Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07 Bengt Ringnér August 31, 2007 1 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Händelser och sannolikheter 2.1 Grundbegrepp I sannolikhetsteorin sysslar man med händelser och deras sannolikheter. Man utgår från vissa sannolikheter, som man fått antingen från erfarenhet eller från situationer där alla fall är lika sannolika, och räknar från dessa ut andra sannolikheter. 2.1.1 Nya sannolikheter ur givna Betrakta, som i förra veckan, följande händelser, som vi kan kalla A och B: A : Det regnar i morgon B : Det blåser i morgon. Låt oss anta att man på grundval av erfarenhet bedömer sannolikheterna för händelserna till 0.7 resp. 0.5. Detta skrivs = 0.7, P(B) = 0.5, där bokstaven P kommer av det engelska probability. Tolkningen är att det regnar resp. blåser i 70 resp. 50 procent av dagarna vid den här årstiden och med hänsyn till dagens väder. Vilka siffror man kommer fram till beror 1
på vad man menar exakt, men hur man än gör detta gäller att i resten av dagarna regnar det inte resp. blåser inte, dvs. P(A c ) = 1 0.7 = 0.3, P(B c ) = 1 0.5 = 0.5, där c på en händelse betyder att den inte inträffar. Om man nu utbrister, om det regnar eller blåser i morgon }{{} A B så går jag inte ut, är det underförstått att om det både blåser och regnar, så går man naturligtvis inte heller ut. För att räkna ut sannolikheten för A B uttalas A union B eller A eller B, kan man inte bara lägga ihop 0.7 och 0.5, för då blir resultatet större än ett och det kan det inte vara om det skall representera andelen dagar. Felet är att de gånger det både regnar och blåser räknas med två gånger, eftersom de finns både i A och B, så vi får dra bort den ena. Säg att man har kommit fram till att det både regnar och blåser i 40 procent av dagarna. Då gäller, enligt förra veckan, P(A B) = + P(B) P(AB) = 0.7 + 0.5 0.4 = 0.8. Istället för AB kan man skriva A B. Uttalet är A snitt B eller A och B. 2.1.2 Sannolikheter givna av symmetriskäl Som exempel på när sannolikheter är givna av symmetriskäl kan vi ta tärningskast. Mer användbara exempel kommer senare. Alla sex sidorna är likvärdiga, så vart och ett av utfallen har sannolikhet 1/6. Gör man två tärningskast finns det 36 utfall, etta etta, etta tvåa, osv. till etta sexa, sedan tvåa etta, tvåa tvåa, osv. enligt samma system och slutligen sexa sexa. Alla utfallen har sannolikheten 1/36. Vill man nu räkna ut t ex sannolikheten att summan av poängtalen är tre, får man P(summan = 3) = P(etta, tvåa) + P(tvåa, etta) = = 1 36 + 1 36 = 1 18. Här behöver man inte dra ifrån sannolikheten att bägge möjligheterna skall inträffa eftersom det är omöjligt; dess sannolikhet är noll. På liknande sätt är P(summan = 4) = P(etta, trea) + P(tvåa, tvåa) + P(trea, etta) = 2
= 1 36 + 1 36 + 1 36 = 1 12. Så kan man fortsätta. Störst sannolikhet har P(summan = 7) = 6 sedan minskar sannolikheten igen. Resultatet är 1 36 = 1 6, summa 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 5 4 3 2 1 sannolikhet 36 36 36 36 36 36 36 36 36 36 36 eller i formelspråk P(summan = k) = { k 1 36 om k = 2,3,4,5,6,7 13 k 36 om k = 8,9,10,11,12 Sådana här räkningar kommer igen senare i samband med stokastiska variabler, som är försök där utfallen är tal. Det kan till exempel vara antal bilar på en väg eller belastningen på en konstruktion. Exemplet med tärningarna är också en tillämpning på begreppet utfallsrum. Detta består här av de 36 utfallen. En delmängd av utfallsrummet t. ex de utfall som ger summan 4, definieras i matematiken som händelse. Sammanfattning Man utgår från givna sannolikheter och räknar ut nya enligt följande regler: 0 1. P(A c ) = 1. P(A B) = + P(B) P(AB). Om A och B inte kan inträffa samtidigt utgår termen P(AB). I nästa avsnitt skall vi betrakta fallet när A och B är oberoende och P(AB) = P(B), samt några sätt att räkna annars. 2.1.3 Sannolikheter givna av relativa frekvenser Detta kommer i laborationen i vecka 4. 3
2.2 Betingade sannolikheter och oberoende händelser Vi börjar med ett exempel: En urna innehåller 5 vita och 3 svarta kulor. Man drar 2 kulor. Vad är sannolikheten att bägge är vita? P(första vit) = 5 5 + 3 = 5 8. När man drar den andra kulan har betingelserna ändrats, om den första blev vit finns det 4 vita och 3 svarta kvar. Den betingade sannolikheten är därför P(andra vit första vit) = 4 4 + 3 = 4 7. Det lodräta trecket betyder att man betingar med avseende på det som står till höger om strecket. Rimligtvis gäller P(bägge vita) = P(första vit)p(andra vit första vit) = 5 8 4 7 = 5 14. Om händelserna betecknas med A resp. B har vi P(AB) = P(B A), vilket är en allmän formel. P(B A) kallas den betingade sannolikheten för B givet A. Man kan också vända på formeln och få I exemplet med vädret ger detta P(B A) = P(AB). P(blåser regnar) = P(B A) = P(AB) = 0.4 0.7 = 4 7, vilket är större än P(blåser) = 0.5. Förklaringen till detta är att regn och blåst är beroende; har man det ena så har man ofta det andra också. Man kan också räkna ut P(regnar blåser) = P(A B) = P(AB) P(B) = 0.4 = 0.8 > 0.7 = P(regnar); 0.5 vaknar man på morgonen och hör blåsten vina, ökar det sannolikheten för regn. 4
Observera att med är det viktigt det roll vilket som står till höger och vänster, medan P(AB) = P(BA), det är ju samma händelse uttryckt på olika sätt. Ibland gäller P(B A) = P(B), vilket är samma sak som P(AB) = P(B). Detta kallas att A och B är oberoende. Exempel på detta är tärningskasten ovan, där t. ex. P(tvåa, femma) = P(tvåa)P(femma) = 1 6 1 6 = 1 36. Avslutningsvis skall vi räkna ut P(A B) när A och B är oberoende. P(A B) = + P(B) P(AB) = + P(B) P(B). Alternativt kan man använda tricket att övergå till komplementhändelser, dvs, att händelsen inte inträffar. Att A B inte inträffar är samma sak som att A inte inträffar och B inte inträffar. Nu är P(A B) = 1 P(A c B c ). Men om A och B är oberoende, så är deras komplement det också, så och alltså P(A c B c ) = P(A c )P(B c ) = (1 )(1 P(B)), P(A B) = 1 (1 )(1 P(B)). Som kontroll kan vi multiplicera ihop parenteserna och förkorta bort ettan, vilket ger samma formel som innan. Fördelen med den senare metoden är att den är lätt att generalisera till fler än två händelser. Sammanfattning P(AB) = P(B A), P(AB) = P(B)P(A B). P(B A) = P(AB), P(A B) = P(AB) P(B). 5
P(AB) = P(BA). Oberoende: P(AB) = P(B), dvs. P(B A) = P(B), dvs. P(A B) =. 2.3 Total sannolikhet och Bayes formel Det här är en teknik som används när man har en händelse som kan uppnås längs flera vägar. I exemplet med urnan skulle vi få först en vit kula och sedan en vit till. Om vi istället är intresserade av sannolikheten att få en av varje, finns två vägar; P(en av varje) = P(först vit sedan svart) + P(först svart sedan vit) = = 5 5 + 3 3 4 + 3 + 3 5 + 3 5 5 + 2 = 15 28. En typisk tillämpning är följande: Man köper något som helst skall fungera, till exempel belysning till sin cykel. Denna kan vara tillverkad 1) på en måndag, 2) på en fredag eller 3) på någon annan arbetsdag. Sannolikheterna för dessa fall antas vara 1/5, 1/5, resp. 3/5. Måndagsexemplar antas fungera med sannolikheten 0.5, medan de övriga fungerar med sannolikheterna 0.7, resp. 0.8. Sannolikheten att belysningen funderar är då P(fungerar) = = P(måndag och fungerar)+p(fredag och fungerar)+p(annan dag och fungerar) = = 1 5 0.5 + 1 5 0.7 + 3 0.8 = 0.1 + 0.14 + 0.48 = 0.72. 5 Med beteckningarna A H 1 H 2 H 3 fungerar tillverkad på måndag tillverkad på fredag tillverkad på annan dag blir räkningarna = P(AH 1 ) + P(AH 2 ) + P(AH 3 ) = = P(H 1 )P(A H 1 ) + P(H 2 )P(A H 2 ) + P(H 3 )P(A H 3 ) = = 1 5 0.5 + 1 5 0.7 + 3 0.8 = 0.72. 5 6
Detta är formeln för total sannolikhet. Antag nu att de visar sig att belysningen fungerar. Vad är då den betingade sannolikheten att det är ett måndagsexemplar? Vi vet att händelsen med sannolikhet 0.1+0.14+0.48 har inträffat. De betingade sannolikheterna för de olika fallen bör då ha motsvarande proportioner, dvs. och P(måndag fungerar) = P(fredag fungerar) = P(annan dag fungerar) = 0.1 0.1 + 0.14 + 0.48 = 0.1 0.72, 0.14 0.1 + 0.14 + 0.48 = 0.14 0.72, 0.48 0.1 + 0.14 + 0.48 = 0.48 0.72. Lägg märke till att summan av dessa sannolikheter är ett. I formelspråk blir räkningarna. P(måndag fungerar) = P(H 1 A) = P(AH 1) 1 5 0.5 0.72 = 0.1 0.72, osv. för H 2 och H 3. Detta är Bayes formel. = P(H 1)P(A H 1 ) = Sammanfattning Total sannolikhet: = n k=1 P(H k)p(a H k ). Bayes formel: P(H k A) = P(AH k) sannolikhet. = P(H k)p(a H k ) 2.4 kombinatorik och urnmodeller, där fås ur total Detta går vi igenom i samband med övningarna och binomialfördelningen i avsnitt 3. Där tar vi upp: Multiplikationsprincipen. Additionsprincipen. Antalet sätt att välja k element ur n utan hänsyn till ordning är ( n k). 7
2.5 Ett exempel på oändligt utfallsrum Exemplet är hämtat från en klassisk bok: B. W. Gnedenko: Kurs i sannolikheternas teorier (1950). Två personer kommer överens om att träffas på en bestämd plats mellan klockan 12 och 13 och att den som kommer först väntar högst 20 minuter och sedan går därifrån. Under förutsättning att de kan komma lika gärna när som helst i tidsintervallet och oberoende av varandra, hur stor är sannolikheten att de träffas? Utfallsrummet är nu en kvadrat där x-koordinaten är den ena personens ankomsttid och y-koordinaten den andras. Om x-personen kommer först, dvs om x < y, träffas de om y < x + 20 och motsvarande om y-personen kommer först. Händelsen att de träffas är alltså området mellan linjerna y = x 20 och y = x + 20, som är inritade i figuren. I figuren är kvadraten också indelad i 36 småkvadrater med sidan 10. 60 50 40 30 20 10 0 0 10 20 30 40 50 60 Figure 1: A:s och B:s ankomsttider i minuter efter kl 12 Enligt antagandet gäller att om man delar in kvadraten i likadana småkvadrater, har dessa samma sannolikhet. Delar man en kvadrat på diagonalen, har de bägge trianglarna samma sannolikhet. Nu är det bara att räkna antalet hela 8
och halva rutor inom träffområdet. Sannolikheten att träffas är alltså 16 + 8/2 36 = 5 9. Det här är naturligtvis ingenting annat än arean av händelsen dividerad med arean av hela utfallsrummet, så P(träffas) = 602 20 2 /2 20 2 /2 60 2 = 5 9. Man kan lika gärna räkna ut 1 P(inte träffas) eller räkna i timmar och få samma resultat. I avsnittet om stokastiska variabler kommer situationen när man inte har likformig sannolikhetsfördelning. Man kan åskådliggöra detta som att sannolikheten för en händelse är proportionell mot dess vikt och räkna enligt vikt = densitet dxdy. 9