3 Grundläggande sannolikhetsteori

3 Grundläggande sannolikhetsteori Ämnet sannolikhetsteori har sin grund i studier av hasardspel utförda under 1500- och 1600-talen av bland andra Gerolamo Cardano, Pierre de Fermat och Blaise Pascal. Mycket av arbetet bakom det som kom att kallas klassisk sannolikhetsteori utfördes av Pierre-Simon Laplace under 1800-talet. Den klassiska denitionen av en sannolikhet lyder: Antag att det nns M möjliga utfall i utfallsrummet, och att alla är lika sannolika. Om G av utfallen är gynnsamma, dvs. medför en viss händelse A, så ges sannolikheten för A av P (A) = G/M. Under första halvan av 1900-talet utvecklade Andrej Kolmogorov idéer från bland andra Henri Lebesgue och Georg Cantor, och lade grunden till den moderna sannolikhetsteorin som baseras på måtteori. Vi kommer att använda en förenklad version av den moderna sannolikhetsteorin baserad på tre sannolikhetsaxiom formulerade av Kolmogorov: 1. För varje händelse A gäller att 0 P (A) 1. Speciellt gäller att om A saknar element, dvs. A är den tomma mängden, så är P (A) = 0. 2. P (Ω) = 1, där Ω är hela utfallsrummet. 3. Om A och B är disjunkta, dvs. saknar gemensamma element, så är P (A B) = P (A) +. Additionssatsen säger att P (A B) = P (A) + P (A B). Veriera satsen med hjälp av Venndiagram! Komplementhändelsen A C denieras så att A A C = Ω och A A C =. Om vi ersätter B med A C i additionssatsen får vi vilket är samma sak som P ( A A C) = P (A) + P ( A C) P ( A A C), P (Ω) = P (A) + P ( A C) P ( ). Kolmogorovs axiom säger att P (Ω) = 1 och P ( ) = 0 så 1 = P (A) + P ( A C), och sannolikheten för komplementhändelsen blir P ( A C) = 1 P (A). 1

Exempel 3.1. Vi kastar två vanliga 6-sidiga tärningar, en röd och en grön. Vad är sannolikheten att vi får en 1:a på den röda tärningen och/eller en 6:a på den gröna? Låt A vara händelsen att den röda tärningen visar en 1:a, och B vara händelsen att den gröna tärningen visar en 6:a. Vi är intresserade av sannolikheten för A B. Sannolikheterna för både A och B är 1/6. Sannolikheten för A B, alltså både en 1:a på den röda tärningen och en 6:a på den gröna, är 1/36. Additionssatsen ger nu P (A B) = P (A) + P (A B) = 1 6 + 1 6 1 36 = 11 36. Exempel 3.2. Vi kastar två vanliga 6-sidiga tärningar, en röd och en grön. Vad är sannolikheten att tärningssumman är större än 4? Låt A vara händelsen att tärningssumman är större än 4, då är A C händelsen att tärningssumman är mindre än eller lika med 4. Detta kan erhållas på 6 olika sätt: den röda visar 1:a och den gröna 1:a, 2:a eller 3:a (3 sätt); den röda visar 2:a och den gröna 1:a eller 2:a (2 sätt); den röda visar 3:a och den gröna 1:a (1 sätt). Vi får sannolikheten för A genom P (A) = 1 P ( A C) = 1 6 36 = 5 6. Ett par räkneregler som ibland kan underlätta är DeMorgans formler P ( A C B C) = 1 P (A B), P ( A C B C) = 1 P (A B). Dessa gäller eftersom (A B) C = A C B C och (A B) C = A C B C. Rita Venndiagram för att bekräfta detta! Det nns formler motsvarande additionssatsen och DeMorgans formles även för 3 eller era händelser, men det är oftast enklare att rita Venndiagram än att försöka lära sig dessa. Kombinatorik Kombinatorik är en gren av matematiken som behandlar bland annat kombinationer och permutationer. En kombination är en unik delmängd (av någon större mängd) med ett bestämt antal element där ordningen inte har betydelse. En permutation är en ordnad kombination. Exempel 3.3. Tag 3 olika bokstäver ur alfabetet. Kombinationen ABC har permutationerna: ABC, ACB, BAC, BCA, CAB och CBA. 2

Multiplikationsprincipen är välanvänd inom kombinatoriken: Om man i tur och ordning ska göra k stycken operationer där den första kan göras på n 1 sätt, den andra på n 2 sätt, osv., så är totala antalet sätt att göra de k operationerna på n 1 n 2... n k. Exempel 3.4. På hur många sätt kan kombinationen ABC permuteras? Detta problem kan ses som att i tur och ordning välja den första bokstaven, den andra bokstaven, och slutligen den tredje bokstaven. Det första valet (den första operationen) kan utföras på 3 olika sätt, det andra på 2 sätt, och det sista på enbart 1 sätt. Multiplikationsprincipen säger att det nns totalt 3 2 1 = 6 sätt att utföra dessa operationer på, och slutsatsen blir att det nns 6 permutationer av kombinationen ABC (precis som vi sett i föregående exempel). Produkten k (k 1)... 2 1 betecknas k! (utläses k-fakultet). Exempel 3.5. Antag att vi ska välja ut tre personer i klasser som elevrepresentanter i kursutvärderingsnämnden. På hur många sätt kan vi göra det om det nns totalt 35 studenter i klassen? Om ordningen vi väljer studenterna i spelar roll kan vi se det som att först välja en av 35 studenter, sedan välja en av de återstående 34 studenterna, och till sist välja en av de 33 studenterna som är kvar efter de två första valen. Enligt multiplikationsprincipen kan detta göras på 35 34 33 = 39270 sätt. Detta är antalet 3-personspermutationer om vi totalt har 35 personer. Säg att vi först väljer Anja, sedan Bodil, och därefter Calle. Om ordningen inte spelar någon roll är det samma sak som att välja Anja, Calle och sen Bodil, eller Calle, Bodil och sen Anja. Kombinationen (Anja, Bodil, Calle) har 6 olika permutationer (se föregående exempel med bokstäverna ABC). De 39270 3-personspermutationerna motsvarar därför 39270/6 = 6545 3- personskombinationer. Om ordningen inte spelar roll kan vi alltså välja 3 personer bland 35 på 6545 olika sätt. Generellt gäller att vi kan välja k element av totalt n på n (n 1)... (n k + 1) sätt om ordningen har betydelse, och ( ) n n! n (n 1)... (n k + 1) := = k k!(n k)! k (k 1)... 2 1 sätt om ordningen inte har betydelse. I det första fallet, om ordningen har betydelse, räknar vi ut antalet permutationer med k element det nns om 3

totala antalet element vi kan välja från är n. I det andra fallet, om ordningen inte har betydelse, räknar vi ut antalet kombinationer med k element det nns om totala antalet element vi kan välja från är n. Uttryck av typen ( n k) (utläses n över k) kallas binomialkoecienter. Beroende och oberoende händelser Två händelser A och B är statistiskt oberoende om och endast om P (A B) = P (A). Om A och B inte är statistiskt oberoende så är de statistiskt beroende. Oftast utelämnar man ordet statistiskt och säger bara oberoende eller beroende. Tre händelser A 1, A 2 och A 3 är oberoende om och endast om och P (A 1 A 2 A 3 ) = P (A 1 ) P (A 2 ) P (A 3 ) P (A i A j ) = P (A i ) P (A j ), för i j. På liknande sätt kan man deniera oberoende för 4 eller er händelser. Exempel 3.6. Vi kastar en vanlig 6-sidig tärning. Låt händelsen A vara att vi får ett jämnt antal prickar, och händelsen B vara att vi får er än 3 prickar upp på tärningen. Är A och B oberoende? Vi har Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} och B = {4, 5, 6}. Snittet A B är de element som nns i både A och B, alltså A B = {4, 6}. Sannolikheterna beräknas till P (A) = 1/2, = 1/2 och P (A B) = 1/3, och vi får P (A) = 1 2 1 2 = 1 4 1 3 = P (A B). Eftersom P (A) P (A B) så är A och B inte oberoende. Den betingade sannolikheten att händelsen A inträar givet att händelsen B inträar är P (A B) P (A B) =. Om A och B är oberoende gäller att P (A B) = P (A B) = P (A) = P (A), 4

och den lososka tolkningen av detta är att kännedomen att B inträat inte ger oss någon ny information om sannolikheten att A kommer att inträa om A och B är oberoende. Från denitionen av betingad sannolikhet följer direkt att P (A B) = P (A B). Eftersom A B är samma sak som B A så gäller även att P (A B) = P (B A) = P (B A) P (A). Eftersom vänsterleden i de två ovanstående uttrycken är lika så måste även högerleden vara lika. Alltså gäller att P (A B) = P (B A) P (A). Dividera båda leden med för att erhålla Bayes sats P (A B) = P (B A) P (A). Exempel 3.7. Vi kastar en vanlig 6-sidig tärning. Vad är sannolikheten att vi får er än 1 prick givet att vi får ett jämnt antal prickar? Och vad är sannolikheten att vi får ett jämnt antal prickar givet att vi får er än 1 prick? Låt händelsen A vara att vi får ett jämnt antal prickar, och händelsen B vara att vi får er än 1 prick upp på tärningen. Vi har Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6}, B = {2, 3, 4, 5, 6} och A B = {2, 4, 6}. Sannolikheterna beräknas till P (A) = 1/2, = 5/6 och P (A B) = 1/2, och vi får de betingade sannolikheterna P (B A) = P (B A) P (A) = 1/2 1/2 = 1 och, från Bayes sats, P (A B) = P (B A) P (A) = 1 1/2 5/6 = 3 5. Generellt är P (A B) P (B A). För att få en bättre förståelse för betingade sannolikheter kan vi använda oss av en korstabell (se Tabell 3). 5

A A C B P (A B) P ( A C B ) B C P ( A B C) P ( A C B C) P ( B C) P (A) P ( A C) 1 Tabell 1: Korstabell för händelserna A och B. 6