Stat. teori gk, ht 2006, JW F6 STOKASTISKA VARIABLER (NCT 5.4-5.6) Binomialfördelningen Används som modell i situation av följande slag: Ett slumpförsök upprepas n gånger (oberoende upprepningar). Varje gång två möjliga resultat: A och icke-a. Slh för A är densamma varje gång, P(A) P. X antalet gånger som A inträffar totalt. Då är X en binomialfördelad stokastisk variabel. Formell definition: En stokastisk variabel X har en binomialfördelning om den antar värdena x 0, 1, 2,, n med sannolikheterna n x n x P(x) P(X x) ( ) P (1 P) x Varför ser sannolikheterna ut som de gör? 1
Att X är binomialfördelad med parametrarna n och P skriver vi kortfattat: X är Bin(n; P). För en binomialfördelad stokastisk variabel X, som är Bin(n; P), gäller att E(X) np och Var(X) np(1-p) Ex.: Tre kast med en välgjord tärning. Låt X antal sexor. Då är X Bin(n 3; P 1/6). 3 1 0 5 P (0) ( )( ) ( ) 0 6 6 3 1 5 P (1) ( ) ( ) 2 1 6 6 3 1 2 5 P (2) ( )( ) 2 6 6 3 1 3 5 0 P (3) ( )( ) ( ) 3 6 6 3 125 216 75 216 15 216 1 216 E(X) np 3 (1/6) 1/2 Var(X) np(1-p) 3(1/6)(5/6) 5/12 2
Tabell 2 i kursboken ger sannolikheterna P(x) P(Xx) (x 0, 1, 2,, n) för n 1, 2,, 20 och P 0,05, 0,10, 0,15,, 0,50. Hur gör man när P > 0,5? Exempel kommer snart. Hur gör man när n > 20? Approximation med hjälp av normalfördelningen kommer längre fram. Tabell 3 i kursboken ger kumulerade sannolikheter F(x) P(X x) P(0) + P(1) + + P(x) för samma värden på n och P. Binomialsannolikheter kan även enkelt erhållas med Minitab (för många fler värden på n och P). 3
Ex.: Vi gör 20 kast med ett mynt. Oberoende mellan kasten antas. (a) Vilken fördelning har X antalet krona? (b) Bestäm P(X 12). (c) Bestäm P(X 12). (d) Bestäm P(X 15). (e) Bestäm P(8 X 12). (f) Vad är det förväntade antalet krona? Svar: a) X är Bin(20; 0,5). b) P(X 12) 0,1201 (Tabell 2) c) P(X 12) 0,868 (Tabell 3) d) P(X 15) 1 P(X 14) 1 0,979 0,021 (Tabell 3) e) P(8 X 12) P(X 12) P(X 7) 0,868 0,132 0,736 (Tabell 3) f) E(X) np 20 0,5 10. 4
Ex.: Man utför en serie om 12 oberoende försök. Varje gång är sannolikheten 0,8 för att det skall bli ett lyckat försök. (a) Vilken fördelning har X antalet lyckade försök? (b) Bestäm P(X 10). (c) Bestäm P(X 10). (d) Bestäm P(5 < X 10). Svar: a) X är Bin(12; 0,8). Här kan tabellerna inte användas direkt, eftersom P > 0,5. Vi ser i stället på Y antalet misslyckade försök. Vi inser att Y är Bin(12; 0,2). Alltså kan tabellerna användas för att bestämma sannolikheter med avseende på Y. b) P(X 10) P(10 lyckade försök) P(2 misslyckade) P(Y 2) 0,2835 (Tabell 2) c) P(X 10) P(Y 2) 1 P(Y 1) 1 0,275 0,725 (Tabell 3) d) P(5 < X 10) P(2 Y 6) P(Y 6) P(Y 1) 0,996 0,275 0,721 (Tabell 3) 5
Hypergeometriska fördelningen Typisk situation: Population med N individer, varav N 1 har en viss egenskap, medan de övriga N N 1 saknar egenskapen. Från populationen väljs genom OSU (utan återläggning) ett stickprov med n individer. X antal individer i stickprovet, som har den aktuella egenskapen. Då är X en hypergeometriskt fördelad stokastisk variabel. Formell definition: En hypergeometriskt fördelad stokastisk variabel X har sannolikhetsfunktionen N1 N N1 ( )( ) x n x P( x) P( X x) N ( ) n för heltalsvärden x, sådana att 0 x N 1 och 0 n-x N-N 1. 6
Vi skriver: X är Hyp(n; N 1 ; N) Exempel: En låda innehåller tio lampor varav tre är felaktiga. Fem lampor väljs ut slumpmässigt (utan återläggning). (a) Vad är slh att högst en utvald lampa är felaktig? (b) Vad är slh att åtm. en utvald lampa är felaktig? Svar: a) Låt X antalet felaktiga lampor bland de utvalda. X är Hyp(n5; N 1 3; N10). P(X 1) P(0) + P(1) 3 7 ( )( ) 0 5 10 ( ) 5 + 3 7 ( )( ) 1 4 10 ( ) 5 21 252 105 126 + 0,5 252 252 b) P(X 1) 1 P(0) 21 231 11 1 0,917 252 252 12 7
Poissonfördelningen Används ibland som sannolikhetsmodell, när man studerar hur många gånger en händelse inträffar under ett givet tidsintervall. Inträffandena antas ske i viss mening slumpmässigt i tiden. Inträffandena kan ske vid vilka tidpunkter som helst, oberoende av varandra, och hela tiden med samma intensitet. X antal gånger som händelsen inträffar under ett tidsintervall av given längd. Då är X en Poissonfördelad stokastisk variabel. (Dvs. egentligen under en mer noggrann formulering av förutsättningarna.) Ex.: X antal telefonsamtal till en växel mellan kl. 9.00 och 9.10 en vardagsmorgon. X antal kunder som kommer till en butik mellan kl. 12.00 och 13.00 en vardag. X antal tryckfel på en sida i en bok. (OBS Ej tid) 8
Formell definition: En stokastisk variabel X har en Poissonfördelning om den antar värdena x 0, 1, 2, med sannolikheterna P( x) P( X x) e λ x λ x! För en Poissonfördelad stokastisk variabel X gäller att E(X) Var(X) λ Konstanten λ är lika med intensiteten, dvs. förväntade antalet gånger som händelsen kommer att inträffa under en tidsperiod av given längd. Tabell 5 i kursboken ger sannolikheterna P(x) P(Xx) (x 0, 1, 2, ) för λ 0,1, 0,2, 0,3,, 21,0 Tabell 6 i kursboken ger motsvarande kumulerade sannolikheter F(x) P(X x) P(0) + P(1) + + P(x) 9
Ex.: X antal flygolyckor i civilflyget i ett land under ett år. Antag att X är en Poissonfördelad stokastisk variabel. Vi vet att det i genomsnitt inträffar 2,1 flygolyckor per år i civilflyget i landet, så vi sätter därför λ 2,1. (a) Vad är slh för högst en flygolycka under ett år? (b) Vad är slh för exakt tre olyckor under ett år? Svar: a) P(X 1) 0,3796 (Tabell 6) b) P(X 3) 0,1890 (Tabell 5) 10
En annan användning av Poissonfördelningen är som approximation till binomialfördelningen. Om n är stort och P litet, så kan Bin(n; P) approximeras med en Poissonfördelning, där vi sätter λ n P Tumregel (enl. kursboken): Binomialfördelningen får approximeras med en Poissonfördelning (med λ n P), när n och P uppfyller villkoret att n är stort och n P 7. Ex.: En person tänker delta 200 gånger i ett spel. Varje gång är slh att vinna lika med 0,001. Vad är slh att han skall vinna minst en gång? Sätt X antalet gånger man vinner, när man spelar 200 gånger. X är egentligen Bin(n 200; P 0,001). Vi approximerar med en Poissonfördelning med λ n P 200 0,001 0,2. (Tumregelns villkor här uppfyllt.) P(X 1) 1 P(X 0) 1 0,8187 0,1813 (Tabell 5) (Exakt svar: 1 0,999 200 0,181351, enl. Minitab) 11