Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen 1
Exempel 1 Möjliga Resultat 1:a 2:a 3:a Antalet krona 1 T T T 0 2 T T H 1 3 T H T 1 4 T H H 2 5 H T T 1 6 H T H 2 7 H H T 2 8 H H H 3 Antar att vi är intresserad av antalet kronor som visas vid tre kastningar av ett mynt. Antalet möjliga utfall är: 2*2*2 8 H: krona T: klave ξantal krona vid tre kastningar av ett mynt 2
Exempel 1 forts Antalet krona x Sannolikheten av Utfall p(x) 0 1/8 0.125 1 3/8 0.375 Sannolikhets Histogram for for x 2 3/8 0.375 3 1/8 0.125 Totalt 8/8 1.000 3
Exempel 2 Kasta 2 tärningar och låt: ξ summan av antal prickar vid 2 tärningskast x p(x) 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 4
Slumpvariabler s.v. En slumpvariabel (stokastisk variabel) är en numerisk beskrivning av utfallet vid ett slumpmässigt försök Diskret s.v. antar heltalsvärden Kontinuerlig s.v. som kan anta alla värden i något intervall (behandlas separat i nästa kapitel) Vi kommer att använda grekiska bokstäver (ofta ξ eller η) för att beteckna slumpvariabler och små bokstäver för att beteckna värden på slumpvariabler P(ξx)p(x) betyder alltså sannolikheten att slumpvariabeln ξ antar värdet x (observerat värde) 5
Exempel 3 Ex: I fallet med tärningskast: P(ξ1)1/6 På samma sätt gäller att P(ξ2)P(ξ3) P(ξ6)1/6 Detta kan sammanfattas med: P(ξx)1/6 Så vi säger att ξ: antalet prickar är en slumpvariabel 6
Sannolikhetsfördelningar Den modell som visar vilka värden en s.v. kan anta och sannolikheterna för dessa värden brukar kallas för variabelns sannolikhetsfördelning Sannolikhetsfördelningen p(x) för en diskret s.v. ξ definieras som p(x) P(ξx) P(ξ antar värdet x) Sannolikheten för ett utfall måste alltid vara mellan 0 och 1 Sannolikhetens summa är 1 Ex 3.2, sid 74 7
Fördelningsfunktion För en diskret stokastisk variabel ξ är fördelningsfunktionen F(x k ) P(ξ < x k ) p(x i ) Ex: Tärningskast x 1 <x 2 <x 3 < <x k <x k+1 < F(3) P(ξ < 3) P(ξ1)+P(ξ2)+P(ξ3) F(x) är en trappfunktion som växer från 0 till 1 Ex 3.5, sid 78 Sats 3 A, Ex 3.6 8
Väntevärde och varians Sannolikhetsfördelningar för olika s.v. kan skilja sig åt på många sätt. De kan t.ex. ha olika Lägesmått: väntevärde Spridningsmått: varians eller standardavvikelse 9
Väntevärde (medelvärde) Ett mått på en fördelnings läge är det förväntade värdet, eller väntevärdet. Om variabeln är diskret definieras variabelns väntevärde av ( ξ ) μ x p( x ) x p x ) + x p ( x ) +... x p ( x ) E i i + i 1 ( 1 2 2 n n Ex: x 0 1 2 3 p(x) 1/8 3/8 3/8 1/8 1 3 3 1 Väntevärdet blir: E( ξ ) xi p( xi ) 0. + 1. + 2. + 3 1, 5 8 8 8 8 Ex 3.13, sid 94 10
Varians Som mått på spridning används ofta variansen eller standardavvikelsen. Om variabeln är diskret definieras variansen av V 2 2 2 ( ξ ) σ E( ξ μ ) ( x μ ) p( x) Enkel sätt att beräkna variansen V 2 2 2 2 ( ξ ) E ( ξ ) μ x p( x) μ i i Standardavvikelsen för en stokastisk variabel definieras som σ Ex 3.15, sid 99 V ( ξ ) i i 11
Räkneregler för väntevärden och varianser Låt a och b vara konstanter och ξ och η slumpvariabler. Om η a + bξ E(a) a E(bξ) be(ξ) E(η) E(a+bξ) a+be(ξ) V(a) 0 V(bξ) b 2 V(ξ) V(η) V(a+bξ) b 2 V(ξ) 12
Likformig Fördelning Ω { 1, 2, 3,..., N } P(ξx) 1/N F(x) x/n E(ξ) x(1/n) (N+1)/2 Var(ξ) (N2-1)/12 Fördelningens parameter 13
Binomialfördelning Varje sannolikhetsproblem som innehåller följande egenskaper 1. Ett bestämt antal n försök skall utföras 2. Varje försök kan antingen lyckas eller misslyckas 3. Sannolikheten P(enskilt försök lyckas) är konstant 4. Den n försöken lyckas respektive misslyckas oberoende av varandra 14
Binomialfördelningen Om ett slumpförsök uppfyller de fyra punkterna och vi låter ξ : vara antalet lyckade försök så har slumpvariabeln ξ sannolikhetsfördelningen P( ξ x) n C x p x (1 p) n x n! x!( n x)! p x (1 p) n x för x 0,1,2,... n. där n C x n! x!( n x)! och n! n( n 1)( n 2)...(2)1och 0! 1. 15
Binomialfördelningen ξ: antalet lyckade försök eller individer med viss egenskap i stickprovet n: stickprovet p: sannolikheten att en viss händelse skall inträffa vid ett försök n och p kallas för binomialfördelningens parameter När vi vill tala om att en variabel ξ är binomialfördelad med parametrarna n och p använder vi ξ är Bin(n, p) 16
Exempel Låt ξ vara antal krona i n kast med ett mynt Sannolikheten att få krona i ett kast är p0.5 Tänkbara utfall är x0,1,..n Vilka sannolikheter är kopplade till dessa utfall? Det beskrivs av Binomialfördelningen Bin(n, p0.5) 17
Exempel Du kastar en tärning 60 gånger Vad är sannolikheten att få högst åtta ettor Låt ξ: antalet ettor vid 60 kast Att ξ är binomialfördelad följer av att 1. Det är på förhand bestämt att 60 kast skall göras, n60 2. Varje kast antingen ge en etta eller inte ge en etta 3. Sannolikheten är konstant 1/6 att få en etta 4. Att de olika försöken är oberoende är klart så länge tärningen kastas från någorlunda hög höjd 18
Exempel forts n 60 p 1/6 ξ är Bin(n60, p1/6) P(ξ 8)? P( ξ 8) 8 x 0 60 C x p x (1 p) 60 x 8 x 0 60! x!(60 x)! 1 6 5 ()() 6 6 60 x 0.312 Beräkna själv och Kolla! 19
Väntevärdet och Variansen Väntevärdet: E(ξ)np Variansen: V(ξ)np(1-p) Ex: med tärningskast 60 gånger så har vi följande väntevärde och varians E(ξ) 60.(1/6) 10 V(ξ) 60.(1/6)(1-1/6) 50/6 20
Binomial-tabeller Att beräkna sannolikheter för binomialfördelade slumpvariabler innebär ofta att långa summeringar måste utföras. Sådant går bra om en dator med lämplig programvara finns tillgänglig Om inte så är fallet brukar tabeller över binomialsannolikheter finnas att tillgå En sådan tabell finns längs bak i boken 21
Ex: Antal pojkar i en fembarnsfamilj ξ antal pojkar Anta att varje barns kön bestäms oberoende av tidigare födslar och att sannolikheten för pojke är p0.5 Då är ξ binomialfördelat Bin(n5; p0.5) 22
De olika sannolikheterna blir P(ξ5) 5 C 5 p 5 (1-p) 0 1/32 (fem pojkar) P(ξ4) 5 C 4 p 4 (1-p) 1 5/32 (fyra pojkar) P(ξ3) 5 C 3 p 3 (1-p) 2 10/32 (tre pojkar) P(ξ2) 5 C 2 p 2 (1-p) 3 10/32 (två pojkar) P(ξ1) 5 C 1 p 1 (1-p) 4 5/32 (en pojke) P(ξ0) 5 C 0 p 0 (1-p) 5 1/32 (ingen pojke) Beräkna P(ξ 1) och P(ξ 3) med hjälp av tabellen 23
Hypergeometriska fördelningen Vi har en urna med 12 kulor, varav 4 vita och 8 svarta Om dragningarna sker med återläggning är antalet vita kulor ξ: Bin(4; 1/3) Men om dragningarna inte sker med återläggning beskrivs sannolikheten med en annan fördelning den s.k Hypergeometriska 24
Hypergeometriska fördelningen Sannolikheten att få ξ2 vita kulor i fyra dragningar utan återläggning är P ( ξ 2) 4 C 12 2 8 C C 4 2 P(få 2 vita bland 4 valda) Välj 2 kulor bland de 4 vita Välj de resterande 2 bland de 8 svarta Välj 4 bland 12 25
Generell formel för Hypergeometriska fördelningen Där: ( P( ξ x) C )( N1 x N N1 n x N: populationsstorlek (8 svarta och 4 vita kulor 12) N1: element av en viss egenskap (4 vita kulor) n: stickprov (4 dragningar) x: element av en viss egenskap i stickprovet (2 vita kulor) N C n C ) Vi säger att ξ är hypergeometriskt fördelad 26
Alternativ form Ibland får man veta att andelen element med en viss egenskapen är p (4/12 i vårt exempel) Då blir N1Np och (N-N1)N(1-p) Formeluttrycket skrivs då P( ξ ( x) Np C Vi säger att ξ är Hyp(n, p, N) Ex. 3.7, sid 83 x )( N N ( 1 p) n x C n C ) 27
Väntevärdet och variansen Hypergeometriska fördelningen har följande väntevärde och varians Väntevärdet E(ξ) np Variansen V(ξ) np(1-p)((n-n)/(n-1)) 28
Approximation Ibland kan man approximera en hypergeometrisk fördelning med en binomialfördelning utan att göra alltför stort fel Allmänt gäller att om N är stort och kvoten n/n är liten Tumregel n/n< 0.10 så kan man göra följande approximation: Ex. 3.10, sid 87 ( N1C x)( N N1 N C n C n x ) x nc xp (1 p) n x 29
Exempel I en urna finns 1000 kulor av vilka 30% är vita och resten svarta Man väljer (och utan återläggning) 10 kulor ur urnan Vad är sannolikheten att man får 4 vita kulor Lösning: Då N är stort som 1000 och man bara väljer ut 10 kulor så ändras inte sammansättningen av svarta och vita kulor nämnvärt när man väljer ut en kula i taget Vi kan approximativt säga att i varje dragning finns 30% vita kulor Vi tänker oss då att vi gör 10 oberoende upprepningar, där p 0.3 i varje dragning ξ är Bin(n10, p0.30) Beräkna själv! 30
Poissonfördelningen Poissonfördelningen uppkommer när man vill studera antal gånger en speciell händelse inträffar inom en given tidsperiod Ex: om det i genomsnitt kommer 3 bilar till en korsning varje minut, hur stor är sannolikheten att det under en viss minut kommer, säg 5 bilar? Poissonfördelningen kan också användas om sannolikheten för lyckat försök är liten och (mycket) stort antal försök Ex: antalet insjuknade i ovanlig sjukdom, dödsfall pga. viss olyckshändelse etc. 31
Poissonfördelningen Så här kan vi beskriva poissonfördelningen på ett matematiskt sätt P ( ξ x) x λ e x! λ Där: µ: genomsnittliga antalet händelser under tidsintervallet x: antalet lyckade e: konstant 2,71828 Vi säger att ξ är Po(λ) 32
Väntevärdet och variansen Poissonfördelningen har följande väntevärde och varians E(ξ) np λ V(ξ) np λ E(ξ) V(ξ) λ 33
Exempel En telefonväxel som tar emot i genomsnitt 3 samtal per minut Vad är sannolikheten för 1) En minut utan samtal? Lösning: Låt ξantal samtal per minut ξ är Po(λ3) P( ξ 0) 3 0 e 0! 3 e 3 0.049787 34
Exempel forts 2) Två eller fler samtal på en minut? Lösning: P ( ξ > 1) 1 P ( ξ 1) 1 P ( ξ 0 ) P ( ξ 1) 1 3 0 e 1! 3 3 1 e 1! 3 1 0.0498 0.1494 0.8008 Poissonsannolikheter kan också beräknas med hjälp av tabeller 35
Sammanfattning Binomial: Dragning med återläggning, samma sannolikhet för lyckat utfall varje gång Hypergeometrisk: Dragning utan återläggning, olika sannolikhet varje gång Poisson: Liten sannolikhet för gynnsamt utfall och (mycket) stort antal försök Approximationer, fig. 3.7, sid 87 36