STOKASTISKA VARIABLER Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). Definition 1. En reellvärld funktion definierad på ett utfallsrum Ω kallas en (endimensionell) stokastisk variabel. Stokastiska variabler betecknas oftast med versaler X, Y, Z,... eller med grekiska bokstäver, ξ (ksi eller xi), η (eta), ζ (zeta). Exempel: I en låda finns fem lappar med talet 40, tre lappar markerade med 80 och 12 lappar markerade med 90. Vi tar ut en lapp på måfå. Möjliga utfall är följande reella tal 40, 80,90. Vi betecknar resultat med X. Då är X en stokastisk variabel. Sannolikheten att X får värdet x betecknar vi med P(X=x). T ex P(X=40)=5/20 eller P(X=80)=3/20. I det här fallet (ändligt antal möjliga utfall) kan vi ange alla möjliga resultat med motsvarande sannolikheter: X 40 80 90 P(X=x) 5/20 3/20 12/20 DISKRETA STOKASTISKA VARIABLER Definition 2 En stokastisk variabel kallas DISKRET om den antar numrerbart (=uppräkneligt) antal olika värden. Sannolikhetsfördelning för en diskret stokastisk variabel oftast anges med en tabell: ξ xx 1 xx 2 xx kk PP(ξξ = xx) pp 1 pp 2 pp kk pp kk = 1 kk Definition 3. Låt ξ vara en diskret stokastisk variabel. Funktionen p ( x) = P( x = x) kallas sannolikhetsfunktionen till ξ. 1 av 8
Definition 4. Låt ξξ vara en diskret stokastisk variabel. Följande funktion kallas fördelningsfunktionen för ξξ. FF(xx) = PP(ξξ xx) För en diskret s.v. kan fördelningsfunktionen bestämmas genom att addera alla p k för de x k som är mindre eller lika med x: F ( x) = p( x ) x x ========================================================== k k VÄNTEVÄRDE OCH VARIANS för diskreta s.v. VÄNTEVÄRDET för en diskret s.v. ξ betecknas m, µ eller EE(ξξ), och definieras som där pp kk = PP(ξξ = xx kk ) EE(ξξ) = xx kk pp kk kk VARIANSEN för en diskret s.v. ξ betecknas VV(ξξ), Var, σσ 2 eller ss 2 och definieras som VV(ξξ) = (xx kk mm) 2 pp kk kk STANDARDAVVIKELSEN för en diskret s.v. ξ betecknas σσ eller s och definieras som σσ = VVVVVVVVVVVVVVVVVV 2 av 8
NÅGRA VIKTIGA DISKRETA FÖRDELNINGAR Fördelning Binomial Bin(n,p) Poisson Po (λ) Sannolikhetsfunk. P ( x = x) Väntevärde Varians n np np( 1 p) x n x p (1 p) x x = 0,1,..., n x λ λ λ λ e x! x = 0, 1, 2, 3... Hypergeometrisk Hyp(N,n,p) N=N 1 +N 2 pp = NN 1 /NN N1 2 x N n N n x np np(1 p)( N n) N 1 ======================================================== ÖVNINGSUPPGIFTER Uppgift 1. I nedanstående tabell finns sannolikhetsfördelning för en diskret stokastisk variabel ξ. xx 1 xx 2 xx 3 xx 4 xx 5 ξ 3 4 5 8 10 PP(ξξ = xx) 0.2 0.1 0.3 0.1 0.3 a) Bestäm väntevärdet och variansen och standardavvikelsen för ξ. b) Rita stolpdiagrammet för tillhörande sannolikhetsfunktion pp(xx) = PP(ξξ = xx). c) Bestäm och rita grafen till fördelningsfunktion FF(xx) = PP(ξξ xx). d) Beräkna följande sannolikheter: P ( 4 ξ 8), P ( 4 < ξ 8), P ( 4 ξ < 8), P ( 4 < ξ < 8), P ( ξ 8), P ( ξ < 8), P ( 4 < ξ ), P ( 4 ξ ), P ( ξ 10), P ( ξ > 10), P ( ξ 3), P ( ξ > 3). Lösning: a) VÄNTEVÄRDET: mm = EE( ξξ) = xx kk pp kk kk = 3 0.2 + 4 0.1 + 5 0.3 + 8 0.1 + 10 0.3 = 6.3 3 av 8
VARIANSEN: V(ξ) = (xx kk mm) 2 kk pp kk = (3 6.3) 2 0.2 + (4 6.3) 2 0.1 + (5 6.3) 2 0.3 + (8 6.3) 2 0.1 + (10 6.3) 2 0.3 = 7.61 STANDARDAVVIKELSEN : σσ = VVVVVVVVVVVVVVVVVV = 7.61 = 2.7586 b) Grafen till sannolikhetsfunktionen pp(xx) (stolpdiagram) 0,4 0,3 0,2 0,1 0 3 4 5 8 10 c) Fördelningsfunktion FF(xx) = PP(ξξ xx) bestäms av kumulativa sannolikheter: 0 0.2 0.3 F( x) = 0.6 0.7 1 om x < 3 om 3 x < 4 om 4 x < 5 om 5 x < 8 om 8 x < 10 om 10 x 4 av 8
d) Från tabellen xx 1 xx 2 xx 3 xx 4 xx 5 ξ 3 4 5 8 10 PP(ξξ = xx) 0.2 0.1 0.3 0.1 0.3 får vi: P ( 4 ξ 8) = 0.1+ 0.3 + 0.1 = 0.5, P ( 4 < ξ 8) = 0.3 + 0.1 = 0.4, P ( 4 ξ < 8) = 0.1+ 0.3 = 0.4, P ( 4 < ξ < 8) = 0.3, P ( ξ 8) = 0.2 + 0.1+ 0.3 + 0.1 = 0.7, P ( ξ < 8) = 0.2 + 0.1+ 0.3 = 0.6, P ( 4 < ξ ) = 0.3 + 0.1+ 0,3 = 0.7, P ( 4 ξ ) = 0.1+ 0.3 + 0.1+ 0.3 = 0.8, P ( ξ 10) = 1, P ( ξ > 10) = 0, P ( ξ 3) = 0, P ( ξ > 3) = 1. Uppgift 2. (Hypergeometrisk fördelning) Bland 15 produkter finns 5 defekta. Man väljer på måfå 4 produkter. Bestäm sannolikheten att få a) ingen defekt b) exakt en defekt c) minst en defekt. 5 av 8
Lösning: a) b) c) 5 10 0 4 15 4 = 2 13 = 0.1538 5 10 1 3 15 4 = 0.43956 11 5 10 0 4 15 4 = 11 2 13 = 0.8462 Binomialfördelning Låt A vara en händelse som inträffar med sannolikheten p vid ett försök. AA AA CC PP(AA) = pp PP(AA CC ) = qq (= 1 pp) Vi upprepar försöket n gånger och kollar hur många gånger A inträffar. Låt ξ vara antalet gånger A inträffar vid n försök. Då gäller PP(ξξ = xx) = nn xx ppxx (1 pp) nn xx, xx = 0, 1,, nn. Vi säger att variabeln ξ är binomialfördelad med parametrar n och p och betecknar ξξ BBBBBB(nn, pp). Man betecknar ofta 1 pp = qq. Föregående formel kan då skrivas kortare PP(ξξ = xx) = nn xx ppxx qq nn xx, xx = 0, 1,, nn. För en binomialfördelad s. v. ξ med parametrar n (antalet upprepningar av ett försök A) och p (sannolikheten för ett försök A) gäller följande formler Väntevärdet: E(ξ) =np 6 av 8
Variansen: V(ξ) =npq och standardavvikelsen: σ = npq Uppgift 3. (Binomialfördelning) Vi planerar att producera 10 st produkter i en maskin. Sannolikheten för att en produkt blir defekt är 5%. Bestäm sannolikheten att få a) exakt 1 defekt produkt b) högst 1 defekt produkt c) minst 1 defekt d) ingen defekt e) alla defekta Lösning: Antalet defekta är en s. v. som vi betecknar med ξ. Variabeln är binomialfördelad med parametrar nn = 10 och pp = 0.05 ( och qq = 1 pp = 0.95), som vi betecknar ξ Bin(10, 0.05) a) Sannolikheten att få exakt 1 defekt produkt är pp 1 = PP(ξξ = 1) = 10 1 pp1 qq 9 = 0.3151 b) Sannolikheten för högst 1 defekt produkter är pp 0 + pp 1 där pp 0 = PP(ξξ = 0) = 10 0 pp0 qq 10 = 0.5987 (pp 1 har vi beräknat i a) Därför pp 0 + pp 1 = 0.9139 c) PP( mmmmmmmmmm eeee dddddddddddd) = pp 1 + pp 2 + pp nn Eftersom pp 0 + pp 1 + pp 2 + pp nn = 1 har vi PP( mmmmmmmmmm eeee dddddddddddd) = pp 1 + pp 2 + pp nn = 1 pp 0 = 1 0.5987 = 0.4013 d) Sannolikheten för ingen defekt är pp 0 = PP(ξξ = 0) = 10 0 pp0 qq 10 = 0.5987 e) Sannolikheten för alla defekta är pp 10 = PP(ξξ = 10) = 10 10 pp10 qq 0 = 9.766 10 14 Poissonfördelning. Poissonfördelningen används oftast i modeller som beskriver antalet oberoende händelser under ett tidsintervall. Om för en stokastisk variabel ξ gäller PP(ξξ = xx) = λλxx xx! ee λλ, ddärr xx = 0, 1, 2, 3,. 7 av 8
då säger vi att ξ är Poissonfördelad med parameter λλ och skriver ξξ PPPP(λλ). För en Poissonfördelad s. v. med parameter λλ gäller följande formler Väntevärdet: E(ξ) = λ Variansen: V(ξ) = λ och standardavvikelsen: σσ = λλ ============================== APPROXIMATION av Bin(n,p) med PPPP(λλ). Om n är stor och p litet ( tumregel nn > 10, pp < 0.1) i en binomialfördelning Bin(n,p) då kan fördelningen Bin(n,p) approximeras med Poissonfördelningen PPPP(λλ) med λλ = nnnn. Uppgift 4. (Poissonfördelning) Till en telefonväxel ankommer i genomsnitt 90 anrop per timme. Vi antar att ankomster är Poissonfördelade. Bestäm sannolikheten att exakt 2 anrop kommer under ett tidsintervall som är en minut långt. Lösning. Viktigt: Parameter λ i en Poissonfördelad s.v. ξ är lika med väntevärdet E(ξ). Vi har i genomsnitt 90 ankomster per timme och därför 90/60=1.5 ankomster per minut. Vi betecknar antalet ankomster per minut med λ. Då är ξξ PPPP(λλ). där λ = 1.5 ankomster per minut. Vi använder formeln PP(ξξ = xx) = λλxx xx! ee λλ, och substituerar λλ = 1.5 och xx = 2. PP(ξξ = 2) = 1.52 ee 1.5 = 0.2510 2! Uppgift 5. (APPROXIMATION. Binomialfördelning, Poissonfördelning) Man ska tillverka 1000 produkter. Vad är sannolikheten att få exakt 2 defekta produkter bland 1000, om felsannolikheten (sannolikheten att en produkt blir defekt) är 0.003. Lösning: Låt ξξ beteckna antalet defekta produkter. Då gäller ξξ BBBBBB(1000,0.003). Metod 1. Vi beräknar sannolikheten direkt (binomialfördelningen) dvs PP(ξξ = xx) = nn xx ppxx (1 pp) nn xx, xx = 0, 1,, nn. pp 2 = 1000 2 pp2 (1 pp) 998 = 0.2242 Metod 2. Vi kan approximera sannolikheten med hjälp av Poissonfördelningen med parameter λ=np=1000 0.003=3. PP(ξξ = xx) λλxx xx! ee λλ = 32 2! ee 3 = 0.2240 8 av 8