1 FÖRELÄSNING IV; STOKASTISK VARIABEL 1 Föreläsning IV; Stoastis variabel Vi har tidigare srivit P (1, 2, 3, 4, 5) = P (C) för sannoliheten för att få 1, 2, 3, 4 eller 5 vid ett tärningsast. Vi sall använda en variabel, en stoastis variabel för att uttryca en händelse (mängd). Dessutom sall vi behandla begreppet (Sannolihets-)fördelning. E 1 Låt ξ vara en stoastis variabel, som betyder antal tärningsögon/poäng på en vanlig tärning. ξ an alltså anta värdena 1, 2, 3, 4, 5, eller 6. Händelsen A att få 3 eller 6 an utrycas (Mer eat) som A = {ξ = 3 eller 6}. P.s.s. sriver vi C = {1, 2, 3, 4, 5} = {ξ 5} underförstått att hela utfallsrummet Ω = {1, 2, 3, 4, 5, 6}. Motsvarande sannolihet srivs P (ξ 5) = 5 6. Definition 1 Givet ett utfallsrum, som antingen är ändligt ( Ω, ett heltal 0) eller uppräneligt, Ω = { 1,, 3,...}. En fördelning an ses som en funtion f() := P (ξ = ), Ω. En sådan funtion allas frevensfuntion. E 2 Vilet medelvärde/genomsnitt får man när man astar en tärning? Vi får antingen utfallet 1, 2, 3, 4, 5 eller 6 med sannoliheten för varje utfall 1 6. Rimligen är medelvärdet 1 + 2 + 3 + 4 + 5 + 6 6 = 3.5 Vi an se 1 = P (ξ = ) för = 1, 2, 3, 4, 5, 6 och sriva medelvärdet som 6 6 P (ξ = ). =1 Medelvärdet, allas i sannolihetseorin väntevärde och definieras som nedan för en stoastis variabel, ξ och är ett lägesmått. E(ξ) := Ω P (ξ = ) = µ. (1) Med betecningen P (ξ = ) = f(), en frevensfuntion an väntevärdet srivas E(ξ) := Ω f(). (2) 1
1.1 Disret fördelning 1 FÖRELÄSNING IV; STOKASTISK VARIABEL E 3 Givet en tärning där sannoliheten för att få en sea är dubbelt så stor som att få de övriga fem utfallen. Vi inför en sto. variabel η för antal tärningspoäng. Då är P (η = ) = 1 7 för = 1, 2, 3, 4, 5 och P (η = 6) = 2 7. Vad är väntevärdet E(η)? Vi beränar det med (2). E(η) = 6 =1 P (η = ) = 1 1 + 2 1 + 3 1 + 4 1 + 5 1 + 6 2 7 = 27 7 4. Man an se väntevärde som ett vitat medelvärde. 1.0.1 Varians Variansen är ett spridningsmåttöch mäter spridningen av utfallen runt väntevärdet E(ξ) = mu. Det definieras som den vadratisa medalavvielsen från µ som V (ξ) := Ω( µ) 2 P (ξ = ). (3) Standardavvielsen definieras som σ := V. E 4 Beräna variansen för antal poäng av tärningsast för en symmetris tärning. V (ξ) = 1 6 6 ( 7/2) 2 = 35 12 2.9. =1 Motsvarande standardavvielse definieras som σ = 35 V (ξ) = 12 1.7}. 1.1 Disret fördelning En disret fördelning är sådan att den stoastis variabeln antar, antingen bara ett ändligt antal värden eller ett uppräneligt oändligt antal värden. Det betyder att Ω = { 1, 2,..., n } eller Ω = { 1, 2,..., n,...} alla j olia. 2
1.1 Disret fördelning 1 FÖRELÄSNING IV; STOKASTISK VARIABEL 1.1.1 Hypergeometris fördelning E 5 I ett större lager finns 1000 =: N mobiltelefoner. Man ränar med att en andel p = 0.40 = 40% av dessa är defeta. Genom att ta ett sticprov, säg 50 =: n av dessa och m.h.a. antal defeta i sticprovet få en uppfattning av antal defeta bland de N = 1000. Vad är sannoliheten att antal defeta bland de n valda är = 20? ( ) N Antal möjliga utfall är och antal gynnsamma får vi med Multipliationsprincipen. Antal defeta är N p = 400 och bland dessa väljer vi. Bland de n orreta väljer vi således n ur mängden av orreta, som är N(1 p) = 600. Söt sannolihet är ( Np ) ( N(1 p) ) n P (ξ = ) = ( N n) så att med de tal som vi har ovan blir sannoliheten att ( ) ( ) 400 600 P (ξ = 20) = = 0.117533 0.118. 20 80 En sådan fördelning allas hypergeometris Hyp(N, n, p). I detta eempel gäller att ξ Hyp(1000, 50, 0.40). Vid prodution av större serier av produter, säg N = 1000, ontrolleras i allmänhet inte alla utan man gör ett sticprov på, e.vis n = 50. Låt p vara andelen/sannoliheten för att en produt är defet. Sannoliheten att P (ξ = 0) är mer allmänt, P (ξ = ) är då beroende på sannoliheten p. 1.1.2 Binomialfördelning Antag att ett försö består av n liafördelade oberoende delförsö med sannoliheten för att få utfall A är p och således 1 p för att utfallet är i A c. Vad är sannoliheten att få utfall i A eat gånger av n? En sevens med n delförsö an se ut så här B := A 1 A 2 A c 3 A 4 A c 5... A n, där precis av händelserna är A j och övriga n är A c j. P.g.s. av oberoende är P (B) = p (1 p) n och B an bildas på olia sätt. Sannoliheten för att få utfall eat gånger av n som ligger i A är P := p (1 p) n (4) 3
1.1 Disret fördelning 1 FÖRELÄSNING IV; STOKASTISK VARIABEL Vi an införa den stoastis variabeln ξ som är antalet gånger som A inträffar vid n oberoende försö. P (ξ = ) = p (1 p) n (5) Hypergeometris fördelning handlar om dragning utan återläggning och Binomialfördelning handlar om dragning med återläggning och båda utan hänsyn till inbördes ordning. Om n N, spelar dragning med eller utan återläggning nappast någon roll. I det fallet får vi (tumregel n/n < 0.1) ( Np ) ( N(1 p) ) n ( N n) p (1 p) n. (6) Längre ned i teten verifieras att totala sannoliheten i binomialfallet n (5) är 1, d.v.s. P (ξ = ) = 1. =0 Utmaning: Verifiera att ( Np ) ( N(1 p) ) n ( N = 1. n) Binomialfördelning används när man gör n identisa och oberoende försö. Obs! Det rör sig om dragning med återläggning. E 6 Man testar 50 identisa produter där 40% är defeta. Beräna sannoliheten att eat 20 är defeta. Det är en binomial situation med ξ Bin(50, 0.40). Söt sannolihet är ( ) 50 P := 0.40 20 0.60 30 = 0.114559 0.115. 20 Villoret i tumregeln (6) är uppfyllt i det förrförra eemplet eftersom n/n = 50/1000 < 0.1. Det sista eemplet an se som just binomialapproimationen av det förrförra eemplet. Sannoliheten är ocså approimativt lia: 0.117533... 0.114559.. 4
1.1 Disret fördelning 1 FÖRELÄSNING IV; STOKASTISK VARIABEL 1.1.3 Poissonfördelning Typisa händelser som bruar vara Poissonfördelade är antal utfall som inträffar slumpmässigt i tiden under ett givet tidsintervall med en viss intensitet, λ. Definition 2 Om ξ Po(λ) betyder, per definition, att P (ξ = ) = e λ λ, = 0, 1, 2,... (7)! E 7 Låt den stoastis variabeln ξ var antal inommande telefonsamtal som inommer till en väel under ett 2 minuter långt tidsintervall. Detta har en fördelning som oftast an betratas som en Poissonfördelning. Vi antar att så är fallet och att förväntat antal inommande samtal är 3 i ett tvåminuters intervall. (a) Beräna sannoliheten att det ommer in eat 2 samtal under en tvåminutersperiod. (b) Beräna sannoliheten att det ommer in minst 2 samtal under en tvåminutersperiod. Låt ζ vara antal inommande telefonsamtal på ett tvåminutersintervall. (a) Sannoliheten att det ommer in eat 2 samtal under en tvåminutersperiod är P (ζ = 2) = e 3 32 2! = 0.224. (b) Sannoliheten att det ommer in minst 2 samtal under en tvåminutersperiod är [ ] 3 1 P (ζ < 2) = 1 e 3 0 0! + 31 = 0.80 1! 1.1.4 Indiatorvariabel E 8 I ett spel går det ut på att få flest poäng. Det går till så att två eller fler astar tärning. Man får 1 poäng för tärningspoängen 1 eller 4 och noll poäng för övriga träningspoäng (2,3,5,6). Vi inför händelsen/mängden A = {1, 4} och således A c = {2, 3, 5, 6}. Som stoastis variabel inför vi en indiatorvariabel, som I = I A. Den sall vara sådan att den antar värdet 1, om utfallet hamnar i A och 0, om utfallet hamnar i A c. P (I = 1) = p = 1 3 P (I = 0) = (1 p) = 2 (8) 3 Definition 3 En speciell stoastis variabel är indiatorvariabeln I = I A. Denna variabel antar bara två värden: I = 1 eller 0 med sannoliheten p för värdet 1, d.v.s. P (I = 1) = p och således måste P (I = 0) = 1 p. 5
1.2 Några väntevärden 1 FÖRELÄSNING IV; STOKASTISK VARIABEL Man an se indiatorvariabeln som en variabel som besriver lycat (1) med sannoliheten p och misslycat (0) med sannoliheten 1 p. 1.1.5 Summor av indiatorvariabler Låt I 1, I 2,..., I n vara n oberonde liafördelade indiatorvariabler. Vi sall besriva fördelningen ξ = n =1 Den an anta alla heltalsvärden mellan 0 och n. Vad är sannoliheten att ξ = för ett = 0, 1, 2, 3,..., n? Det betyder att stycen antar värdet 1 och övriga n antar värdet 0. En sådan sevens har sannoliheten I. P (I 1 = 1 I 2 = 0.. I n = 1) Med precis ettor och n nollor. P.g.a. oberoende och att vi har snitt (och) får vi p (1 p)... p = p (1 p) n för en sevens med ettor. Det finns sådana sevenser (med ettor). Sannoliheten P (ξ = ) är alltså P (ξ = ) = p (1 p) n, = 0, 1, 2,..., n (9) Vi verifierar att totala sannoliheten är 1: n p (1 p) n = (p + (1 p)) n = 1 n = 1. =0 1.2 Några väntevärden E 9 Väntevärde för ξ Bin(n, p) För n = 10 ober. och identisa delförsö är sannoliheten för att lycas, 40%. Man borde i genomsnitt lycas i 4 av delförsöen alltså i 10 0.4 = 4 delförsö. Intuitivt är, med ξ antal lycade delförsö av n = 10, E(ξ) = n p. Att diret beräna E(ξ), väntevärdet, är att beräna summan n =0 p (1 p) n. 6
1.2 Några väntevärden 1 FÖRELÄSNING IV; STOKASTISK VARIABEL Väntevärdet för Hyp(N, n, p) = n p, alltså samma som för binomialförd. Väntevärdet för geometris fördelning är (sätt ξ Geo(p)) µ = E(ξ) = (1 p) 1 p = 1 p. =0 Väntevärdet för Poissonfördelning är (sätt ξ Po(λ)) µ = E(ξ) = e λ λ! = e λ λ! = λ e λ λ 1 ( 1)! = λ =0 =1 =1 7