TAMS79: Föreläsig 9 Approximatioer och stokastiska processer Joha Thim 18 ovember 2018 9.1 Biomialfördelig Vi har reda stött på dea fördelig flera gåger. Situatioe är att ett slumpförsök har två möjliga utfall, ett med saolikhet p och det adra med 1 p. Vi upprepar försöket oberoede gåger, och räkar atalet X gåger det första utfallet iträffar. Vi kallar X för biomialfördelad med parametrara och p, och skriver X Bi(, p. Biomialfördelig Sats. Om X Bi(, p, så är E(X = p och V (X = p(1 p. Vidare gäller att vi ka approximera X appr. N(p, p(1 p om p(1 p 10. Beviset för vätevärde och varias följer av argumetet i föregåede föreläsig agåede CGS. Vi skriver X som e summa av oberoede Beroulli-variabler X k Be(p, så vätevärdet E(X = k=1 E(X k = p, eftersom E(X k = 0 (1 p + 1 p = p. På samma sätt, V (X = p(1 p eftersom V (X k = 0 2 (1 p + 1 2 p p 2 = p(1 p. När det gäller approximatioe till ormalfördelig så följer detta av CGS. Att just kravet p(1 p 10 ger e bra approximatio kräver e lite djupare aalys av på vilket sätt saolikhetera kovergerar. Exempel Vi sår 1000 stycke frö som har e grobarhet på 80% (saolikhete att ett frö gror. Vad är saolikhete att högst 180 stycke ite gror? Låt X vara atalet frö som ite gror. Vi atar att olika frö är oberoede av varadra. Då är X Bi(1000, 0.2. Eftersom så är X appr. N(200, 160. Vi beräkar p(1 p = 1000 0.2 0.8 = 160 10, P (X 180 Φ((180 200/ 160 = Φ( 1.5811 = 1 Φ(1.5811 = 0.057. Det är alltså ca 6% saolikhet. Verklig saolikhet (matlab biocdf(180,1000,0.2 är 6.02%. jothi@mai.liu.se 1
9.2 Poissofördelig Atag att vi har e situatio där hädelser iträffar oberoede av varadra med e kostat itesitet λ, det vill säga, på t tidseheter iträffar i geomsitt λt hädelser. Dea typ av situatio brukar ofta moduleras med hjälp av Poisso-fördelige. Om X(t är atalet hädelser i tidsitervallet [0, t], så säger vi att X(t är Poissofördelad med vätevärde µ = λt. t=0 1 2 3 t 1 t 2 t 3 4 t 4 5 t 5 6 t 6 7 t 7 8 t 8 9 t 9 10 t 10 t Hädelser (markerade med kryss och umrerade i tidsitervallet [0, t]. Tidera t k är tidpukte för hädelse k. Poissofördelig Sats. Vi kallar X för Poissofördelad med parameter µ, X Po(µ, om saolikhetsfuktioe ges av p X (k = P (X = k = µk e µ, k = 0, 1, 2,.... Variabel X har E(X = V (X = µ (samma vätevärde som varias, parameter µ. Hur häger situatioe ova ihop med defiitioe av p X? Vi fixerar tide t och delar i itervallet [0, t] i lika stora delar, där vi väljer så stort att det högst fis e hädelse i varje delitervall. Vi itroducerar e saolikhet p som är saolikhete att ett visst delitervall iehåller e hädelse. Det är samma p för alla delitervall och sambadet p = λt måste gälla. Eftersom hädelsera är oberoede måste X(t Bi(, p. Egeskaper för biomialfördelige medför att E(X(t = p = λt. Vi börjar med att betrakta fallet med oll hädelser i itervallet [0, t], det vill säga, hädelse att X(t = 0: ( ( P (X(t = 0 = p 0 (1 p 0 = 1 λt ( ( = exp l 1 λt e λt, 0 då. Här har vi utyttjat stadardgräsvärdet s 1 l(1 + s 1 då s 0. I det allmäa fallet ka vi visa att P (X(t = k (λtk e λt,. För att se detta, låt k vara fix och betrakta ( P (X(t = k = p k (1 p k! = k ( k! = ( 1 ( k + 1 k (λtk ( λt ( 1 λt k ( 1 λt ( 1 λt k k 1 (λtk e λt 1,. D Vad detta iebär är att om X Bi(, λ/, så kommer X X Po(λ. Detta följer av satse på föregåede föreläsig om att koverges i fördelig blir ekvivalet med koverges av saolikhetsfuktioer i det diskreta fallet. Detta ger oss äve e avädbar approximatiossats för biomialfördelige. 2
Approximatio: Biomial till Poisso Sats. Om X Bi(, p med 10 och p 0.1, så är X appr. Po(p. Att p X verklige är e saolikhetsfuktio följer frå Maclauriutecklig av e x : p X (k = e µ k=1 µ k = e µ e µ = 1. Låt oss äve härleda vätevärde och varias. För vätevärdet: kp X (k = e (0 µ µ k + = µe µ µ k 1 (k 1! (k 1! = µe µ k=1 µ k = µ. Variase är lite bökigare. Vi ka ite direkt räka ut E(X 2, uta tar till omskrivige E(X 2 = E(X(X 1 + E(X. Alltså, E(X(X 1 = ( k(k 1p X (k = e µ = µ 2 e µ µ k = µ2, k=2 µ k = µ 2 e µ (k 2! k=2 µ k 2 (k 2! så E(X 2 = µ 2 + µ, vilket medför att V (X = E(X 2 E(X 2 = µ. Exempel Sågare Sverker sågar ut brädor som har ormalfördelad lägd L N(200, 50 (σ 2 = 50, ehet: cm. Om Sverker e vacker dag sågar upp 300 brädor (oberoede av varadra, vad är saolikhete att färre ä 5 stycke är kortare ä 185 cm? Lösig: Vi räkar först ut saolikhete p att e bräda är kortare ä 185 cm: p = P (L < 185 = P ( L 200 50 < 15 50 = Φ( 2.12 = 1 Φ(2.12 = 0.0170. Låt X vara atalet brädor av 300 som är kortare ä 185 cm. Det följer att X Bi(300, p. Saolikhete p är alltså lite, och 300p(1 p = 5.01 är betydligt midre ä 10, så ormalapproximatio fugerar ataglige ite. Me Poissoapproximatio borde fugera bra då p 0.1 och = 300 10. Alltså är X appr. Po(300 0.0170 = Po(5.10. Ur tabell (iterpolatio mella Po(5.0 och Po(5.2: P (X 4 0.4405 + 0.4061 2 = 0.4233. Alltså ugefär 42% chas. Verklig saolikhet blir 42.15%. Normalapproximatio skulle i fallet ge 31%, vilket är alldeles för lågt. 3
Additio av oberoede Poissofördelade variabler Sats. Låt X Po(µ 1 och Y Po(µ 2 vara oberoede. Då är X + Y Po(µ 1 + µ 2. Satse förefaller ituitivt att vara rimlig. Vi lägger helt ekelt ihop hädelsera frå två likade processer, det förvätade atalet blir u µ 1 + µ 2, och på grud av beteedet hos var och e tippar vi att summa fugerar på samma sätt. Formellt ka vi visa satse medelst de så kallade faltigssatse. De simultaa saolikhetsfuktioe för (X, Y ges av produkte p X (ip Y (j, och vi söker saolikhetsfuktioe för Z = X + Y. Alltså, p Z (k = P (X + Y = k = p X (ip Y (j = i+j=k k p X (ip Y (k i. i=0 Dubbelsumma blir e ekelsumma eftersom vi bara summerar över diagoale (är k är fixt och i + j = k. Se är p X (i = 0 då i < 0 och p Y (k i = 0 då i > k så det räcker att summera frå i = 0 till i = k. Vidare, k p Z (k = e µ µi 1 1 µ k i i! e µ 2 2 (k i! = e (µ1+µ2 i=0 = e (µ 1+µ 2 k ( k µ i i 1µ k i i=0 k i=0 2 = e (µ 1+µ 2 (k i!i! µi 1µ k i 2 (µ 1 + µ 2 k, där vi utyttjat biomialsatse i sista steget. Detta uttryck är iget aat ä saolikhetsfuktioe för e Po(µ 1 + µ 2 -fördelad variabel, vilket var precis det vi ville visa! Dea sats ka vi aväda för att dela upp e Po(µ fördelad variabel i µ stycke oberoede variabler med vätevärde ett, och e lite svas (med lägd µ µ. På detta sätt ka ma visa följade sats. Approximatio av Poissofördelig Sats. Låt X Po(µ med µ 15. Då är X appr. N(µ, µ (V (X = µ. Exempel Låt X vara atal paket i e datakö uder e sekud. Mätigar har visat att e vettig modell är X Po(250. Beräka approximativt P (X < 240. Lösig: Eftersom vätevärdet µ = 250 15 så ka vi ormalapproximera. Då blir ( 239 250 P (X < 240 = P (X 239 Φ = Φ( 0.6957 = 1 Φ(0.6957 = 0.2433. 250 Exakt värde: 0.2552. 4
9.3 Expoetialfördelig Vi fortsätter med situatioe för Poissofördelige, me istället för att räka atalet hädelser räkar vi tide mella hädelser. Det visar sig ämlige att tide är expoetialfördelad. Varför? Betrakta följade. Låt T 1 vara tide till de första hädelse. Detta iebär att iga hädelser iträffar på tide t, dvs P (T 1 > t = P (X(t = 0. Me P (X(t = 0 = e λt. Vi betraktar fördeligsfuktioe för T 1 : F T1 (t = P (T 1 t = 1 P (T 1 > t = 1 e λt, t 0. Vi ka u derivera fram täthetsfuktioe: f T1 (t = F T 1 (t = λe λt för t 0. Detta är precis täthetsfuktioe för e Exp(λ-fördelad variabel! Expoetialfördelig Sats. E stokastisk variabel X med täthetsfuktio f X (x = λe λx, x 0, kallas expoetialfördelad. Vätevärde och varias ges av E(X = λ 1 och V (X = λ 2. E itressat egeskap hos expoetialfördelige är att de är miesslös: P ( X > x + x 0 X > x 0 = P ({X > x + x 0 } {X > x 0 } P (X > x 0 9.4 Stokastiska processer = e λx = P (X > x. = P (X > x + x 0 P (X > x 0 = e λ(x 0+x e λx 0 Stokastisk process Defiitio. E stokastisk process är e familj {X t } t I av stokastiska variabler X t : Ω E, där t är ett idex i idexmägde I och processe tar värde i tillstådsrummet E. Iblad skriver vi {X(t} t I istället om det ite fis risk för missförståd. Följade kategoriserig ka göras. Processe {X t } t I säges (i ha diskret tid om I är uppräkelig, typiskt I = {0, 1, 2, 3,...}; (ii ha kotiuerlig tid om I är ett kotiuum, typiskt I [0, ett itervall; (iii vara diskret om tillstådsrummet E är uppräkeligt: E = {E 0, E 1, E 2,...}; (iv vara kotiuerlig om tillstådsrummet E är ett kotiuum, typiskt E [0, ige. Processer ka alltså vara både kotierliga eller diskreta, och ha kotiuerlig eller diskret tid. Speciellt ka vi till exempel ha e diskret process med kotiuerlig tid (tillstådsrummet uppräkigsbart me tide ett kotiuum. Amärkig: eftersom X t är e stokastisk variabel så borde vi kräva att E R eftersom vi defiierat terme stokastisk variabel på det sättet. Vi kommer i de ärmaste avsitte att tillåta tillstådsrummet att vara mer abstrakt, säg E = {sole skier, det är att} till exempel. Detta uderlättar i våra tilltäkta tillämpigar. För varje ω Ω ka vi prata om realiserige av processe i form av e tidsfuktio x(ω, t som avbildar idexmägde I i i tillstådsrummet E; x(ω, : I E. Med adra ord, x(ω, t ger värdet av utfallet vid tide t. 5
ω ω 4 y ω 3 x(ω 4,t x(ω 3,t ω 2 x(ω 2,t ω 1 x(ω 1,t t Några realiserigar vid fixerade utfall ω i för e tidskotiuerlig kotiuerlig stokstisk process. Exempel (i X t = s t + N t där N t (0, σ för alla t är oberoede. Detta är e sigal s t vi ofta är itresserade av som är störd av brus (som är ormalfördelat i detta fall. (ii X t = A cos 2t+Be t där A och B är stokastiska variabler. Vad häder är t går mot? Det fis mycket teori om stokastiska processer; hur ma klassificerar dem (statioär? svagstatioär? etc och hur ma studerar beteedet. Detta ligger utaför rame på dea kurs, me vi skall puktstudera vissa specialfall de ärmaste tide. Först ut är de så kallade Poissoprocesse. 9.5 Poissoprocesse Vi återkommer u till poissofördelig, me på ett lite aorluda sätt. Låt X(t räka atalet impulser i itervallet [0, t]. Vi ställer följade krav. Defiitio. E stokastisk process {X(t} t [0, är e Poissoprocess med itesitet λ om och edast om (i Atalet impulser i disjukta tidsitervall är oberoede stokastiska variabler; (ii P (X(t + h X(t = 1 = λh + o(h; (iii P (X(t + h X(t 2 = o(h. Poissoprocess 6
Notatioe o(h betyder ågot som går mot oll sabbare ä h. Om f(h = o(h iebär f(h det att lim = 0. Kommer i ihåg stora ordo frå resttermer i Maclauriutveckligar i h 0 h aalyse? Vi haterar lilla ordo på likade sätt och ka göra aaloga förekligar. Så hur häger de här defiitioe ihop med Poissofördelige? Låt p (t = P (X(t = och ata att h > 0 är litet. Eftersom [0, t och [t, t + h är disjukta tidsitervall så är variablera X(t och X(t + h X(t oberoede, och X(t + h är alltså summa av dessa två oberoede variabler. Hädelse att X(t + h = ka u delas upp i uioe {X(t + h = } = ( {X(t = k} {X(t + h X(t = k}, där hädelsera i varje sitt är oberoede! Vidare medför våra villkor att Alltså blir P (X(t + h X(t = 0 = 1 λh + o(h. p (t + h = P (X(t = P (X(t + h X(t = 0 + P (X(t = 1P (X(t + h X(t = 1 + P (X(t = kp (X(t + h X(t = k k=2 Vi stuvar om lite och fier att = p (t(1 λh + o(h + p 1 (t(λh + o(h + p k (to(h k=2 = p (t(1 λh + o(h + p 1 (t(λh + o(h + o(h. p (t + h p (t h = λp (t + λp 1 (t + o(h h. Vi låter t 0 + och erhåller då att högerderivata uppfyller (p +(t = λp (t + λp 1 (t, = 1, 2,.... Speciellt gäller p 0(t = λp 0 (t, t 0, för = 0. Med det aturliga begyelsevillkoret p 0 (0 = 1 har dea differetialekvatio lösige p 0 (t = e λt. Om vi löser differetialekvatioe för 1 erhåller vi p (t = (λt e λ, = 0, 1, 2, 3,....! Detta är saolikhetsfuktioe för Poissofördelige! Vi har med adra ord precis visat att X(t Po(λt för alla t > 0. 7
Frå detta och tidigare härledda resultat för Poissofördelige har vi u följade resultat för Poissoprocesse. Egeskaper hos Poissoprocesse Låt X(t vara e Poissoprocess med itesitet λ > 0. (i Vid tide t > 0 gäller att X(t Po(λt. (ii Tide T mella två hädelser är expoetialfördelad: T Exp(λ. (iii Tider mella olika hädelser är oberoede stokastiska variabler. (iv Sammaslagige av två oberoede Poissoprocesser med itesiteter λ 1 respektive λ 2 är e Poissoprocess med itesitet λ 1 + λ 2. (v Om p 1, p 2 [0, 1] med p 1 + p 2 = 1, så ka X(t delas upp i två oberoede Poissoprocesser med itesiteter p 1 λ respektive p 2 λ. 8