Oberoende stokastiska variabler

Kapitel 6 Oberoende stokastiska variabler Betrakta ett försök med ett ändligt (eller högst numrerbart) utfallsrum Ω samt två stokastiska variabler ξ och η med värdemängderna Ω ξ och Ω η. Vi bildar funktionen ω (ξ(ω), η(ω)). Denna funktion kallas en tvådimensionell stokastisk variabel. Beteckna dess värdemängd med Ω (ξ,η). Då gäller Ω (ξ,η) Ω ξ Ω η. Låt (x, y) Ω (ξ,η). Då är mängden {ω : ξ(ω) = x, η(ω) = y} en händelse, dvs en delmängd till Ω. Definition 6. Funktionen f : Ω ξ Ω η [, ] : P(ξ = x, η = y), (x, y) Ω (ξ,η), f(x, y) =, i övrigt benämns frekvensfunktionen för den tvådimensionella stokastiska variabeln (ξ, η). Observera att vi definierat frekvensfunktionen i hela mängden Ω ξ Ω η. (I fallet Ω (ξ,η) Ω ξ Ω η innebär denna definition att sannolikheten är noll för den händelse att (ξ, η) antar ett värde i Ω ξ Ω η Ω (ξ,η).) Det är klart att en frekvensfunktion f uppfyller (i) f(x, y) för varje (x, y) Ω ξ Ω η, (ii) x Ω ξ y Ω η f(x, y) =. Vi kan bestämma frekvensfunktionerna f(ξ) och f(η) för ξ resp. η utgående från funktionen f på följande sätt: Låt x Ω ξ. Då gäller {ξ = x} = y Ω η {ξ = x, η = y}. 53

Följaktligen På samma sätt ( ) f ξ (x) = P(ξ = x) = P {ξ = x, η = y} y Ω η = y Ω η P(ξ = x, η = y) = y Ω η f(x, y). f η (x) = P(η = y) = x Ω ξ f(x, y). Funktionerna f ξ och f η kallas, i detta sammanhang, de marginala frekvensfunktionerna för variabeln (ξ, η). Omvändningen till det ovan sagda behöver ej gälla, dvs om vi känner till funktionerna f ξ och f η, så kan vi inte i allmänhet konstruera funktionen f. Vi har ändå följande viktiga specialfall Definition 6. Två stokastiska variabler ξ och η säges vara oberoende om f(x, y) = f ξ (x)f η (y), för varje (x, y) Ω ξ Ω η, där f, f ξ och f η är frekvensfunktionerna för (ξ, η), ξ resp. η. Vi har Sats 6.3 Låt ξ och η vara oberoende samt A och B delmängder till Ω ξ resp. Ω η. Då är händelserna {ξ A} och {η B} oberoende. Bevis Betrakta P ( {ξ A} {η B} ) = P ( (ξ, η) A B ) = f(x, y) = (x,y) A B f(x, y) = x A y B = f ξ (x) f η (y) = P(ξ A) P(η B). x A y B 5

Anmärkning 6. Allt ovanstående kan lätt generaliseras till det n-dimensionella fallet. T.ex. är ξ,..., ξ n oberoende, om f(x, x,..., x n ) = f ξ (x ) f ξ (x )...f ξn (x n ), där (x, x,..., x n ) Xi= n Ω ξ i samt f och f ξi (i =,,..., n) är frekvensfunktionerna för (ξ, ξ,..., ξ n ) resp. ξ i (i =,,..., n). Exempel 6.5 Betrakta en urna som innehåller fyra kulor numrerade,,3,. Vi drar två kulor ur urnan utan återläggning. Låt ξ vara siffran på den första dragna kulan och η siffran på den andra dragna kulan. Vi har Ω ξ = {,, 3, } och Ω η = {,, 3, }. Vidare η : y ξ : x 3 3 f ξ 3 f η Således är ξ och η beroende, ty t.ex. f(, ) = = f ξ()f η (). Antag nu att vi drar de två kulorna med återläggning. Då gäller Således är ξ och η oberoende. η : y ξ : x 6 3 6 6 f η 3 f ξ 6 6 6 6 6 6 6 6 6 6 6 6 Vi skall nu betrakta tvådimensionella stokastiska variabler som har en täthet. Låt ξ och η vara stokastiska variabler med värdemängderna Ω ξ = (a, b ) resp. Ω η = (a, b ). Den tvådimensionella variabeln (ξ, η) har då en värdemängd Ω (ξ,η) som är en delmängd till Ω ξ Ω η. 55

Antag att det existerar en funktion f sådan att P ( (ξ, η) A ) = A f(x, y)dxdy, där A är en mängd i Ω ξ Ω η som är en union av ett ändligt (eller högst numrerbart) antal rektanglar R i ur Ω ξ Ω η, dvs A = n i= R i (eller A = i= R i). Funktionen f kallas frekvensfunktionen för (ξ, η) och den uppfyller (i) f(x, y) för (x, y) Ω ξ Ω η (ii) Ω ξ Ω η f(x, y)dxdy = b a b a f(x, y)dxdy =. Exempel 6.6 Låt Ω ξ = Ω η = [, ). A = i= R i Ω η R 5 R R n R R R 3 R 6 Ω ξ Utgående från frekvensfunktionen för (ξ, η) kan vi bestämma frekvensfunktionerna för ξ och η. Vi har f ξ (x) = f η (y) = b a b a f(x, y)dy, f(x, y)dx. 56

Definition 6.7 Två stokastiska variabler ξ och η säges vara oberoende om f(x, y) = f ξ (x) f η (y), för varje (x, y) Ω ξ Ω η. Anmärkning 6.8 Se Anmärkning 6.. Exempel 6.9 Låt (ξ, η) ha frekvensfunktionen Vi bestämmer konstanten c: f(x, y) = c e αx βy, x, y, α >, β >. Vidare c f(x, y) dxdy = e αx dx e βy dy = f ξ (x) = αβ f η (y) = αβ c αβ c e αx βy dxdy = = c = αβ e αx βy dy = αe αx, e αx βy dx = βe αy. Följaktligen f(x, y) = f ξ (x) f η (y) och variablerna ξ och η är således oberoende. Nedan ges ett antal satser om tvådimensionella stokastiska variabler. Sats 6. Låt ξ och η vara oberoende stokastiska variabler samt g och h reellvärda funktioner med Ω ξ resp. Ω η som definitionsmängder. a) Om Ω är ändligt (eller högst numrerbart), så är även variablerna g(ξ) och h(η) oberoende. b) Om ξ och η har tätheter samt g och h är kontinuerliga, så är även variablerna g(ξ) och h(η) oberoende. Sats 6. Låt (ξ, η) vara en tvådimensionell stokastisk variabel med frekvensfunktionen f. Om väntevärdet för den sammansatta stokastiska variabeln ϕ(ξ, η) existerar, så gäller E ( ϕ(ξ, η) ) = x Ω ξ Ω ξ y Ω η ϕ(x, y) f(x, y) Ω η (x, y) f(x, y) dxdy. I det fall då Ω är högst numrerbart kan denna sats bevisas på samma sätt som Sats.. 57

Sats 6. a) E(ξ + η) = E(ξ) + E(η). b) Om ξ och η är oberoende, så är E(ξη) = E(ξ) E(η). Bevis a) Betrakta det fall då Ω är högst numrerbart. Det andra fallet bevisas analogt. E(ξ + η) = (x + y) f(x, y) x Ω ξ y Ω η = xf(x, y) + yf(x, y) x Ω ξ y Ω η x Ω ξ y Ω η = x f(x, y) + y f(x, y) x Ω ξ y Ω η y Ω η x Ω ξ = xf ξ (x, y) + yf η (x, y) = E(ξ) + E(η) x Ω ξ y Ω η b) Betrakta det fall då (ξ, η) har tätheten f. Det andra fallet bevisas analogt. Sätt Ω ξ = (a, b ) och Ω η = (a, b ). E(ξη) = = b b a b a a xf ξ (x) dx = E(ξ) E(η). xy f(x, y) dxdy b a yf η (y) dy (ty ξ och η är oberoende) Sats 6.3 V(ξ + η) = V(ξ) + V(η) + Kov(ξ, η), där Kov(ξ, η) = E{ ( ξ E(ξ) )( η E(η) ) }. Bevis V(ξ + η) = E{ ( ξ + η ( E(ξ) + E(η) )) } = E{ ( ξ E(ξ) + η E(η) ) } = E{ ( ξ E(ξ) ) } + E{ ( η E(η) ) } + E{ ( ξ E(ξ) )( η E(η) ) } = V(ξ) + V(η) + Kov(ξ, η). 58

Sats 6. Om ξ och η är oberoende så är V(ξ + η) = V(ξ) + V(η). Bevis Betrakta Kov(ξ, η) = E{ ( ξ E(ξ) )( η E(η) ) } = E(ξη) = E(ξ) E(η) = enligt Sats 6. b). Påståendet följer nu ur Sats 6.3. Anmärkning 6.5 Dessa satser kan lätt generaliseras till det n-dimensionella fallet. Låt t.ex. ξ, ξ,..., ξ n vara n stycken stokastiska variabler. Då gäller Om ξ,..., ξ n är oberoende, så är E(ξ +... + ξ n ) = E(ξ ) +... + E(ξ n ) n n n V(ξ +... + ξ n ) = V(ξ i ) + Kov(ξ i, ξ j ). i= i= j= i j E(ξ... ξ n ) = E(ξ )E(ξ )... E(ξ n ) V(ξ +... + ξ n ) = V(ξ ) +... + V(ξ n ). Exempel 6.6 Låt ξ och η vara oberoende med väntevärdena E(ξ) och E(η) samt varianserna V(ξ) och V(η). Bilda ζ = ξ η. Vi har E(ζ) = E(ξ η) = E(ξ) E(η), V(ζ) = V(ξ η) = V(ξ) + V( η) ty enligt Sats 6. är även ξ och η oberoende. Följaktligen V(ζ) = V(ξ) + ( ) V(η) = V(ξ) + V(η). Exempel 6.7 Vid kast med två symmetriska tärningar betraktas tärningarnas värden som stokastiska variabler. Vi har E(ξ, ξ ) = x Ω ξ = = xy f(x, y) x Ω η 6 6 ( i j ty f(x, y) = ) i= j= 6 i i= =, 5 6 j= j = 6 + 6 6 + 6 59

Å andra sidan är ξ och ξ oberoende och således E(ξ, ξ ) = E(ξ )E(ξ ) = + 6 + 6 =, 5, (Se Exempel.9). Vidare V(ξ, ξ ) = E ( (ξ, ξ ) ) ( E(ξ, ξ ) ) = E(ξ ) E(ξ ) ( E(ξ ) ) ( E(ξ ) ). Enligt Exempel.5 Följaktligen V(ξ ) = 6 = 35, E(ξ ) = E(ξ ) = V(ξ ) + ( E(ξ ) ) = 35 + = 8 V(ξ, ξ ) = 8 8 Betrakta nu variabeln η = ξ ξ. Då är ( 7 ) ( ) 7 8. ( ) 7 ( ) E(η) = E(ξ ) E ξ ty ξ och ξ är oberoende, ( ) E ξ = 6 i= i 6 = 7 E(η) = 3, 5, 83, 9, 83 Det är klart att ζ = ξ ξ och η = ξ ξ inte är oberoende. Vi har E(ζη) = E(ξ ) = 8 E(ζ) E(η) 7, 5. 5, 7, 6

Exempel 6.8 Vi bestämmer kovariansen för variablerna ξ och η i Exempel 6.5 då dragningen sker utan återläggning. Kov(ξ, η) = E ( (ξ E(ξ))(η E(η)) ) = E(ξη) E(ξ) E(η). E(ξ) = 5, E(η) = 5 E(ξ η ) = xy f(x, y) = y Ω η x Ω ξ = Kov(ξ, η) = 7 5 = 5. i i= j j= i j ( ( + 3 + ) + ( + 3 + ) + 3 ( + + ) + ( + + 3) ) = 7 Tjebysjevs olikhet och de stora talens lag Sats 6.9 (Tjebysjevs olikhet) Låt ξ vara en stokastisk variabel med väntevärde µ och varians σ. Då gäller för varje t > att P( ξ µ tσ) t. Bevis Vi bevisar satsen i det fall då ξ har en täthet f. Låt Ω ξ = (a, b) och betrakta σ = = b a (x µ) f(x) dx (x µ) f(x) dx, ty vi kan sätta f(x) för x < a och x > b. Låt t >. Då gäller σ = = µ tσ µ tσ (x µ) f(x) dx (x µ) f(x) dx + (x µ) f(x) dx + µ+tσ µ tσ µ+tσ (x µ) f(x) dx + (x µ) f(x) dx µ+tσ (x µ) f(x) dx, 6

ty µ+tσ µ tσ (x µ) f(x) dx >. Men µ tσ µ+tσ (x µ) f(x) dx (x µ) f(x) dx µ tσ (µ tσ µ) f(x) dx µ tσ = t σ f(x) dx, µ+tσ = t σ (µ + tσ µ) f(x) dx µ+tσ f(x) dx. Följaktligen ( µ tσ ) σ t σ f(x) dx + f(x) dx µ+tσ σ t σ ( P(ξ µ tσ) + P(ξ µ + tσ) ) σ t σ P( ξ µ tσ) P( ξ µ tσ) t. Observera att olikheten gäller för varje sannolikhetsfördelning, och är således vanligtvis mycket grov. (T.ex. då t = säger satsen endast att P( ξ µ σ) vilket är en trivialitet.) Sats 6. (De stora talens lag) Låt ξ, ξ,... vara oberoende stokastiska variabler med samma sannolikhetsfördelning (dvs de är identiskt fördelade) med väntevärdet µ och variansen σ. Låt ξ n = n n i= ξ i vara medelvärdet av de stokastiska variablerna. Då gäller för varje ε > att lim P( ξ n µ > ε) =. n Bevis Vi har E( ξ n ) = n n i= E(ξ i) = µ och V( ξ n ) = n n i= V(ξ i) = σ n, ty variablerna antas vara oberoende. Enligt Sats 6.9 gäller för varje t > att ( σ ) P ξ n µ > t n t. 6

σ Välj t så att t n = ε, dvs t = ε n. Följaktligen gäller för varje n σ P( ξ n µ ε) σ ε n. Men den högra sidan av denna olikhet går mot noll då n, dvs lim P( ξ σ n µ ε) lim n n ε n =. Exempel 6. Låt ξ, ξ,... vara oberoende och binomialfördelade med parametrarna n och p. Bestäm ett värde på m, så att sannolikheten att ξ m = m m i= ξ i avviker från np med mer än, är mindre än,5. Vi har E( ξ m ) = m m E(ξ i ) = np i= V( ξ m ) = m m V(ξ i ) = i= np( p) m. För varje t > gäller då ( P ξ m np > t ) np( p) m t. Välj t så att t =, 5, dvs t = 5 = 5. Då gäller P ( ξ m np 5 ) np( p) m, 5. Välj nu m så stort att np( p) 5 =, m np( p) = m m = np( p). T.ex. om n = och p = fås att m = 5. 63

Övningsuppgifter. Den tvådimensionella variabeln (ξ, η) har frekvensfunktionen f(x, y) = c(x+y), (x, y) {, } {, }. Bestäm konstanten c samt de endimensionella frekvensfunktionerna f ξ och f η. Är variablerna ξ och η oberoende?. Den tvådimensionella stokastiska variabeln (ξ, η) har följande fördelning y : 5 6 x: 3 Bestäm frekvensfunktionerna f ξ (x) och f η (y) för de endimensionella variablerna. Är ξ och η oberoende? Bestäm vidare frekvensfunktionerna för variablerna ζ = ξ η och ζ = ξ. 3. De stokastiska variablerna ξ och ξ har samma väntevärden och samma varianser. Variablerna är oberoende. Den stokastiska variabeln η = ξ + ξ har väntevärdet lika 3 med 6 och variansen. Bestäm E(ξ ) och V(ξ ).. ξ är en tvåpunktsfördelad variabel, som antar värdet med sannolikheten a och värdet med sannolikheten a. a) Bestäm E(ξ) och V(ξ). b) Gör två oberoende observationer på ξ och bestäm väntevärdet och variansen för dessa observationers summa. 5. För variablerna ξ och η gäller följande E(ξ) =, V(ξ) =, Kov(ξ, η) =, 3. E(η) =, V(η) =, 9 Sök väntevärdet för variabeln ζ = ξ + η ξη! 6. Ett försäkringsbolag tillämpar ett bonussystem med 3 klasser med nedan angiven rabatt på grundpremien: bonusklass 3 bonus (rabatt) % 35 % 7 % Första året betalar en ny försäkringstagare full premie ( mk). Ett skadefritt år medför för nästa år en uppflyttning till närmast högre bonusklass, dock högst till bonusklass 3. Ett icke skadefritt år medför att nästa års premie betalas enligt närmast 3 6

lägre bonusklass, dock lägst klass. Bestäm för en ny försäkringstagare väntevärdet för den sammanlagda premien under de första tre åren. De tre årens premier grundar sig på förhållandena under de två första åren, eftersom första årspremien är given. Vår försäkringstagare har sannolikheten 5 6 att köra skadefritt under ett år och vi förutsätter oberoende mellan åren. 7. En urna innehåller fem kulor markerade,, 3, och 5. Man tar med återläggning på måfå två kulor ur urnan. Låt ξ och η vara de därvid erhållna poängtalen för första resp. andra kulan. Definiera nya stokastiska variabler enligt ξ = ξ + η och ξ = max(ξ, η). Bestäm frekvensfunktionerna för ξ, ξ och (ξ, ξ ). Är variablerna oberoende? 8. Låt ξ och η vara två stokastiska variabler. Talet ρ = Kov(ξ,η) kallas korrelationsko- V(ξ)E(η) efficienten mellan variablerna ξ och η. Bestäm korrelationskoefficienten mellan ξ och ξ, där ξ betecknar utfallet vid kast med en symmetrisk tärning. 9. En stokastisk variabel ξ har frekvensfunktionen cx 3, för x, f(x) =, för övriga x. Bestäm konstanten c! Vad är sannolikheten att av två slumpmässiga oberoende observationer av variabeln båda är större än,5?. Den kontinuerliga stokastiska variabeln ξ är likformigt fördelad i intervallet (a, b) och har variansen 3 6. Bestäm variationsvidden för ξ, dvs beräkna avståndet mellan a och b.. Beräkna väntevärdet och variansen för summan av tio oberoende stokastiska variabler, som alla är likformigt fördelade i intervallet (, 3).. Bestäm k så att funktionen f(x, y) = k xy( y), (x, y) (, ) (, ) blir en frekvensfunktion för en tvådimensionell stokastisk variabel (ξ, η). Visa att variablerna ξ och η är oberoende. Beräkna sannolikheterna P(ξ > η) och P(η < ξ ). 3. En tvådimensionell stokastisk variabel (ξ, η) har frekvensfunktionen f(x, y) = x y, (x, y) (, ) (, ). Bestäm frekvensfunktionerna för ξ och η. Sätt ζ = ξη. Bestäm E(ζ)! 65

. Man väljer på måfå två punkter på en cirkels periferi. Vad är sannolikheten att deras avstånd är större än cirkelns radie? (Ledning: Välj först en punkt. Fördela sedan sannolikhetsmassan likformigt över cirkelns periferi.) 5. Låt ξ, ξ,... vara oberoende och a) Poissonfördelade b) exponentialfördelade. Bestäm med hjälp av Tjebysjevs olikhet ett tal n så att sannolikheten att ξ n = n n i= ξ i avviker från E( ξ n ) med mer än, är mindre än,5. 6. Låt ξ vara en normalfördelad stokastisk variabel med parametrarna µ och σ. Uppskatta med Tjebysjevs olikhet sannolikheten att ξ avviker från µ med mer än, 96 σ. Vad är den exakta sannolikheten? 66