F6: Betingade fördelningar
Exempel: Tillförlitlighet Styrkan hos en lina (wire) kan modelleras enligt en stokastisk variabel Y. En tänkbar modell för styrkan är Weibullfördelning. Den last som linan utsätts för år 1 är också en s.v. som betecknas X 1. En tänkbar modell för lasten är Gumbelfördelning. Intressanta frågor: Vad är slh att linan håller under det första året, d.v.s. vad är P(Y > X 1 )? Antag att linan höll första året d.v.s. händelsen Y > X 1 har skett. Vad är då sannolikheten att linan håller år 2 också, d.v.s. vad är sannolikheten P(Y > X 2 Y > X 1 ) där X 2 är andra årets last? Vi vet att linan inte kan vara hur klen som helst eftersom den ju klarade den last den blev utsatt för första året. Hur kan vi modifiera fördelningen för styrkan för att ta hänsyn till detta? Se avsnitt 5.4.3. (s. 119 121) i boken för en ordentlig genomgång.
Vind Simultan Marginell Oberoende Betingad Exempel: Vindmätning I ett område noterar man antal dagar per år som man har vindar som överstiger 60 km/h. Man har två typer av instrument för vindmätningar: X = antal stormdagar per år med noggrann vindmätning, Y = antal stormdagar per år med mindre noggrann vindmätning. Som ett första steg i en eventuell kalibrering har man, genom att studera data under en lång följd av år, uppskattat den simultana sannolikhetsfunktionen för X och Y. Y = 0 Y = 1 Y = 2 Y = 3 X = 0 0.2910 0.0600 0.0000 0.0000 X = 1 0.0400 0.3580 0.0100 0.0000 X = 2 0.0100 0.0250 0.1135 0.0300 X = 3 0.0005 0.0015 0.0100 0.0505 = 1
Vind Simultan Marginell Oberoende Betingad Ex: Vind (forts) (a) Vad är sannolikheten att det mindre noggranna instrumentet visar 0 stormdagar samtidigt som det noggranna visar 1 stormdag? (b) Vad är sannolikheten att det noggranna instrumentet visar 1 stormdag? (c) Vad är den marginella sannolikhetsfördelningen för X? (d) Vad är den marginella sannolikhetsfördelningen för Y? (e) Är X och Y oberoende? (f) Om vi vet att det mindre noggranna instrumentet visar 1 stormdag, vad är då slh att det noggranna instrumentet kommer att visa 2 stormdagar? (g) Vad är den betingade sannolikhetsfunktionen för Y givet att X = 2?
Vind Simultan Marginell Oberoende Betingad Tvådimensionella fördelningar Vi studerar X och Y samtidigt och vill veta deras simultana variation: F(x, y) = F X,Y (x, y) = P(X x, Y y) är den tvådimensionella fördelningsfunktionen. Diskreta s.v.: Simultan sannolikhetsfunktion Den simultana sannolikhetsfunktionen för X och Y definieras som: p jk = P(X = j Y = k) = P(X = j, Y = k) Ex: Vindmätning (a) Vad är sannolikheten att det mindre noggranna instrumentet visar 0 stormdagar samtidigt som det noggranna visar 1 stormdag? P(X = 1, Y = 0) = p 10 = 0.04
Vind Simultan Marginell Oberoende Betingad Diskret: Marginell sannolikhetsfunktion Den marginella sannolikhetsfunktionen för X fås som: P(X = j) = k P(X = j, Y = k) Ex: Vindmätning (forts) (b) Vad är sannolikheten att det noggranna instrumentet visar 1 stormdag? P(X = 1) = p 10 + p 11 + p 12 + p 13 = = 0.04 + 0.358 + 0.01 + 0 = 0.408 (c) Vad är den marginella sannolikhetsfördelningen för X? P(X = 0) = p 00 + p 01 + p 02 + p 03 = 0.3510, P(X = 1) = 0.408, P(X = 2) = p 20 + p 21 + p 22 + p 23 = 0.1785, P(X = 3) = p 30 + p 31 + p 32 + p 33 = 0.0625.
Vind Simultan Marginell Oberoende Betingad Ex: Vindmätning (forts) (c)+(d) (d) Vad är den marginella sannolikhetsfördelningen för Y? P(Y = 0) = p 00 + p 10 + p 20 + p 30 = 0.3415, P(Y = 1) = p 01 + p 11 + p 21 + p 31 = 0.4445, P(Y = 2) = p 02 + p 12 + p 22 + p 32 = 0.1335, P(Y = 3) = p 03 + p 13 + p 23 + p 33 = 0.0805. Y = 0 Y = 1 Y = 2 Y = 3 p(x = j) X = 0 0.2910 0.0600 0.0000 0.0000 0.3510 X = 1 0.0400 0.3580 0.0100 0.0000 0.4080 X = 2 0.0100 0.0250 0.1135 0.0300 0.1785 X = 3 0.0005 0.0015 0.0100 0.0505 0.0625 P(Y = k) 0.3415 0.4445 0.1335 0.0805 = 1
Vind Simultan Marginell Oberoende Betingad Oberoende Om P(X = j, Y = k) = P(X = j) P(Y = k) för alla j och k så är X och Y oberoende (och tvärtom). Ex: Vindmätning (forts) (e) Är X och Y oberoende? Eftersom, t.ex., P(X = 0, Y = 0) = 0.2910 = P(X = 0) P(Y = 0) = 0.3510 0.3415 = 0.1814 så är X och Y inte oberoende.
Vind Simultan Marginell Oberoende Betingad Betingad sannolikhetsfunktion Den betingade sannolikhetsfunktionen för X, givet Y = k, definieras som: P(X = j Y = k) = P(X = j, Y = k) P(Y = k) Ex: Vindmätning (forts) (f) Om vi vet att det mindre noggranna instrumentet visar 1 stormdag, vad är då slh att det noggranna instrumentet kommer att visa 2 stormdagar? Definitionen ger P(X = 2 Y = 1) = P(X = 2, Y = 1) P(Y = 1) = 0.0250 0.4445 = 0.0562
Vind Simultan Marginell Oberoende Betingad Ex: Vindmätning (forts) (g) Vad är den betingade sannolikhetsfunktionen för Y givet att X = 2? Vi har P(Y = 0 X = 2) = P(Y = 1 X = 2) = P(Y = 2 X = 2) = P(Y = 3 X = 2) = P(X = 2, Y = 0) P(X = 2) P(X = 2, Y = 1) P(X = 2) P(X = 2, Y = 2) P(X = 2) P(X = 2, Y = 3) P(X = 2) = 0.0100 0.1785 = 0.0560, = 0.0250 0.1785 = 0.1401, = 0.1135 0.1785 = 0.6359, = 0.0300 0.1785 = 0.1681. Observera att 3 k=0 P(Y = k X = 2) = 1.
Sprickor Vi kan också vara intresserade av andra betingade sannolikheter, t.ex. P(X j Y = k) eller P(X j Y k). Exempel: P(X 1 Y 2) = P(X 1, Y 2) P(Y 2) = p 00 + p 01 + p 02 + p 10 + p 11 + p 12 P(Y = 0) + P(Y = 1) + P(Y = 2) = 0.9041 Satsen om total sannolikhet Vi kan uttrycka satsen om total sannolikhet med betingade fördelningar. Sätt A k : Y = k så blir P(B) = P(B Y = k) P(Y = k) k=0
Sprickor Exempel: Sprickor En gammal tank har ett stort antal sprickor på ytan. Antalet sprickor anses vara Poissonfördelat med väntevärde l tankens area där l antas vara 0.01 m 2. Eftersom totala arean är 5000 m 2 blir väntevärdet i Poissonfördelningen m = 50. En automatisk maskin används för att upptäcka och laga sprickorna. Maskinen är bra så att sannolikheten att den ska hitta en spricka (och därmed laga den) är 0.999. Vad är sannolikheten att minst en spricka missas?
Sprickor Lösning: Sätt Y = antal sprickor i tanken Po(50), dvs P(Y = k) = e 50 50k, k = 0, 1, 2,... k! och B = alla sprickor hittas. Då har vi att P(B Y = k) = P(alla k sprickorna hittas Y = k) = 0.999 k P(B) = P(B Y = k) P(Y = k) = k=0 k=0 0.999 k e 50 50k k! = e 50 (0.999 50) k k! k=0 = e 50 e 0.999 50 = e 50 0.001 = 0.951 P(minst en spricka missas) = 1 P(B) = 1 0.951 = 0.049.
Barn Motsvarande funktioner kan definieras för kontinuerliga fördelningar: Simultan täthetsfunktion: f X,Y (x, y) Simultan fördelningsfunktion: F X,Y (x, y) = P(X x, Y y) = Marginell täthetsfunktion: f X (x) = f Y (y) = x y f X,Y (x, u) du, f X,Y (t, y) dt f X,Y (t, u) dt du Oberoende: om f X,Y (x, y) = f X (x) f Y (y) för alla värden på x och y så är X och Y oberoende (och tvärtom).
Barn Exempel: Födelselängd och -vikt Längd (cm) och vikt (g) noterades på 725 nyfödda barn. Tänkbar modell: X = längd är N(m x, s 2 x), Från data har vi m x = 49.8 (cm) och s x = 2.5 (cm). Y = vikt är N(m y, s 2 y), Från data har vi m y = 3343 (g) och s y = 528 (g). 8 x 10 4 Fördelning för vikten 0.2 Fördelning för längden 6 0.15 4 0.1 2 0.05 0 1000 2000 3000 4000 5000 6000 vikt (gram) 0 40 45 50 55 60 längd (cm)
Barn Beroende? Uppenbarligen gäller INTE att f(x, y) = f(x) f(y) 60 Oberoende? 60 Beroende! 55 55 längd 50 längd 50 45 45 40 1000 2000 3000 4000 5000 vikt 40 1000 2000 3000 4000 5000 vikt Längd och vikt är uppenbart beroende av varandra. Hur kan vi mäta hur starkt beroendet är?
Kovarians Korrelation Mått på det linjära beroendet mellan X och Y Kovarians Koviariansen mellan X och Y definieras som Cov(X, Y) = E ( (X mx)(y my) ) Egenskaper: = E(X Y) E(X) E(Y) = E(X Y) mx my Cov(Y, X) = Cov(X, Y), Cov(X, X) = V(X), Cov(aX, by) = ab Cov(X, Y), V(aX + by) = a 2 V(X) + b 2 V(Y) + 2ab Cov(X, Y), Cov(X, Y) = 0 om X och Y är oberoende (men inte tvärtom!) Kovariansen har samma enhet som X Y (t.ex. gram cm).
Kovarians Korrelation Korrelationskoefficient Korrelationskoefficienten r är ett enhetslöst mått på kovariansen: rx,y = Cov(X, Y) V(X) V(Y), 1 rx,y 1 Om r = ±1 är X och Y perfekt linjärt beroende. Om vi har mätningarna (x 1, y 1 ),..., (x n, y n ) kan vi skatta r med n rx,y = i=1 (x i x)(y i ȳ) n i=1 (x i x) 2 n i=1 (y i ȳ) 2 Ex: r längd,vikt = 0.75.
Kovarians Korrelation 3 X,Y N(0,1 2 ), ρ = 0 3 X,Y N(0,1 2 ), ρ = 0.99 2 2 1 1 y 0 y 0 1 1 2 2 3 3 2 1 0 1 2 3 x 3 3 2 1 0 1 2 3 x 3 X,Y N(0,1 2 ), ρ = 0.3 3 X,Y N(0,1 2 ), ρ = 0.7 2 2 1 1 y 0 y 0 1 1 2 2 3 3 2 1 0 1 2 3 x 3 3 2 1 0 1 2 3 x
Diskret Total sannolikhet Kont. Beroendema tt Kovarians Korrelation Beroende? Korrelation? 6 4 y 2 0 2 4 6 5 4 3 2 1 0 x 1 2 3 4 Statistiska metoder fo r sa kerhetsanalys 5