Statistiska metoder för säkerhetsanalys

Relevanta dokument
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Kapitel 5 Multivariata sannolikhetsfördelningar

Matematisk statistik för D, I, Π och Fysiker

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Matematisk statistik 9 hp Föreläsning 4: Flerdim

SF1901: Sannolikhetslära och statistik

Föreläsning 5, FMSF45 Summor och väntevärden

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Föreläsning 7: Punktskattningar

Föreläsning 5, Matematisk statistik Π + E

TENTAMEN I STATISTIKENS GRUNDER 1

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Kap 2. Sannolikhetsteorins grunder

SF1901: Sannolikhetslära och statistik

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

Några extra övningsuppgifter i Statistisk teori

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Stokastiska vektorer

Föreläsning 7: Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Statistiska metoder för säkerhetsanalys

Föreläsning 7: Punktskattningar

Stokastiska signaler. Mediesignaler

Kurssammanfattning MVE055

Väntevärde och varians

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Övning 1 Sannolikhetsteorins grunder

Sannolikhet och statistik XI

F10 Kap 8. Statistikens grunder, 15p dagtid. Binomialfördelningen 4. En räkneregel till. Lite repetition HT Sedan

Stokastiska vektorer och multivariat normalfördelning

Laboration 2: Sannolikhetsteori och simulering

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Laboration 2: Sannolikhetsteori och simulering

TMS136. Föreläsning 4

Lärmål Sannolikhet, statistik och risk 2015

Simulering av elmarknader. EG2205 Föreläsning 11, vårterminen 2016 Mikael Amelin

Tentamen MVE302 Sannolikhet och statistik

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Kovarians och kriging

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Föreläsning 7: Stokastiska vektorer

SF1901: Sannolikhetslära och statistik

FACIT: Tentamen L9MA30, LGMA30

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Formler och tabeller till kursen MSG830

Slumpvariabler och sannolikhetsfördelningar

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Föreläsning 2, Matematisk statistik för M

(x) = F X. och kvantiler

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

modell Finansiell statistik, vt-05 Modeller F5 Diskreta variabler beskriva/analysera data Kursens mål verktyg strukturera omvärlden formellt

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

SF1901 Sannolikhetsteori och statistik I

Mer om slumpvariabler

Matematisk statistik för D, I, Π och Fysiker

Grundläggande matematisk statistik

Formel- och tabellsamling i matematisk statistik

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

SF1901: Sannolikhetslära och statistik

bli bekant med summor av stokastiska variabler.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Föreläsning 4, Matematisk statistik för M

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

LINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1

Tentamen i Matematisk Statistik, 7.5 hp

Föreläsning 2, FMSF45 Slumpvariabel

4.2.1 Binomialfördelning

SF1901: Sannolikhetslära och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Föreläsning 6, FMSF45 Linjärkombinationer

Grundläggande matematisk statistik

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

SF1901: Övningshäfte

19.1 Funktioner av stokastiska variabler

2.1 Mikromodul: stokastiska processer

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Transkript:

F6: Betingade fördelningar

Exempel: Tillförlitlighet Styrkan hos en lina (wire) kan modelleras enligt en stokastisk variabel Y. En tänkbar modell för styrkan är Weibullfördelning. Den last som linan utsätts för år 1 är också en s.v. som betecknas X 1. En tänkbar modell för lasten är Gumbelfördelning. Intressanta frågor: Vad är slh att linan håller under det första året, d.v.s. vad är P(Y > X 1 )? Antag att linan höll första året d.v.s. händelsen Y > X 1 har skett. Vad är då sannolikheten att linan håller år 2 också, d.v.s. vad är sannolikheten P(Y > X 2 Y > X 1 ) där X 2 är andra årets last? Vi vet att linan inte kan vara hur klen som helst eftersom den ju klarade den last den blev utsatt för första året. Hur kan vi modifiera fördelningen för styrkan för att ta hänsyn till detta? Se avsnitt 5.4.3. (s. 119 121) i boken för en ordentlig genomgång.

Vind Simultan Marginell Oberoende Betingad Exempel: Vindmätning I ett område noterar man antal dagar per år som man har vindar som överstiger 60 km/h. Man har två typer av instrument för vindmätningar: X = antal stormdagar per år med noggrann vindmätning, Y = antal stormdagar per år med mindre noggrann vindmätning. Som ett första steg i en eventuell kalibrering har man, genom att studera data under en lång följd av år, uppskattat den simultana sannolikhetsfunktionen för X och Y. Y = 0 Y = 1 Y = 2 Y = 3 X = 0 0.2910 0.0600 0.0000 0.0000 X = 1 0.0400 0.3580 0.0100 0.0000 X = 2 0.0100 0.0250 0.1135 0.0300 X = 3 0.0005 0.0015 0.0100 0.0505 = 1

Vind Simultan Marginell Oberoende Betingad Ex: Vind (forts) (a) Vad är sannolikheten att det mindre noggranna instrumentet visar 0 stormdagar samtidigt som det noggranna visar 1 stormdag? (b) Vad är sannolikheten att det noggranna instrumentet visar 1 stormdag? (c) Vad är den marginella sannolikhetsfördelningen för X? (d) Vad är den marginella sannolikhetsfördelningen för Y? (e) Är X och Y oberoende? (f) Om vi vet att det mindre noggranna instrumentet visar 1 stormdag, vad är då slh att det noggranna instrumentet kommer att visa 2 stormdagar? (g) Vad är den betingade sannolikhetsfunktionen för Y givet att X = 2?

Vind Simultan Marginell Oberoende Betingad Tvådimensionella fördelningar Vi studerar X och Y samtidigt och vill veta deras simultana variation: F(x, y) = F X,Y (x, y) = P(X x, Y y) är den tvådimensionella fördelningsfunktionen. Diskreta s.v.: Simultan sannolikhetsfunktion Den simultana sannolikhetsfunktionen för X och Y definieras som: p jk = P(X = j Y = k) = P(X = j, Y = k) Ex: Vindmätning (a) Vad är sannolikheten att det mindre noggranna instrumentet visar 0 stormdagar samtidigt som det noggranna visar 1 stormdag? P(X = 1, Y = 0) = p 10 = 0.04

Vind Simultan Marginell Oberoende Betingad Diskret: Marginell sannolikhetsfunktion Den marginella sannolikhetsfunktionen för X fås som: P(X = j) = k P(X = j, Y = k) Ex: Vindmätning (forts) (b) Vad är sannolikheten att det noggranna instrumentet visar 1 stormdag? P(X = 1) = p 10 + p 11 + p 12 + p 13 = = 0.04 + 0.358 + 0.01 + 0 = 0.408 (c) Vad är den marginella sannolikhetsfördelningen för X? P(X = 0) = p 00 + p 01 + p 02 + p 03 = 0.3510, P(X = 1) = 0.408, P(X = 2) = p 20 + p 21 + p 22 + p 23 = 0.1785, P(X = 3) = p 30 + p 31 + p 32 + p 33 = 0.0625.

Vind Simultan Marginell Oberoende Betingad Ex: Vindmätning (forts) (c)+(d) (d) Vad är den marginella sannolikhetsfördelningen för Y? P(Y = 0) = p 00 + p 10 + p 20 + p 30 = 0.3415, P(Y = 1) = p 01 + p 11 + p 21 + p 31 = 0.4445, P(Y = 2) = p 02 + p 12 + p 22 + p 32 = 0.1335, P(Y = 3) = p 03 + p 13 + p 23 + p 33 = 0.0805. Y = 0 Y = 1 Y = 2 Y = 3 p(x = j) X = 0 0.2910 0.0600 0.0000 0.0000 0.3510 X = 1 0.0400 0.3580 0.0100 0.0000 0.4080 X = 2 0.0100 0.0250 0.1135 0.0300 0.1785 X = 3 0.0005 0.0015 0.0100 0.0505 0.0625 P(Y = k) 0.3415 0.4445 0.1335 0.0805 = 1

Vind Simultan Marginell Oberoende Betingad Oberoende Om P(X = j, Y = k) = P(X = j) P(Y = k) för alla j och k så är X och Y oberoende (och tvärtom). Ex: Vindmätning (forts) (e) Är X och Y oberoende? Eftersom, t.ex., P(X = 0, Y = 0) = 0.2910 = P(X = 0) P(Y = 0) = 0.3510 0.3415 = 0.1814 så är X och Y inte oberoende.

Vind Simultan Marginell Oberoende Betingad Betingad sannolikhetsfunktion Den betingade sannolikhetsfunktionen för X, givet Y = k, definieras som: P(X = j Y = k) = P(X = j, Y = k) P(Y = k) Ex: Vindmätning (forts) (f) Om vi vet att det mindre noggranna instrumentet visar 1 stormdag, vad är då slh att det noggranna instrumentet kommer att visa 2 stormdagar? Definitionen ger P(X = 2 Y = 1) = P(X = 2, Y = 1) P(Y = 1) = 0.0250 0.4445 = 0.0562

Vind Simultan Marginell Oberoende Betingad Ex: Vindmätning (forts) (g) Vad är den betingade sannolikhetsfunktionen för Y givet att X = 2? Vi har P(Y = 0 X = 2) = P(Y = 1 X = 2) = P(Y = 2 X = 2) = P(Y = 3 X = 2) = P(X = 2, Y = 0) P(X = 2) P(X = 2, Y = 1) P(X = 2) P(X = 2, Y = 2) P(X = 2) P(X = 2, Y = 3) P(X = 2) = 0.0100 0.1785 = 0.0560, = 0.0250 0.1785 = 0.1401, = 0.1135 0.1785 = 0.6359, = 0.0300 0.1785 = 0.1681. Observera att 3 k=0 P(Y = k X = 2) = 1.

Sprickor Vi kan också vara intresserade av andra betingade sannolikheter, t.ex. P(X j Y = k) eller P(X j Y k). Exempel: P(X 1 Y 2) = P(X 1, Y 2) P(Y 2) = p 00 + p 01 + p 02 + p 10 + p 11 + p 12 P(Y = 0) + P(Y = 1) + P(Y = 2) = 0.9041 Satsen om total sannolikhet Vi kan uttrycka satsen om total sannolikhet med betingade fördelningar. Sätt A k : Y = k så blir P(B) = P(B Y = k) P(Y = k) k=0

Sprickor Exempel: Sprickor En gammal tank har ett stort antal sprickor på ytan. Antalet sprickor anses vara Poissonfördelat med väntevärde l tankens area där l antas vara 0.01 m 2. Eftersom totala arean är 5000 m 2 blir väntevärdet i Poissonfördelningen m = 50. En automatisk maskin används för att upptäcka och laga sprickorna. Maskinen är bra så att sannolikheten att den ska hitta en spricka (och därmed laga den) är 0.999. Vad är sannolikheten att minst en spricka missas?

Sprickor Lösning: Sätt Y = antal sprickor i tanken Po(50), dvs P(Y = k) = e 50 50k, k = 0, 1, 2,... k! och B = alla sprickor hittas. Då har vi att P(B Y = k) = P(alla k sprickorna hittas Y = k) = 0.999 k P(B) = P(B Y = k) P(Y = k) = k=0 k=0 0.999 k e 50 50k k! = e 50 (0.999 50) k k! k=0 = e 50 e 0.999 50 = e 50 0.001 = 0.951 P(minst en spricka missas) = 1 P(B) = 1 0.951 = 0.049.

Barn Motsvarande funktioner kan definieras för kontinuerliga fördelningar: Simultan täthetsfunktion: f X,Y (x, y) Simultan fördelningsfunktion: F X,Y (x, y) = P(X x, Y y) = Marginell täthetsfunktion: f X (x) = f Y (y) = x y f X,Y (x, u) du, f X,Y (t, y) dt f X,Y (t, u) dt du Oberoende: om f X,Y (x, y) = f X (x) f Y (y) för alla värden på x och y så är X och Y oberoende (och tvärtom).

Barn Exempel: Födelselängd och -vikt Längd (cm) och vikt (g) noterades på 725 nyfödda barn. Tänkbar modell: X = längd är N(m x, s 2 x), Från data har vi m x = 49.8 (cm) och s x = 2.5 (cm). Y = vikt är N(m y, s 2 y), Från data har vi m y = 3343 (g) och s y = 528 (g). 8 x 10 4 Fördelning för vikten 0.2 Fördelning för längden 6 0.15 4 0.1 2 0.05 0 1000 2000 3000 4000 5000 6000 vikt (gram) 0 40 45 50 55 60 längd (cm)

Barn Beroende? Uppenbarligen gäller INTE att f(x, y) = f(x) f(y) 60 Oberoende? 60 Beroende! 55 55 längd 50 längd 50 45 45 40 1000 2000 3000 4000 5000 vikt 40 1000 2000 3000 4000 5000 vikt Längd och vikt är uppenbart beroende av varandra. Hur kan vi mäta hur starkt beroendet är?

Kovarians Korrelation Mått på det linjära beroendet mellan X och Y Kovarians Koviariansen mellan X och Y definieras som Cov(X, Y) = E ( (X mx)(y my) ) Egenskaper: = E(X Y) E(X) E(Y) = E(X Y) mx my Cov(Y, X) = Cov(X, Y), Cov(X, X) = V(X), Cov(aX, by) = ab Cov(X, Y), V(aX + by) = a 2 V(X) + b 2 V(Y) + 2ab Cov(X, Y), Cov(X, Y) = 0 om X och Y är oberoende (men inte tvärtom!) Kovariansen har samma enhet som X Y (t.ex. gram cm).

Kovarians Korrelation Korrelationskoefficient Korrelationskoefficienten r är ett enhetslöst mått på kovariansen: rx,y = Cov(X, Y) V(X) V(Y), 1 rx,y 1 Om r = ±1 är X och Y perfekt linjärt beroende. Om vi har mätningarna (x 1, y 1 ),..., (x n, y n ) kan vi skatta r med n rx,y = i=1 (x i x)(y i ȳ) n i=1 (x i x) 2 n i=1 (y i ȳ) 2 Ex: r längd,vikt = 0.75.

Kovarians Korrelation 3 X,Y N(0,1 2 ), ρ = 0 3 X,Y N(0,1 2 ), ρ = 0.99 2 2 1 1 y 0 y 0 1 1 2 2 3 3 2 1 0 1 2 3 x 3 3 2 1 0 1 2 3 x 3 X,Y N(0,1 2 ), ρ = 0.3 3 X,Y N(0,1 2 ), ρ = 0.7 2 2 1 1 y 0 y 0 1 1 2 2 3 3 2 1 0 1 2 3 x 3 3 2 1 0 1 2 3 x

Diskret Total sannolikhet Kont. Beroendema tt Kovarians Korrelation Beroende? Korrelation? 6 4 y 2 0 2 4 6 5 4 3 2 1 0 x 1 2 3 4 Statistiska metoder fo r sa kerhetsanalys 5