Anna Lindgren Matematisk statistik 2 september 2013
Formalia Syfte och Mål Om kursen Kursen ger 7.5 hp och är obligatorisk på Riskhantering. Förutsätter en grundläggande kurs i statistik/matematisk statistik. Hemsida: http://www.maths.lth.se/matstat/kurser/fms065/ Lärare Anna Lindgren, MH:136, tel: 046-222 42 76, e-post: anna@maths.lth.se. Ted Kronvall Kurssekreterare Maria Lövgren, marial@maths.lth.se, tel: 046-222 45 77, MH:225a b. Kursen består av föreläsningar (28 timmar vid 14 tillfällen), övningar (14 timmar vid 7 tillfällen), obligatoriska datorövningar (12 timmar vid 6 tillfällen)
Formalia Syfte och Mål Datorövningarna i Matlab i grupper om två. Obligatorisk närvaro. Kurslitteratur Rychlik, Rydén: Probability and Risk Analysis, An Introduction for Engineers, Springer 2006, ISBN: 978-3-540-24223-9. Finns som e-bok. För att bli godkänd på kursen krävs deltagande vid samtliga sex datorövningar, godkänd vid skriftlig tentamen. Tillåtna hjälpmedel vid tentamen: Kursens formelsamling Formelsamling i grundkurs i matematisk statistik/statistik Miniräknare Tentamen lördag 26 oktober kl. 8.00 13.00 i Sparta:A B. Omtentamen lördag 11 januari 2014, 8.00 13.00 i MA:10 J.
Formalia Syfte och Mål Syfte: Kursen presenterar begrepp och idéer för grunderna i statistisk behandling av risker. Tyngdpunkten ligger på förståelsen av teorin och metoderna. Därför fokuserar kursen på tillämpningar inom risk och säkerhetsanalys. Eftersom uppskattningen av risker kräver att man kombinerar information från olika källor används Bayesianska metoder flitigt inom detta område. Därför ägnas en väsentlig del av kursen åt sådana metoder. För att kunna analysera och prediktera förekomst och frekvens av farliga scenarier scenarios används moderna statistiska verktyg, såsom Poisson-regression, deviationsanalys, extremvärdesteori och tröskelmetoder. Kännedom om sådana metoder underlättar förståelsen av den roll sannolikhetsteori spelar i riskanalys och hur man på bästa sätt utnyttjar resultatet från datorkörningar.
Formalia Syfte och Mål Kursens mål Kunskap och förståelse För godkänd kurs skall studenten kunna skatta olycksintensiteten och modellera dess beroende av några förklarande variabler kunna identifiera situationer där osäkerheten i de framräknade resultaten inte kan försummas, ofta i situationer där mängden tillgänglig information är begränsad, kunna inkludera olika typer av information i en riskuppskattning med Bayesianska metoder.
Formalia Syfte och Mål Kursens mål Färdighet och förmåga För godkänd kurs skall studenten kunna läsa speciallitteratur inom området risk och säkerhet där begrepp som intensitet, sannolikhet och säkerhetsindex ofta används, kunna kvantifiera osäkerheten i ofta förekommande riskmått, kunna validera de modeller som använts för att beräkna riskmåtten.
Formalia Syfte och Mål Kursens mål Värderingsförmåga och förhållningssätt För godkänd kurs skall studenten visa en större förståelse för de koncept som används inom andra kurser i riskuppskattning, vara medveten om den roll sannolikhet spelar i riskanalys och kunna använda programpaket på ett riktigt sätt.
Formalia Syfte och Mål Kursinnehåll Repetition av de grundläggande begreppen inom sannolikhetsteori: oberoende, betingad sannolikhet, stokastisk variabel, täthets- och sannolikhetsfunktion, väntevärde, varians och kovarians. Introduktion och enkla tillämpningar av Bayes sats, Centrala gränsvärdessatsen, Stora talens lag och Små talens lag. Klassisk statistisk inferens: ML-metoden, konfidensintervall, hypotesprövning och anpassningstest. Introduktion till bootstrap och delta-metoden för konstruktion av konfidensintervall. Introduktion till Bayesiansk inferens: prediktiv sannolikhet, conjugated priors, credibility interval. Skattning av intensiteter och Poissonregression
Formalia Syfte och Mål Kursinnehåll (forts) Några begrepp från säkerhets- och riskanalys: felintensitet, säkerhetsindex, karaktäristiska värdet. Skattning av kvantiler med POT-metoden. Introduktion till extremvärdesanalys: skattning av designhändelsen, t.ex. styrkan hos 100-årsstormen, samt uppskattning av osäkerheten hos skattningarna.
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods Exempel: Stormar Under perioden 1900 2005 hade Sverige 26 individuella stormar där skadorna översteg en million m 3 skog. Man har noterat tidperioden (dagar) mellan dessa svåra stormar. 10 9 8 7 6 frekvens 5 4 3 2 1 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 dagar Fördelning (matematisk modell) för tidpunkten mellan stormar? Sannolikheten att det är mindre än 400 dagar mellan två stormar? Med vilken intensitet kommer svåra stormar? Har intensiteten ändrats under tidsperioden?
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods Exempel: Årligt maxflöde Figuerna visar maximala årliga flödet (ft 3 /s) i Feather River under perioden 1902 till 1960. Antag att 200 ft 3 /s är en kritisk gräns. 300 250 Flöde (ft 3 /s) 200 150 100 50 0 1900 1910 1920 1930 1940 1950 1960 År 12 10 8 6 4 2 0 0 50 100 150 200 250 300 Flöde (ft 3 /s) Fördelning för maximalt årsflöde? Vad är 50-årsflödet? Sannolikheten att flödet överstiger 200 ft 3 /s? Baserad på samtliga data eller enbart på höga flöden?
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods Exempel: Trafikdöda Nedan visas antalet döda i trafiken i Sverige under perioden 1986 2005. (Källa: Vägverket) 1000 Antal döda i trafiken 800 600 400 200 0 1985 1990 1995 2000 2005 2010 År 1000 Antal döda i trafiken 800 600 400 200 0 1985 1990 1995 2000 2005 2010 År En enkel linjär regressionsmodell där antal döda antas avta linjärt med tiden räcker tydligen ej! En mer komplicerad modell för att beskriva hur antal döda varierar i tiden inkluderar också andra variabler (t.ex. trafikindex, antal människor, antal bilar, antal fordonskm). Vi introducerar s.k. Poissonregression. Hur ska vi avgöra vilka variabler den ska innehålla?
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods Exempel: Utsläpp I en dal finns två fabriker som båda, oberoende av varandra, vissa dagar använder en kemisk process som ger upphov till att toxiska föroreningar sprids i luften. Användandet beror inte på veckodag eller säsong. Fabrik E 1 använder den kemiska processen 150 dagar av de totalt 260 arbetsdagarna under ett år medan fabrik E 2 gör det under 30 dagar. (a) Vad är sannolikheten att fabrik E 1 sprider föroreningen i dalen en given arbetsdag? (b) Vad är sannolikheten att den toxiska föroreningen sprids i dalen en given arbetsdag? (c) En viss dag visar mätningar att den toxiska föroreningen finns i dalen, vad är sannolikheten att det var fabrik E 1 som gjorde utsläppet? (d) Vad är sannolikheten att föroreningen inte sprids i dalen under en arbetsvecka om fem dagar? (e) Vad är sannolikheten att den toxiska föroreningen sprids i dalen minst en dag under en arbetsvecka om fem dagar?
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods Exempel: Fraktgods När ett företag skickar fraktgods till en återförsäljare sker detta antingen med lastbil, tåg eller flyg. 50% fraktas med lastbil, 30% med tåg och 20% med flyg. Andelen transportskadat gods är 5% med lastbil, 10% med tåg och 2% med flyg. (a) Hur stor andel av godset kan man räkna med får transportskador? (b) Om man mottar ett transportskadat gods hur stor är sannolikheten att det skickats med tåg?
Grundläggande begrepp Odds Sannolikhetsteori Grundläggande begrepp Utfall Vi har ett experiment (försök) vars utfall vi inte känner. Ex: Kasta en tärning och notera resultatet Ex: Betrakta en industri och se om den drabbas av utsläpp Händelse Händelsen A är ett uttalande om utfallet. Ex: Kasta en tärning: A = minst femma Ex: Betrakta en industri en dag: B = utsläpp Sannolikhet P(A) = sannolikheten för A Ex: P(A) = sannolikheten att tärningen visar minst femma Ex: P(B) = sannolikheten att industrin drabbas av utsläpp
Grundläggande begrepp Odds Egenskaper hos P(A) 0 P(A) 1 Om P(A) = 0 så inträffar A aldrig Om P(A) = 1 så inträffar A alltid P(inte A) = 1 P(A) Frekvenstolkning Om vi upprepar experimentet många gånger, oberoende av varandra, kan vi tolka P(A) som relativa frekvensen: antal femmor och sexor Ex: P(A) = P(minst femma) = totalt antal kast antal dagar med utsläpp Ex: P(B) = P(utsläpp) = totalt antal dagar
Grundläggande begrepp Odds Additionssatsen P(A B) = P(A) + P(B) P(A B) dvs P(minst en av A och B inträffar) = = P(A inträffar) + P(B inträffar) P(både A och B inträffar) Oberoende Om A och B är oberoende så är P(A B) = P(A) P(B). Om P(A B) = P(A) P(B) så är A och B är oberoende. Betingad sannolikhet Vi vet att A inträffade. Vad är då sannolikheten att B (också) inträffar? P(B A) = P(A B) P(A) A och B oberoende ger P(B A) = P(B).
Grundläggande begrepp Odds Satsen om total sannolikhet Om händelserna A 1,...,A n inte kan inträffa samtidigt och tillsammans fyller upp hela utfallsrummet så gäller att P(B) = n P(B A i ) P(A i ) i=1 Ex: Fraktgods (a) P(lastbil) = 0.5, P(tåg) = 0.3, P(flyg) = 0.2, P(skada lastbil) = 0.05, P(skada tåg) = 0.10, P(skada flyg) = 0.02. P(skada) = P(skada lastbil) P(lastbil) + P(skada tåg) P(tåg) + + P(skada flyg) P(flyg) = 0.05 0.5 + 0.10 0.3 + 0.02 0.2 = 0.059
Grundläggande begrepp Odds Bayes sats Utnyttja att definitionen av betingad sannolikhet medför att P(B A) P(A) = P(B A) = P(A B) P(B) P(A B) = P(B A) P(A) P(B) Ex: Fraktgods (b) P(skada tåg) P(skada tåg) P(tåg) P(tåg skada) = = P(skada) P(skada) 0.10 0.3 = 0.05 0.5 + 0.10 0.3 + 0.02 0.2 = 0.03 0.059 = 0.51
Grundläggande begrepp Odds Odds För två händelser A 1 och A 2 är oddsen två positiva tal q 1 och q 2 så att q 1 = P(A 1) q 2 P(A 2 ) För flera uteslutande händelser A 1,...,A n : Ex: Fraktgods q i q j = P(A i) P(A j ) q i P(A i ) = q 1 + + q n Vi har ett gods, vad är oddsen för lastbil, tåg resp. flyg? P(lastbil) P(tåg) = 0.5 0.3 = 5 3, P(lastbil) = 0.5 P(flyg) 0.2 = 5 2, P(tåg) P(flyg) = 0.3 0.2 = 3 2 Oddsen för lastbil : tåg : flyg är 5 : 3 : 2 eller 10 : 6 : 4 eller...
Grundläggande begrepp Odds Ex: Fraktgods (forts) Antag nu att vi får ny information, nämligen att godset är skadat, vad är då oddsen för lastbil, tåg resp. flyg? Betingade sannolikheter! P(lastbil skadat) P(tåg skadat) P(lastbil skadat) P(flyg skadat) P(lastbil) P(skadat lastbil) P(skadat) = P(tåg) P(skadat tåg) = =... P(skadat lastbil) P(skadat tåg) P(skadat) ) P(lastbil) P(tåg) }{{} gamla oddset 5:3 P(tåg skadat) P(flyg skadat) =...
Grundläggande begrepp Odds Ex: Fraktgods (forts) Uppdaterade odds: q post lastbil = P(skadat lastbil) qprior lastbil = 0.05 5 = 0.25 q post tåg q post flyg = P(skadat tåg) q prior tåg = 0.10 3 = 0.30 = P(skadat flyg) qprior flyg = 0.02 2 = 0.04 Nya oddsen för lastbil : tåg : flyg är 25 : 30 : 4 A priori och a posteriori odds Vi har sinsemellan uteslutande händelser A 1,...,A n. Gamla odds q prior 1,..., q prior n kallas a priori odds. Nya odds, när vi fått information om att händelsen B har inträffat, q post 1,..., q post n kallas a posteriori odds där q post i = P(B A i ) q prior i