Extremvärdesteori som ett hjälpmedel att sätta gränser

Relevanta dokument
PROGRAMFÖRKLARING III

Statistiska metoder för säkerhetsanalys

Extremvärden att extrapolera utanför data och utanför teori/modell. Statistik för modellval och prediktion p.1/27

State Examinations Commission

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

BILAGA II. Extremvärdesstatistik och osäkerhet

Statistiska metoder för säkerhetsanalys

EVALUATION OF ADVANCED BIOSTATISTICS COURSE, part I

BILAGA 1 BERÄKNINGAR HÖGVATTEN

LU/LTHs undervisningsstruktur

Adding active and blended learning to an introductory mechanics course

Vågkraft. Verification of Numerical Field Model for Permanent Magnet Two Pole Motor. Centrum för förnybar elenergiomvandling

Skattningsmetoder för den generaliserade extremvärdesfördelningen

Datorövning 6 Extremvärden och Peak over Threshold

vetenskap - beslut - osäkerhet

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Föreläsning 3, Matematisk statistik Π + E

Klicka här för att ändra format på bakgrundsrubriken

FORSKNINGSKOMMUNIKATION OCH PUBLICERINGS- MÖNSTER INOM UTBILDNINGSVETENSKAP

The Arctic boundary layer

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Fortbildningsavdelningen för skolans internationalisering. Dossier 3. European Language Portfolio 16+ Europeisk språkportfolio 16+ English version

Förändrade förväntningar

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Arbetsplatsträff 8 mars 2011

Hållbar utveckling i kurser lå 16-17

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Viktig information för transmittrar med option /A1 Gold-Plated Diaphragm

Klimatanpassning bland stora företag

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

Vägytans tillstånd, historik och framtid. Johan Lang

Statistiska metoder för säkerhetsanalys

Urban Runoff in Denser Environments. Tom Richman, ASLA, AICP

The Municipality of Ystad

Anders Persson Philosophy of Science (FOR001F) Response rate = 0 % Survey Results. Relative Frequencies of answers Std. Dev.

Collaborative Product Development:

Tentamen MVE301 Sannolikhet, statistik och risk

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap

The reception Unit Adjunkten - for newly arrived pupils

3 Maximum Likelihoodestimering

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Den Disruptiva Utmaningen. Christian Sandström, Tekn Dr. Chalmers och Ratio. Disruptive, Computer Sweden 16 oktober 2014

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

Ett hållbart boende A sustainable living. Mikael Hassel. Handledare/ Supervisor. Examiner. Katarina Lundeberg/Fredric Benesch

Webbregistrering pa kurs och termin

SWESIAQ Swedish Chapter of International Society of Indoor Air Quality and Climate

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

denna del en poäng. 1. (Dugga 1.1) och v = (a) Beräkna u (2u 2u v) om u = . (1p) och som är parallell

Drivers of Climate Change? Political and Economic Explanations of Greenhouse Gas Emissions

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Second handbook of research on mathematics teaching and learning (NCTM)

Lärmål Sannolikhet, statistik och risk 2015

Anmälan av avsiktsförklaring om samarbete mellan Merck Sharp & Dohme AB (MSD AB) och Stockholms läns landsting

Datorövning 1: Fördelningar

Anmälan av avsiktsförklaring om samarbete med AstraZeneca AB

SF1901: Sannolikhetslära och statistik

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Kvalitativ design. Jenny Ericson Medicine doktor och barnsjuksköterska Centrum för klinisk forskning Dalarna

Teenage Brain Development

Measuring child participation in immunization registries: two national surveys, 2001

SVENSK STANDARD SS

Webbreg öppen: 26/ /

Make a speech. How to make the perfect speech. söndag 6 oktober 13

De senaste åren har det hänt en hel del på ATO Fritid

Tentamen MVE301 Sannolikhet, statistik och risk

Livskvalitet hos äldre: Att jämföra äpplen och päron?

S0005M, Föreläsning 2

SOLAR LIGHT SOLUTION. Giving you the advantages of sunshine. Ningbo Green Light Energy Technology Co., Ltd.

Vad styr spridningen av luftföroreningar? Vilken meteorologi skall användas? Normalväder, typväder, medelväder, flexa år?

Taking Flight! Migrating to SAS 9.2!

Momento Silverline. To further protect the environment Momento introduces a new coating for our impact sockets - Momento Silverline

Chapter 2: Random Variables

Institutionsmöte. 7 mars 2017 Hälsokontroller Godisautomat Källsortering Psykosocial enkät LUCRIS LU, LTH, Nfak Utlysningar mm

IAK115 Kritiskt tänkande och teori inom arkitektur och design 1&2, 4 hp (H15)

Vässa kraven och förbättra samarbetet med hjälp av Behaviour Driven Development Anna Fallqvist Eriksson

Isolda Purchase - EDI

Datorövning 6 Extremvärden och Peaks over Threshold

FOI MEMO. Jonas Hallberg FOI Memo 5253

Luftkvaliteten i Trelleborg Resultat från mätningar. Året 2010

Bridging the gap - state-of-the-art testing research, Explanea, and why you should care

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik för D, I, Π och Fysiker

IAK116 Perception/Färg, Ljus, Rum 1, 6 hp (VT16)

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Intäkter inom äldreomsorgen Habo kommun

Inkvarteringsstatistik. Göteborg & Co

FÖREDRAGNINGSLISTA. Kårstyrelsemöte 14 15/ Formalia. 2. Valärenden. 3. Beslutspunkter. 1.1 Mötets öppnande. 1.2 Mötets behöriga utlysande*

District Application for Partnership

Fatigue Properties in Additive manufactured Titanium & Inconell

Kvalitativ design. Jenny Ericson Doktorand och barnsjuksköterska Uppsala universitet Centrum för klinisk forskning Dalarna

12.6 Heat equation, Wave equation

1. Varje bevissteg ska motiveras formellt (informella bevis ger 0 poang)

Tentamen MVE301 Sannolikhet, statistik och risk

Mycket formellt, mottagaren har en speciell titel som ska användas i stället för namnet

Mycket formellt, mottagaren har en speciell titel som ska användas i stället för namnet

Transkript:

Extremvärdesteori som ett hjälpmedel att sätta gränser Blickar bakåt och framåt Georg Lindgren Lunds universitet, Matematisk statistik 22 mars, 2012 Cramérsällskapet

Introduktion Nytt? New and growing? Emil Julius Gumbel, a German mathematician, pacifist and anti-nazi campaigner developed new distributions in the 1950s. The Gumbel-distribution, the Generalized Extreme Value distribution and the Generalized Pareto Distribution (GPD) are just the tip of the ice-berg of an entire new and quickly growing branch of statistics. The first application was to answer environmental questions, quickly followed by the finance industry. Extreme Value Theory can save your neck Valérie Chavez-Demoulin ETHZ & Armin Roehrl, Approximity GmbH, (2004) Springerkatalogen har (minst) sex titlar: Statistical extremes Kom in i AMS Math Subject classification 2000, 60G70, 62G32 Tidskriften Extremes startade 1998

Introduktion En gräns i tiden NATO-ASI Statistical extremes and Applications 1983 Avslutning på klassisk extremvärdesteori, start på ny användbar Inferens

Introduktion Exempel på gränser Exempel på gränser, Sverige, SO 2 timme Naturvårdsverkets Miljökvalitetesnormer för svaveldioxid i luft: Medelvärdestid Värde Anmärkning 1 timme 200 µg/m3 Värdet får överskridas 175 gånger per kalenderår förutsatt att föroreningsnivån aldrig överskrider 350 mikrogram per kubikmeter luft under en timme mer än 24 gånger per kalenderår.

Introduktion Exempel på gränser Exempel på gränser, Sverige, SO 2 dygn Naturvårdsverkets Miljökvalitetesnormer för svaveldioxid i luft: Medelvärdestid Värde Anmärkning 1 dygn 100 µg/m3 Värdet får överskridas 7 gånger per kalenderår förutsatt att föroreningsnivån aldrig överskrider 125 mikrogram per kubikmeter luft under en timme mer än 3 gånger per kalenderår.

Introduktion Verkligheten Men hur ser det egentligen ut?

Extremvärdesteori Klassisk extremvärdesteori Klassisk extremvärdesteori Vad kan man säga om MAXIMUM/MINIMUM av ett stort antal (oberoende eller beroende) stokastiska variabler? Oberoende (Dodd (1923), Fréchet (1927), Fisher & Tippett (1928), Gumbel-fördelningen extremvärdesfördelningen, (Cramér: after some calculation ), för normal(0,1)-variabler: P( max X k x 2 logn...+ ) exp( e x ) k=1,...,n 2 log n Weibull-fördelningen svagaste länken Gnedenko de tre typerna av extremvärdesfördelningar von Mises, Jenkinson (1955): Allt i ett, Den Generaliserade extremvärdesfördelningen, GEV, med läges- och skal-parameter plus en formparameter, k: k < 0, uppåt begränsad (omvänd Weibull); k = 0, Gumbel; k > 0, tung-svansad

Extremvärdesteori Klassisk extremvärdesteori Gumbel It seems that the rivers know the theory. It only remains to convince the engineers of the validity of this analysis. Gumbel (1958) Hydrologer och ingenjörer ("safety of structures") accepterade snabbt extremvärdesfördelningarna på 50-, 60-, 70-talen Waloddi Weibull!

Extremvärdesteori Beroende data Beroende! Beroende variabler bör ge lägre extremvärden Intuitionen: I två-dimensionell normalfördelning (X, Y) med korrelation ρ < 1, om X = u är mycket stort så är Y ρu Slutsats: Finns chans att beroendet inte spelar någon roll! Loynes, Leadbetter 1975 Om Cov(X n,x n+k )/log k 0 när k så beter sig en beroende normalföljd som om den vore oberoende.

Extremvärdesteori Beroende data Ett typiskt exempel på 70-talsteori Ylvisaker - Mittal (1975): Om Cov(X n,x n+k )/log k γ > 0 så är maximum fördelat som Gumbel + 2γ * Normal

Teori och praktik Teorin kastar ljus över verkligheten Vad har detta med miljönormer att göra? Poissonprocessen! Extrema värden uppträder ungefär som en Poissonprocess Finns det ett samband mellan extrema värden och inte riktigt extrema värden? Tillåtet: högst 7 dygnsvärden över 100 µg/m3 per år men högst 3 värden över 125 µg/m3

Teori och praktik Teorin kastar ljus över verkligheten SO 2 i Köpenhamn För SO 2 i Köpenhamn 1990 var median för timmedelvärdet 20 µg/m3. Övre 98% kvantilen kan uppskattas till 60 µg/m3. Antag log-normalfördelning ger E(log SO 2 ) = 3, D(log SO 2 ) = 0.54. Klassisk extremvärdesteori ger för normerade log årsmaximum a 365 24 = b 365 24 = 4.26. Sannolikheten att årsmaximum < 100 (125) är 43% (87%). Fullständig Poissonkonvergens säger att man kan förstora upp svansen i data och få en Poisonprocess i planet!

Teori och praktik Fullständig Poissonkonvergens Extremvärden uppträder som en Poissonprocess i planet 140 120 100 Högst 3 överskridanden per år Högst 7 överskridanden per år 80 0 0.2 0.4 0.6 0.8 1 200 150 100 2 värden över 125 18 värden över 100 50 0 0 1000 2000 3000 4000 5000 6000 7000 8000

Teori och praktik Fullständig Poissonkonvergens Fullständig Poissonkonvergens ger nya möjligheter Beräkna sannoliheten att kraven uppfylls under ett visst år givet en fördelning. Komplikation: beroende mellan timvärden identifiera kluster av höga värden Pekar på svårigheterna att skriva normer. Är 8 dagar i rad med värden över 100 (varav 4 över 125) lika allvarligt som 8(4) isolerade överskridanden

Inte bara för specialister Inferens Inferens blir allmänt tillgängligt Plott på Weibullpapper MK-metoden Momentmetoder Pickands III 2:a från vänster Likelihood-metoder Likelihood-metoder med kovariater Standardmetoder för att skatta läge, skala, och formparametrar med kovariater, t.ex. trend, säsong och geografiskt läge

Inte bara för specialister Inferens POT, kovariater och bra dataprogram gör extremvärdesanalys användbar Citat ur Coles: Extreme value theory has emerged as one of the most important statistical disciplines for the applied sciences over the last 50 years.... At the time of writing, in the past twelve months alone, applications of extreme value modeling have been published in the fields of alloy strength prediction, ocean wave modeling, memory cell failure, wind engineering, management strategy, biomedical data processing, thermodynamics of earthquakes, assessment of meteorological change, nonlinear beam vibration, food science. (2000-2001).

Inte bara för specialister Extremvärdesteori i utbildningen Intresse från studenter inte bara från extremister Riskanalys - både teknisk och finansiell LU kurs i Statistisk analys av extremvärden lockar studenter kurs 2009/10 2010/11 2011/12 Analys av extremvärden 32 33 55 Tidsserieanalys 28 46 53 Finansiell statistik 23 20 33

Framtiden? Centrala utmaningar Utmaningar Multivariata extremvärden Extrema "episoder" - extremvärdesteori för former, bilder, händelser Spatiala extremvärden nivåkurvor Exakt numerisk beräkning Alan Genz (Washington State): "My primary area of research interest is the numerical computation of multiple integrals". Numeriska rutiner för exakt beräkning av sannolikheter i flerdimensionella normafördelningar: Dimension > 100: med (X 1,...,X 100 ) N(m,Σ) P(X k x k ;k = 1,...,100)

Framtiden? Klimatforskning en utmaning i sig Katz & Naveau, 2010 Today, weather and climate extremes remain a fertile area of application, with virtually limitless data and a wide variety of extremal behavior... requires treatment of spatial fields of observations which evolve over time.... with external (especially the sun) and internal drivers and dynamical constraints with variations over a wide range of spatial and temporal scales. Further, the specter of global climate change suggests that non-stationarity need be considered in any treatment of extremes. As such, weather and climate extremes pose a number of problems which could serve as a catalyst for further developments in extreme value theory. Despite much effort, this theory does not yet even provide a fully satisfactory spatio-temporal model for extremes. Still climate scientists, in collaboration with statisticians, need to address critical questions about weather and climate extremes.

Litteratur References S. Coles (2001): An Introduction to Statistical Modeling of Extreme Values, Springer R.W.Katz & P.Naveau (2010): Editorial: special issue on extremes in weather and climate. Extremes, 13, 107 108. A.Stephenson & E.Gilleland (2006): Software for the analysis of extreme events: The current state and future directions. Extremes, 8, 87 109. WAFO-group, (2011). WAFO a Matlab Toolbox for Analysis of Random Waves and Loads; Tutorial for WAFO Version 2.5, URL http://www.maths.lth.se/matstat/wafo