Extremvärdesteori och POT-modellen
|
|
- Bengt Lindberg
- för 8 år sedan
- Visningar:
Transkript
1 Extremvärdesteori och POT-modellen Tove Nilsson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics
2 Kandidatuppsats 29:4 Matematisk statistik Juni 29 Matematisk statistik Matematiska institutionen Stockholms universitet 6 9 Stockholm
3 Matematisk statistik Stockholms universitet Kandidatuppsats 29:4, Extremvärdesteori och POT-modellen Tove Nilsson Juni 29 Sammanfattning Den här uppsatsen beskriver extremvärdesteorin samt dess koppling till den så kallade POT-modellen. Syftet är att utreda vilka villkor som måste uppfyllas för att dessa modeller ska kunna tillämpas. Det är även av intresse att förstå hur dessa modeller kan användas i försäkringssammanhang. Extremvärdesteorin beskriver vad maximum av ett antal slumpvariabler har för fördelning då de skalas om på ett lämpligt sätt. POT-modellen redogör fördelningen för en enskild slumpvariabel givet att den överstiger en viss nivå. Slumpvariabler från fyra fördelningar kommer att studeras för att kunna förstå gränsfördelningarna. Extremvärdesteorin visas användbar då maximum kommer från stora stickprov, maximum ska dessutom skalas om på olika sätt beroende på till vilken extremvärdesfördelning konvergens kommer att äga rum. POT-modellen visas användbar då slumpvariablerna betingas överstiga en hög nivå, slumpvariablerna behöver skalas om på ett särskilt sätt även i POT-modellen. POT-modellen är tillämpbar vid prissättning av återförsäkring då återförsäkringskontrakt ofta ger skydd mot skador givet att de överstiger en hög nivå. Postadress: Matematisk statistik, Stockholms universitet, 6 9, Sverige. E-post: tove@sss.se. Handledare: Andreas Nordvall Lagerås.
4 Abstract This essay describes the extreme value theory and its connection to the POT method. The purpose is to investigate which conditions are necessary for using the two models. It also of interest to understand how these models can be used in insurance mathematics. The extreme value theory describes the distribution of centered and normalized maxima. The POT method gives details about the distribution of a single random variable given that it exceeds a threshold. We will examine the limit distribution of random variables from four distributions. It will be shown that the extreme value theory is useful when maxima comes from large samples. Maxima also have to be centered and normalized in a certain way depending on towards which extreme value distribution convergence will take place. The POT method is useful when the threshold that the random variables will exceed is high. The variables have to be centered and normalized in a certain way even in this model. The POT method is useful for pricing reinsurance since it usually gives protection to damages that exceeds a high threshold.
5 Innehåll Introduktion 2. Inledning Bakgrund och Syfte Metod Extremvärdesteori 3 3 POT-modellen 8 4 Illustration av teorin 4. Paretofördelningen Konvergens för maxima av Paretovariabler POT-modellen för Paretovariabler Lognormalfördelningen Konvergens för maxima av lognormalvariabler POT-modellen för lognormalvariabler F-fördelningen Konvergens för maxima av F-variabler POT-modellen för F-variabler U(,) Tillämpningar 2 5. Tillämpning av extremvärdesteorin Tillämpning av POT-modellen, återförsäkring Slutsatser 24 7 Diskussion 25 8 Referenser 26
6 9 Bilagor 26 Introduktion. Inledning Extremvärdesteorin beskriver hur maximum av ett antal slumpvariabler konvergerar i fördelning då de skalas om på ett lämpligt sätt. Det finns tre stycken så kallade extremvärdesfördelningar, Fréchet-, Gumbel- och Weibullfördelningen. Dessa tre fördelningar kan modellera för hur stora de största slumpvariablerna kan komma att vara. I försäkringssammanhang skulle dessa slumpvariabler kunna ses som storlekar på skadebelopp som antas komma från en känd fördelning. Extremvärdesteorin gör det då möjligt att modellera hur de största skadorna under de kommande åren kan komma att drabba ett försäkringsbolag. Den så kallade POT-modellen har en tydlig koppling till extremvärdesteorin. POT står för Peaks over Threshold. Givet att slumpvariabler överstiger en hög nivå, kan de antas ha en generaliserad Paretofördelning. I försäkringssammanhang är det intressant att förstå fördelningen för skadan givet att den överstiger någon hög nivå, eftersom återförsäkringskontrakt ofta ger skydd mot just sådana skador. POT-modellen kan användas för beräkning av förväntade kostnader för olika typer av återförsäkringar..2 Bakgrund och Syfte Extremvärdesteorin är relativt gammal då grunden lades för drygt 8 år sedan. Det finns många verk skrivna om extremvärdesteorin men trots det saknas det i flera av dem kopplingen till POT-modellen. Syftet med detta arbete är att sammanfatta extremvärdesteorin samt dess koppling till POTmodellen, för att förstå hur dessa modeller kan användas i försäkringssammanhang. Vilka villkor som måste uppfyllas för att modellerna ska vara användbara kommer att utredas i den här studien..3 Metod Först kommer extremvärdesteorin att sammanfattas med ord och formler. Extremvärdesteorin sammanfattas till stor del med hjälp av Embrechts et al. För att bevisa satserna i extremvärdesteorin ger Falk et al. bra ledning. Sedan beskrivs kopplingen till POT-modellen med ord och formler. Beviset för POT-modellen kräver ingen kännedom om hur slumpvariabler bör skalas om men beräkningen av dessa normeringskonstanter kommer att göras då det 2
7 är nödvändiga för att tillämpa POT-modellen. För att kunna säga något om hur väl extremvärdesteorin fungerar för små och stora antal slumpvariabler från olika fördelningar kommer ett antal Matlabfigurer att illustrera gränsfördelningarna. Eftersom det är svårt att kunna säga något om konvergens är god eller ej kommer ett antal slumpvariabler att simuleras, spridningen av dessa kan då hjälpa till att avgöra om konvergensen är tillräckligt god. Matlab kommer även att användas då villkor för POT-modellen ska redas ut. Avslutningsvis kommer extremvärdesteorin och POT-modellen tillämpas i varsitt exempel. Det ska illustrera vad de två modellerna har för användningsområden i försäkringssammanhang. 2 Extremvärdesteori Extremvärdesteorin förklarar vad maximum av ett antal oberoende och lika fördelade slumpvariabler har för fördelning då de skalas om på lämpligt vis. Slumpvariablerna betecknas här (X,..., X n ) och antas vara oberoende och lika fördelade med en gemensam fördelningsfunktion F. Maximum av alla värden i en viss tidsperiod betecknas M n där M n = max(x,..., X n ). Fördelningsfunktionen för maximun är P (M n x) = P (X i x) n = F n X(x) Definition (Övre begränsning). För X från en given fördelning F, låt ω = ω(f ) = sup(x : F (x) < ), så att ω är det minsta värde för vilket P (X ω) =. Om X inte har någon övre gräns är ω =. Definition 2 (Långsvansad fördelning). Låt X komma från en given fördelning F. Då är F en långsvansad fördelning om E[X n ] = för något (litet) n. Extrema värden antas i svansen av fördelningsfunktionen. då n och x < ω P (M n x) = F n X(x) P (M n x) = F n X(x) = då x ω M n konvergerar alltså i sannolikhet mot ω, (M n p ω) då n. Det är alltså inte särskilt intressant att studera konvergensen för M n utan normering, därför är det konvergens för Mn dn c n som ska studeras där c n > och d n är några lämpligt valda konstanter som kan bero på antalet n. 3
8 I försäkringssammanhang är extremvärdesteorin tillämpbar då ett försäkringsbolag kan behöva modellera för de största skadebeloppen som kan komma att betalas. Slumpvariablerna ses då som storlekar på skadebelopp och dessa skador inträffar oberoende av varandra med lika sannolikhet. Om försäkringsavtalen täcker översvämningar, stormar eller andra naturkatastrofer är de exempel på sådana försäkringsavtal som kan komma att kosta stora summor. Då är det lämpligt att kunna modellera för hur sannolika dessa stora skador är. Definition 3 (Extremvärdesfördelningar). Låt α >. Följande tre fördelningar kallas extremvärdesfördelningar. Fréchet: Φ α (x) = { om x e x α om x > Gumbel: (x) = e e x alla x { e ( x) α om x Weibull: Ψ α (x) = om x > Kopplingen mellan fördelningarna är Y Φ α log Y α Y Ψ α De tre extremvärdesfördelningarna kan skrivas på en allmän form. Den generaliserade extremvärdesfördelningen har följande utseende: Definition 4 (Den generaliserade extremvärdesfördelningen). { e G β (x) = (+βx) /β om β e e x om β = Både läge och skala kan varieras fritt då extremvärdesfördelningen förblir en extremvärdesfördelning. Då β används sambandet att om X d = cx + d så är ( X ) d F X (x) = P (X x) = P x = P (X cx + d) = F X (cx + d) c för att kunna se att en extremvärdesfördelning kan skriva som den generaliserade extremvärdesfördelningen. Då β = är den generaliserande extremvärdesfördelningen definierad som en Gumbelfördelning. 4
9 Fréchetfördelningen kan alltså skrivas som den generaliserande extremvärdesfördelningen: Φ α (x) = G β (ax + b) e x α = e (+β(ax+b)) /β Detta ger att α = /β och x = + β(ax + b) så för att parametrisera Φ α (x) som den generaliserande extremvärdesfördelningen sätts β = /α, a = /β och b = /β. Även Weibullfördelningen kan skrivas som den generaliserande extremvärdesfördelningen: Ψ α (x) = G β (ax + b) e ( x)α = e (+β(ax+b)) /β så för att parametrisera Ψ α (x) som den generaliserande extremvärdesfördelningen sätts β = /α, a = /β och b = /β. Sats (Konvergens för maxima). Antag att X,..., X n är oberoende lika fördelade med fördelningsfunktion F. Låt M n = max(x,..., X n ). Om det finns konstanter c n > och d n sådana att M n d n c n d Y för någon slumpvariabel Y, då har Y en extremvärdesfördelning. Följande observation är intressant. M n = max(x,..., X n ) är maximum av ett n st slumpvariabler och då n är tillräckligt stort konvergerar Mn dn c n mot en gränsfördelning G. M nk kan ses som maximum av k st maximum, eller maximum av nk stycken slumpvariabler. Även M nk d nk c nk konvergerar mot gränsfördelningen G enligt Sats då nk är tillräckligt stort. och därför är och ( Mnk d n P c n ) ( Mn d n x = P c n ( ) x dnk P (M nk x) G c nk ( ) x P (M nk x) G k dn c n ) k x Alltså är G och G k lika förutom läge och skalparameter och båda tillhör extremvärdesfördelningarna. 5
10 .9.8 Frechet Gumbel Weibull Figur : Täthetsfunktioner för de tre extremvärdesfördelningarna, α = Sats ställer inga villkor på varken F eller normeringskonstanterna. Det kan vara behändigt att kunna säga något om gränsfördelningen utan att ställa några villkor, och Sats kan bevisas. För att tillämpa gränsfördelningarna är det mer användbart att skriva om Sats och bevisa den då villkor ställs på normeringskonstanterna. Beviset är approximativt då ett fullständigt bevis kräver kunskap om så kallad reguljär variation. För att förstå nästa sats behövs ytterligare en definition. Definition 5 (Kvantilfunktion). För X från en given fördelning F, låt q n = q n (F ) vara n -kvantilen, det vill säga q n är det minsta värdet som uppfyller att P (X > q n ) n. Sats 2 (Konvergens av maxima med villkor). Med definitioner enligt ovan.. M n q n d Φα lim P (X > xt X > t) = x α t x >, ω = M n q n E[X q n X > q n ] alla x, ω =. ( d limp t ω ) X t E[X t X > t] > x X > t = e x ( M n ω d Ψα lim P X > ω ω q n t tx X > ω ) = x α t x >, ω =. 6
11 Jämfört med Sats ställs villkor på normeringskonstanterna. För att maxima ska konvergera till Φ α ska c n = q n och d n =. För att maxima ska konvergera till ska c n = E[X q n X > q n ] och d n = q n. För att maxima ska konvergera till Ψ α sätts c n = ω q n och d n = ω. Bevis.. lim P (X > xt X > t) = t x α P (X > x) ax α. Enligt definition 5 beräknas kvantilen till q n (an) /α. Nu följer det att ( ) Mn P x = P (M n q n x) = P (X q n x) n = ( P (X > q n x)) n q n där alltså ) n ( x α e x α = Φ α (x), n P (X > q n x) a(q n x) α = a(x(na) /α ) α = ax α n a = x α n. 2. Börja med att definiera e(t) som E[X t X > t]. Observera att den betingade sannolikheten ( ) lim P X t t ω E[X t X > t] > x X > t = e x P ( X t e(t) ) > x = e x P (X > t) då t ω. Enligt definition 5 konvergerar q n ω då n samt P (X > q n ) n. Nu följer det att ( ) ( Mn q n X n ( ( )) qn X n qn P x = P x) = P > x e(q n ) e(q n ) e(q n ) ) n ( e x e e x = (x). n 7
12 3. Den övre gränsen ω sätts till då det bara handlar om en förskjutning från X till X ω. ( lim P X > ω t tx X > ω ) = x α P (X > x) ax α t för små x >. Kvantilen beräknas enligt definition 5 till Detta ger att ( ) Mn ω P x = P ω q n där alltså = ( P (X > q n x)) n q n (an) /α. ( ) Mn x = P (M n q n x) = P (X q n x) n q n ) n ( xα e xα = Ψ α ( x), n P (X > q n x) a(xq n ) α = a( x(an) /α ) α = ax α a n = xα n. Om istället x < så erhålls ( ) Mn P x e ( x)α = Ψ α (x). q n Standardgränsvärdet ( + n )n e då n förekommer i bevisen. 3 POT-modellen I den så kallade Peaks over Threshold-modellen antas att slumpvariablerna, givet att de överstiger en hög nivå, kommer från en generaliserad Paretofördeling. Detta kan motiveras med extremvärdesteori; om maximum konvergerar mot en viss extremvärdesfördelning så är det ekvivalent med att de betingade slumpvariablerna konvergerar mot en viss generaliserad Paretofördelning. I försäkringssammanhang är det intressant att förstå fördelningen för skadebeloppen givet att de överstiger en hög nivå eftersom återförsäkringskontrakt ofta ger skydd mot just sådana stora skadebelopp. 8
13 Antalet slumpvariabler som överstiger tröskeln t antas vara Poissonfördelade med intensitet λ. Detta beror på att en binomialfördelning, Bin(n, p) kan approximeras med en Poissonfördelning då sannolikheten p är liten. För att tillämpa POT-modellen bör tröskeln t vara hög, så att p är litet. Definition 6 (Den generaliserade Paretofördelningen). Den generaliserade Paretofördelningen har fördelningsfunktionen { om β H β (x) = + log G β (x) = (+βx) /β e x om β = Definition 7 (Mean excess function). e(t) = E[X t X > t] kallas för mean excess function, e(t) beräknar väntevärdet av X givet att X är större än t. e(q n ) har redan förekommit som en normeringskonstant, men Mean excess function har en speciell betydelse i POT-modellen då det är det sökta väntevärdet. Sats 3 (POT). ( M n d n d X dn Gβ c n c n där Y H β. u X d n c n ) d > u (Y u Y > u) Bevis. Antag att X har fördelningsfunktion F som tidigare. Då har X dn c n fördelningen F (c n x + d n ) och vidare F n (c n x + d n ) G β (x). För att följa beviset observeras att log F (z) ( F (z)) då z är stort. ( X dn P u > v X d n c n c n = F (c n(v + u) + d n ) F (c n u + d n ) = n log F (c n(v + u) + d n ) n log F (c n u + d n ) log G β(v + u) log G β (u) = F Y (v + u) F Y (u) ( ) ) P X dn c n > v + u > u = ( ) P X dn c n > u = log F (c n(v + u) + d n ) log F (c n u + d n ) + o() + o() = log F n (c n (v + u) + d n ) log F n (c n u + d n ) = ( + log G β(v + u)) ( + log G β (u)) = P (Y u > v Y > u). + o() 9
14 Sats 3 ställer i likhet med Sats inga krav på normeringskonstanterna. Sats 3 går att bevisa utan att bestämma dessa normeringskonstanter men för att kunna tillämpa Sats 3 är det nödvändigt att veta hur variablerna bör skalas om. I den här studien är det av intresse att ta reda på hur POT-modellen är användbar, därför kommer dessa normeringskonstanter att beräknas. För att göra Sats 3 ännu tydligare kommer u sättas till i den nya satsen. u säger mer då det betyder att även variabler som betingas på en ännu högre nivå än tröskeln t följer en generaliserad Paretofördelning. Här kommer u = att studeras och tröskeln som variablerna betingas överstiga är alltså lika med t. Sats 4 (POT med villkor). Med definitioner enligt ovan,. M n q n d Φα Y H β, β = /α, n och t. ( ) X t tβ X > t d Y 2. M n q n e(q n ) d Y H β, n och t. ( X t e(t) ) X > t d Y 3. M n ω ω q n d Ψα Y H β, β = /α, n och t ω. ( ) X t β(t ω) X > t d Y Det är. och 2. som är intressant att använda då 3. har övre begränsning. För beräkning av normeringskonstanterna c n och d n i Sats 3 kommer beräkningarna som gjordes i avsnitt 2 till användning. För att Fréchetfördelningen ska kunna parametriseras som den generaliserande extremvärdesfördelningen sätts β = /α, a = /β och b = /β och för att Weibullfördelningen ska kunna parametriseras som den generaliserande extremvärdesfördelningen sätts β = /α, a = /β och b = /β. Då gäller för. att eller det omvända sambandet Nu är Φ α (βx + ) = P Φ α (x) = G β ( x β ) Φ α (βx + ) = G β (x) ( ) ( Mn Mn q n βx + = P q n q n β ) x = G β (x).
15 konvergerar mot en Fréchetfördelning konvergerar Mn qn q nβ mot den generaliserade extremvärdesfördelningen och det är det sistnämda som är av intresse här. Sedan följer Sats 4 om u = och den höga tröskel q n betecknas med t. Beräkning av normeringskonstanterna i 3. görs enligt samma mönster, för 2. observeras att en Gumbelfördelning är definierad som den generaliserade extremvärdesfördelning och normeringskonstanterna återfinns i Sats 2. Om Mn q n 4 Illustration av teorin För att illustrera extremvärdesteorin samt POT-modellen i ett antal grafer kommer Matlab att användas. Idén med att illustrera extremvärdesteorin är att ta reda på hur många observationer varje stickprov bör innehålla för att konvergens ska äga rum. När det gäller POT-modellen är det intressant att studera för vilka nivåer på tröskeln t som modellen är tillämpbar. Även hur många slumpvariabler som bör överstiga t för att det ska vara rimligt att använda modellen är intressant att utreda. Det är fyra fördelningar som kommer att studeras: Paretofördelningen, Lognormalfördelningen, F-fördelningen och U(,). Både Paretofördelningen och F-fördelningen är långsvansade och saknar övre begränsning. Maxima bör konvergera till en Fréchetfördelning för de två fördelningarna. Anledningen till att studera ytterligare en fördelning, F-fördelningen, är den att i Paretofördelningen kommer konvergensen visas vara lite mer uppenbar. Lognormal saknar även den övre begränsning men definieras inte som långsvansad. Maxima från lognormal kommer att konvergera mot en Gumbelfördelning. Fördelningar med övre begränsning är inte särskilt intressant här, men för att illustrera den tredje extremvärdesfördelningen kommer maxima från U(,) att studeras. För att illustrera konvergensen mot extremvärdesfördelningarna kommer fördelningsfunktionen för extremvärdesfördelningen, det vill säga Φ α (x), (x) eller Ψ α (x) att plottas mot F n (c n x+d n ) där F är fördelningsfunktionen för någon av de fyra nämnda fördelningarna. Variabler från fördelningarna kommer även att simuleras då det är intressant att se hur stor spridningen för dessa är. För att illustrara hur väl POT-modellen fungerar för olika värden på t kommer den generaliserande Paretofördelningen att plottas mot fördelningsfunktionerna från några av de nämnda fördelningarna, även här kommer slumpvariabler att simuleras. Slumpvariablerna från Paretofördelningen, lognormal och F-fördelningen kan ses som storlekar på skadebelopp. Paretofördelningen och lognormal är anpassbara till just skadebelopp där ett fåtal skador står för den största delen av den totala kostnaden. I figur 2 visas fördelningsfunktionen för Paretofördelningen och lognormal som har anpassats till befintliga data över skadebelopp från [4]. Figur 2 visar att de båda fördelningarna anpassas väl till skadebeloppen i de två dataseten. Med stor
16 sannolikhet är skadebeloppet på en låg nivå, men det finns ingen övre begränsning, därför kan skadebeloppet bli hur stort som helst. Nedan studeras konvergensen för de fyra fördelningarna. För konvergens av maxima kommer stickprovet att innehålla n stycken slumpvariabler för ett varierande antal n. Detta kan ses som n stycken skadebelopp under en tidsperiod. Maxima från 5 stycken tidsperioder kommer att simuleras då det är av intressa att studera spridningen av dessa. För illustration av POT-modellen kommer tröskelt t studeras för olika värden på t. Då POT-modellen gäller för enskilda slumpvariabler kan n, antalet slumpvariabler som simuleras varav några överstiger t väljas fritt. Anpassad Lognormal till data Anpassad Pareto till data x x 5 Figur 2: Fördelningar anpassade till skadebelopp, Paretofördelningen är anpassad till data över skadebelopp vid stormar. 4. Paretofördelningen Paretofördelningen har täthetsfunktionen: f(x) = δγ ( + δx) +γ och fördelningsfunktionen: ( ) γ, F (x) = + δx väntevärdet: E[X] = δ(γ ) och den n:te kvantilen beräknas med hjälp av defintion 5 till: q n = δ (n γ ). 2
17 4.. Konvergens för maxima av Paretovariabler Då slumpvariablerna kommer från en Paretofördelning gäller det att M n q n d Φα (x) = e x α enligt Sats 2. Det är alltså en Fréchetfördelningen som bör passa till Mn q n. Konstanten α i Fréchetfördelningen är lika med γ i Paretofördelningen. Detta kan motiveras med att då n är F (x) = ( + δx) γ x γ. I figur 3 illusteras hur väl en Fréchetfördelning passar för några olika stora n. Konvergensen är tydligast för stora n, med i jämförelse med spridningen på de simulerade slumpvariablerna är anpassningen god för n = 4..2 POT-modellen för Paretovariabler Då X Pareto(δ, γ) är enligt Sats 4 X t tβ H β där den generaliserande Paretofördelningen är H β (x) = ( + βx) /β. Paretofördelningen har den egenskapen att slumpvariabler som överstiger en viss nivå också är Paretofördelade med modifierade parametrar. Den generaliserande Paretofördelningen är just en Paretofördelning och det är likhet i Sats 3 som kommer att råda. H β (u + v) H β (u) = F ((u + v)c n + d n ). F (uc n + d n ) Mean excess function då X är Paretofördelad är: e(t) = δ + t γ. 3
18 n=2 n=2, m= n= n=, m= n= n=, m= Figur 3: Konvergens för maxima, Fréchetfördelningen (röd) närmar sig en Paretofördelning underifrån då n blir större. Till höger jämförs simulerade variabler från Paretofördelningen med Fréchetfördelningen. Konvergensen är tydlig för n 4.2 Lognormalfördelningen En slumpvariabel som är lognormalfördelad kan skrivas som e X där X N(µ, σ 2 ). En lognormalfördelad variabel har täthetsfunktionen: och fördelningsfunktionen: f(x) = (log x µ)2 e 2σ 2 2πσx F (x) = P (e X x) = P (X log x) = 4
19 ( X µ P log x µ ) ( ) log x µ = Φ σ σ σ där nu Φ(.) står för fördelningsfunktionen för N(, ). Väntevärdet är: σ2 µ+ E[X] = e 2. och kvantilen q n löses ur: n = F (q n) n = Φ ( log qn µ Kvantiler, z /n utläses ur normalfördelningstabellen och finns dessutom inbyggda i Matlab. log q n µ σ σ = z /n q n = e σz /n+µ. ) Konvergens för maxima av lognormalvariabler Enligt Sats 2 ska M n q n e(q n ) d (x) = e e x. Då q n kan e(q n ) enligt [2] approximeras med σ 2 q n log q n µ. I figur 4 visas hur väl maxima från lognormalfördelningen konvergerar mot en Gumbelfördelning för några olika värden på n. Den här lognormalfördelningen verkar konvergera snabbt till sin extremvärdesfördelning POT-modellen för lognormalvariabler Då X LogN(µ, σ 2 ) gäller det enligt Sats 4 att X t e(t) d H β. Då maxima konvergerar mot en Gumbelfördelning har den generaliserade Paretofördelningen fördelningsfunktion: H β (x) = e x. Då X är Lognormalfördelat och t är stort approximeras alltså Mean excess function enligt: e(t) σ2 t log t µ 5
20 n=2 n=2, m= n= n=, m= n= n=, m= Figur 4: Konvergens för maxima. Gumbelfördelningen (röd) och Lognormalfördelningen till vänster, konvergens tydligt redan då n = 2, och i princip lika god för n = som n =. Till höger visas Gumbelfördelningen och de simulerade variabler från lognormalfördelningen. Sats 4 gör det enkelt att illustrera hur väl lognormalfördelningen konvergerar till den generaliserande Paretofördelningen, detta visas genom att jämföra ( ) X t P < v X t e(t) > e(t) där X t e(t) H β med P (X < ve(t) + t X > t) 6
21 där X logn(µ, σ 2 ). I figur 5 illustreras gränsfördelningen för olika nivåer på t. Trösklarna t är valda så att, 5 respektive procent av slumpvariablerna bör överstiga t. Konvergensen är bättre då t är på den högre nivån men modellen bör fungera väl då t q POT modellen lognormalvariabler, t = q POT modellen lognormalvariabler, t=q POT modellen lognormalvariabler, t=q x x x 5 Figur 5: Den generaliserande Paretofördelningen är den prickade linjen och lognormal är heldragen. Tre nivåer på t illustreras. 4.3 F-fördelningen Att maxima från en Paretofördelning konvergerar mot en Fréchetfördelning är kanske inte så överraskande med tanke på fördelningsfunktionens utseende. Därför är det intressant att titta på ytterligare en fördelning, nämligen F-fördelningen som även den är långsvansad och saknar övre begränsning. F-fördelningens maximum bör enligt Sats 2 konvergera mot en Fréchetfördelning. F-fördelningen är egentligen en hel familj av fördelningar då den beror av ett antal frihetsgrader i både täljaren och nämnaren. Täthetsfunktionen för F (n, m) är: f(x) = och dess väntevärde är: Γ( n+m 2 )( n m )n/2 Γ( n 2 )Γ( m 2 ) x n/2 ( + nx m )(n+m)/2 E[X] = m m Konvergens för maxima av F-variabler Även maxima från F-fördelningen kommer alltså att konvergera mot en Fréchetfördelning. För beräkning av konstanten α i Fréchetfördelningen är 7
22 fördelningsfunktionen för F (n, m) av intresse. Denna kan erhållas med integrering av täthetsfunktionen. f(x) F (x) xm/2+ x m/2. Konstanten α i Fréchetfördelningen är därmed lika med m 2. För att skala om maxima behövs kvantiler från F-fördelningen. Dessa kvantiler finns i tabeller, men det finns även inbyggda i Matlab. I figur 6 jämförs en Fréchetfördelning med F-fördelningen för varierande n. F-fördelningen konvergerar långsammare än de redan studerade fördelningarna. Anpassningnen för n = 2 är sämre här. Konvergensen blir tydligare för större n med kan med tanke på slumpvariablernas spridning ändå inte anses som tillräcklig god för n =. Dessa slumpvariabler ser inte ut att kunna komma från en Fréchetfördelning POT-modellen för F-variabler Då X F (n, m) gäller det enligt Sats 4 att X t tβ d H β där den generaliserande Paretofördelningen är Enligt Sats 3 gäller det att H β (x) = ( + βx) /β. H β (u + v) H β (u) d F ((u + v)c n + d n ) F (uc n + d n ). Mean excess function då X är F-fördelad erhålls som alltid genom integrering: ω e(t) = ( F (x))dx. F (t) Med hjälp av Sats 4 framgår det att det är ( X t P < v X t tβ tβ där X t tβ H β och t ) > P (X < vtβ + t X > t) där X F (n, m) som ska studeras för att kunna säga något om konvergens för olika nivåer på t. β = 2/m där m är antalet frihetsgrader i nämnaren för 8
23 n=2 n=2, m= n= n=, m= n= n=, m= Figur 6: Konvergens för maxima, Fréchetfördelningen (röd) närmar sig långsamt F-fördelningen underifrån. Konvergensen är tydligare för större värden på n. Fréchetfördelning och de simulerade F-variablerna jämförs till höger. F-fördelningen. Figur 7 visar att en hög nivå på t krävs för att konvergens ska äga rum. I figur 7 är t bestämt enligt att., respektive 5 procent av slumpvariablerna bör överstiga t. Slumpvariabler från F-fördelningen har även simulerats för att kunna avgöra om modellen är lämplig för dessa nivåer på t. I simuleringen väljs antalet slumpvariabler n så att ungefär 5 stycken överstiger t. Konvergensen är klart sämre än för lognormalvariabler, här krävs en högre tröskel, då t = q är modellen fortfarande inte tillfredsställande. 9
24 POT modellen F variabler, t=q POT modellen F variabler, t=q POT modellen F variabler, t=q Figur 7: Den generaliserande Paretofördelningen är den prickade linjen och F-fördelningen är den heldragna. Tre nivåer på t illustreras. 4.4 U(,) Weibullfördelningen är inte särskilt intressant i detta sammanhang eftersom skadebelopp inte har någon övre begränsning, men ett exempel får illustrera den tredje extremvärdesfördelningen. Den likformiga fördelningen U(,) har täthetsfunktion: f(x) = och fördelningsfunktionen: då < x <. Väntevärdet är: F (x) = x E[X] = 2 och kvantiler är enkla att beräkna då: q n = n. Den övre begränsningen ω = och P (X x) = x. Låt nu x <. ( ) Mn ω ( P x = P (n(m n ) x) = M n + x ) ω q n n ( = P X + x ) ( n = P X x ) n e ( x). n n Detta är alltså en Weibullfördelningen med parametern α =. Weibullfördelningen illustreras i figur 8. 2
25 Weibull och U(,), n= Figur 8: Konvergens för maxima, Weibullfördelningen är den prickade linjen och U(,) den heldragna. Konvergensen är tydlig redan för n=2. 5 Tillämpningar 5. Tillämpning av extremvärdesteorin I avsnitt 4 illustrerades hur många observationer ett stickprov bör innehålla för att maxima ska konvergera till någon extremvärdesfördelning. I detta avsnitt ska värden från lognormalfördelningen simuleras för att studera konvergens av maxima. Idén är att simulera n stycken slumpvariabler från m stycken stickprov som då kan ses som n stycken skadebelopp från varje tidsperiod m. Det är alltså m stycken maximum som kommer att studeras. Syftet med illustrationen är att undersöka om det är rimligt att med hjälp av extremvärdesteorin modellera för hur stort det största skadebeloppet för varje år kan komma att bli de kommande åren. Maxima kommer från stickprov som innehåller stycken slumpvariabler, då det enligt avsnitt 4 är tillräckligt. Detta skadebolag drabbas alltså av stycken utbetalningar per år. I figur 9 visas fördelningen för maxima då värden för, 2 och 5 år framåt simuleras. Anpassningen blir bättre desto fler maxima som studeras men redan då det är 5 stycken maxima fungerar modellen tillfredställande. 5.2 Tillämpning av POT-modellen, återförsäkring Återförsäkring betyder att försäkringsbolagen försäkrar sina egna åtaganden hos en större aktör, ett återförsäkringsbolag. Försäkringsbolaget är alltså försäkringstagare hos ett återförsäkringsbolag medan de är försäkringsgivare till sina kunder (försäkringstagarna). Genom att försäkringsgivarna i sin tur 2
26 Simulerade maxima lognormalvariabler, m= Simulerade maxima lognormalvariabler, m= Simulerade maxima lognormalvariabler, m= Figur 9: Simulering av maxima från Lognormalfördelningen. Gumbelfördelningen är den prickade linjen. är försäkrade är den enskilde försäkringstagaren skyddad även om ett enskilt försäkringsbolag drabbas av många och stora skadebelopp, se [5]. Detta skulle kunna hända om exempelvis en översvämning drabbar ett område där majoriteten har tecknat försäkring i samma försäkringsbolag. Ett exempel på återförsäkringsavtal skulle kunna vara att om en skada överstiger en viss nivå, t, går återförsäkringsbolaget in och betalar det överstigande beloppet. Med hjälp av POT-modellen kan återförsäkringsavtal prissättas. Det första antaganden i detta exempel är att skadebeloppen X är Paretofördelade med parametrar enligt ovan, (δ = 24, γ = 2.8). Det ger att E[X] 3. Det andra antagandet är att försäkringsbolagen har eller 5 skadeutbetalningar per år. Det tredje antagandet är att antalet skador N som överstiger en viss nivå är Poissonfördelade med intensitet λ. Det är fyra olika fall som kommer att studeras över en års period och återförsäkringsbolaget kommer här i exemplet att stå för hela kostnaden som överstiger t.. Då skadebelopp överstiger 46 kr betalas den överstigande summan av återförsäkringsbolaget. n = och t = Då skadebelopp överstiger 46 kr betalas den överstigande summan av återförsäkringsbolaget. n = 5 och t = Då skadebelopp överstiger kr betalas den överstigande summan av återförsäkringsbolaget. n = och t =. 4. Då skadebelopp överstiger kr betalas den överstigande summan av återförsäkringsbolaget. n = 5 och t =. 22
27 I fall och 2 är λ =.5 då F(46) =.95 och i fall 3 och 4 är λ =. då F() =.99. Väntevärdet för återförsäkringsbolagets åtaganden i de fyra fallen beräknas med hjälp av ne[n]e(t) där och N P o(λ) E[N] = λ e(t) = δ + t (γ ). För att illustrara utfallet av de fyra fallen har n stycken slumpvariabler simulerats från Paretofördelningen. Dessa kan ses som skadebeloppen under de kommande åren. För att få en bättre bild av hur väl modellen fungerar i de fyra fallen upprepas försöken fyra gånger. Det kan ses som att fyra försäkringsbolag med samma förutsättningar har tecknat samma typ av återförsäkring. Resultat av simuleringen. Tabell redogör för den totala kostnaden i tusentals kronor för det fyra återförsäkringsbolagen. Förväntad kostnad ÅFB ÅFB 2 ÅFB 3 ÅFB 4 fall fall fall fall Tabell 2 redogör för antalet skadebelopp som drabbar återförsäkringsbolagen. ne[n] ÅFB ÅFB 2 ÅFB 3 ÅFB 4 fall fall fall fall Tabell 3 redogör för det största skadebeloppet i tusentals kronor under tidsperioden ÅFB ÅFB 2 ÅFB 3 ÅFB 4 fall fall fall fall
28 Priset på återförsäkringen kommer sättas högre än den förväntade kostnaden då återförsäkringsbolaget vill ha betalt för sitt risktagande. I fall 3 skulle det betyda att återförsäkringsbolaget kräver mer än kronor under de åren. Ju fler försäkringstagare återförsäkringsbolaget har, desto mindre blir risken och de skulle kunna sätta en lägre premie. Även om återförsäkring bör vara dyrare än förväntad kostnad är det ändå en poäng för ett försäkringsbolag att köpa återförsäkring då risktagandet skjuts över på en annan part. I fall 4 drabbas återförsäkringsbolag nr 2 av större utgifter under tidsperioden än väntat och det finns ett skadebelopp som överstiger 7 kronor. Detta är nu återförsäkringsbolagets åtaganden. Ytterligare en motivering till återförsäkring är att det blir ett jämnare flöde av utgifter då de stora skadebeloppen får ett fast pris. I detta exempel står återförsäkringsbolaget för den del av skadebeloppet som överstiger en viss nivå. Andra tänkbara scenarion är att endast en del av den överstigande summan tillfaller återförsäkringsbolaget eller att det finns en övre begränsning även för återförsäkringsbolaget, detta är mycket vanligt. Det är även troligt att det är fler återförsäkringsbolag som är med och delar på de stora skadorna. För att beräkna den förväntade kostnaderna i ett intervall, då återförsäkringsbolaget står för kostnaden som överstiger t upp till den övre gränsen t 2, subtraheras e(t 2 ) från e(t ). Av simuleringen framgår att det är ett stort n som gör att kostnaden kommer nära sitt väntevärde. Om t är på en så hög nivå att det är få observationer som överstiger blir det osäkrare. Även om n är litet men t är på en rimlig nivå blir det osäkert. Den generaliserande Paretofördelningen fungerar för alla värden på t men t bör ändå vara stort så att sannolikheten att överstiga t blir liten. Då kan Poissonfördelningen användas för att modellera hur många skador som överstiger t. 6 Slutsatser Extremvärdesteorin är tillämpbar för de fyra fördelningar som har studerats. Maximum med lämplig omskalning konvergerar väl mot någon av extremvärdesfördelningarna då n närmar sig för tre av de fyra studerade fördelningar. F-fördelningen är den som konvergerar långsammast. För att kunna säga något om när konvergensen är god simulerades även variabler från fördelningarna. Då kunde spridningen av variablerna tas med i resonemanget. Då det inte går att avgöra från vilken fördelning slumpvariablerna kommer ifrån kan konvergensen ses som god. Konvergensen studeras enbart genom att titta på figurer, det är inget exakt mått. För att kunna använda extremvärdesteorin är Sats 2 nödvändig. Utan att känna till normeringskonstanterna eller till vilken extremvärdesfördelning som konvergens kommer äga rum blir inte extremvärdesteorin användbar. I avsnitt 5. illustreras i ett exempel att det är flera maxima som bör studeras för att teorin ska vara 24
29 användbar. Även ett enskilt maxima följer fördelningen men det är mycket osäkert att modellera för ett enstaka maxima. I exemplet framgår att då 5 maxima studeras fungerar modellen tillfredställande. POT-modellen fungerar bäst då slumpvariabler kommer från en Paretofördelning. Den generaliserande Paretofördelningen är just en Paretofördelning och i Sats 3 och 4 är det likhet och inte konvergens som råder. Paretofördelningen har den egenskapen att givet en basnivå t erhålls enkelt fördelningen för andra nivåer då det också är en Paretofördelning med modifierade parametrar. POT-modellen fungerar även för lognormalvariabler och F-variabler då t är på en hög nivå. I de två fallen bör tröskeln t vara på en hög nivå av två anledningar, dels för att Sats 4 kräver det och dels för att då t är på en hög nivå blir sannolikheten att överstiga t liten och skador som överstiger t kan då modelleras med en Poissonfördelningen. För Paretofördelningen är det bara det sistnämnda som gör att t bör vara på en hög nivå. Figur 5 och 7 säger att POT-modellen för lognormalvariabler fungerar för en lägre nivå på t än vad POT-modellen för F-variabler gör. Det beror på att F-fördelningen inte ser ut som en Paretofördelning förrän långt ute i svansen. Beräkningarna av normeringskonstanterna i Sats 4 var viktiga för att förstå hur den generaliserande Paretofördelningen och därmed POT-modellen kan användas. Om inte beräkningen av dessa hade gjorts skulle det inte vara möjligt att anpassa en generaliserad Paretofördelning. Sats 3 säger enbart att det finns konstanter så att konvergens äger rum, men den är alltså inte tillämpbar. I avsnitt 5.2 illustreras POT-modellen i ett exempel. Där visas att spridningen är relativt stor. Då många observationer hamnar över t blir spridningen mindre. Ett lägre t ger fler värden som överstiger t men då t ska vara stort behöver n vara så stort att flera variabler överstiger t. I exemplet har fall 3 stor spridning mellan återförsäkringsbolagen trots att det är runt observationer som överstiger t. I detta perspektiv framgår det att modellen kräver stora tal för bättre säkerhet. 7 Diskussion För att tillämpa extremvärdesteorin och POT-modellen i försäkringssammanhang måste anpassningen av skadebelopp till en känd fördelning vara god. Om det finns knapphändigt med data över skadebelopp för en viss försäkringstyp blir det större osäkerhet i modellen för dessa skadebelopp. Detta medför även större osäkerhet vid tillämpning av extremvärdesteorin och POT-modellen. En annan aspekt att ta hänsyn till vid anpassning av skadebelopp är att tiderna förändras. Exempel på det skulle kunna vara växthuseffekten. Växthuseffekten verkar påverka naturfenomen, gör den att vi drabbas av fler naturkatastofer i framtiden? Ett annat exempel är villain- 25
30 brott, gör nya och säkrare larm att villainbrotten minskar? Sådana frågor försvårar anpassning av skadebelopp även om tillräckligt med data finns att tillgå. Det hade varit intressant att studera modellerna med riktigt data, men simulering var nödvändigt då det är svårt att få tillräckligt med data för att studera gränsfördelningar. Extra svårt blir det när det handlar om extrema händelser. Det är intressant att reflektera över att det krävs en djup förståelse för ämnet då flera beräkningar av normeringskonstanter krävs för tillämpning. Det som i teorin ser behändigt ut kräver alltså en del omformuleringar. En annan komplikation för att kunna tillämpa modellerna är att det krävs enorma mängder med data för att få någon säkerhet i modellerna. För att tillämpa POT-modellen måste det även tas hänsyn till en rimlig nivå på t. I simuleringen kan önskat antal variabler erhållas men det går att diskutera dess rimlighet. 8 Referenser Referenser [] Coles. S (2). An introduction to statistical modeling of extreme values, Springer. [2] Embrechts. P, Klüppelberg. C och Mikosch. T (997). Modelling extremal events, Springer. [3] Falk. M, Hüsler. J och Reiss. R-D (24). Laws of small numbers: Extremes and rare events, Birkhäuser. [4] Olsson. E (28). Matematiska metoder inom sakförsäkring, Stockholms universitet. [5] (29-5-5) 9 Bilagor Matlab kod % m-fil pareto extremvärde gamma=2.8; alpha=/24; 26
31 m=; n=; %Simulering från Pareto(alpha,gamma) S = ((-rand(n, m)).^(-/gamma)-)./alpha; %cdf: F(x) = -(+alpha*x)^(-gamma) M=sort(max(S)); x=[.:.:]; %kvantilen q q=(/alpha)*n^(/gamma)-(/alpha); %Fördelningsfunktion F^n(qx) Fpareto=(-(./(+alpha*q*x)).^gamma).^n; %Simulerad fördelningsfunktion EmpF=[:m]/m; %Fördelningsfunktion Frechet Ffrechet=exp(-(x).^(-gamma)); % m-fil 2 Lognormal extremvärde mu=9.8236; sigma2=47; sigma=sqrt(sigma2); m=; n=; % Simulerade värden från logn(mu,sigma2) L=exp(mu+sigma.*randn(n,m)); M=sort(max(L)); %kvantilen q = konstanden d q=exp(sigma*norminv(-(/n))+mu); %aux = konstanten d aux=sigma2*q/(log(q)-mu); x= [-2:.:5]; %x=[::]; %Simulerad fördelningsfunktion EmpF=[:m]/m; T=(M-q)./aux; %Fördelningsfunktion Gumbel G=exp(-exp(-x)); %Fördelningesfunktionen F^n(x*aux+q) Flogn=normcdf((log(x*aux+q)-mu)/sigma).^n; % m-fil 3 F-fördelningen extremvärde n=; %här antal frihetsgrader m=; %här antal frihetsgrader j=; % "m" antal maxima i=; % "n" antal i varje stickprov 27
32 % i*j stycken simulerade F(n,m)-variabler Fnm=[]; for t=:i Xn=sum((randn(n,j)).^2); Xm=sum((randn(m,j)).^2); Fnm(t,:j) =(Xn/n)./(Xm/m); end F=sort(max(Fnm)); %kvantilen q = konstanten c q=finv(-/i,n,m); %Simulerad fördelning EmpF=[:j]/j; %Frechetfördelningens fördelningsfunktion x=[.:.:3]; alpha=m/2; Ffrechet=exp(-x.^(-alpha)); %Fördelningen F^n(cx+d) FF=(fcdf(q*x,n,m)).^i; % m-fil 4 Likformigafördelningen Extremvärde n=; m=; %Simulerade variabler från U(,) UU=rand(n,m); U=sort(max(UU)); %övre gräns w = konstanten d w=; %kvantilen q, konstanten c = w - q q=-(/n); %simulerad fördelningsfunktion EmpF=[:m]/m; T=(U-w)./(w-q); %Wiebullfördelningens fördelningsfunktion x=-[.:.:7]; alpha=; W=exp(-(-x).^alpha); % F^n((w-q)x+w)^n Funi=(x*(w-q)+w).^n; % m-fil 5 Pareto pot-modell phi=/24; gamma=2.8; alpha=2.8; beta=/alpha; 28
33 u=; v=[:5]; genpar=((+beta*u)./(+beta*u+beta*v)).^(/beta); n=; q=(n^(/gamma)-)/phi; pareto= ((-phi*q+phi*u*q/alpha)./(-phi*q+phi*q*(u+v)/alpha)).^gamma; % m-fil 6 lognormal pot-modell mu=9.8236; sigma2=47; sigma=sqrt(sigma2); n=; u=55; L=exp(mu+sigma.*randn(n,)); V=sort(L(L>u)); v=length(v); q=u; eq=sigma2*q/(log(q)-mu); EmpF=[:v]/v; x=[:.:8]; y=x*eq; genpar=-exp(-x); t=u+y; t2=u; F=-(-normcdf((log(t)-mu)./sigma))./(-normcdf((log(t2)-mu)./sigma)); % m-fil 7 F-pot-modell t=8.75; %F(2.98)=.95 n=223; % antal v=[:.:2]; i=; %frihetsgrader j=; %frihetsgrader q=finv(-/n,i,j); %kvantil beta=2/j; alpha=/beta; genpar=-(./(+beta*v).^(/beta)); F=(-fcdf(v*t*beta+t,i,j))./(-fcdf(t,i,j)); V=frnd(i,j,n); %ger n*n värden V=sort(V(V>t)); x=length(v); EmpF=[:x]/x; 29
PROGRAMFÖRKLARING III
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING III Matematisk statistik, Lunds universitet stik för modellval och prediktion p./22 Statistik
Statistiska metoder för säkerhetsanalys
F13: Kvantiler och extremvärden Lysrör Extremvärden Vi hade tidigare (Kedja) att om X i var oberoende och Rayleigh-fördelade så blev Y = min(x 1,..., X n ) också Rayleighfördelad. Vad händer med Z = max(x
Extremvärden att extrapolera utanför data och utanför teori/modell. Statistik för modellval och prediktion p.1/27
Extremvärden att extrapolera utanför data och utanför teori/modell Statistik för modellval och prediktion p.1/27 Ledning utgjuter sig Centrala Uppsala översvämmades på tisdagskvällen för andra gången den
histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 4, 28-3-27 EXEMPEL: buss. Från en busshållplats avgår en buss var 2 min (inga
4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
SF1911: Statistik för bioteknik
SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion
histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF5: Matematisk statistik för L och V OH-bilder på föreläsning 4, 27--8 EXEMPEL: buss. Från en busshållplats avgår en buss var 2 min (inga
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge
Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 28-9-3 Normalfördelningen, X N(µ, σ) f(x) = e (x µ)2 2σ 2, < x < 2π σ.4 N(2,).35.3.25.2.5..5
Grundläggande matematisk statistik
Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.
SF1901: Sannolikhetslära och statistik
SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
SF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 6. Normalfördelning, Centrala gränsvärdessatsen, Approximationer Jan Grandell & Timo Koski 06.02.2012 Jan Grandell & Timo Koski () Matematisk statistik
Kap 3: Diskreta fördelningar
Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen
FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Demonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Formel- och tabellsamling i matematisk statistik
Formel- och tabellsamling i matematisk statistik 1. Sannolikhetsteori för lärarprogrammet Sannolikhetsformler P (A ) = 1 P (A) P (A B) = P (A) + P (B) P (A B) P (A B) = P (A B) P (B) P (A B) = P (A B)P
Kap 2. Sannolikhetsteorins grunder
Kap 2. Sannolikhetsteorins grunder Olika händelser och deras mängbetäckningar Sats 2.7 Dragning utan återläggning av k element ur n (utan hänsyn till ordning) kan ske på ( n ) olika sätt k För två händelser
Matematisk statistik 9hp Föreläsning 2: Slumpvariabel
Matematisk statistik 9hp Föreläsning 2: Slumpvariabel Anna Lindgren 6+7 september 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F2: Slumpvariabel 1/23 Begrepp Samband Grundläggande begrepp Utfall
Mer om slumpvariabler
1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde
Föreläsning 4, Matematisk statistik för M
Föreläsning 4, Matematisk statistik för M Erik Lindström 1 april 2015 Erik Lindström - erikl@maths.lth.se FMS012 F4 1/19 Binomialfördelning Beteckning: X Bin(n, p) Förekomst: Ett slumpmässigt försök med
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
SF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 5. Kovarians, korrelation, väntevärde och varians för summor av s.v.:er, normalfördelning (del 1) Jan Grandell & Timo Koski 15.09.2008 Jan Grandell &
Lärmål Sannolikhet, statistik och risk 2015
Lärmål Sannolikhet, statistik och risk 2015 Johan Jonasson Februari 2016 Följande begrepp och metoder ska behärskas väl, kunna förklaras och tillämpas. Direkta bevis av satser från kursen kommer inte på
FÖRELÄSNING 7:
FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla
TMS136. Föreläsning 4
TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Övning 1 Sannolikhetsteorins grunder
Övning 1 Sannolikhetsteorins grunder Två händelser A och B är disjunkta om {A B} =, det vill säga att snittet inte innehåller några element. Om vi har en mängd händelser A 1, A 2, A 3,..., A n, vilka är
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.
Stokastiska processer och simulering I 24 maj
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd. Matematisk statistik 24 maj 2016 Lösningar Stokastiska processer och simulering I 24 maj 2016 9 14
9. Konfidensintervall vid normalfördelning
TNG006 F9 09-05-016 Konfidensintervall 9. Konfidensintervall vid normalfördelning Låt x 1, x,..., x n vara ett observerat stickprov av oberoende s.v. X 1, X,..., X n var och en med fördelning F. Antag
SF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 4. Väntevärde och varians, funktioner av s.v:er, flera stokastiska variabler. Jan Grandell & Timo Koski 10.09.2008 Jan Grandell & Timo Koski () Matematisk
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
Datorövning 1: Fördelningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och
F9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski
SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel
Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Thomas Önskog 28/
Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta
Föreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)
SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012
Våra vanligaste fördelningar
Sida Våra vanligaste fördelningar Matematisk statistik för D3, VT Geometrisk fördelning X är geometriskt fördelad med parameter p, X Geo(p), om P (X = k) = ( p) k p P (X k) = ( p) k för k =,,... Beskriver
Grundläggande matematisk statistik
Grundläggande matematisk statistik Väntevärde, varians, standardavvikelse, kvantiler Uwe Menzel, 28 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Väntevärdet X : diskret eller kontinuerlig slumpvariable
Statistiska metoder för säkerhetsanalys
F3: Slumpvariaber och fördelningar Diskret Kontinuerlig Slumpvariabler Slumpvariabler = stokastiska variabler = random variables = s.v. Heter ofta X, Y, T. Diskreta kan anta ändligt eller uppräkneligt
1 Stokastiska processer. 2 Poissonprocessen
1 Stokastiska processer En stokastisk process är en stokastisk variabel X(t), som beror på en parameter t, kallad tiden. Tiden kan vara kontinuerlig, eller diskret (i vilket fall man brukar beteckna processen
Tentamen MVE302 Sannolikhet och statistik
Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Introduktion till statistik för statsvetare
"Det finns inget så praktiskt som en bra teori" November 2011 Repetition Vad vi gjort hitills Vi har börjat med att studera olika typer av mätningar och sedan successivt tagit fram olika beskrivande mått
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer
Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion
Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Sakförsäkring och approximation av totalt skadebelopp
U.U.D.M. Project Report 207:22 Sakförsäkring och approximation av totalt skadebelopp Oskar Vedin Examensarbete i matematik, 5 hp Handledare: Rolf Larsson Examinator: Jörgen Östensson Juni 207 Department
Föreläsning 2, FMSF45 Slumpvariabel
Föreläsning 2, FMSF45 Slumpvariabel Stas Volkov 2017-09-05 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F2: Slumpvariabel 1/23 Begrepp Samband Grundläggande begrepp och beteckningar Utfall resultatet
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 4 7 november 2017 1 / 29 Idag Förra gången Viktiga kontinuerliga fördelningar (Kap. 3.6) Fördelningsfunktion (Kap. 3.7) Funktioner av stokastiska
Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik
Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =
FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:
Föreläsning 3. Sannolikhetsfördelningar
Föreläsning 3. Sannolikhetsfördelningar Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Slumpvariabel? Resultatet av ett slumpmässigt försök utgörs
TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65
Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................
en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.
February 6, 2018 1 Föreläsning VIII 1.1 Punktskattning Punktskattning av µ Vi låter {ξ 1, ξ 2,..., ξ n } vara oberoende likafördelade stokastiska variabler (med ett gemensamt µ). ξ =: µ är en punktskattning
Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd
LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2
LINKÖPINGS UNIVERSITET Matematiska institutionen EXAM TAMS 27 / TEN 2 augusti 218, klockan 8.-12. Examinator: Jörg-Uwe Löbus (Tel: 79-62827) Tillåtna hjälpmedel är en räknare, formelsamling i matematisk
(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-
Tentamenskrivning för TMS6, Matematisk Statistik. Onsdag fm den 1 maj, 217. Examinator: Marina Axelson-Fisk. Tel: 1-7724996 Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte (bifogas).
Exempel för diskreta och kontinuerliga stokastiska variabler
Stokastisk variabel ( slumpvariabel) Sannolikhet och statistik Stokastiska variabler HT 2008 Uwe.Menzel@math.uu.se http://www.math.uu.se/ uwe/ Stokastisk variabel, slumpvariabel (s.v.): Funktion: Resultat
Matematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter
Lunds universitet Matematikcentrum Matematisk statistik Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT-15 Syftet med denna laboration är att du skall bli förtrogen med två viktiga områden
Konvergens och Kontinuitet
Kapitel 7 Konvergens och Kontinuitet Gränsvärdesbegreppet är väldigt centralt inom matematik. Som du förhoppningsvis kommer ihåg från matematisk analys så definieras tex derivatan av en funktion f : R
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 7 15 november 2017 1 / 28 Lite om kontrollskrivning och laborationer Kontrollskrivningen omfattar Kap. 1 5 i boken, alltså Föreläsning
Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).
STOKASTISKA VARIABLER Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). Definition 1. En reellvärd funktion definierad på ett utfallsrum Ω kallas en (endimensionell)
SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 3 4 november 2016 1 / 28 Idag Förra gången Stokastiska variabler (Kap. 3.2) Diskret stokastisk variabel (Kap. 3.3 3.4) Kontinuerlig stokastisk
Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...
Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för
BILAGA II. Extremvärdesstatistik och osäkerhet
BILAGA II Extremvärdesstatistik och osäkerhet I denna något spretiga bilaga har samlats ett antal sektioner som beskriver och fördjupar olika metoder och resultat kopplade till den statistiska bearbetningen
Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ
Inledning till statistikteorin Skattningar och konfidensintervall för μ och σ Punktskattningar Stickprov från en population - - - Vi vill undersöka bollhavet men får bara göra det genom att ta en boll
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-06-0 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 03-7725348 Hjälpmedel: Valfri miniräknare.
4.1 Grundläggande sannolikhetslära
4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Hur måttsätta osäkerheter?
Geotekniska osäkerheter och deras hantering Hur måttsätta osäkerheter? Lars Olsson Geostatistik AB 11-04-07 Hur måttsätta osäkerheter _LO 1 Sannolikheter Vi måste kunna sätta mått på osäkerheterna för
träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 1, 1 APRIL 215 FÖRDELNINGAR, SIMULERING OCH FÖRDELNINGSANPASSNING Syfte Syftet med dagens laboration är att du ska
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.
Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 31:E MAJ 2012 KL 08.00 13.00. Examinator: Tobias Rydén, tel 790 8469. Kursledare: Tatjana Pavlenko, tel 790 8466.
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde
Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.
Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Ytterligare begrepp Viktiga
TMS136. Föreläsning 7
TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna
Föreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
SF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 4. Funktioner av s.v:er, Flera stokastiska variabler. Marginell sannolikhetsfunktion och -täthetsfunktion. Oberoende sv:er, Maximum och minimum av oberoende
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 3 Johan Lindström 4 september 7 Johan Lindström - johanl@maths.lth.se FMSF7/MASB F3 /3 fördelningsplot log- Johan Lindström - johanl@maths.lth.se
Matematisk statistik 9hp Föreläsning 7: Normalfördelning
Matematisk statistik 9hp Föreläsning 7: Normalfördelning Anna Lindgren 29+3 september 216 Anna Lindgren anna@maths.lth.se FMS12/MASB3 F7: normalfördelning 1/18 Kovarians, C(X, Y) Repetition Normalfördelning
Weibullanalys. Maximum-likelihoodskattning
1 Weibullanalys Jan Enger Matematisk statistik KTH Weibull-fördelningen är en mycket viktig fördelning inom tillförlitlighetsanalysen. Den används ofta för att modellera mekaniska komponenters livslängder.
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).
Tekniska högskolan i Linköping Matematiska institutionen Matematisk statistik,jan Olheim MATEMATIK:Statistik 9MA31 STN, 9MA37 STN TENTAMEN MÅNDAGEN DEN OKTOBER 01 KL 14.00-18.00. Hjälpmedel:Formler och