Modeller för livslängd och dödlighet

Storlek: px
Starta visningen från sidan:

Download "Modeller för livslängd och dödlighet"

Transkript

1 Kapitel 1 Modeller för livslängd och dödlighet Tillsammans med tekniken att förränta kapital är studier av livslängden de viktigaste delarna inom livförsäkring. Försäkringshändelser inom livförsäkring beror på om en person lever eller ej (alternativt benner sig i andra hälsotillstånd i vissa situationer) och betalningar till eller från en livförsäkrings konto beror på vilket tillstånd den försäkrade personen benner sig. Studier av livslängden hos människor går så långt tillbaka i tiden som till talet. Välkända namn i detta sammanhang är till exempel John Graunt (1662), Edmund Halley 1 (Wrochlau (Breslau), 1693), Deparcieux (1746), Buon (1749), Richard Price (Northampton, 1783), Mourge (1790), Duvillard (1790) och Wigglesworth (Massachusetts, 1793). Inom parentes kan det vara intressant att nämna att gårdagens vetenskapsmän ofta hade en bred repertoar och många har skapat sig ett erkännande inom er vetenskapliga områden. Tidpunkterna då de första nationella livslängdstabellerna publicerades har varierat kraftigt mellan olika länder. Sverige (1755) var det första landet att göra det och därefter följde ett ertal länder. Exempel är Holland (1816), Frankrike (1817), Norge (1821), England (1843), Tyskland (1871), Schweiz (1876) och USA (1900). Observera att i många länder producerades det regionala livslängdstabeller långt innan de nationella tabellerna såg dagens ljus. En svårig-het i klassiceringen av tabellerna är att begreppet nation inte varit tydligt nog. I Sverige gjordes en framträdande insats av Pehr Wargentin ( ) vars arbete lade grunden till Statistiska centralbyrån som grundades Pehr War- 1 Edmund Halley är för allmänheten kanske mer känd för att ha givit namn åt en komet. 1

2 2 Modeller för livslängd och dödlighet Figur 1.1: Pehr Wargentin. gentins övriga arbete innehöll många intressanta konklusioner som bar frukt även före Inom livförsäkring använder de esta länderna någon form av statistisk utjämning av observerade data. Vilken metod som används varierar. Vanligt är medeltal över olika åldrar respektive utjämning med hjälp av polynom. Oftast brukar man arbeta med modeller som utjämnar den så kallade ettåriga dödsrisken. I Sverige har vi en lång tradition (större delen av 1900-talet) att utjämna den så kallade dödlighetsintensiteten med en parametrisk funktion, Makehams formel. Som det visar sig nedan nns det alternativ (utvidgningar) till den modellen men i huvudsak är det den modellen som används i Sverige. Ett ertal personer har gjort framträdande arbeten inom ramen för att etablera livslängdstabeller inom livförsäkring De historiskt mest kända personerna är demoivre (1729), Gompertz (1825), Makeham (1860), Sang (1868) och Weibull (1939).

3 Modeller för livslängd och dödlighet 3 Vi kommer i detta kapitel att formulera modeller som bygger på livslängden hos individer i en population. Dessa modeller kommer sedan att appliceras på försäkringar för ett liv i Kapitel 3 och försäkringar för två liv i Kapitel Sannolikhetsteoretisk modell Vi skall nu introducera den teoretiska grund som är nödvändig för att kunna studera olika individers livslängder. Vi börjar med att deniera begreppet livslängd. För detta ändamål har vi till vårt förfogande en population individer, i olika åldrar, som vi antar har sinsemellan oberoende livslängder. Denition Låt livslängden T för en godtyckligt vald individ vara en ickenegativ kontinuerlig stokastisk variabel med fördelningsfunktionen F (x) = P (T x), x 0. Täthetsfunktionen f denieras genom f(x) = F (x), x 0. Betrakta nu intervallet (x, x + dx). En naturlig fråga är hur stor sannolikheten är att individen avlider i intervallet (x, x + dx) under förutsättning att individen lever vid x. Om dx är litet är det rimligt att anta att den sannolikheten är proportionell mot längden på intervallet. Under förutsättningen att dx är litet antar vi därför att vi kan skriva den sökta sannolikheten som µ xdx där µ x är en proportionalitetsfaktor. Vi har att göra med en betingad sannolikhet och vi har den approximativa relationen µ x dx F (x + dx) F (x) 1 F (x) (1.1.1) vilket också kan skrivas som µ x 1 dx F (x + dx) F (x). (1.1.2) 1 F (x)

4 4 Modeller för livslängd och dödlighet Om vi nu låter dx 0 får vi 1 F (x + dx) F (x) µ x = lim = f(x) dx 0 dx 1 F (x) 1 F (x). (1.1.3) Det är värt att notera att f(x) dx är sannolikheten att en godtycklig individ avlider i intervallet (x, x + dx), där vi alltså inte betingat med att individen lever vid ingången av intervallet. Härledningen av µ x skulle då kunnat gå lite snabbare men det nns en poäng i att vara noggrann i det här fallet. Storheten µ x kallas för dödlighetsintensiteten för åldern x och vi har därmed följande denition Denition Låt T vara en icke-negativ stokastisk variabel som representerar en godtycklig individs livslängd. Dödlighetsintensite-ten för individen, vid åldern x, denieras som µ x = f(x) 1 F (x) där F (x) är fördelningsfunktionen för en godtycklig individs livslängd och f(x) respektive täthetsfunktion. Att deniera livslängden för en individ är emellertid inte tillräckligt med tanke på att det stora ertalet individer har levt en viss tid när individen kan komma att ingå i den population som observeras. För att kunna hantera det inför vi ett begrepp som får representera den återstående livslängden givet att individen är x år. Det leder oss till följande denition Denition Låt T x vara en icke-negativ stokastisk variabel som representerar återstående livslängd vid åldern x för en godtycklig individ. Fördelningsfunktionen för T x denieras som F x(t) = P (T x t), t 0. Med denna denition kan vi, genom användande av begreppet livslängd, T = T 0, skriva

5 Modeller för livslängd och dödlighet 5 P (T x > t) = P (T > x + t T > x) = P (T > x + t). (1.1.4) P (T > x) Då en individ uppnått åldern x kan individens totala livslängd skrivas som x+t x. Vi inför också begreppet överlevelsefunktion genom följande denition. Syftet med denna näst intill synonyma denition är att det i vissa situationer är beteckningsmässigt praktiskt.

6 6 Modeller för livslängd och dödlighet Denition Funktionen l x denieras som överlevelsefunktionen till den återstående livslängden T x genom l x (t) = 1 F x (t) = P (T x > t), t 0. Funktionsvärdet l x (t) är alltså sannolikheten för en x-årig individ att leva i ytterligare minst t år. Beteckningen som vi just infört kan i vissa situationer upplevas som obekväm vilket föranleder oss att förenkla den som nedanstående resonemang visar. Betrakta en individ som har uppnått åldern x år. Individens återstående livslängd är då T x. Vi kan då skriva P (T x > t) = l 0(x + t), t 0, (1.1.5) l 0 (x) vilket kan uttryckas som l x (t) = l 0(x + t), t 0. (1.1.6) l 0 (x) Denna relation visar, eftersom x och t var helt godtyckligt valda, på det viktiga sambandet att överlevelsefunktionen för en x-årig individ kan uttryckas med hjälp av överlevelsefunktionen för en nyfödd individ. Det är då naturligt att förenkla beteckningarna, det vill säga beteckningarna T 0, F 0(t), f 0(t) och l 0(t) skrivs som T, F (t), f(t) och l(t) vilket är konsistent med den inledande denitionen av en individs livslängd. Vi skall utveckla resonemanget kring T x ytterligare. Dödlighetsintensiteten µ x kan, för en godtycklig ålder x, på ett naturligt sätt uttryckas med hjälp av överlevelsefunktionen l(x).

7 Modeller för livslängd och dödlighet 7 Om vi använder oss av (0.1.3) och att l (t) = d(1 F (t)) dt = f(t) (1.1.7) får vi att µ x = l (x) l(x) = d(ln l(x)) dx (1.1.8) vilket också, med användande av att l(0) = 1, kan skrivas som l(x) = e x 0 µ sds. (1.1.9) Vad vi egentligen gör är att integrera i (0.1.8) från 0 till x, vilket ger att ln[l(x)] ln[l(0)] = x µ 0 sds. Eftersom nu l(0) = 1 så är ln[l(0)] = 0 och därmed erhåller vi (0.1.9). Denna relation kan nu användas på följande sätt. Med hjälp av (0.1.4) kan vi skriva P (T x t) = 1 l(x + t)/l(x), t 0 (1.1.10) och genom att använda (0.1.9) får vi x+t P (T x > t) = l(x + t)/l(x) = e µ s ds x, t 0. (1.1.11) En alternativ formulering, som i vissa situationer också behövs, är x+t P (T x t) = 1 e µ s ds x, t 0. (1.1.12) Per denition är dödlighetsintensiteten µ x 0, x 0, och för individer i en population, som är vårt intresseområde, konvergerar den inte mot noll då x.

8 8 Modeller för livslängd och dödlighet Detta innebär att integralen av µ x över intervallet 0 x < är divergent vilket medför att P (T x > t) 0 då t, vilket kan tolkas som att en individ, vars livslängd kan beskrivas med denna typ av livslängdsfördelning, inte med positiv sannolikhet kan ha evigt liv. Man använder ibland livslängdsmodeller där man lägger in en högsta möjlig ålder w, det vill säga att P (T > w) = 0. Det kan ge en del speciella egenskaper åt modellen. En ytterligare koppling mellan F x och µ x som kan vara praktisk att notera är att eftersom F x (t) = P (T x t) = P (T x + t T > x) = F (x + t) F (x) 1 F (x) (1.1.13) får vi P (T x t) lim = µ x. (1.1.14) t 0 t Vi skall avsluta detta avsnitt med ett viktigt begrepp, som bygger på (0.1.14), nämligen den ettåriga dödsrisken vilket föranleder oss att göra följande denition. Denition Den ettåriga dödsrisken q x för åldern x deni-eras som q x = P (T x 1).

9 Modeller för livslängd och dödlighet 9 Ur denitionen för q x följer att man kan skriva q x = 1 l(x + 1) l(x) (1.1.15) samt x+1 q x = 1 e x x+1 µ s ds µ s ds (1.1.16) x där vi serieutvecklat exponentialfunktionen och bara tagit med en term. Det är en rimligt bra approximation då µ är litet. Det innebär att för höga åldrar är inte approximationen att rekommendera. 1.2 Approximativt samband mellan q x och µ x Man kan ibland hamna i situationer där man behöver nyttja den relationen som nns mellan µ och q. Exempelvis kan det handla om att vi, vilket vi återkommer till nedan, behöver skatta den ena av µ eller q genom användande av den andra. Det nns ett nära samband mellan dessa storheter som kan vara bra att använda sig av. Vi skall i detta avsnitt hålla oss till ett enskilt observationsår, vilket vi för enkelhets skull ej anger i notationen. Betrakta en individ som är x, x 0, år gammal och låt T x vara individens återstående livslängd. Fördelningsfunktionen för T x anges som F Tx. Vidare denierar vi överlevelsefunktionen l x genom sambandet l x (t) = 1 F Tx (t), t 0. Man kan konstatera att l x(t) = = l 0(x + t)/l 0(x). För att förenkla beteckningarna sätter vi l 0 = l. Om vi nu antar att T x är kontinuerlig, vilket inte på något vis innebär någon inskränkning då man betraktar livslängder hos individer, kan man deniera dödlighetsintensiteten µ x som µ x = f(x)/(1 F (x)) där f(x) = F (x). Låt oss återigen betrakta denitionen, se Denition 0.1.5, av den ettåriga dödsrisken q x, q x = P (T x 1) = 1 P (T x > 1). (1.2.1) När man skall studera relationer mellan q och µ kan man med fördel nyttja det faktum att

10 10 Modeller för livslängd och dödlighet l(x) = e x 0 µ sds (1.2.2) kombinerat med sambandet mellan den ettåriga dödssannolikheten för en x-årig individ, q x = P (T x 1), och µ x vilket kan skrivas x+1 q x = 1 e µ sds x. (1.2.3) Låt oss nu anta att µ s är konstant på intervallet (x, x+1) och för att uppnå bästa möjliga approximation sätter vi då µ s = µ x Det innebär att vi från (0.2.3) får x+1 ln(1 q x ) = µ s ds µ x+ 1. (1.2.4) 2 x Om vi nu antar att q x är litet, vilket gäller i alla normala fall utom i riktigt höga åldrar, kan vi MacLaurinutveckla ln(1 q x ) runt x = 0 vilket ger ln(1 q x ) 0 q x q2 x 2 = q x(1 + qx ). (1.2.5) 2

11 Modeller för livslängd och dödlighet 11 Genom att förlänga högra ledet i (0.2.5) med (1 qx ) får vi 2 ln(1 q x) 0 q x q2 x 2 = (1 q 2 x qx 1 qx 2 4 ) qx 1 qx 2. (1.2.6) Vi har därmed etablerat relationen µ x+ 1 qx. (1.2.7) 2 1 qx 2 Man kan skriva om denna approximativa likhet som q x µ x µ. (1.2.8) x Approximationerna i (0.2.7) och (0.2.8) kan förbättras genom att i MacLaurinutvecklingen ta med termer av högre ordning. 1.3 Livslängdsfördelningens egenskaper Som normalt när man denierar och arbetar med olika stokastiska variabler har man ofta ett behov av att kunna räkna ut respektive fördelningars olika moment. Vi skall i detta avsnitt härleda uttrycken för första och andra ordningens moment. Vi börjar med att sammanfatta en del karakteristika. Den stokastiska variabeln T representerar livslängden hos en individ. T är kontinu-erlig och har en fördelningsfunktion, benämnd F, med tillhörande täthetsfunktion f. Speciellt gäller att t P (T t) = F (t) = f(s) ds. (1.3.1) 0 Vidare gäller att F (0) = 1 l(0) = 0 (1.3.2)

12 12 Modeller för livslängd och dödlighet och lim F (t) = 1 lim l(t) = 1. (1.3.3) t t Täthetsfunktionen f kan, se (0.1.7), uttryckas med hjälp av överlevelsefunktionen på följande sätt l (t) = d (1 F (t)) = f(t). (1.3.4) dt Eftersom T är en kontinuerlig stokastisk variabel så följer att även den stokastiska variabeln T x är kontinuerlig, vilket inses genom följande resonemang P (T x t) = F (x + t) F (x) 1 F (x) = = [s x = u] = 1 1 F (x) 1 1 F (x) x+t x t 0 f(s) ds = f(x + u) du. (1.3.5) Härav följer att T x är kontinuerlig med täthetsfunktionen f x (t) = f(x + t) 1 F (x) = l (x + t) l(x + t) = µ x+t, t 0. (1.3.6) l(x) l(x) Nästa steg blir att beräkna första och eventuellt andra ordningens moment för en livslängdsfördelning. Vi kommer i detta avsnitt att göra det i generella termer eftersom vi ännu inte har angivit något analytisk form för livslängdsfördelningen. För att göra det på enklaste sättet skall vi utnyttja att livslängden aldrig är negativ, det vill säga vi har att göra med en icke-negativ stokastisk variabel. Att beräkna väntevärdet i fördelningar med den egenskapen görs enkelt med hjälp av följande (välkända) teorem Teorem Låt X vara en stokastisk variabel som bara kan anta icke-negativa värden och har fördelningsfunktionen F (x). Då är E(X) = [1 F (x)] dx. 0

13 Modeller för livslängd och dödlighet 13 Det är nu dags att göra nedanstående denition Denition Låt T x vara den återstående livslängden för en godtycklig individ med åldern x. Med förväntad återstående livslängd för T x menar vi e x = E(T x). Även om vi i det här läget inte har angivit någon livslängdsfördelning kan vi göra vissa beräkningar. Genom att använda Teorem kan vi skriva e x = 0 (1 F x (t)) dt = 0 l(x + t) l(x) dt. (1.3.7) Speciellt gäller, med x = 0, E(T 0) = l(t) dt (1.3.8) 0 vilket alltså är lika med förväntad återstående livslängd för en nyfödd individ. Man kan naturligtvis beräkna e x direkt genom att använda denitionen för väntevärde. Man får då e x = t l (x + t) l(x + t) dt = t µ x+t dt = l(x) l(x) 0 0 ( = 1 ) [t l(x + t)] t= t=0 l(x) l(x + s) ds. (1.3.9) 0 Första termen i högra ledet är lika med noll och kvar är då enbart den andra termen vilken kan skrivas som högerledet i (0.3.7). För att komma fram till resultatet så har vi använt partiell integration. Förutsättningen för att det skall vara möjligt är att t l(x + t) skall existera då t. Vi går inte djupare in på det här utan antar att vi har att göra med livslängdsfördelningar som uppfyller den egenskapen. Nästa steg är att sätta upp ett uttryck för variansen för livslängdsfördelningen. Vi behöver därför räkna ut andramomentet i fördel-ningen, det vill säga

14 14 Modeller för livslängd och dödlighet E(T 2 x ) = 0 t 2 l(x + t) l(x) µ x+t dt = 2 0 t l(x + t) l(x) dt. (1.3.10) Denna integral låter sig inte vidareutvecklas på ett praktiskt sätt utan vi får nöja oss med denna formulering. Dock kan vi teckna ned variansen för T x, det vill säga σ 2 (T x ), som kan skrivas som σ 2 (T x ) = 2 0 t l(x + t) l(x) dt e 2 x. (1.3.11) Beträande typvärde och andra karakteristika för en livslängdsfördelning avvaktar vi till dess vi har valt en specik livslängdsfördelning att studera. 1.4 Parametriska livslängdsmodeller För att komma vidare från det generella resonemanget i föregående avsnitt krävs en konkretisering av livslängdsfördelningen. Vi skall göra det genom att betrakta ett antal exempel på livslängdsfördelningar och studera deras egenskaper. Vi börjar med följande enkla modell. Exempel Den enklaste livslängdsmodellen är modellen med konstant dödlighetsintensitet, det vill säga µ x = c, x 0. (1.4.1) där c är en positiv parameter. Genom att tillämpa resultaten i ovanstående avsnitt i detta kapitel får vi l(x) = e x 0 µsds = e cx. (1.4.2) En följd av detta samband är att

15 Modeller för livslängd och dödlighet 15 l(x + t) l(x) x+t = e µ s ds x = e ct. (1.4.3)

16 16 Modeller för livslängd och dödlighet Täthetsfunktionen för T x ges av f x (t) = l(x + t) l(x) µ x+t = c e ct (1.4.4) och den förväntade återstående medellivslängden e x är lika med c 1. Detta exempel är alltså, vilket man egentligen ser direkt av formen på dödlighetsintensiteten, en exponentiell livslängdsfördelning. Fördelningen är välbekant inom teorin för livslängdsmodeller, till exempel för maskindelar utan förslitning, dock föga användbar inom livförsäkring. I nästa exempel beskriver vi situationen med en tänkt ändlig hög-sta levnadsålder. Modellen föreslogs för första gången av demoivre redan Av naturliga skäl används modellen mycket lite inom livförsäkring nuförtiden men har ett visst pedagogiskt intresse. Problemet ligger egentligen inte i att anta en högsta tillåten levnads-ålder, förutsatt att den sätts tillräckligt hög, utan problemet i detta exempel är valet av dödlighetsintensitet. Exempel Vi betraktar en livslängdsfördelning med en högsta tillåten levnadsålder w och en dödlighetsintensitet som ges av µ x = 1, 0 x < ω. (1.4.5) w x Genom att återigen tillämpa denitionen av l(x), se Denition 0.1.4, får vi x x l(x) = e µ s ds 1 0 = e 0 w s ds = e [ln(w s)]s=x s=0 = = e ln(w x) ln(w 0) = e ln(1 x/w) = = 1 x, 0 x < w. (1.4.6) w Observera att l(x) är lika med noll utanför intervallet 0 x < w. En följd av (0.4.6) är att

17 Modeller för livslängd och dödlighet 17 l(x + t) l(x) = 1 t w x. (1.4.7) Täthetsfunktionen för T x ges alltså av f x (t) = l(x + t) l(x) µ x+t = 1 w x (1.4.8) som ej beror av t. Fördelningen för T x är då likformig på [0, ω x] och därför är den återstående medellivslängden e x = (w x)/2. Observera att man lätt kan formulera täthetsfunktionen för den totala livslängden, T 0, som f(t) = 1, 0 t < ω. (1.4.9) w Då gäller naturligtvis, i linje med konstaterandet ovan om T x, att livslängden, T 0, är likformigt fördelad på intervallet [0, ω].

18 18 Modeller för livslängd och dödlighet Även detta exempel har en begränsat användning inom livförsäkring, för att inte säga att det direkt saknar betydelse inom modern livförsäk-ring. Listan på exempel som man kan studera kan göras lång. Vi skall emellertid övergå till att särskilt studera den modell som har kommit att bli den mest använda modellen inom svensk livförsäkring. I själva verket är den så betydelsefull att vi ger den ett eget avsnitt, det är den modell som bygger på den livslängdsfördelning som kallas Makehams fördelning. William Makeham var en engelsk aktuarie som levde Makehams fördelning Det här avsnittet har vi vikt för den livslängdsmodell som nästan uteslutande används i Skandinavien och i synnerhet i Sverige för utjämning av observerad dödlighet. Låt vara att man i vissa situationer kombinerar denna modell med andra modeller för att till exempel få en bättre överensstämmelse i höga åldrar. Man kan naturligtvis fråga sig varför modellen används i Skandinavien med så stor framgång och nästan inte alls i övriga delar i världen. Oavsett överväganden vid valet av modell i andra länder kan man konstatera att överensstämmelsen mellan modellen och observerade data, i till exempel Sverige, är förvånansvärt god. Det är illustrerat i Figur 2 och Figur 3. Figur 1.2: Jämförelse mellan observerad och skattad dödlighet, män, år. Källa: FTN. Figur 2 beskriver dödligheten hos män, år, där överensstämmelsen mellan observerade data och skattad dödlighet kan observeras. Vad som inte framgå

19 Modeller för livslängd och dödlighet 19 av guren är att vid högre åldrar än 70 år minskar överensstämmelsen och det föranleder ofta att man överger Makehams formel för höga åldrar.

20 20 Modeller för livslängd och dödlighet Figur 3 visar, och vi har här valt dödligheten hos kvinnor, år, avvikelsen mellan observerade data och modellen. Avvikelsen illustrerar, som nämnts ovan, att man inte helt okritiskt kan använda Makehams modell för alla åldrar då man vill estimera dödligheten. Mer om metoder att hantera dessa avvikelser senare. Figur 1.3: Jämförelse mellan observerad och skattad dödlighet, kvinnor, år. Källa: FTN. Ytterligare information om jämförande studier av detta slag nns att läsa om i skrifter från Försäkringstekniska Forskningsnämnden, se till exempel [?]. Livslängdsfördelningen presenterades för första gången av Makeham Ett specialfall ges av den livslängdsfördelning som Gompertz föreslog 1825, en variant på Makehams förslag som saknar konstantterm. Konstanttermens berättigande rönte mycket uppmärksamhet i mitten av det nittonde århundradet. Stundtals lär det ha varit en mycket animerad diskussion mellan dessa två herrar om lämpligheten att införa en konstantterm i dödlighetsintensiteten. Idag kan vi konstatera att konstanttermen närvaro i modellen är berättigad. Man kan naturligtvis tänka sig att bevekelsegrunderna för konstanttermens vara eller inte vara säkert var annorlunda för drygt 150 år sedan än vad de är idag.

21 Modeller för livslängd och dödlighet 21 Figur 1.4: Benjamin Gompertz. Låt oss som ett minne av svunna tider beundra en bild av Benjamin Gompertz, , Figur 4, publicerad i samband med en artikel om Gompertz omfattande vetenskapliga arbete, ur Journal of the Institute of Actuaries, (1965), vol 91, pp En reektion är att då Makeham publicerade sitt arbete, bland annat inkluderande konstanttermen, var Gompertz 81 år gammal men uppenbarligen närvarande i vetenskapen. (Det verkar inte nnas någon i litteraturen publicerad bild på William Makeham.) Modellen i fråga bygger på tre parametrar, α, β och γ. Vi antar att α + β > 0, β > 0 samt att γ 0. Observera att om α = 0 får vi Gompertz modell som ett specialfall och om vi sätter β = 0 får vi specialfallet med konstant dödlighetsintensitet, jämför Exempel Livslängdsmodellen denieras genom följande antagande om utseendet på dödlighetsintensiteten µ x = α + βe γx, x 0. (1.5.1) Observera att för x = 0 får vi µ 0 parametrarna är positiva. = α + β > 0 i den händelse minst en av

22 22 Modeller för livslängd och dödlighet Genom att tillämpa resultaten i ovanstående avsnitt i detta kapitel får vi ln(l(x)) = x 0 µ sds = αx + β γ (eγx 1), x 0. (1.5.2) Eftersom Makehams fördelning är så viktig i tillämpningarna fram-över skall vi härleda en del egenskaper för fördelningen. Vi kan relativt enkelt beräkna fördelningsfunktionen genom att vidareutveckla uttrycket för l(x) ovan. Vi får att F (x) = 1 e αx β γ (eγx 1), x 0. (1.5.3) Täthetsfunktionen kan då skrivas f(x) = (α + βe γx ) e αx β γ (eγx 1), x 0. (1.5.4) Man kan också uttrycka Makehamfördelningens kvantilfunktion i en sluten form med hjälp av Lamberts W-funktion, se [?]. I och med att fördelningen är känd kan vi beräkna dess väntevärde, det vill säga vi kan beräkna medellivslängden. Inga moment kan emellertid uttryckas med enkla formler utan vi får nöja oss med relativt komplicerade uttryck. Vi sätter upp följande integral e 0 = 0 (1 F (x)) dx = 0 e αx β γ (eγx 1) dx =... = ( ) = 1 α/γ β γ eβ/γ e t t α γ 1 dt = γ β/γ ( ) = 1 α/γ ( ) β α γ eβ/γ Γ γ γ, β. (1.5.5) γ Funktionen Γ är den så kallade ofullständiga gammafunktionen och kräver numeriska metoder för att lösa. Dock kan vi, för α = 0, skriva e 0 = 1 γ eβ/γ β/γ e t t dt (1.5.6)

23 Modeller för livslängd och dödlighet 23 vilket alltså är den förväntade livslängden för en individ enligt Gompertz fördelning. Vi kan, i detta fall med α = 0, även ge en annan representation av e 0. Med hjälp av Eulers konstant C 2 kan nämligen (0.5.6) skrivas som e 0 = 1 γ eβ/γ [ C ln(β/γ) k=1 ] ( β/γ) k. (1.5.7) k k! Utöver e 0 så är det naturligtvis intressant att räkna ut e x. Med hjälp av (0.3.7) och (0.5.3) kan vi skriva e x = 0 l(x + t) l(x) dt = e α(x+t) β γ (eγ(x+t) 1) 0 e αx β γ (eγx 1) dt. (1.5.8) Efter vissa förenklingar får vi e x = e αt e β γ eγx (e γt 1) dt. (1.5.9) 0 Vidare analys av (0.5.9) kräver numerisk integration. Genom att sätta såväl α = 0 som x = 0 kan man emellertid uppnå överensstämmelse med (0.5.6) vilket i och för sig inte är uppenbart men genom vissa omskrivningar är det möjligt. Särskilt när det handlar om livslängdsteori nöjer man sig sällan med enbart väntevärdet i fördelningen. Eftersom F är kontinuerlig existerar medianen m entydigt och denieras av F (m) = 0, 5 (1.5.10) vilket innebär att medianen uppfyller relationen αm + β γ (eγm 1) = ln(2). (1.5.11) Speciellt får vi, med α = 0, 2 Eulers konstant denieras genom C = lim n [ n k=1 1 k ln(n)]

24 24 Modeller för livslängd och dödlighet m = 1 γ ln [ γ β ln(2) + 1 ]. (1.5.12) Typvärdet x i fördelningen (med generellt α) kan också räknas ut tämligen enkelt genom att bestämma maximum för täthetsfunktionen. Det görs genom att derivera täthetsfunktionen, se (0.5.4), och därefter sätta derivatan lika med noll vilket medför att vi kan vi lösa ut typvärdet. Vi får ekvationen t 2 γ 2α β t + α2 β 2 = 0 (1.5.13) där t = e γx. Ekvationen har rötterna t = γ 2α 2β γ(γ 4α) ±. (1.5.14) 2β Återigen kan vi sätta α = 0 och vi får då att e γx = γ/β, vilket ger att typvärdet x ges av x = 1 γ ln(γ/β). Nästa steg är att beräkna variansen i fördelningen. Eftersom σ(x) 2 = E(X 2 ) (E(X)) 2 behöver vi beräkna andramomentet i fördelningen och speciellt har vi E(X 2 ) = x 2 (α + βe γx ) e αx β γ (eγx 1) dx = 0 = 2 x e αx β γ (eγx 1) dx. (1.5.15) 0 Denna ekvation låter sig inte, på något njutbart sätt, bearbetas vidare och vi hänvisar därför vidare bearbetning till numeriska metoder. Vi skall avsluta den teoretiska analysen av fördelningen genom att slutligen diskutera den karakteristiska funktionen. Den denieras som φ(λ) = E(e iλx ) där i är den komplexa enheten och λ argumentet i den karakteristiska funktionen. Observera att den karakteristiska funktionen alltid existerar. Vi kan då göra följande beräkning

25 Modeller för livslängd och dödlighet 25 φ(λ) = = = e iλx (α + β e γx ) e αx β γ (eγx 1) dx = (α + β e γx ) e x(α iλ) β γ (eγx 1) dx = (α iλ + β e γx ) e x(α iλ) β γ (eγx 1) dx iλ e x(α iλ) β γ (eγx 1) dx = = 1 + iλ e β/γ e x(α iλ) β γ (eγx 1) dx = =... = 1 + iλ γ eβ/γ ( β γ 0 ) α iλ γ ( ) Γ α iλ, β. (1.5.16) γ γ Den karakteristiska funktionen kan användas till att bestämma noll-punktsmomenten men den typen av analytiska kalkyler är inte att rekommendera på grund av komplexiteten i funktionen. Vi avstår därför från vidare analyser av detta slag. 1.6 Tillämpningar av Makehams fördelning i Sverige Makehams modell är som nämnts ovan den modell som vi huvudsakligen använder i våra vidare analyser av livslängder inom försäkringsbranschen i Sverige. Vi skall därför i detta avsnitt diskutera olika tillämpningar. Den långsiktiga förändringen av dödligheten avspeglas i de skattade parametrarna i livslängdsmodellerna. Man har namngett olika parameteruppsättningar och exempel på det är L37, L55, G64 och M90. I den här boken har vi valt att ge exempel dels på den så kallade M90-modellen och dels den så kallade M12- modellen. Vi skall ge en översiktlig förklaring till de två modellerna som används i boken. Ett syfte med valet av dessa modeller är att försöka vara så pass konkurrensmässigt neutrala som möjligt i numeriska illustrationer.

26 26 Modeller för livslängd och dödlighet man kvinna Dödlighetsintensitet Ålder Figur 1.5: Dödlighetsintensiteten µ x enligt M90. M90 enligt Premiepensionsmyndigheten De tabeller som här i boken går under benämningen M90 utgår från det regelverk som är skapat för att prissätta försäkringar, på den tiden så kallade premiegrunder. Modellen är en Makehammodell och gör åtskillnad på kön. De är inte anpassade för en särskild försäkringspopulation utan är avsedd att i någon mening vara neutral för befolkningen. Parameterantagandena i M90 bygger på dödlighetsobservationer fram till slutet av 1980-talet. Tabellerna är framräknade med en traditionell ränta, 3 %, och ränteintensiteten är belastad med 0, 003. Även om modellen benämns M90 så är det tänkt att den skall fånga Premiepensionsmyndighetens behov fram till början av 2000-talet. Observera att vi i den här boken har avstått från att i M90-tabellerna införa den linearisering som Premiepensionsmyndigheten har infört för åldrar från och med 97 år. M12 enligt Pensionsmyndigheten Det har gått i stort sett tio år mellan den första och den andra upplagan av denna bok. På den tiden har Premiepensionsmyndigheten hunnit byta namn till Pensionsmyndigheten. Formellt har Premiepensionsmyndigheten upphört att existera och från och med inrättades en ny myndighet att bland annat svara för Premiepensionsmyndighetens gamla uppgifter. Vidare innebär det tio

27 Modeller för livslängd och dödlighet 27 år av ytterligare erfarenhet avseende utveckling av populationen. Dessutom har den nansiella situationen förändrats vilket har gjort det naturligt att försäkringsbranschen har en annan syn på val av modell än tio år tidigare. Vi har därför valt att inte ersätta de gamla M90-tabellerna i boken utan istället komplettera boken med ytterligare tabeller, M12-tabeller. Dessa tabeller bygger på den livslängdsanalys som SCB har publicerat för befolkningen Dödligheten har fortsatt att förbättras och det allmänna ränteläget har sjunkit. Vidare ser Pensionsmyndigheten något annorlunda på behovet av en helhetstäckande modell för dödligheten. Det åldersintervall som är intressant är år och man har då valt att fokusera på dessa åldrar vid anpassningen av dödligheten. Orsaken är att man har behov av en bra anpassning i detta åldersintervall på grund av behovet för så kallade efterlevandepensioner. Det har fått som eekt att det är en mindre bra anpassning för låga åldrar men vilket inte har så stor påverkan på helheten. Exempelvis använder M90 parametern α = 0, 001 medan M12 använder α = 0, För högre åldrar är anpassningen av en exponentialfunktion till observerade data ej heller helt perfekt. Pensionsmyndigheten har valt att införa en linjär dödlighetsintensitet från och med 97 års ålder vilket vi också använder oss av i de så kallade M12-tabellerna, se vidare Exempel Vad gäller räntan har man valt att sätta räntan lika med 0 %, med en belastning på 0, 001 på ränteintensiteten. Det innebär negativ ränta.

28 28 Modeller för livslängd och dödlighet Sammantaget kan man säga att M12-tabellerna måste användas med viss försiktighet men spelar en viss roll vad avser förändringarna i prissättningen av försäkringsprodukter. En bra illustration till skillnaden i dödlighetsintensiteterna ses enkelt i Figur 6. Knycket, lineariseringen, i M12 vid x = 97 visar hur abrupt dödlighetsantagandet påverkas. Man måste ha klart för sig att syftet med detta är inte att beskriva försäkringsdödligheten, eller befolkningsdödligheten, på ett korrekt sätt. Syftet är att uppnå en så pass bra uppskattning av den nansiella belastningen på det försäkringsföretag, i det här fallet Pensionsmyndigheten, som nyttjar antagandet enligt M12. Figur 1.6: Jämförelse av dödlighetsintensiteter, M90 och M12. Ett annat sätt att illustrera skillnaderna i dödligheterna är genom att titta på respektive överlevelsefunktioner, se Figur 7. Den viktigaste faktorn som utgör skillnaden mellan M12 och M90 är den höga dödligheten för M12 i låga åldrar vilket trycker ner l(x) direkt i början. Översiktligt perspektiv på modeller av dödlighet Historiskt har man i Sverige haft en mycket långt gående reglering av livförsäkringsmarknaden. Under 1920-talet, vilket senare accentu-erades under 1930-talet, ck ett ertal mindre försäkringsgivare all-varliga nansiella problem. Orsaken var till stor del de ekonomiska svårigheter som hela samhället led av. Det föranledde livförsäkringsbranschen att självt aktivt bidra till en kraftig reglering av förutsätt-ningarna för att bedriva livförsäkring.

29 Modeller för livslängd och dödlighet 29 Figur 1.7: Jämförelse av överlevelsefunktioner, M90 och M12. På så sätt inleddes redan på 1930-talet en reglering av de antaganden som branschen använder sig av vid tekniska beräkningar. En eekt av detta blev att hela livföräkringsbranschen fram till 1990 använde samma dödlighetsantagande och fram till dess i princip bara konkurrerat med återbäringsräntan. I och med att man också under den senare delen av 1900-talet har luckrat upp samarbetet inom livförsäkringsbranschen i Sverige så har olika bolag, av ett ertal olika skäl, därmed anpassat sina dödlighets-antaganden i högre grad än tidigare till den population som man faktiskt arbetar med inom sin försäkringsverksamhet. Under senare delen av 1980-talet genomfördes ett arbete av den så kallade Grundkommittén, se [?], där man hade målsättningen att se över dödligheten inom svensk försäkring. Man kom fram till ett förslag som bland annat innebar reviderade dödlighetsantaganden för svensk livförsäkring. Det är dessa antaganden som generellt inom livförsäkringsbranschen går under benämningen M90 och de- nieras genom µ x = α + β 10 γ(x f), x 0, (1.6.1) där man, som vi skall gå igenom nedan i mer detalj, har valt paramet-rarna α = 0, 001, β = 0, och γ = 0, 044. Parametern f används som en åldersförskjutning mellan man och kvinna. Det framkom i det arbete som Grundkommittén gjorde att skillnaden i dödlighet mellan man och kvinna på ett praktiskt sätt kunde åskådliggöras som en för-

30 30 Modeller för livslängd och dödlighet skjutning med sex år i dödlighetsintensiteten, det vill säga f = { 0, om man 6, om kvinna. (1.6.2) Man har ibland anledningen att använda sig av ett antagande om könsneutralitet i beståndet och då kan man välja f = 3. Normalt bör man studera beståndet det handlar om och, vid behov av att ej särskilja på kön, skatta ur beståndet göra mer anpassade skattningar av parametrarna. Vidare skall vi också ge en annan representation av µ x än den given av relationen (0.6.1). Vi kommer enbart att arbeta med logaritmer med basen e istället för basen 10. Vi skriver därför om M90s dödlighetsantagande som µ x = α + β e ln(10 )γ(x f), x 0. (1.6.3) Med denna representation av µ x har vi alltså egentligen, en omskriven γ-parameter, γ = ln(10 ) 0, 044 = 0, När man anger dödlighetsantagandet som används för ett visst bestånd brukar man normera med 10 3, det vill säga man skriver 10 3 µ x = 1 + 0, 012 e 0,044 ln(10 ) (x f ), x 0. (1.6.4) I Figur 5 ges en grask representation av dödlighetsintensiteten av M90 med en linjär skala. Den övre kurvan är dödlighetsintensiteten för man och den undre kurvan dödlighetsintensiteten för kvinna. Utseendet på täthetsfunktionen nns återgivet i Figur 8, plottad för åldrarna 0 < x < 120. Täthetsfunktionen, M90, är plottad för såväl man, vänster kurva med f = 0, som kvinna, höger kurva med f = 6. För den parameteruppsättning som gäller i M90 kan man bestämma typvärdet enligt (0.5.14) och man får, för man, x = 89, 13 vilket kan läsas av i Figur 8. I fallet med α = 0 blir typvärdet lika med 89, 24. Som synes så har α en begränsad påverkan på typvärdet. Vi har också plottat fördelningsfunktionen för åldrarna 0 < x < 120 i Figur 9 där vi valt att återge den, M90, för såväl man, vänster kurva med f = 0, som kvinna, höger kurva med f = 6. Innan vi går vidare skall vi göra en observation om åldersförskjutningen f. Man kan lätt förledas att tro att överlevelsefunktionen för kvinna kan erhållas som en

31 Modeller för livslängd och dödlighet man kvinna Täthetsfunktion Ålder Figur 1.8: Täthetsfunktionen enligt M90. förskjutning med f år av överlevelsefunktionen för man givet att man har samma parameterantaganden i övrigt (som i M90). Det förhåller sig emellertid inte på det sättet vilket inses av följande. För att skilja på intensiteterna för man och kvinna, introducerar vi µ m x respektive µ k x. Den åldersförskjutning på f år som nns i M90 innebär att vi kan skriva µ m x = µ k x+f. (1.6.5) Vi kan också vilja ha den omvända relationen, det vill säga µ k x uttryckt i dödlighetsintensiteten för man. Vi får µ k x = α + β e γ(x f) = α + β e γf e γx (1.6.6) vilket inte kan skrivas på ett snyggt sätt med hjälp av dödlighetsintensiteten för man. Vad vi har visat är att µ k x kan skrivas som dödlighetsintensiteten för man, vid åldern x, med justerad β-parameter, nämligen β = β e γf, men med samma α och γ. En alternativ beskrivning ges nedan, se (0.6.10), för att utveckla överlevelsefunktionen för kvinna. För överlevelsefunktionen för man kan vi nu skriva

32 32 Modeller för livslängd och dödlighet Fördelningsfunktion man kvinna Ålder Figur 1.9: Fördelningsfunktionen enligt M90 för man. x x x+f l m (x) = e 0 µm s ds = e 0 µk s+f ds = e f µ k s ds = lk (x + f). l k (f) (1.6.7) Konsekvensen av (0.6.7) är att fördelningen för återstående livslängd för en godtycklig man inte är densamma som fördelningen för återstående livslängd för en godtycklig kvinna då man tillämpar M90. Låt oss nu fortsätta med att utveckla µ k x som en funktion av µ m x respektive l k (x) som en funktion av l m (x) genom följande resonemang. Vi börjar med att konstatera att µ m x = α + βe γx (1.6.8) samt att µ k x = α + βe γ(x f). (1.6.9) Efter en del räknande får vi

33 Modeller för livslängd och dödlighet 33 µ k x = e ( ) γf α(e γf 1) + µ m x. (1.6.10) Överlevelsefunktionen ges av (0.5.2) och vi får, för kvinna, l k (x) = e αx β γ e γf (e γx 1) (1.6.11) och ur (0.5.2) får vi, för man, l m (x) = e αx β γ (eγx 1). (1.6.12) Man kan nu uttrycka l k (x) med hjälp av l m (x) genom l k (x) = [l m (x)] e γf e αx(1 e γf ). (1.6.13) Slutligen skall vi titta på lineariseringen av µ x i M12 och se hur man bestämmer överlevelsefunktionen l(x). Exempel Vi skall bestämma överlevelsefunktionen med en lineariserad dödlighetsintensitet för åldrar från och med 97 år. För att beräkna l(x) använder vi gängse formel l(x) = e x 0 µsds. Om vi nu låter dödlighetsintensiteten ges av { α + β e γ x, x ω µ x = µ ω + k(x ω), x ω får vi, för x ω, x 0 µ sds = αx + β γ (eγx 1)

34 34 Modeller för livslängd och dödlighet och för x ω får vi x ω x µ sds = (α + βe γs )ds + µ ω + k(s ω)ds 0 0 ω vilket ger följande resultat och därmed ett uttryck för l(x) som söktes. x 0 µ s ds = αω + β γ (eγω 1) + µ ω (x ω) + k ( x2 2 ω2 ω(x ω)) = 2 = αω + β γ (eγω 1) + µ ω (x ω) + k 2 (x ω) Livslängdstabeller enligt SCB Befolkningsdödligheten är i den här boken illustrerad med utdrag ur tabeller från SCB. Deras tabeller är utgivna i en serie publikationer som heter SCB Befolkningsstatistik som ges ut årligen. Till den första upplagan av den här boken utgick vi från dödligheten Dels angav vi tabeller med dödligheten 2002 och dels återgav vi tabeller med dödligheten Femårstabellerna är motiverade eftersom för vissa åldrar underlaget i populationen är för litet för att kunna dra säkra slutsatser. Genom okulärbesiktning av SCBs livslängdstabeller från senare delen av talet kan man se att det skett förhållandevis stora förbättringar i livslängden för befolkningen. Det är motivet till att vi i den här boken bygger ut tabellerna med era års tabeller. De första tabellerna som vi har med i boken i denna upplaga är livslängdstabeller från De följer inte det moderna formatet som vi har i dagens livslängdstabeller utan vi har fått göra en del approximationer vid angivande av dödsriskerna. Se tabellbilagan för ytterligare information. SCBs tabeller från 2002 är också kompletterade med tabeller från 2012 och motsvarande femårstabeller från Dessa två årgångars tabeller följer samma format, det vill säga de är helt jämförbara. Genom att jämföra de olika årgångarna ser man tydligt hur dödligheten har minskat på tio år vilket medfört att livslängderna för olika åldrar genomgående har ökat.

35 Modeller för livslängd och dödlighet Populationer och delpopulationer När vi har denierat den sannolikhetsmodell som vi anser beskriver individers åldrande på ett nöjaktigt sätt är nästa uppgift att skatta parametrarna i modellen. Modellen, och följaktligen också skatt-ningarna av modellens parametrar, är starkt beroende av den population vi studerar.

36 36 Modeller för livslängd och dödlighet Den första frågan man måste ställa sig är som sagt vilken population man avser att studera. Det visar sig, av ganska naturliga skäl, att det föreligger stora skillnader mellan befolkningen i allmänhet och försäkrade populationer i synnerhet. Givet en population kan man vidare urskilja olika delpopulationer. Den mest uppenbara uppdelningen som man först brukar göra är uppdelning i kön, det vill säga uppdelning i män och kvinnor. Män och kvinnor har, av biologiska orsaker, skilda dödligheter vilket är viktigt att ta hänsyn till i olika analyser. Här nns emellertid en anledning till eftertanke. I ett ertal situationer är det ej tillåtet att använda kön, och ej heller andra faktorer som kan vara särskiljande på ett diskriminerande sätt, som premiebestämmande faktor. Det regleras av lagstiftningen om diskriminering via ett EU-direktiv. Däremot kan man använda det exempelvis internt i bokföringen i ett försäkringsföretag för att säkerställa att man har rätt kapital avsatt för framtida behov vid händelse av utbetalning på grund av försäkringsskada. Vidare kan delpopulationer uppstå genom att olika individer till exempel tillhör olika yrkeskategorier. Den vanligaste skiljelinjen i det avseendet är mellan arbetare och tjänstemän. I dagens samhälle kan man i och för sig konstatera att skiljelinjen mellan dessa två delpopu-lationer till har blivit mer dius men ändå kvarstår. Dessa skillnader ger till upphov att när man skattar de olika parametrarna i Makehams fördelning så antar skattningarna olika värden för olika delpopulationer. Det har förekommit att man skiljt på rökare och icke-rökare vid premiesättning av vissa produkter inom livförsäkring. Det kan motiveras av att dödligheten bland rökare i princip är dubbelt så hög som hos icke-rökare. På senare tid har andelen rökare i befolkningen sjunkit till mindre än 20 % vilket har inneburit att påverkan på premiesättningen har varit så liten att det inte har varit marknadsmässigt intressant att göra selektionen. Dessutom kan man hamna i svårigheter med att skilja på rökare och icke-rökare eftersom det nns en gråzon som är svår att kontrollera. En viktigare fråga när man skiljer på olika populationer är frågan om individens riskexponering. Den kan ta sig olika uttryck. Dels kan individen ha genetiska anlag för olika sjukdomar som gör att han eller hon löper en större risk att drabbas av antingen en sjukdom eller, i värsta fall, att avlida i förtid. Dels kan individen av egen fri vilja exponera sig för risker som påverkar levernet. Exempel på den typen av risker är om individen utövar aktiviteter som är riskfyllda, till exempel extrema fysiska aktiviteter, benner sig på platser där risken är större än vid mer normala platser aktivt, deltar i verksamhet som är farlig och så vidare. Inte oväntat undantar försäkringsföretag till exempel krigszoner från de platser som man får vistas på för att en försäkring normalt skall vara giltig. Mer frekvent upplever vi i dagens västerländska samhälle att individer frivilligt utsätter sig för risker genom osunt leverne, till exempel sämre matvanor och

37 Modeller för livslängd och dödlighet 37 mindre motion än vad som behövs för att upp-rätthålla en låg riskexponering. Å andra sidan kan man konstatera att för vissa försäkringsprodukter är ett förkortat leverne en positiv faktor. För att kunna hantera olika riskexponeringar hos individer delar vi in populationen i olika riskklasser. Beroende på vilken riskklass man tillhör justeras den biometriska risken. Om det till exempel handlar om en individ som utsätter sig för högre risk att avlida än normalt, kan den individen råka ut för att bedömas som en förhöjd dödlighetsrisk, vilket är ett exempel på en så kallad förhöjd risk. Man bör också nämna att på senare år har vetenskapen också tagit fram verktyg för att man skall kunna analysera individers medicinska belägenhet mycket noggrant. Den tekniken, genteknik som bygger på DNA-tekniken, är diskuterad inom försäkringsbranschen och används inte för att anpassa Makeham-kurvor till delpopulationer baserade på ett DNA-urval. Orsaken till diskussionerna är att det nns risk för en så kallad asymmetrisk information, det vill säga försäkringstagaren och försäkringsgivaren har inte samma information avseende den risk som skall försäkras. Studier av befolkningsdödligheten genomförs, som nämnts ovan, av Statistiska centralbyrån. Se vidare föregående avsnitt för en diskussion om vad som i denna bok nns återgivet av dessa tabeller. På uppdrag av försäkringsbranschen genomförs varje år studier av försäkringsdödligheten av den branschgemensamma nämnden Försäk-ringstekniska Forskningsnämnden (FTN). Nämnden har under lång tid följt utvecklingen och publicerar sina resultat årligen. För vidare information hänvisas till FTN. Som underlag för FTNs arbete används merparten av de svenska livbolagens erfarenheter inom detta område. 1.9 Teori för livslängdstabeller Innan vi kan beräkna skattningarna av parametrarna i Makehams formel behöver vi kunna upprätta så kallade livslängdstabeller som är ett viktigt redskap inom livförsäkring. Livslängdstabeller är också ett centralt begrepp inom demogra, befolkningslära, det vill säga läran om att nedteckna information om folk, jämför de grekiska ordstammarna demos = folk och graphein = skriver, antecknar. Som vi nämnt tidigare så var Pehr Wargentin en föregångsman i Sverige avseende arbetet med livslängdstabeller. Delar av hans arbete är återgivet i [?] och vi återger en tabell ur hans arbete i Bilaga E, Figur E.1. Tabellen beskriver den observerade dödligheten i Sverige åren Resultatet av en undersökning av såväl befolkningsdödligheten som försäkringsdödligheten brukar man sammanfatta i en livslängdstabell. Utformningen av dessa varierar mellan upphovsmän. Gemensamt för livslängdstabeller är emellertid

38 38 Modeller för livslängd och dödlighet att de kan användas till att bilda sig en uppfattning om dödsrisken, sannolikheten att överleva samt i någon mån hur länge man kan förvänta sig att leva. Intresset för dessa egenskaper ger att det är praktiskt att i en livslängdstabell bland annat ange den ettåriga dödsrisken, överlevelsefunktionen samt förväntad återstående livslängd. Alla dessa begrepp är välbekanta storheter för oss men observera att vi i en livslängdstabell normalt anger skattningar av dessa storheter. Vad gäller tabeller över befolkningsdödligheten, till exempel SCBs tabeller, är det ofta inte skattningar i normal bemärkelse eftersom de bygger på en totalundersökning. Exempel på livslängdstabell ges, som nämnts ovan, i Tabellerna E.1-E.30 som alla har befolkningen som underlag. Vidare beskriver tabellerna den så kallade perioddödligheten eftersom dödligheten är skattad ett visst kalenderår, observationsår, alternativt era kalenderår. De individer som ingår i underlaget från ett visst kalenderår är individer från olika generationer. En person som under undersökningsåret t fyller x år är född x år före observationsåret, det vill säga år t x. Det som i tabellerna betecknas med dödsrisker är de ettåriga döds-riskerna framräknade ur underlaget. Vi väljer att betrakta dem som skattningar även om de, som nämnts ovan, är framräknade på basis av hela populationen. Vi använder beteckningen ˆq t (x) där t representerar det år som livslängdstabellen avser, observationsåret, och x = 0, 1, 2..., är den ålder på individen som betraktas 3. Betrakta nu den ettåriga dödsrisken för en x-årig person född år F. Den betecknas med q(x, F ) och dess skattning är ˆq(x, F ). Vi har då sambandet ˆq t(x) = ˆq(x, t x). (1.9.1) I en livslängdstabell brukar man skatta överlevelsesannolikheterna med hjälp av de skattade ettåriga dödsriskerna ˆq x. Det kommer sig av att det nns ett naturligt samband mellan överlevelsesannolikheterna och de ettåriga dödsriskerna vilket ges av följande Teorem Betrakta en godtycklig x-årig individ med återstående livslängd T x. Då gäller att, med l(0) = 1, x 1 l(x) = l(x 1) (1 q x 1) = (1 q i), x = 1, 2,... 3 Observera att med anledningen av puckeln i dödligheten för nyfödda brukar man göra en korrigering i formeln för x = 0. Den förhöjda dödligheten innebär nämligen att man inte kan göra antagandet att dödligheten sker i genomsnitt mitt på året. Korrektionstermens storlek i tabellerna är (0, 118 0, 5)q 0 = 0, 382q 0. i=0

39 Modeller för livslängd och dödlighet 39 Beviset låter sig enklast göras med hjälp av induktion. Till att börja med ser vi att påståendet är sant för x = 1 eftersom l(1) = 1 q 0. Nästa steg är att anta att påståendet är sant för x = k, det vill säga att l(k) = k 1 (1 qi). Slutligen i=0 gäller att visa att då är påståendet också sant för x = k + 1. Men eftersom l(k + 1) = l(k)(1 q k ) så är påståendet sant för alla x. Låt oss nu övergå till förväntad återstående livslängd, e x, se Denition 0.3.1, som kan beräknas som e x = 0 l(x + t) l(x) dt. (1.9.2) Integralen kan beräknas med rimlig approximation genom att använda till exempel rektangelregeln eller trapetsregeln. Även om rektangelregeln ger något bättre noggrannhet skall vi koncentrera oss på trapetsregeln. Orsaken är att den ligger till grund för Euler-Maclaurins formel som är den som normalt används för att beräkna e x eftersom den ger bättre noggrannhet än trapetsregeln. Beskrivningen nedan förenklas i den bemärkelsen att vi utelämnar här diskussionen om resttermernas storlek. Elementära läroböcker i numerisk analys, se till exempel Björck, Dahlquist [?], innehåller oftast utförliga beskrivningar av restermsproblematiken. Trapetsregeln bygger på att man vill beräkna integralen b f(t) dt med hjälp av numeriska metoder. Vi formulerar följande teorem a Teorem Låt f(t) vara en kontinuerlig funktion denierad för alla t [a, b]. Låt vidare nh = b a representera en ekvidistant indelning, t i = a+ih, i = 0, 1, 2,..., n, av intervallet [a, b] och låt f i = f(t i ), i = 0, 1, 2,..., n, vara respektive funktionsvärden. Då gäller b a ( ) 1 n 1 f(t)dt h 2 f 0 + f i f n. i=1 Denna metod att approximera integralen b f(t)dt med kallas för tra-petsregeln. a Högerledet i den approximativa likheten i Teorem betecknar vi med ˆT (h). Observera att metoden som trapetsregeln bygger på är att summera de ytor som de linjära interpolationerna mellan de ekvidistanta x-värdena ger upphov till, det vill säga ( ) ˆT (h) = h n 1 n 1 1 (f i + f i+1 ) = h 2 2 f 0 + f i f n. (1.9.3) i=0 i=1

40 40 Modeller för livslängd och dödlighet Vi kan nu tillämpa trapetsregeln på e x och får då, med h = 1, samtidigt som vi låter n, e x [ i=0 ] l(x + i) 1, x = 1, 2,... (1.9.4) l(x) 2 Högerledet i (0.9.4) är alltså lika med ˆT (1) enligt terminologin i trapetsregeln. Observera att den övre integrationsgränsen, oändligheten, i praktiken inte skapar något problem trots att trapetsregeln, som formulerad ovan, enbart omfattar integration över ändliga intervall. Metoden att komma runt det är att trunkera integralen vid tillämpning av trapets-regeln. Genomför man trunkeringen vid ett tillräckligt stort värde i den övre integrationsgränsen blir felet godtyckligt litet eftersom integranden konvergerar mot 0. Summeringen till oändligheten kan därför ses symboliskt eftersom man i praktiken avbryter summeringen vid ett godtyckligt ändligt men stort tal, just beroende på konvergensen av l(t) mot 0 då t. Normalt brukar man emellertid inte använda trapetsregeln vid beräk-ningen av e x. Orsaken är att man med förhållandevis enkla medel kan uppnå bättre noggrannhet. Det låter sig göras genom att använda Euler-Maclaurins summationsformel. Ofta brukar Euler-Maclaurins summationsformel formuleras som att man önskar beräkna en summa där man kan göra det approximativt genom att ersätta summan med en integral istället, korrigerat med en restterm. Vi formulerar följande teorem Teorem Låt ˆT (h) vara denierad som approximation av en ändlig integral enligt trapetsregeln, se (0.9.3). Då gäller följande relation, som går under benämningen Euler-Maclaurins summationsformel, ˆT (h) = b a f(t)dt + h2 12 (f (b) f (a)) + R(h) där R(h) är en restterm som innehåller termer av fjärde ordningen av h och högre. Som nämnts ovan hänvisar vi diskussionen om resttermens storlek till allmän litteratur inom numerisk analys. Vi skall istället fokusera på att tillämpa Euler- Maclaurins summationsformel på förväntad återstående livslängd.

41 Modeller för livslängd och dödlighet 41 Vi börjar med att konstatera att, då vi vill beräkna e x, är funktionen f i Teorem given av f(t) = l(x + t)/l(x), och vi får df(t) dt = d [l(x + t)/l(x)] dt = l(x + t) µx+t. (1.9.5) l(x) Genom att välja den övre integrationsgränsen tillräcklig stor (egentligen är den ju lika med ) faller termen f (b) bort. Däremot ger termen f (a) ett tillskott eftersom a = 0. Att a = 0 är liktydigt med att t = 0 och med hjälp av (0.9.5) får vi e x [ i=0 ] l(x + i) 1 l(x) µ x, x = 0, 1, 2,... (1.9.6) där de två första termerna i högra ledet i (0.9.6) är lika med ˆT (1) enligt vad vi kom fram till ovan i (0.9.4). Genom att i formeln för l(x) i Teorem sätta in skattningarna av de ettåriga dödsriskerna och därefter i formel (0.9.6) för e x sätta in skattningarna av l(x) får vi nu skattningarna ˆl(x) och ê x för överlevelsefunktionen och den återstående medellivslängden. Vad gäller ˆl(x) återkommer vi till den skattningen senare. För e x har vi, med användande av M90, beräknat förväntad återstående livslängd med hjälp av Euler-Maclaurins summationsformel vilket återges i Tabell E.35- E.36. Dessa tabeller bygger, som synes ovan, på överlevelsefunktionerna vilka är, med M90 som grund, tabellerade i Tabell E.33-E.34. Betrakta nu en livslängdstabell för kalenderåret t. I tabellen återges antalet individer, födda år t, som avlider under sitt första levnadsår, antalet individer, födda år t 1 som avlider under sitt andra levnads-år, och så vidare. Allmänt återges antalet individer, födda år t x, som avlider under levnadsår x+1 (mellan åldern x och åldern x + 1). Livslängdstabellen kan alltså användas för att beskriva sannolikhetsfördelningen för livslängden för ktiva individer i olika åldrar. Överlevelsesannolikheten för en person som är x år gammal år t bestäms (för heltalsintervall) av de ettåriga dödsriskerna q x, q x+1, q x+2, q x+3,.... Dödsriskerna angivna i till exempel Tabell E.1 avser verkliga personer födda under åren (t x), (t x 1), (t x 2), (t x 3),.... Eftersom dödsriskernas variation efter födelseår får bedömas vara ganska långsam, bör tabellvärdena därför utgöra en god approximation till en individs verkliga överlevelsesannolikheter under de närmsta åren i takt med att individen åldras.

42 42 Modeller för livslängd och dödlighet Perioddödligheten, som vi nyss diskuterat, är väsentligt skild från den så kallade generationsdödligheten. Vi betraktar de ettåriga döds-riskerna q(x, F ) för ett xt födelseår F och x =, 0, 1, 2,... Det ger en uppfattning om den generation av individer som föddes år F. Ett vanligt begrepp i detta sammanhang är att man pratar om kohorten av de individer som är födda år F. Om man jämför dagens dödlighet med dödligheten i den population som till exempel Pehr Wargentin studerade, så kan man konstatera att det är mycket stora skillnader. Problemet med generationsdödligheten är naturligtvis att man måste vänta mycket länge innan man har kunnat avsluta analysen av en generation. På grund av de långa livslängderna för individer i dagens moderna samhälle kan det ta mer än 100 år tills den sista levande individen i en generation har avlidit. Det gör naturligtvis att det nns ett stort behov av att så tidigt som möjligt i en generations levnad prognostisera dess dödlighet. I själva verket är generationsdödlighet (annat ord är kohortdödlig-heten) just den typ av dödlighet som är mest intressant för försäkringsbranschen. Generationsdödligheten används emellertid inte speciellt frekvent inom försäkringsbranschen. En viktig orsak är att det inte nns tillförlitliga modeller att arbeta med. Man kan till exempel fråga sig vilken livslängdsfördelning man bör använda. Generationsdödlighet har i och för sig studerats på olika sätt och prognoser för generationsdödligheten produceras också till exempel av SCB. Ett tidigt arbete med att ansätta lämplig modell gjordes 1934 av Cramér och Wold, se [?]. De ansatte modellen µ(x, τ) = α τ + β τ c x τ (1.9.7) där alltså µ(x, τ) är dödlighetsintensiteten för en x-årig person född år τ. Denna modell har alltså inte använts inom livförsäkringsbranschen för att utjämna dödligheter. Man kan emellertid konstatera att under den senaste tiden (andra halvan av 1900-talet) har dödligheten sjunkit relativt snabbt och det kan därför nnas vissa fördelar med att ansätta en modell som tar hänsyn till utvecklingen mellan generationer. Samtidigt kan man konstatera att man har under det senaste århund-randet gjort löpande analyser av dödligheten som gjort att man vid vissa tillfällen justerat antagandena i modellen. Det är inte troligt att man, genom att tillämpa en generationsberoende modell, slipper denna löpande översyn av parametrarna i modellen. För närvarande överväger man i Norge att införa en generationsberoende modell. Man lutar åt att reducera dödlighetsantagandet för till exempel x-åringar i takt

43 Modeller för livslängd och dödlighet 43 med tiden. Reduktionsfaktorn kommer att variera mellan olika åldrar. Vi kommer här inte vidare att syssla med generationsdödlighet utan uppmanar läsaren till att studera annan litteratur för den frågans belysning. Det kan vara intressant att känna till att SCB bygger upp ett kohortregister med start under slutet av 1800-talet. Det registret inkluderar också dödsrisker. Vanligtvis brukar man inte vid dödlighetsanalyser arbeta med enskilda år utan brukar arbeta med femårsklasser. De är i princip vägda medelvärden av respektive ettårsklasser. Slutligen skall vi bara nämna två begrepp som brukar användas i samband med analyser som är tidsrelaterade som livslängdsanalyser. När man skall analysera generationsdödligheten brukar man, på grund av tidsrelationen, prata om longitudinella undersökningar. På motsvarande sätt brukar man, vid analys av perioddödligheten, tala om transversella undersökningar Skattningar av q x och l(x) Betrakta n x individer som alla är exakt x år gamla. Livslängderna för individerna antas också vara sinsemellan oberoende. Vi gör följande denition Denition Låt den stokastiska variabeln D(x, x+1) vara lika med antalet individer i populationen, av storlek n x, som avlider efter det att individen uppnått åldern x men före åldern (x + 1). Eftersom alla individer i populationen säkert har uppnått åldern x så representerar variabeln D(x, x + 1) antalet individer som avlider i åldersintervallet (x, x + 1). Vi utgår från att individerna i populationen är likvärdiga vad gäller sin förmåga att hålla sig vid liv, bortseende just från ålder som påverkande faktor. Vi kan då anta att sannolikheten för en godtycklig individ i åldern x att avlida är densamma som för alla andra individer i åldern x och för det närmsta året är lika med q x. Då gäller att D(x, x + 1) Bin(n x, q x ). (1.10.1) Vi skattar då, enligt välkänd teori för binomialfördelningen, q x med ˆq x = D(x, x + 1) n x. (1.10.2)

44 44 Modeller för livslängd och dödlighet Vidare gäller att E(ˆq x ) = q x (1.10.3) samt att σ 2 (ˆq x ) = q x(1 q x ) n x. (1.10.4) Man brukar också ha ett intresse av att istället för att ange en punktskattning för en parameter, q x, ibland kunna vilja ange en intervallskattning. Det låter sig enklast göras genom att utnyttja möjligheten att använda en normalapproximation av binomialfördelningen. Enligt känd teori gäller, för tillräckligt stort n x, att ˆq x = D(x, x + 1) n x asn ( q x, qx(1 qx) n x ). (1.10.5)

45 Modeller för livslängd och dödlighet 45 Ett approximativt kondensintervall för q x med kondensgraden (1 α) ges då av I qx (ˆq x ± λ 1 α/2 σ2 (ˆq x )) (1.10.6) vilket också kan skrivas som I qx ˆq x(1 ± λ 1 α/2 D(x, x + 1) ) (1.10.7) varvid vi använt relationen σ 2 (ˆq x ) = qx(1 qx) n x q x D(x, x + 1) n x n 2 x (1.10.8) som är en bra approximation för små värden på q x. Att använda normalapproximation av binomialfördelningen är inte alltid självklart. Tvärtom är det så att man i många situationer delar in observationsmaterialet i ett antal celler där man kan råka ut för att i vissa celler ha ett fåtal observationer (individer som avlidit). En naturligare ansats är då att approximera binomialfördelningen med en poissonfördelning. Vad som är att föredra varierar mellan olika situationer men det är viktigt att man använder sig av en så pass korrekt modell som möjligt för att analysera data. Ett argument för poissonfördelningen över normalfördelningen som ofta framförs, vid sidan av det faktum att en diskret approximation verkar mer naturlig, är att svanssannolikheterna i normalfördelningen är små och kanske inte speglar den ekonomiska vikt som är relevant i vissa situationer. En annan frågeställning, som är giltigt för både poissonfördelningen och normalfördelningen, är att om det i populationen ingår individer med mer än en försäkring gäller inte antagandet om oberoende mellan observationerna. Det problemet är relativt litet i normala bestånd men nns ändå. Det är viktigt att ha klart för sig att när vi anger en punktskattning för q x, för givet x, uttalar vi oss inte om annat än just den ettåriga dödsrisken för åldern x. För att kunna skatta er ettåriga dödsrisker, för andra åldrar, krävs det en population för varje ålder x med observerade avlidna för respektive ålder. På så vis kan man då uppnå en serie av skattningar för ettåriga dödsrisker q x för ett ertal åldrar.

46 46 Modeller för livslängd och dödlighet Efter att ha bestämt hur q x ska skattas ligger det nära till hands att härleda en skattning för l(x). Det låter sig lämpligen göras genom att utnyttja sambandet l(x) = x 1 (1 qi). Som man ser av detta samband så är överlevelsefunktionen i=0 l(x) en parameter av just den karaktären att vi behöver information för era åldrar än just en ålder x. Vi formulerar därför följande modell. Betrakta en population där vi har n i, i = 0, 1, 2,..., individer med åldern i år. Låt vidare D(i, i + 1) vara antalet individer i respektive ålder i som avlider före åldern i + 1 vilka antas vara oberoende av varandra. Vi skattar q i med ˆq i för i = 1, 2,..., där ˆq i = D(i, i + 1)/n i enligt ovan. Med den modellen till hands ges en naturlig skattning av l(x) av x 1 ˆl(x) = (1 ˆq i). (1.10.9) i=0 Detta är en typ av skattningar som kallas för Kaplan-Meier-skatt-ningar. Det är exempel på icke-parametriska skattningar som har stor användbarhet generellt. En lämplig referens i detta sammanhang är Kaplan, Meier [?]. Nästa steg blir att härleda några karakteristiska egenskaper för skatt-ningen. Vi börjar med att beräkna väntevärdet. Om vi använder att skattningarna ˆq i är oberoende får vi x 1 x 1 E(ˆl(x)) = E(1 ˆq i) = (1 q i) = l(x). ( ) i=0 i=0 Vi har alltså konstaterat att skattningen ˆl(x) är väntevärdesriktig. Nästa steg blir att beräkna variansen för ˆl(x) vilket inte är fullt så enkelt som att beräkna väntevärdet. Vi behöver göra ett par approximationer för att kunna bilda oss en uppfattning om variansen. Vi skall med andra ord försöka nna en approximation till σ 2 (ˆl(x)). På grund av den relativa komplexa strukturen på ˆl(x) visar det sig lämpligt att utnyttja logaritmer. Det är praktiskt eftersom logaritmen av en produkt kan skrivas som en summa av logaritmer. Vi börjar alltså med att studera ln ˆl(x) vars varians kan skrivas som x 1 σ 2 [ln ˆl(x)] = σ 2 [ln(1 ˆq i )]. ( ) i=0

47 Modeller för livslängd och dödlighet 47 Det visar sig lämpligt att använda tekniken med linearisering och vi börjar med vänstra ledet i ( ). Vi skall alltså serieutveckla ln ˆl(x) runt l(x) och tar bara med termer av första ordningen. Allmänt uttryckt så innebär lineariseringen att vi använder relationen f(t) f(a) + (t a) f (a) ( ) 1 där funktionen f = ln samt a = l(x) och t = ˆl(x) vilket insatt ger ln(ˆl(x)) ln(l(x)) + ˆl(x) l(x) 1 1 l(x). ( )

48 48 Modeller för livslängd och dödlighet Vi får då [ σ 2 (ln(ˆl(x))) σ 2 ln(l(x)) + ˆl(x) l(x) 1 ] [ˆl(x) l(x) = σ 2 l(x) ] 1 = l(x) = σ2 [ˆl(x)] l(x) 2. ( ) Vi gör nu samma linearisering för summanden i högra ledet i ( ), det vill säga ln(1 ˆq i ) ln(1 q i ) + qi ˆqi 1 q i ( ) vilket ger att [ σ 2 [ln(1 ˆq i )] σ 2 ln(1 q i ) + ] qi ˆqi = 1 q i = σ2 [q i ˆq i] (1 q i) 2 = σ2 [ˆq i] (1 q i) 2. ( ) Relationen ( ) kan nu, med hjälp av ( ) och ( ), skrivas som följande approximativa likhet σ 2 [ˆl(x)] l(x) 2 x 1 i=0 σ 2 [ˆq i ] (1 q i ) 2 ( ) som, lite omskrivet, ger x 1 σ 2 [ˆl(x)] l(x) 2 σ 2 [ˆq i ] (1 q i ). ( ) 2 i=0 Eftersom σ 2 [ˆq i] = qi(1 qi) n i ( )

49 Modeller för livslängd och dödlighet 49 får vi x 1 σ 2 [ˆl(x)] l(x) 2 q i n i (1 q i ). ( ) i=0 Vi har därmed etablerat den så kallade Greenwoods formel. Den kan, med hjälp av vetskapen att ˆl(x) är asymptotiskt normalfördelad, användas till att beräkna kondensintervall för l(x) det vill säga ˆl(x) asn ( l(x), σ 2 [ˆl(x)] ). ( ) Detta innebär att vi kan skriva x 1 I l(x) ˆl(x) ˆq i 1 ± λ1 α/2. ( ) n i (1 ˆq i ) i=0 Vi sammanfattar resultaten i detta avsnitt i följande teorem Teorem Låt en livslängdsfördelning vara given genom överlevelsefunktionen l(x), x 0. Betrakta en population där vi har n i, i = 0, 1, 2,..., individer med åldern i år. Låt vidare D(i, i + 1 ) vara antalet individer i respektive ålder i som avlider före åldern i + 1 vars livslängder antas vara oberoende av varandra. Vi skattar q i med ˆq i för i = 1, 2,.... Skatta l(x) med x 1 ˆl(x) = (1 ˆq i ) i=0 där ˆq i = D(i, i + 1) n i. Då kan variansen för skattningen av l(x) approximeras med

50 50 Modeller för livslängd och dödlighet x 1 σ 2 [ˆl(x)] l(x) 2 q i n i (1 q i ). i= Skattning av dödlighetsintensiteten µ Vi skall nu skatta dödlighetsintensiteten µ. Eftersom µ beror av x så särskiljer vi olika åldrar när vi praktiskt beräknar skattningarna även om modellen naturligtvis gäller oavsett värde på x. Det är angeläget att nämna att den teknik som vi skall återge här bygger på att vi använder Maximum Likelihoodtekniken (ML-tekniken) för att skatta µ. Eftersom vi tidigare har infört en parametriserad utjämning av µ (Makehamfunktionen) verkar det frestande att använda ML-tekniken för att skatta parametrarna µ, β samt γ. Den aktuella likelihoodfunktionen ges då av n n L(x; α, β, γ) = f(x i ) = (α + βe γx i ) e αx i β γ eγx i 1. i=1 i=1 (1.11.1) Det visar sig emellertid att maximera ML-funktionen med avseende på α, β och γ inte låter sig göras på ett enkelt sätt utan istället konstruerar vi ML-skattningen för µ varefter vi skattar parametrarna α, β och γ med den modierade minimum χ 2 -metoden. Låt oss därför etablera den teori som är nödvändig för att kunna skatta µ med hjälp av ML-metoden. Betrakta en population av n stycken oberoende individer, alla med åldern x. Betrakta vidare ett intervall (x, x + h) där h > 0. Intervallet tjänar som den observationsperiod i individernas ålder som vi betraktar. Det är vanligt att vi betraktar kalenderår och att man då gör betraktelser av populationen vid årets slut, till exempel den 31 december Att en individ då är x år gammal innebär att individen under det då gångna kalenderåret har upplevt sin x-åriga födelsedag. Vi har med andra ord trunkerat individens ålder till antalet hela år. Vi antar att dödlighetsintensiteten är konstant på observationsintervallet (x, x + h), det vill säga att µ s = µ då x < s x + h. Vi denierar följande stokastiska variabler Denition Betrakta en godtycklig individ i ur en population om n individer. Låt T i vara återstående livslängd för individ i, räknat från x till x + h, 1 = 1, 2,..., n. Deniera

51 Modeller för livslängd och dödlighet 51 R i = min(t i, h) och D i = { 1, Ti h 0, T i > h för i = 1, 2,..., n. Den stokastiska variabeln R i anger risktid i åldersintervallet (x, x + h) för individ i och den stokastiska variabeln D i räknar huruvida individ i avlider i intervallet. Man skall inte förväxla den tidigare denierade variabeln T x med T i. Variabeln T x beskriver återstående livslängd vid åldern x och är ej begränsad till åldersintervallet (x, x + h). Låt nu t i vara tid som förutit sedan början på risktidsintervallet, det vill säga då T i = 0, och låt t i vara en godtycklig tidpunkt i intervallet (0, h). Vi skall nu härleda täthetsfunktionen för individ i:s risktid i intervallet, det vill säga för T i och betraktar därför en godtycklig individ i samt ett litet intervall (t i, t i + dt) som innehålls i intervallet (0, h). Observera att, för att den händelse som vi skall beräkna sannolikheten för skall vara uppfylld, det krävs dels att individen i fråga har levt i t i år och dels att individen avlider inom t i + dt år räknat från det att individen är x år gammal. Vi har, enligt (0.1.10), att P (T i > t i) = l(x + t i)/l(x). Vi får då, genom att använda antagandet att µ är konstant i åldersintervallet (x, x + t i), samt (0.1.9), att P (T i > t i) = e µt i. Vidare är sannolikheten att individen avlider i intervallet, eftersom µ antas vara konstant, och intervallets längd är lika med dt, lika med µ dt. Sammantaget har vi då etablerat P (t i < T i < t i + dt) = P ([D i = 1] [0 < R i < dt]) = = µ dt e µt i. (1.11.2) Vänstra ledet i (0.11.2) kan uttryckas i termer av fördelningsfunktionen för T i i specialfallet med konstant µ. Om vi sedan passar på att dividera med dt får vi följande relation F x (t i + dt) F x (t i ) dt = µ e µt i. (1.11.3)

52 52 Modeller för livslängd och dödlighet Om vi nu låter dt 0 får vi F x (t i + dt) F x (t i ) f x (t i ) = lim = µ e µt i (1.11.4) dt 0 dt vilket är täthetsfunktionen för T i med konstant µ. Vidare gäller att P (T i > h) = P (D i = 0, R i = h) = e µ h. (1.11.5) Med användning av täthetsfunktionen kan vi nu formulera likelihooden för individ i. Det låter sig göras genom att vi observerar att det föreligger två tänkbara tillstånd för individens återstående livslängd, antingen avlider individen under åldersintervallet (x, x + h) eller så fortsätter individen att vara vid liv efter det att åldersintervallet är till ända.

53 Modeller för livslängd och dödlighet 53 Om individen avlider under intervallet är D i = 1 samt R i = T i vilket ger Λ i = µe µt i. (1.11.6) Om, å andra sidan, individen överlever hela åldersintervallet är D i = 0 och R i = h vilket i sin tur ger Λ i = e µh. (1.11.7) Sammantaget kan då likelihooden skrivas som Λ i = µ D i e µr i. (1.11.8) Om vi summerar risktiden för alla individer får vi den totala risktiden för den aktuella populationen, n R(x, x + h) = R i (1.11.9) i=1 och på samma sätt kan vi beräkna antalet individer i populationen som avlider i intervallet genom n D(x, x + h) = D i. ( ) i=1

54 54 Modeller för livslängd och dödlighet Man kan då skriva den sammanlagda likelihooden som n n Λ = Λ i = µ D i e µr i = µ D(x,x+h) e µr(x,x+h). i=1 i=1 ( ) Nästa steg är att söka maximum för likelihooden med avseende på µ. Det är likvärdigt med att bestämma maximum för ln(λ). För enkelhets skull inför vi D = D(x, x + h) samt R = R(x, x + h). Vi får ln(λ) = ln[µ D e µr ] = D lnµ µr. ( ) Om vi nu deriverar högerledet i ( ) med avseende på µ och om vi sätter derivatan lika med noll får vi skattningen ˆµ = D R. ( ) Skattningen ˆµ är den så kallade ML-skattningen av µ. Den skiljer sig till en del från skattningen av den ettåriga dödsrisken q x, det vill säga ˆq x. Den räknades ut genom att observera antalet individer som avled i intervallet (x, x + 1). I härledningen av ML-skattningen studerade vi istället intervallet (x, x+h). Genom att sätta h = 1 får vi skattningen av q x, jämför (0.10.2). Ytterligare en typ av skattning används i olika sammanhang och den skattningen baserar sig på ett symmetriskt intervall runt x. Vi gör följande denition

55 Modeller för livslängd och dödlighet 55 Denition Vi denierar, för den aktuella tidsperioden, den centrala dödskvoten med avseende på tidsintervallet (x h, x + h) som M(x h, x + h) = D(x h, x + h) R(x h, x + h), h > 0. Storheterna D(x h, x + h) och R(x h, x + h) är denierade analogt med D i och R i i Denition Den centrala dödskvoten är av principiell betydelse på grund av dess konstruktion och används mycket i statistisk analys av livslängder. Efter att ha etablerat en punktskattning av µ x är det naturligt att beräkna skattningens fördelning. Dessvärre är fördelningen för skattningen ˆµ av komplicerad natur och kan inte uttryckas på ett enkelt sätt. För studium av fördelningen hänvisas till Beyer, Keiding och Simonsen [?]. De statistiska egenskaperna för skattningen ˆµ, angiven i ( ), är som förväntat godartade. Asymptotiskt är skattningen normalfördelad med väntevärdet µ och variansen σ 2, det vill säga vi har att n(ˆµ µ) asn(0, σ 2 ) ( ) där σ 2 = [ E ( 2 lnλ i µ 2 )] 1 = µ2 E(D i ) = µ 2 1 e µh ( ) och vi har utnyttjat att D i är binomialfördelad med parametrarna n = 1 och p = 1 exp( µh). Man kan förhållandevis lätt räkna ut de förväntade värdena av de stokastiska variablerna D i och R i. Det gäller att E(D i) = P (T i < h) = h 0 l(x + s) l(x) µ x+s ds = x+h x l(s) µs ds l(x) ( ) samt att

56 56 Modeller för livslängd och dödlighet E(R i) = h 0 s l(x + s) l(x) µ x+s ds + l(x + h) l(x) h. ( ) Detta uttryck kan, via partiell integration, skrivas om till E(R i) = h 0 l(x + s) l(x) ds = x+h x l(s) ds. ( ) l(x) Nästa steg i resonemanget är att eftersom vi, på grund av att intervallet (x, x+h) får anses vara rimligt litet, har antagit att dödlighetsintensiteten µ är konstant på intervallet. Då följer, med hjälp av ( ) och ( ), att E(D i) = µ xe(r i), ( ) vilket, genom att summera över hela populationen om n stycken x-åriga individer, ger E(D) = µ x E(R). ( ) Under antagandet att µ är konstant över de betraktade (små) intervallen är vidare den centrala dödskvoten M(x h, x + h) en konsistent skattning av µ x. Vi vet, som vi påpekat tidigare, att ˆµ x är ML-skattningen av µ x. Det följer då, under allmänna villkor, att M är approximativt normalfördelad då n är tillräckligt stort. Man kan då, återigen, skapa ett approximativt kondensintervall för µ x, där vi nedan visat hur det kan formuleras för den centrala dödskvoten, genom I µx M(x h, x + h) (1 ± λ 1 α/2 / D(x h, x + h) ) ( ) med kondensgraden 1 α, jämför ( ). Det nns en del viktiga kommentarer som till viss del påverkar hur vi tillämpar teorin om skattningar av dödligheten och relaterade parametrar. För det första är det viktigt att nämna att vi så här långt arbetat med individer och indirekt har vi då tänkt oss att det är individerna som försäkras. Det är

57 Modeller för livslängd och dödlighet 57 förvisso sant men normalt innehåller försäkringsföretagens register information om försäkringar i första hand. Eftersom många individer har mer än en försäkring så innebär det ett visst hänsynstagande vid analysen. Om man väljer att studera försäkrade/försäkringar betraktar vi den så kallade antalsdödligheten. Om man analyserar beståndet med försäkringsbeloppen som bas är det mer en fråga om den så kallade ekonomiska dödligheten. Den syftar mer till att analysera den ekonomiska påverkan som en försäkrings-händelse har för bolaget. Vi kommer senare att studera ett begrepp som är mer lämpligt att studera för detta ändamål, den så kallade risksumman. Slutligen är det på sin plats att påpeka att om man har antalet försäkringar, och ej försäkrade, som bas för analysen, så föreligger inte ett fullständigt oberoende mellan observationerna. Emellertid brukar man trots detta anta att observationerna kommer från oberoende stokastiska variabler Lexisdiagram Man kan då och då läsa uttalanden som Medellivslängden för kvinnor är idag 82,11 år samtidigt som männens medellivslängd är 77,73 år, Den senaste femårsperioden har... och så vidare. Efter att ha funderat ett tag inser man att vad som menas med medellivslängden är inte självklart utan kräver en precis denition. Vikten av en precis denition inses när man betänker att olika gene-rationers livslängder förändras med tiden. En nyfödd människa idag kan förvänta sig att leva mycket längre än en nyfödd människa på, till exempel, 1700-talet. Det kan man se genom att studera Figur E.1 som beskriver den tidens erfarenhet avseende livslängden i Sverige och jämföra med dagens livslängdstabeller från SCB. Det här avsnittet kommer att beskriva tekniken med att skapa livslängdstabeller för en population och med en sådan i handen kan man veriera uttalanden citerade i inledningen av detta avsnitt. Vi nöjer oss här med att konstatera att man brukar, med uttalande som ovan, mena den förväntade återstående livslängden för en nyfödd individ. Detta uttalande kan verieras genom att i Tabell E.7 konstatera att förväntad återstående livslängd för just en manlig 0-åring är 77,73 år. Motsvarande värde för kvinna är enligt Tabell E.10 82,11 år. Vi skall i det här avsnittet angripa frågan att, med den i tidigare av-snitt härledda skattningsteorin, i praktiken skapa en dödlighetstabell. Vi skall använda Tabellerna E.7-9 som illustrationer. Att vi väljer livslängdstabellerna 2002 och inte 1968 beror på att vi för 1968 dels har använt en approximativ ansats för när på året individer fyller år i förhållande till när de avlider och dels att vi inte har 5-årstabeller för Innan vi går in på hur man går till väga skall vi först beskriva en grask metod för illustration av livslängder.

58 58 Modeller för livslängd och dödlighet I mitten av 1800-talet växte det bland demografer fram ett behov av att kunna presentera dynamiken i olika populationer graskt. För demografer nns det väsentligen tre variabler som är särskilt betydelsefulla; födelsetidpunkt, ålder samt aktuell tidpunkt. Dessa tre variabler skall, i en tvådimensionell gur, kunna återges samtidigt.

59 Modeller för livslängd och dödlighet 59 Det fanns era förslag till hur detta skulle lösas av forskare som alla hade olika bevekelsegrunder för sina förslag. Det kanske mest vägvinnande förslaget producerades av Zeuner (1869), modierat något av Wilhelm Lexis i slutet på 1870-talet. Lexis kom att publicera en uppsats i frågan, se Lexis [?], som förmodligen kom att bli det avgörande dokumentet. Sedan dess används den teknik som Lexis propagerade för och den typen av diagram har kommit att kallas för Lexisdiagram. Ett Lexisdiagram är ett två-dimensionellt koordinatsystem, där man på x-axeln avsätter kalendertid och på y-axeln avsätter aktuell ålder. Varje individ, som ingår i den population som observeras, beskrivs med hjälp av en rät linje, en så kallad livslinje, i diagrammet med lutningen 45 relativt x-axeln. Startpunkt respektive slutpunkt på livslinjen beror på när individen i fråga träder in respektive träder ut ur populationen. Koordinaterna som anger livslinjens position är dels inträdespunkten, som representeras av (kalendertid, ålder), samt utträdespunkten, som representeras av (kalendertid, ålder). Inträdet i populationen kan ske antingen genom att man, vid en ålder större än noll, väljes ut för att ingå i populationen, själv väljer att inträda i populationen eller genom att man föds in i populationen. Man kan lämna populationen på grund av dödsfall eller annan anledning. Observationsperioden är kalenderåret t, som också är angivet i dia-grammet. Att en individ avlider anges med en punkt i änden av livslinjen. Att en individ fyller år kan man se av att livslinjen passerar en vågrät linje som markerar åldern i hela år hos individen i fråga. För att illustrera olika exempel på livslinjer, individer som ingår i populationen, ger vi ett exempel på ett Lexisdiagram, Figur 2.7. Individ A: Individen inträder i populationen den 1.1 kalenderår F + 1, vid en ålder av 2 år. Individen är med andra ord född år F-2. Individen avlider under observationsperioden och, som syns av den streckade linjen, sker dödsfallet före individens födelsedag under kalenderåret. Individen är x + 1 = t F + 2 år vid dödsfallet.

60 60 Modeller för livslängd och dödlighet Individ B: Individen har tillhört populationen sedan födseln år F men lämnar populationen under observationsperioden av annan orsak än dödsfall. Vid utträdet ur populationen har individen uppnått åldern x = t F år. Individ C: Individen föds in i populationen den 1.1 år F + 1 och avlider under observationsperioden i en ålder av x 1 år efter det att individen har fyllt år under observationsåret. Individen har uppnått åldern x 1 = t F 1 år vid dödsfallet. Individ D: Individen är född år F + 3 och har ingått i populationen sedan dess. Under observationsperioden, det vill säga kalenderår t, ingår individen hela tiden i populationen och lever vidare efter det att observationsperioden är avslutad. Efter att ha bekantat oss med ett graskt verktyg att åskådliggöra olika individers livslinjer, och därmed deras tillhörighet till en given population under en viss observationsperiod, återvänder vi till det mer konkreta fallet att statistiskt illustera olika egenskaper (utvecklingen) i en population. Utgångspunkten brukar vara att man bestämmer sig för en observationsperiod. Vi väljer ett helt kalenderår som vi kallar för år t. Vi gör följande denitioner Denition Betrakta en population av individer och låt 1. L x (t) = Antalet individer som uppnått åldern x år under kalenderåret t, det vill säga antalet individer med exakt ålder i intervallet (x, x + 1) vilket innebär att födelseåret är F = t x. 2. D x (t) = Antalet individer som avlider under kalenderåret t i åldern x, det vill säga antalet individer med exakt ålder i intervallet (x, x + 1) som avlider under kalenderåret t. 3. DE x (t) = Antalet individer som avlider under kalenderåret t i uppnådd ålder x år vid dödsfallet och där dödsfallet inträat efter födelsedagen. 4. DF x (t) = Antalet individer som avlider under kalenderåret t i uppnådd ålder x år vid dödsfallet och där dödsfallet inträat till och med födelsedagen. 5. N x(t) = (L x(t 1) + L x(t)) /2, det vill säga genomsnittlig folkmängd i åldern x under kalenderåret t.

61 Modeller för livslängd och dödlighet 61 ålder x+1 x x A B C F F+1 F+2 F+3 t Figur 2.7: Lexisdiagram. D kalenderår år t Denitionen kräver en del diskussion. Symbolerna införda i Denition kan åskådliggöras i ett utdrag ur ett Lexisdiagram. Vi tittar därför närmare på ett sådant i Figur 2.8.

62 62 Modeller för livslängd och dödlighet ålder x+1 x x-1 D F A B C (1) (3) (2) (4) E t kalenderår Figur 2.8: Utdrag ur Lexisdiagram. Till att börja med så ser vi att observationsperioden, kalenderår t, är angiven i guren. De individer som kan observeras under observationsperioden är de individer vars livslinjer skär linjesegmentet AF. Parallellogrammet F DBE beskriver födelseårsgenerationen F = t x under kalenderåret t. Kvadraten DABE representerar de individer (de individer vars livslinjer skär genom kvadraten) som under någon del av observationsåret t är mellan x och x+1 år gamla till den del de under året benner sig i detta åldersintervall. Denna grupp individer består av två olika födelseårsgenerationer, dels den generation som är född kalenderåret F 1 och dels den generation som är född kalenderår F. Antalet individer vars livslinjer skär linjesegmentet EB är lika med L x(t). Dessa individer har en exakt ålder som ligger i intervallet [x, x + 1).

63 Modeller för livslängd och dödlighet 63 På samma sätt kan vi inse att antalet individer vars livslinjer skär linjesegmentet F D är lika med L x 1(t 1) och antalet individer vars livslinjer skär linjesegmentet DA är lika med L x(t 1). Om man sedan går över till att studera de individer som avlider under observationsåret så nner vi att DF x (t) representeras av de individer vars livslinjer avslutas i triangeln DAB och att DE x(t) representeras av de individer vars livslinjer avslutas i triangeln DBE. Man inser nu, vilket torde ha varit uppenbart redan tidigare, att D x (t) = DE x (t) + DF x (t). (1.12.1) För fullständighets skull konstaterar vi att de individer som avlider i triangeln F DE representerar DF x 1 (t) samt de individer som avlider i triangeln EBC representerar DF x (t + 1). I Figur 2.8 nns återgivet fyra livslinjer som representerar fyra individer som avlider. Individerna (1), (2) och (4) avlider under observationsperioden medan individ (3) avlider efter observationsperiodens slut. I och med att individ (3) avlider efter det att observationsperioden är till ända saknar vi information om tidpunkten för dödsfallet. I enlighet med vad vi nyss konstaterat så ser vi att individ (1) ger ett bidrag till DF x (t), individ (2) till DE x (t), individ (3) till DF x (t + 1) samt individ (4) till DF x 1 (t). Det kan vara på sin plats att här göra reektionen att beteckningarna i detta avsnitt är konsistent med vad vi infört tidigare. Vi vill nu skatta µ x+ 1 som sedan kan användas för att skatta q x enligt (0.2.8). Till 2 vår hjälp skall vi ta den centrala dödskvoten, denierad i Denition För att koppla ihop den centrala dödskvoten med de denitioner vi gjort i Denition inser vi att vi skall utgå från åldersintervallet [x, x + 1). Det uppnår vi genom att i denitionen av den centrala dödskvoten välja h= 1 och följaktligen 2 sätta mittpunkten i observationsintervallet till (x + 1 ). Vi får då 2 ˆµ x+ 1 2 = M(x, x + 1) = D(x, x + 1) R(x, x + 1) D x(t) N x (t) (1.12.2) där den approximativa likheten är en följd av att vi inte förfogar över den exakta risktiden. Att skatta risktiden med N x(t) är rimligt om vi antar att individer avlider likformigt under kalenderåret. Det är ett naturligt val i den här situationen. För att

64 64 Modeller för livslängd och dödlighet vi skulle kunna förfoga över den exakta risktiden krävs att vi noterar respektive inträde och utträde, till exempel dödsfallstidpunkt, för de olika individerna i populationen under observationstiden vilket vi normalt inte gör. Vi utgår därför från att dödsfallen inträar likformigt under året. Vi sammanfattar resonemanget i följande denition Denition Med dödstalet i ålder x menas µ x+ 1 2 = D x (t)/n x (t). Dödstalet uttrycks normalt i promille, det vill säga som antalet avlidna per individer av medelpopulationen i ålder x. Som nämnts ovan har vi tidigare konstaterat, se (0.2.8), att det föreligger ett samband mellan q och µ. Det är därför nu lätt att skatta q x utgående från Denition Vi får ˆq x = ˆµ x ˆµ x+ 1 2 /2 D x(t) N x(t) + D x(t)/2. (1.12.3) Om vi som ovan antar att individer avlider likformigt under året så innebär det att DF x (t) DE x (t) vilket ger att D x (t)/2 DE x (t). Skattningen i (0.12.3) är viktig och vi uttrycker därför även den i form av en denition Denition Med dödsrisken i ålder x menar vi ˆq x D x (t) N x (t) + DE x (t). Vi skall nu ge exempel på konstruktion av livslängdstabeller. Exempel Konstruktion av en livslängdstabell med 1 års kalendertid som observationstid. Vi antar att vi förfogar över en population av individer, tillräckligt stor för denna typ av statistiska analys, där vi vet de olika individernas respektive ålder. Vi kommer löpande i detta exempel att referera till

65 Modeller för livslängd och dödlighet 65 Tabell E.7 som är en tabell av just den typen som vi avser att konstruera i detta exempel. Till att börja med sätter man upp en ålderskolumn, kolumn 1 i Tabell E.7. Nästa steg är att beräkna risktiden för respektive ålder. Risktiden skattas med N x (t) som är denierad enligt Denition Risktiden anges i kolumn 2 i livslängdstabellen. Nästa steg är att ange antalet avlidna individer, D x (t), under observationsperioden som anges i kolumn 3. Man brukar också notera huruvida de dödsfallen som inträat har inträat före respektive individs födelsedag under året eller ej. Vi anger därför antalet dödsfall efter födelsedagen, DE x (t), i kolumn 4. Nästa steg är att skatta dödsrisken ˆq x. Det låter sig lätt beräknas genom användande av Denition (0.12.3) och i Tabell E.7 nns den angiven i kolumn 5. Täljaren respektive nämnaren ges av tidigare kolumner i tabellen. Man brukar också i en livslängdstabell ange skattningen av överlevelsefunktionen, det vill säga ˆl(x). Vi använder (0.10.9) vilket tecknas ned i kolumn 6 i livslängdstabellen. Slutligen brukar man också beräkna återstående medellivslängd. Genom att i (0.9.6) ersätta l(x) och µ x med respektive skattningar får vi fram återstående medellivslängd som skrivs in i kolumn 7. Oftast nöjer man sig inte med att enbart konstruera livslängdstabeller med 1 år som observationstid. Orsaken är att det ibland kan förekomma vissa tillfälliga avvikelser i en populations utveckling som man vill utjämna. Man uppnår lätt den utjämningen genom att man parallellt med de ettåriga livslängdstabellerna också konstruerar rullande femåriga livslängdstabeller. Vi har därför anledning att införa följande tabellform. Exempel Konstruktion av en livlängdstabell med 5 års kalendertid som observationstid. I princip så skall vi förfoga över fem stycken konsekutiva 1-årstabeller, konstruerade som i exemplet ovan. Respektive års populationer måste var och en vara av den storleken att det är meningsfullt att utföra respektive ettåriga analys. Det kan vara lämpligt att snegla på Tabell E.19, som är just en femårig livslängdstabell, i detta exempel. För enkelhets skull numrerar vi de fem åren 1, 2,..., 5. Ålderskolumnen (kolumn 1 i Tabell E.19) är densamma som för ettåriga livslängdstabeller. Risktiden för respektive ålder ges av summan av risktiderna för de fem åren, det vill säga R x = 5 i=1 R x(i) där R x (i) är risktiden för kalenderåret i. Risktiden

66 66 Modeller för livslängd och dödlighet skattas med N x = 5 Nx(i) och anges i kolumn 2 i livslängdstabellen. i=1 Kolumnerna 3 och 4 är analoga till kolumnerna 3 och 4 i Exempel ovan fast med tillägget att de är summerade över de fem åren. Det vill säga vi anger i kolumnerna D x = 5 D i=1 x(i) respektive DE x = 5 DE i=1 x(i). Nästa steg är att skatta dödsrisken ˆq x. Det låter sig återigen beräknas genom att använda Denition Dock med den skillnaden att de respektive termerna i högra ledet i denitionen skall bytas ut mot motsvarande femårsvärden, beräknade ovan i detta exempel. De framräknade värdena återges i kolumn 5. Även i femårstabeller anger vi en skattningen av överlevelsefunktionen, ˆl(x). Vi gör det enkelt för oss och använder (0.10.9) där vi använder de ovan framräknade femåriga dödsriskerna som tecknas ned i kolumn 6 i livslängdstabellen. Slutligen brukar vi även i denna tabell beräkna återstående medellivslängd. Genom att i (0.9.6) ersätta l(x) med respektive skatt-ningar får vi fram återstående medellivslängd över det femåriga tidsintervallet. Livslängdstabeller med 5 års observationstid är mycket frekventa i analysen av livslängder såväl för befolkningen som för försäkringspopu-lationer. Som nämnts ovan blir precisionen i skattningarna för höga åldrar av mindre bra kvalitet. Vid upprättandet av livslängdstabeller för befolkningen använde SCB till och med 1986 en utjämning för höga åldrar som baserade sig på den så kallade Wittsteins formel. Den metoden överskattade dödsriskerna i de högsta åldrarna och man utarbetade därför en ny metod för utjämning av dödsriskerna i de högsta åldrarna. Den numera använda metoden nns beskriven i Martinelle [?]. I exemplen ovan i detta avsnitt har vi gjort skattningar av µ baserade på observationer under ett kalenderår t. Det har då gett upphov till skattningar av µ x Vi skall avsluta avsnittet med två exempel där vi skapar en dödlighetstabell med uppdelning på födelseår. En viktig skillnad mot ovanstående exempel är att vi då får skattningar av µ x. Exempel Vi återvänder till Lexisdiagrammet i Figur 2.8. Parallellogrammet FDBE representerar, som angett ovan, de individer som är födda år F = t x. I genomsnitt så är individerna x år gamla under året. Det betyder att vi observerar generationen under åldersintervallet (x 1, x + 1 ). Åldern på respektive individ vid inträdet är approximativt likformigt fördelat mellan x 1 och x. Vidare är den ålder då individerna lämnar observationsperioden likformigt approximativt likformigt fördelade mellan x och x + 1. Konsekvensen av konstruktionen av observationsperioden är att vi kan skatta µ

67 Modeller för livslängd och dödlighet 67 mitt i åldersintervallet, det vill säga vi kan skatta µ x. Vi använder återigen centrala dödskvoten för att konstruera skatt-ningarna, vilket ger ˆµ x = D(x 1, x + 1) N(x 1, x + 1) (1.12.4) där D(x 1, x + 1) = DF x 1(t) + DE x(t) (1.12.5) och N(x 1, x + 1) = 1 (Lx 1(t 1) + Lx(t)). (1.12.6) 2 Vi har med den här metoden skapat skattningar för dödstalet för födelseåret F under observationsåret t. Exempel Det kan nnas anledning att utjämna skattningarna av den typen som vi skapade i Exempel Det gör vi genom att till exempel använda ett femårigt födelseårsintervall (F 2, F + 2). Skattningarna blir då ˆµ x = D(x 3, x + 3) N(x 3, x + 3) (1.12.7) där D(x 3, x + 3) = x+2 i=x 2 (DF i 1 (t) + DE i (t)) (1.12.8) och N(x 3, x + 3) = 1 2 x+2 i=x 2 (L i 1 (t 1) + L i (t)). (1.12.9)

68 68 Modeller för livslängd och dödlighet Observera att vi i de två senaste exemplen har ignorerat de störningar som kan uppstå i samband med immigration och emigration som påverkar risktiderna i de två exemplen Utjämning av observerad dödlighet med Makehammodell Att skatta dödligheten för olika åldrar som beskrivet ovan kan inte fullständigt utjämna de stokastiska variationerna som alltid uppstår i statistiska material. För att uppnå en mer utjämnad skattning av dödligheten anpassar man i nordisk livförsäkringstradition en Makehamfunktion till observerad dödlighet. Problemet att skatta dödligheten handlar då istället om att skatta parametrarna i Makehamfunktionen. Vid studie av försäkringsdödligheten är metoden mindre lämplig för åldrar under 20 år eftersom anpassningen är mindre bra för dessa åldrar. Å andra sidan är den åldersgruppen av ganska liten betydelse inom livförsäkring, särskilt med inslag av sparande. Det förtjänar också att nämnas att Makehammodellen är relativt gammal. Det nns modernare metoder som i många situationer kan vara mera lämpade. Ett exempel är de så kallade Lee-Carter-modellerna som beskrivs senare i detta kapitel. Till skillnad från Makeham-modellen tar Lee- Carter-modellerna också hänsyn till trender. Vi skall använda känd statistisk teori applicerad på den situation vi beskrivit ovan. I detta avsnitt skall vi diskutera den statistiska modellen medan insamlingen av data diskuteras senare. Före datorernas intåg som kraftfulla hjälpmedel i beräkningsarbetet letade man efter numeriska metoder som underlättade beräkningsarbetet. I princip har man använt fyra olika metoder, King-Hardys metod, momentmetoden, χ 2 -metoden samt minstakvadratmetoden. Dessa metoder används i praktiken ej längre och vi avstår därför från att i detalj diskutera dem. Den metod som idag är vanlig att använda går under benämningen den modierade minimum χ 2 -metoden. Observera att även om man använder dator för skattningsarbetet så är det nödvändigt att man anpassar indata till det datorprogram man använder. Vi nöjer oss därför med att ange principen i tillvägagångssättet för att sedan överlåta själva anpassningen i beräkningsarbetet till berörda aktuarier. Den parametriska livslängdsmodellen som vi skall arbeta med är, som vi redogjort för ovan, µ x = α + βe γx (1.13.1)

69 Modeller för livslängd och dödlighet 69 där α + β > 0, β > 0 och γ 0. Det första steget i analysen är att för åldrarna x i, i = 1, 2,...n, 4 beräkna lämpliga skattningar av µ xi, till exempel de centrala döds-kvoterna ˆµ xi = M xi = D xi /R xi, i = 1, 2,..., n. Vi skall därefter använda den modierade minimum χ 2 - metoden som nämnts ovan för att skatta parametrarna α, β och γ. Det innebär att vi bildar n Q = w xi (ˆµ xi α βe γx i ) 2 (1.13.2) i=1 och väljer den uppsättning parametrar som gör att Q blir så litet som möjligt för lämpligt valda vikter w xi. Vikterna ω xi väljes som w xi = σ 2 (ˆµ xi ). (1.13.3) Motivet för detta val av vikter är samma som man brukar använda vid andra tillämpningar, nämligen att observationer med hög precision, det vill säga låg varians, skall väga tyngre än observationer med dålig precision. Observera att summan av vikterna inte, i normala fall, är lika med 1. De i uttrycket angivna skattningarna av µ x är de centrala dödskvoterna som denierades i Denition , det vill säga ˆµ x = M x. Dessa är också approximativt normalfördelade, för stora n, och dess väntevärde är µ x och dess varians är µ 2 x/d x. Det innebär att vikterna w x bör väljas som w xi = D xi /ˆµ 2 x i = R xi /ˆµ xi. (1.13.4) Notera att risktiderna kan skattas med N xi som nämnts ovan. Relationen (0.13.2) kan, med skattningarna för risktiderna insatta istället för risktiderna själva, skrivas som 4 Mot bakgrund av den mindre bra anpassningen som föreligger för åldrar under 20 år väljer man ibland i detta första steg att arbeta med åldrar 20, 21,..., n, istället för att genomföra det för åldrar även under 20 år. För försäkringsbranschen spelar denna begränsning som nämnts mindre roll eftersom vanliga sparprodukter inte omfattar så låga åldrar.

70 70 Modeller för livslängd och dödlighet n (ˆµ xi α βe γx i ) 2 Q =. (1.13.5) ˆµ xi /N xi i=1 Även om vi, se ovan i detta avsnitt, har hänvisat till att utjäm-ningsarbetet med fördel utförs med datorer så nns det en poäng i att teckna ner de ekvationer som behövs i utjämningsarbetet. Det gör att vi relativt enkelt kan genomföra beräkningarna med enklare iterativa datorverktyg och inte är hänvisade till mer komplexa datormiljöer. Vi gör det i formen av ett exempel Exempel Vi skall genomföra en skattning i praktiken av para-metrarna i Makehamfunktionen. I detta exempel skall vi också genomföra beräkningarna på det sätt som man normalt gör om man inte har tillgång till regressionsverktyg för icke-linjära modeller. Vi startar med att välja γ-värde som vi kan betrakta som korrekt. Valet är en följd av att vi inte kan genomföra en icke-linjär regression. Genom att välja ett γ-värde överför vi problemet till ett linjärt regressionsproblem. Det antagandet behöver inte vara orimligt, det kan till exempel vara en följd av att vi löpande har gjort skattningar (observationer) och på så sätt skapat en kunskap om det korrekta, men i och för sig okända, γ-värdet. Därefter skattar vi α och β med hjälp av den modierade minimum χ 2 -metoden. Det är på sin plats att påpeka att det nns en viss risk att man kan hamna i ett lokalt minimum beroende på hur väl man väljer sitt γ-värde. Vi utgår från modellen µ x = α + βe γx (1.13.6) där vi skall minimera n Q = w xi (ˆµ xi α βe γx i ) 2 (1.13.7) i=1 och vikterna w xi ges av w xi = D xi /ˆµ 2 x i = N xi /ˆµ xi. (1.13.8)

71 Modeller för livslängd och dödlighet 71 Till vårt förfogande har man normalt ett numeriskt material baserat på en lämplig population. Vi löser ekvationssystemet Q α = 0 Q β = 0 (1.13.9) där vi betraktar γ som xt. Skattningarna kan skrivas som ˆα = m01 ˆβm 10 w ( ) och ˆβ = wm 11 m 10 m 01 wm 20 m 2 10 ( ) där w = m 10 = m 01 = m 20 = m 11 = n w xi, ( ) i=1 n w xi e γx i, ( ) i=1 n w xi ˆµ xi, ( ) i=1 n w xi e 2γx i, ( ) i=1 n w xi e γxi ˆµ xi. ( ) i=1

72 72 Modeller för livslängd och dödlighet Observera att efter att ha genomfört skattningsarbetet är det viktigt att man i efterhand också jämför det skattade resultatet med observerat resultat. I exemplet ovan så har vi valt vikterna w xi på ett sätt som man brukar göra då man är intresserad av den så kallade ekonomiska dödligheten vilken används vid fördelning av de så kallade arvsvinsterna. Man kan också välja w xi = N xi vilket är en metod som används då man är intresserad av den så kallade antalsdödligheten. Istället för, ur relationen (0.11.7), få relationen w xi ˆµ xi = w xi (α + βe γx i ) får vi då D xi = N xi (α + βe γx i ) Utjämning av observerad dödlighet med Lee-Carter-modell Möjligheten att använda sostikerade matematiska modeller vid ana-lys av livslängder hos individer är starkt sammankopplat till en eektiv skattningsteknik som numeriskt är praktisk att använda. Under större delen av 1900-talet har man i Sverige förlitat sig på en modell där observerade dödligheter har utjämnats med hjälp av en Makehamfunktion. I praktiken brukar observerade dödligheter ges i form av ettåriga dödlighetssannolikheter q x medan man vid användande av Makehamfunktioner utjämnar dödlighetsintensiteten µ x istället. Här representerar x olika åldrar. Relationen mellan q x och µ x diskuterades i Avsnitt 2.2. I den branschövergripande utredning om försäkringsdödligheten, som genomfördes i slutet på 1980-talet i Sverige, använde man sig huvudsakligen av Makehamfunktioner för utjämning av dödlighetsintensiteten, se [?]. Där är dödlighetsintensiteten angiven med hjälp av parametrarna α, β och γ i en Makehamutjämning av observerad dödlighet. Vi kommer här diskutera en utjämning som i huvudsak är en trendbaserad utjämning enligt den så kallade Lee-Cartermodellen. Vi disku-terar en teknik att utjämna observerad dödlighet i en population med hänsyn tagen till den trendinformation som kan observeras i ett datamaterial som spänner över era år. Vi kommer att arbeta med skattningar av dödlighetsintensiteten µ x för olika åldrar x. Till vårt förfogande behöver vi, för att på ett rimligt korrekt sätt kunna beskriva trender i dödligheten, ett ganska omfattande datamaterial över befolkningsdödligheten. De tabeller som nns inkluderade i Appendix E och som härrör från SCB är bra exempel på vad som behövs, det vill säga observationer av befolkningsdödligheten i Sverige under ett antal kalenderår fördelat på olika kön respektive åldrar. Det är viktigt att påpeka att det kan vara svårt att särskilja försäkrade från försäkringar i vissa material. Därför är det oftast naturligt att arbeta med försäkringar som enhet. Denna inskränkning har en viss påverkan på resultatet men det är av ganska marginell betydelse.

73 Modeller för livslängd och dödlighet 73 Den modell som vi kommer att beskriva för att modellera trenden i dödligheten är en så kallad Lee-Cartermodell och vi använder oss av befolkningsdödligheten för att skatta trenden i dödligheten. Orsaken till det är att datamaterialet från försäkringsgivarna är för litet för att tillräckligt säkert kunna skatta trenden i dödligheten. Att därefter överföra trenden i befolkningsdödligheten till försäkringsdödligheten görs genom att bilda kvoter mellan försäkringsdödligheten, som gene-rellt är lägre än befolkningsdödligheten, och befolkningsdödligheten. Den teknik vi redovisar nedan har använts i en större utredning som gjorts av Försäkringstekniska Forskningsnämnden i Sverige som publicerades 2007, se [?]. För en fullständig genomgång hänvisar vi till den utredningen. För att ändå ge en känsla för hur resultaten från en utredning gjord enligt en Lee-Carter-modell återger vi delar av resultaten för en delpopulation. Den teoretiska modellen i utredningen samt beskrivningen av resultatet har Bengt von Bahr och Ellinor Samuelsson varit särskilt bidragande till, se längre fram i detta avsnitt Stokastisk modell Betrakta en individ som är x år gammal och antag att vi observerar individen vid tidpunkten t. Vi låter både x och t vara kontinuerliga variabler. Vi denierar T x(t) = återstående livslängd för en x-årig individ vid tidpunkten t. (1.14.1) Betrakta individen under åldersintervallet (x, x + dx) där dx betraktas som litet. Detta är ekvivalent med att vi observerar individen under tidsintervallet (t, t + dx). Det är emellertid naturligare att formulera sig i termer av individens åldrande varför vi håller oss till åldersintervallet (x, x + dx). Nästa steg är att studera sannolikheten att individen avlider i åldersintervallet (x, x + dx) givet att individen lever vid åldern x år. Eftersom dx är litet är det rimligt att anta att den sannolikheten är proportionell mot längden på intervallet, det vill säga dx. Den sökta sannolikheten kan därför skrivas som µ x dx = µ x (t) dx där µ x = µ x (t) är en proportionalitetsfaktor. Vi sammanfattar detta som P(individen avlider i åldersintervallet (x, x + dx) lever vid tidpunkten t, x år gammal) = µ x (t) dx. (1.14.2) Som nämnts i inledningen till kapitlet kan man behöva uttrycka sig i termer av

74 74 Modeller för livslängd och dödlighet både µ x(t) som q x(t) där vi explicit angett kopplingen till observationstidpunkten t. Vi denierar därför q x (t) som sannolikheten att en x-årig individ, observerad vid tidpunkten t, skall avlida inom ett år, det vill säga q x (t) = P (T x (t) 1). (1.14.3) Det problem som nu innner sig är problemet med att tillämpa en modell med kontinuerliga antaganden i ett praktiskt (diskret) sammanhang. Lösningen är att välja en tidpunkt vid vilken vi observerar ett antal individer som i genomsnitt har en viss ålder x. Kalenderår är det naturliga tidsbegreppet i försäkringsföretag vilket gör det praktiskt att som observationstidpunkter välja utgången av kalenderår. Populationen under betraktelse delas upp efter ålder x (initialt görs en uppdelning på kön) per kalenderår t genom att deniera N x (t) = antal individer som lever vid utgången av kalenderår t och fyllde x år under kalenderåret t. (1.14.4) Observera att eftersom det är rimligt att anta att individer föds likformigt under ett kalenderår är de individer som ingår i populationen N x(t) i genomsnitt x år gamla. På samma sätt kan man sluta sig till att de individer som ingår i populationen N x 1 (t 1) är i genomsnitt x 1 år gamla. 2 Vi denierar nu risktiden för den x-åriga delen av populationen under kalenderåret t som summan av den tid som de individer som är födda under kalenderåret t x har varit del av beståndet under kalenderåret t. Risktiden betecknas med R x(t). Om vi låter R x,i (t) vara risktiden för individ i kan risktiden för den x-åriga delen av populationen skrivas som R x (t) = N x(t) i=1 R x,i (t). (1.14.5) Risktiden R x(t) kan normalt inte anges exakt utan tillgång till exakt kunskap om när alla individer i populationen föds, tecknar försäkring av den typ som

75 Modeller för livslängd och dödlighet 75 denierar beståndet respektive avlider. Istället approximerar vi risktiden med hjälp av ˆR x(t) = Nx 1(t 1) + Nx(t). 2 (1.14.6) Eftersom populationen N x(t) är i genomsnitt x + 1 år gamla och populationen 2 N x 1(t 1) år i genomsnitt x 1 år gamla kan man sluta sig till att ˆR 2 x(t) i genomsnitt beskriver risktiden för en x-årig population. Vi denierar nu D x(t) = antal individer som avlider under kalenderåret t och fyllde eller skulle ha fyllt x år under kalenderåret t. (1.14.7) Storheten N x (t) är antalet individer som föddes kalenderåret t x och levde i slutet av kalenderåret t. Vidare är D x (t) antalet individer som föddes kalenderåret t x och som avled under kalenderåret t. Om enda möjligheten att lämna beståndet är att avlida, och att inga nytillskott sker, gäller att N x 1 (t 1) = N x (t) + D x (t). Denna relation gäller för befolkningsundersökningar så när som på migrationer som sker in och ut ur befolkningar. För försäkringsbestånd gäller dess-utom att relationen påverkas av såväl nyteckning av försäkringar som försäkringar som upphör av andra skäl än dödsfall. Ett sätt att numeriskt mäta hur stor del av ett försäkringsbestånd som lämnar beståndet på annat sätt än genom att avlida, vilket används senare i utredningen, är att ange kvoten ξ x(t) = N x 1(t 1) D x (t). (1.14.8) N x(t) Som nämnts ovan är det rimligt att anta att olika individer föds likformigt under ett kalenderår. På samma sätt är det rimligt att anta att individer avlider likformigt under ett kalenderår. De individer som avlider ungefär i samband med sin födelsedag under kalenderåret t x är då ungefär x år gamla. De individer som föddes i början av kalenderåret t x och som avled i slutet av kalenderåret t var då de avled ungefär x + 1 år gamla då de avled. På samma sätt var de individer som föddes i slutet av kalenderåret t x och avled i början av kalenderårets t ungefär x 1 år gamla då de avled.

76 76 Modeller för livslängd och dödlighet Man kan därför konstatera att i genomsnitt var de D x(t) individerna x år gamla då de avled. Av praktiska skäl kommer vi hädanefter att referera till dödlighetsintensiteten för åldern x kalenderåret t som µ x (t). Vi har också anledning att betrakta dödlighetsintensiteten för en viss ålder x med födelseår F vilken betecknas med µ x(f ). Vi inför begreppet kohort för individer med samma födelseår eller är födda under samma angivna tidsperiod. En individ som uppnår åldern x under kalenderåret t är född kalenderår F = t x. Det betyder att vi har sambandet µ x(f ) = µ x (x + F ). (1.14.9) Vi kommer i resultaten nedan exempelvis att referera till kohorter av individer som är födda inom samma decennium. En individ uppnår åldern x då individen uppnår sin x-åriga födelsedag. Vi kommer att ange åldrar som heltalsåldrar vilket innebär att en individ antas vara x år till dess individen uppnår sin nästa födelsedag. Vissa avgränsningar behöver göras vad avser åldrar som betraktas vilket anges i modellen som åldrarna x [x min,..., x max ]. Vidare låter vi t stå för kalenderår. Begränsningen t [t min,..., t max] för de kalenderår kommer vi att använda här, för övrigt samma som i den nämnda utredningen, se [?]. Antalet kalenderår är normalt ganska få eftersom av praktiska skäl observerade data brukar begränsas till ett fåtal år. Å andra sidan visar det sig att redan med fem observationsår kan man få en god uppfattning om trenden i ett observerat material. Vi har i denna utredning av olika skäl valt att använda just fem observationsår. Vi skall nu diskutera fördelningen för antalet x-åriga individer som avlider under kalenderåret t, det vill säga fördelningen för D x (t). Det visar sig praktiskt att anta att dödlighetsintensiteten är konstant inom kvadrater i Lexisdiagram, det vill säga att µ x+h (t + τ) = µ x (t) för (0 h, τ 1). Om vi nu antar att de i populationen ingående individernas livslängder är sinsemellan oberoende och likafördelade kan man sluta sig till att D x(t) är binomialfördelad. Vi skriver det som D x(t) Bin(N x 1(t 1), q x(t)). ( ) Mot bakgrund av att de esta bestånden, för de olika åldrarna och kalenderåren,

77 Modeller för livslängd och dödlighet 77 kan betraktas som stora kan binomialfördelningen approximeras med en Poissonfördelning om vissa förutsättningar är uppfyllda. I sin vanliga form modellerar Lee-Cartermodellen egentligen loga-ritmen av dödligheten uttryckt antingen i termer av q eller µ. Man brukar sedan använda så kallad Singular Value Decomposition för att skatta parametrarna i modellen. Man har i den nämnda utredningen, [?], valt att använda en teknik som bygger på Maximum-Likelihood-teknik för att modellera observerat antal avlidna individer. Utgående från binomialfördelningen angiven i ( ) ovan är det naturligt att tänka sig att man kan använda sig av en Poissonapprox-imation. Emellertid bygger binomialfördelningen i ( ) på para-metern q x och inte på µ x för respektive åldrar x. Modellen vi diskuterar här har analyserats av N. Brouhns et al, se [?]. I ett annat arbete visar D. R. Brillinger [?] att under förutsättningen att dödlighetsintensiteten är konstant inom kvadrater i Lexisdiagram, som vi infört ovan, kan man visa att antalet avlidna kan betraktas som Poissonfördelat. Genom att utnyttja det förhållandet får vi D x(t) ap P o(r x(t) µ x(t)) ( ) där väntevärdet för D x(t) är lika med R x(t) µ x(t). Även här gäller att risktiden kan skattas enligt (0.14.6). Lee-Cartermodeller har getts olika formuleringar i litteraturen, där en av de första formuleringarna gavs av Lee-Carter i [?]. Den formuleringen av modellen bygger på de ettåriga dödssannolikheterna medan vi i den här utredningen skall använda dödlighetsintensiteterna. Vi väljer därför att modellera dödlighetsintensiteten enligt följande µ x (t) = e α x+κ(t) β x. ( ) Även om vi här uteslutande kommer att använda en utjämning med användande av Lee-Cartermodellen kan det vara av intresse att göra vissa jämförelser med Makehamutjämning. Bland annat använder vi Makehamutjämning för olika kohorter i kommande kapitel. För att tydligt visa på skillnaden mellan Lee-Cartermodellen och Makehammodellen återger vi här den senare där vi också anger på vilket sätt kalenderår uppträder i modellen. Dödlighetsintensiteten µ x(t) anges på formen µ x (t) = a t + b t c x t ( )

78 78 Modeller för livslängd och dödlighet där parametervektorn (a t, b t, c t) skattas med lämplig metod, förslags-vis lämplig variant av minstakvadratmetoden, för varje kalenderår t. Som synes har kalenderåret ingen påverkan i modellen varför modellen saknar förmåga att skatta trender utan att man kombinerar skattningar av era på varandra följande kalenderår. I nästa avsnitt skall vi kortfattat ange vad som menas med en klassisk Lee- Carterteknik som bygger på Singular Value Decomposition (SVD) som skattningsteknik, en teknik vi inte kommer att använda här. Istället kommer vi att använda oss av den teknik som bygger på MaximumLikelihoodteori vilket beskrivs i Avsnitt Klassisk skattningsteknik i Lee-Cartermodellen Klassisk skattningsteknik av Lee-Cartermodellen bygger på en minsta-kvadratanpassning av observerade data till den teoretiska modellen. Om vi logaritmerar ( ) och inför en felterm får vi

79 Modeller för livslängd och dödlighet 79 ln[ˆµ x(t)] = ln[µ x(t)] + ϵ x(t) = α x + κ(t)β x + ϵ x(t) ( ) där ϵ x(t) är feltermen. Vi kan då bilda kvadratsumman av feltermerna som = t max t=t min x max Q = t max t=t min x max x=x min ϵ x(t) 2 = x=x min [ln(ˆµ x (t)) α x κ(t)β x ] 2. ( ) Tekniken att skatta parametrarna med denna teknik nns beskriven i olika källor, see till exempel N. Brouhns et al [?]. Den normala tekniken är att man använder så kallad Singular Value Decomposition (SVD). Eftersom vi inte använder denna metod i denna utredning hänvisar vi den vetgirige läsaren till litteraturen. Den metod som vi använder i denna utredning redovisas i nästa avsnitt Skattningsteknik enligt ML-metoden i Lee-Cartermodellen Vi skall nu härleda skattningarna av parametervektorerna α, κ och β med användande av maximumlikelihoodmetoden. Parametervekto-rerna denieras genom α = {α x ; x = x min,..., x max }, κ = {κ(t); t = = t min,..., t max} och β = {β x; x = x min,..., x max}. Likelihoodfunktionen kan då skrivas som L(α, κ, β) = t max t=t min t max = t=t min x max x=x min P (D x (t) = d x (t)) = x max d x (t) e λx(t) λx(t) d x (t)! x=x min ( ) där d x(t) är observerat värde av den stokastiska variabeln D x(t). Vi har använt λ x(t) vilket är det förväntade värdet av D x(t), det vill säga λ x(t) = E[D x(t)], för att förenkla läsbarheten. Uttryckt i parametrarna α x, κ(t) och β x kan λ x(t) skrivas som

80 80 Modeller för livslängd och dödlighet λ x (t) = E[D x (t)] = R x (t) µ x (t) = R x (t) e αx+κ(t) βx. ( ) Den normala proceduren att nna maximum för L-funktionen är att först logaritmera likelihoodfunktionen och därefter maximera den logaritmerade likelihoodfunktionen. Vi får, efter att ha samlat ihop konstanterna i en term, benämnd konstant, = t max t=t min x max ln[l(α, κ, β)] = x=x min [ λ x(t) + d x(t) ln(λ x(t))] + konstant. ( ) Ersätter vi nu λ x (t) med dess rätta uttryck i de aktuella paramet-rarna och förenklar skrivsättet något får vi lnl = [ R x(t) µ x(t) + d x(t) ln(r x(t) µ x(t))] + konstant x,t ( ) vilket med användning av ( ) kan skrivas som [ lnl = Rx(t) e α x+κ(t) β x + d x(t) (α x + κ(t) β ] x) + x,t + konstant. ( ) Vi skall nu alltså maximera den logaritmerade likelihoodfunktionen angiven i ( ). Funktionen är komplicerad och vi behöver använda en iterativ metod för att maximera funktionen eftersom parametrarna inte går att lösa ut analytiskt. En traditionell Newton-Raphsonteknik är ej heller så lätt att använda i detta fall eftersom den funktion som skall maximeras har en förhållandevis komplicerad struktur. Istället skall vi använda en förenklad Newton-Raphsonteknik som går ut på att vi itererar en komponent i parametervariabeln i sänder. Metoden ges en allmän genomgång av i Avsnitt Att via en algoritm estimera parametrar i

81 Modeller för livslängd och dödlighet 81 en loglinjär modell med bilinjära termer har tidigare också diskuterats till exempel av L. A. Goodman [?]. För att maximera den logaritmerade likelihoodfunktionen börjar vi med att skatta dödlighetsintensiteten med ˆµ x (t) = d x(t) ˆR x (t) ( ) där d x (t) är observerat värde av D x (t) och ˆR x (t) ges av (0.14.6). För att kunna välja lämpliga startvärden av parametervektorerna α, κ och β är det lämpligt att skapa en förståelse för vad de representerar. Parametrarna (α x, x = x min,..., x max) kan ses som medelvärden av ln[µ x(t)] över observationsåren t, parametrarna (κ(t), t = = t min,..., t max ) representerar tidstrenden i dödlighetsintensiteten och (β x, x = x min,..., x max ) indikerar känsligheten av logaritmen av dödlighetsintensiteten till tidstrenden. Det är därför naturligt att som startvärden i iterationen välja ˆα x (0) 1 = t max t min + 1 t max t=t min ln[ˆµ x (t)], ( ) ˆκ (0) (t) = x max ˆβ(0) x z x (t) ( ) x=x min där z x (t) = ln[ˆµ x (t)] ˆα (0) x ( ) och ˆβ x (0) 1 = x max x min + 1. ( ) Vi skall nu tillämpa den allmänna iterationstekniken beskriven i Avsnitt Vi behöver då välja en steglängd h och för enkelhets skull väljer vi h = 1. Enligt

82 82 Modeller för livslängd och dödlighet teorin i Avsnitt rekommenderas att använda en kortare steglängd. Det visar sig emellertid att det fungerar väl med steglängden h = 1 varför vi nöjer oss med den steglängden. Om vi nu tillämpar de allmänna iterationsformlerna ( ) - ( ) får vi ˆα (ν+1) x = ˆα (ν) x [ d t x (t) ˆR x (t) exp(ˆα x (ν) [ ˆRx (t) exp(ˆα (ν) t x + ˆκ (ν) (t) + ˆκ (ν) (t) (ν) ˆβ x ) ˆβ (ν) x ) ] ], ( ) [ d x x (t) ˆR x (t) exp(ˆα x (ν+1) [ ˆRx (t) exp(ˆα (ν+1) t x + ˆκ (ν) (t) ˆκ (ν+1) (t) = ˆκ (ν) (t) + ˆκ (ν) (t) ] (ν) ˆβ x ) ] (ν) ˆβ x ) ˆβ(ν) x (ν) ( ˆβ x ) 2 ( ) samt ˆβ (ν+1) (t) = ˆβ (ν) (t) [ ] d x x (t) ˆR x (t) exp(ˆα (ν+1) x + ˆκ (ν+1) (ν) (t) ˆβ x ) ˆκ (ν+1) (t) [ ]. t ˆRx(t) exp(ˆα (ν+1) x + ˆκ (ν+1) (ν) (t) ˆβ x ) (ˆκ (ν+1) (t)) 2 ( ) Efter varje iteration normeras den uppsättning skattningar man får fram enligt bivillkoren (0.14.7) - (0.14.8). Tekniken för normeringen ges av ( ) - ( ). Notera att vi här löpande uppdaterar de skattade parametrarna en och en medan i den allmänna modellen i Avsnitt görs uppdateringarna stegvis för alla parametrar. Man kan diskutera hur många iterationer som behövs för att uppnå en rimlig noggrannhet. Konvergensen är förhållandevis snabb vilket innebär att man kan nöja sig med relativt få iterationer. Här har vi valt MLE(ν+1) MLE (ν) < ( )

83 Modeller för livslängd och dödlighet 83 som avbrottskriterium för iterationerna där MLE (ν) = [d x (t) (ˆα x (ν) x,t ˆR x (t) exp(ˆα (ν) x + ˆκ (ν) (t) + ˆκ (ν) (t) (ν) ˆβ x ) ˆβ (ν) x )]. ( ) Iterationsteknik enligt Newton-Raphson Vi skall i det här avsnittet redovisa hur man kan använda sig av en Newton- Raphsonteknik för att skatta parametrarna i den Lee-Cartermodell som formulerats i Avsnitt Speciellt är den funktion som skall maximeras med avseende på dess parametervariabler angiven i ( ). Innan vi ger oss i kast med själva iterationstekniken skall vi först konstatera att det nns linjära samband i modellen mellan paramet-rarna. Det är därför ingen inskränkning av modellen att anta, till exempel, att κ(t) = 0 ( ) t och β x = 1. ( ) x Man kan illustrera att dessa normeringar ej påverkar skattningen av µ x (t) genom följande resonemang. Betrakta en uppsättning godtyckliga värden på α x, κ(t) och β x. Låt oss nu genomföra transformationerna α x = α x + c β x, κ (t) = = d (κ(t) c) och β x = β x /d får vi samma värde på µ x (t). Man kan därför välja konstanterna c och d efter godtycke. Exempel 1: Med c = 1 n t κ(t) blir t κ (t) = 0. Exempel 2: Med d = x βx blir x β x = 1.

84 84 Modeller för livslängd och dödlighet Exempel 3: Om man vill att α x = m x(t ) för något särskilt kalenderår T, kan man sätta α x = m x(t ), κ (t) = κ(t) κ(t ) och β x = β x. Även om man som synes kan använda olika normeringar väljer vi bivillkoren ( ) och ( ). För att hitta maximum för funktionen angiven i ( ) borde man bilda gradientvektorn och andraderivatanmatrisen, och med en New-ton-Raphsonmetodik iterativt söka sig fram till en maximipunkt. Den allmänna teorin för detta problem kan formuleras som följer: Vi har en endimensionell funktion f(x) av en k-dimensionell variabel x, som uppfattas som en kolumnvektor. Vi betecknar gradientvektorn (som också är en kolumnvektor) i punkten x med g(x) och andraderivatmatrisen i punkten x med B(x). Taylorutveckling av funktionen och dess gradient i punkten a har formen f(x) = f(a) + g(a) T (x a) (x a)t B(a) (x a) + +termer av högre ordning ( ) respektive g(x) = g(a) + B(a) (x a) + termer av högre ordning ( ) där superindex T står för transponering. Om matrisen B(a) är positivt eller negativt denit så har den andragradsyta som representeras av de första termerna i utvecklingen sin extrempunkt i den punkt där gradienten är lika med noll, nämligen i punkten x = a B(a) 1 g(a). Newton- Raphsoniterationen mot extrempunkten sker då genom att bilda en följd (x n ), där x 0 är en första gissning och x n+1 = x n B(x n ) 1 g(x n ). Emellertid blir denna allmänna metod rätt komplicerad. Andraderiva-tanmatrisen har hög ordning och det stöter på problem att beräkna dess invers. I stället fungerar en förenklad iterationsmetod, där man itererar en komponent av parametervariabeln i sänder. Vi bildar, utgående från ( ), därför dlnl dα x = [ Rx (t) e α x+κ(t) β x + d x (t) ], x, ( ) t

85 Modeller för livslängd och dödlighet 85 dlnl dκ(t) = [ ] Rx (t) β x e αx+κ(t) βx + d x (t) β x, t, x ( ) dlnl dβ x = [ Rx (t) κ(t) e αx+κ(t) βx + d x (t) κ(t) ], t x. ( ) Ekvationerna ( ) - ( ) kan med hjälp av tidigare införda beteckningar skrivas på ett enklare sätt. Genom att utnyttja ( ), som anger väntevärdet för D x (t), får vi dlnl dα x = [d x(t) λ x(t)], x, ( ) t dlnl dκ(t) = [d x(t) λ x(t)] β x, t, ( ) x dlnl dβ x = [d x(t) λ x(t)] κ(t), x. ( ) t På samma sätt fås för andraderivatorna d 2 lnl dα 2 x = λ x (t), x, ( ) t d 2 lnl dκ 2 (t) = βx 2 λ x(t), t, ( ) x d 2 lnl dβ 2 x = κ 2 (t) λ x (t), x. ( ) t

86 86 Modeller för livslängd och dödlighet Iterationen sker nu steg för steg genom att vi börjar med de givna värdena α x (0), κ (0) (t), β x (0) som uppfyller bivillkoren ( ) och ( ). Därefter bildar vi preliminära nya värden genom α (1) x = α (0) x + h t [dx(t) λx(t)] t λx(t), ( ) κ (1) (t) = κ (0) (t) + h [d x x(t) λ x (t)] β x, x x(t) βx(t) 2 ( ) β (1) x = β (0) x + h [d t x(t) λ x (t)] κ(t) λ. ( ) t x(t) κ 2 (t) Här har i iterationen införts en steglängdsparameter h. Orsaken är att den riktiga iterationen utnyttjar inversen av andraderivatanmatrisen. Den ger ett samlat värde på krökningen av den yta som representeras av den funktion som ska maximeras. Andraderivatan med avseende på en enskild variabel är ett mått på krökningen i just den variabelns riktning. Denna krökning kan vara mycket mindre (vilket motsvarar större krökningsradie), vilket i sin tur leder till att extremvärdet förläggs längre bort. Parametern h ges därför ett värde som är mindre än 1. Därefter normeras de preliminära värdena på sätt som angivits ovan, så att bivillkoren uppfylls. Följande iterativa steg kan nu beskrivas genom successiva upprepningar av ( ) - ( ). Den iterativa processen beskrivs genom att de nya värdena för α x, κ(t) och β x i iterationen sätts till α (ν+1) x = α (ν) x + c β (ν) x, ( ) κ (ν+1) (t) = (κ (ν) (t) c) d, ( ) β (ν+1) x = β (ν) x /d, ( ) där

87 Modeller för livslängd och dödlighet 87 c = 1 κ (ν) (t) ( ) n t och d = β x (ν). ( ) x I tillämpningar kan man till exempel välja h till 0, 1 eller 0, 05. Tillräcklig noggrannhet uppnås då normalt efter iterationer. Andra värden på h kan också användas även om de bör hållas relativt små Exempel på utjämning av observerad dödlighet med Lee-Carter För att ge en kortfattad information om hur resultatet i en Lee-Carter-utredning kan se ut skall vi här ge en liten inblick i de resultat som står att nna i [?]. I arbetet med att ta fram dessa resultat har arbetsgruppen för DUS-utredningen gjort en stor insats och särskilt har Bengt von Bahr och Ellinor Samuelsson haft en stor del. Arbetet med trendskattningar vilar som nämnts på det underlag som SCB producerar varje år. Syftet är att illustrera en utjämning av observerade dödligheter med trendanpassning. För att skatta trenden i dödligheten använder man befolkningsdödligheten. Det har sin grund i att befolkningsdödligheten är mer homogen än respektive dödlighet i olika försäkringsbestånd. Observationer från åren ingår i utredningen. Data består i antalet dödsfall under den tidsperioden tillsammans folkmängden vid respektive års slut. Aktuella åldrar som ingår är 0 till 99 år. Som kuriosa kan nämnas att befolkningsdödligheten 1968 nns i Tabellerna E.1-6. Man skattar de i modellen ingående parametrarna och kan på så sätt illustrera dödlighetsprognoserna för de olika åldrarna. Exempel på en sådan illustration ges i Figur 10. För en mer omfattande beskrivning av trendskattningar i befolkningsdödligheten hänvisas till [?].

88 88 Modeller för livslängd och dödlighet Figur 1.10: Ettåriga dödssannolikheter - kvinnor. Källa: DUS. Utgående enbart från befolkningsdödligheten kan man inte dra långtgående slutsatser om framtida försäkringsdödlighet. Orsakerna är era, bland annat är det svårt att ta fram trovärdiga historiska data från försäkringsföretagen. Detta beror ofta på tekniska förändringar i datasystem och andra tekniska förändringar. Vidare förändras produkter ständigt vilket gör att bestånden mellan olika år förändras. Vad gäller befolkningsdödligheten vet vi att den historiskt har förändrats hela tiden. Metoden att överföra trenderna från befolkningsdödligheten till försäk-ringsdödligheten låter sig göras genom att kvotförfarande av följande typ k i,b x = µi x µ B x ( ) är död- där µ i x är dödlighetsintensiteten för respektive försäkringsbestånd och µ B x lighetsintensiteten för befolkningen, per ålder x. Som ett alternativ till en fullständig Lee-Carter-anpassning kan man välja att arbeta med en modierad Makeham-anpassning. Låt oss först titta på en traditionell Makeham-anpassning vilket vi ser i Tabell 1 där vi väljer att ge skattningarna för parametrarna i Makehammodellen. Detta är ju som vi sett tidigare ett trubbigt verktyg om man vill blicka in i framtiden. Vad man istället kan göra är att titta på olika kohorter. Vi har valt att återge beståndet frivilligt försäkrade, kvinnor, se Tabell 2.

Vi tittar också på Makehams fördelning som är den mest tillämpade livslängdsmodellen i Sverige. Historia om livslängdstabeller 2

Vi tittar också på Makehams fördelning som är den mest tillämpade livslängdsmodellen i Sverige. Historia om livslängdstabeller 2 Abstract Den här föreläsningen introducerar en stokastisk modell för livslängder. Speciellt definierar vi livslängd, fördelningsfunktion, dödlighetsintensitet och överlevelsefunktion. Vi tittar också på

Läs mer

Boken är tänkt att ersätta tidigare kurslitteratur som används i kursen Livförsäkringsmatematik I som ges vid Stockholms universitet.

Boken är tänkt att ersätta tidigare kurslitteratur som används i kursen Livförsäkringsmatematik I som ges vid Stockholms universitet. Livförsäkringsmatematik andra upplagan Inledning Litteraturen för inledande kurser inom livförsäkring på svenska högskolor och universitet har, på grund av den omfattande utvecklingen i livförsäkringsbranschen

Läs mer

STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. Matematisk statistik, GA 08 januari 2015. Lösningar

STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. Matematisk statistik, GA 08 januari 2015. Lösningar STOCKHOLMS UNIVERSITET MT712 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, GA 8 januari 215 Lösningar Tentamen i Livförsäkringsmatematik I, 8 januari 215 Uppgift 1 a) Först konstaterar

Läs mer

Tentamen i Livförsäkringsmatematik I, 22 mars 2006

Tentamen i Livförsäkringsmatematik I, 22 mars 2006 STOCKHOLMS UNIVERSITET MS 2070 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, GA 22 mars 2006 Lösningar Tentamen i Livförsäkringsmatematik I, 22 mars 2006 Uppgift 1 a) Eftersom T x är likformigt

Läs mer

SF1911: Statistik för bioteknik

SF1911: Statistik för bioteknik SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion

Läs mer

Laborationer till kursen Livförsäkringsmatematik I

Laborationer till kursen Livförsäkringsmatematik I Laborationer till kursen Livförsäkringsmatematik I OBS: Texten i laborationerna är till viss del formulerad för att passa med Excel. Valet av verktyg för att genomföra laborationerna är emellertid ingalunda

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska

Läs mer

TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer

TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer TATA42: Föreläsning 7 Differentialekvationer av första ordningen och integralekvationer Johan Thim 0 januari 207 Introduktion En differentialekvation (DE) i en variabel är en ekvation som innehåller både

Läs mer

4 Diskret stokastisk variabel

4 Diskret stokastisk variabel 4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används

Läs mer

Föreläsning 8 för TNIU23 Integraler och statistik

Föreläsning 8 för TNIU23 Integraler och statistik Föreläsning 8 för TNIU Integraler och statistik Krzysztof Marciniak ITN, Campus Norrköping, krzma@itn.liu.se www.itn.liu.se/ krzma ver. - 9--6 Inledning - lite om statistik Statistik är en gren av tillämpad

Läs mer

Livslängdsantagande i trafikskadelivräntor

Livslängdsantagande i trafikskadelivräntor 2016-03-31 Livslängdsantagande i trafikskadelivräntor Studie genomförd 2015-2016 Svensk Försäkring Box 24043 104 50 Stockholm Karlavägen 108 Tel 08-522 785 00 www.svenskforsakring.se Innehåll 1 Sammanfattning...

Läs mer

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk

Läs mer

Övning 1 Sannolikhetsteorins grunder

Övning 1 Sannolikhetsteorins grunder Övning 1 Sannolikhetsteorins grunder Två händelser A och B är disjunkta om {A B} =, det vill säga att snittet inte innehåller några element. Om vi har en mängd händelser A 1, A 2, A 3,..., A n, vilka är

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse

Läs mer

Matematik 3c Kap 2 Förändringshastighet och derivator

Matematik 3c Kap 2 Förändringshastighet och derivator Matematik 3c Kap 2 Förändringshastighet och derivator Inledning Konkretisering av ämnesplan (länk) http://www.ioprog.se/public_html/ämnesplan_matematik/struktur_äm nesplan_matematik/struktur_ämnesplan_matematik.html

Läs mer

Laboration 1 - Utjämning med Makehams formel

Laboration 1 - Utjämning med Makehams formel Laborationer OBS: Texten i laborationerna är till viss del formulerad för att passa med Excel. Valet av verktyg för att genomföra laborationerna är emellertid ingalunda nödvändigt att vara Excel. För att

Läs mer

Lite Kommentarer om Gränsvärden

Lite Kommentarer om Gränsvärden Lite Kommentarer om Gränsvärden På föreläsningen (Föreläsning 2 för att vara eakt) så introducerade vi denitionen Denition. Vi säger att f() går mot a då går mot oändligheten, uttryckt i symboler som f()

Läs mer

Weibullanalys. Maximum-likelihoodskattning

Weibullanalys. Maximum-likelihoodskattning 1 Weibullanalys Jan Enger Matematisk statistik KTH Weibull-fördelningen är en mycket viktig fördelning inom tillförlitlighetsanalysen. Den används ofta för att modellera mekaniska komponenters livslängder.

Läs mer

TATA42: Föreläsning 3 Restterm på Lagranges form

TATA42: Föreläsning 3 Restterm på Lagranges form TATA4: Föreläsning 3 Restterm på Lagranges form Johan Thim 9 mars 9 Lagranges form för resttermen Vi har tidigare använt resttermen på ordo-form med goda resultat. Oftast i samband med gränsvärden, extrempunktsundersökningar

Läs mer

Föreläsningen ger en introduktion till differentialekvationer och behandlar stoff från delkapitel 18.1, 18.3 och 7.9 i Adams. 18.

Föreläsningen ger en introduktion till differentialekvationer och behandlar stoff från delkapitel 18.1, 18.3 och 7.9 i Adams. 18. Föreläsningen ger en introduktion till differentialekvationer och behandlar stoff från delkapitel 18.1, 18.3 och 7.9 i Adams. 18.1 Delkapitlet introducerar en del terminologi och beteckningar som används.

Läs mer

Nya antaganden om dödlighet i tryggandegrunderna Bilaga 1

Nya antaganden om dödlighet i tryggandegrunderna Bilaga 1 PROMEMORIA Datum 2007-11-02 Författare Bengt von Bahr Dnr 07-2156-200 Nya antaganden om dödlighet i tryggandegrunderna Bilaga 1 Finansinspektionen P.O. Box 6750 SE-113 85 Stockholm [Sveavägen 167] Tel

Läs mer

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p) Avd. Matematisk statistik TENTAMEN I SF190 (f d 5B2501 ) SANNOLIKHETSLÄRA OCH STATISTIK FÖR - ÅRIG MEDIA MÅNDAGEN DEN 1 AUGUSTI 2012 KL 08.00 1.00. Examinator: Gunnar Englund, tel. 07 21 7 45 Tillåtna

Läs mer

Tentamen SF e Januari 2016

Tentamen SF e Januari 2016 Tentamen SF6 8e Januari 6 Hjälpmedel: Papper, penna. poäng per uppgift totalt poäng. Betg E är garanterat vid 6 poäng, betg D vid poäng, betg vid C poäng, betg B vid 8 poäng och betg A vid poäng. För de

Läs mer

Lennart Carleson. KTH och Uppsala universitet

Lennart Carleson. KTH och Uppsala universitet 46 Om +x Lennart Carleson KTH och Uppsala universitet Vi börjar med att försöka uppskatta ovanstående integral, som vi kallar I, numeriskt. Vi delar in intervallet (, ) i n lika delar med delningspunkterna

Läs mer

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II Sannolikhetslära och inferens II Kapitel 4 Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar 1 Kontinuerliga slumpvariabler En slumpvariabel som kan anta alla värden på något intervall sägs

Läs mer

R AKNE OVNING VECKA 2 David Heintz, 13 november 2002

R AKNE OVNING VECKA 2 David Heintz, 13 november 2002 RÄKNEÖVNING VECKA 2 David Heintz, 3 november 22 Innehåll Uppgift 29.4 2 Uppgift 29. 3 3 Uppgift 29.2 5 4 Uppgift 3. 7 5 Uppgift 3. 9 6 Uppgift 3.2 Uppgift 29.4 Prove that ln( + x) x for x >, and that ln(

Läs mer

f(x + h) f(x) h f(x) f(x h) h

f(x + h) f(x) h f(x) f(x h) h NUMPROG, D för M, vt 008 Föreläsning N: Numerisk derivering och integrering Inledning: numerisk lösning av analytiska problem Skillnader mellan matematisk analys och numeriska metoder. Grundläggande begrepp

Läs mer

Föresläsningsanteckningar Sanno II

Föresläsningsanteckningar Sanno II Föresläsningsanteckningar 1 Gammafunktionen I flera av våra vanliga sannolikhetsfördelningar ingår den s.k. gamma-funktionen. Γ(p) = 0 x p 1 e x dx vilken är definierad för alla reella p > 0. Vi ska här

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer

Läs mer

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde

Läs mer

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

SF1633, Differentialekvationer I Tentamen, torsdagen den 7 januari Lösningsförslag. Del I

SF1633, Differentialekvationer I Tentamen, torsdagen den 7 januari Lösningsförslag. Del I Institutionen för matematik, KTH Serguei Shimorin SF6, Differentialekvationer I Tentamen, torsdagen den 7 januari 26 Lösningsförslag Del I Moduluppgift En liter av lösningen som innehåller 2 gram av kemiska

Läs mer

SF1625 Envariabelanalys Lösningsförslag till tentamen

SF1625 Envariabelanalys Lösningsförslag till tentamen SF1625 Envariabelanalys Lösningsförslag till tentamen 216-6-1 1. Derivera nedanstående funktioner med avseende på x och ange för vilka x derivatan existerar. Endast svar krävs. A. f(x) = arctan 1 x B.

Läs mer

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler Jörgen Säve-Söderbergh Stokastisk variabel Singla en slant två gånger. Ω = {Kr Kr, Kr Kl, Kl Kr, Kl Kl}

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" September 2011 Inledning Introduktion till demografi Inledning Demografer (befolkningsanalytiker) studerar befolkningens sammansättning och dess förändringar.

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.

Läs mer

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p) Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 74 16. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

SF1625 Envariabelanalys Tentamen Lördagen den 11 januari, 2014

SF1625 Envariabelanalys Tentamen Lördagen den 11 januari, 2014 SF65 Envariabelanalys Tentamen Lördagen den januari, 04 Skrivtid: 9:00-4:00 Tillåtna hjälpmedel: inga Examinator: Bengt Ek, Maria Saprykina Tentamen består av nio uppgifter som vardera ger maximalt fyra

Läs mer

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p) Avd. Matematisk statistik TENTAMEN I SF90 OCH SF905 SANNOLIKHETSTEORI OCH STATISTIK, FREDAGEN DEN 4:E MARS 204 KL 4.00 9.00. Kursledare: För D och Media: Gunnar Englund, 073 32 37 45 Kursledare: För F:

Läs mer

Maclaurins och Taylors formler. Standardutvecklingar (fortsättning), entydighet, numerisk beräkning av vissa uttryck, beräkning

Maclaurins och Taylors formler. Standardutvecklingar (fortsättning), entydighet, numerisk beräkning av vissa uttryck, beräkning Maclaurins och Taylors formler Standardutvecklingar (fortsättning), entydighet, numerisk beräkning av vissa uttryck, beräkning av gränsvärden Standardutvecklingar Vid beräkningar där man inte behöver någon

Läs mer

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor Kontinuerliga stokastiska variabler Exempel En stokastisk variabel är kontinuerlig om den kan anta vilka värden som helst i ett intervall, men sannolikheten för varje enskilt utfall är noll: P(X = x) =.

Läs mer

Tentamen i Matematisk analys MVE045, Lösningsförslag

Tentamen i Matematisk analys MVE045, Lösningsförslag Tentamen i Matematisk analys MVE5 26-8-23 Lösningsförslag Kl. 8.3 2.3. Tillåtna hjälpmedel: Mathematics handbook for science and engineering (BE- TA) eller CRC Standard Mathematical Tables. Indexeringar

Läs mer

Lösningar till tentamen i Transformmetoder okt 2007

Lösningar till tentamen i Transformmetoder okt 2007 Lösningar till tentamen i Transformmetoder okt 7. Låt Y (s beteckna Laplacetransformen till funktionen y. Laplacetransformering av den givna ekvationen ger: varav följer att. (a För s > a är Y (s + s Y

Läs mer

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:... Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för

Läs mer

TMS136. Föreläsning 4

TMS136. Föreläsning 4 TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,

Läs mer

0 om x < 0, F X (x) = c x. 1 om x 2.

0 om x < 0, F X (x) = c x. 1 om x 2. Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 4 7 november 2017 1 / 29 Idag Förra gången Viktiga kontinuerliga fördelningar (Kap. 3.6) Fördelningsfunktion (Kap. 3.7) Funktioner av stokastiska

Läs mer

1 Föreläsning V; Kontinuerlig förd.

1 Föreläsning V; Kontinuerlig förd. Föreläsning V; Kontinuerlig förd. Ufallsrummet har hittills varit dsikret, den stokastisk variabeln har endast kunnat anta ett antal värden. Ex.vis Poissonfördeln. är antal observationer inom ett tidsintervall

Läs mer

5 Blandade problem. b(t) = t. b t ln b(t) = e

5 Blandade problem. b(t) = t. b t ln b(t) = e 5 Blandade problem 5.1 Dagens Teori Ett person sätter in 10000 kr på banken vid nyår 2000 till 4% ränta. Teckna en funktion, b(t) för beloppets utveckling. b(t) = 10000 1.04 t Skriv om funktionen med basen

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Tillämpningar av integraler: Area, skivformeln för volymberäkning, båglängd, rotationsarea, integraler och summor

Tillämpningar av integraler: Area, skivformeln för volymberäkning, båglängd, rotationsarea, integraler och summor Tillämpningar av integraler: Area, skivformeln för volymberäkning, båglängd, rotationsarea, integraler och summor Areaberäkningar En av huvudtillämpningar av integraler är areaberäkning. Nedan följer ett

Läs mer

Instuderingsfrågor i Funktionsteori

Instuderingsfrågor i Funktionsteori Instuderingsfrågor i Funktionsteori Anvisningar. Avsikten med dessa instuderingsfrågor är att ge Dig möjlighet att fortlöpande kontrollera att Du någorlunda behärskar kursens teori. Om Du märker att Du

Läs mer

Matematisk statistik TMS064/TMS063 Tentamen

Matematisk statistik TMS064/TMS063 Tentamen Matematisk statistik TMS64/TMS63 Tentamen 29-8-2 Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.

Läs mer

TENTAPLUGG.NU AV STUDENTER FÖR STUDENTER. Kursnamn Fysik 1. Datum LP Laboration Balkböjning. Kursexaminator. Betygsgränser.

TENTAPLUGG.NU AV STUDENTER FÖR STUDENTER. Kursnamn Fysik 1. Datum LP Laboration Balkböjning. Kursexaminator. Betygsgränser. TENTAPLUGG.NU AV STUDENTER FÖR STUDENTER Kurskod F0004T Kursnamn Fysik 1 Datum LP2 10-11 Material Laboration Balkböjning Kursexaminator Betygsgränser Tentamenspoäng Övrig kommentar Sammanfattning Denna

Läs mer

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A SF165 Envariabelanalys Lösningsförslag till tentamen 15-4-7 DEL A 1. Låt f(x) = arcsin x + 1 x. A. Bestäm definitionsmängden till funktionen f. B. Bestäm funktionens största och minsta värde. (Om du har

Läs mer

Oberoende stokastiska variabler

Oberoende stokastiska variabler Kapitel 6 Oberoende stokastiska variabler Betrakta ett försök med ett ändligt (eller högst numrerbart) utfallsrum Ω samt två stokastiska variabler ξ och η med värdemängderna Ω ξ och Ω η. Vi bildar funktionen

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Väntevärde, varians, standardavvikelse, kvantiler Uwe Menzel, 28 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Väntevärdet X : diskret eller kontinuerlig slumpvariable

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1913 MATEMATISK STATISTIK FÖR IT OCH ME ONSDAGEN DEN 12 JANUARI 2011 KL 14.00 19.00. Examinator: Camilla Landén, tel. 7908466. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

TAMS79: Föreläsning 6. Normalfördelning

TAMS79: Föreläsning 6. Normalfördelning TAMS79: Föreläsning 6 Normalfördelningen Johan Thim (johan.thim@liu.se 3 november 018 Normalfördelning Definition. Låt µ R och > 0. Om X är en stokastisk variabel med täthetsfunktion f X ( = 1 ( ep ( µ,

Läs mer

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A

SF1625 Envariabelanalys Lösningsförslag till tentamen DEL A SF625 Envariabelanalys Lösningsförslag till tentamen 206-0- DEL A. Betrakta funktionen f som ges av f(x) = x 2 arctan x. A. Bestäm definitionsmängden till f. B. Bestäm de intervall där f är växande respektive

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012

Läs mer

Omtentamen i DV & TDV

Omtentamen i DV & TDV Umeå Universitet Institutionen för Datavetenskap Gunilla Wikström (e-post wikstrom) Omtentamen i Teknisk-Vetenskapliga Beräkningar för DV & TDV Tentamensdatum: 2006-06-05 Skrivtid: 9-15 Hjälpmedel: inga

Läs mer

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik

Läs mer

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p) Avd. Matematisk statistik TENTAMEN I SF90, SF905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 8:E AUGSTI 204 KL 08.00 3.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel- och

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" November 2011 Repetition Vad vi gjort hitills Vi har börjat med att studera olika typer av mätningar och sedan successivt tagit fram olika beskrivande mått

Läs mer

TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar

TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar Johan Thim 9 januari 27 Entydighet Om vi har ett polynom som approximerar en snäll funktion bra, kan vi då vara säkra på att koefficienterna

Läs mer

Lufttorkat trä Ugnstorkat trä

Lufttorkat trä Ugnstorkat trä Avd. Matematisk statistik TENTAMEN I SF1901 och SF1905 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 18:E OKTOBER 2012 KL 14.00 19.00. Examinator: Tatjana Pavlenko, tel 790 8466. Tillåtna hjälpmedel:

Läs mer

TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar

TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar TATA42: Föreläsning 2 Tillämpningar av Maclaurinutvecklingar Johan Thim 24 mars 29 Entydighet Om vi har ett polynom som approimerar en snäll funktion bra, kan vi då vara säkra på att koefficienterna i

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler Johan Thim (johan.thim@liu.se) 1 november 18 Vi fokuserar på två-dimensionella variabler. Det är steget från en dimension till två som är det

Läs mer

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2 LINKÖPINGS UNIVERSITET Matematiska institutionen EXAM TAMS 27 / TEN 2 augusti 218, klockan 8.-12. Examinator: Jörg-Uwe Löbus (Tel: 79-62827) Tillåtna hjälpmedel är en räknare, formelsamling i matematisk

Läs mer

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs. Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 31:E MAJ 2012 KL 08.00 13.00. Examinator: Tobias Rydén, tel 790 8469. Kursledare: Tatjana Pavlenko, tel 790 8466.

Läs mer

TATA42: Föreläsning 6 Potensserier

TATA42: Föreläsning 6 Potensserier TATA4: Föreläsning 6 Potensserier Johan Thim januari 7 Vi ska nu betrakta serier där termerna inte längre är konstanter. Speciellt ska vi studera så kallade potensserier. Dessa definieras som a k x k a

Läs mer

Kovarians och kriging

Kovarians och kriging Kovarians och kriging Bengt Ringnér November 2, 2007 Inledning Detta är föreläsningsmanus på lantmätarprogrammet vid LTH. 2 Kovarianser Sedan tidigare har vi, för oberoende X och Y, att VX + Y ) = VX)

Läs mer

Studietips inför kommande tentamen TEN1 inom kursen TNIU23

Studietips inför kommande tentamen TEN1 inom kursen TNIU23 Studietips inför kommande tentamen TEN1 inom kursen TNIU23 Lämplig ordning på sammanfattande studier inom denna kurs: Inled med att grundligt studera föreläsningsanteckningarna Därefter läs tillhörande

Läs mer

D 1 u(x, y) = e x (1 + x + y 2 ), D 2 u(x, y) = 2ye x + 1, (x, y) R 2.

D 1 u(x, y) = e x (1 + x + y 2 ), D 2 u(x, y) = 2ye x + 1, (x, y) R 2. Differentialekvationer I Modellsvar till räkneövning 4 De frivilliga uppgifterna U1 och U2 påminner om nyttiga kunskaper, och räknas inte för extrapoäng (fråga vid behov). U1. Sök en potentialfunktion

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

SF1544 LABORATION 2 INTEGRATION, MONTE-CARLO OCH BLACK-SCHOLES EKVATION FÖR OPTIONER

SF1544 LABORATION 2 INTEGRATION, MONTE-CARLO OCH BLACK-SCHOLES EKVATION FÖR OPTIONER SF1544 LABORATION INTEGRATION, MONTE-CARLO OCH BLACK-SCHOLES EKVATION FÖR OPTIONER Avsikten med denna laboration är att: - snabbt komma igång med träning på matlabprogrammering (uttnyttja gärna alla schemalagda

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd

Läs mer

Om existens och entydighet av lösningar till ordinära differentialekvationer

Om existens och entydighet av lösningar till ordinära differentialekvationer Om existens och entydighet av lösningar till ordinära differentialekvationer Anders Källén 11 maj 2016 1 Introduktion I det här kapitlet ska vi diskutera vad vi allmänt kan säga om lösningar till ett system

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

1 Stokastiska processer. 2 Poissonprocessen

1 Stokastiska processer. 2 Poissonprocessen 1 Stokastiska processer En stokastisk process är en stokastisk variabel X(t), som beror på en parameter t, kallad tiden. Tiden kan vara kontinuerlig, eller diskret (i vilket fall man brukar beteckna processen

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016

Läs mer

TATA42: Föreläsning 8 Linjära differentialekvationer av högre ordning

TATA42: Föreläsning 8 Linjära differentialekvationer av högre ordning TATA42: Föreläsning 8 Linjära differentialekvationer av högre ordning Johan Thim 23 april 2018 1 Differentialoperatorer För att underlätta notation och visa på underliggande struktur introducerar vi begreppet

Läs mer

SF1625 Envariabelanalys Tentamen Måndagen den 11 januari 2016

SF1625 Envariabelanalys Tentamen Måndagen den 11 januari 2016 SF625 Envariabelanalys Tentamen Måndagen den januari 206 Skrivtid: 08:00-3:00 Tillåtna hjälpmedel: inga Examinator: Lars Filipsson Tentamen består av nio uppgifter som vardera ger maximalt fyra poäng.

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF1901: Sannolikhetslära och statistik Föreläsning 6. Normalfördelning, Centrala gränsvärdessatsen, Approximationer Jan Grandell & Timo Koski 06.02.2012 Jan Grandell & Timo Koski () Matematisk statistik

Läs mer

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1. Avd. Matematisk statistik TENTAMEN I SF9, SF95 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 2:E JANUARI 25 KL 4. 9.. Kursledare: Gunnar Englund, 73 32 37 45 Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Något om Taylors formel och Mathematica

Något om Taylors formel och Mathematica HH/ITE/BN Taylors formel och Mathematica Något om Taylors formel och Mathematica Bertil Nilsson 207-0-0 I am the best Ett av Brooks många ödmjuka inlägg i den infekterade striden som under början av 700

Läs mer

Numerisk Analys, MMG410. Lecture 13. 1/58

Numerisk Analys, MMG410. Lecture 13. 1/58 Numerisk Analys, MMG410. Lecture 13. 1/58 Interpolation För i tiden gällde räknesticka och tabeller. Beräkna 1.244 givet en tabel över y = t, y-värdena är givna med fem siffror, och t = 0,0.01,0.02,...,9.99,10.00.

Läs mer

Svar till vissa uppgifter från första veckan.

Svar till vissa uppgifter från första veckan. Svar till vissa uppgifter från första veckan. Svar till kortuppgifter F:. Ja! Förhoppningsvis så ser man direkt att g fx) är ett polynom. Vidare så gäller det att g fα) = gfα)) = gβ) = 0. Använd faktorsatsen!

Läs mer

LMA515 Matematik, del B Sammanställning av lärmål

LMA515 Matematik, del B Sammanställning av lärmål LMA515 Matematik, del B Sammanställning av lärmål Lärmål för godkänt Funktion, gränsvärde, kontinuitet, derivata. Förklara begreppen funktion, definitionsmängd och värdemängd, och bestämma (största möjliga)

Läs mer

Statistisk analys av komplexa data

Statistisk analys av komplexa data Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data

Läs mer

Institutionen för Matematik, KTH Lösningar till tentamen i Analys i en variabel för I och K (SF1644) 1/ e x h. (sin x) 2 1 cos x.

Institutionen för Matematik, KTH Lösningar till tentamen i Analys i en variabel för I och K (SF1644) 1/ e x h. (sin x) 2 1 cos x. Institutionen för Matematik, KTH Lösningar till tentamen i Analys i en variabel för I och K (SF644) /6 29. Bestäm med derivatans definition d dx ex. Derivatans definition är f (x) = lim h h ( f(x + h)

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF90/SF9 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAG 5 JUNI 09 KL 4.00 9.00. Examinator: Björn-Olof Skytt, 08-790 86 49. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p) Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel-

Läs mer