Stokastisk reservsättning med Tweedie-modeller och bootstrap-simulering

Relevanta dokument
Test av anpassning, homogenitet och oberoende med χ 2 - metod

Centrala Gränsvärdessatsen:

Flode. I figuren har vi också lagt in en rät linje som någorlunda väl bör spegla den nedåtgående tendensen i medelhastighet för ökande flöden.

Experimentella metoder 2014, Räkneövning 5

Beräkna standardavvikelser för efterfrågevariationer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 6. Regression & Korrelation. (LLL Kap 13-14) Inledning till Regressionsanalys

Slumpvariabler (Stokastiska variabler)

Tentamen i Dataanalys och statistik för I den 5 jan 2016

a) B är oberoende av A. (1p) b) P (A B) = 1 2. (1p) c) P (A B) = 1 och P (A B) = 1 6. (1p) Lösningar: = P (A) P (A B) = 1

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

En reservberäkningsmetodik baserad på enskilda skador

FORMELSAMLING HT-15 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02. Sannolikhetsteori. Beskrivning av data

ENKEL LINJÄR REGRESSION

1. a Vad menas med medianen för en kontinuerligt fördelad stokastisk variabel?

Mätfelsbehandling. Lars Engström

Thomas Macks beräkning av standardfelet för reservavsättningar

Vinst (k) Sannolikhet ( )

Utbildningsavkastning i Sverige

Förklaring:

VALUE AT RISK. En komparativ studie av beräkningsmetoder. VALUE AT RISK A comparative study of calculation methods. Fredrik Andersson, Petter Finn

Dödlighetsundersökningar på KPA:s

Arbetslivsinriktad rehabilitering för sjukskrivna arbetslösa funkar det?

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Del A Begrepp och grundläggande förståelse.

Primär- och sekundärdata. Undersökningsmetodik. Olika slag av undersökningar. Beskrivande forts. Beskrivande forts

Matrismodellen vs Two-part regressionsmodeller -effekter på Region Skånes resursfördelning-

Sammanfattning. Härledning av LM - kurvan. Efterfrågan, Z. Produktion, Y. M s. M d inkomst = Y >Y. M d inkomst = Y

Modellering av antal resor och destinationsval

Blixtkurs i komplex integration

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Beräkna standardavvikelser för efterfrågevariationer

Tentamen i MATEMATISK STATISTIK Datum: 8 Juni 07

KVALITETSDEKLARATION

En studiecirkel om Stockholms katolska stifts församlingsordning

Citeringsstudie av natur och samhällsvetenskapliga institutioner vid Stockholms universitet,

Föreläsning G70 Statistik A

Mos. Statens väg- ochtrafi V" NationalRoad&Traffic Research Institute- $-58101Li: Lä & t # % p. i E d $ åv 3 %. ISSN

Fond-i-fonder. med global placeringsinriktning. Ett konkurrenskraftigt alternativ till globalfonder? En jämförelse med fokus på risk och avkastning.

Kompenserande löneskillnader för pendlingstid

Undersökning av vissa försäkringsantaganden i efterlevandepension för anställda i kommuner och landstinget och dess påverkan på prissättningen

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

saknar reella lösningar. Om vi försöker formellt lösa ekvationen x 1 skriver vi x 1

Fördelning av kvarlåtenskap vid arvsskifte

FK2002,FK2004. Föreläsning 5

Postadress: Internet: Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Sverige

Introduktionsersättning eller socialbidraghar ersättningsregim betydelse för integrationen av flyktingar? 1

Partikeldynamik. Fjädervåg. Balansvåg. Dynamik är läran om rörelsers orsak.

1. Inledning s Teori bakom reversionspendeln s. 3

Företagsrådgivning i form av Konsultcheckar. Working paper/pm

Lönebildningen i Sverige

Sammanfattning, Dag 1

Projekt i transformetoder. Rikke Apelfröjd Signaler och System rikke.apelfrojd@signal.uu.se Rum 72126

DAGLIGVARUPRISERNA PÅ ÅLAND

Innehåll: har missbrukat jämfört med om man inte har. missbrukat. Risk 1 Odds Risk. Odds 1 Risk. Odds

När vi räknade ut regressionsekvationen sa vi att denna beskriver förhållandet mellan flera variabler. Man försöker hitta det bästa möjliga sättet

Balansering av vindkraft och vattenkraft i norra Sverige. Elforsk rapport 09:88

Beräkning av Sannolikheter för Utfall i Fotbollsmatcher

Klarar hedgefonder att skapa positiv avkastning oavsett börsutveckling? En empirisk studie av ett urval svenska hedgefonder

N A T U R V Å R D S V E R K E T

Att identifiera systemviktiga banker i Sverige vad kan kvantitativa indikatorer visa oss?

Viltskadestatistik 2014 Skador av fredat vilt på tamdjur, hundar och gröda

Partikeldynamik. Dynamik är läran om rörelsers orsak.

Prissättningen av bostadsrätter: Vilka faktorer påverkar priserna, vad är riktpriset för en lägenhet?

Tentamen (TEN2) Maskininlärning (ML) 5hp 21IS1C Systemarkitekturutbildningen. Tentamenskod: Inga hjälpmedel är tillåtna

Performansanalys LHS/Tvåspråkighet och andraspråksinlärning Madeleine Midenstrand

Optimering i samband med produktionsplanering av, och materialförsörjning vid, underhåll av flygmotorer

Lösningar modul 3 - Lokala nätverk

KOMMISSIONENS DELEGERADE FÖRORDNING (EU) / av den

2B1115 Ingenjörsmetodik för IT och ME, HT 2004 Omtentamen Måndagen den 23:e aug, 2005, kl. 9:00-14:00

Tillämpningar av dekomposition: Flervaruflödesproblemet. Flervaruflödesproblemet: Lagrangeheuristik

Riktlinjer för avgifter och ersättningar till kommunen vid insatser enligt LSS

Jag vill tacka alla på företaget som har delat med sig av sina kunskaper och erfarenheter vilket har hjälpt mig enormt mycket.

Ekonomihögskolan Lunds Universitet Vårterminen Priset på Poker. En studie av efterfrågeelasticiteten på Internetpoker.

En kort introduktion till principalkomponenttransformation och kanonisk diskriminantanalys av multispektrala data

Oljeprisets inverkan på oljerelaterade aktier

5.4 Feluppskattning vid lösning av ekvationssystem.

Effekter av kön, ålder och region på sjukpenningen i Sverige

Almedalsveckan Snabba fakta om aktuella ämnen under Almedalsveckan Ungas ingångslöner. Stark som Pippi? Löner och inflation

Gymnasial yrkesutbildning 2015

Skoldemokratiplan Principer och guide till elevinflytande

Något om beskrivande statistik

2 Jämvikt. snitt. R f. R n. Yttre krafter. Inre krafter. F =mg. F =mg

Bankernas kapitalkrav med Basel 2

Industrins förbrukning av inköpta varor (INFI) 2008

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

Lektion 8 Specialfall, del I (SFI) Rev HL

Förstärkare Ingångsresistans Utgångsresistans Spänningsförstärkare, v v Transadmittansförstärkare, i v Transimpedansförstärkare, v i

för alla i Landskrona

Steg 1 Arbeta med frågor till filmen Jespers glasögon

A2009:004. Regional utveckling i Sverige. Flerregional integration mellan modellerna STRAGO och raps. Christer Anderstig och Marcus Sundberg

Industrins förbrukning av inköpta varor INFI

Hur har Grön Flagg-rådet/elevrådet arbetat och varit organiserat? Hur har rådet nått ut till resten av skolan?

Arbetskraftskostnadsindex 2008=100

Optimering av underhållsplaner leder till strategier för utvecklingsprojekt

Faradays lag. ger. Låt oss nu bestämma den magnetiska energin för N st kopplade kretsar. Arbetet som kretsarnas batterier utför är

Nyföretagande inom den offentliga sektorn ett lönelyft för de anställda Johan Kreicbergs och Carl Oreland

Konsoliderad version av

TNK049 Optimeringslära

Mätfelsbehandling. Medelvärde och standardavvikelse

Transkript:

Matematsk statstk Stockholms unverstet Stokastsk reservsättnng med Tweede-modeller och bootstrap-smulerng Totte Pkanen Examensarbete 2005:4

Postadress: Matematsk statstk Matematska nsttutonen Stockholms unverstet 106 91 Stockholm Sverge Internet: http://www.matematk.su.se/matstat

Stokastsk reservsättnng med Tweedemodeller och bootstrap-smulerng Totte Pkanen 1 Februar 2005 SAMMANFATTNING För att kunna täcka framtda kostnader för skador som dag ännu nte anmälts samt för skador som rapporterats men nte slutreglerats, avsätter vare försäkrngsbolag medel tll en ersättnngsreserv. Det fnns många tllvägagångssätt för att estmera storleken på reserven. Hstorskt sett har de flesta metoderna endast gett en punktskattnng av det totala reservbehovet. På senare år har det kommt fram en rad olka metoder som förutom punktskattnng även ger ett osäkerhetsmått för reserven. I denna stude undersöks tre olka generalserade lnära modeller, närmare bestämt Tweede-modellerna översprdd Posson, sammansatt Posson och Gamma, som genom bootstrap-smulerng ger en smulerad fördelnng för reserven. Metoderna ämförs med varandra och problem med algortmerna belyses. 1 E-post: Totte.pkanen@trygghansa.se Handledare: Esbörn Ohlsson, Anders Lndström 1

Stochastc clams reservng usng Tweede models and bootstrap smulaton ABSTRACT To be able to cover future expenses caused by clams ncurred but not reported and clams reported but not settled, a general nsurance company must allocate captal to a reserve. There are many approaches to estmate the sze of ths reserve. Hstorcally most of the methods have gven ust a pont estmate of the requred reserve. In recent years a number of methods has been ntroduced whch n addton to a pont estmate gves a measure of the uncertanty n the reserve. In ths study we examne the use of three dfferent generalzed lnear models, namely the Tweede models overdspersed Posson, compound Posson and Gamma, that together wth bootstrap smulaton gves a smulated dstrbuton for the reserve. The methods are compared to each other and problems wth the algorthms are dscussed. 2

FÖRORD Huvuddelen av denna undersöknng genomfördes under våren 2003 på försäkrngsbolaget Trygg-Hansa, aktuareenheten dvson Prvat, Affärsområde Sak, Stockholm. I anuar 2005 återupptogs arbetet med kompletterngar och vssa förändrngar som föld. Undersöknngen utgör ett examensarbete, omfattande 20 poäng för magsterexamen matematsk statstk på Matematsk-datalogska lnen, Stockholms unverstet. Jag vll med detta förord passa på att rkta ett tack tll Trygg-Hansa som och med erbudandet av arbetsplats och egen dator gav mg mölgheten att få en nblck arbetslvet. Stort tack även tll mn handledare på Trygg-Hansa, Anders Lndström, för rådgvnng och väglednng. Mn handledare på Stockholms Unverstet, Esbörn Ohlsson, skall också ha ett stort tack. Tll sst en eloge tll hela den dåvarande aktuaregruppen för trevlgt sällskap samt stöd, råd och tps längs vägen. 3

1 BAKGRUND... 5 1.1 UPPGIFT... 6 2 METODER... 6 2.1 ANTAGANDEN... 6 2.2 BOOTSTRAP-SIMULERING... 7 2.2.1 Bootstrap-algortmen steg för steg... 9 3 DATA... 10 3.1 UTVECKLINGSTRIANGLAR... 10 4 RESULTAT AV TILLÄMPNING PÅ DATA FRÅN TRYGG-HANSA... 12 4.1 MODELLERNAS ANPASSNING TILL DATA... 12 4.1.1 Försäkrngsklass cvl... 13 4.1.2 Försäkrngsklass trafk... 14 4.1.3 Försäkrngsklass olycksfall... 15 4.2 SKATTAD RESERV UTAN BOOTSTRAP... 16 4.3 PARAMETERN φ... 16 4.4 RESIDUALER... 17 4.5 NEGATIVA VÄRDEN I PSEUDOTRIANGLARNA... 17 4.6 SIMULERINGSSTEGET... 18 4.6.1 Fördelnngarnas utseende... 19 4.7 RESULTAT EFTER 1000 ITERATIONER... 21 4.7.1 Försäkrngsklass cvl... 22 4.7.2 Försäkrngsklass trafk... 24 4.7.3 Försäkrngsklass olycksfall... 26 5 SLUTSATSER... 29 6 APPENDIX..... 6.1 PARAMETERBYTE I LOG-LINJÄRA MODELLEN... 31 6.2 PARAMETERSKATTNING OCH HAT -MATRISEN... 31 6.3 FÖRDELNINGAR... 32 6.3.1 Översprdd Posson, OdP... 32 6.3.2 Sammansatt Posson... 32 6.3.3 Gamma... 33 LITTERATUR... 34 4

1 Bakgrund Inom sakförsäkrng händer det att det går lång td från att en skada nträffar tlls slutgltg ersättnng utgår från försäkrngsbolaget. Det kan hända att det går en lång td från skadetllfället tlls skadan anmäls tll bolaget eller att det tar lång td från att skadan anmälts tll bolaget tlls det avgörs vlka belopp som skall utbetalas. I slutet av en försäkrngsperod (vanlgen ett år eller ett kvartal) skall det bolagets bokslut framgå hur mycket medel som avsätts för dessa nträffade men cke slutgltgt reglerade skador. Denna avsättnng av kaptal kallas ofta för ersättnngsreserven. Ersättnngsreserven sn tur brukar delas upp reserv för nträffade men e rapporterade skador, IBNR (Incurred But Not Reported), och reserv för rapporterade men e slutreglerade skador, IBNER (Incurred But Not Enough Reported). Att bestämma denna ersättnngsreserv är ett statstskt problem. Data brukar vara uppställda en trangel kallad utvecklngstrangel där raderna representerar skadeår och kolumnerna utvecklngsår. Elementen utvecklngstrangeln representerar utbetalnngar gorda under utvecklngsår för skador nträffade under skadeår och betecknas y med motsvarande stokastska varabel Y,, = 1,2,... m. Utbetalnngar gorda under utvecklngsår är gorda 1 år efter det att skadan nträffade. Vanlgen antar man att alla skador är slutreglerade efter m år. För (,) med + m + 1 är y kända och den statstska uppgften är att utvdga trangeln tll en kvadrat nnehållande predktoner om framtda utbetalnngar. Trangeln som utgör framtda utbetalnngar kallas här för framtdstrangeln. utvecklngsår skadeår 1 2 3 m-1 m 1 y 11 y 12 y 13 y 1,m-1 y 1,m 2 y 21 y 22 y 23 y 2,m-1.. m-1 y m-1,1 y m-1,2 m y m1 utvecklngsår skadeår 1 2 3 m-1 m 1 y 11 y 12 y 13 y 1,m-1 y 1,m 2 y 21 y 22 y 23 y 2,m-1 Y 2,m.. m-1 y m-1,1 y m-1,2 Y m-1,3 Y m-1,m-1 Y m-1,m m y m1 Y m2 Y m3 Y m,m-1 Y m,m Fgur A: Utvecklngstrangel Fgur B: Utvecklngstrangel och Framtdstrangel Den totala ersättnngsreserven, R, består av summan av Y framtdstrangeln och skattas med R ˆ = ˆ + > m + y 1. Data är här alltså på nkrementell form så att utbetalt under år verklgen betyder utbetalt under år och nte fram tll och med år. Den kanske vanlgaste metoden för att bestämma ersättnngsreserven är Chan Laddermetoden. Metoden är en determnstsk metod som ger en punktskattnng för reserven. På senare år har flera metoder som förutom punktskattnng även ger predktonsfel och vssa fall fördelnng för totala reserven kommt fram. I England & Verrall (2002) görs en sammanställnng av en rad sådana så kallade stokastska reservsättnngsmetoder. England & Verrall (1999) föreslår en översprdd Posson GLM-modell som med bootstrap-smulerng ger en smulerad fördelnng med percentler för totala reserven. Pnhero, Andrade e Slva & Centeno (2002) utvdgar metoden från England & Verrall (1999) med att även undersöka en Gamma GLM-modell samt med en korrgerng av resdualerna som används vd bootstrapsmulerngen. Mack (1993) föreslår en fördelnngsfr metod för att beräkna predktonsfelet hos Chan Ladder-skattnngarna. 5

1.1 Uppgft I detta arbete söker v osäkerheten den totala reserven genom dess fördelnng. Arbetet är tänkt att kunna användas tll att möta kommande EU-lagstftnng för försäkrngsbolag. Lagstftnngen förväntas ställa kaptalkrav som bland annat kommer att bero på osäkerheten reserven. De undersökta modellerna är tre generalserade lnära modeller, GLM, som genom bootstrap-smulerng ger en smulerad fördelnng för totala ersättnngsreserven. Modellerna har logartmsk länkfunkton med den lnära strukturen log( µ ) = c + α + β och varansfunktonen v ( µ ) = µ där p detta arbete är 1, 1.5 eller 2. p Modeller med denna varansfunkton kallas för Tweede-modeller. Modellerna svarar mot fördelnngarna (översprdd) Posson (då p = 1), sammansatt Posson (p = 1.5) resp. Gamma (p = 1.5) varför modellerna detta arbete genomgående kommer att kallas för OdP, SaPo och Gamma även om det egentlgen bara är strukturen på varansfunktonen som är det vktga modellanpassnngen. Vlken aktuell fördelnng som varansfunktonen svarar mot har betydelse endast det ssta steget, smulerngssteget, där det smuleras från dessa fördelnngar framtdstrangeln. 2 Metoder Genom att ansätta en generalserad lnär modell kan ensklda predktoner göras för framtdstrangelns samtlga celler. Det är emellertd komplcerat eller bland omölgt att analytskt beräkna predktonsfelet hos skattnngen för totala reserven som är summan av framtdstrangelns element. Även de fall det går att beräkna predktonsfelet för summan så är dessa beräknngar bara approxmatva (Pnhero, Andrade e Slva & Centeno (2002)). Det är därför bootstrap-smulerng används detta arbete för beräknng av predktonsfelet. Förutom predktonsfelet ger smulerngen även en emprsk fördelnng ur vlken exempelvs percentler kan utläsas. 2.1 Antaganden V gör fölande antaganden. m = (A1) µ E[ Y ] = γ δ, där δ = 1 1. (A2) Y, oberoende då (, ) ( ', ' )., Y ' ' (A3) Fördelnngen för Y tllhör famlen EDM och har varansfunkton där 1,1.5, 2. p { } v ( µ ) = µ p Exponentella dspersonsmodeller, EDM, är famlen av fördelnngar vars frekvensfunkton yθ b( θ ) kan skrvas på formen f Y ( y) = exp + c( y; φ, w), se exempelvs Ohlsson & φ w Johansson (2003) för EDM:s användnng nom GLM. 6

Antagande (A1) nnebär att de utbetalda skadebeloppen modelleras multplkatvt där parametern γ tolkas som en nvåparameter, eller mer specfkt förväntade totala skadekostnaden, för skadeår. Parametern δ tolkas som förväntade proportonen skadekostnad som uppstår under utvecklngsår. Antagande (A2) nnebär helt enkelt att utbetalnngarna olka celler antas vara oberoende och antagande (A3) att de har en varans proportonell mot väntevärdet upphöt tll p. Logartmerng av (A1) bägge leden ger (A1 ) log( µ ) = log( γ ) + log( δ ), där log( δ ) = 0, som genom ett lämplgt m = 1 parameterbyte (se appendx för detaler) och reducerng av en parameter kan skrvas som (A1 ) log( µ ) = c + α + β, där α = β 0. 1 1 = Antagandena (A1), (A2) och (A3) defnerar en generalserad lnär modell, GLM, se McCullagh & Nelder (1989). 2.2 Bootstrap-smulerng Bootstrap-smulerng som en datorbaserad statstsk metod ntroducerades av Efron 1979. Metoden ersätter analytska beräknngar av fördelnng och predktonsfel hos parametrar och statstkor med en smulerngsalgortm. Smulerngsalgortmen går ut på att ur ett gvet stckprov återskapa många nya stckprov genom slumpmässgt urval med återläggnng. En ntrodukton tll bootstrap-metoden fnns Efron & Tbshran (1993). Det fnns olka sätt att gå tll väga bootstrap-algortmen. Här används den typ som kallas för resdual-bootstrap (Efron & Tbshran, 1993) som nnebär att man skapar nya pseudostckprov genom urval med återläggnng bland resdualerna stället för urval bland sälva observatonerna. För detta krävs en resdualdefnton som gör att resdualerna kan betraktas som oberoende och lka fördelade. Här används den standardserade Pearsonresdualen (1) r st r, pearson = φ ˆ(1 h ) där h är dagonalelementet hat -matrsen för observaton y (se appendx för defnton y µ ˆ av hat -matrsen) och r, pearson = är den ostandardserade Pearsonresdualen. v( µ ˆ ) + 2 r + m 1, pearson Sprdnngsparametern φ skattas med Pearsonskattnngen φ ˆ = där df df = n p = antal observatoner antal parametrar är antalet frhetsgrader modellen. ( ) Ur (1) kan y lösas ut vlket ger * (2) y = r φˆ v( µ ˆ )(1 h ) + µ ˆ. 7

Bootsrap-smulerngen börar med att v ur vårt stckprov y r (utvecklngstrangeln) först skapar n resdualer. Sedan skapas genom slumpmässgt urval med återläggnng bland * resdualerna en ny pseudotrangel y r genom relatonen * (2 ) y = r φˆ ' ' v( µ ˆ )(1 h ) + µ ˆ där r ' ' nnebär slumpmässgt vald resdual. På denna psuedotrangel applceras modellen, parametrar skattas och predktoner för vare cell framtdstrangeln görs genom b yˆ exp{ ˆ ˆ ˆ = c + α + β }, + > m + 1. Denna procedur upprepas B gånger och ndex b anger aktuellt teratonsnummer. När predktoner framtdstrangeln gorts smuleras vare cell framtdstrangeln ur den aktuella modellens fördelnng med predktonerna yˆ som väntevärden och parametern φ som skattas vare teratonssteg utgör en parameter den aktuella fördelnngen som det smuleras ur (se appendx för exakt utseende hos fördelnngarna). Sedan summeras dessa smulerade värden framtdstrangeln och v har efter B teratoner B stycken skattade reserver. V får även en emprsk fördelnngsfunkton för obs x totala reserven Fˆ ( x) = # ur vlken percentler kan utläsas. B b Smulerngen sker alltså två steg. I första steget smuleras en pseudotrangel fram genom slumpmässgt urval bland resdualerna. I det andra steget sker smulerng ur den aktuella fördelnngen framtdstrangelns alla celler. Tanken är att fånga upp dels varatonen parameterskattnngarna och dels varatonen framtden. England & Verrall (2002, kaptel 7) uttrycker detta som Predcton varance = Estmaton varance + Process varance. En bootstrap-algortm som efter det första steget skattar den total reserven genom summan av framtdstrangelns celler fångar bara felet parameterskattnngarna och mssar därmed varatonen krng de framtda väntevärdena. 8

2.2.1 Bootstrap-algortmen steg för steg I schemat nedan är bootstrap-algortmen llustrerad steg för steg. Steg 1 Startprocedur Ansättnng av modell med skattnng av parametrarna Parametrarna pearsonskattnngen. c, α, β, (, = 1,2 m) och φ. c, α, β skattas med quas-lkelhood (se appendx) och φ med Beräknng av anpassade värden µˆ utvecklngstrangeln ( + m + 1). Beräknng av de standardserade resdualerna enlgt (1): r st = y φˆ v( µ ˆ µ ˆ )(1 h. ) Steg 2 Smulerng, upprepas B gånger Substeg 2.1 - estmatonsfelet * Skapande av en pseudotrangel y r * genom relatonen y = r φˆ ' ' v( µ ˆ )(1 h ) + µ ˆ för vare plats utvecklngstrangeln där resdualerna r ' ' väls genom slumpmässgt urval med återläggnng bland resdualerna från steg 1. Ansättnng av modell och skattnng av parametrarna c, α, β, (, = 1,2 m) och φ. Predktoner för alla celler framtdstrangeln genom b b b ˆ exp ˆ ˆ ˆ b y = c + α + β, + > m +. { } 1 Substeg 2.2 - processfelet Skapande av smulerade värden b sm y ˆ,, (+ > m+1), där b anger teratonssteg och sm att den är smulerad, alla celler framtdstrangeln. Smulerngen sker från aktuell fördelnng med predktonerna från substeg 2.1 som väntevärden. 9

Beräknng av bootstrap-smulerad total reserv Steg 3 Resultat efter B teratoner b R ˆ = y. b, sm ˆ + > m+ 1 1 B Skattnng av standardavvkelsen för reserven med sr = = ( Rˆ b b R) 1 B 1 Skattnng av fördelnngen för reserven med den emprska fördelnngen 2. obs x Fˆ ( x) = #. B Beräknng av percentler hos den framsmulerade fördelnngen. Percentlerna defneras här genom λ α = [ αb] där α är en sannolkhet och funktonen [x] betyder heltalsdelen av x. Percentlen är då observaton nummer λ α det ordnade stckprovet av smulerade reserver. 3 Data Data som används detta arbete är utvecklngstranglar för tre försäkrngsklasser hos Trygg- Hansa, cvl, trafk, resp. olycksfall. För att skydda Trygg-Hansa är beloppen omräknade tll fantasenheten a-mark. Tranglarna avser utbetalt skadebelopp och beloppen är avrundade tll närmaste heltal. Med utbetalt skadebelopp menas här bokade utbetalnngar. I praktken skulle en cell kunna vara negatv eftersom det bland förekommer negatva utbetalnngar det vll säga nbetalnngar tll bolaget. Detta sker exempelvs då bolaget betalar ut för en trafkskada som senare tllfaller ett annat försäkrngsbolag varvd bolaget får tllbaks det utlagda beloppet. De negatva utbetalnngarna är små förhållande tll de postva varför negatva cellvärden uppstår mycket sällan och förekommande fall hamnar bland de allra ssta utvecklngsåren då utbetalnngarna går mot noll. Aktuella data från Trygg-Hansa nnehåller nga negatva värden. Att det praktken skulle kunna hända att cellvärden är negatva är dock ett problem som måste övervägas noga. Skall modellerna tllåta negatva värden eller skall de bygga på att alla data är postva och betrakta negatva värden, om de förekommer, som fel data. I det senare fallet måste data usteras. Även om aktuella data från Trygg-Hansa enbart nnehåller postva värden blr detta problem aktuellt vd bootrap-smulerngen då vssa pseudotranglar nnehåller negatva värden. Detta dskuteras vdare avsntt 4.5. 3.1 Utvecklngstranglar I datatrangel 1, 2 och 3 återfnns de tre utvecklngstranglarna på nkrementell form. I cell (,) står utbetalt skadebelopp under utvecklngsår för skadeår. 10

Skade- Utvecklngsår år 1 2 3 4 5 6 7 8 9 10 11 12 1991 455 026 239 004 37 780 12 100 12 725 11 748 3 800 2 709 656 1 204 3 535 2 758 1992 488 889 205 687 28 558 12 017 7 684 5 991 2 074 2 599 1 152 2 074 2 758 1993 445 587 231 555 24 193 15 640 7 266 3 907 2 595 1 896 874 1 131 1994 460 090 247 022 37 285 17 180 7 765 4 474 3 134 1 321 1 906 1995 462 317 274 102 38 792 13 790 7 603 3 358 3 521 2 081 1996 488 402 281 925 37 572 13 387 8 097 7 332 2 699 1997 485 153 299 578 34 104 23 048 13 654 9 833 1998 469 737 288 414 49 503 23 893 14 079 1999 476 509 352 804 64 066 44 921 2000 463 609 345 448 57 855 2001 516 484 363 033 2002 562 729 Datatrangel 1: Utvecklngstrangel. Försäkrngsklass cvl. Enhet a-mark. Skade- Utvecklngsår år 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1985 156 063 230 111 838 130 21 142 392 12 241 537 8 410 511 14 679 382 9 828 106 14 210 733 15 454 940 15 861 540 6 923 365 21 738 979 10 329 201 13 453 250 10 437 657 9 579 207 17 715 929 5 419 239 1986 155 091 032 135 597 624 25 443 576 16 113 355 15 978 471 13 240 829 10 764 950 21 351 958 9 717 327 16 835 904 13 370 156 13 424 302 8 174 112 35 831 829 14 544 305 14 747 320 9 307 465 1987 181 016 649 161 159 105 25 273 050 17 782 484 20 900 299 13 076 994 15 410 388 12 781 235 14 054 606 5 689 056 16 189 167 21 871 643 17 704 383 16 474 067 22 629 931 15 672 321 1988 208 670 773 167 882 070 43 262 051 37 644 157 27 809 555 20 609 914 31 759 751 12 914 918 16 516 403 18 318 403 29 540 209 20 654 633 21 835 746 15 186 123 11 166 040 1989 198 311 234 191 525 760 44 706 702 22 290 021 29 874 341 19 392 713 26 716 770 30 082 336 12 283 812 16 207 258 22 960 477 22 639 840 33 776 729 25 984 186 1990 239 683 619 183 683 603 42 958 688 28 174 342 19 622 973 18 554 163 22 382 261 24 037 310 23 251 992 15 463 269 24 679 000 38 863 067 30 711 312 1991 245 737 117 144 852 785 39 096 659 24 621 365 16 311 842 20 619 275 18 706 822 16 892 812 25 504 833 22 146 539 25 416 660 38 070 314 1992 221 151 095 127 269 647 41 218 430 24 452 687 20 047 288 28 755 435 13 626 921 11 948 967 16 482 819 29 227 113 17 094 804 1993 210 127 694 119 483 395 39 878 377 33 570 157 34 303 372 17 284 086 27 503 639 30 103 081 41 878 299 40 685 663 1994 203 832 530 127 723 011 38 273 522 36 300 830 32 595 444 22 510 828 27 775 066 42 683 098 61 006 861 1995 207 437 891 122 631 681 42 122 386 33 023 356 21 846 173 23 019 249 39 778 304 33 097 219 1996 164 459 900 100 935 488 33 138 889 24 374 875 16 804 580 36 050 902 29 038 330 1997 159 458 110 113 251 953 40 484 435 51 039 129 25 768 939 34 837 589 1998 192 043 580 146 773 594 43 034 962 40 961 806 37 098 112 1999 196 055 568 143 089 868 51 700 229 40 568 867 2000 163 718 738 141 807 096 51 426 099 2001 163 451 788 134 411 369 2002 176 723 239 Datatrangel 2: Utvecklngstrangel. Försäkrngsklass trafk. Enhet a-mark. Skade- Utvecklngsår år 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1986 23 630 25 020 6 950 11 472 12 519 5 713 4 244 5 873 4 158 3 472 6 028 3 165 2 119 1 773 2 475 2 930 292 1987 23 630 25 020 7 612 15 324 12 655 13 934 8 883 4 509 6 445 2 621 3 865 2 208 6 604 1 503 538 417 1988 23 630 26 069 20 878 21 379 14 543 11 011 9 130 7 224 10 093 6 969 6 297 3 199 1 895 4 920 3 559 1989 24 445 29 498 32 622 27 685 18 618 15 346 13 207 9 334 7 103 6 434 3 396 5 749 2 465 4 407 1990 18 988 44 225 45 456 31 750 21 790 14 775 13 874 8 599 10 939 6 009 6 368 5 893 6 662 1991 27 545 47 345 53 786 35 906 29 256 14 535 11 553 17 118 7 056 11 031 8 664 8 961 1992 31 027 58 727 60 783 50 122 30 302 24 365 15 197 13 735 11 555 11 754 10 900 1993 44 716 64 890 69 719 41 004 30 822 18 476 17 792 18 297 15 615 7 898 1994 62 889 66 339 64 875 52 026 36 149 21 557 19 539 14 883 9 615 1995 38 873 55 160 77 094 44 559 29 805 21 239 15 704 10 599 1996 40 998 54 452 63 085 45 679 32 616 23 020 28 053 1997 39 474 49 957 53 288 52 176 36 031 25 630 1998 38 811 54 034 64 492 53 691 44 755 1999 45 089 61 824 73 528 54 171 2000 44 485 55 397 69 533 2001 40 079 49 029 2002 56 782 Datatrangel 3: Utvecklngstrangel. Försäkrngsklass olycksfall. Enhet a-mark. De tre tranglarna har lte olka egenskaper. Trafktrangeln består av betydlgt större värden än de två andra och betraktas som e avslutad med vlket menas att utbetalnngar för de aktuella skadeåren förväntas fortsätta bortom det ssta utvecklngsåret trangeln. Tranglarna har också olka dmenson där cvl-trangeln har den mnsta dmensonen. 11

4 Resultat av tllämpnng på data från Trygg-Hansa Anpassnng av modellerna och smulerng sker med hälp av programvaran SAS. Först undersöks modellernas anpassnng tll data där resdualplottar för de olka modellerna redovsas och dskuteras. Sedan utförs sälva bootstrap-smulerngen för de olka metoderna och resultaten redovsas. 4.1 Modellernas anpassnng tll data För att studera modellernas anpassnng tll data plottades de standardserade pearsonresdualerna r, enlgt (1), mot sna anpassade värden µˆ. Enlgt modellen kan dessa st betraktas som oberoende och lka fördelade med väntevärde 0 och varans 1. För ett tllfredsställande resultat skall nga mönster fnnas bland dem utan det skall se ut som ett ämt brus krng 0-axeln. Avvkelser från detta kan tyda på att modellen är felaktg på något sätt, se exempelvs McCullagh & Nelder (1989) kap. 12. På fölande sdor är de standardserade pearsonresduelarna plottade mot µˆ för alla modeller alla försäkrngsklasser. 12

4.1.1 Försäkrngsklass cvl Fgur 1 (tll vänster): Standardserade pearsonresdualer plottade mot µˆ. Modell OdP. Försäkrngsklass cvl. Fgur 2 (tll höger): Standardserade pearsonresdualer plottade mot µˆ. Modell SaPo. Försäkrngsklass cvl. Fgur 3: Standardserade pearsonresdualer plottade mot µˆ. Modell Gamma. Försäkrngsklass cvl. 13

4.1.2 Försäkrngsklass trafk Fgur 4 (tll vänster): Standardserade pearsonresdualer plottade mot µˆ. Modell OdP. Försäkrngsklass trafk. Fgur 5 (tll höger): Standardserade pearsonresdualer plottade mot µˆ. Modell SaPo. Försäkrngsklass trafk. Fgur 6: Standardserade pearsonresdualer plottade mot µˆ. Modell Gamma. Försäkrngsklass trafk. 14

4.1.3 Försäkrngsklass olycksfall Fgur 7 (tll vänster): Standardserade pearsonresdualer plottade mot µˆ. Modell OdP. Försäkrngsklass olycksfall. Fgur 8 (tll höger): Standardserade pearsonresdualer plottade mot µˆ. Modell SaPo. Försäkrngsklass olycksfall. Fgur 9: Standardserade pearsonresdualer plottade mot µˆ. Modell Gamma. Försäkrngsklass olycksfall. Vad det gäller försäkrngsklass cvl är det svårt att se något drekt mönster bland 2 observatonerna. Mölgen kan en parabel på formen x skönas för OdP- och SaPomodellen för stora µˆ där v har få observatoner. Tendensen är störst för OdP-modellen. Spännvdden för resdualerna verkar öka med µˆ för OdP samtdgt som den ser ganska konstant ut för SaPo medan den för Gamma mölgen verkar sunka. På försäkrngsklass trafk har v en tät svärm med resdualer för låga µˆ och en lte glesare svärm längre bort på µˆ -axeln. Resdualerna är kraftgt konformade för Gamma-modellen. SaPo-modellens resdualer ser ut att föla en lne på formen kx den bortre glesare svärmen. OdP-resdualerna ser bra ut. 15

På försäkrngsklass olycksfall har v ett ämnt resdualspektrum för OdP-modellen varefter kon-utseendet ökar med ökande p varansfunktonen. För Gamma-modellen ser resdualerna ut att avta med ökande µˆ för alla tre försäkrngsklasser vlket kan tyda på en för hög potens varansfunktonen. Tydlgast är detta olycksfall. Det som mest ser ut som ett skolboksexempel av oberoende lkafördelade observatoner är OdP-resdualerna för olycksfall. Där får man hälp av att resdualerna är ämnt fördelade med avseende på µˆ. Modellerna OdP och SaPo ser hyfsade ut alla tre fallen och mölgen ser OdP-modellen bättre ut än SaPo. Kanske skulle p = 1.25 eller lknande ge bäst anpassnng. 4.2 Skattad reserv utan bootstrap Metoderna ger lte olka skattnngar av den totala reserven och resultaten skler sg för de olka försäkrngsklasserna. I tabell 10 ges skattnngarna av den totala reserven för alla metoder. I tabell 11 uttrycks skattnngarna som procent av OdP-skattnngen (som alltd är samma som Chan Ladder-skattnngen). V ser att försäkrngsklass cvl ger metoderna stort sett samma skattnng av reserven, SaPo-skattnngen är anngen större än OdP och Gammaskattnngen ännu lte större, dock bara crka 1.7% större än OdP. I försäkrngsklass trafk är skllnaderna större där SaPo ger en 8.6% större skattnng än OdP och Gamma 18.2% större än OdP. I försäkrngsklass cvl är skllnaderna annorlunda. Där ger SaPo och Gamma anngen lägre skattnngar än OdP, SaPo knappt 1% och Gamma drygt 2% lägre. OdP SaPo Gamma Cvl 726 869 731 649 739 210 Trafk 3 146 215 376 3 416 936 388 3 717 943 160 Olycksfall 1 664 686 1 652 360 1 627 902 Tabell 10: Skattade reserver för alla metoder. OdP SaPo Gamma Cvl 100 100.7 101.7 Trafk 100 108.6 118.2 Olycksfall 100 99.3 97.8 Tabell 11: Skattade reserver för alla metoder som procent av OdP. Den stora skllnaden på försäkrngsklass trafk är anmärknngsvärd. Skattnngen av totala reservbehovet är nästan 20% större med Gamma än med OdP. Annars är det svårt att se några mönster, två fall växer reservbehovet med växande p och ett fall sunker den. 4.3 Parametern φ Vd ansättnng av modellerna skattades parametrarna c, α, β genom maxmerng av quaslkelhooden (se appendx). Parametern φ skattades genom pearsonskattnngen 2 2 r, pearson 1 ( y µ ˆ ) φ ˆ = = + + 1 där varansfunktonen v (µ) u är m + m+ 1 n p n p v( µ ˆ ) v ( µ ) = µ, 1.5 v ( µ ) = µ resp. 2 v ( µ ) = µ för de tre modellerna OdP, SaPo och Gamma. 16

Skattnngen avφ för de tre modellerna steg 1 bootstrap-algortmen fnns tabell 12 där v ser mycket varerande värden. Skllnaderna beror på att varansfunktonen är nämnare pearsonresdualen och ger därför mndre pearsonresdualer med ökande p. Fölaktlgen blr även φˆ mndre. OdP SaPo Gamma Cvl 2 156 9.58 0.066 Olycksfall 969 8.16 0.088 Trafk 3 174 359 534 0.093 Tabell 12: Skattade φ :n steg 1. 4.4 Resdualer Vd skapandet av de standardserade Pearsonresdualerna steg 1 bootstrap-algortmen blr resdualerna r 1 nordöstra hörnet och r 1 sydvästra hörnet lka med noll eftersom st m µ ˆ 1m = y 1m och ˆ m1 = ym 1 st m µ per defnton. Dessa resdualer betraktas nte som observatoner från den underlggande stokastska varabeln och tas därför nte med bland resdualerna ur vlka urval med återläggnng sker. V tror helt enkelt nte på att v har två observatoner som passar perfekt varför v skulle förlora varaton om dessa noll-resdualer togs med smulerngen. Statstska data om de resulterande resdualmängderna efter det nledande bootstrap-steget återfnns Tabell 13. Medelvärdet hamnade nära 0 och standardavvkelsen nära 1 överlag, som väntat. n-2 medelv. st. avv. mn max Cvl OdP 76-0.0091 1.099-3.13 3.40 SaPo 76-0.0078 1.019-2.70 3.61 Gamma 76 0.0001 1.015-2.36 3.02 Trafk OdP 169-0.0096 1.006-1.96 3.99 SaPo 169-0.0062 1.007-1.98 3.75 Gamma 169 0.0001 1.011-2.31 3.42 Olycksfall OdP 151 0.0062 1.002-3.56 2.82 SaPo 151-0.0027 1.011-3.05 3.38 Gamma 151 0.0000 1.047-3.69 4.59 Tabell 13: Data om resdualerna från steg 1 bootstrap-algortmen 4.5 Negatva värden pseudotranglarna Även om aktuella data från Trygg-Hansa nte nnehåller negatva värden är problemet med negatva värden utvecklngstrangeln värt att dskutera. För några av modellerna uppstod relatvt ofta negatva värden pseudotranglarna (se fgur 14). Dessa kan uppstå om den slumpmässgt valda resdualen är stor och negatv, se relaton (2 ). Vd en sådan stuaton kan parametrar skattas genom quas-lkelhood med det mndre stränga kravet att kolumnsummorna skall vara postva fallet OdP och Gamma. När negatva värden 17

pseudotrangeln uppstår sker detta dock oftast någonstans den nordöstra delen av trangeln varför kolumnsumman med stor sannolkhet blr negatv då detta sker. I fallet SaPo tllåts negatva värden men problem uppstår då SAS skall skatta parametrar. Den teratva skattnngsprocessen som SAS använder sg av (se appendx) konvergerar nte alltd varför en korrgerng även SaPo-fallet var nödvändg. Här valdes den pragmatska lösnngen att nte tllåta några negatva värden över huvud taget. Vd ett negatvt värde pseudotrangeln ersattes den med ett annat värde. I fallet OdP och SaPo ersattes negatva värden pseudotranglarna med värdet noll. I Gammafallet ersattes negatva värden pseudotranglarna med talet 100 alla tre försäkrngsklasserna. Hur England & Verrall (2001) och andra löst problemet framgår nte ur deras uppsatser. Att ersätta negatva värden med postva nnebär att en del av den totala varatonen underskattas vlket bör beaktas vd analyserna efter smulerngen. Specellt om negatva värden uppstår ofta. I tabell 14 nedan redovsas hur ofta ett negatvt värde uppstod pseudotranglarna. I fallet OdP var detta ett relatvt stort problem där det för försäkrngsklass cvl skedde 2728 gånger på olka ställen trangeln och för försäkrngsklass olycksfall 885 gånger. För modellen SaPo var det också ett problem där det försäkrngsklass cvl var en resdual ( r = 2. 698) som gav upphov tll de negatva värdena. För Gamma-modellen uppstod nte negatva värden cvl eller trafk medan en mycket stor resdual ( r = 3. 687 ) spökade försäkrngsklass olycksfall. Att negatva värden nte uppstod så ofta försäkrngsklass trafk beror på att den ursprunglga trangeln har genomgående höga värden. Värdena för de sena utvecklngsåren har nte gått ner mot noll än. OdP SaPo Gamma Cvl 2728 gånger 253 gånger olka r alltd r=-2.697604 nga negatva värden olka ställen utv.år 7 och framåt Trafk 46 gånger r <=-1.310445 nga negatva värden nga negatva värden alltd nordöstra hörnet Olycksfall 885 gånger 189 gånger 357 gånger r <=-0.561069 r<= -1.504999 alltd r=-3.687047 utv. år 6 och framåt utv.år 10 och framåt utv. år 2 och framåt Tabell 14: Förekomst av negatva värden pseudotranglarna under 1000 teratoner. 4.6 Smulerngssteget Det är först vd smulerngen framtdstrangeln som fördelnngsantagandet gör sg gällande. Vd ansättnng av modellen räckte det med specfkaton av varansfunkton men här måste v ha en fördelnng att smulera från. Smulerngen framtdstrangeln med de predkterade värdena som väntevärden skedde på fölande sätt. I fallet OdP; för att smulera från en översprdd Possonfördelnng med väntevärde y smulerades från en possonfördelad b 18

b y b varabel med väntevärde multplcerat med φˆ. Indexet b anger aktuellt b φˆ teratonsnummer. För vare ny pseudotrangel skattas dspersonsparametern φ om på nytt. I fallet SaPo smulerades två steg (se appendx om hur SaPo-varabeln är uppbyggd). Först b 2 p ( y ) b sm smulerades ett m fram från en possonfördelnng med väntevärde varefter y, ˆb φ (2 p) m(2 p) erhölls genom smulerng ur en gammafördelnng med parametrarna α = och p 1 ˆb b p 1 sm β = φ ( p 1)( y ). I Gammafallet erhölls y, genom smulerng från en 1 gammafördelnng med parametrarna α = och β b φˆ att 2 E [Y ] = αβ och Var ( Y) = αβ. b = φˆ b y där gammafördelnngen är sådan b 4.6.1 Fördelnngarnas utseende Modellen OdP är specell genom att stödet för fördelnngen beror på sprdnngsparametern φ. Gvet parametern φ hamnar stödet på talen φ n, n = 1, 2,3.... Fördelnngarna som det smuleras från framtdstrangeln ser märklga ut om φ är stort förhållande tll väntevärdet µ vlket är fallet alla tre försäkrngsklasserna. En typsk framtdstrangel försäkrngsklass cvl för OdP-modellen är den som beräknas på den ursprunglga utvecklngstrangeln, se fgur 15. utvecklngsår skadeår 1 2 3 4 5 6 7 8 9 10 11 12 1 2 2 684 3 3 015 2 607 4 1 520 3 208 2 774 5 1 216 1 571 3 317 2 869 6 2 322 1 271 1 642 3 466 2 997 7 3 313 2 403 1 315 1 699 3 587 3 102 8 7 205 3 265 2 368 1 296 1 675 3 535 3 057 9 11 857 8 096 3 668 2 661 1 456 1 882 3 972 3 435 10 21 782 11 231 7 668 3 475 2 520 1 379 1 782 3 762 3 253 11 48 298 23 313 12 020 8 206 3 719 2 697 1 476 1 907 4 026 3 482 12 337 798 49 452 23 869 12 307 8 402 3 807 2 762 1 511 1 953 4 122 3 565 Fgur 15: Framtdstrangel beräknad på ursprungsdata. Försäkrngsklass cvl, modell OdP. Parametern φ skattades här tll 2156 och v ser att för utvecklngsår 9 och 10 är samtlga värden lägre än detta och att värdena utvecklngsåren 7, 8, 11 och 12 bara är anngen större än 2156. Då värdena framtdstrangeln, som fungerar som väntevärden den fördelnng som det smuleras ur, lgger närheten av φ ser fördelnngarna konstga ut. I fgur 16 och 17 fnns två OdP-fördelnngar plottade som llustrerar detta. Fördelnngarna har stora punktmassor ett fåtal punkter där sannolkhetsmassan är störst y = 0 om µ är mndre än φ. 19

Frekvensfunkton, OdP, ph=2156, m=2000 sannolkhet 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 2 156 4 312 6 468 8 624 10 780 12 936 15 092 y Fgur 16: Frekvensfunkton för en OdP-fördelad s.v. Frekvensfunkton, OdP, ph=2156, m= 3500 0.3 0.25 sannolkhet 0.2 0.15 0.1 0.05 0 0 2 156 4 312 6 468 8 624 10 780 12 936 15 092 17 248 19 404 21 560 y Fgur 17: Frekvensfunkton för OdP-fördelad s.v. Sannolkhetsmassan lgger på punkterna n 2156, n = 0,1,2... med en stor sannolkhet nollan fgur 16 då µ = 2000 vlket känns onaturlgt då det som smuleras är framtda utbetalnngar. Fördelnngen borde vara kontnuerlg eller åtmnstone approxmatvt kontnuerlg så att punkterna för stödet lgger tätt. I försäkrngsklass olycksfall är fenomenet densamma att φ är stort relaton tll framtdstrangelns värden men dock nte lka stort. I en typsk framtdstrangel beräknad på ursprungsdata där φ skattades tll 969 är det bara ssta kolumnen framtdstrangeln som nnehåller värden mndre än det. I fördelnngarna SaPo och Gamma beror nte fördelnngarnas stöd på parametern φ. Där ser fördelnngarna mer rmlga ut även för mndre värden framtdstrangeln. Eftersom frekvensfunktonen för en SaPo-fördelad stokastsk varabel har ett komplcerat utseende (se appendx) återfnns fgur 18 en smulerad frekvensfunkton för en SaPo-fördelad varabel med väntevärde 1500 och sprdnngsparameter skattad tll 9.58 då SaPo-modellen applcerades på den ursprunglga utvecklngstrangeln för försäkrngsklass cvl. Då Gamma- 20

modellen anpassades på samma utvecklngstrangel skattades φ tll 0.066 och en bld av frekvensfunktonen för en gammafördelad stokastsk varabel med väntevärde 1500 och sprdnngsparameter 0.066 fnns fgur 19. Fgur 18: Smulerad frekvensfunkton för en SaPo-fördelad s.v. Gamma-täthet, ph=0.066, mu=1500 0.0012 0.001 0.0008 f(y) 0.0006 0.0004 Sere1 0.0002 100 400 700 1000 0 1300 1600 1900 y 2200 2500 2800 3100 Fgur 19: Frekvensfunkton för Gamma-fördelad s.v. 4.7 Resultat efter 1000 teratoner b I denna undersöknng valdes B = 1000 teratoner varvd 1000 smulerade totala reserver Rˆ erhölls. I det fölande undersöker v predktonsfelet, medelvärdet, fördelnngarnas utseende 21

och percentler fördelnngarna för respektve metod för de tre försäkrngsklasserna. Predktonsfelet som gäller som en skattnng av estmatonsfelet + processfelet för totala b reserven skattades med standardavvkelsen av Rˆ genom formeln 1000 =1 b 2 b 1000 ( R R) R s = b = där 1 = b R är medelvärdet av de smulerade skattade 1000 1 1000 reserverna. Percentler den emprska fördelnngen erhölls genom observaton nummer λ α det ordnade stckprovet av smulerade reserver där λ α = [ α 1000] och α är procentnvån. # obs x Den emprska fördelnngen erhölls genom Fˆ ( x) =. Den emprska 1000 b frekvensfunktonen för totala reserven erhölls genom att plotta ett hstogram över Rˆ. 4.7.1 Försäkrngsklass cvl I tabell 20 ser v percentler hos den framsmulerade fördelnngen samt medelvärdet, standardavvkelsen och varatonskoeffcenten, som är standardavvkelsen delat med medelvärdet, för försäkrngsklass cvl efter 1000 teratoner. På ssta raden redovsas modellens ursprunglgt predkterade totala reserv. Percentler OdP SaPo Gamma 0.025 631 890 601 873 493 781 0.05 642 876 628 821 529 659 0.1 661 000 645 960 574 923 0.25 693 805 681 354 643 035 0.5 734 313 725 459 729 353 0.75 772 374 770 770 823 206 0.9 813 811 822 597 938 441 0.95 843 405 852 475 1 018 687 0.975 869 843 883 483 1 094 428 0.99 887 529 920 748 1 165 017 Medelv. 735 462 730 037 745 100 St.avv. 60 298 69 784 147 872 Std/Medelv 0.082 0.096 0.198 Modell 726 900 731 600 739 200 Tabell 20: Percentler och standardavvkelse efter 1000 teratoner. Försäkrngsklass cvl. Modellerna ger olka varaton där OdP ger mnst och SaPo anngen större varaton. Gamma varerar mer än dubbelt så mycket som de övrga. Medelvärdena lgger ganska nära det ursprunglgt skattade för alla tre modellerna vlket tyder på att bootstrap-smulerngen här nte verkar ha någon större bas vad det gäller skattnng av väntevärdet. Att Gamma har en dubbelt så stor standardavvkelse som de andra är anmärknngsvärt. Hstogram över smulerade reserver för respektve metod redovsas fgur 21, 22 och 23. Hstogrammen är plottade samma skala. 22

Fgur 21: Hstogram över smulerad totala reserver. Modell OdP, försäkrngsklass cvl. Fgur 22: Hstogram över smulerad totala reserver. Modell SaPo, försäkrngsklass cvl. 23

Fgur 23: Hstogram över smulerad totala reserver. Modell Gamma, försäkrngsklass cvl. 4.7.2 Försäkrngsklass trafk Percentler, medelvärden och andra statstska data efter 1000 bootstrap-teratoner på utvecklngstrangeln för försäkrngsklass trafk återfnns tabell 24. Varatonen som del av väntevärdet är samma storleksordnng för alla tre modellerna, omkrng 7%. För alla tre modellerna lgger det smulerade väntevärdet nära (nom ± 1% av) det predkterade värde som modellen ursprunglgen ger. Väntevärdena skler sg dock kraftgt åt såsom tdgare påpekats. Percentler OdP SaPo Gamma 0.025 2 714 923 121 2 989 356 310 3 202 165 921 0.05 2 771 166 134 3 051 574 711 3 273 524 490 0.1 2 848 880 664 3 128 822 238 3 385 614 239 0.25 2 974 748 319 3 252 097 873 3 537 869 904 0.5 3 125 922 257 3 400 915 499 3 717 601 889 0.75 3 257 325 692 3 565 913 123 3 891 882 619 0.9 3 416 724 264 3 713 779 419 4 094 951 457 0.95 3 500 740 530 3 810 202 479 4 197 054 018 0.975 3 565 987 417 3 902 331 702 4 286 686 132 0.99 3 669 209 172 3 956 092 421 4 410 156 788 Medelv. 3 124 999 762 3 414 218 098 3 721 694 105 St.avv. 220 914 668 229 626 269 272 511 656 Std/Medelv 0.071 0.067 0.073 Modell 3 146 000 000 3 417 000 000 3 718 000 000 Tabell 24: Percentler och andra data efter 1000 teratoner. Försäkrngsklass trafk. Resultatet av smulerngarna, för försäkrngsklass trafk, form av hstogram återfnns fgur 25, 26 och 27. 24

Fgur 25: Hstogram över smulerade totala reserver. Modell OdP, försäkrngsklass trafk. Fgur 26: Hstogram över smulerade totala reserver. Modell SaPo, försäkrngsklass trafk. 25

Fgur 27: Hstogram över smulerade totala reserver. Modell Gamma, försäkrngsklass trafk. 4.7.3 Försäkrngsklass olycksfall Percentler och annat efter smulerngarna för försäkrngsklass olycksfall fnns fgur 28. OdP ger störst väntevärde, SaPo lte mndre och Gamma mnst. Varatonen är som försäkrngsklass cvl klart störst för modell Gamma. OdP har mnst varans och SaPo anngen större. Percentler OdP SaPo Gamma 0.025 1 494 732 1 460 384 1 310 843 0.05 1 520 487 1 483 157 1 377 070 0.1 1 558 878 1 511 388 1 448 599 0.25 1 615 303 1 583 991 1 536 406 0.5 1 679 059 1 655 201 1 640 386 0.75 1 740 563 1 726 152 1 747 237 0.9 1 800 982 1 815 030 1 859 423 0.95 1 834 173 1 854 057 1 948 175 0.975 1 862 236 1 890 557 2 043 658 0.99 1 891 933 1 941 076 2 150 984 Medelv. 1 679 383 1 658 464 1 649 367 St.avv. 95 147 113 735 179 780 Std/Medelv 0.057 0.069 0.109 Modell 1 665 000 1 652 000 1 627 000 Fgur 28: Percentler och andra data efter 1000 teratoner. Försäkrngsklass olycksfall. Resultatet av smulerngarna, för försäkrngsklass olycksfall, form av hstogram återfnns fgur 29, 30 och 31. 26

Fgur 29: Hstogram över smulerade totala reserver. Modell OdP, försäkrngsklass olycksfall. Fgur 30: Hstogram över smulerade totala reserver. Modell SaPo, försäkrngsklass olycksfall. 27

Fgur 31: Hstogram över smulerade totala reserver. Modell Gamma, försäkrngsklass olycksfall. 28

5 Slutsatser I tabell 32 sammanfattas resultatet av smulerngarna. Där återfnns medelvärdet av smulerngarna samt medelvärdet delat med modellens predkterade värde och varatonskoeffcenten uttryckta procent. OdP SaPo Gamma Cvl Medelvärde 735 462 730 037 745 100 Medelv./Modell 101.2 99.8 100.8 Varatonskoeff. 8.2 9.6 19.8 Trafk Medelvärde 3 124 999 762 3 414 218 098 3 721 694 105 Medelv./Modell 99.3 99.9 100.1 Varatonskoeff. 7.1 6.7 7.3 Olycksfall Medelvärde 1 679 383 1 658 464 1 649 367 Medelv./Modell 100.9 100.4 101.3 Varatonskoeff. 5.7 6.9 10.9 Tabell 32: Smulerngsresultat. Smulerngarna för alla modeller alla försäkrngsklasser ger ett medelvärde som lgger ganska nära det som modellen ger ursprunglgen. Den största basen är för modell Gamma försäkrngsklass cvl där smulerngarnas medelvärde är 1.3% större än modellens väntevärde. Detta ndkerar att smulerngsproceduren är relatvt bas-fr vad det gäller predkton av modellens ursprunglga väntevärde trots problemen med negatva väntevärden pseudotranglarna (se kaptel 4.5). Modellerna ger olka väntevärden utan något entydgt samband. I två fall av tre växer väntevärdet med växande p varansfunktonen dvs. OdP, som ger samma skattnng som Chan Ladder, ger mnst reserv, SaPo lte större och Gamma störst. Detta var fallet för försäkrngsklass cvl och trafk. Skllnaderna är relatvt små försäkrngsklass cvl där Gamma ger 1.7% större skattad reserv än OdP medan de är större försäkrngsklass trafk där motsvarande skllnad är 18.2%. I det trede fallet, för försäkrngsklass olycksfall, sunker väntevärdet med ökande p där Gamma ger mnst reserv SaPo lte större och OdP störst där Gamma-modellens reserv är 2.2% mndre än OdP:s. Varatonskoeffcenten varerar mellan metoderna och försäkrngsklasserna. Gamma ger störst varatonskoeffcent alla klasser. OdP har lägst varatonskoeffcent klass cvl och olycksfall där SaPo lgger ganska nära men något över. I försäkrngsklass trafk är SaPomodellens varatonskoeffcent anngen mndre än hos OdP-modellens. Största skllnaderna varaton är försäkrngsklass cvl där varatonskoeffcenten är mer än dubbelt så stor för Gamma ämfört med OdP och SaPo och mnsta skllnaderna fnns försäkrngsklass trafk där standardavvkelserna lgger nära varandra, varatonskoeffcenterna är 7.1, 6.7 resp. 7.3 procent. Om man betraktar 90-, 95-, 97,5- och 99%-percentlen för alla tre metoderna alla tre försäkrngsklasser är resultatet entydgt. OdP ger mnst percentl, SaPo lte större och Gamma störst. Mölgen kan 1000 teratoner vara på gränsen tll för lte. Tttar v på Gamma-smulerngarna fgur 23 och 31 ser det ut som att den framsmulerade fördelnngen nte rktgt har konvergerat. 29

Analysen av plottade resdualer kaptel 4.1 talar för OdP-modellen eller en modell med p nära ett. Problemen med många negatva värden pseudotranglarna däremot samt det märklga utseendet hos fördelnngarna det smuleras ur framtdstrangeln talar emot OdPmodellen. De kraftgt konformade resdualerna samt den stora varansen hos Gammamodellen tyder på att varansantagandet med p = 2 kan vara för stort. Gammamodellen känns överlag anngen nstabl. SaPo-modellens resdual-plottar är nte helt tllfredsställande. Däremot känns fördelnngarna det smleras ur framtdstrangeln rmlga och problemet med negatva värden pseudotranglarna är nte lka stort som OdP. I ett val mellan de tre modellerna OdP, SaPo med p = 1.5 och Gamma blr rekommendatonen att väla modell SaPo. Den känns naturlg då den uppstår genom ett possonfördelat antal gammafördelade varabler och v här en gven cell har ett stokastskt antal utbetalnngar av varerande storlek. Mölgen skulle en modell med p någonstans mtt emellan 1 och 1.5 vara bäst. På senare td har metoder och framförallt programvaror för att skatta p kommt som gör att en metod skulle kunna vara att först skatta p och sedan stoppa n den en sådan här smulerngsalgortm SAS. I ett försök, egentlgen utanför ramen för detta arbete, skattades p med hälp av programvaran Emblem tll 1.42, 1.42 och 1.65 för olycksfall, trafk respektve cvl. 30

6 Appendx 6.1 Parameterbyte log-lnära modellen Parameterbytet för att gå från den log-lnära strukturen (*) log( µ ) = log( γ ) + log( δ ), där log( δ ) = 0 tll m = 1 1 = β1 = (**) log( µ ) = c + α + β, där α 0 sker genom att låta c+ α m β = e ( e ), c log( γ 1δ 1), α = log( γ / γ 1), β = log( δ / δ1) β e = δ = = 1 m γ. β e = 1 6.2 Parameterskattnng och hat -matrsen Vd parameterskattnng sker först en övergång från trangelform tll lstform så att v har r T m( m +1) observatonerna y en lång vektor y = ( y1, y2,..., y n ) där n = är antalet 2 observatoner utvecklngstrangeln. Observatonerna y ordnas så att de hamnar r T enlgt y = ( y11, y12,..., y1 m, y21,..., y m 1). Den generalserade lnära modellen skrvs då på formen r r g ( µ ) = Xβ m( m + 1) där funktonen g är log, X är den (2m 1) -dmensonella desgnmatrsen 2 T nnehållande ettor och nollor, och β r = ( β,..., ) 1 β 2m 1 är parametervektorn nnehållande r T parametrarna c, α och β omdöpta och ordnade enlgt β = ( c, α 2,..., α m, β 2,..., β m ). Då r r exempelvs m = 4 har v g ( µ ) = Xβ log( µ log( µ log( µ log( µ log( µ log( µ log( µ log( µ log( µ log( µ 1 2 3 4 5 6 7 8 9 ) ) ) ) ) ) ) ) ) ) 10 110 0 010 0 0 β1 110 0 0 010 0 β 2 110 0 0 0 010 β 3 110 0 0 0 0 01 β = 1010 010 0 0 4 1010 0 010 0 β 5 1010 0 0 010 β 6 10 01010 0 0 β 7 10 010 010 0 β 8 10 0 0110 0 0 β 9 Skattnngen av parametrarna c, α och β genom vanlg maxmum lkelhood sker genom maxmerng av lkelhoodfunktonen r r 1 l ( θ ; φ, y) = ( y + θ b( θ )) c( y, φ). Teorn nedan är hämtad ur Ohlsson & Johansson φ (2003). 31

Derverng av denna med avseende på l β 1 = φ y µ v( µ ) g ( µ x ) = β blr efter upprepad användnng av kederegeln p 1 y µ log( µ ), v( µ ) = µ = x p 1. φ µ { g( µ ) = } Nollstället tll dessa 2 m + 1 dervator ger SAS genom Newton-Raphson-metoden enlgt r r r 2 l (*) β k + 1 = β k H s där H (Hessanen) är matrsen av andradervator och s är β β vektorn av förstadervator tll lkelhooden. H ges av T H = X W X där X är desgnmatrsen och W 0 är en dagonalmatrs vars element på rad ges av v( µ ) g ( µ ) + v ( µ ) g ( µ ) 1 w0 = we + ( y µ ) där w 2 3 e =. 2 φ( v( µ )) ( g ( µ )) v( µ )( g ( µ )) Hatmatrsen defneras här, enlgt SAS default, som Hatmatrs = W där W = W0 om algortmen slutade första steget och W e annars. 0 1/ 2 X k T 1 T 1/ 2 ( X WX ) X W Maxmum quas lkelhood-skattnng av parametrarna sker på samma sätt. Enlgt teorn nnebär Maxmum quas lkelhood att parametrarna skattas genom maxmerng av quaslkelhood-funktonen Q( µ, y) = Q = = r r r r µ y t µ y t ( µ, y) dt y dt stället för y p φv( t) φt den vanlga log-lkelhooden. Denna fungerar som en äkta log-lkelhood vad det gäller estmaton av parametrarna, se Olsson & Johansson (2003) kap 3, och ger samma parameterskattnngar som maxmum lkelhood. Fördelen med quas-lkelhood är att fördelnng nte behöver specfceras utan det räcker med specfkaton av varansfunktonen. 6.3 Fördelnngar 6.3.1 Översprdd Posson, OdP Varansfunktonen v ( µ ) = µ svarar mot en översprdd possonfördelnng. Gvet φ är frekvensfunktonen för en översprdd Posson varabel y φ y log( µ ) µ y y y log( µ ) µ φ f Y ( y) = exp log( φ) log! = exp + log där φ φ φ φ y! φ y = φ n, n {0,1,2 K}, och 0 annars. För dessa fördelnngar gäller att Var (Y ) = φµ Var (Y) = φ µ det vll säga standardavvkelsen är proportonell mot µ. 6.3.2 Sammansatt Posson 32

Då 1 < p < 2 v µ p ( µ ) = vsar Jørgensen (1997) att fördelnngen blr yθ b( θ ) f Y ( y) = exp + c( y; φ, p) där φ 1 p 1 ( p 2) /( p 1) 1/(1 p) µ b( θ ) = ( θ (1 p) ), µ = b'( θ ) = ( θ (1 p)) θ = och 2 p 1 p n n 1 φ ( b( φ / y)) log > ( ) då y 0 n= 1 y Γ n(2 p) /( p 1) n! c( y; φ, p) =. 0 annars Denna fördelnng uppkommer på fölande sätt: n Antag att Z = = X 1 där X ~ d Ga( α, β ) och N ~ Po( m) samt N och X oberoende. Med 2 Ga(α,β) menas här gammafördelnng med E [X ] = αβ och Var ( X ) = αβ. Parametrarna α och β gammafördelnngen samt m possonfördelnngen väls 1 enlgt 2 2 p p p µ α =, β = φ( p 1) µ och m =. Den stokastska varabeln Z har då ovan p 1 φ(2 p) p nämnda fördelnng. För dessa fördelnngar gäller att Var( Y) = φµ Var φµ p ( Y) =. 6.3.3 Gamma Tätheten för en gammafördelad stokastsk varabel är y 1 α 1 1 β y fy ( y; α, β ) = y e = exp ( α 1) log( y) log( Γ( α)) α log( β ) = α Γ( α) β β 1 φ y( 1/ µ ) log( µ ) y = { φ = 1/ α, µ = αβ } = exp + log( ) = φ φ φ( Γ(1/ φ)) yθ b( θ ) = { θ = 1/ µ, b ( θ ) = log( 1/ θ )} = exp + c( y; φ). φ 2 För denna fördelnng gäller att Var ( Y) = φµ Var( Y ) = φ µ d v s standardavvkelsen är proportonell mot väntevärdet. 33

Ltteratur Efron, B. & Tbshran, R. J., 1993. An Introducton to the Bootstrap. Chapman and Hall. England, P. D. & Verrall, R. J., 2002. Stochastc clams reservng n general nsurance. Presenterat nför Insttute of actuares, 28 anuar 2002. http://www.actuares.org.uk/fles/pdf/sessonal/sm0201.pdf England, P. D. & Verrall, R. J., 1999. Analytc and bootstrap estmates of predcton errors n clams reservng. Mathematcs and Economcs, Elsever, vol. 25(3). England, P. D., 2001. Addendum to Analytc and bootstrap estmates of predcton errors n clams reservng. Research report no. 138 Cty Unversty London. Jørgensen, Bent, 1997. The theory of dsperson models. Chapman and Hall, New York. Mack, T., 1993. Dstrbuton-free calculaton of the standard error of chan-ladder reserve estmates. ASTIN Bulletn, 23, No.2. McCullagh, P. & Nelder J.A., 1989. Generalzed lnear models, second edton. Chapman and Hall. Ohlsson, E. & Johansson, B., 2003. Prssättnng nom sakförsäkrng med Generalserade lnära modeller. Olsson, U., 2002. Generalzed lnear models, an appled approach. Studentltteratur. Pnhero, P. J. R., Andrade e Slva, J. M. & Centeno, M., 2002. Bootstrap methodology n clams reservng. http://www.casact.org/coneduc/rensure/astn/2000/andradeeslva1.doc SAS Insttute, 1999. SASOnlneDocument. 34