GMM och Estimationsfunktioner

Relevanta dokument
3 Maximum Likelihoodestimering

Föreläsning 8: Konfidensintervall

MVE051/MSG Föreläsning 14

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Föreläsning 12: Linjär regression

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Exempel på tentamensuppgifter

Kapitel 9 Egenskaper hos punktskattare

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik KTH. Formelsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

MVE051/MSG Föreläsning 7

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Datorövning 1: Fördelningar

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

f(x) = 2 x2, 1 < x < 2.

Enkel och multipel linjär regression

Föreläsning 13: Multipel Regression

TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 10/ KL

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Härledning av Black-Littermans formel mha allmänna linjära modellen

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Kurser inom profilen Teknisk matematik (Y)

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Avd. Matematisk statistik

Demonstration av laboration 2, SF1901

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Laboration 4: Lineär regression

Matematisk statistik TMS064/TMS063 Tentamen

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

TAMS65 - Seminarium 4 Regressionsanalys

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE301 Sannolikhet, statistik och risk

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

NEKP34, Nationalekonomi: Ekonometrisk teori, 7,5 högskolepoäng Economics: Econometric Theory, 7.5 credits Avancerad nivå / Second Cycle

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 11: Mer om jämförelser och inferens

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Avd. Matematisk statistik

Tentamentsskrivning: Matematisk Statistik TMA321 1

1 e (λx)β, för x 0, F X (x) = 0, annars.

Instruktioner till arbetet med miniprojekt II

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 7. Statistikens grunder.

SF1901 Sannolikhetsteori och statistik, VT 2017 Datorlaboration 1 för CELTE2, CTFYS2

Tentamen MVE301 Sannolikhet, statistik och risk

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

1 Konvexa optimeringsproblem grundläggande egenskaper

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Teststorheten är ett modellvalideringsmått Betrakta. Översikt. Modellvalideringsmått, forts. Titta lite noggrannare på testet.

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

2.1 Mikromodul: stokastiska processer

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

PROGRAMFÖRKLARING III

Sannolikhet och statistik 1MS005

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

oberoende av varandra så observationerna är

Grundläggande matematisk statistik

Föreläsning 7: Stokastiska vektorer

Matematisk statistik för D, I, Π och Fysiker

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

b) Beräkna sannolikheten för att en person med språkcentrum i vänster hjärnhalva är vänsterhänt. (5 p)

Statistiska metoder för säkerhetsanalys

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Stokastiska vektorer

SF1901: Medelfel, felfortplantning

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Transkript:

Lunds Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 GMM och Estimationsfunktioner I laborationen möter du två besläktade metoder för att estimera parameterar, generaliserade momentmetoden och estimationsfunktioner. Metoderna appliceras bland annat på stokastiska differentialekvationer. Det är en fördel om du använder Matlab men du får naturligtvis använda vilket programspråk du vill. Notera att du måste kommentera din kod noggrannt om du använder något annat program än Matlab. Laborationen skall genomföras i grupper om maximalt två studenter per grupp. 1 Förberedelseuppgifter Läs kapitel 14.6 (översiktligt) och 14.8 i [1, utdelat material [2 samt laborationshandledningen. Förbered sedan laborationen genom att skriva de matlabfunktioner som behövs för laborationen. Innan laborationen börjar kommer några av frågorna nedan att ställas. Dessa måste besvaras korrekt för att laborationen skall godkännas. 2 Frågekatalog 1. Föreslå några lämpliga momentvillkor för att estimera parametrarna i modellen y i = β 0 + β 1 x i + ε i, (1) med GMM. ε i är oberoende och likafördelat brus. Dessutom är ε i oberoende av x j för alla i, j. 2. Diskretisera och bestäm lämpliga moment för att estimera parametrarna i CKLSmodellen. 3. Beräkna väntevärde, andramoment och tredjemoment för Cox-Ingersoll-Ross processen genom Dynkins formel (se ekvation 4). 1

3 Laborationsuppgifter 3.1 Regression Estimation med generaliserade momentmetoden är ett alternativ som främst bör användas då maximum likelihoodestimering inte är möjlig eller då man inte explicit vill gör ett antagande om fördelningen hos innovationerna i sin modell. Metoden har ett visst mått av godtycke vid specificering av lämpliga momentvillkor vilket ibland leder till sämre effektivitet än maximum likelihood 1. Samtidigt kan man för enklare modeller och med lämpligt valda momentvillkor visa att båda metoderna ger identiska estimatorer. Om antalet momentvillkor är lika med antalet parametrar kan man ofta bespara sig en del arbete vid estimationen eftersom man då kan lösa ett ekvationssystem istället för att lösa ett optimeringsproblem. Metoden brukar då kallas momentmetoden. Vid en första anblick ger metoden intryck av att vara en rent teoretisk konstruktion då det sanna parametervärdet krävs för att beräkna viktmatrisen vilken i sin tur krävs för att beräkna estimaten. Detta är emellertid inget problem då man kan visa att generaliserade momentmetoden är konsistent (men inte effektiv) för alla positivt definita viktmatriser. Pseudoalgoritmmässigt utförs estimationen därför som 1. Estimera parametrarna med en godtycklig positivt definit viktsmatris W, förslagsvis vald som en enhetsmatris, som ger en första uppskattning av parametrarna. ( 1 ) T ( 1 ) θ = arg min J N (θ) = arg min f(xt, θ) W f(xt, θ) N N 2. Använd dessa parameterskattningar för att estimera den optimala viktsmatrisen, vald som inversen av kovariansmatrisen för momentvillkoren. 3. Estimera nya parametrar med den nya viktmatrisen, och gör om från steg 2 tills parameterestimaten har konvergerat. Uppgift: För att introducera GMM skall ni estimera parametrarna i en linjär regressionsmodell. Datamängden är densamma som för laboration 1. Ladda in data genom att skriva > > load regdata.mat 1 Detta är inte alltid av ondo då man kan välja ekonomiskt lämpliga momentvillkor. Eftersom det inte finns någon allomfattande teori hur momentvillkoren skall väljas ser man ofta att de väljs bekvämt vilket ibland ger inkonsistenta skattningar. Samtidigt innebär det att man kan skatta modeller där man inte kan finna ett explicit uttryck för likelihoodfunktionen. 2

Använd dina resultat från förberedelseuppgift 1 för att estimera parametrarna. Beräkna 95% konfidensintervall för alla parametrarna. Jämför dina estimat (och estimatorer) med resultaten från laboration 1. 3.1.1 Tester Komplexa modeller kan jämföras med LR-tester om vi använder Maximum Likelihoodtekniker. För GMM finns det liknande tester. Teststorheten ges av [ N J N ( θ Restricted ) J N ( θ Unrestricted ) och har under nollhypotesen asymptotiskt en χ 2 (k)-fördelning där k anger skillnaden i antalet parametrar. Uppgift: Testa den linjära modellen mot den kvadratiska modell, y i = β 0 + β 1 x i + β 2 x 2 i + ε i. Slutsats? 3.2 Estimation av parametrar i stokastiska differentialekvationer Du kommer möta två olika processer under denna delen av laborationen Cox-Ingersoll- Rossprocessen och CKLS-processen. Cox-Ingersoll-Rossprocessen används ofta för att modellera räntor och defineras som dr t = κ(θ r t )dt + σ r t dw t. (2) Denna kan generaliseras till CKLS-modellen som skrivs som dr t = κ(θ r t )dt + σr γ t dw t. (3) Modellerna har också används för att modellera volatiliteter i stokastiska variansmodeller eftersom processerna alltid är positiva. Data kan laddas in genom att skriva > > load cirdata.mat > > load cklsdata.mat Data har simulerats genom att använda en Milstein diskretisering. Alla processerna har simulerats så att tidsavståndet mellan observationerna är t = 1. 3.3 Momentmetoder Genom att diskretisera den stokastiska differentialekvationen kan man använda t.ex. GMM för parameterestimation. Diskretiseringen sker vanligtvis genom att använda Euler-diskretisering men högre ordningens metoder fungerar naturligtvis ännu bättre. Fördelen att diskretisera processen är att vi kan estimera analytiskt svårhanterade modeller utan större problem. 3

Uppgift: Estimera parametrarna och deras kovariansmatriser i modellerna ovan genom att använda den generaliserade momentmetoden. 3.4 Estimationsfunktioner Det går ibland att undvika den bias som diskretiseringen medför genom att beräkna momenten exakt. Metoden heter estimationsfunktioner och är ett aktivt forskningsområde. Kort uttryckt används inte diskretisering av den stokastiska differentialekvationen utan exakta moment. Dessa beräknas genom Dynkins formel vilket egentligen bara är en tillämpning av Itôs formel. Dynkins formel ges av [ t E X [f(x t ) = f(x 0 ) + E X Af(X s )ds (4) där operatorn A defineras (i det generella, multivariata fallet) som 0 Af = n i=1 µ i f x i + 1 2 n ( ) σσ T i,j i,j=1 2 f x i x j. och där processen {X t } ges som lösningen till dx(t) = µdt + σdw(t). I vårt fall är {X t } en endimensionell process vilket gör Dynkins formels betydligt enklare (n = 1). Uppgift: Estimera parametrarna och deras kovariansmatris för Cox-Ingersoll-Rossprocessen genom att använda exakta moment, dvs genom att använda f(x) = {x, x 2, x 3 }. Tips: För att visa hur Dynkins formel fungerar ges här ett exempel där f(x) = x 2. Antag att vi skall beräkna momenten i CIR-processen. Ax 2 = κ(θ x) x2 x + 1 ) ((σ 2 x) 2 x 2 2 x 2 = κ(θ x)2x + 1 2 σ2 x2 = 2κx 2 + (2κθ + σ 2 )x Genom att föra in detta i formeln fås E [ [ t X Xt 2 = x 2 0 + E X ( 2κXs 2 + (2κθ + σ2 )X s )ds 0 Slutligen antar vi att vi kan byta plats på väntevärdet och tidsintegralen varefter vi deriverar båda sidor med avseende på t. Vi får då en linjär differentialekvation E X [X 2 t t = 2κE X [ X 2 t + (2κθ + σ 2 )E X [X t. 4

4 Feedback Kommentarer och synpunkter på laborationen är alltid välkomna. Skicka dem till Erik Lindström, erikl@maths.lth.se eller ring 046 222 45 78. 5 MATLAB rutiner fminunc Quasi-Newton baserad optimeringsrutin. fmincon Quasi-Newton baserad optimeringsrutin med bivillkor. fminsearch Simplexbaserad optimeringsrutin. Referenser [1 Madsen, H., Nielsen, J. N., Lindström, E., Baadsgaard, M. and Holst, J. Statistics in Finance, IMM;DTU; Lyngby och Matematisk Statistik, LTH, Lund 2004. [2 Nolsøe, K., Madsen, H., Nielsen, J. N. and Baadsgaard, M. Lecture Notes in estimation functions, IMM;DTU; Lyngby 5