Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Relevanta dokument
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Stokastiska processer med diskret tid

Föreläsning 7: Punktskattningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Föreläsning 12: Linjär regression

Kap 2. Sannolikhetsteorins grunder

Stokastiska processer med diskret tid

Föreläsning 6, Matematisk statistik Π + E

Tentamen MVE302 Sannolikhet och statistik

Formler och tabeller till kursen MSG830

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 7: Punktskattningar

SF1901 Sannolikhetsteori och statistik I

Föreläsning 7: Punktskattningar

TENTAMEN I STATISTIKENS GRUNDER 1

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i Matematisk Statistik, 7.5 hp

0 om x < 0, F X (x) = c x. 1 om x 2.

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Grundläggande matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Tentamen L9MA30, LGMA30

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Enkel och multipel linjär regression

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Kurssammanfattning MVE055

SF1901: Sannolikhetslära och statistik

40 5! = 1, ! = 1, Om man drar utan återläggning så kan sannolikheten beräknas som 8 19

Lektionsanteckningar 11-12: Normalfördelningen

Repetitionsföreläsning

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

SF1901: Sannolikhetslära och statistik

Formel- och tabellsamling i matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

TENTAMEN GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 12: Regression

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Stokastiska vektorer och multivariat normalfördelning

Matematisk statistik KTH. Formelsamling i matematisk statistik

Stockholms Universitet Statistiska institutionen Termeh Shafie

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Mer om konfidensintervall + repetition

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

F13 Regression och problemlösning

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

f(x) = 2 x2, 1 < x < 2.

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

9. Konfidensintervall vid normalfördelning

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1911: Statistik för bioteknik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen MVE301 Sannolikhet, statistik och risk

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Tentamen i Matematisk statistik Kurskod S0001M

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik, Föreläsning 5

1 e (λx)β, för x 0, F X (x) = 0, annars.

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Grundläggande matematisk statistik

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Lufttorkat trä Ugnstorkat trä

Avd. Matematisk statistik

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik för B, K, N, BME och Kemister

STATISTISKA INSTITUTIONEN Jakob Bergman

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

19.1 Funktioner av stokastiska variabler

Kovarians och kriging

Matematisk statistik för D, I, Π och Fysiker

Tentamen MVE302 Sannolikhet och statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Tentamen MVE300 Sannolikhet, statistik och risk

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Föreläsning 17, Matematisk statistik Π + E

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Transkript:

Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X] = ( 1) 5 16 +0 6 16 +1 5 16 = 0 E[Y] = ( 1) 5 16 +0 6 16 +1 5 16 = 0 V[X] = ( 1 0) 2 5 16 +(0 0)2 6 16 +(1 0)2 5 16 = 10 16 V[Y] = ( 1 0) 2 5 16 +(0 0)2 6 16 +(1 0)2 5 16 = 10 16 E[XY] = ( 1) ( 1) 1 16 +( 1) 0 3 16 +...+1 1 1 16 = 0 Cov[X,Y] = E[XY] E[X]E[Y] = 0 0 = 0 Corr[X,Y] = 0 b) X och Y är oberoendeom och endastom P(X = x) P(Y = y) = P(X = x,y = y) för alla kombinationer av (x,y). Testar man detta ser man att: P(X = 1) P(Y = 0) = 5 16 6 16 = 15 3 128 P(X = 1,Y = 0) = 16 Då det finns åtminstånde en kombination av (x, y) där ovanstående relation inte håller, är X och Y beroende (inte oberoende), detta trots att Corr[X,Y] = 0. c) Cov[X,Y] = E[(X µ X )(Y µ Y )] = E[XY Xµ Y Yµ X +µ X µ Y ] = E[XY] E[Xµ Y ] E[Yµ X ]+E[µ X µ Y ] = E[XY] µ Y E[X] µ X E[Y]+µ X µ Y = E[XY] µ Y µ X µ X µ Y +µ X µ Y = E[XY] µ X µ Y 1

Uppgift 2a-c) Eftersom datat är uppdelat i tre perioder är ett 3-punkters glidande medelvärde lämpligt. Tertial X t Xt X t /Xt Korrigerat SI Säsongsrensad X t 2009-1 90 69.3613666 129.8 2009-2 150 134.6667 1.1138614 111.5252735 134.5 2009-3 164 138.0000 1.1884058 119.1133599 137.7 2010-1 100 143.6667 0.6960557 69.3613666 144.2 2010-2 167 150.0000 1.1133333 111.5252735 149.7 2010-3 183 153.6667 1.1908894 119.1133599 153.6 2011-1 111 161.0000 0.6894410 69.3613666 160.0 2011-2 189 167.6667 1.1272366 111.5252735 169.5 2011-3 203 119.1133599 170.4 Säsongsindex: år tertial1 tertial2 tertial3 2009 1.1138614 1.1884058 2010 0.6960557 1.1133333 1.1908894 2011 0.6894410 1.1272366 Median 0.6927483 1.1138614 1.189647584 Säsongsindex 69.27483 111.38614 118.9647584 Korrigeringsfaktorn: 300 69.27483+111.38614+118.9647584 = 1.001249122 Korrigerade säsongsindex: Tertial1 69.27483 1.001249122 = 69.3613666 69.4 Tertial2 111.38614 1.001249122 = 111.5252735 111.5 Tertial3 118.9647584 1.001249122 = 119.1133599 119.1 Till följd av förvirrande direktiv på lektionerna ges även full poäng till de som korrekt har beräknat korrigerade säsongsindex baserat på medelvärden istället för medianer. d) En nackdel med att använda glidande medelvärden är att metoden inte baserar sig på en matematisk modell. Detta skapar problem eftersom man då inte kan använda sig av de vanliga inferensverktygen, t.ex beräkna konfidensintervall eller utföra en hypotesprövning. 2

Uppgift 3a) och b) Genom att beräkna första differensen på Y t, dvs. Z t = Y t Y t 1, blir serien stationär. Z t pendlar bara mellan värdena 1 och 2 och serien har därför ett konstant väntevärde z = 1.5 och varians vilket är krav för stationäritet. t y t y t 1 z t z t 1 z t z z t 1 z 2000 3 * * * * * 2001 5 3 2 * 0.5 * 2002 6 5 1 2-0.5 0.5 2003 8 6 2 1 0.5-0.5 2004 9 8 1 2-0.5 0.5 2005 11 9 2 1 0.5-0.5 2006 12 11 1 2-0.5 0.5 2007 14 12 2 1 0.5-0.5 2008 15 14 1 2-0.5 0.5 2009 17 15 2 1 0.5-0.5 2010 18 17 1 2-0.5 0.5 Då vi har en AR(1)-modell med drift fås skattningen av φ 1 som: ˆφ 1 = 2010 t=2002 (zt z)(z t 1 z) 2010 = ( 0.5) 0.5+0.5 ( 0.5)+...+( 0.5) 0.5 t=2001 (zt z)2 0.5 2 +( 0.5) 2 +...+( 0.5) = 2.25 2 2.5 = 0.9 c) Den anpassade AR(1) modellen är: z t = 2.85 0.9z t 1 Eftersom att z t = y t y t 1 kan vi utveckla AR(1) modellen: (y t y t 1 ) = 2.85 0.9(y t 1 y t 2 ) y t = 2.85 0.9y t 1 +0.9y t 2 +y t 1 = 2.85+0.1y t 1 +0.9y t 2 Prognosmodellen ser då ut på följande sätt: ŷ t+1 = 2.85+0.1y t +0.9y t 1 Stoppar man sedan in värden från Y t så får man prognosen: ŷ 2011 = 2.85+0.1y 2010 +0.9y 2009 = 2.85+0.1 18+0.9 17 = 19.95 Används ˆφ 1 = 0.4 fås att ŷ 2011 = 20.45 3

d) Utgångspunkten är en Random Walk-modell utan drift, Y t = Y t 1 +ǫ t, där p rognosmodellen har följande utseende: ŷ t+1 = y t Eftersom prognosmodellen inte inkluderar parametrar, är det prognosen för en tidsperiod lika med det observerade värdet från föregående tidsperiod: ŷ 2011 = y 2010 = 18 Uppgift 4a) Då alla diagonalelement i övergångsmatrisen är lika med 0 så kommer ett tillstånd aldrig att upprepas mellan två tidsperioder. Tillståndet E 1 kommer aldrig att övergå till E 1, osv. Den praktiska innebörden blir att aktien aldrig kommer att ha samma typ av prisförändring två dagar i följd. b) Övergångsmatrisen av andra ordningen fås som: P (2) = 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 Där varje element i P (2) fås som: p (2) 11 p (2) 12 p (2) 33 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 = = 0 0+0.6 0.2+0.4 0.4 = 0.28 = 0 0.6+0.6 0+0.4 0.6 = 0.24.. = 0.4 0.4+0.6 0.8+0 0 = 0.64 0.28 0.24 0.48 0.32 0.60 0.08 0.12 0.24 0.64 c) Då utfallet den första dagen redan är känt, blir detta utgångspunkten för beräkningen. Startpunkten är tillståndet E 2 och efter tre övergångar (från dag 1 till dag 4) befinnersig aktien i E 1. Övergångssannolikheten vi söker är p (3) 21 vilken fås från övergångsmatrisen av tredje ordningen, P(3) = P P (2). P (3) = 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 I matrisen finns p (3) 21 = 0.152 0.28 0.24 0.48 0.32 0.60 0.08 0.12 0.24 0.64 = 0.240 0.456 0.304 0.152 0.240 0.608 0.304 0.456 0.240 4

Uppgift 5a) E[Z t ] = E[δ +a t +θ 1 a t 1 ] = E[δ]+E[a t ]+E[θ 1 a t 1 ] = δ +E[a t ]+θ 1 E[a t 1 ] = δ Eftersom att E[a t ] = E[a t 1 ] = 0 b) Sannolikheten som efterfrågas är P(X(5) < 2) alternativt P(10 + X(5) < 8). För att beräkna sannolikheten uttrycks X(t) i termer av den standardiserade Brownska Rörelsen B(t). X(t) N(tµ,tσ 2 ) X(t) tµ N(0,1) tσ 2 B(t) N(0,t) B(1) N(0,1) X(t) tµ tσ 2 = B(1) X(t) = tσ 2 B(1)+tµ Där N(0, 1) är en standard-normalfördelning. Stoppar man in värden på parametrarna, t = 5,σ a 2 = 0.8 och µ = 0.1, fås att X(5) = 2B(1) + 0.5. Detta uttryck ger sannolikheten: P(X(5) < 2) = P(2B(1)+0.5 < 2) = P(B(1) < 2.5 ) = P(Z < 1.25) 2 P(Z < 1.25) = [enligt tabell] = 0.1056 = 10.56% c) Det x-värde vi söker är det som löser följande ekvation: 0.75 = e 4.5+0.15x 1+e 4.5+0.15x Om man möblerar om uttrycket fås att: 0.75(1+e 4.5+0.15x ) = e 4.5+0.15x 0.75+0.75e 4.5+0.15x = e 4.5+0.15x 0.75 = e 4.5+0.15x 0.75e 4.5+0.15x 0.75 = 0.25e 4.5+0.15x 3 = e 4.5+0.15x ln3 = lne 4.5+0.15x ln3 = 4.5+0.15x x = ln3+4.5 0.15 37 5

d) Eftersom X 1 kan uttryckas som en linjärkombination av X 2 så finns ett multikollinearitetsproblem. Man kan då inte se en unik effekt av respektive variabel och parameterskattningarna från modellen kommer inte att vara väntevärdesriktiga. Matematisk lösning: Y = β 0 +β 1 (3+7X 2 )+β 2 X 2 +ǫ = β 0 +3β 1 +7β 1 X 2 +β 2 X 2 +ǫ = (β 0 +3β 1 )+(7β 1 +β 2 )X 2 +ǫ Man ser då att modellens nya intercept (β 0 + 3β 1 ) och lutning (7β 1 + β 2 ) överskattar de sanna parametervärdena β 0 och β 2. e) Laspeyres Index = P L 0 t = n i=1 (ptq 0) n i=1 (p 0q 0 ) 100 Paasches Index = P P 0 t = n i=1 (ptqt) n i=1 (p 0q t) 100 Stoppar man in värden för p och q i de olika formlerna fås följande indexvärden då man summerar över alla n=3 varor: P2009 2010 L = 650 2+749 0.8+31.7 8 2152.8 600 2+699 0.8+31.3 8 2009.6 100 107.1 P2009 2011 L = 750 2+799 0.8+35.6 8 2424 600 2+699 0.8+31.3 8 2009.6 100 120.6 P2009 2010 P = 650 2+749 1.0+31.7 12 2429.4 600 2+699 1.0+31.3 12 2274.6 100 106.8 P2009 2011 P = 750 2+799 1.1+35.6 11 2770.5 600 2+699 1.1+31.3 11 2313.2 100 119.8 6