Preliminärt lösningsförslag - omtentamen i Finansiell statistik, 2012-08-22 Uppgift 1a) y x -1 0 1 P(Y = y) -1 1/16 3/16 1/16 5/16 0 3/16 0 3/16 6/16 1 1/16 3/16 1/16 5/16 P(X = y) 5/16 6/16 5/16 1 E[X] = ( 1) 5 16 +0 6 16 +1 5 16 = 0 E[Y] = ( 1) 5 16 +0 6 16 +1 5 16 = 0 V[X] = ( 1 0) 2 5 16 +(0 0)2 6 16 +(1 0)2 5 16 = 10 16 V[Y] = ( 1 0) 2 5 16 +(0 0)2 6 16 +(1 0)2 5 16 = 10 16 E[XY] = ( 1) ( 1) 1 16 +( 1) 0 3 16 +...+1 1 1 16 = 0 Cov[X,Y] = E[XY] E[X]E[Y] = 0 0 = 0 Corr[X,Y] = 0 b) X och Y är oberoendeom och endastom P(X = x) P(Y = y) = P(X = x,y = y) för alla kombinationer av (x,y). Testar man detta ser man att: P(X = 1) P(Y = 0) = 5 16 6 16 = 15 3 128 P(X = 1,Y = 0) = 16 Då det finns åtminstånde en kombination av (x, y) där ovanstående relation inte håller, är X och Y beroende (inte oberoende), detta trots att Corr[X,Y] = 0. c) Cov[X,Y] = E[(X µ X )(Y µ Y )] = E[XY Xµ Y Yµ X +µ X µ Y ] = E[XY] E[Xµ Y ] E[Yµ X ]+E[µ X µ Y ] = E[XY] µ Y E[X] µ X E[Y]+µ X µ Y = E[XY] µ Y µ X µ X µ Y +µ X µ Y = E[XY] µ X µ Y 1
Uppgift 2a-c) Eftersom datat är uppdelat i tre perioder är ett 3-punkters glidande medelvärde lämpligt. Tertial X t Xt X t /Xt Korrigerat SI Säsongsrensad X t 2009-1 90 69.3613666 129.8 2009-2 150 134.6667 1.1138614 111.5252735 134.5 2009-3 164 138.0000 1.1884058 119.1133599 137.7 2010-1 100 143.6667 0.6960557 69.3613666 144.2 2010-2 167 150.0000 1.1133333 111.5252735 149.7 2010-3 183 153.6667 1.1908894 119.1133599 153.6 2011-1 111 161.0000 0.6894410 69.3613666 160.0 2011-2 189 167.6667 1.1272366 111.5252735 169.5 2011-3 203 119.1133599 170.4 Säsongsindex: år tertial1 tertial2 tertial3 2009 1.1138614 1.1884058 2010 0.6960557 1.1133333 1.1908894 2011 0.6894410 1.1272366 Median 0.6927483 1.1138614 1.189647584 Säsongsindex 69.27483 111.38614 118.9647584 Korrigeringsfaktorn: 300 69.27483+111.38614+118.9647584 = 1.001249122 Korrigerade säsongsindex: Tertial1 69.27483 1.001249122 = 69.3613666 69.4 Tertial2 111.38614 1.001249122 = 111.5252735 111.5 Tertial3 118.9647584 1.001249122 = 119.1133599 119.1 Till följd av förvirrande direktiv på lektionerna ges även full poäng till de som korrekt har beräknat korrigerade säsongsindex baserat på medelvärden istället för medianer. d) En nackdel med att använda glidande medelvärden är att metoden inte baserar sig på en matematisk modell. Detta skapar problem eftersom man då inte kan använda sig av de vanliga inferensverktygen, t.ex beräkna konfidensintervall eller utföra en hypotesprövning. 2
Uppgift 3a) och b) Genom att beräkna första differensen på Y t, dvs. Z t = Y t Y t 1, blir serien stationär. Z t pendlar bara mellan värdena 1 och 2 och serien har därför ett konstant väntevärde z = 1.5 och varians vilket är krav för stationäritet. t y t y t 1 z t z t 1 z t z z t 1 z 2000 3 * * * * * 2001 5 3 2 * 0.5 * 2002 6 5 1 2-0.5 0.5 2003 8 6 2 1 0.5-0.5 2004 9 8 1 2-0.5 0.5 2005 11 9 2 1 0.5-0.5 2006 12 11 1 2-0.5 0.5 2007 14 12 2 1 0.5-0.5 2008 15 14 1 2-0.5 0.5 2009 17 15 2 1 0.5-0.5 2010 18 17 1 2-0.5 0.5 Då vi har en AR(1)-modell med drift fås skattningen av φ 1 som: ˆφ 1 = 2010 t=2002 (zt z)(z t 1 z) 2010 = ( 0.5) 0.5+0.5 ( 0.5)+...+( 0.5) 0.5 t=2001 (zt z)2 0.5 2 +( 0.5) 2 +...+( 0.5) = 2.25 2 2.5 = 0.9 c) Den anpassade AR(1) modellen är: z t = 2.85 0.9z t 1 Eftersom att z t = y t y t 1 kan vi utveckla AR(1) modellen: (y t y t 1 ) = 2.85 0.9(y t 1 y t 2 ) y t = 2.85 0.9y t 1 +0.9y t 2 +y t 1 = 2.85+0.1y t 1 +0.9y t 2 Prognosmodellen ser då ut på följande sätt: ŷ t+1 = 2.85+0.1y t +0.9y t 1 Stoppar man sedan in värden från Y t så får man prognosen: ŷ 2011 = 2.85+0.1y 2010 +0.9y 2009 = 2.85+0.1 18+0.9 17 = 19.95 Används ˆφ 1 = 0.4 fås att ŷ 2011 = 20.45 3
d) Utgångspunkten är en Random Walk-modell utan drift, Y t = Y t 1 +ǫ t, där p rognosmodellen har följande utseende: ŷ t+1 = y t Eftersom prognosmodellen inte inkluderar parametrar, är det prognosen för en tidsperiod lika med det observerade värdet från föregående tidsperiod: ŷ 2011 = y 2010 = 18 Uppgift 4a) Då alla diagonalelement i övergångsmatrisen är lika med 0 så kommer ett tillstånd aldrig att upprepas mellan två tidsperioder. Tillståndet E 1 kommer aldrig att övergå till E 1, osv. Den praktiska innebörden blir att aktien aldrig kommer att ha samma typ av prisförändring två dagar i följd. b) Övergångsmatrisen av andra ordningen fås som: P (2) = 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 Där varje element i P (2) fås som: p (2) 11 p (2) 12 p (2) 33 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 = = 0 0+0.6 0.2+0.4 0.4 = 0.28 = 0 0.6+0.6 0+0.4 0.6 = 0.24.. = 0.4 0.4+0.6 0.8+0 0 = 0.64 0.28 0.24 0.48 0.32 0.60 0.08 0.12 0.24 0.64 c) Då utfallet den första dagen redan är känt, blir detta utgångspunkten för beräkningen. Startpunkten är tillståndet E 2 och efter tre övergångar (från dag 1 till dag 4) befinnersig aktien i E 1. Övergångssannolikheten vi söker är p (3) 21 vilken fås från övergångsmatrisen av tredje ordningen, P(3) = P P (2). P (3) = 0.0 0.6 0.4 0.2 0.0 0.8 0.4 0.6 0.0 I matrisen finns p (3) 21 = 0.152 0.28 0.24 0.48 0.32 0.60 0.08 0.12 0.24 0.64 = 0.240 0.456 0.304 0.152 0.240 0.608 0.304 0.456 0.240 4
Uppgift 5a) E[Z t ] = E[δ +a t +θ 1 a t 1 ] = E[δ]+E[a t ]+E[θ 1 a t 1 ] = δ +E[a t ]+θ 1 E[a t 1 ] = δ Eftersom att E[a t ] = E[a t 1 ] = 0 b) Sannolikheten som efterfrågas är P(X(5) < 2) alternativt P(10 + X(5) < 8). För att beräkna sannolikheten uttrycks X(t) i termer av den standardiserade Brownska Rörelsen B(t). X(t) N(tµ,tσ 2 ) X(t) tµ N(0,1) tσ 2 B(t) N(0,t) B(1) N(0,1) X(t) tµ tσ 2 = B(1) X(t) = tσ 2 B(1)+tµ Där N(0, 1) är en standard-normalfördelning. Stoppar man in värden på parametrarna, t = 5,σ a 2 = 0.8 och µ = 0.1, fås att X(5) = 2B(1) + 0.5. Detta uttryck ger sannolikheten: P(X(5) < 2) = P(2B(1)+0.5 < 2) = P(B(1) < 2.5 ) = P(Z < 1.25) 2 P(Z < 1.25) = [enligt tabell] = 0.1056 = 10.56% c) Det x-värde vi söker är det som löser följande ekvation: 0.75 = e 4.5+0.15x 1+e 4.5+0.15x Om man möblerar om uttrycket fås att: 0.75(1+e 4.5+0.15x ) = e 4.5+0.15x 0.75+0.75e 4.5+0.15x = e 4.5+0.15x 0.75 = e 4.5+0.15x 0.75e 4.5+0.15x 0.75 = 0.25e 4.5+0.15x 3 = e 4.5+0.15x ln3 = lne 4.5+0.15x ln3 = 4.5+0.15x x = ln3+4.5 0.15 37 5
d) Eftersom X 1 kan uttryckas som en linjärkombination av X 2 så finns ett multikollinearitetsproblem. Man kan då inte se en unik effekt av respektive variabel och parameterskattningarna från modellen kommer inte att vara väntevärdesriktiga. Matematisk lösning: Y = β 0 +β 1 (3+7X 2 )+β 2 X 2 +ǫ = β 0 +3β 1 +7β 1 X 2 +β 2 X 2 +ǫ = (β 0 +3β 1 )+(7β 1 +β 2 )X 2 +ǫ Man ser då att modellens nya intercept (β 0 + 3β 1 ) och lutning (7β 1 + β 2 ) överskattar de sanna parametervärdena β 0 och β 2. e) Laspeyres Index = P L 0 t = n i=1 (ptq 0) n i=1 (p 0q 0 ) 100 Paasches Index = P P 0 t = n i=1 (ptqt) n i=1 (p 0q t) 100 Stoppar man in värden för p och q i de olika formlerna fås följande indexvärden då man summerar över alla n=3 varor: P2009 2010 L = 650 2+749 0.8+31.7 8 2152.8 600 2+699 0.8+31.3 8 2009.6 100 107.1 P2009 2011 L = 750 2+799 0.8+35.6 8 2424 600 2+699 0.8+31.3 8 2009.6 100 120.6 P2009 2010 P = 650 2+749 1.0+31.7 12 2429.4 600 2+699 1.0+31.3 12 2274.6 100 106.8 P2009 2011 P = 750 2+799 1.1+35.6 11 2770.5 600 2+699 1.1+31.3 11 2313.2 100 119.8 6