Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller text, samt bifogade tabeller och formelblad. Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Tentamen består av sex uppgifter som kan ge totalt 60 poäng. Använd endast institutionens papper för dina svar och lösningar. Betygskriterier: A: 54-60 poäng B: 48-53 poäng C: 42-47 poäng D: 36-41 poäng E: 30-35 poäng F: 0-29 poäng Lösningsförslag till denna tentamen läggs upp på kursens mondosida den 12/2. LYCKA TILL! 1
Uppgift 1 (8 poäng) Använd högst ett A4 för att beskriva tillvägagångssättet för att dekomponera en tidsserie med kvartalsdata för försäljning i en konjunkturberoende bransch. Se NCT 16.1-2 + föreläsning 5 (inklusive kalkylblad) Uppgift 2 (14 poäng) En placering övervägs i en tillgång A (till en kostnad av 120 kr per andel) för vilken vi erhållit uppgifterna (per andel) baserat på de senaste fyra åren (om vardera ca 250 handelsdagar) i tabell 2.1. I alla deluppgifter antas att historisk utveckling gäller också för er aktuella placeringshorisont (ett år). Tabell 2.1 Statistiska moment för tillgång A Moment Medelvärde Varians Skewness Kurtosis Tillgång A 119.64 8.66-0.12 2.78 a. (2 poäng) Testa om fördelningen för A verkar vara normalfördelad. Utför ett Jarque-Bera test. Antag signifikansnivå 5%. Ur tabellen (7a) erhålls då med υ = 2 frihetsgrader kritiskt värde 5.991. Förkasta således H0: Normalfördelning, dvs skevhet=0 och kurtosis=3 till förmån för H1: ej normalfördelning om observerat värde [ på teststatistikan ] [ är större än kritiskt ] tabellvärde. Då observerat ˆτ värde är JB = n 2 + (ˆκ 3)2.12 = 1000 2 + (2.78 3)2 = 4.417 < 5.991 kan vi således ej 6 24 6 24 förkasta H0, dvs vi finner inte stöd att fördelningen ej är normalfördelad. b. (2 poäng) Oavsett resultatet i a., antag att fördelningen för värdet av tillgång A är normalfördelad. Vad är sannolikheten att tillgången ökat i värde med 5% när den realiseras? Eftersom vi antas ha en normalfördelad variabel kan vi räkna på sannolikheten att kursen har ökat med 5% eller mer som sannolikheten P (X > 120 1.05 = 126) P ( X 119.64 8.66 > 126 119.64 8.66 ) P (Z > 2.16) = 1 0.9846 = 0.0154 dvs ca 1.5%. c. (2 poäng) Antag att ytterligare ett tillgångsslag B övervägs (till en kostnad av 60 kr per andel) för vilket vi erhållit uppgifter (per andel) i tabell 2.2. Antag att korrelationen mellan de två tillgångsslagen A och B är -0,30. Vad är variansen för värdet av en portfölj som kostar 60 000 kr, som värdemässigt är viktad lika mellan A och B? Variansen för en portfölj (P) som innehåller A för 30000 (dvs a=250 andelar) och B för 30000 (dvs b=500 andelar) kan skrivas som V (P ) = V (aa + bb) = a 2 V (A) + b 2 V (B) + 2abCov(A, B) = a 2 V (A) + b 2 V (B) + 2abρ A,B SD(A)SD(B) = 250 2 8.66 + 500 2 5.16 + 2
Tabell 2.2 Statistiska moment för tillgång B Moment Medelvärde Varians Skewness Kurtosis Tillgång B 60.26 5.16 0.17 2.97 2 250 500 0.30 8.66 5.16 = 1329895 1153 2 d. (4 poäng) Hur skall portföljen i c. viktas om för att dess varians skall minimeras? Här underlättas beräkningen av om vi antar att en andel av tillgång A kan delas i två delar A med variansen V(A )=V(.5A)=.25V(A)=2.165. För att minimera variansen i en optimal portfölj (Q) sätter vi sedan vikterna för A och B till w A + w B = 1 och den totala varians V (Q) = V (w A A + w B B) = wa 2 V (A ) + wb 2 V (B) + 2w A w BCov(A, B), där Cov(A, B) = ρ A,BSD(A )SD(B) = 0.30 8.66/4 5.16 = 1.00 Om vi deriverar uttrycket med avseende på w A erhålls V (Q)/ w A = 2w A V (A ) 2(1 w A )V (B) + 2(1 w A )Cov(A, B). Detta sätts lika med noll och sedan löses w A ut V (B) Cov(A som w A =,B) = 5.16 ( 1.00) = 0.66. Således skall vi ha en portfölj om 66% A och 34% B, dvs 60000/60*.66=660 andelar A (= 330 andelar A) och V (A )+V (B) 2Cov(A,B) 2.165+5.16 2( 1.00) 60000/60*.34=340 andelar B. Vi får då variansen V (Q) = 330 2 8.66 + 340 2 5.16 + 2 330 340 0.30 8.66 5.16 = 1089554 1044 2 e. (4 poäng) Diskutera vad som talar för eller emot att värdet av portföljen med tillgång A är stationär. Enligt uppgiften gäller historisk utveckling också för aktuella placeringshorisont. Detta antyder att väntevärdet och variansen skulle kunna vara långsiktigt stabila. Kovariansen är svårare att uttala sig om. Vi vet dock att fördelningen baserat på historiska fyra år är normalfördelad och att den antas vara det ett år framåt. Visst stöd finns därför för att den både skulle kunna vara både svagt och strikt stationär. (Noterbart är att detta i s f får anses vara en dålig investering då vi inte förväntas erhålla någon kompensation för den risk vi tar.) Uppgift 3 (10 poäng) Denna fråga är uppdelad i fem delfrågor. I varje delfråga är ett (och endast ett) av alternativen rätt. Skriv tydligt i ditt svar vilket alternativ som är rätt. Rätt svar ger 2 poäng på delfrågan. Motivering behövs inte och ger inte pluspoäng. Om du angett fler än ett alternativ på en delfråga ger det 0 poäng på delfrågan. Delfråga 1 (2 poäng) Antag att vi studerar ett aktiepris (X t ) under ett års tid. Under denna period sker en dag en splitt av aktien. Splitten innebär att varje ägare av en aktie erhåller två nya aktier, utan att det totala börsvärdet märkbart förändras. Vi missar dock att ta hänsyn till detta i våra beräkningar av daglig avkastning, X t = log(x t ) log(x t 1 ). Vilken konsekvens får detta misstag för vår avkastningsserie? a. Vi får troligtvis en outlier i data vid dagen för splitten, och den summerade avkastningen 250 t=1 X t motsvarar den faktiska årsavkastningen. 3
b. Den summerade avkastningen 250 t=1 X t för året blir för låg, eftersom alla dagliga avkastningarna efter splitten kommer att vara för låga. c. Den summerade avkastningen 250 t=1 X t för året blir lägre än den faktiska årsavkastningen och vi får troligtvis en outlier dagen för splitten. d. Den summerade avkastningen 250 t=1 X t för året blir högre än den faktiska årsavkastningen eftersom alla dagliga avkastningarna efter splitten kommer att vara för höga. Rätt svar: c. Delfråga 2 (2 poäng) Vad är syftet med Dickey-Fuller testet? a. Att testa om en autoregressiv modell innehåller en enhetsrot eller ej. b. Att testa om residualerna från en autoregressiv modell är autokorrelerade eller ej. c. Att testa om autokorrelationen i en tidsserie är skiljd från noll eller ej. d. Att testa om en tidsserie följer en slumpvandring. Rätt svar: a. Delfråga 3 (2 poäng) ( ).8.2 En matris har följande utseende Q =. Vad gäller för denna?.4.6 a. Om vi betraktar Q som en markovkedja där rad 1 och 2 motsvarar två olika tillstånd (E 1 och E 2 ) och vi antas börja i tillstånd E 1, då är realiseringen E 2 E 2 troligare än realiseringen E 1 E 1 E 1 E 1 E 1. b. Om vi betraktar Q som en markovkedja där rad 1 och 2 motsvarar två olika tillstånd (E 1 och E 2 ) och vi antas börja i tillstånd E 2, då är realiseringen E 2 E 2 troligare än realiseringen E 1 E 1 E 1 E 1 E 1. c. Q kan vara en kovariansmatris. d. Q kan vara en korrelationsmatris. Rätt svar: b. Delfråga 4 (2 poäng) Vad kännetecknas AR(1) processen Y t = φy t 1 + e t, av då φ = 1? a. Serien är stationär. b. Serien innehåller en positiv drift. c. Serien innehåller en enhetsrot. d. Variansen är inte beroende av tiden. Rätt svar: c. Delfråga 5 (2 poäng) Om residualerna från en linjär regressionsmodell har väntevärdet noll, då gäller alltid att a. Förklaringsgraden R 2 kan inte ökas. 4
b. Antalet observationer är färre än antalet skattade parametrar. c. Residualerna är okorrelerade. d. Parametrarna i regressionsmodellen kan inte vara skattade med minstakvadratmetoden. Rätt svar: e. Uppgift 4 (8 poäng) Ett byggföretag oroas över den framtida orderingången. Baserat på 20 historiska observationer anpassar därför ledningen följande linjära regressionsmodell med syfte att försöka skatta framtida orderingång (Y ) med hjälp av två branschindikatorer (X 1 och X 2 ) Y t = α 0 + α 1 X 1,t 1 + α 2 X 2,t 1 + e t (1) Stickprovskorrelationen för residualerna skattas till r = 0.25, och man misstänker att dessa kan vara autokorrelerade. a. (4 poäng) Utför ett hypotestest om residualerna är autokorrelerade. Var noga med att redovisa alla delar som ingår i testet. Hypoteser H0: φ = 0. H1: φ > 0 Signifikansnivå: 5% (tabell finns bara för denna) Teststatistika: DW 2(1 r) Kritiskt värde/testvärde för n=20 observationer och K=2 variabler: d L = 1.10 och d U = 1.54 Beslutsregel: Förkasta H0 om DW < d L, slutsats ej möjlig om d L < DW < d U, och förkasta ej om d U < DW. Observerat värde på teststatistika är DW=2(1-.25) = 1.5 Slutsats: Eftersom d L < DW < d U kan vi ej dra någon slutsats. b. (4 poäng) Oavsett resultatet av testet i a. så antag att residualerna är autokorrelerade. Hur påverkas företagets möjlighet att dra slutsatser utifrån regressionsmodellen om framtida orderingång av detta? Om residualerna är autokorrelerade så innebär det att residualvariansen underskattas dvs den skall egentligen vara större än den skattade variansen, vilket får till följd att t.ex. prediktionsintervall skulle ha varit bredare, t-statistikor mindre och signifikanstesten således svagare. Sammantaget kommer utsagor om framtida orderingång att bli för säkra. Uppgift 5 (8 poäng) En nyöppnad bilförsäljare misstänker att antalet sålda bilar på kort sikt kan beskrivas med hjälp av en linjär regressionsmodell utan intercept, med tiden sedan öppnandet som förklarande variabel. Tillgängliga data ges i tabellen nedan. 5
antal veckor sedan öppnande 1 2 3 4 5 6 7 8 9 10 antal sålda bilar 7 9 10 14 13 17 16 18 20 19 a. (3 poäng) Skatta den föreslagna modellen, plotta residualerna och kommentera eventuella problem med den. (Notera att det inte är meningsfullt att beräkna förklaringsgraden för en modell utan intercept.) Vi skall skatta modellen y i = βx i + e i. Enligt formelsamlingen skattas β = n i=1 x iy i n i=1 x2 i (1 7 + 2 9 +... + 10 19)/(1 2 + 2 2 +... + 10 2 ) = 904/385 = 2.35. Vi får residualerna e i = y i βx i till 4.65 4.30 2.96 4.61 1.26 2.91-0.44-0.78-1.13-4.48. Plottar vi dessa så ser vi att de relativt linjärt går från höga till låga värden och visar ett starkt samband över tiden. b. (3 poäng) Skatta samma modell men inklusive intercept, plotta residualerna och kommentera eventuella problem med den. Vi skattar nu istället modellen y i = β 0 + β 1 x i + e i. Enligt formelsamlingen skattas β 1 = sx,y = 13.06 = 1.424, och β s 2 x 9.17 0 = y β 1 x = 14.3 5.5 1.424 = 6.5 Vi får residualerna e i = y i β 0 β 1 x i till -0.89-0.32-0.74 1.84-0.59 1.99-0.44 0.14 0.72-1.71. Residualerna kretser nu kring noll, men dock tenderar en positiv residual att följas av en negativ och vice versa, dvs förmodligen är de negativt korrelerade över tiden. c. (2 poäng) Försäljningen blev 23 respektive 24 bilar vecka 11 och 12. Jämför prognosfelen för modellerna i a. och b. vecka (x) 11 12 y 23 24 Beräkna MSFE och MAFE mha följande y βx -2.83-5.17 y β 0 + β 1 x.87.44 MSFE blir således ( 2.83 2 + 5.17 2 )/2 = 17.4 4.2 2 och (.87 2 +.44 2 )/2 =.48.69 2, och MAFE( 2.83 + 5.17 )/2 = 4 och (.87 +.44 )/2 =.65, dvs båda måtten är betydligt lägre för modellen med ett intercept. = Uppgift 6 (12 poäng) a. (2 poäng) Antag att vi beräknat en serie med 5-årigt glidande medelvärden baserat på årsdata från år 1990-2013. Antag att vi önskar en prediktion av år 2014 baserat på denna serie. Vilket är det minsta tidsavståndet mellan prediktionen och observationen av medelvärdesserien? Ett 5-årigt glidande medelvärde beräknas för tidpunkterna 1992-2011. En prediktion av 2014 ligger således minst 2014-2011=3 år framåt. 6
b. (2 poäng) Antag att variansen för tidsserien Y t skiftar mellan absolutbeloppmässigt höga värden i vissa tidsperioder och absolutbeloppmässigt låga värden i andra perioder. Vilket stationäritetsvillkor för Y t riskerar att inte vara uppfyllt? Villkoret som riskerar att ej uppfyllas är att variansen för Y t skall vara oberoende av tiden t. c. (2 poäng) Vilken typ av modell tar hänsyn till att stationäritetsvillkoret som nämns i b. inte är uppfyllt genom att modellera den betingade variansen för Y t? För modellering av denna tidsserie kan (G)ARCH-modeller användas. d. (3 poäng) Beskriv kort skillnaden mellan de prognoser som kan göras med hjälp av enkel och dubbel exponentiell utjämning. För enkel exponentiell utjämning gäller att alla prognoser från tidpunkt t och h stycken steg framåt är det senast utjämnade värdet, dvs en konstant. Vid dubbel exponentiell utjämning adderas även h stycken av den senaste trendkomponenten. e. (3 poäng) Visa att en variansen för en process med startvärde Y 0 som utsätts för en slumpmässig störning e t varje dag t beror av tiden. Antag att variansen för e t = σ 2 samt att Y 0 är en konstant. Då har vi V (Y 0 ) = 0, V (Y 1 ) = V (Y 0 + e 1 ) = σ 2, V (Y 1 ) = V (Y 0 + e 1 + e 2 ) = 2σ 2,..., V (Y t ) = V (Y 0 + e 1 +... + e t ) = tσ 2, dvs variansen beror av tiden t. 7