Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller text, samt bifogade tabeller och formelblad. Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Tentamen består av sex uppgifter som kan ge totalt 60 poäng. Använd endast institutionens papper för dina svar och lösningar. Betygskriterier: A: 54-60 poäng B: 48-53 poäng C: 42-47 poäng D: 36-41 poäng E: 30-35 poäng F: 0-29 poäng LYCKA TILL! 1
Uppgift 1 (6 poäng) Använd högst ett A4 för att beskriva hur olika plottar kan användas för att upptäcka brott mot antaganden som används vid linjär regression (t.ex. normalitet, heteroskedasticitet, autokorrelation, linjäritet/specifikationsfel). Histogram/täthetsskattning/qq-plot - normalitet Skattade värden mot residualer - linjäritet/specifikationsfel x-variabler mot residualer/kvadrerade residualer - heteroscedasticitet Tid mot residualer - autokorrelation Residual mot laggad residual - autokorrelation (skattad autokorrelationsfunktionen) Se föreläsning... samt NCT. Uppgift 2 (8 poäng) Vi har erhållit nedanstående tidsserie med försäljningssiffror i miljoner. År Tertial 2010 2011 2012 2013 1 10 12 11 13 2 8 10 10 11 3 15 15 16 17 a. Beskriv trenden på lämpligt sätt (3 poäng) Använd 3-punkts glidande medelvärde för att erhålla År Tertial 2010 2011 2012 2013 1 **** 12+1/3 12 13+1/3 2 11 12+1/3 12+1/3 13+2/3 3 11+2/3 12 13 **** b. Beräkna säsongseffekten på lämpligt sätt (3 poäng) Med säsongsindexmetoden tar vi först kvoten mellan observation och trend, dvs År Tertial 2010 2011 2012 2013 1 ****.973.971.975 2.727.811.811.805 3 1.286 1.250 1.231 **** Sedan beräknas medianen för varje tertial.973.808 1.250 vilken justeras för genomsnittet (3.031/3) så att säsongsindex erhålls:.973/1.01=.963.808/1.01=.800 1.250/1.01=1.237 c. Säsongsrensa år 2012 på lämpligt sätt (2 poäng) 2
Dela observerade värden med säsongsindex för att säsongsrensa 11/.963=11.42 10/.800=12.50 16/1.237=12.93 Uppgift 3 (10 poäng) Denna fråga är uppdelad i fem delfrågor. I varje delfråga är ett (och endast ett) av alternativen rätt. Skriv tydligt i ditt svar vilket alternativ som är rätt. Rätt svar ger 2 poäng på delfrågan. Motivering behövs inte och ger inte pluspoäng. Om du angett fler än ett alternativ på en delfråga ger det 0 poäng på delfrågan. Delfråga 1 (2 poäng) Ett tillstånd (E) i en Markovkedja kallas absorberande om processen för alltid förblir i detta ( tillstånd ) när den en gång har kommit dit. Vilket av följande påståenden stämmer?.8.2 a. innehåller två absorberande tillstånd..4.6.5.5 0 b. Om man börjar i tillstånd E 2 i.5.5 0 kommer man aldrig att hamna i ett ab- 0 0 1 sorberande tillstånd. c. Om en Markovkedja innehåller absorberande tillstånd går den asymptotiska fördelningen inte att beräkna. 0 0.5.5 d. I Markovkedjan 0.5.5 0 0.5.5 0 är det endast möjligt att nå ett absorberande tillstånd om man börjar i tillstånd E 1. 0 0 0 1 Rätt svar: b. Delfråga 2 (2 poäng) Vad gäller för följande två ARIMA-processer? Y t = φ 0 + φ 1 Y t 1 + φ 2 Y t 2 + φ 3 Y t 3 + ɛ t + θ 1 ɛ t 1 X t = Φ 0 + ε t + Θ 1 ε t 1 + Φ 1 X t 1 + Φ 2 X t 2 + Φ 3 X t 3 a. Y t är en ARIMA(p=3,d=1,q=1) b. Processerna kan inte vara exakt lika c. X t är en ARIMA(p=1,d=0,q=3) d. Oavsett parametervärdena kommer differentiering behövas för att erhålla stationäritet Rätt svar: e. Delfråga 3 (2 poäng) 3
Ett företag använder sig av en enkel exponentiell utjämningsmodell ŷ t,t+1 = αy t + (1 α)ŷ t 1,t för att prognosticera volatilitet. Man avser nu att byta utjämningskonstant från α =.8 till α =.7. Vilket av följande påståenden stämmer då? a. Prognosen kommer att reagera långsammare på den senast tillförda informationen än tidigare. b. Långsiktiga prognoser (flera än en tidsperiod framåt) kommer tendera att vara lägre än tidigare. c. Prognoserna kommer att uppvisa större variation än tidigare. d. Vikten som ges till de äldsta observationerna kommer att minska. Rätt svar: a. Delfråga 4 (2 poäng) Vad stämmer om linjär regression som skattas med minsta-kvadrat-metoden (eng. OLS)? a. Väntevärdet av residualerna är noll. b. Det är möjligt att skatta modellen med en förklarande X-variabel som är konstant. c. Det krävs fler parametrar än observationer för att kunna skatta en linjär regressionsmodell d. Om residualerna är heteroskedastiska kan vi ändå dra korrekta slutsatser om skattade parametrar utifrån test och konfidensintervall som baseras på t-fördelningen. Rätt svar: a. Delfråga 5 (2 poäng) Att en process är svagt stationär innebär att a. den alltid följer en normalfördelning. b. den kan vara en random walk. c. om processen är diskret så bestäms den av 2 t parametrar, där t är tiden i heltal. d. variansen beror endast av tiden. Rätt svar: e. Uppgift 4 (17 poäng) a. (4 poäng) Beskriv varför Laspeyres prisindex tenderar att överskatta prisinflation. Nedan finns exempeldata över kvantitet och pris för två varor som skulle kunna refereras till i beskrivningen. Biobesök Köpfilm År Pris Kvantitet Pris Kvantitet 0 80 20 200 80 1 80 22 200 88 2 100 20 200 90 4
se exempel i L10, p6. b. (3 poäng) I slutet av varje år beräknar en butikskedja sambandet mellan omsättningen (Y ) och en uppsättning av variabler med hjälp av linjär regression; X 1 genomsnittlig öppetid per butik X 2 förändring av konsumentprisindex X 3 genomsnittlig inkomstnivå inom kommunen X 4 antal konkurrenter inom närområdet Parameterskattningarna i modellen brukar vara relativt stabila över åren, bortsett från β 2 för förändring av konsumentprisindex som är mest variabel. I år blev det dock en stor överraskning, då skattningen för genomsnittlig öppettid per butik β 1 kraftigt reducerades, se tabellen nedan. Dock var den enligt p-värdet ungefär lika signifikant som tidigare år, och övriga parameterskattningar var relativt oförändrade. Försök att ge en rimlig förklaring till varför detta resultatet erhållits. År 2010 2011 2112 2013 β 1 75.2 78.78 74.27 1.26 p-värde.013.022.042.024 Det verkar vara en faktor 60 som skiljer skattningen 2013 från de tidigare årens. En faktor 60 när något mäts i tid antyder att man har använt sig av olika tidsenhet, gissningsvis timmar tidigare och minuter 2013. Vi förväntar oss då just denna effekt, att parameterskattningen sjunker med en faktor 60 men att effekten är oförändrad då denna är oberoende av vilken skala som mäts på. c. (6 poäng) Din chef visar stolt upp resultatet från sin skattade regressionsmodell, vilken uppvisar en förklaringsgrad på R 2 adj =.59; y = 4.02 + 20.92x 1 + e där y är kapitalbehov och x är genomsnittligt antal (heltids)anställda. Du misstänker dock att sambandet inte är helt så enkelt och gräver lite i bakgrundsmaterialet där du hittar följande plottar; 5
Föreslå hur modellen skulle kunna förbättras genom att skriva upp ett nytt förslag på en linjär regressionmodell att skatta, förklara vilka variabler som ingår och varför de ingår. I figurerna finns det tre saker att lägga märke till. 1. Histogrammet antyder att fördelningen av kvoten är skev, och tittar vi i spridningsdiagrammet så ser vi varför, sambandet verkar vara exponentiellt snarare än linjärt. 2. Nystartade respektive äldre företag verkar ha olika stark exponentiell utveckling. 3. Startpunkten för nystartade respektive äldre företag verkar vara olika (dvs om vi extrapolerar till 0 antal genomsnittligt anställda). Av dessa skäl torde modellen log(y) = β 0 + β 1 x 1 + β 2 d 1 + β 3 x 1 d 1 + ε { 1 om nystartat passa bättre, där d 1 =. 0 om äldre d. (4 poäng) Följande linjära regressionmodell är skattad baserad på 5 års månadsdata. y t = β 0 + β 1 x 1,t + β 2 x 2,t + β 3 x 3,t + e I plotten ses den skattade autokorrelationsfunktion (ACF) för residualerna. 6
Du misstänker att residualerna är autokorrelerade. Testa därför hypotesen H 0 : φ = 0 mot H 1 : φ > 0 med ett lämpligt test på α =.05 signifikansnivå. Vi gör ett Durbin-Watson test utifrån givna hypoteser. Antag signifikansnivå α =.05 (enda som är given i tabellen). För K=3 variabler har vi i tabellen för 60 observationer d L = 1.48 och d U = 1.69. Läser av skattat autokorrelation r 1.6 i figuren. Vi utnyttjar approximation d obs = 2 (1 r 1 ) =.8. Förkasta således nollhypotesen om ingen autokorrelation. Uppgift 5 (13 poäng) Två variabler X t och Y t kan båda antas vara genererade från samma typ av Wienerprocess N(δt, σ 2 t), där driften δ =.05, variansen σ 2 = 4, och tiden t mäts i dagar. a. (3 poäng) Vad är sannolikheten att X t ökat med minst 1 efter en dag? Vi har E[X 1 ] = δ t =.05 1 =.05, V [X 1 ] = 4 1 = 4. Då blir P (X 1 > 1) = P ( X 1.05 4 > 1.05 4 ) = P (Z >.475) = = 1 P (Z <.475) = om vi interpolerar i tabellen mellan.47 och.48 dvs ca 31.7 % sannolikhet. (1 P (Z <.47)) + (1 P (Z <.48)) 2 = 1.6808 +.6844 2 =.3174 7
b. (3 poäng) Vilken fördelning följer X t + X t? Vi har E[X t + X t ] = E[2X t ] = 2 E[X t ] =.10t, och V [2X t ] = 2 2 V [X t ] = 4 4 t = 16t. dvs N(2δt, 4σ 2 t) c. (3 poäng) Vilken fördelning följer X t + Y t om korrelationen ρ X,Y =.4? Vi har E[X t + Y t ] = E[2X t ] = 2 E[X t ] =.10t, V [X t + Y t ] = V [X t ] + V [Y t ] + 2Cov[X t, Y t ] = = V [X t ] + V [Y t ] + 2ρ V [X t ] V [Y t ] = (4 + 4 + 2.4 2 2) t = 11.2t. dvs N(2 δ t, 11.2 t). d. (4 poäng) Vad är sannolikheten att X t + Y t ökat med minst 1 efter en halv dag, om korrelationen ρ X,Y =.4? Kalla W t = X t + Y t Notera att t =.5 Vi har då E[W.5 ] =.10.5 =.05, V [W.5 ] = 11.2.5 = 5.6. Då blir P (W.5 > 1) = P 1 P (Z <.40) = 1.6554 =.3446 dvs ca 34 % sannolikhet. ( W.5.05 5.6 > 1.05 5.6 ) = = P (Z >.4014) Uppgift 6 (6 poäng) En undersökning studerar risken att ett aktiebolag lägger ner sin verksamhet i Sverige om en majoritet av aktierna i företaget ägs av utländska juridiska personer (utlandsägda företag), och jämför med risken att det läggs ner om en majoritet av aktierna i företaget ägs av svenska juridiska personer (svenskägda företag). Undersökningen, som omfattar 425 företag, redovisar följande tabell. Företaget är utlandsägt Företaget är svenskägt Företaget har lagts ner 25 125 Företaget har ej lagts ner 25 250 8
a) Hur stor är risken att ett företag läggs ner helt oavsett om det är svenskägt eller utlandsägt? (1 poäng) 150/425 = 6/17.353 dvs ca 35 %. b) I logistisk regression modelleras logaritmen av oddset för den intressanta händelsen som en linjär funktion. Hur stor är oddskvoten, dvs oddset att ett företag läggs ner om det är utlandsägt dividerat med oddset att ett företag läggs ner om det är svenskägt? (2 poäng) 25/25 125/250 = 2 dvs 2 gånger högre odds om det är utländskt än svenskt c) Följande logistiska regressionsmodell anpassas till data i tabellen: eβ 0+β 1 x π(x) = 1 + e β 0+β 1 x { 1 om företaget är svenskägt där x = 0 om företaget är utlandsägt. så att π(x) = P (Y = 1 X = x) är sannolikheten att ett slumpvis utvalt företag med värdet x läggs ner. Hur tolkas koefficienten β 1 i den logistiska modellen? (3 poäng) Förväntad förändring av logaritmerad oddskvot för händelse y (dvs nedläggning), vid förändring av en enhet x (dvs om vi byter till svenskt (x=1) från utlandsägt (x=0)). 9