Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller text samt bifogade tabeller och formelblad. Tentamensgenomgång och återlämning: Onsdag 30/1 kl. 16.00 i sal B419. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset. Tentamen består av 5 uppgifter som totalt kan ge 60 poäng. Fullständiga lösningar måste lämnas in för att generera full poäng på en fråga. Använd endast institutionens papper för dina svar och lösningar. Betygskriterier: A: 54-60 poäng B: 48-53 poäng C: 42-47 poäng D: 36-41 poäng E: 30-35 poäng F: 0-29 poäng Lösningsförslag till denna tentamen läggs upp på kursens mondosida den 18/1 kl.15.00 LYCKA TILL! 1
Fråga 1 (12p) Den dagliga förändringen i företaget RisingStars aktiekurs kan modelleras som en markovkedja med tre tillstånd; E 0 =uppgång, E 1 =nedgång och E 2 =oförändrad kurs. Under 31 dagars tid observerades dessa övergångar där 0 motsvarar en uppgång, 1 en nedgång och 2 en oförändrad kurs: 0 1 1 2 0 2 0 1 1 1 2 2 0 0 0 1 0 1 0 2 2 2 1 1 1 0 1 1 0 2 1 a) Skatta övergångsmatrisen. (5p) b) Skatta sannolikheten att aktiekursen går ned i övermorgon om den gick upp idag. (5p) c) Förklara kortfattat innebörden av markovvillkoret. (2p) Fråga 2 (11p) Antag att rörelser i en tidsserie Y t följer en slumpvandring med drift δ: Y t = δ + Y t 1 + a t där a t är oberoende stokastiska feltermer med fördelning: a t N(0, σ 2 a). a) Beräkna E(Y t ) och V (Y t ) (6p) b) Är Y t en stationär tidsserie? Motivera varför/varför inte. (3p) c) Vad är prognosen för tidsperioden t + 1 i slumpvandringsmodellen? (2p) Y t = Y t 1 + a t Fråga 3 (10p) Företaget Körd i Botten AB säljer begagnade bilar till förmånliga priser. För att försöka balansera sitt utbud med rådande efterfrågan gör man löpande försäljningsprognoser med hjälp av utjämningsmodeller, detta för att inte riskera för stora inköp varje månad. Följande tabell anger antalet bilar som företaget sålde under de 10 första månaderna 2012: Månad jan feb mar apr maj jun jul aug sep okt Antal 40 38 38 36 37 33 34 29 28 26 a) Beräkna en utjämnad serie för januari till oktober baserat på en enkel exponentiell utjämning där α = 0.6. Avrunda svaren till 2 decimaler. (5p) b) Beräkna prognoserna för antalet sålda bilar i november och december. (3p) c) Beskriv kort en fördel med att använda MSE för prognosutvärdering. (2p) 2
Fråga 4 (11p) a) Ange tre modellantaganden för multipel regression och förklara varför vart och ett av dessa är viktigt. (6p) b) Ett företag vill undersöka hur försäljningen för dess butiker i olika delar av landet påverkas av olika förklarande variabler. En anställd inser att sambandet är linjärt och skattar en multipel regression baserat på ett slumpmässigt urval om 27 butiker. Modellen är: där Y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + β 4 x 2i x 3i + ε i, ε i N(0, σ 2 ) y i = årlig försäljning i $1000. x 1i = butiksarea i square feet x 2i = annonseringskostnad i $1000 x 3i = 1 om fler än 10000 familjer bor i närområdet (0 annars) Man erhöll följande regressionsutskrift och ANOVA-tablå för den skattade modellen: Koefficient Std. Error t obs Pr(> t ) Intercept -65.827 28.551-2.306 0.030941 x 1 24.544 7.365 3.332 0.003020 x 2 24.942 6.068 4.110 0.000461 x 3 162.764 60.970 2.670 0.014001 x 2 x 3-3.664 7.004-0.523 0.606113 Varationsorsak SS Df MS F obs Regression 928917 4 232229.2 169.39 Residualer 30163 22 1371 Total 959080 26 Den anställda är emellertid osäker på om den anpassade modellen har bäst anpassning och jämför modellen ovan med en reducerad modell Y i = β 0 + β 1 x 1i + β 2 x 2i + ε i ANOVA-tablån för den reducerade modellen är: Variationsorsak SS Df MS F obs Regression 897340 2 448670 174.41 Residualer 61740 24 2572.5 Total 959080 26 3
Testa på 5% signikansnivå vilken av de två modellerna som har bäst anpassning baserat på hypotesuppställningen: (5p) Fråga 5 (16p) H 0 : β 3 = β 4 = 0 H 1 : Åtminstone ett β j 0 j = 3, 4 Denna fråga är uppdelad i 8 delfrågor, där ett av alternativen a)-e) är rätt och där varje rätt svar ger 2 poäng. I den bifogade svarsbilagan ska du endast kryssa i ett alternativ, i de fall där flera alternativ kryssats i ges 0p på delfrågan. Delfråga 1 (2p) Regressionsmodellen Y i = β 0 + β 1 x + ε i anpassades på följande datamaterial: y x 3 1 4 2 8 4 14 7 12 6 10 3 Vad är b 0 och b 1? a) 4.101 och -7.220 b) -0.729 och 11.294 c) 0.330 och 7.236 d) 1.714 och 1.770 Delfråga 2 (2p) Följande regressionsmodell med trend och säsong anpassades på en tidsserie med n = 15 observationer: Y t = β 0 + β 1 t + β 2 D 1 + ε t Då man misstänkte att modellens feltermer var autokorrelerade, vill man göra ett Durbin-Watson test. d obs beräknades till 0.9. Vilket av följande alternativ är sant om signifikansnivån är 5%? a) H 0 : φ = 0 förkastas till förmån för H 1 : φ > 0 b) H 0 : φ = 0 förkastas inte till förmån för H 1 : φ > 0 c) H 0 : φ = 0 förkastas till förmån för H 1 : φ < 0 d) H 0 : φ = 0 förkastas inte till förmån för H 1 : φ < 0 e) Det är osäkert om H 0 : φ = 0 förkastas eller inte. 4
Delfråga 3 (2p) Vilken ARIMA-process har gett upphov till dessa korrelogram? Autokorrelation Partiell autokorrelation ACF -0.5 0.0 0.5 1.0 Partial ACF -0.6-0.2 0.2 0 5 10 15 Lag 2 4 6 8 10 12 14 Lag a) AR(1) b) AR(2) c) MA(1) d) MA(2) Delfråga 4 (2p) De stokastiska variablerna X och Y har följande simultana sannolikhetsfördelning: 0 1 2 3 P(X=x) 0 0.08 0.07 0.04 0.00 0.19 1 0.06 0.15 0.05 0.04 0.30 X 2 0.05 0.04 0.10 0.06 0.25 3 0.00 0.03 0.04 0.07 0.14 4 0.00 0.01 0.05 0.06 0.12 P(Y=y) 0.19 0.30 0.28 0.23 1.00 Y Vad är V(X)? a) 1.68 b) 2.78 c) 1.59 d) 1.09 5
Delfråga 5 (2p) Baserat på den simultana fördelningen för X och Y i delfråga 4, vilket av följande påståenden är sant? a) X och Y är oberoende. b) X och Y är okorrelerade. c) Den simultana fördelningen för X och Y är kontinuerlig. d) Det går ej att beräkna den betingade fördelningen P (X = x Y = y) Delfråga 6 (2p) Antag att en stokastisk process X(t) kan modelleras med en Brownsk Rörelse med driften δ och där X(0) = 0. Vilket av följande påståenden är felaktigt? a) Processen är kontinuerlig. b) Processen är inte stationär. c) Processens väntevärde är E(X(t)) = tδ. d) Processens varians beror inte på t. e) Processen har oberoende ökningar. Delfråga 7 (2p) Vilket av följande påståenden om logistisk regression är sant? a) Logistisk regression används för att modellera en numerisk Y-variabel. b) Skattningen b 1 tolkas som effekten på Y i av enhetförändringar i x 1. c) Modellens parametrar skattas med minsta kvadratmetoden. d) Det går inte att anpassa en modell med kategoriska x-variabler. e) Ett negativt värde på b 1 ger en negativ lutning på den logistiska kurvan. Delfråga 8 (2p) Totte arbetar som drejare på Krukmakeriet Krusidull och samlar in följande data om företagets försäljningspriser (kr) mellan 2009-2011: Vara/År 2009 2010 2011 Muggar 20 25 30 Tallrikar 100 110 110 Krukor 50 52 55 2009 väljs som basår och har index 100. Vad är det viktade Laspeyresindexet för 2011 om vikterna är w muggar = 1/3, w tallrikar = 1/4 och w krukor = 5/12? a) 112.50 b) 109.07 c) 104.17 d) 123.33 e) 115.08 6