1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 20 november 2008 kl 14.00 16.00. Resultatet anslås senast den 27 november på anslagstavlan, plan 3. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL!. 1. Bestämmer man en rät regressionslinje anpassad till ett visst statistiskt material bestående av endast tre stycken parvisa observationer (x i, y i ) som är (2,3), (4,5) och (7,5) får den vilken form? (2 poäng) a) y = 4,26 + 0,17x b) y = 2,74 + 0,37x c) y = 2,45 + 2,58x d) y = 7,50 0,65x
2 2. På en viss arbetsplats arbetar åtta personer vars ålder i år och månadsinkomst i kronor framgår av följande; Ålder Inkomst 26 21500 30 21200 34 23000 45 36400 33 27600 39 29000 50 31000 25 19700 En minitabkörning ger följande resultat; Regression Analysis: Inkomst versus Ålder The regression equation is Inkomst = 5853 + 577 Ålder 38000 Scatterplot of Inkomst vs Ålder 36000 34000 32000 Inkomst 30000 28000 26000 24000 22000 20000 25 30 35 Ålder 40 45 50
3 Hur ska vi tolka regressionskoefficienten? (2 poäng) a) När åldern ökar med ett år stiger inkomsten med 5,77 procent. b) När åldern ökar med ett år stiger inkomsten med 577 kronor. c) När åldern ökar med en procent stiger inkomsten med 5,77 procent. d) När åldern ökar med en procent stiger inkomsten med 577 kronor. 3. Uppskatta residualen för den observation som avser en 30-åring? a) 21200 b) (23163 21200) 2 c) 1963 d) 1963 4. På kontoret som avses i fråga 2 anställs en ny medarbetare som får 32000 kronor i lön. Ge med hjälp av regressionsmodellen en uppskattning av dennes ålder? a) 45 år b) 44 år c) 43 år d) 42 år 5. För en viss enkel regressionsmodell gäller att determinationskoefficienten är 0,78. Vilket av följande påståenden kan inte vara sant angående denna modell? a) Regressionskoefficienten är lägre än 0,78. b) Vi har ett negativt samband mellan variablerna. c) Vi har multikollinearitetsproblem. d) Residualvariansen är mindre än 0,78. 6. Residualspridningen är alltid: a) den kvadrerade residualvariansen. b) roten ur residualvariansen. c) den kvadrerade korrelationskoefficienten. d) roten ur regressionskoefficienten.
4 7. Betrakta följande påståenden om index: Påstående 1: Om vi antar att det är mer komplicerat och tar längre tid att få fram uppgifter om kvantiteter än priser är Paasches formel mer praktisk och enklare att använda än Laspeyres formel. Påstående 2: COICOP är en typ av kedjeindex som bygger på NPI. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 8. Följande indexserie avser det genomsnittliga priset (årsmedeltal) i dollar per ton för en viss råvara; År 2003 2004 2005 2006 2007 Pris 100 107 118 115 125 Om priset år 2004 var 3512 dollar, hur mycket kostade ett ton av råvaran år 2005? a) 3898 dollar. b) 3873 dollar. c) 3829 dollar. d) Kan ej beräknas. 9. Om vi för materialet i fråga 8 byter basår till 2006, vad blir indexvärdet för 2004? a) 91 b) 92 c) 93 d) 94
5 10. Följande tabeller visar dels det genomsnittliga priset i kronor för vara A och vara B, dels uppgifter om värdet av konsumtionen i miljoner kronor för respektive vara, under åren 1997 och 2007. Priser Värdet av konsumtionen 1997 2007 1997 2007 ------ ------ ------ ------ Vara A 27 33 450 540 Vara B 30 31 510 550 Bestäm ett Laspeyres fastbasindex för år 2007 med 1997 som basår för varorna A och B sammantagna? (2 poäng) a) 111,9 b) 112,9 c) 112,2 d) 111,7 11. Bestäm utifrån uppgifterna i fråga 10 ett Paasches fastbasindex för år 2007 med 1997 som basår för varorna A och B sammantagna? a) 111,9 b) 112,9 c) 112,2 d) 111,7 12. Varför uppkommer urvalsfel vid beräkningen av KPI? (2 poäng) a) Eftersom det inte alltid är möjligt att få fram tillförlitliga och aktuella uppgifter om konsumtionen av olika varor. b) Eftersom det är svårt att bedöma skillnader i kvalitet mellan en ny och utgången vara. c) Eftersom det är svårt att bedöma skillnader i kvantitet mellan en ny och utgången vara. d) Eftersom KPI bygger på stickprovsundersökningar.
6 13. Betrakta följande påståenden om chi-2 testet: Påstående 1: Testar vi ett eventuellt samband mellan två binära variabler får vi utvärdera det kritiska chi-2 värdet för två frihetsgrader. Påstående 2: Beräkningen av själva chi-2 statistikan förutsätter användning av de relativa frekvenserna (både observerade och förväntade) i tabellcellerna. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 14. Vi har på kvartalsdata skapat en trend med hjälp av ett centrerat glidande medelvärde (5- termer) på en viss tidsserie. Vi vill nu också säsongsrensa materialet och skattar därför säsongskoefficienter i en additiv modell. Nedan följer en förteckning över de faktiska värdena på tidsserien där trendvärdet subtraherats för respektive kvartal; Kvartal 1 Kvartal 2 Kvartal 3 Kvartal 4 5,0-12,6 2,7 2,5 4,5-11,2 5,3 3,5 5,2-13,1 Hur många observationer innehåller den ursprungliga tidsserien på vilken trend och säsongskoefficienter skattas? a) 14 b) 12 c) 6 d) 10 15. Beräkna för materialet i fråga 14 en justerad säsongskoefficient för kvartal 1? (2 poäng) a) 3,0 b) 2,9 c) 3,1 d) 2,7
7 16. Ett företag uppvisar följande omsättningsutveckling (miljoner kronor); År 2003 2004 2005 2006 2007 Omsättn 150 178 200 245 360 Anpassa en exponentiell trendmodell till materialet. Gör en transformation av tidsvariabeln så att 2005 motsvarar t = 0 och förändringen av en enhet av t är lika med ett år. Hur ser modellen ut? (2 poäng) a) y = 216 1,22 t b) y = 216 1,23 t c) y = 216 1,24 t d) y = 216 1,25 t 17. Vad blir det prognosticerade värdet för 2009 enligt den rätt anpassade modellen i fråga 16? a) 494 b) 608 c) 479 d) 511 18. Körner och Wahlgren hänvisar till att man i traditionell tidsserieanalys brukar tala om fyra olika variationsorsaker eller komponenter. Tre av dessa är trend, säsong och slump. Vilken är den fjärde? (2 poäng) a) Relativ trendrörelse b) Årstidsvariation c) Konjunktur d) Säsongsindex