1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 16 januari 2008, kl 18.00 20.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 23 januari på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 23/1 på ordinarie mottagningstider. Observera att korrekt lösning anslås på anslagstavlan plan 3 i samband med att själva tentamen avslutas. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Vi har ett statistiskt material om tre observationspar (x i, y i ) som är ( 1, 3), ( 2, 6), och (0, 0). Om vi med hjälp av minsta-kvadratmetoden skattar en regressionsekvation till detta material får den vilken form? (2 poäng) a) y = 2 + x b) y = 3x c) y = 3x d) y = 3 + 6x
2 2. För 18 stycken hushåll undersöktes eventuellt samband mellan hushållets bruttoårsinkomst (i tusentals kronor, variabeln Inkomst nedan) och de sammanlagda utgifterna under året för inköp av nudlar (i kronor, variabeln Kons nedan). Grafiskt ser sambandet ut enligt följande: 1500 Scatterplot of Kons vs Inkomst 1000 Kons 500 0 100 200 300 400 Inkomst 500 600 700 Ovan har den genom minsta-kvadratmetoden skattade regressionslinjen ritats ut. En minitabkörning ger följande resultat: Regression Analysis: Kons versus Inkomst The regression equation is Kons = 876-1,59 Inkomst Predictor Coef SE Coef T P Constant 875,7 163,3 5,36 0,000 Inkomst -1,5913 0,4616-3,45 0,003 S = 312,782 R-Sq = 42,6%
3 (forts fråga 2) Hur skall regressionskoefficienten tolkas? (2 poäng) a) För varje tusental kronor som inkomsten stiger så minskar i genomsnitt utgifterna för nudlar med ca 1,59 procent. b) För varje tusental kronor som inkomsten stiger så minskar i genomsnitt utgifterna för nudlar med ca 15,9 procent. c) För varje tusental kronor som inkomsten stiger så minskar i genomsnitt utgifterna för nudlar med 1,59 kronor. d) För varje tusental kronor som inkomsten stiger så minskar i genomsnitt utgifterna för nudlar med 15,90 kronor. 3. Bestäm korrelationskoefficienten för materialet i fråga 2? a) 1,59 b) 1,59 c) 0,426 d) 0,653 4. Har skall interceptet (konstanten) tolkas i modellen för materialet i fråga 2? a) För varje tusental kronor som inkomsten stiger så minskar i genomsnitt utgifterna för nudlar med 15,90 kronor. b) Ett hushåll utan inkomst konsumerar nudlar för 876 kronor. c) Ett hushåll utan inkomst konsumerar nudlar för 87,60 kronor. d) 8,76 procent av konsumtionsutgifterna i ett inkomstlöst hushåll går till nudlar. 5. Hur stor är residualvariansen för materialet i fråga 2? a) 97833 b) 0,426 c) 312,782 d) 875,7
4 6. Uppskatta för materialet i fråga 2 storleken på den residual som avser en observerad hushållsinkomst om 567 000 kronor? a) Drygt 135 kronor b) Knappt 19 000 kronor c) 25,6 d) 799 7. Vilket av följande är sant angående materialet i fråga 2? (2 poäng) a) Vi har fler positiva än negativa residualer. b) Sex hushåll har ingen nudelkonsumtion överhuvudtaget. c) Fyra hushåll lägger mer än en procent av sin bruttoinkomst på nudlar. d) Determinationskoefficienten är 42,6 procent. 8. Följande indexserie avser det genomsnittliga priset (årsmedeltal) i dollar per ton för en viss råvara; År 2001 2002 2003 2004 2005 Pris 100 112 110 123 130 Om priset år 2002 var 352 dollar, hur mycket kostade ett ton av råvaran år 2005? (2 poäng) a) 409 dollar. b) 415 dollar. c) 422 dollar. d) Kan ej beräknas. 9. Om vi för materialet i fråga 8 byter basår till 2004, vad blir indexvärdet för 2003? a) 91 b) 89 c) 87 d) 85
5 10. För materialet i fråga 8, hur stor är den procentuella prissänkningen mellan år 2002 och 2003? a) 2 b) 110 c) 2,18 d) 1,8 11. Följande tabeller visar dels det genomsnittliga priset i kronor för vara A och vara B, dels uppgifter om värdet av konsumtionen i miljoner kronor för respektive vara, under åren 1980 och 2000. Priser Värdet av konsumtionen 1980 2000 1980 2000 ------ ------ ------ ------ Vara A 22 25 550 600 Vara B 30 32 600 800 Bestäm ett Laspeyres fastbasindex för år 2000 med 1980 som basår för varorna A och B sammantagna? a) 109,5 b) 109,6 c) 110,0 d) 109,8 12. Bestäm utifrån uppgifterna i fråga 11 ett Paasches fastbasindex för år 2000 med 1980 som basår för varorna A och B sammantagna? (2 poäng) a) 109,1 b) 109,5 c) 109,8 d) 110,0 13. Varför uppkommer urvalsfel vid beräkningen av KPI? a) Eftersom det är svårt att bedöma skillnader i kvantitet mellan en ny och utgången vara. b) Eftersom det är svårt att bedöma skillnader i kvalitet mellan en ny och utgången vara. c) Eftersom KPI bygger på stickprovsundersökningar. d) Eftersom det inte alltid är möjligt att få fram tillförlitliga och aktuella uppgifter om konsumtionen av olika varor.
6 14. Antag att ett företag under en period av 60 år fått se sin omsättning halverad i reala termer. Hur stor har den genomsnittliga årliga reala procentuella omsättningsminskningen varit? a) 1,15 b) 0,83 c) 1,2 d) 1,33 15. Ett företag uppvisar följande omsättningsutveckling (miljoner kronor); År 2002 2003 2004 2005 2006 Omsättn 200 216 240 272 316 Anpassa en exponentiell trendmodell till materialet. Gör en transformation av tidsvariabeln så att 2004 motsvarar t = 0 och förändringen av en enhet av t är lika med ett år. Hur ser modellen ut? (2 poäng) a) y = 245 1,15 t b) y = 245 1,14 t c) y = 245 1,13 t d) y = 245 1,12 t 16. Vad blir det prognosticerade värdet på omsättningen i miljoner kronor för 2007 enligt den rätt anpassade modellen i fråga 15? a) 373 b) 363 c) 354 d) 344 17. Vilka vikter använder vi om vi konstruerar ett 3-termers glidande medelvärde på t ex tertialdata? (2 poäng) a) 1/3 1/3 1/3 1/3 b) 1/8 1/4 1/4 1/4 1/8 c) 1/3 1/3 1/3 d) 1/4 1/4 1/4
7 18. På ett visst tidsseriematerial har ett 9-termers glidande medelvärde använts. Den med hjälp av det glidande medelvärdet skattade trenden innehåller 40 observationer. Hur många observationer innehåller den tidsserie på vilken trenden skattas? a) 58 b) 48 c) 46 d) 45