1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 19 december 2007, kl 18.00 20.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 8 januari på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 8/1 på ordinarie mottagningstider. Observera att korrekt lösning anslås på anslagstavlan plan 3 i samband med att själva tentamen avslutas. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Vi har ett statistiskt material om tre stycken observationspar (x i, y i ) som är (0, 2), (2, 3), och (2, 5). Om vi med hjälp av minsta-kvadratmetoden skattar en regressionsekvation till detta material får den vilken form? (2 poäng) a) y = 2 2x b) y = 3x c) y = 2 x d) y = 1 1,5x
2 2. För 19 stycken hushåll undersöktes eventuellt samband mellan hushållets inkomst (i tusentals kronor) och de sammanlagda utgifterna för julklappsinköp (också det i tusentals kronor). Grafiskt ser sambandet ut enligt följande: Scatterplot of Utgifter vs Inkomst 9 8 7 6 Utgifter 5 4 3 2 1 0 0 100 200 300 400 500 Inkomst 600 700 800 900 Ovan har den genom minsta-kvadratmetoden skattade regressionslinjen ritats ut. En minitabkörning ger följande resultat: Regression Analysis: Utgifter versus Inkomst The regression equation is Utgifter = - 0,05 + 0,00707 Inkomst Predictor Coef SE Coef T P Constant -0,049 1,014-0,05 0,962 Inkomst 0,007073 0,002221 3,18 0,005 S = 1,99706 R-Sq = 37,4%
3 (forts fråga 2) Hur skall regressionskoefficienten tolkas? (2 poäng) a) För varje tusental kronor som inkomsten stiger så ökar i genomsnitt utgifterna för julklappar med ca 7 procent. b) För varje tusental kronor som inkomsten stiger så ökar i genomsnitt utgifterna för julklappar med ca 0,7 procent. c) För varje tusental kronor som inkomsten stiger så ökar i genomsnitt utgifterna för julklappar med drygt 7 kronor. d) För varje tusental kronor som inkomsten stiger så ökar i genomsnitt utgifterna för julklappar med drygt 70 kronor. 3. Uppskatta med hjälp av modellen i fråga 2 hur stor inkomst det hushåll har som har utgifter för julklappar motsvarande 4 000 kronor? a) 572 843 kronor b) 607 202 kronor c) 565 778 kronor d) Saknar inkomst (enligt modellen) 4. Bestäm korrelationskoefficienten för materialet i fråga 2? a) 0,374 b) 1,99706 c) 0,61 d) 0,14 5. Uppskatta för materialet i fråga 2 storleken på den residual som avser en observerad hushållsinkomst om 780 000 kronor? a) Drygt 6700 kronor b) Knappt 5500 kronor c) Drygt 1200 kronor d) Drygt 1 440 000 kronor 6. Hur stor är residualspridningen för materialet i fråga 2? a) 0,05 b) 37,4 procent c) 0,962 d) 1997 kronor
4 7. Antag att man korstabellerat två variabler för olika undergrupper och att man okulärt sett ett tecken på ett visst samband. Man gör chi-2 tester baserade på de olika korstabellerna. Samtliga korstabeller har samma undersökningsvariabel åsikt med variabelvärdena mycket positiv, positiv, tveksam och negativ. Åsiktsvariabeln testas mot Kön, som (naturligtvis) är antingen man eller kvinna. Hur många frihetsgrader gäller för respektive chi-2 test? a) 3 b) 4 c) 6 d) 8 8. De fyra personer som tillsammans gör undersökningen som refereras i fråga 7 har fyra helt olika uppfattningar om hur de olika resultaten skall tolkas, trots att de har tillgång till samma chi-2 tabell. Vem vill du ge rätt? (2 poäng) a) Ett lägre värde på chi-2 variabeln än den kritiska gränsen indikerar ett samband och högre än vår signifikansnivå. b) Ett högre värde på chi-2 variabeln än den kritiska gränsen indikerar ett samband och högre än vår signifikansnivå. c) Ett lägre värde på chi-2 variabeln än den kritiska gränsen indikerar ett samband och lägre än vår signifikansnivå. d) Ett högre värde på chi-2 variabeln än den kritiska gränsen indikerar ett samband och lägre än vår signifikansnivå. 9. Betrakta följande indexserie: År 2001 2002 2003 2004 Index 100 121 144 160 Mellan vilka år var den procentuella ökningen störst? (2 poäng) a) Mellan 2001 och 2002 b) Mellan 2002 och 2003 c) Mellan 2003 och 2004 d) Kan ej beräknas
5 10. Utgå ifrån materialet i fråga 9: hur stor var den genomsnittliga årliga procentuella ökningen under perioden? a) 12,5 b) 17 c) 20 d) 25 11. Byt basår för indexserien i fråga 9, till år 2003. Vad blir indexvärdet för år 2001? a) 56 b) 69 c) 77 d) 79 12. Beakta två varor A och B. 1995 kostade vara A 20 kronor och vara B kostade 30 kronor. Det konsumerades 1995 100 enheter av båda varorna. År 2005 hade priset på vara A stigit med 25 procent och priset på vara B hade stigit med 30 procent. Konsumtionen (mätt i antal enheter) av vara A var 2005 oförändrad jämfört med 1995, däremot hade konsumtionen av vara B sjunkit från 100 till 60 stycken enheter. Beräkna ett Paasches fastbasindex för år 2005 för de två varorna sammantagna, med 1995 som basår? (2 poäng) a) 129 b) 128 c) 127 d) 126 13. Försäljningen av en viss produkt tycker man följer en linjär utveckling över tiden och man vill därför anpassa en linjär trendmodell. Gör en lämplig transformation av tidsvariabeln (där svarsalternativen ger vägledning om hur denna bör gå till) och skatta med hjälp av minstakvadratmetoden en linjär trendmodell för materialet nedan: År Försäljning miljoner kr 2002 52 2003 70 2004 85 2005 102 2006 120
6 (forts fråga 13) Vilken form får denna modell? (2 poäng) a) y = 85,8 + 16,8t b) y = 85,8 + 17t c) y = 86,2 + 16,8t d) y = 86,2 + 17t 14. Vilken blir den skattade trendmässiga ökningen av försäljningen i miljoner kronor över en treårsperiod givet att man använder rätt skattad modell i fråga 13? a) 50,4 b) 51 c) 28,6 d) 28,7 15. Antag att vi använder en prognosmodell enligt: ŷ = 112 1,10 t där t = 1 betyder år 2004 och t = 1 betyder år 2003 Beräkna det skattade värdet på y för år 2008? a) 156 b) 180 c) 223 d) 264 16. Vilken årlig procentuell ökningstakt ger modellen i fråga 15? a) 10 b) 21 c) Knappt 5 d) 12
7 17. Vi har på tertialdata anpassat en trend med hjälp av ett glidande medelvärde (3-termer) på en viss tidsserie. Vi vill nu också säsongsrensa materialet och skattar därför säsongskoefficienter i en additiv modell. Nedan följer en förteckning över de faktiska värdena på tidsserien där trendvärdet subtraherats för respektive tertial: Tertial 1 Tertial 2 Tertial 3 10,7 9,9-22,2 11,3 11,5-21,4 13,8 11,2-22,4 12,6 9,4 Hur många observationer innehåller den ursprungliga tidsserien på vilken trend och säsongskoefficienter skattas? a) 11 b) 12 c) 13 d) 15 18. Beräkna för materialet i fråga 17 en justerad (korrigerad) säsongskoefficient för tertial 1? (2 poäng) a) 10,3 b) 10,5 c) 10,7 d) 10,9