1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 22 november 2007, kl 14.00 16.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 28 november på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 28/11 på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Vi har ett statistiskt material om tre stycken observationspar (x i, y i ) som är (1, 6), ( 1, 6), och ( 3, 4). Om vi med hjälp av minsta-kvadratmetoden skattar en regressionsekvation till detta material får den vilken form? (2 poäng) a) y = 6,23 + 1,20x b) y = 5,83 + 0,50x c) y = 5,20 + 0,0034x d) y = 6x
2 2. Sambandet mellan ålder och TV-tittande studerades för sju personer. Grafiskt såg det ut enligt nedan. Med hjälp av minsta kvadrat-metoden har en regressionsmodell skattats, och den funktionen har också ritats in nedan: 25 Scatterplot of Tv-tittande/vecka vs Ålder 20 Tv-tittande/vecka 15 10 5 20 30 40 Ålder 50 60 Uppskatta storleken på regressionskoefficienten? (2 poäng) a) 0,41 b) 0,83 c) 67 procent d) 3,82 3. Uppskatta storleken på interceptet (konstanten)? a) 9,67 b) 67 c) 2,63 d) 5,72
3 4. Gör med hjälp av den modell som grafiskt visas i fråga 2 en uppskattning av hur många timmar per vecka en 55-åring tittar på TV? a) 5,72 b) 20 c) 23 d) 26 5. En regressionsekvation skattas med hjälp av minsta kvadrat-metoden. Materialet består av sex observationer. Nedan listas samtliga residualer. 5 7,5 4 8 3,5 X Som synes har en av residualerna ersatts med ett X, vilket värde har X? a) 7,5 b) 7,5 c) 3 d) 3 6. För variabler på vilken datanivå är rangkorrelationskoefficienten ett lämpligt sambandsmått? a) Nominal b) Kvot c) Ordinal d) Intervall 7. Du får reda på att residualspridningen för ett visst material är 92, vilka slutsatser kan dras av det? (2 poäng) a) Korrelationskoefficienten är 0,96 eller 0,96 beroende på om sambandet är positivt eller negativt. b) Determinationskoefficienten är strax under 85 procent (exakt 0,8464). c) Denna residualspridning tyder på ett starkt samband mellan variablerna, och det måste vara ett positivt samband. d) Vi kan med ledning av denna information inte uttala oss om sambandets styrka.
4 8. Betrakta följande indexserie: År 2003 2004 2005 2006 Index 100 91 75 60 Mellan vilka år var den procentuella minskningen störst? (2 poäng) a) Mellan 2003 och 2004 b) Mellan 2004 och 2005 c) Mellan 2005 och 2006 d) Kan ej beräknas 9. Utgå ifrån materialet i fråga 8: hur stor var den genomsnittliga årliga procentuella minskningen under perioden? a) 10,0 b) 12,0 c) 13,3 d) 15,7 10. Byt basår för serien i fråga 8, till år 2005. Vad blir indexvärdet för år 2006? a) 80 b) 85 c) 125 d) 83 11. I vilket av nedanstående index exkluderas varor som i huvudsak importeras? a) UNDINHX b) NPI c) HIKP d) UND1X (numera benämnt KPIX) 12. Beakta två varor A och B. 1990 kostade vara A 20 kronor och värdet av konsumtionen var 200 miljoner kronor. År 2000 hade priset stigit med 25 procent men värdet av konsumtionen halverats.
5 (forts fråga 12) Vara B kostade 1990 10 kronor och värdet av konsumtionen var 100 miljoner kronor. År 2000 var såväl pris som konsumtionsvärde oförändrat jämfört med 1990. Beräkna ett Paasches fastbasindex för de två varorna sammantagna, med 1990 som basår? (2 poäng) a) 120 b) 117 c) 114 d) 111 13. Antag att vi använder en prognosmodell enligt: ŷ = 220 1,18 t där t = 1 betyder år 1950 och t = 1 betyder år 1900 Beräkna det skattade värdet på y för år 2000? a) 260 b) 306 c) 361 d) 427 14. Vilken årlig procentuell ökningstakt ger modellen i fråga 13? a) 0,66 b) 0,72 c) 18 d) 0,33 15. BNP-utvecklingen för ett visst land följer en uppenbart linjär utveckling och man vill därför anpassa en linjär trendmodell. Gör en lämplig transformation av tidsvariabeln (där svarsalternativen ger vägledning om hur denna bör gå till) och skatta med hjälp av minstakvadratmetoden en linjär trendmodell för materialet nedan: År BNP, miljarder lokal valuta 2002 330 2003 340 2004 348 2005 362 2006 370
6 (forts fråga 15) Vilken form får denna modell? (2 poäng) a) y = 350 + 10,2t b) y = 350 + 10,4t c) y = 350 + 10,6t d) y = 350 + 10,8t 16. Vad blir det prognosticerade värdet för år 2007 när du använder rätt anpassad modell för materialet i fråga 15? a) 380,6 b) 381,2 c) 381,8 d) 382,4 17. Vi har på kvartalsdata skattat en trend med hjälp av ett centrerat glidande medelvärde (5- termer) på en viss tidsserie. Vi vill nu också säsongsrensa materialet och skattar därför säsongskoefficienter i en additiv modell. Nedan följer en förteckning över de faktiska värdena på tidsserien där trendvärdet subtraherats för respektive kvartal; Kvartal 1 Kvartal 2 Kvartal 3 Kvartal 4 3,8-10,0 2,9 2,0 3,2-9,2 3,3 3,0 3,2-10,2 Hur många observationer innehåller den ursprungliga tidsserien på vilken trend och säsongskoefficienter skattas? a) 13 b) 14 c) 10 d) 12 18. Beräkna för materialet ovan en justerad säsongskoefficient för kvartal 2? (2 poäng) a) 3,4 b) 3,6 c) 3,2 d) 3,8