1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 31 oktober 2007, kl 18.00 20.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 8 november på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 8/11 på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter som kan ge totalt 25 poäng, således sju stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Vi har ett statistiskt material om tre stycken observationspar (x i, y i ) som är (5, 5), (4, 4), och (2, 0). Om vi med hjälp av minsta-kvadratmetoden skattar en regressionsekvation till detta material får den vilken form? (2 poäng) a) y = 0,50 0,75x b) y = 8,27 + 1,75x c) y = 3,29 1,71x d) y = 1,21 + 0,32x
2 2. Regressionsekvationen VariabelA = 70 + 0,80RegressorB ser grafiskt ut som följer: 500 Scatterplot of Variabel A vs Regressor B 450 400 Variabel A 350 300 250 200 200 250 300 350 Regressor B 400 450 500 Gör en uppskattning av residualspridningen? a) 47 b) 95 c) 378 d) 2355 3. Vilken av följande benämningar kan vi inte använda för variabeln Regressor B ovan, och som traditionellt finns på den horisontella x-axeln? a) Beroende variabel b) Oberoende variabel c) Förklarande variabel d) Bakgrundsvariabel 4. Vilket av följande mått ger inte en uppfattning om variationen kring regressionslinjen? a) Determinationskoefficienten b) Residualspridningen c) Residualvariansen d) Regressionskoefficienten
3 5. För att undersöka hur en viss mögelsvamp påverkar veteskörden gjordes på ett antal experimentytor noteringar om mögelsvampförekomst (beräknad med ett visst index) och veteskörd (i kilo per hektar) och man fann följande samband (utskrift från programmet Minitab): Regression Analysis: Veteskörd versus Svampindex The regression equation is Veteskörd = 5476-37,1 Svampindex Predictor Coef SE Coef T P Constant 5476,3 394,2 13,89 0,000 Svampindex -37,122 6,106-6,08 0,001 S = 555,516 R-Sq = 84,1% R-Sq(adj) = 81,8% Analysis of Variance Source DF SS MS F P Regression 1 11407222 11407222 36,96 0,001 Residual Error 7 2160184 308598 Total 8 13567406 Hur skall interceptet (konstanten) tolkas? (2 poäng) a) När svampindex är 100 är skörden 5476 kilo. b) När svampindex är 0 är skörden 5476 kilo. c) Skörden minskar 37,1 kilo för varje enhets ökning av svampindex. d) 54,76 % av variationen i skörden kan förklaras av svampindex. 6. Bestäm korrelationskoefficienten för materialet i fråga 5? (2 poäng) a) 0,84 b) 0,92 c) 37,1 d) 0,917 7. Uppskatta med hjälp av modellen i fråga 5 effekten av en 20 indexenheters ökning av svampindex? a) Skörden minskar med 7,42 procent. b) Skörden minskar med 74,2 procent. c) Skörden minskar med 742 kilo. d) Skörden minskar med 1322 kilo.
4 8. Betrakta följande indexserie: År Index 1999 87 2000 100 2001 105 2002 107 2003 119 2004 120 2005 134 2006 139 Mellan vilka år var den procentuella ökningen av indexvärdet störst? (2 poäng) a) Mellan 2004 och 2005 b) Mellan 1999 och 2000 c) Mellan 2005 och 2006 d) Mellan 2000 och 2001 9. Om vi för indexserien i fråga 8 byter basår till år 2002, vilket indexvärde får vi då för år 2006? a) 130 b) 132 c) 160 d) 152 10. Betrakta nedanstående uppgifter om pris och kvantitet för två varor A och B: Pris vara A år 1990: 35 kronor Pris vara B år 1990: 25 kronor Pris vara A år 2000: 38 kronor Pris vara B år 2000: 30 kronor Försäljning vara A år 1990: 500 st Försäljning vara B år 1990: 800 st Försäljning vara A år 2000: 500 st Försäljning vara B år 2000: 400 st
5 (forts fråga 10) Beräkna ett Laspeyres fastbasindex för år 2000 för de två varorna sammantaget (1990 = 100)? (2 poäng) a) 114,7 b) 113,9 c) 112,7 d) 111,9 11. I samband med beräkningen av KPI är det ibland inte möjligt att få fram tillförlitliga och aktuella uppgifter om konsumtionen av olika varor. Vilken typ av fel ger detta enligt Körner & Wahlgren upphov till? a) Övertäckningsfel med avseende på representantvarorna b) Undertäckningsfel med avseende på representantvarorna c) Fel i vägningstal d) Fel i konsumtionskorgsrepresentation 12. Vad heter det inflationsmått som används av Europeiska centralbanken och som utvecklats för att underlätta jämförelser mellan EU-länderna? a) UND1X b) HIKP c) UNDINHX d) NPI 13. Ett visst index har på 80 år stigit från 187 till 620. Hur stor har den genomsnittliga årliga procentuella ökningen varit? a) 1,51 b) 1,85 c) 2,89 d) 3,16 14. Antag att vi använder en prognosmodell enligt: ŷ = 220 1,08 t där t = 1 betyder år 2005 och t = 1 betyder år 2004 Beräkna det skattade värdet för år 2002?
6 (forts fråga 14) a) 149,7 b) 156,8 c) 174,6 d) 177,3 15. Vinstutvecklingen för ett visst företag följer en uppenbart linjär utveckling och man vill därför anpassa en linjär trendmodell. Gör en lämplig transformation av tidsvariabeln (där svarsalternativen ger vägledning om hur denna bör gå till) och skatta med hjälp av minstakvadratmetoden en linjär trendmodell för materialet nedan: År Vinst miljoner kronor 2002 742 2003 780 2004 792 2005 830 2006 856 Vilken form får denna modell? (2 poäng) a) y = 800 + 28,5t b) y = 800 + 27,8t c) y = 800 + 29,2t d) y = 800 + 26,5t 16. Vad blir det prognosticerade värdet för år 2008 om du använder rätt anpassad modell från fråga 15? a) 906 b) 916,8 c) 911,2 d) 914 17. Antag att vi med hjälp av ett 7-termers glidande medelvärde skattar en trend på en viss tidsserie. Vårt glidande medelvärde består då av 30 stycken observationer. Hur många observationer består den ursprungliga tidsserien, på vilken trenden skattades, av? a) 34 b) 44 c) 37 d) 36
7 18. Betrakta nedanstående tidsserie: 400 Time Series Plot of Försäljning 350 Försäljning 300 250 200 03:1 03:2 03:3 03:4 04:1 04:2 04:3 04:4 År och kvartal 05:1 05:2 05:3 05:4 06:1 Vi har 13 observationer av ett företags försäljning. Det är kvartalsdata som löper från första kvartalet 2003 till första kvartalet 2006. Antag nu att man vill säsongsrensa materialet. En trend skattas med ett 5-termers centrerat glidande medelvärde. Med hjälp av denna skattas säsongskomponenter (säsongskoefficienter alt säsongsindex om multiplikation med 100 sker) i en multiplikativ modell. Uppskatta storleken på säsongskomponenten för det första kvartalet? (förtydligande: det som avses är den generella, justerade, säsongskomponenten) (2 poäng) a) 0,47 b) 2,13 c) 0,81 d) 1,23