1 STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistiska metoder SDA III, 2 poäng ingående i kurserna Grundkurs i statistik 20 p samt Undersökningsmetodik och statistisk dataanalys 10 p, den 16 april 2007 kl 15.00 17.00. Observera att endast den särskilda svarsbilagan skall lämnas in. Resultatet anslås senast måndag 23 april på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 23 april på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 18 uppgifter varav 7 stycken är tvåpoängsuppgifter, totalt således 25 poäng. För betyget godkänd krävs minst 15 poäng och för betyget väl godkänd krävs minst 22 poäng. Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn samt personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagan det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Varför kan multikollinearitet inte uppträda i enkel regression? a) Sambanden vi skattar är endast linjära. b) Korrelationskoefficienten är inte entydigt definierad. c) Vi har bara en oberoende variabel, i multipel regression flera. d) Vi har bara en beroende variabel, i multipel regression flera. 2. Följande material föreligger vad gäller en grupp studenter i fråga om tentamensresultat och ålder; (se nästföljande sida)
2 Ålder (år) Tentamensresultat (antal poäng) 20 25 21 18 21 23 23 17 25 13 31 8 37 23 En minitabkörning ger följande resultat; Regression Analysis: Resultat versus Ålder The regression equation is Resultat = 23,8-0,223 Ålder Predictor Coef SE Coef T P Constant 23,81 11,00 2,16 0,083 Ålder -0,2229 0,4215-0,53 0,620 S = 6,52608 R-Sq = 5,3% R-Sq(adj) = 0,0% Analysis of Variance Source DF SS MS F P Regression 1 11,91 11,91 0,28 0,620 Residual Error 5 212,95 42,59 Total 6 224,86 Unusual Observations Obs Ålder Resultat Fit SE Fit Residual St Resid 7 37,0 23,00 15,56 5,47 7,44 2,09R R denotes an observation with a large standardized residual. Grafiskt ser sambandet ut enligt; (se nästföljande sida)
3 (forts fråga 2) Scatterplot of Resultat vs Ålder 25 20 Resultat 15 10 20 22 24 26 28 Ålder 30 32 34 36 38 Vilket intercept har vi för materialet? a) 19,8 b) 23,8 c) 0,223 d) 0,223 3. Hur skall vi tolka interceptet ovan? (2 poäng) a) Som det genomsnittliga tentamensresultatet. b) Som den genomsnittliga åldern. c) Som uppskattat tentamensresultat för en 25-åring (25 är medelvärdet för åldern). d) Interceptet kan i detta fall inte ges någon rimlig tolkning. 4. Om vi trimmar materialet i fråga 2 genom att plocka bort 37-åringen skulle det linjära sambandet mellan ålder och tentamensresultat bli; a) starkare. b) svagare. c) oförändrat. d) Det kan ej ens approximeras hur sambandet skulle påverkas.
4 5. Gör en uppskattning av hur stor regressionskoefficienten är om vi tar bort 37-åringen från materialet i fråga 2? (2 poäng) a) 0,19 b) 0,86 c) 1,43 d) 0,25 6. Använd modellen i fråga 2 för att uppskatta hur många poäng en 40-årig student skulle uppnå? a) 23 b) 17 c) 15 d) 9 7. Nedanstående indexserie visar prisutvecklingen för en viss vara: År Index 2001 93 2002 98 2003 100 2004 105 2005 110 2006 115 Mellan vilka år var den procentuella prisstegringen som störst? a) Mellan 2001 och 2002. b) Mellan 2005 och 2006. c) Den var lika stor mellan 2001 och 2002 som mellan 2005 och 2006. d) Den vara lika stor mellan varje år utom mellan 2002 och 2003. 8. Vilket basår har vi för materialet i fråga 7? a) 2001 b) 2003 c) 2002, 2003 och 2005 är samtliga basår. d) Kan ej bestämmas.
5 9. Om vi för materialet i fråga 7 byter basår till 2006, vad blir då indexvärdet för 2001? a) 78 b) 79 c) 81 d) 137 10. När man beräknar KPI görs ett urval av varor och tjänster. Vad kallas detta urval? a) Prisbasbeloppsvarorna. b) Kedjeindexvarorna. c) Deflateringsvarorna. d) Representantvarorna. 11. Antag att vi använder en prognosmodell enligt: = 102 1,05 t där t = 1 betyder år 2006 och t = 1 betyder år 2005 Vilket av nedanstående beskriver bäst denna modell? (2 poäng) a) En exponentiell trend med 5 procents årlig ökningstakt. b) En exponentiell trend med 10,25 procents årlig ökningstakt. c) En exponentiell trend med knappt 2,5 procents årlig ökningstakt. d) En exponentiell trend med 2 procents årlig ökningstakt. 12. Använd modellen i fråga 11 för att skatta trendvärdet för år 2003? a) 97 b) 93 c) 88 d) 80 13. Man vill skatta omsättningsutvecklingen för ett visst företag. Denna tycks följa en linjär utveckling och man vill därför anpassa en linjär trendmodell. Gör en lämplig transformation av tidsvariabeln (där en enhets förändring av t = ett halvår) och skatta med hjälp av minsta kvadratmetoden en linjär trendmodell för materialet nedan: År Omsättning milj kronor 2003 556 2004 612 2005 662 2006 728
6 (forts fråga 13) Vilken form får denna modell? (2 poäng) a) y = 639,5 + 28,3t b) y = 639,5 + 28,5t c) y = 639,5 + 28,7t d) y = 639,5 + 28,9t 14. Gör med hjälp av den i fråga 13 skattade modellen en prognos av omsättningen i miljoner kronor år 2007? a) 781 b) 782 c) 783 d) 784 15. En viss djurpopulation har halverats i storlek på femtio år. Hur stor har den genomsnittliga procentuella minskningen per år varit? (2 poäng) a) 2 b) 1,453 c) 1,412 d) 1,377 16. Vi har på tertialdata anpassat en trend med hjälp av ett glidande medelvärde (3 termer) på en viss tidsserie. Vi vill nu också säsongsrensa materialet och skattar därför säsongskoefficienter i en multiplikativ modell. Nedan följer en förteckning över de faktiska värdena dividerade med de skattade trendvärdena: Tertial 1 Tertial 2 Tertial 3 0,88 1,26 0,90 0,93 1,18 0,94 0,92 Beräkna en justerad (korrigerad) säsongskoefficient för tertial 3? (2 poäng) a) 1,20 b) 1,21 c) 1,22 d) 1,23
7 17. För staden Boxhult har vi följande statistik för åldersfördelning och dödlighet; Åldersklass Antal personer Antal döda -29 10000 50 30-64 25000 25 65-15000 500 I staden Lidtuna, som har lika många invånare, gäller följande; Åldersklass Antal personer Antal döda -29 10000 45 30-64 20000 15 65-20000 620 Som synes är dödligheten större i varje åldersklass i Boxhult trots att vi har ett större antal döda i Lidtuna. Beräkna ett standardiserat uttryck för det allmänna dödstalet i Lidtuna där vi använt Boxhult som standardpopulation? (2 poäng) a. Detta standardiserade dödstal för Lidtuna är 10,925 promille, att jämföra med det b. Detta standardiserade dödstal för Lidtuna är 10,575 promille, att jämföra med det c. Detta standardiserade dödstal för Lidtuna är 10,275 promille, att jämföra med det d. Detta standardiserade dödstal för Lidtuna är 10,025 promille, att jämföra med det 18. I 1949 års tryckfrihetsförordning (TF) specificeras vad som menas med en handling. Vilket av följande är korrekt med avseende på handling? a) En handling måste vara försedd med text. b) En handling är alltid antingen allmän eller hemlig. c) En allmän handling är en handling som förvaras hos en statlig eller kommunal myndighet, den har antingen kommit in till myndigheten eller upprättats där. d) En offentlig handling är antingen allmän eller hemlig.