1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys I (SDA l), 3 högskolepoäng ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, deltidskurs, den 29 oktober 2008 kl 18.00 20.00. Resultatet anslås senast den 5 november på anslagstavlan, plan 3. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. En (liten) seminariegrupp om 14 stycken statistikstudenter uppnådde följande tentamensresultat på en kryssfrågetenta liknande den du skriver just nu: 12 23 24 3 17 15 20 25 5 17 22 22 11 17
2 1. Beräkna medianresultatet? (2 poäng) a) 17 b) 22,5 c) 16,6 d) Kan ej bestämmas. 2. Vilken stickprovsvarians gäller för materialet i fråga 1? a) 7 b) 9 c) 47 d) 81 3. Bestäm variationsvidden för materialet i fråga 1? a) 17 b) 12 (stycken) c) 22 d) Kan ej bestämmas. 4. Betrakta följande påståenden om materialet i fråga 1: Påstående 1: Den variabel som mäts är kvantitativ. Påstående 2: Den variabel som mäts är kontinuerlig. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 5. Betrakta följande åldersfördelning: Ålder Kumulativ frekvens (absoluta tal) 20-24 20 25-29 55 30-34 75 35-39 80
3 (forts fråga 5) Hur stor andel av materialet är över 35 år? a) 20 procent. b) 16 procent. c) 5 procent. d) 6,25 procent. 6. Bestäm andra kvartilen för materialet i fråga 5? a) 20 år. b) 27,5 år. c) 27,9 år. d) 27 år. 7. Bestäm typvärdet för materialet i fråga 5? a) 27 år. b) 27,5 år. c) 25 år. d) 30 år. 8. Betrakta följande tabell med frekvensfördelningen för en variabel som i en marknadsundersökning mäter åsikt om en viss förpackningsutformning: Åsikt Frekvens (%) Mycket dålig 28 Dålig 24 Varken bra eller dålig 22 Bra 21 Mycket bra 5 Bestäm medianen för variabeln Åsikt ovan? (2 poäng) a) 50 b) Varken bra eller dålig. c) Bra. d) Dålig.
4 9. På vilken datanivå mäts variabeln i fråga 8? a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 10. Vilken är den högsta datanivån på vilken typvärdet kan bestämmas? (2 poäng) a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 11. Betrakta följande påståenden: Påstående 1: En percentil kan bestämmas för en variabel på intervallskalenivå. Påstående 2: En fraktil kan bestämmas för en nominalskalevariabel. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 12. Du avser att undersöka vad invånarna i Stockholms Län anser i en viss fråga. Du väljer självfallet att göra en stickprovsundersökning och tror att telefonintervjuer kan vara en lämplig datainsamlingsmetod. Lyckligtvis har du ett telefonregister i digitalt format från vilket urvalsdragningar kan göras. Tyvärr avser registret endast abonnenter i länets södra kommuner. Vilket problem beskrivs ovan? a) Klassifikationsfel b) Kodningsfel c) Undertäckningsfel d) Övertäckningsfel 13. När kan det bli aktuellt att använda s k imputering? a) När man vill undvika objektsbortfall. b) För att hantera partiellt bortfall. c) Vid planeringen av en omnibusundersökning. d) När justering för övertäckningsfel behöver göras.
5 14. Vilken av följande urvalsmetoder är inte ett exempel på sannolikhetsurval? a) Obundet slumpmässigt urval. b) Stratifierat urval. c) Kvoturval. d) Systematiskt urval. 15. I Karin Dahmströms Från datainsamlig till rapport beskrivs en rad av postenkätens egenskaper som datainsamlingsmetod. Vad av följande är, med ledning av det som tas upp i boken, inte sant angående postenkäter? a) Respondenten kan konsultera handlingar/anteckningar. b) Man slipper intervjuareffekter. c) Det är en dyr metod. d) Det är svårt att få svar på öppna frågor. 16. Antag att vi vet att 40 procent av Sveriges befolkning anser att regeringen gör ett dåligt eller mycket dåligt arbete. I en webundersökning anslagen på Aftonbladets hemsida blir resultatet att 73 procent av deltagarna anger att regeringen gör ett dåligt eller mycket dåligt arbete. Vilket fel uppkommer (mest sannolikt, givet informationen i frågan) i Aftonbladets undersökning? a) Täckningsfel (specifikt: övertäckningsfel). b) Bearbetningsfel. c) Bias pga själv-val. d) Ett retrospektivt mätfel. 17. Vad menas med kapacitetsindex när vi talar om standardiseringsmetoder? a) Produkten av observerat och förväntat värde. b) Kvoten mellan förväntat och observerat värde. c) Kvoten mellan observerat och förväntat värde. d) Kvoten mellan standardpopulation och jämförelsegrupp. 18. Betrakta diagrammet på nästföljande sida avseende variabeln Föredragen förpackning. Det förekommer inget partiellt bortfall.
Count 6 (forts fråga 18) 10 2.Kön Man Kvinna 8 Bars show counts 6 4 2 Förp A Förb B Förp C 6.Förp val Utvärdera följande påståenden: Påstående 1: Typvärdet för variabeln Kön är Man. Påstående 2: 36,4 procent av kvinnorna föredrar förpackning C. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 19. Lådagrammet på nästföljande sida visar inkomstspridningen för en grupp anställda vid ett visst företag, uppdelat på kön. Inkomsten anges i tusental kronor.
7 Boxplot of Inkomst vs Kön Kvinna Kön Man 100 150 200 250 300 Inkomst 350 400 450 Hur stor är variansen för männens inkomst i materialet ovan? a) Ca 280. b) Ett värde mellan 150 och 200. c) Ca 370. d) Kan ej bestämmas. 20. Uppskatta med hjälp av diagrammet i fråga 19 hur stor andel av kvinnorna som tjänar mindre än 308 000 kronor? a) Ca en fjärdedel. b) Ca hälften. c) Ca tre fjärdedelar. d) Kan ej bestämmas i ett lådagram.
8 21. Den sannolikaste livslängden är: a) den ålder vid vilken hälften av den ursprungliga kohorten har avlidit. b) ett annat uttryck för medellivslängden. c) ett annat utryck för medianlivslängden. d) den ålder vid vilken flest individer avlider. 22. I en s k sluten befolkning: a) antar vi att nativiteten är 0. b) förekommer varken in- eller utflyttning. c) antar vi att mortaliteten är 0. d) förekommer inga varierande dödsrisker.