1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys I (SDA l), 3 högskolepoäng ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, deltidskurs, samt omtentamen samma kurs, heltid, den 8 oktober 2008 kl 18.00 20.00. Resultatet anslås den 15 oktober på anslagstavlan, plan 3. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Ett plutonsbefäl får ett infall att mäta kroppslängden i centimeter hos sina (endast) sex stycken soldater i plutonen. Resultatet blir: 178 195 185 177 180 162 Beräkna standardavvikelsen? (Betrakta inte materialet som en population, i stället vill du skatta standardavvikelsen för hela kompaniet) (2 poäng) a) 10,8 b) 9 c) 81 d) 5,5
2 2. Bestäm variationsvidden för materialet i fråga 1? a) 179 b) 6 c) 33 d) 0 3. Betrakta följande åldersfördelning: Ålder Kumulativ frekvens (%) 20-24 20 25-29 60 30-34 80 35-39 100 Givet att materialet består av 50 personer, hur många av dessa är över 30 år gamla? a) 10 b) 40 c) 20 d) 5 4. Bestäm medianen för materialet i fråga 3? a) 70 b) 29,50 c) 28,75 d) 30 5. Bestäm kvartilavvikelsen för materialet i fråga 3? a) 6 b) 4,1 c) 4,3 d) 4,5 6. Hur vill du klassificera den variabel som behandlas i fråga 3? a) Det är en kvantitativ diskret variabel. b) Det är en kvantitativ kontinuerlig variabel. c) Det är en kvalitativ diskret variabel. d) Det är en kvalitativ kontinuerlig variabel.
3 7. Betrakta följande tabell över personalsammansättningen på ett företag: Kategori Frekvens Kontor/adm 23 Metallarbetare 75 Transport 31 Högre tj-män 21 Ledning 10 Bestäm typvärdet för variabeln Kategori ovan? a) 75 b) 23 c) Kan ej bestämmas. d) Metallarbetare. 8. På vilken datanivå mäts variabeln i fråga 7? a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 9. På vilken datanivå mäts variabeln Födelseår? a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 10. Betrakta följande påståenden: Påstående 1: En kategorivariabel kan vara dikotom. Påstående 2: En numerisk variabel är samma sak som en kvalitativ variabel. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant.
4 11. Betrakta nedanstående frekvensfördelning för en godtycklig variabel, vi har den absoluta frekvensen på den vertikala axeln: Fördelning 45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 Hur förhåller sig typvärde, median och medelvärde till varandra ovan? a) Medelvärde > median > typvärde b) Median > typvärde > medelvärde c) Typvärde > median > medelvärde d) Medelvärde > typvärde > median 12. För en viss inkomstfördelning gäller att 70:e percentilen är 290 000 kronor. Vad innebär det? (2 poäng) a) Att 70 procent tjänar precis 290 000. b) Att 30 procent tjänar mer än 290 000. c) Att 70 procent tjänar mer än 290 000. d) Att 7 procent tjänar mindre än 29 000. 13. Vid vilken urvalsmetod kan förekomsten av periodicitet i urvalsramen få särskilt allvarliga följder? a) Kvoturval b) Systematiskt urval c) Snöbollsurval d) Obundet slumpmässigt urval
5 14. Hur kan validitetsproblemet i en statistisk undersökning på sätt och vis kringgås? a) Genom att minimera bearbetningsfelen. b) Genom ökad reliabilitet. c) Genom att använda postenkäter (ev gruppenkäter) som datainsamlingsmetod. d) Genom att använda operationella definitioner. 15. Om vi ska redovisa den kumulativa fördelningen för en diskret variabel med ett fåtal variabelvärden, vilket av följande diagram kommer då i fråga? a) Summapolygon b) Trappstegskurva c) Stolpdiagram d) Frekvenspolygon 16. Vi använder ett cirkeldiagram när vi ska redovisa den relativa frekvensen för en viss variabel. Vi har mätt ut en pajbit där vinkeln är 43,2 grader. Hur stor andel tycker vi att den biten skall representera? a) 12 procent b) 24 procent c) 1,2 procent d) 2,4 procent 17. Åke deltar i en undersökning som syftar till att kartlägga folks inköpsvanor vad gäller kapitalvaror. Frågorna avser inköp senaste 12-månadersperioden. Åke anger både ny bil och nytt kylskåp, trots att det var 15 resp 22 månader sedan dessa inhandlades. Vad kallas denna typ av minnesfel? a) Sublimerat minnesfel. b) Transcendenseffekt. c) Reliabilitetseffekt. d) Teleskopeffekt. 18. Vilken är den uppenbara nackdelen med en omnibus-undersökning? a) Undersökningskostnaderna tenderar att stiga kraftigt. b) Kvaliteten på svaren tenderar att bli lidande vid stora frågevolymer. c) Respondenterna (de intervjuade) kan aldrig ges anonymitet. d) Skattningar av variansen försvåras.
6 19. För staden Gräsholmen har vi följande statistik för åldersfördelning och dödlighet; Åldersklass Antal personer Antal döda -19 20000 100 20-64 50000 50 65-30000 960 I staden Kvastnäs (med lika många invånare) gäller följande; Åldersklass Antal personer Antal döda -19 20000 90 20-64 40000 30 65-40000 1200 Som synes är den relativa dödligheten större i varje åldersklass i Gräsholmen trots att vi har ett större antal döda i Kvastnäs. Beräkna ett standardiserat uttryck för det allmänna dödstalet i Kvastnäs där vi använt Gräsholmen som standardpopulation? (2 poäng) a) Detta standardiserade dödstal för Kvastnäs är 13,225 promille, att jämföra med det b) Detta standardiserade dödstal för Kvastnäs är 10,525 promille, att jämföra med det c) Detta standardiserade dödstal för Kvastnäs är 10,875 promille, att jämföra med det d) Detta standardiserade dödstal för Kvastnäs är 10,275 promille, att jämföra med det 20. I kap 11 i Dahmström behandlas bl a begreppet handling. En allmän handling som inte är en offentlig handling är en: a) icke-allmän handling. b) lagstadgad handling. c) publik handling. d) hemlig handling. 21. Hur definieras allmänna dödstalet? a) Antal döda under perioden. b) Antal döda under perioden dividerat med medianfolkmängden. c) Antal döda under perioden dividerat med medelfolkmängden. d) Antal döda under perioden dividerat med ingångsfolkmängden.
7 22. För en viss sluten djurpopulation gäller att: Ålder Dödsrisk (%) 0 50 1 60 2 100 Beräkna medellivslängden? a) 1 år b) 0,95 år c) 1,2 år d) 0,7 år