1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys I (SDA l, beskrivande statistik) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 19 september 2007, kl 9.00 11.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast torsdag 27 september på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 27/9 på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Vid en längdhoppstävling uppnådde en deltagare följande resultat (i centimeter, angivna i den ordning hoppen utfördes): 712 843 810 855 830 834 Vilken variationsvidd gäller för materialet ovan? a) 6 b) 1 (en deltagare) c) 143 d) 122
2 2. Bestäm medianen för materialet i fråga 1? a) 830 b) 810 c) 832,5 d) 832 3. På vilken datanivå mäts materialet i fråga 1? a) Kvot b) Nominal c) Intervall d) Ordinal 4. För att kunna bestämma fraktilerna krävs att en variabel mäts på minst ordinalskalenivå, varför? a) Vi måste kunna rangordna värdena. b) Vi måste kunna meningsfullt gruppera värdena. c) Ett visst intervall på skalan måste överallt på denna skala innebära samma sak, s k identiska skalsteg; skillnaden mellan 14 och 12 är lika stor som skillnaden mellan 27 och 25. d) En bestämning av fraktilerna kräver att en absolut nollpunkt kan fastställas. 5. Betrakta variabeln Antal bilar per hushåll. Hur skulle du vilja klassificera denna variabel? a) Det är en kategorivariabel. b) Det är en kvalitativ variabel. c) Det är en diskret kvantitativ variabel. d) Det är en kontinuerlig kvantitativ variabel. 6. Betrakta följande åldersfördelning: Ålder Frekvens (absoluta tal) Kumulativ frekvens (procent) 40-49 10 20 50-59 22 X 60-69 10 Y 70-71 8 Z Vilket typvärde gäller för materialet ovan? a) 22 b) 55 c) 71 d) 10
3 7. I kolumnen för kumulativ relativ frekvens i fråga 6 har tre värden ersatts med X, Y och Z. Vilka är dessa värden? a) 32, 42 och 50 b) 44, 20 och 16 c) 16, 20 och 100 d) 64, 84 och 100 8. Vilken klassbredd gäller för materialet i fråga 6? a) I tre klasser nio år, i en klass ett år b) I tre klasser tio år, i en klass två år c) 31 år d) 32 år 9. Bestäm den tredje kvartilen för materialet i fråga 6? a) 64 b) 65,5 c) 66 d) 66,5 10. Antag att man vill studera ett eventuellt samband mellan någon typ av sjukdom och arbets- och fritidsvanor. Man gör ett urval av individer och följer dessa framåt i tiden för att så att säga se vad som händer med avseende på ett antal variabler. Hur vill du benämna en dylik studie? a) Det är en longitudinell, prospektiv undersökning. b) Det är en longitudinell, retrospektiv undersökning. c) Det är en tvärsnittsstudie, logistisk. d) Det är en snowballing-studie, logistisk. 11. I Karin Dahmströms Från datainsamling till rapport att göra en statistisk undersökning identifieras en rad fördelar med att använda webbenkäter. Vilket är inte en sådan fördel? a) Snabbt b) Kontroll av svaren vid själva besvarandet c) Anonymiteten kan skyddas d) Dataregistrering direkt vid insändandet av enkäten
4 12. Vad är sant angående täckningsfel? a) Undertäckning är vanligtvis mindre allvarligt än övertäckning eftersom man helt enkelt kastar de element som inte hör till målpopulationen. b) Övertäckning men inte undertäckning är exempel på icke-urvalsfel ( non-sampling errors ). c) Undertäckning men inte övertäckning är exempel på icke-urvalsfel ( non-sampling errors ). d) Täckningsfel är exempel på icke-urvalsfel ( non-sampling errors ). 13. Aktiebolaget ABC redovisar för år 2005 en omsättning (försäljningsvärde) på 80 miljoner kronor. Företaget har tre olika produkter; A, B och C. Omsättningens fördelning mellan dessa ges enligt diagrammet nedan: Cirkeldiagram Omsättning 2005 C 25,0% Category A B C A 50,0% B 25,0% År 2006 fördubblades omsättningen. Samtidigt halverades (det absoluta) försäljningsvärdet av produkt B. Däremot var den inbördes relationen mellan produkterna A och C oförändrad; försäljningsvärdet av A var dubbelt så stort som för C. Hur stort var försäljningsvärdet av produkt C år 2006 i miljoner kronor? (2 poäng) a) 47 b) 50 c) 27,5 d) 42,5
5 14. Betrakta nedanstående lådagram, gjort i programmet Minitab, som visar inkomstspridningen för ett visst företag, uttryckt i tusentals kronor: Boxplot of Inkomst Kvinna Kön Man 0 100 200 300 400 Inkomst 500 600 700 800 Vad är sant angående materialet? a) Medianinkomsten för kvinnor är högre än den för män, men medelinkomsten för kvinnor är (troligen) lägre. b) Medianinkomsten för kvinnor är lägre än den för män, men medelinkomsten för kvinnor är (troligen) högre. c) Variationsvidden går ej att ens uppskatta för vare sig män eller kvinnor, eftersom vi inte känner de enskilda observationerna. d) Ingen observation finns bortom 1,5 kvartilavvikelser från någon kvartil. 15. Vilket av följande är inte sant gällande materialet i fråga 14? a) Hälften av kvinnorna har en inkomst mellan 217 000 och 451 000 kronor. b) En fjärdedel av männen tjänar mer än 496 000 kronor. c) Kvartilavvikelsen för kvinnors inkomst är 234 000 kronor. d) Kvartilavvikelsen för mäns inkomst är 132 000 kronor.
6 16. Betrakta nedanstående stam-bladdiagram, gjort i programmet Minitab. Antalet observationer har där angivits vara lika med X. Stem-and-Leaf Display: inköpstillfällen Stem-and-leaf of inköpstillfällen N = X Leaf Unit = 1,0 3 5 555 4 5 6 5 5 9 5 6 5 6 (4) 6 5555 2 6 6 1 6 1 7 0 Hur många observationer omfattar materialet? a) 11 b) 10 c) 14 d) 28 17. Ett trappstegsdiagram bör endast användas då vi vill: a) åskådliggöra den kumulativa fördelningen för en kontinuerlig variabel. b) åskådliggöra den kumulativa fördelningen för en diskret variabel med ett fåtal värden. c) åskådliggöra en variabels utveckling över tiden. d) åskådliggöra de absoluta frekvenserna för en kategorivariabel. 18. Betrakta nedanstående livslängdstabell för en viss djurpopulation: Ålder/år Antal kvarlevande 0 500 1 400 2 200 3 50 Beräkna medellivslängden? (2 poäng) a) 1,65 år b) 1,7 år c) 1,8 år d) 1,95 år
7 19. Beräkna för materialet i fråga 18 den sannolika återstående livslängden för en nyfödd (medianlivslängden)? a) 1 år b) 2 år c) 1,67 år d) 1,75 år 20. I demografiska sammanhang talar man ibland om TFR. TFR ligger i Sverige strax under 2. Ett TFR under 2 indikerar på lång sikt att den naturliga folkökningen kommer att vara negativ. Vad menas med TFR? a) Det summerade fruktsamhetstalet b) Bruttoreproduktionstalet c) Nettoreproduktionstalet d) Födelseöverskottet 21. Den styrande vänstermajoriteten i en viss kommun anklagas av oppositionen för att vara alltför generös med socialbidragsutbetalningar. Kommunens faktiska utgifter för socialbidrag är 4500 kronor per kommuninvånare och år. Detta är 10 procent högre än länsgenomsnittet. En statistiker har dock visat att om man tar hänsyn till befolkningssammansättningen (bl a fler ungdomar) är man inte alls vidare generös. De förväntade utgifterna för socialbidrag blir då 20 procent högre än de faktiska. Vad blir det s k kapacitetsindexet i detta fall? (2 poäng) a) 83,3 b) 120 c) 75,8 d) 132 22. Vad heter den lag vars huvudsyfte är att tillse att den personliga integriteten upprätthålls vid behandlandet av personuppgifter? a) Tryckfrihetsförordningen b) Personuppgiftslagen c) Sekretesslagen d) Identitetsskyddslagen