1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys I (SDA l, beskrivande statistik) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, deltid/kvällskurs, den 31 oktober 2007, kl 18.00 20.00. Kan även tenteras av dagkursstudenter. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 8 november på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 8/11 på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. I ett visst bostadsområde finns totalt 20 kvinnor i fertil ålder, nedan ges en förteckning över antalet barn per kvinna för denna grupp: 0 4 2 1 1 1 2 0 3 0 4 2 5 1 1 1 1 2 2 3
2 (forts fråga 1) Bestäm det aritmetiska medelvärdet? a) 1,8 b) 1,75 c) 1,6 d) 1,5 2. Bestäm medianantalet barn för materialet i fråga 1? a) 1 b) 1,5 c) 1,9 d) 2 3. Vilken variationsvidd gäller för materialet i fråga 1? a) 20 b) 5 c) 1,399 d) 1,183 4. Vilket typvärde gäller för materialet i fråga 1? a) 2 b) 1 c) 1,9 d) 20 5. Hur vill du klassificera den variabel som beskrivs i fråga 1? a) Det är en numerisk kategorivariabel b) Det är en icke-numerisk kategorivariabel c) Det är en kontinuerlig kvantitativ variabel d) Det är en diskret kvantitativ variabel 6. Vilken datanivå gäller för den variabel som beskrivs i fråga 1? a) Kvot b) Intervall c) Nominal d) Ordinal
3 7. Variabeln Ålder är en: a) kategorivariabel som mäts på en kvotskala. b) numerisk variabel som mäts på intervallskala. c) är en kontinuerlig kvantitativ variabel. d) är en numerisk variabel som mäts på ordinalskala. 8. I en viss enkät förekom följande fråga: Använder du deoderant? Ja Nej Vad är sant gällande denna variabel? a) Den är kvantitativ b) Den är binär c) Det är inte en kategorivariabel d) Det är inte en kvalitativ variabel 9. Betrakta nedanstående material: Variabel Frekvens (absoluta tal) Kum frekvens (absoluta tal) Kum frekvens (%) A 25 25 Y B 50 X 100 Bestäm X och Y? a) X = 100 och Y = 50 b) X = 100 och Y = 33,3 c) X = 25 och Y = 50 d) X = 75 och Y = 33,3 10. Betrakta nedanstående åldersfördelning: Ålder Frekvens 50-59 10 60-69 40 70-74 10
4 (forts fråga 10) Bestäm kvartilavvikelsen? a) 15 b) 5,45 c) 5,25 d) 3,75 11. Bestäm medianen för materialet i fråga 10? a) 65,5 b) 64,5 c) 65 d) 64 12. Vilken av följande feltyper kan inte uppkomma vid totalundersökningar? a) Täckningsfel b) Bortfallsfel c) Urvalsfel d) Bearbetningfel 13. En undersökning som kännetecknas av hög validitet använder en metod som: a) gör bättre skattningar ju skevare fördelningen är. b) följer en viss grupp framåt i tiden, prospektivt. c) mäter det man faktiskt vill mäta. d) alltid garanterar respondentens anonymitet. 14. Vad menas i samband med kodningsprocessen med begreppet oberoende kontroll? a) Materialet kodas på nytt av en ny kodare, en s k kontrollkodare, som stämmer av sin kodning med den först angivna koden. b) Materialet kodas av två (eller fler) kodare som saknar kännedom om den andres/de andras angivna koder. c) En s k kontrollkodare stämmer av, med hjälp av kontrollfrågor, angivna svar i öppna frågor och justerar därefter kodningen med ledning av detta. d) Kodningen sker oberoende av dataregistreringen i bearbetningsprocessen.
5 15. En statistikstudent får höra att hon gjort något galet då hon beräknat en populationsvarians till 25. Hennes uträkning är dock helt korrekt utförd. Det som eftersöktes var i stället en stickprovsstandardavvikelse. Materialet består av 8 observationer. Beräkna med ledning av givna uppgifter denna stickprovsstandardavvikelse? (2 poäng) a) 5,35 b) 5,25 c) 5,15 d) 5,05 16. Betrakta nedanstående diagram: 9 Histogram of Blodtryck: övertryck 8 7 6 Frequency 5 4 3 2 1 0 100 120 140 160 Blodtryck: övertryck 180 200 Vilken klassbredd gäller ovan? a) 20 b) 100 c) 110 d) 10 17. Vad är sant avseende materialet i fråga 16? a) Typvärdet är 150. b) Ingen kan ha ett övertryck om 132. c) Materialet består av totalt 205 observationer. d) Det aritmetiska medelvärdet är 150.
6 18. Betrakta nedanstående lådagram gjort i programmet Minitab och som visar spridningen vad gäller årsomsättning i miljoner kronor för ett antal företag ingående i en viss studie: Boxplot of Omsättning 0 20 40 60 80 Omsättning 100 120 140 Vad är sant beträffande materialet ovan? (2 poäng) a) En fjärdedel av alla företag har en omsättning över 69 miljoner kronor. b) Tre fjärdedelar av alla företag har en omsättning över 69 miljoner kronor. c) Hälften av alla företag har en omsättning över 69 miljoner kronor. d) Variansen är 132 miljoner kronor. 19. Vilket av följande gäller för materialet i fråga 18? a) Vi har en extrem observation som ligger bortom 3 kvartilavstånd från tredje kvartilen. b) Vi har en extrem observation som ligger bortom 3 kvartilavvikelser från tredje kvartilen. c) Vi har en extrem observation som ligger bortom 6 kvartilavvikelser från tredje kvartilen. d) Vi har en extrem observation som ligger bortom 1,5 variationsvidder från tredje kvartilen.
7 20. En stabil befolkning får man om: a) brutto- och nettoreproduktionstalen är lika stora. b) nettoreproduktionstalet är något högre än bruttoreproduktionstalet och samtidigt dödligheten i olika åldrar under en mycket lång period är konstant. c) nettoreproduktionsstalet är konstant. d) dödligheten i olika åldrar är konstant under en mycket lång period, och befolkningen dessutom är sluten. 21. Inflyttningsöverskottet anges vanligen i: a) procent. b) promille. c) absoluta tal. d) percentiler. 22. För en viss bransch gäller att medellönen är 26 000 kronor. På det i den aktuella branschen verkande företaget Kapacitetsmetoden AB har man med hjälp av branschstatistik räknat fram en förväntad medellön i företaget på 23 400 kronor, om man tar hänsyn till företagets personalsammansättning. Det s k kapacitetsindex blir här 120. Vad har man för faktisk medellön på företaget? (2 poäng) a) 21 667 kronor b) 31 200 kronor c) 28 080 kronor d) 19 500 kronor