1 STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström Skriftlig omtentamen på momentet Statistisk dataanalys I (SDA l), 3 högskolepoäng ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 3 mars 2008 kl 16.00 18.00. Resultatet anslås den 10 mars på anslagstavlan, plan 3. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Ett nystartat skoföretag ställde följande fråga till 15 kvinnliga SU-studenter: Vilken skostorlek har du? Företaget erhöll följande svar; 39 38 36 41 38 40 37 38 38 36 37 39 39 39 37 Hur stort är det aritmetiska medelvärdet för skostorlek? a. 38,02 b. 38,13 c. 38,67 d. 39,52
2 2. Vad är medianen för materialet i fråga 1? a. 37 b. 38 c. 38,5 d. 39 3. Vad är relationen mellan variationsvidden, variationskoefficienten, och variansen (stickprovsvariansen) för materialet i fråga 1 a. variansen är störst, följt av variationsvidden, som är följt av variationskoefficienten b. variansen är störst, följt av variationskoefficienten, som är följt av variationsvidden c. variationsvidden är störst, följt av variationskoefficienten, som är följt av variansen d. variationsvidden är störst, följt av variansen, som är följt av variationskoefficienten 4. Vad är sant om variabeln i fråga 1? a. Variabeln är kvalitativ b. Variabeln är mätt på nominalskalenivå c. Variabeln är kvantitativ d. Variabeln är kön 5. Betrakta följande längdfördelning (i cm) Längd frekvens 150-154 30 155-159 30 160-164 40 Vad är kvartilavvikelsen för materialet i fråga 5? (2 poäng) a. 3,35 b. 3,85 c. 4,35 d. 4,85 6. Vilken är den lägsta datanivå vid vilken medianen kan beräknas? a. Nominal b. Ordinal c. Intervall d. Kvot
3 7. Om en variabel är kvalitativ, vilket påstående är då falskt? a. Dess variabelvärden kan kategoriseras b. Proportionen (andelen) för ett visst variabelvärde kan bestämmas c. Typvärdet kan beräknas d. Den kan mätas på intervallskalenivå 8. Om vi ska redovisa frekvensfördelningen (absoluta frekvensen) för en kontinuerlig variabel, vilket av följande diagram kommer då i fråga? a. Summapolygon b. Trappstegskurva c. Stolpdiagram d. Frekvenspolygon 9. Om vår målpopulation är Sveriges befolkning, vad är det allvarligaste felet som kan uppstå om vi använder telefonkatalogen som urvalsram? a. Övertäckning, eftersom vi missar de som inte har telefonabbonemang b. Undertäckning, eftersom vi missar de som inte har telefonabbonemang c. Övertäckning, eftersom en del hushåll kan ha fler än ett telefonabbonemang d. Undertäckning, eftersom en del hushåll kan ha fler än ett telefonabbonemang 10. Antag att en intervjuare har 60 kort där det står Jag har använt heroin samt 40 kort där det står Jag har inte använt heroin. Intervjuaren ber respondenten hålla med respektive ej hålla med om påståendet på ett slumpmässigt valt kort (där intervjuaren ej ser vilket påstående som står skrivet på kortet). Vad kallas denna teknik? a. Randomiserad svarsteknik b. Valurnemetoden c. CASI d. CATI 11. En grupp studenter gjorde en enkätundersökning om inställningen till privat barnomsorg. Nedan visas ett utdrag från deras enkät: Vilken är Din huvudsakliga inställning till privat barnomsorg? Mycket positiv Ganska positiv Varken positiv eller negativ Ganska negativ Mycket negativ
4 Vilken datanivå gäller för den variabel som mäts i barnomsorgsfrågan ovan? a. Nominal b. Ordinal c. Intervall d. Kvot 12. I Dahmströms Från datainsamling till rapport beskrivs det totala felet i en undersökning. Vilka feltyper består det totala felet i en undersökning av enligt Dahmström? a. Täckningsfel, bortfallsfel och individfel b. Täckningsfel, individfel och bearbetningsfel c. Partiellt bortfall, individbortfall och typbortfall d. Urvalsfel och icke-urvalsfel 13. En mätmetod som har hög validitet kännetecknas av? a. Stort partiellt bortfall b. Stor förvissning om att man mäter det man avser att mäta c. Stort urvalsfel d. Avsaknad av nominalskalevariabler 14. Nedanstående histogram visar inkomstfördelningen vid ett visst företag. Inkomsten anges i tusental kronor. 4 Histogram över inkomst (i tusentals kronor) 3 Frekvens 2 1 0 300 400 500 Inkomst 600 700 800
5 Vad är klassbredden i histogrammet ovan? a. 25 000 b. 50 000 c. 75 000 d. 100 000 15. Vilket av följande påståenden om materialet i fråga 14 är sant? a. Medianen är 350 000 b. Vi vet att ingen i materialet har en inkomst på exakt 700 000 c. Vi vet att den person med högst inkomst har en inkomst på exakt 800 000 d. Typvärdet är 450 000 16. Betrakta följande trappstegsdiagram (trappstegskurva) över antal TV-apparater i hushållet beräknat på 50 hushåll: 100 80 Procent 60 40 20 0 0 1 2 3 4 Antal TV-apparater 5 6 7 Uppskatta antal hushåll med exakt 1 TV-apparat? a. 10 b. 20 c. 30 d. 40
6 17. Vilket av följande påståenden om materialet i fråga 16 är sant (2 poäng)? a. 70% av hushållen har fler än 3 apparater. b. alla hushåll har minst 1 apparat. c. 90% av hushållen har minst 2 apparater. d. Inget hushåll har fler än 7 apparater. 18. På två företag har man undersökt medellönen (i tusentals kronor). På företag A har man 20% kvinnor medan man på företag B har 50% kvinnor. På båda företagen har man 100 anställda. Följande medellöner redovisas per kön och företag. A B Kön Medellön Medellön Man 500 510 Kvinna 450 460 Som synes är medellönen högre för både män och kvinnor i företag B trots att den ostandardiserade medellönen är högre i A. Beräkna ett standardiserat uttryck för medellönen i A där vi använt B som standardpopulation? (2 poäng) a. Den standardiserade medellönen för A är 475 000 kr, att jämföra med den verkliga medellönen i B som är 510 000 kr. b. Den standardiserade medellönen för A är 500 000 kr, att jämföra med den verkliga medellönen i B som är 485 000 kr. c. Den standardiserade medellönen för A är 475 000 kr, att jämföra med den verkliga medellönen i B som är 485 000 kr. d. Den standardiserade medellönen för A är 500 000 kr, att jämföra med den verkliga medellönen i B som är 510 000 kr. 19. En naturlig folkökning ett visst år innebär att: a. det under det aktuella året föds fler än det dör. b. det under det aktuella året föds fler än året innan. c. det under det aktuella året är ett positivt invandringsöverskott. d. det under det aktuella året är ett positivt inflyttningsöverskott. 20. Följande gäller för en sluten kohort av en viss djurpopulation: Ålder Antal kvarlevande 0 1000 1 700 2 400 3 0
7 Beräkna medellivslängden för djurpopulationen ovan? a. 1,00 b. 1,50 c. 1,60 d. 2,55 21. Beräkna den sannolikaste livslängden för materialet i fråga 20? a. 1 b. 1,5 c. 2 d. 2,5. 22. Det allmänna födelsetalet mäts vanligen i a. binära tal b. absoluta tal c. procent d. promille