1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys I (SDA l), 3 högskolepoäng ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, den 17 september 2008 kl 09.00 11.00. Resultatet anslås den 24 september på anslagstavlan, plan 3. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Observera att endast den särskilda svarsbilagan skall lämnas in. Beräkningar beaktas ej. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Betrakta följande frekvenstabell över antal personbilar per hushåll för en grupp om 200 hushåll: Antal fordon Frekvens 0 55 1 78 2 42 3 15 4 10
2 Hur stor är variationsvidden? a) 200 b) 4 c) 45 d) 55 2. Beräkna det aritmetiska medelvärdet för materialet i fråga 1? (2 poäng) a) 1,24 b) 40 c) 1,00 d) 1,57 3. Bestäm medianen för materialet i fråga1? a) 1 b) 78 c) 42 d) 1,58 4. Bestäm typvärdet för materialet i fråga 1? a) Det finns inget typvärde. b) 1,32 c) 1 d) 200 5. Bestäm den första kvartilen för materialet i fråga 1? a) 0,78 b) 0 c) 0,91 d) 1 6. Vad kan sägas om den variabel som mäts i fråga 1? (2 poäng) a) Det är en kvantitativ diskret variabel. b) Det är en kvantitativ kontinuerlig variabel. c) Det är en kvalitativ diskret variabel. d) Det är en kvalitativ kontinuerlig variabel.
3 7. På vilken datanivå mäts variabeln i fråga 1? a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 8. Variabeln Temperatur i Celsiusgrader mäts på vilken datanivå? a) Ordinal. b) Kvot. c) Nominal. d) Intervall. 9. Betrakta följande påståenden: Påstående 1: En dikotom variabel är samma sak som en binär variabel. Påstående 2: En numerisk variabel är samma sak som en kvantitativ variabel. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 10. I ett sannolikhetsurval har varje element i populationen: a) Samma sannolikhet att komma med i urvalet. b) En känd sannolikhet, som är större än noll, att komma med i urvalet. c) En okänd sannolikhet, som är större än noll, att komma med i urvalet. d) Sannolikheten 1 att komma med i urvalet. 11. Snöbollsurval bör främst användas när man vill ha tag på individer: a) som inte vill ta sig tid att delta i en surveyundersökning. b) som gärna tillåter datasamkörning av personliga registeruppgifter. c) som finns i befintliga och lättillgängliga register. d) för vilka vi inte har någon urvalsram.
4 12. Registret SPAR innehåller bl a vissa uppgifter om: a) modersmål och etnisk härkomst. b) inkomst, förmögenhet och fastighetsinnehav. c) gymnasiebetyg och högskolepoäng. d) sparande och konsumtionsvanor. 13. Variationskoefficienten definieras som kvoten: a) aritmetiska medelvärdet / variansen. b) geometriska medelvärdet / variansen. c) standardavvikelsen / aritmetiska medelvärdet. d) variansen / standardavvikelsen. 14. Nedanstående enkla tabell visar arbetslösheten i procent i tre länder A, B och C samt arbetskraftens storlek i miljoner människor i dessa länder. Arbetslöshet beräknas i tabellen som procentuell andel av arbetskraften. Land A Land B Land C Arbetslöshet: 8 12 4 Arbetskraft: 20 15 15 Om vi betraktar dessa tre länder som en och samma arbetsmarknad, hur stor är då arbetslösheten (= det vägda medelvärdet)? a) 12 procent. b) 12,8 procent. c) Går ej att beräkna. d) 8 procent. 15. I absoluta tal, hur stor är arbetslösheten i land B och C sammantaget (för materialet i fråga 14)? a) 1,6 miljoner. b) 10,2 procent. c) 9 procent. d) 2,4 miljoner.
5 16. Betrakta följande påståenden: Påstående 1: Täckningsfel kan endast uppkomma vid totalundersökningar. Påstående 2: Undertäckning är generellt mindre problematiskt än övertäckning. a) Påstående 1 är sant och påstående 2 är falskt. b) Påstående 1 är falskt och påstående 2 är sant. c) Båda påståendena är sanna. d) Inget av påståendena är sant. 17. Betrakta nedanstående lådagram som illustrerar en åldersfördelning; Boxplot of Ålder 20 30 40 50 Ålder 60 70 80 Vilket av följande påståenden om materialet ovan är sant? a) Ingen är 40 år. b) Variationsvidden är mindre än standardavvikelsen. c) Kvartilavståndet är större än kvartilavvikelsen. d) Mer än hälften är under 30 år gamla.
6 18. Betrakta nedanstående diagram; 10 Histogram of Resultat - längdhopp 8 Frequency 6 4 2 0 720 760 800 Resultat - längdhopp 840 880 Vilken klassbredd gäller för materialet ovan? a) 20 b) 40 c) 160 d) 180 19. För staden Bolleberg har vi följande statistik för åldersfördelning och dödlighet; Åldersklass Antal personer Antal döda -29 20000 90 30-64 30000 30 65-30000 600 I staden Arkeby, som har lika många invånare, gäller följande; Åldersklass Antal personer Antal döda -29 10000 50 30-64 60000 60 65-10000 300
7 Beräkna först dödstalet i de båda städerna. Hur stort är det verkliga (ojusterade) dödstalet i Bolleberg? a) 6,5 promille. b) 17 promille. c) 9 promille. d) 11,7 promille. 20. Beräkna med hjälp av uppgifterna i fråga 19 ett standardiserat uttryck för det allmänna dödstalet i Bolleberg där vi använt Arkeby som standardpopulation? (2 poäng) a) Detta standardiserade dödstal för Bolleberg är 4,7250 promille, att jämföra med det b) Detta standardiserade dödstal för Bolleberg är 3,8125 promille, att jämföra med det c) Detta standardiserade dödstal för Bolleberg är 4,7375 promille, att jämföra med det d) Detta standardiserade dödstal för Bolleberg är 3,2545 promille, att jämföra med det 21. Betrakta följande livslängdstabell över en sluten population om 1000 individer av en viss djurart; Ålder/år Antal kvarlevande 0 1000 1 600 2 100 3 0 Beräkna medellivslängden? a) 1,2 år. b) 0,8 år. c) 0,6 år. d) 1 år. 22. Om den sannolika livslängden är avsevärt högre än medellivslängden är en rimlig orsak: a) låg nativitet. b) hög nativitet. c) liten spädbarnsdödlighet. d) stor spädbarnsdödlighet.