1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys I (SDA l, beskrivande statistik) 3 högskolepoäng, ingående i kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, samt samma moment på kursen Undersökningsmetodik och statistisk dataanalys, 15 högskolepoäng, deltid/kvällskurs, den 10 oktober 2007, kl 18.00 20.00. Observera att endast den särskilda svarsbilagan, med försättsblad, skall lämnas in. Resultatet anslås senast 18 oktober på anslagstavlan, plan 3. Tentamen kan utkvitteras på studentexpeditionen plan 7 fr o m 18/10 på ordinarie mottagningstider. Skrivtid: 2 timmar. Hjälpmedel: godkänd miniräknare utan lagrade formler eller text. Tentamen består av 22 uppgifter som kan ge totalt 25 poäng, således tre stycken tvåpoängsuppgifter. Examinationen betraktas som avklarad om poäng motsvarande lägst betyget E uppnås. Följande betygsgränser gäller: Betyg Poäng A 24-25 B 22-23 C 19-21 D 17-18 E 15-16 Fx 12-14 F 0-11 Observera att felaktiga svar ej ger minuspoäng. Använd den särskilda svarsbilagan och ringa in det svarsalternativ som du tycker bäst besvarar frågan. Fler inringade alternativ samt andra oklarheter gör att frågan anses obesvarad. Var noga med att tydligt skriva namn och personnummer på svarsbilagans båda sidor. Skriv dessutom på svarsbilagans båda sidor det platsnummer du har i tentamenssalen. LYCKA TILL! 1. Betrakta nedanstående tabell: Antal bilar per hushåll Frekvens (absoluta tal) 0 66 1 90 2 84 3 48 4 12
2 Bestäm medianen för den variabel som studeras ovan? a) 1 b) 2 c) 150 d) 1,93 2. Beräkna det aritmetiska medelvärdet för den variabel som studeras i fråga 1? a) 2 b) 1,93 c) 1,50 d) 1,75 3. Vilket typvärde gäller för materialet i fråga 1? a) 1 b) 1,75 c) 1,93 d) 90 4. En ornitolog studerar häckningen för en viss fågelart. Hon gör ett stickprov om fem stycken fågelbon för att skatta antalet ägg per bo. Resultatet ser ut som följer: 5 3 4 6 2 Beräkna variansen? a) 1,58 b) 1,41 c) 2,5 d) 2 5. En kvantitativ variabel är antingen: a) en kategorivariabel eller en icke-numerisk variabel b) diskret eller kontinuerlig c) numerisk eller icke-numerisk d) binär eller dikotom
3 6. En kategorivariabel mäter vi på en: a) kvotskala b) kvot- eller intervallskala c) intervallskala d) nominalskala 7. En grupp studenter gjorde en enkätundersökning av inställningen till trängselskatter i Stockholm. Nedan visas ett utdrag från deras enkät: Vilken inställning har du till trängselskatter i Stockholm? Mycket positiv Övervägande positiv Varken positiv eller negativ Övervägande negativ Mycket negativ Vilken datanivå gäller för den variabel som mäts i trängselskattefrågan ovan? a) Intervall b) Kvot c) Nominal d) Ordinal 8. Samma undersökning som refereras i föregående fråga innehöll också följande enkätfråga: Hur stor är din månatliga förvärvsinkomst (brutto)? tusen kronor (avrunda till hela tusental) Vilken datanivå gäller för den variabel som mäts i inkomstfrågan ovan? a) Intervall b) Kvot c) Nominal d) Ordinal
4 9. Betrakta nedanstående åldersfördelning för en grupp om 40 stycken individer: Ålder Frekvens Kumulativ frekvens (absoluta tal) (procent) 20-24 X 25 25-29 Y 60 30-39 Z 100 Som synes har i kolumnen för den absoluta frekvensen tre värden ersatts med X, Y och Z. Vilka är dessa värden? a) 10, 24 och 40 b) 10, 14 och 16 c) 25, 35 och 40 d) Inget av alternativen a, b eller c är rätt 10. Beräkna kvartilavståndet för materialet i fråga 9? a) 8,375 år b) 4,1875 år c) 8,75 år d) 20 individer 11. Vid OSU (obundet slumpmässigt urval) har samtliga individer i populationen: (märk att du ska ange det alternativ som bäst besvarar frågan vilket inte innebär att tre alternativ måste vara fel!) a) samma sannolikhet att komma med i urvalet b) en känd sannolikhet (mellan 0 och 1) att komma med i urvalet c) en okänd sannolikhet att komma med i urvalet d) sannolikheten 0 att komma med i urvalet 12. Vad kan vara en nackdel vid användandet av s k probes? a) Respondenten måste ha tillräcklig bandbredd för att kunna svara på webenkäten. b) Alla har inte tillgång till Internet. c) Det finns en risk att intervjuaren styr det angivna svaret. d) Få personer kan undersökas.
5 13. Erik deltar i en medicinsk studie som vill undersöka om ökat intag av C-vitamin minskar benägenheten att drabbas av höstförkylningar. Han bryr sig inte om att läsa det finstilta om hur undersökningen är upplagd - med en undersökningsgrupp och en kontrollgrupp utan tar för givet att den tablett han äter dagligen i ett halvårs tid innehåller tre gånger dagsbehovet av C-vitamin. Han tycker vid undersökningens slut sig ha märkt en avsevärd förbättring vad gäller hans eget förkylningsläge, men han känner sig också lurad då han efter att skriftligen ha rapporterat om dessa förbättringar får reda på att han tillhört kontrollgruppen som bara fått sockerpiller i stället för C-vitamin. Hur skulle du benämna Eriks upplevda förbättrade friskhet? a) Som ett resultat av dubbel-blind design b) Som en placebo-effekt c) Som effekten av en multivariat experimentmiljö d) Som ett resultat av ett stort mörkertal 14. Betrakta nedanstående histogram: 7 Histogram of Hoppresultat 6 5 Frequency 4 3 2 1 0 780 800 820 840 Hoppresultat 860 880 Vad är sant angående det material som visas i histogrammet? a) Typvärdet är 810. b) Medianen finns i den klass som har högst frekvens. c) Typvärdet är 820. d) Klassbredden är 120.
6 15. Fiskeklubben Fiskelycka i Handen redovisade år 1996 könsfördelningen bland sina medlemmar med hjälp av följande cirkeldiagram: Könsfördelning Medlemmar År 1996 Kvinna 20,0% Category Kvinna Man Man 80,0% År 2006 hade det totala medlemsantalet ökat med 50 procent. Andelen kvinnor hade stigit till 30 procent år 2006, då man var totalt 90 stycken kvinnor i fiskeklubben. Hur många män var medlemmar i klubben år 1996? (2 poäng) a) 125 b) 150 c) 152 d) 160 16. På en viss kvällskurs finns tre undervisningsgrupper; A, B och C. På en tentamen deltar 22, 25 resp 25 från de olika grupperna. Det aritmetiska medelvärdet för resp grupps tentamensresultat framgår enligt nedan: Grupp Antal skrivande Medelpoäng A 22 20,50 B 25 18 C 25 X Medelpoängen för samtliga 72 skrivande var 20. Som synes har medelpoängen för de skrivande från grupp C ersatts med ett X ovan. Beräkna X?
7 (fortsättning fråga 16) a) 21,50 b) 21,52 c) 21,54 d) 21,56 17. Betrakta nedanstående lådagram som visar inkomstspridningen (årsinkomst i tusen kronor) för en viss grupp uppdelad på kategorierna arbetare och tjänstemän: Boxplot of Inkomst Arbetare Yrkeskategori Tjänstemän 100 200 300 400 Inkomst 500 600 700 Vad är sant beträffande materialet som redovisas ovan? (2 poäng) a) Kvartilavvikelsen i kategorin tjänstemän är 53 000 kronor. b) Variationsvidden är större för arbetare än för tjänstemän. c) Kvartilavståndet är större för arbetare än för tjänstemän. d) Tre fjärdedelar av tjänstemännen har en inkomst över 462 000 kronor. 18. En naturlig folkökning ett visst år innebär att: a) det under det aktuella året föds fler än det dör. b) invandringsöverskottet under det aktuella året är positivt. c) det under det aktuella året är ett positivt nettoreproduktionstal. d) det under det aktuella året är ett positivt bruttoreproduktionstal.
8 19. Dödsriskerna för en viss djurart är 30 % under det första levnadsåret, 40 % under det andra och 100 % under det tredje och sista levnadsåret. Beräkna den sannolikaste livslängden (typvärdet) för djurpopulationen i fråga? a) 3 år b) 1,5 år c) 2 år d) 2,5 år 20. Hur brukar det allmänna inflyttningstalet anges? a) I absoluta tal b) I procent c) I promille d) Som en oddskvot 21. För staden Mortdalen har vi följande statistik för åldersfördelning och dödlighet; Åldersklass Antal personer Antal döda -29 25000 125 30-64 30000 75 65-25000 1000 I staden Bredberga, som har lika många invånare, gäller följande; Åldersklass Antal personer Antal döda -29 25000 100 30-64 20000 40 65-35000 1330 Som synes är dödligheten större i varje åldersklass i Mortdalen trots att vi har ett större antal döda i Bredberga. Beräkna ett standardiserat uttryck för det allmänna dödstalet i Bredberga där vi använt Mortdalen som standardpopulation? (2 poäng) a) Detta standardiserade dödstal för Bredberga är 10,925 promille, att jämföra med det verkliga dödstalet i Mortdalen som är 15 promille. b) Detta standardiserade dödstal för Bredberga är 12,575 promille, att jämföra med det verkliga dödstalet i Mortdalen som är 15 promille. c) Detta standardiserade dödstal för Bredberga är 18,375 promille, att jämföra med det verkliga dödstalet i Mortdalen som är 15 promille. d) Detta standardiserade dödstal för Bredberga är 13,875 promille, att jämföra med det verkliga dödstalet i Mortdalen som är 15 promille.
9 22. Reglerna för hemliga handlingar regleras i vilken lag? a) Personuppgiftslagen (PuL) b) Tryckfrihetsförordningen (TF) c) Sekretesslagen (SekrL) d) Statistiksekretesslagen (StatSekrL)