TENTAMEN Tentamensdatum 2008-10-02 Statistisk undersökningsmetodik (Pol. kand.) Namn:.. Personnr:.. Tentakod: Obs! Var noga med att skriva din tentakod på varje lösningsblad som du lämnar in. Skrivtid 09.00-13.00, ÖP, sal 4 Hjälpmedel: Miniräknare, utdelad formel- och tabellsamling. Poängfördelning mellan deluppgifter sker enligt lärarens bedömning av dess vikt. För godkänt resultat krävs 50 procent av maximal poäng, för väl godkänd 75 procent. Obs! Utelämnade eller bristfälliga motiveringar medför poängavdrag. Lycka till! Tentamenspoäng Examinationsuppgifter Summa Betyg:
TENTAMEN Tentamensdatum 2008-10-02 Statistisk undersökningsmetodik (Pol. kand.) Tentakod: Uppgift 1 2 3 4 5 6 Summa Poäng
Uppgift 1 (15p) Följande uppgifter besvaras på separat lösningsblad. Kom ihåg att skriva din tentakod på varje blad! a) Vad menas med att man använder tratteknik när man bestämmer ordningen på frågorna i en enkätundersökning? (1p) b) Vad är ett urvalsfel i en urvalsundersökning? (1p) c) Konstruera ett exempel där både undertäckning och övertäckning förekommer i samma undersökning. (2p) d) Vad är innebörden i begreppen rampopulation resp. målpopulation? (2p) e) Redogör kortfattat för de olika stegen i en statistisk undersökning. (4p) f) Definiera begreppet slumpmässigt urval (sannolikhetsurval) (1p) g) Vad är skälet till att göra ett slumpmässigt urval ur en population i stället för att göra ett icke-slumpmässigt urval? (2p) h) Vad är det viktigaste skälet till att man ibland väljer att göra ett stratifierat urval i stället för ett obundet slumpmässigt urval? (2p)
Uppgift 2 (5p) Nedan följer fem flervalsfrågor. På varje fråga finns endast ett korrekt svar. Rätt svar ger en poäng. Felaktigt svar eller uteblivet svar ger noll poäng. Om du kryssar för fler än ett svarsalternativ på en fråga så betraktas svaret som felaktigt. a) Vilket av följande alternativ beskriver bäst ett binomialexperiment? Dra (med återläggning) kort ur en kortlek och räkna antalet kort tills det första esset kommer upp. Dra (utan återläggning) kort ur en kortlek och räkna antalet kort tills det första esset kommer upp. Välj personer ur en mycket stor population och räkna antalet som är för en svensk anslutning till EMU. Räkna antalet bilar som passerar en korsning under en timme. b) Om en rampopulation innhåller element som inte ingår i målpopulationen så har vi övertäckning. undertäckning. ett urvalsfel. ett bortfallsfel. c) Ett lämpligt mått för att mäta styrkan i sambandet mellan två variabler mätta på ordinalskala är Spearmans rangkorrelation. Pearsons korrelation. linjär regression. standardavvikelsen.
Uppgift 2 (forts) d) Om medianen är större än medelvärdet i en fördelning betyder det vanligtvis att fördelningen är skev år vänster. är skev år höger. är symmetrisk. är approximativt normal. e) Om du slumpmässigt väljer vilket svarsalternativ du ska ange på de fem delfrågorna i uppgift 2 så kommer sannolikhetsfördelningen för antal poäng på uppgiften att följa en binomialfördelning med n=4 och p=0,25. en binomialfördelning med n=4 och p=0,75. en binomialfördelning med n=5 och p=0,25. en binomialfördelning med n=5 och p=0,75.
Uppgift 3 (7p) På följande uppgifter anges svaret direkt i formuläret. a) Para ihop varje histogram (1-3) med en av boxplottarna (A-D). (3p) Fig. 1:.. Fig. 2 Fig. 3.. Fig. 1 Fig. A Histogram Boxplot 10 120 8 110 Frequency 6 4 2 90 0 90 110 120 80 Fig. 2 Fig. B 9 Histogram 130 Boxplot 8 7 120 Frequency 6 5 4 110 3 2 1 90 0 90 110 120 130 80 Fig. 3 Fig. C 20 Histogram Boxplot 125 15 120 Frequency 10 5 115 110 105 95 0 0 80 160 240 320 90 85 Fig. D Boxplot 350 300 250 200 150 50 0
Uppgift 3 (forts) b) Ange korrelationen i grafen nedan (skalorna på axlarna är lika). (1p) -0.45 0.25 0.78-0.94 c) Ange minimum, maximum, medianen, samt första och tredje kvartilen för datamaterialet nedan. (3p) 4 3 7 1 5 9 3 10 9 3 4 8 2 1 3 Min:.. Max:. Median:.. Q1:. Q3:..
Uppgift 4 (10p) På följande uppgifter krävs endast svar. Du kan ange svaret direkt i formuläret. a) Beräkna sannolikheten att en standardnormalfördelad variabel antar värden mellan -1,5 och +1,2. (2p) Svar:... b) Beräkna tredje kvartilen i en normalfördelning med väntevärde μ = 110 och standardavvikelse σ = 10. Avrunda till närmaste heltal. (2p) Svar:... c) Beräkna sannolikheten att få krona exakt fem gånger vid tio kast av ett balanserat mynt. (2p) n k n k n n! P( X = k) = p ( 1 p) =, n! = 1 2... n, 0! = 1, 1! = 1 k k k!( n k)! Svar... d) Variationen i längd hos vuxna kvinnor kan beskrivas med en normalfördelning med okänt väntevärde, μ, och standardavvikelsen σ = 7 cm. Hur stort obundet slumpmässigt urval ur populationen behöver vi göra för att stickprovsmedelvärdet med 95 % sannolikhet ska hamna högst 2 cm ifrån populationsmedelvärdet? (2p) Svar:... e) Antag att sambandet mellan antal cyklar och antal bilar i medelstora svenska städer kan beskrivas med följande regressionslinje: Antal cyklar = + 2*Antal bilar. Korrelationen mellan variablerna är r = 0,8. Hur stor blir lutningen på regressionslinjen om vi byter plats på variablerna så att Antal cyklar ska förklara Antal bilar? (2p) Svar...
Uppgift 5 (15p) a) Variationen i livslängd hos glödlampor från tillverkaren Mysbelysning AB kan beskrivas med en normalfördelning med väntevärde μ = 1400 timmar och standardavvikelsen σ = 85 timmar. Tillverkaren vill ange lampornas livslängd på förpackningarna men vet inte vilket värde som ska anges. Sannolikheten att en glödlampa ska ha en kortare livslängd än vad som angivits ska vara 1 %. Hjälp tillverkaren att välja den livslängd som ska anges på förpackningen, avrunda till närmaste tiotal timmar. (6p) b) Förpackningarna med glödlampor packas i kartonger om tio lampor i varje kartong. Beräkna sannolikheten för att det i en slumpmässigt vald kartong ska finnas minst en lampa med kortare livslängd än vad som angivits på förpackningen. (4p) c) Påverkar tiden som små barn sitter vid lunchbordet, hur mycket mat de äter? Vi har data från 20 koltbarn (barn mellan 1 och 3 år) där tider (i minuter), samt antalet kalorier registrerades över flera månaders tid. Sedan räknade man ut den genomsnittliga lunchtiden, samt det genomsnittliga antalet kalorier, för varje barn. Nedan syns en regressionsanalys-utskrift i MiniTab samt ett spridningsdiagram. Tolka och kommentera regressionslinjen (i ord som rör datamaterialet). (3p) Tvillingarna Sara och Måns (2 år) sitter i genomsnitt 15 respektive 41 minuter vid lunchen. Ge prediktioner för deras genomsnittliga lunchintag (i kalorier). Kommentera lämpligheten i prediktionerna? (2p) Regression Analysis: kalorier versus tid The regression equation is kalorier = 561-3,08 tid Predictor Coef SE Coef T P Constant 560,65 29,37 19,09 0,000 tid -3,0771 0,8498-3,62 0,002 S = 23,3980 R-Sq = 42,1% R-Sq(adj) = 38,9% 520 500 480 Regression över lunchtid mot antalet kalorier kalorier 460 440 420 400 20 25 30 tid 35 40 45
Uppgift 6 (8p) Korstabellen nedan visar antalet ensamboende kvinnor och män för olika åldrar år 2006 (källa: SCB). Totalt fanns det ca 4 465 000 hushåll i Sverige då. För varje uppgift kommentera resultaten (Uppge marginalfördelningar och betingade fördelningar i procent). Svar lämnas på separat lösningsblad. a) Ta fram marginalfördelningen för variabeln kön. (2p) b) Ta fram marginalfördelningen för variabeln ålder. (2p) c) Ta fram de betingade ålderfördelningen för män och kvinnor. (2p) d) Ta fram den betingade könsfördelningen för åldersgruppen 25-34 år. (2p) Ålder Kvinnor Män 18 24 115 000 132 000 25 34 123 000 213 000 35 49 122 000 238 000 50 64 236 000 213 000 65 74 154 000 92 000 75+ 326 000 112 000