Skrivning/skriftlig eksamen till statistikdelen av kursen i forskningsmetodik maj 2002 Skriv läsligt! Utrymmet/pladsen på pappret bör räcka att svara på. Om du fortsätter på något annat ställe, ange detta tydligt. Namn: 1. I en undersökning frågade man folk hur bra de trivdes i sitt bostadsområde enligt en 3-gradig skala från 1 = vantrivs förfärligt, 2 = varken trivs eller vantrivs och 3 = trivs alldeles utmärkt. Man undersökte också färgen på deras hus och kodade den som 1 = gul, 2 = röd och 3 = annat. Vilka typer av skalor har dessa två variabler? Bör man presentera medelvärdet för någon av dem? Medianen? (3p) 2. Figuren anger antalet barn per familj i ett stickprov om 100 slumpmässigt dragna familjer från alla familjer i den påhittade kommunen K. relativ frekvens (%) 50 40 30 20 10 0 45 Antal barn per familj 26 19 0 1 2 3 4 5 antal barn 6 (b) Beräkna medelvärdet av antalet barn per familj. 3 1 (a) Beräkna medianen och 25 %- och 75 %- kvartilerna för antalet barn per familj: (3p) (2p) (c) Standarddeviationen blir s = 1.14. Ange ungefärliga gränser för hur många barn 95 % av familjerna i kommunen K borde ha om antalet barn per familj vore normalfördelat. (2p) (d) Ange gränser som stämmer bättre med verkligheten. (2p)
(e) Ett 95 % konfidensintervall för medelantalet barn per familj i hela kommunen, beräknat som stickprovsmedelvärdet plus/minus två standard error, blir CI (0.76, 1.22). Motivera varför man kan få räkna så i det här fallet. (3p) (f) Tyder resultatet i uppgift 2e på att medelantalet barn per familj i kommunen K skiljer sig signifikant från riksgenomsnittet som är 1.5 barn per familj? (3p) 3. En undersökning av det linjära sambandet mellan systoliskt blodtryck (mmhg) och ålder (år) bland kvinnor i åldersintervallet 50 70 år gav som resultat medelblodtryck = 110 + 0.6 ålder. (a) Hur stor är medelskillnaden/forskelden i blodtryck mellan 60-åriga och 65-åriga kvinnor?(3p) (b) Hur högt blodtryck kan man förvänta sig hos en 65-årig kvinna? (3p) (c) Det visade sig också att åldern kunde förklara 7% av variationen i blodtryck. Motivera vilken av nedanstående figurer, A, B eller C, som kan beskriva situationen ovan och vilken korrelationskoefficient, i), ii) eller iii), som hör till? 180 A) Blodtryck 180 B) Blodtryck 180 C) Blodtryck 160 160 160 140 140 140 120 50 60 70 Ålder 120 50 60 70 Ålder 120 50 60 70 Ålder i) = 0.88 ii) = 0.93 iii) = 0.26 (3p) (d) Para ihop de två återstående bilderna med de två återstående korrelationskeofficienterna.(3p) Lycka till! (Summa 30p)
Lösningar till statistikdelen av kursen i forskningsmetodik maj 2002 1. Hur bra man trivs har en ordinalskala (det finns en ordning mellan svarsalternativen men inget avstånd). Husfärgen har en nominalskala (det finns ingen ordning, bara namn). Man bör inte presentera medelvärden för någon av dem. Det går bra att presentera medianen för hur bra man trivs, men inte för husfärgen. 2. (a) Medianen: det första värde för vilket den kumulativa frekvensen blir minst 50 %, dvs 1 barn. 25 %-kvartilen:... minst 25 %, dvs 0 barn. 75 %-kvartilen:... minst 75 %, dvs 2 barn. totalt antal barn 0 45 + 1 26 + 2 19 + 3 6 + 4 3 + 5 1 (b) Medelvärdet = = = antal familjer 100 = 99/100 = 0.99 barn. (I 45 familjer finns inga barn, i 26 familjer finns ett barn, i 19 familjer finns 3 barn, etc.) (c) Eftersom ungefär 95 % av värdena bör hamna inom plus/minus 2 standarddeviationer från medelvärdet blir gränserna 0.99 2 1.14 = 1.30 respektive 0.99 + 2 1.14 = 3.28. Antalet barn i en familj borde alltså ligga i intervallet ( 1.30, 3.28); det verkar inte rimligt med negativa barn. Data är inte normalfördelade. (d) Enligt stickprovet borde c:a 96 % av familjerna ha mellan 0 och 3 barn. (e) Eftersom stickprovet är stort (100 familjer) blir medelantalet barn i stickprovet ungefär normalfördelat, trots att antalet barn i en familj inte är det. (f) Ja, eftersom 1.5 inte ligger i intervallet kan vi förkasta nollhypotesen att medelantalet barn är lika med 1.5 på nivån 5 %. Vi tror alltså på mothypotesen medelantalet barn är inte 1.5. 3. (a) Eftersom blodtrycket i medeltal ökar med 0.6 mmhg per år bör 65-åriga kvinnor ha 5 0.6 = 3 mmhg högre blodtryck än 60-åriga. (b) 110 + 0.6 65 = 149 mmhg. (c) Eftersom förklaringsgraden är kvadraten på korrelationskoefficienten och vi har i) 2 = ( 0.88) 2 77.4 %, ii) 2 = 0.93 2 86.5 % och iii) 2 = 0.26 2 0.068 7 % är det rätta alternativet = 0.23. Det innebär att det finns ett svagt men positivt samband och figur A måste vara den rätta. (d) B och i) eftersom de visar negativa samband, C och ii) eftersom de visar starka positiva samband.