Föreläsig 3 732G04: Surveymetodik
Dages föreläsig Obudet slumpmässigt urval (OSU) Populatiosparametrar och stickprovsstatistikor Vätevärdesriktighet Ädliga och oädliga populatioer Medelvärde, adel Kofidesitervall Urvalsdimesioerig Redovisigsgrupper Ramproblem, replikat
Obudet slumpmässigt urval (OSU) (egelska Simple Radom Sample) Stickprovsdragig på ett sådat sätt att alla eheter i populatioe har samma saolikhet: att bli utvalda i stickprovet. Exempel: Vår populatio är alla studeter i ett klassrum, och vi vill udersöka geomsittsvikte i de väldigt stora klasse. Att väga alla skulle ta låg tid, och ma vill därför dra ett stickprov om 20 persoer. Det eklaste sättet att göra ett OSU skulle då vara att skriva ed allas am på lappar, lägga dem i e låda och dra 20 lappar ur låda. Då har slumpe valt ut 20 persoer åt oss och alla har lika stor chas att bli utvalda.
Fördelar och ackdelar med OSU som urvalsdesig Fördelar Ituitiv metod Formelmässigt ekel På sta-urval ackdelar Tar ej häsy till populatioes sammasättig, vilket gör att precisioe ka bli låg Praktisk tillämpig av OSU, som lämpar sig är vi vill göra ett slumpmässigt urval ur e populatio av mäiskor som rör sig i ett område. Stå på e plats där populatioe strömmar förbi, och tillfråga exempelvis var tiode som passerar. Stå på olika platser vid olika tidpukter för att täcka evetuella udergrupper i populatioe. 4
Relatio mella populatio och stickprov Populatiosparametrar: beskrivade mått för populatioe. Okäda, och de som vi öskar dra slutsatser om Stickprovsstatistikor: skattigar av populatiosparametrara baserat på stickprov Medelvärde Populatiosparameter μ = 1 i=1 x i Stickprovsstatistika (vätevärdesriktiga, ubiased) x = 1 i=1 x i Varias σ 2 = 1 i=1 = 1 x 2 i i=1 x i μ 2 i=1 2 x i s 2 = 1 x 1 i i=1 = 1 1 i=1 x i 2 x 2 i=1 2 x i Adel Varias adelar P = atalet gysamma utfall p = atalet gysamma utfall σ 2 = P (1 P) s 2 = p (1 p) 1 5
Vätevärdesriktighet Vi studerar u relatioe mella stickprovsstatistikor och populatiosparametrar geom att fokusera på relatioe mella stickprovsmedelvärde och populatiosmedelvärde. Låt X vara e slumpvariabel med vilke fördelig som helst. Ia stickprovet har dragits är de första observatioe vi ska göra, X 1, också e slumpvariabel, med vätevärde E(X 1 ) = μ och varias Var X 1 = σ 2 Samma sak gäller för X 2, X 3,, X : de har vart och ett vätevärde och varias E X 2 = E(X 3 ) = = E(X ) = μ Var X 2 = Var X 3 = = Var X = σ 2 Vi atar u att vi för variabel X har observerat värdea X 1, X 2,, X. 6
Vätevärdesriktighet Utyttja reglera för lijära variabeltrasformatioer (grudkurse). Exempel: E x = E 1 x i = E 1 x 1 + x 2 + + x = 1 E x 1 + x 2 + + x i=1 = 1 μ + μ + + μ = 1 μ = μ Iebörde i vätevärdesriktighet är att iga systematiska fel görs är stickprovsstatistika aväds för att uppskatta populatiosparameter. På motsvarade sätt ka det visas att E s 2 = σ 2 och E p = P Dock är ite stickprovsstadardavvikelse e vätevärdesriktig skattig av populatiosstadardavvikelse! Felet, som är e systematisk uderskattig, är dock litet och stickprovsstadardavvikelse aväds därför ädå som e skattig av populatiosstadardavvikelse. 7
Stickprovsmedelvärdets varias, medelfel Vilket fel gör vi i geomsitt är vi aväder e stickprovsstatistika som e uppskattig av populatiosparameter? Återige eligt reglera för lijära variabeltrasformatioer: Var x = Var 1 i=1 x i = Var 1 x 1 + x 2 + + x = 1 2 (Var x 1) + Var(x 2 ) + + Var(x ) = 1 2 σ2 + σ 2 + + σ 2 = 1 σ2 2 = σ2 Härledige visar att är stickprovsstorleke ökar så miskar stickprovsmedelvärdets varias fördelige för stickprovsmedelvärdet blir mer och mer kocetrerad krig. Medelfel för stickprovsmedelvärdet: σ x = σ Medelfelet är e uppskattig av de geomsittliga osäkerhete är vi aväder e stickprovsstatistika för att uppskatta populatiosparameter. 8
Ädliga och oädliga populatioer Iom statistike är det valigt att ma talar om ädliga respektive oädliga populatioer. E oädlig populatio föreklar räkearbetet, eftersom de eheter som väljs ut ur stickprovet då ka betraktas som oberoede. Ett valigt sätt att betrakta oädliga respektive ädliga populatioer är geom dragig med eller uta återläggig. Ett exempel på dragig med återläggig är tärigskast: saolikhete för sexa vid tärigskast förädras ite oavsett hur måga gåger vi kastar tärige. E valig tumregel är att populatioe ur statistiskt perspektiv ka betraktas som oädlig om stickprovet utgör midre ä 10% av populatiosstorleke. 9
Ädliga och oädliga populatioer Exempel: Vi har e skål med 5 kulor, vilke vi betraktar som e populatio. Ur populatioe vill vi dra ett stickprov om 3 kulor. Saolikhete för e specifik kula att bli utvald som de första är 1/5. u fis det bara fyra kulor kvar i skåle. Saolikhete för e specifik kula av de fyra som är kvar att bli utvald som de adra är 1/4. Saolikhete för e specifik kula av de tre resterade att bli de sista kula är 1/3. Ett valigt sätt att betrakta oädliga respektive ädliga populatioer är Vi ser att saolikhetera förädras mella varje dragig med statistiskt språkbruk säger vi att det råder ett beroede mella dragigara. Om skåle istället hade iehållit 10000 kulor och vi skulle välja 3 hade saolikhete för e specifik kula att bli utvald som de första varit 1/10000, som de adra 1/9999 och som de tredje 1/9998. De praktiska skillade i saolikhet mella varje dragig är så lite att de ka betraktas som försumbar, och vi ka betrakta dragigara som oberoede. 10
Vätevärdesriktiga puktskattigar vid ädliga populatioer Storhet Vätevärdesriktig skattig Populatiosmedelvärde μ = x Populatiosvarias 2 σ 2 = 1 s2 Populatiosadel P P = p Populatiosvarias adelar 2 σ 2 = 1 p(1 p) 1 otera beteckige ^ ( hatt, cirkoflex) för skattige. 11
Egeskaper hos stickprovsstatistikora Lägesmått Spridig Medelfel Stickprovsmedelvärde E x = μ Var x = s2 1 s 2 1 Stickprovsadel E p = P Var p = p(1 p) 1 1 p(1 p) 1 1 där 1 kallas ädlighetskorrektio 12
Dubbelsidiga kofidesitervall vid OSU Populatiosparameter Formel för kofidesitervall Populatiosmedelvärde x ± z α 2 s 2 1 Populatiostotal x ± z α 2 2 s2 1 Populatiosadel P p ± z α 2 p(1 p) 1 1 13
Exempel Vi betraktar e populatio om 1000 företag och är itresserade av hur stora ivesterigar som gjorts det seaste året. Tid och ekoomi fas för ett OSU om 50 företag. Följade iformatio (uttryckt i tusetals kroor) samlades i. x 107.61 s 179.61 50 1000 Beräka ett 95% kofidesitervall för geomsittsivesterigara i populatioe Beräka också ett 95% kofidesitervall för de totala ivesterigara i populatioe. 14
Exempel Ska e y väg dras geom samhället? Samhället består av 840 ivåare, varav 126 slumpmässigt valts ut och tillfrågats. 21 av dessa ställde sig positiva till förslaget. Beräka ett 95% kofidesitervall för adele ivåare i samhället som är positiva till e y väg. 15
Ekelsidiga kofidesitervall För populatiosmedelvärde: Uppåt begräsat: μ < x + z α s 2 1 edåt begräsat: μ > För populatiosadel: x z α s 2 1 Uppåt begräsat: P < p + z α p(1 p) 1 1 edåt begräsat: P > p z α p(1 p) 1 1 Exempel: Vid e aoym ekät om 100 slumpmässigt utvalda förvärvsarbetade i e kommu uppgav 16% av respodetera att de sjukamält sig fast de var friska för att slippa gå till jobbet. Beräka ett 95% kofidesitervall som ger e edre gräs för adele falskt sjukamälda i kommue. 16
Urvalsdimesioerig Om vi accepterar kofidesitervallbredde B, välj stickprovsstorlek eligt För medelvärde: För adelar: 0 0 4 z α 2 B 2 4 z α 2 2 σ 2 2 P(1 P) B 2 Om 0 > 5% justeras formlera geom att vi i ett adra steg bestämmer 0 1 0 1 Exempel: Iför e folkomröstig vill ma med ett OSU skatta adele persoer som är positiva till ett visst förslag. Skattige ska ges i form av ett itervall med kofidesgrade 95%, och ma accepterar att kofidesitervallets bredd är ugefär 4 proceteheter. Hur stort stickprov ska ma dra om populatioe består av 10 000 idivider? 17
Redovisigsgrupper Om redovisigsgrupperas storlek är käda Iblad är vi ite itresserade av att dra slutsatser om hela populatioe, uta istället om delpopulatioer i de. Detta kallas för att vi studerar redovisigsgrupper. Vi skiljer på situatioera att redovisigsgrupperas storlekar ( 1, 2, ) är käda eller okäda. Om redovisigsgrupperas storlek är käda: Medelvärde x 1 ± z α 2 s 1 2 1 1 1 1 Adelar p 1 ± z α 2 p 1 (1 p 1 ) 1 1 1 1 1 18
Redovisigsgrupper Om redovisigsgrupperas storlekar är okäda Redovisigsgruppes storlek skattas eligt: varpå itervalle beräkas eligt: Medelvärde 1 = 1 x 1 ± z α 2 s 1 2 1 1 1 1 x 1 ± z α 2 s 1 2 1 1 Adelar p 1 ± z α 2 p 1 (1 p 1 ) 1 1 1 19
Exempel Ma har dragit ett OSU om 2400 vuxa mä och studerat deras utgifter för hälsovård det seaste året. I ett urval om 223 mä är medelutgifte 527 kroor och stadardavvikelse 170 kroor. Atalet rökare i urvalet är 59 stycke och blad dessa är medelutgifte 618 kroor med e stadardavvikelse om 186 kroor. Beräka ett 99% kofidesitervall för de geomsittliga utgiftera för hälsovård för samtliga rökare blad de 2400 mäe. Ma udersökte äve förekomste av hjärtifarkter. Blad rökara i urvalet visade det sig att 22 av de 59 hade haft mist e hjärtifarkt. Beräka ett 99% kofidesitervall för adele rökare som haft hjärtifarkt. 20
Ramproblem Övertäckig: är det fis eheter i urvalsrame som egetlige ite tillhör målpopulatioe Exempel: Vid studie av vikter blad studeter i ett klassrum aväds klasslista som urvalsram. Me vissa studeter har hoppat av utbildige seda klasslista trycktes de tillhör ite lägre målpopulatioe uta utgör övertäckig. Udertäckig: är det fis eheter i målpopulatioe som sakas i urvalsrame Exempel: Vissa studeter har påbörjat si utbildig seda klasslista trycktes. De tillhör därför målpopulatioe me har ige chas att bli utvalda och utgör därför udertäckig. 21
Ramproblem Replikat beteckar problemet att samma ehet igår flera gåger i rampopulatioe. Detta iebär att saolikhete för att de replikerade ehete ska bli utvald är större ä för övriga eheter. Exempel: På e skola med 350 elever för ma e udersökig i syfte att ta reda på hur måga av skoleleveras familjer som är itresserade av att starta e föräldraföreig. Ett urval om 10 elever gav följade iformatio: Utvald elev Atal sysko på skola Familje itresserad 1 1 ej 2 2 Ja 3 0 Ja 4 1 ej 5 1 Ja 6 0 Ja 7 1 ej 8 2 ej 9 0 ej 10 1 Ja 22
Replikat (forts) Låt M i = atalet elemet i rampopulatioe som elemet i represeteras av = rampopulatioes storlek τ = 1 i=1 M i x i s 2 u = 1 1 i=1 M i x i 2 1 i=1 M i x i 2 τ ± z α 2 s u 2 23