Föreläsig 5 732G04 Surveymetodik 732G19 Utredigskuskap I
Dages föreläsig Klusterurval Estegs klusterurval Tvåstegs klusterurval Klusterurval med PPS 2
Klusterurval De urvalsdesiger som diskuterats hittills baseras på att vi slumpar ut eskilda elemet (exempelvis persoer) ur populatioe och drar slutsatser om dessa. Iblad vill vi dock av tids- eller kostadsskäl geeralisera urvalsförfaradet till att omfatta grupper av elemet. Estegs klusterurval: vi delar i populatioe i grupper kluster som vi seda slumpmässigt väljer ut ågra av. Seda udersöker vi alla eheter i de utvalda klustre (dessa kallas primära eheter). Exempel: Vi är itresserade av iodeklassares situatio i skola. Vi väljer slumpmässigt ut ett atal kommuer i ladet, och udersöker iodeklassara i dessa kommuer. Tvåstegs klusterurval: vi delar först i populatioe i kluster som vi slumpmässigt väljer ut ågra av (primära eheter). Seda gör vi slumpmässiga urval iom respektive kluster och udersöker dessa utvalda elemet (sekudära eheter). Exempel: Det ises att det fis måga iodeklasser i varje kommu. Därför drar ma i ett adra steg ett OSU om iodeklasser i varje utvald kommu och udersöker elevera i dessa klasser. 3
Defiitioer N: atal kluster i populatioe M 0 : atal elemet i populatioe M i : atal elemet i kluster i : stickprovsstorlek (atal utvalda kluster) x ij : mätvärde för elemet j frå kluster i 4
Estegs klusterurval OSU av kluster: lämpar sig om klustre är ugefär av samma storleksordig Vätevärdesriktig skattig Kvotskattig: ej vätevärdesriktig skattig, me kräver midre iformatio om populatioe PPS-urval (Probabilities Proportioal to Size) av kluster: om klustre är olika stora Exempel: Atag att klustre är Sveriges kommuer. Ett OSU av kluster skulle då kua leda till att vi övervägade får små kommuer i urvalet, och e lite total stickprovsstorlek. 5
Estegs klusterurval med OSU För varje utvalt kluster beräkas klustermedelvärde x i = 1 M i M i x ij j=1 och klustertotal T i = M i x i = M i x ij j=1 Eftersom kluster utgör de primära ehetera blir klustertotale det vi ormalt betraktar som mätvärde! 6
Estegs klusterurval med OSU E vätevärdesriktig skattig av populatiosmedelvärdet μ u ges av: μ u = N M 0 μ T = N μ T där μ M T = 1 0 T i Variase beräkas som: Var μ u = N M 0 2 s T 2 1 N där s 2 T = 1 1 T 2 i T 2 Itervall ka beräkas eligt: μ u ± z α 2 N M 0 2 s T 2 1 N 7
Estegs klusterurval med OSU För 0/1-data (adelar) görs skattige på precis samma sätt (ma räkar alltså ite som P(1-P) här) För populatiostotale bestäms kofidesitervallet eligt: M 0 μ u ± M 0 z α 2 N M 0 2 s T 2 1 N 8
Exempel I e kommu vill ma udersöka skolbars idrottsaktiviteter. Det fis 19 skolor med totalt 2210 skolbar i kommue. Ma gör ett OSU om 5 skolor, och vill beräka det geomsittliga atalet timmar i vecka som bare idrottar. Följade tabell iehållade utvald skola, atal bar i skola och det totala atalet veckotimmar bare idrottar tas fram. Skola Atal bar Totalt atal veckotimmar 1 165 231 2 258 327 3 88 144 4 136 186 5 177 211 Bestäm ett 95% kofidesitervall för det geomsittliga atalet timmar i vecka som skolbare idrottar. 9
Estegs klusterurval med OSU, kvotskattig Räkemetodik som lämpar sig är vi gjort ett estegs klusterurval baserat på OSU är klustre är olika stora. Populatiosmedelvärdet puktskattas eligt μ R = T i M i och ett kofidesitervall för populatiosmedelvärdet bildas geom μ R ± z α 2 1 N 1 1 1 M 2 T 2 i + μ 2 R M 2 i 2 μ R T i M i 10
Exempel Ett fackförbud ikommer med klagomål till e matkedja om att persoale arbetar för mycket. Blad matkedjas 50 butiker väljer ma slumpmässigt ut 5 butiker och tillfrågar varje aställd hur måga timmar i vecka de i geomsitt arbetar. Följade resultat erhålles. Butik Atal aställda Total arbetstid/vecka 1 10 423 2 12 501 3 5 168 4 17 692 5 8 325 Beräka ett 95% kofidesitervall för de geomsittliga arbetstide. 11
Estegs klusterurval med OSU, kvotskattig Skattigara blir desamma vid adelar. För puktskattig och kofidesitervall för total multipliceras puktskattig respektive felmargial med M 0 (om dea är käd!). 12
Estegs klusterurval med PPS-urval (Probabilities Proportioal to Size) Metodik som lämpar sig om klusterstorlekara är väldigt olika stora och vi vill göra ett gaska litet urval. N: atal kluster i populatioe M 0 : atal elemet i populatioe : stickprovsstorlek (atal utvalda kluster) M i : atal elemet i kluster i Urvalet görs med återläggig och urvalssaolikhetera är proportioella mot klusterstorlek, varje kluster dras med saolikhete: M i M 0 13
Estegs klusterurval med PPS-urval Klustermedelvärde x i = 1 M i M i x ij j=1 Vätevärdesriktig puktskattig av populatiosmedelvärdet μ PPS = x PPS = 1 x i Vätevärdesriktig puktskattig av populatiosadele P P PPS = p PPS = 1 p i 14
Estegs klusterurval med PPS-urval Kofidesitervall för x PPS ± z α 2 1 x i 2 x PPS 2 1 Kofidesitervall för P p PPS ± z α 2 1 1 p i 2 p PPS 2 15
Exempel Iom e kocer vill ma udersöka hur måga semesterdagar per aställd som i geomsitt tas ut uder augusti måad. Ma väljer ut 5 avdeligar med återläggig och med saolikheter proportioella mot avdeligaras storlek blad koceres företag. Vid varje avdelig oteras det totala atalet uttaga semesterdagar uder augusti måad det seaste året. Avdelig Atal aställda Totalt atal semesterdagar 1 38 79 2 115 240 3 55 91 4 58 113 5 42 66 Beräka ett 95% kofidesitervall för det geomsittliga atalet semesterdagar de aställda tar ut uder augusti måad. 16
Urvalsdimesioerig vid estegs klusterurval Urvalsdimesioerig vid klusterurval baserat på OSU är svårt, eftersom klusterstorlekara ofta varierar och förhadsuppskattig av populatiosvariase är svår då de är mer komplex ä valigt. För PPS-urval är dock formlera ekla: Om vi accepterar bredde B i ett kofidesitervall med sigifikasivå väljs 4 z α 2 där 2 σ x i B 2 2 σ 2 x i är variase för klustermedelvärdea i populatioe. 17
Tvåstegs klusterurval med OSU Iblad ka det vara praktiskt väldigt krågligt och tidsödade att udersöka samtliga elemet i varje kluster. Då ka ma istället välja ut ett visst atal elemet i de olika klustre till udersökige. N: atal kluster i populatioe M 0 : atal elemet i populatioe M i : atal elemet i kluster i : atal utvalda kluster m i : atal utvalda elemet i kluster i x ij : mätvärde för elemet (idivid) j i kluster i 18
Tvåstegs klusterurval med OSU Vi beräkar medelvärdet i urvalet frå varje kluster x i = 1 m i m i x ij Vätevärdesriktiga skattigar av respektive P ges då av μ u2 = N 1 M 0 M i x i P u2 = N M 0 1 M i p i (otera idexet 2 för tvåstegs klusterurval) 19
Exempel I e kommu udersöks grudskollärara (totalt fis det 722 grudskollärare i hela kommue) med avseede på deras utbildig. Frå kommues totalt 19 grudskolor görs ett OSU om 5 skolor och på varje skola görs ett OSU om 50% av lärara. För varje lärare ihämtas iformatio om det totala atalet fortbildigstimmar det seaste året. Skola Atal utvalda lärare Medelatal timmar Stadardavvikelse 1 15 28 5 2 23 31 7 3 19 23 4 4 24 37 6 5 16 28 6 20
Tvåstegs klusterurval med OSU, kvotskattig Puktskattig av populatiosmedelvärdet μ R2 = M i M i x i Puktskattig av populatiosadele P R2 = M i p i M i För totaler multipliceras puktskattige av populatiosmedelvärdet med M 0 21
Tvåstegs klusterurval med PPS-urval Populatiosmedelvärdet skattas eligt μ PPS2 = 1 x i och ett kofidesitervall bildas eligt μ PPS2 ± z α 2 1 x i 2 x PPS 2 ( 1) 22
Tack för idag! Nästa tillfälle: Föreläsig 6, torsdag 15 maj 10-12, T2 23