Bilaga 1(6) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi inte lycas få svar från alla personer (bortfall) och om e avvier från e svarane me avseene på unersöningsvariablerna. Detta fel allas för bortfallsfel. För att unerlätta använningen av statistien är et värefullt om storleen på felen an uppsattas. Av nämna feltyper är et enast storleen på urvalsfelet som an sattas me hjälp av urvalsinformation. Kunsap om bortfallsfelet an i regel bara fås på ett iniret och approximativt sätt genom att utnyttja registervariabler. Båe urvalsfel och bortfallsfel an reuceras genom att använa ett effetivt uppräningsförfarane. I följane avsnitt reovisas hur et görs i enna unersöning. 2 Parametrar De parametrar som sattas i enna unersöning är totaler och voter. 3 Hjälpinformation Viss hjälpinformation utnyttjas vanligtvis även före estimationen, t.ex. för bilane av stratifierae urvalsesigner. I enna unersöning rogs ett tvåstegs lusterurval. I första steget rogs ett stratifierat urval av ommuner och i anra steget ett urval av retorsområen. Elever i utvala retorsområen totalunersötes. På grun av bortfall av elever i enätunersöningen så använs hjälpinformation på elevnivå i avseene att reucera e sevheter som etta bortfall an lea till. Det centrala arbetet för att få go valitet på sattningarna, å alibreringsestimatorn använs, är att använa star hjälpinformation. I följane avsnitt besrivs etta arbete för enna unersöning. 3.1 Tänbara hjälpvariabler Vi val av hjälpvariabler är et tre riterier som sa beatas (se Lunström och Särnal 2001): (i) Det första riteriet är att variabeln samvarierar väl me svarsbenägenheten (-sannoliheten). Det är et vitigaste riteriet eftersom et leer till en minsning av bortfallssevheten för alla sattningar.
Bilaga 2(6) (ii) (iii) Det anra riteriet är att variabeln samvarierar väl me (vitiga) målvariabler. Om så är fallet minsar bortfallsbiasen för e sattningar som byggs upp av essa målvariabler. Även variansen minsar för essa sattningar. Det treje riteriet är att variabeln avgränsar (vitiga) reovisningsgrupper. Det leer framförallt till minsa varians i sattningar för essa reovisningsgrupper. I en här unersöningen innehåller enäten frågor av mycet siftane aratär. Därför är et främst punterna (i) och (iii) som an beatas, vilet innebär att alibreringen främst tjänar till att reucera en sevhet som bortfallet troligtvis ger upphov till. Tänbara hjälpvariabler, et vill säga variabler som tros uppfylla e ovan uppsatta riterierna, hämtaes ifrån Registret över totalbefolningen (RTB) Utbilningsregistret (UREG) och Elevpanelernas årsurs 8 insamling. En genomgång av variablerna resulterae i att fem variabler vales ut. De sammanslagningar av ategorier som gjorts baseras på unsaper från tiigare alibreringar. Hjälpvariablerna är efinierae enligt tabell 1. Tabell 1. Tänbara hjälpvariabler Variabel (benämning) Kategorier (oer) KÖN 1 = Man 2 = Kvinna FÖDELSELAND 1 = Fö i Sverige HÖGSTA UTBILDNING FÖRÄLDRAR REGION 1 MERITVÄRDE ÅRSKURS 8 2 = Fö i övriga Värlen 1 = Grunsoleutbilning eller lägre 2 = Gymnasial utbilning 3 = Eftergymnasial utbilning 1 = Storstäer 2 = Förortsommuner 3 = Större stäer 4 = Övriga ommuner 1 = Uppgift sanas 2 = < 160 3 = 165-190 4 = > 190 Me högsta utbilning förälrar avses högsta avslutae utbilning till och me 2007. Utbilningen avser en föräler som har högst utbilning. Me region avses en region är inivien var folboför i februari 2008. I följane avsnitt analyserar vi variablerna i tabell 1 för att slutligen bestämma en hjälpvetor. 1 För efinition av regioner, se http://www.sl.se/artiel.asp?a=11248&c=445
Bilaga 3(6) 4 Analys av hjälpinformation 4.1 Kriterium 1: Variabeln samvarierar me svarsbenägenheten För att se huruvia hjälpvariablerna uppfyller et första riteriet, stueras sambanet mellan en iotoma variabeln svarane/bortfall och hjälpvariablerna. Det görs genom att beräna satta anel svarane i olia grupper, bestäma av respetive hjälpvariabel. Den totala svarsanelen har sattats till 61 procent. Vi stora sillnaer mellan svarsanelarna utgör variabeln en star aniat till hjälpvariabel. Tabell 2. Anel svarane förelat på ön Kön Svarsanel (%) Kvinnor 65,7 Män 56,3 Tabell 3. Anel svarane förelat på föelselan Föelselan Svarsanel (%) Sverige 60,9 Övriga Värlen 59,7 Tabell 4. Anel svarane förelat på region Region Svarsanel (%) Storstäer 55,4 Förortsommuner 61,9 Större stäer 63,1 Övriga ommuner 61,0 Tabell 5. Anel svarane förelat på högsta utbilning förälrar Utbilningsnivå Svarsanel (%) Grunsoleutbilning 47,6 Gymnasial utbilning 55,4 Eftergymnasial utbilning 67,8 Tabell 6. Anel svarane förelat på meritväre årsurs 8 Meritväre årsurs 8 Svarsanel (%) Uppgift sanas 56,2 <160 54,6 165-190 59,8 >190 71,8
Bilaga 4(6) Tabellerna 2-6 visar att variablerna ön, högsta utbilning förälrar och meritväre årsurs 8 an anses som stara (beträffane riterium 1). Även för variabeln region finns en tenens att elever i storstasområen svarar i lägre gra än elever i övriga regioner. 4.3 Kriterium 3: Variabeln avgränsar (vitiga) reovisningsgrupper Om hjälpvariabeln avgränsar vitiga reovisningsgrupper an valiteten bli bättre i essa grupper. Framförallt blir sattningarna särare om hjälpvariabeln väl avgränsar reovisningsgruppen. Variabeln ön avgränsar reovisningsgrupper och bör ärför vara me i hjälpvetorn om et är möjligt. 4.4 Slutligt val av hjälpvetor I en slutliga hjälpvetorn använes alla fem hjälpvariabler. Föelselan var inte en star variabel enligt riterium 1. Att variabeln föelselan änå inluerats i hjälpvetorn motiveras me att föelselan an vara en reovisningsgrupp av intresse. Efter en sammanvägning av analysen ring e tre riterierna samt efter ontroll av viternas förelning använs följane hjälpvetor: Kön+ Föelselan + Region + Högsta utbilning förälrar + Meritväre årsurs 8 5 Tenis besrivning av urval och estimation Vi har en population U beståene av N personer. De parametrar vi är intresserae av är främst funtioner av två totaler Y y och U z, är y är väret på variabel y för person och z väret på en annan variabel för samma person. Vi an efiniera y (och även z) som en iotom variabel,.v.s. 1 om person har stuerae egensap y (5.1) 0 för övrigt Det finns givetvis ocså intresse av parametrar för olia reovisningsgrupper. Låt oss benämna essa U1,..., U,..., UD, är D U. Totalen för reovisningsgrupp an srivas U 1 Y U y (5.2) U är y y 0 för U för övrigt.
Bilaga 5(6) bilas på liartat sätt. En generell parameter för reovisningsgrupp ( an ocså avse hela Y populationen) an srivas C, är C är en onstant. Den vanligaste parametern är en procentuell anel, som erhålles när C 100 och z 1 för alla, och y är efiniera enligt (5.1). Om vi låter N vara antalet personer i reovisningsgrupp, å an parametern srivas P U 100 (5.3) N y Vi rar ett tvåstegs lusterurval s av storleen n, men p.g.a. övertäcning och bortfall har vi enast svarsmängen r av storleen m att utföra beräningarna på. Den onventionella estimatorn (för Y ), har följane form: ˆ r w w w y (5.4) Y 1 2 3 är w 1 = w 2 = w 3 = totalt antal ommuner i respetive stratum/ antal utvala ommuner i respetive stratum totalt antal RO-områen i utval ommun/ antal utvala RO-områen i utval ommun totalt antal elever i respetive RO-områe/ antal elever som svarat på enäten i respetive RO-områe I estimator (5.4) använs ingen ytterligare hjälpinformation än stratifieringsinformationen. Denna estimationsmeto bruar allas ra uppräning inom strata. I syfte att erhålla en estimator me minre urvalsfel och bortfallssevhet än estimator (5.4) utnyttjar vi hjälpinformation ocså i estimationen. Vi bilar en hjälpvetor x, som anger till vila ategorier av Kön+ Föelselan + Region + Högsta utbilning förälrar + Meritväre årsurs 8
Bilaga 6(6) som elev tillhör. Från Utbilningsregistret och Registret över totalbefolningen framställer vi sean hjälptotalerna s x. Vi utnyttjar enna hjälpinformation i en alibreringsestimator. Kalibreringsestimatorn för totalen Y har följane utseene: ˆ y w y (5.5) Yw w w v r 1 2 3 är v r 1 x w x w x x x 3 3 3 ( ) s r r 1 (5.6) Y Vi sattning av en parameter av typen C sattas respetive total me hjälp av alibreringsviterna w w1 w2v3. Referenser: Lunström S. och Särnal C.-E. (2001). Estimation in the Presence of Nonresponse an Frame Imperfection. Stocholm: Statistics Sween