Bilaga 1(6) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi inte lycas få svar från alla personer (bortfall) och om e avvier från e svarane me avseene på unersöningsvariablerna. Detta fel allas för bortfallsfel. För att unerlätta använningen av statistien är et värefullt om storleen på felen an uppsattas. Av nämna feltyper är et enast storleen på urvalsfelet som an sattas me hjälp av urvalsinformation. Kunsap om bortfallsfelet an i regel bara fås på ett iniret och approximativt sätt genom att utnyttja registervariabler. Båe urvalsfel och bortfallsfel an reuceras genom att använa ett effetivt uppräningsförfarane. I följane avsnitt reovisas hur et görs i enna unersöning. Parametrar De parametrar som sattas i enna unersöning är totaler och voter. 3 Hjälpinformation Viss hjälpinformation utnyttjas vanligtvis även före estimationen, t.ex. för bilane av stratifierae urvalsesigner. I enna unersöning rogs ett lusterurval. I första steget rogs ett stratifierat urval solor. Elever i utvala solor totalunersötes. På grun av bortfall i enätunersöningen så använs hjälpinformation på inivinivå i avseene att reucera e sevheter som etta bortfall an lea till. Det centrala arbetet för att få go valitet på sattningarna, å alibreringsestimatorn använs, är att använa star hjälpinformation. I följane avsnitt besrivs etta arbete för enna unersöning. 3.1 Tänbara hjälpvariabler Vi val av hjälpvariabler är et tre riterier som sa beatas (se Lunström och Särnal 001): (i) Det första riteriet är att variabeln samvarierar väl me svarsbenägenheten (-sannoliheten). Det är et vitigaste riteriet eftersom et leer till en minsning av bortfallssevheten för alla sattningar.
Bilaga (6) (ii) (iii) Det anra riteriet är att variabeln samvarierar väl me (vitiga) målvariabler. Om så är fallet minsar bortfallsbiasen för e sattningar som byggs upp av essa målvariabler. Även variansen minsar för essa sattningar. Det treje riteriet är att variabeln avgränsar (vitiga) reovisningsgrupper. Det leer framförallt till minsa varians i sattningar för essa reovisningsgrupper. I en här unersöningen innehåller enäten frågor av mycet siftane aratär. Därför är et främst punterna (i) och (iii) som an beatas, vilet innebär att alibreringen främst tjänar till att reucera en sevhet som bortfallet troligtvis ger upphov till. Tänbara hjälpvariabler, et vill säga variabler som tros uppfylla e ovan uppsatta riterierna, hämtaes ifrån Registret över totalbefolningen (RTB), Solregistret och Utbilningsregistret (UREG). En genomgång av variablerna resulterae i att sju variabler vales ut. De sammanslagningar av ategorier som gjorts baseras på unsaper från tiigare alibreringar. Hjälpvariablerna är efinierae enligt tabell 1. Tabell 1. Tänbara hjälpvariabler Variabel (benämning) Kategorier (oer) ELEVENS KÖN 1 = Poje = Flica ELEVENS 1 = Fö i Sverige FÖDELSELAND HÖGSTA UTBILDNING FÖRÄLDRAR REGION 1 MODERNS FÖDELSELAND MODERNS ÅLDER HUVUDMAN = Fö i övriga Värlen 1 = Grunsoleutbilning eller lägre = Gymnasial utbilning 3 = Eftergymnasial utbilning 1 = Storstasommuner = Övriga ommuner 1 = Fö i Sverige = Fö i övriga Värlen 1 = 8-39 = 40-45 3 = 46-1 = Kommunal sola = Friståene sola Me högsta utbilning förälrar avses högsta avslutae utbilning till och me vårterminen 010. Utbilningen avser en föräler som har högst utbilning. Me region avses en region är eleven var folboför i februari 011. Storstasommuner är Stocholm, Göteborg och Malmö ommun.
Bilaga 3(6) I följane avsnitt analyserar vi variablerna i tabell 1 för att slutligen bestämma en hjälpvetor. 4 Analys av hjälpinformation 4.1 Kriterium 1: Variabeln samvarierar me svarsbenägenheten För att se huruvia hjälpvariablerna uppfyller et första riteriet, stueras sambanet mellan en iotoma variabeln svarane/bortfall och hjälpvariablerna. Det görs genom att beräna satta anel svarane i olia grupper, bestäma av respetive hjälpvariabel. Den totala svarsanelen har sattats till 87,4 procent. Vi stora sillnaer mellan svarsanelarna utgör variabeln en star aniat till hjälpvariabel. Tabell. Satta anel svarane förelat på elevens ön Kön Svarsanel (%) Poje 88,0 Flica 86,7 Tabell 3. Satta anel svarane förelat på elevens föelselan Föelselan Svarsanel (%) Sverige 87,4 Övriga Värlen 87, Tabell 4. Satta anel svarane förelat på region Region Svarsanel (%) Storstasommuner 83,6 Övriga ommuner 88,0 Tabell 5. Satta anel svarane förelat på högsta utbilning förälrar Utbilningsnivå Svarsanel (%) Grunsoleutbilning 84,9 Gymnasial utbilning 87,1 Eftergymnasial utbilning 87,8 Tabell 6. Satta anel svarane förelat på moerns föelselan Moerns föelselan Svarsanel (%) Sverige 87,6 Övriga Värlen 86,4
Bilaga 4(6) Tabell 7 Satta anel svarane förelat på moerns åler Moerns åler Svarsanel (%) 8-39 85,6 40-45 88,7 46-87,0 Tabell 8. Satta anel svarane förelat på huvuman Huvuman Svarsanel (%) Kommunal 87,9 Friståene 84,4 Tabellerna -8 visar att svarsanelarna är höga i samtliga grupper. Elevens egensaper verar inte påvera svarsfrevensen. Region har oc viss samvariation me svarsfrevensen. 4.3 Kriterium 3: Variabeln avgränsar (vitiga) reovisningsgrupper Om hjälpvariabeln avgränsar vitiga reovisningsgrupper an valiteten bli bättre i essa grupper. Framförallt blir sattningarna särare om hjälpvariabeln väl avgränsar reovisningsgruppen. Variabeln elevens ön avgränsar reovisningsgrupper och bör ärför vara me i hjälpvetorn om et är möjligt. 4.4 Slutligt val av hjälpvetor Efter en sammanvägning av analysen ring e tre riterierna samt efter ontroll av viternas förelning använs följane hjälpvetor: Region + Elevens ön
Bilaga 5(6) 5 Tenis besrivning av urval och estimation Vi har en population U beståene av N personer. De parametrar vi är intresserae av är främst funtioner av två totaler Y y och Z U z, är y är väret på variabel y för person och z väret på en annan variabel för samma person. Vi an efiniera y (och även z) som en iotom variabel,.v.s. 1 om person har stuerae egensap y (5.1) 0 för övrigt Det finns givetvis ocså intresse av parametrar för olia reovisningsgrupper. Låt oss benämna essa U1,..., U,..., UD, är D U. Totalen för reovisningsgrupp an srivas U 1 Y U y (5.) U är y y 0 för U för övrigt. Z bilas på liartat sätt. En generell parameter för reovisningsgrupp ( an ocså avse hela Y populationen) an srivas C, är C är en onstant. Z Den vanligaste parametern är en procentuell anel, som erhålles när C 100 och z 1 för alla, och y är efiniera enligt (5.1). Om vi låter N vara antalet personer i reovisningsgrupp, å an parametern srivas P U 100 (5.3) N y Vi rar ett urval s av storleen n, men p.g.a. övertäcning och bortfall har vi enast svarsmängen r av storleen m att utföra beräningarna på. Den onventionella estimatorn (för Y ), har följane form: ˆ r w1 w y (5.4) Y är
Bilaga 6(6) w 1 = w = totalt antal solor i respetive stratum/ antal utvala solor i respetive stratum totalt antal elever i respetive sola/ antal elever är förälrarna svarat på enäten i respetive sola I estimator (5.4) använs ingen ytterligare hjälpinformation än stratifieringsinformationen. Denna estimationsmeto bruar allas ra uppräning inom strata. I syfte att erhålla en estimator me minre urvalsfel och bortfallssevhet än estimator (5.4) utnyttjar vi hjälpinformation ocså i estimationen. Vi bilar en hjälpvetor x, som anger till vila ategorier av Region + Elevens ön som elev tillhör. Från register framställer vi sean hjälptotalerna s x. Vi utnyttjar enna hjälpinformation i en alibreringsestimator. Kalibreringsestimatorn för totalen Y har följane utseene: ˆ (5.5) Yw r är v w1 wv y r w y 1 x w x w x x x ( ) s r r 1 (5.6) Y Vi sattning av en parameter av typen C sattas respetive total Z me hjälp av alibreringsviterna w w1 wv. Referenser: Lunström S. och Särnal C.-E. (001). Estimation in the Presence of Nonresponse an Frame Imperfection. Stocholm: Statistics Sween