STATISTISKA CENTRALBYRÅN 014-05-8 1(6) Kalibreringsrapport Elevpaneler - enätunersöning 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi inte lycas få svar från alla personer (bortfall) och om e avvier från e svarane me avseene på unersöningsvariablerna. Detta fel allas för bortfallsfel. För att unerlätta använningen av statistien är et värefullt om storleen på felen an uppsattas. Av nämna feltyper är et enast storleen på urvalsfelet som an sattas me hjälp av urvalsinformation. Kunsap om bortfallsfelet an i regel bara fås på ett iniret och approximativt sätt genom att utnyttja registervariabler. Båe urvalsfel och bortfallsfel an reuceras genom att använa ett effetivt uppräningsförfarane. I följane avsnitt reovisas hur et görs i enna unersöning. Parametrar De parametrar som sattas i enna unersöning är totaler och voter. 3 Hjälpinformation Viss hjälpinformation utnyttjas vanligtvis även före estimationen, t.ex. för bilane av stratifierae urvalsesigner. I enna unersöning rogs ett lusterurval. I första steget rogs ett stratifierat urval solor. Elever i utvala solor totalunersötes. På grun av bortfall i enätunersöningen så använs hjälpinformation på inivinivå i avseene att reucera e sevheter som etta bortfall an lea till. Det centrala arbetet för att få go valitet på sattningarna, å alibreringsestimatorn använs, är att använa star hjälpinformation. I följane avsnitt besrivs etta arbete för enna unersöning. 3.1 Tänbara hjälpvariabler Vi val av hjälpvariabler är et tre riterier som sa beatas (se Lunström och Särnal 001): (i) Det första riteriet är att variabeln samvarierar väl me svarsbenägenheten (-sannoliheten). Det är et vitigaste riteriet eftersom et leer till en minsning av bortfallssevheten för alla sattningar.
STATISTISKA CENTRALBYRÅN 014-05-8 (6) (ii) (iii) Det anra riteriet är att variabeln samvarierar väl me (vitiga) målvariabler. Om så är fallet minsar bortfallsbiasen för e sattningar som byggs upp av essa målvariabler. Även variansen minsar för essa sattningar. Det treje riteriet är att variabeln avgränsar (vitiga) reovisningsgrupper. Det leer framförallt till minsa varians i sattningar för essa reovisningsgrupper. I en här unersöningen innehåller enäten frågor av mycet siftane aratär. Därför är et främst punterna (i) och (iii) som an beatas, vilet innebär att alibreringen främst tjänar till att reucera en sevhet som bortfallet troligtvis ger upphov till. Tänbara hjälpvariabler, et vill säga variabler som tros uppfylla e ovan uppsatta riterierna, hämtaes ifrån Registret över totalbefolningen (RTB), Solregistret och Utbilningsregistret (UREG). En genomgång av variablerna resulterae i att sex variabler vales ut. De sammanslagningar av ategorier som gjorts baseras på unsaper från tiigare alibreringar. Hjälpvariablerna är efinierae enligt tabell 1. Tabell 1. Tänbara hjälpvariabler Variabel (benämning) Kategorier (oer) ELEVENS KÖN 1 = Poje = Flica ELEVENS 1 = Fö i Sverige FÖDELSELAND = Fö i övriga Värlen HÖGSTA UTBILDNING 1 = Grunsoleutbilning eller lägre FÖRÄLDRAR = Gymnasial utbilning 3 = Eftergymnasial utbilning REGION 1 1 = Storstasommuner = Övriga ommuner HUVUDMAN 1 = Kommunal sola MERITVÄRDE ÅRSKURS 8 = Friståene sola 1 = Uppgift sanas = 0 18.5 3 = 185.5 4 = 5 - Me högsta utbilning förälrar avses högsta avslutae utbilning till och me vårterminen 013. Utbilningen avser en föräler som har högst utbilning. Me region avses en region är eleven var folboför i ecember 013. Storstasommuner är Stocholm, Göteborg och Malmö ommun.
STATISTISKA CENTRALBYRÅN 014-05-8 3(6) I följane avsnitt analyserar vi variablerna i tabell 1 för att slutligen bestämma en hjälpvetor. 4 Analys av hjälpinformation 4.1 Kriterium 1: Variabeln samvarierar me svarsbenägenheten För att se huruvia hjälpvariablerna uppfyller et första riteriet, stueras sambanet mellan en iotoma variabeln svarane/bortfall och hjälpvariablerna. Det görs genom att beräna satta anel svarane i olia grupper, bestäma av respetive hjälpvariabel. Vi sattningen tar man hänsyn till att elever i olia strata hae olia stor sannolihet att ras till urvalet. Den totala svarsanelen har sattats till 48,0 procent. Vi stora sillnaer mellan svarsanelarna utgör variabeln en star aniat till hjälpvariabel. Tabell. Satta anel svarane förelat på elevens ön Kön Svarsanel (%) Poje 4,0 Flica 54, Tabell 3. Satta anel svarane förelat på elevens föelselan Föelselan Svarsanel (%) Sverige 48,1 Övriga Värlen 47,3 Tabell 4. Satta anel svarane förelat på region Region Svarsanel (%) Storstasommuner 46,6 Övriga ommuner 48,3 Tabell 5. Satta anel svarane förelat på högsta utbilning förälrar Utbilningsnivå Svarsanel (%) Grunsoleutbilning 35,8 Gymnasial utbilning 39,9 Eftergymnasial utbilning 55, Tabell 6. Satta anel svarane förelat på huvuman Huvuman Svarsanel (%) Kommunal 47,8 Friståene 50,7
STATISTISKA CENTRALBYRÅN 014-05-8 4(6) Tabell 7. Satta anel svarane förelat på meritväre Meritväre Svarsanel (%) Uppgift sanas 33,5 0 18.5 34,1 185.5 49,0 5-63,1 Tabellerna visar att variablerna ön, högsta utbilning förälrar och meritväre årsurs 8 an anses som stara (beträffane riterium 1). 4.3 Kriterium 3: Variabeln avgränsar (vitiga) reovisningsgrupper Om hjälpvariabeln avgränsar vitiga reovisningsgrupper an valiteten bli bättre i essa grupper. Framförallt blir sattningarna särare om hjälpvariabeln väl avgränsar reovisningsgruppen. Variabeln elevens ön avgränsar reovisningsgrupper och bör ärför vara me i hjälpvetorn om et är möjligt. 4.4 Slutligt val av hjälpvetor Efter en sammanvägning av analysen ring e tre riterierna samt efter ontroll av viternas förelning använs följane hjälpvetor: ELEVENS KÖN + HÖGSTA UTBILDNING FÖRÄLDRAR + MERITVÄRDE ÅRSKURS 8
STATISTISKA CENTRALBYRÅN 014-05-8 5(6) 5 Tenis besrivning av urval och estimation Vi har en population U beståene av N personer. De parametrar vi är intresserae av är främst funtioner av två totaler Y y och Z U z, är y är väret på variabel y för person och z väret på en annan variabel för samma person. Vi an efiniera y (och även z) som en iotom variabel,.v.s. 1 om person har stuerae egensap y (5.1) 0 för övrigt Det finns givetvis ocså intresse av parametrar för olia reovisningsgrupper. Låt oss benämna essa U,..., U,..., U, är U D U 1. Totalen för reovisningsgrupp an srivas Y U y (5.) 1 U D är y y 0 för U för övrigt. Z bilas på liartat sätt. En generell parameter för reovisningsgrupp ( an ocså avse hela Y populationen) an srivas C, är C är en onstant. Z Den vanligaste parametern är en procentuell anel, som erhålles när C 100 och z 1 för alla, och y är efiniera enligt (5.1). Om vi låter N vara antalet personer i reovisningsgrupp, å an parametern srivas P U 100 (5.3) N y Vi rar ett urval s av storleen n, men p.g.a. övertäcning och bortfall har vi enast svarsmängen r av storleen m att utföra beräningarna på. Den onventionella estimatorn (för Y ), har följane form: ˆ r w1 w y (5.4) Y är
STATISTISKA CENTRALBYRÅN 014-05-8 6(6) w 1 = w = totalt antal solor i respetive stratum/ antal utvala solor i respetive stratum totalt antal elever i respetive sola/ antal elever som svarat på enäten i respetive sola I estimator (5.4) använs ingen ytterligare hjälpinformation än stratifieringsinformationen. Denna estimationsmeto bruar allas ra uppräning inom strata. I syfte att erhålla en estimator me minre urvalsfel och bortfallssevhet än estimator (5.4) utnyttjar vi hjälpinformation ocså i estimationen. Vi bilar en hjälpvetor x, som anger till vila ategorier av ELEVENS KÖN + HÖGSTA UTBILDNING FÖRÄLDRAR + MERITVÄRDE ÅRSKURS 8 som elev tillhör. Från register framställer vi sean hjälptotalerna s x. Vi utnyttjar enna hjälpinformation i en alibreringsestimator. Kalibreringsestimatorn för totalen Y har följane utseene: ˆ (5.5) Yw r är v w1 w v y r w y 1 x w x w x x x ( ) s r r 1 (5.6) Y Vi sattning av en parameter av typen C sattas respetive total Z me hjälp av alibreringsviterna w w1 wv. Referenser: Lunström S. och Särnal C.-E. (001). Estimation in the Presence of Nonresponse an Frame Imperfection. Stocholm: Statistics Sween