STATISTISKA CENTRALBYRÅN 2013-04-12 1(7) Kalibreringsrapport 1 Inlening I en urvalsunersöning är allti sattningarna behäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppommer om vi inte lycas få svar från alla personer (bortfall) och om e avvier från e svarane me avseene på unersöningsvariablerna. Detta fel allas för bortfallsfel. För att unerlätta använningen av statistien är et värefullt om storleen på felen an uppsattas. Av nämna feltyper är et enast storleen på urvalsfelet som an sattas me hjälp av urvalsinformation. Kunsap om bortfallsfelet an i regel bara fås på ett iniret och approximativt sätt genom att utnyttja registervariabler. Båe urvalsfel och bortfallsfel an reuceras genom att använa ett effetivt uppräningsförfarane. I följane avsnitt reovisas hur et görs i enna unersöning. 2 Hjälpinformation Viss hjälpinformation utnyttjas vanligtvis även före estimationen, t.ex. för bilane av stratifierae urvalsesigner. Det an oc finnas ytterligare hjälpinformation som är effetiv i estimationen. Det centrala arbetet för att få go valitet på sattningarna, å alibreringsestimatorn använs, är att använa star hjälpinformation. I följane avsnitt besrivs etta arbete för enna unersöning. 2.1 Tänbara hjälpvariabler Vi val av hjälpvariabler är et tre riterier som sa beatas (se Lunström och Särnal 2001): Det första riteriet är att variabeln samvarierar väl me svarsbenägenheten (-sannoliheten). Det är et vitigaste riteriet eftersom et leer till en minsning av bortfallssevheten för alla sattningar. Det anra riteriet är att variabeln samvarierar väl me (vitiga) målvariabler. Om så är fallet minsar bortfallssevheten för e sattningar som byggs upp av essa målvariabler. Även variansen minsar för essa sattningar.
STATISTISKA CENTRALBYRÅN 2013-04-12 2(7) Det treje riteriet är att variabeln avgränsar (vitiga) reovisningsgrupper. Det leer framförallt till minsa varians i sattningar för essa reovisningsgrupper. I en unersöning me ett stort antal frågor av siftane aratär är et främst riterierna (i) och (iii) som an beatas. Eftersom et i enna unersöning rör sig om två olia typer av populationer man vill satta iverse storheter i, har två olia uppsättningar av hjälpvariabler utnyttjats: en för barnpopulationerna och en för förälrapopulationerna. Tänbara hjälpvariabler, et vill säga variabler som tros uppfylla ovanståene riterier, hämtaes ifrån RTB (Registret över totalbefolningen) och Utbilningsregistret. Hjälpvariablerna är efinierae enligt tabell 1 (barnpopulationerna) och tabell 2 (förälrapopulationerna). Tabell 1. Tänbara hjälpvariabler, barnpopulationerna Variabel (benämning) Kategorier (oer) ANT (=antal vårnashavare) 1 = ingen vårnashavare 2 = en vårnashavare 3 = två vårnashavare FOD (=vårnashavarnas 1 = ingen v.h. fö utanför Sverige föelseläner) UTB (=högsta utbilningsnivå blan vårnashavarna) 2 = minst en v.h. fö utanför Sverige 1 = Förgymnasial (inl. oän/sanas) 2 = Gymnasial 3 = Eftergymnasial INK (=hushållets årsinomst, r) 1 = 0-399 999 2 = 400 000-599 999 3 = 600 000- REG (=barnets bostasregion) 1 = Stocholm, Göteborg, Malmö 2 = Övriga ommuner >= 50 000 invånare 3 = Övriga ommuner < 50 000 invånare
STATISTISKA CENTRALBYRÅN 2013-04-12 3(7) Tabell 2. Tänbara hjälpvariabler, förälrapopulationerna Variabel (benämning) Kategorier (oer) KON (=förälerns ön) 1 = man 2 = vinna CIV (=förälerns civilstån) 1 = Gift/registrerat partnersap 2 = Övriga FOD (=förälerns föelselan) 1 = Sverige UTB (=förälerns utbilningsnivå) 2 = Övriga värlen 1 = Förgymnasial (inl. oän/sanas) 2 = Gymnasial 3 = Eftergymnasial INK (=förälerns årsinomst, r) 1 = 0-199 999 2 = 200 000-299 999 3 = 300 000- REG (=förälerns bostasregion) 1 = Stocholm, Göteborg, Malmö 2 = Övriga ommuner >= 50 000 invånare 3 = Övriga ommuner < 50 000 invånare I följane avsnitt analyserar vi variablerna i tabell 1-2 för att slutligen bestämma hjälpvetorer. 3 Analys av hjälpinformation 3.1.1 Kriterium 1: Variabeln samvarierar me svarsbenägenheten För att se huruvia hjälpvariablerna uppfyller et första riteriet, stueras sambanet mellan en iotoma variabeln svarane/bortfall och hjälpvariablerna. Det görs genom att beräna anel svarane i olia grupper, bestäma av respetive hjälpvariabel. Vi stora sillnaer mellan svarsanelarna utgör variabeln en star aniat till hjälpvariabel. Först analyseras hjälpvariablerna för barnpopulationerna. Tabell 3-7 visar som exempel svarsanelar inom gruppen barn 9-12 år. Tabell 3 Anel svarane barn förelat på antal vårnashavare Svarsanel (%) 28,4 43,2 Tabell 4 Anel svarane barn förelat på vårnashavarnas föelseläner Svarsanel (%) 44,6 36,0
STATISTISKA CENTRALBYRÅN 2013-04-12 4(7) Tabell 5 Anel svarane barn förelat på högsta utbilningsnivå Svarsanel (%) 33,8 38,5 49,8 Tabell 6 Anel svarane barn förelat på hushållsinomst Svarsanel (%) 27,5 45,3 49,4 Tabell 7 Anel svarane barn förelat på bostasregion Svarsanel (%) 39,8 46,3 41,3 Tabellerna 3-7 visar att samtliga hjälpvariabler, möjligen me unantag för region, är stara beträffane riterium 1. Exempelvis är svarsbenägenheten betyligt högre hos barn me två vårnashavare (43,2 %) än hos barn me en vårnashavare (28,4 %). Nean analyseras hjälpvariablerna för förälrapopulationerna. Tabell 8-13 visar som exempel svarsanelar inom gruppen förälrar till barn 5-8 år. Tabell 8 Anel svarane förälrar förelat på ön Svarsanel (%) 44,6 43,7 Tabell 9 Anel svarane förälrar förelat på civilstån Svarsanel (%) 46,0 40,9 Tabell 10 Anel svarane förälrar förelat på föelselan Svarsanel (%) 46,9 34,2 Tabell 11 Anel svarane förälrar förelat på utbilningsnivå Svarsanel (%) 31,9 43,8 54,9 Tabell 12 Anel svarane förälrar förelat på inomst Svarsanel (%) 33,5 42,0 52,2
STATISTISKA CENTRALBYRÅN 2013-04-12 5(7) Tabell 13 Anel svarane förälrar förelat på bostasregion Svarsanel (%) 45,3 46,1 41,1 Tabellerna 8-13 visar att hjälpvariablerna, me unantag för ön och möjligen ocså region, är stara beträffane riterium 1. Exempelvis är svarsbenägenheten betyligt högre hos förälrar me eftergymnasial utbilningsnivå (54,9 %) än hos förälrar me förgymnasial utbilningsnivå (31,9 %). 3.1.2 Kriterium 3: Variabeln avgränsar (vitiga) reovisningsgrupper Om hjälpvariabeln avgränsar vitiga reovisningsgrupper an valiteten bli bättre i essa grupper me avseene på sattningarnas urvalsfel. Hjälpvariabeln förälerns ön avgränsar vitiga reovisningsgrupper i föreliggane unersöning. 3.2 Slutligt val av hjälpvetor Efter en sammanvägning av analysen ring ovanståene riterier samt efter ontroll av viternas förelning använs följane hjälpvetor för respetive barnpopulation: ANT + FOD + UTB + INK För respetive förälrapopulation använs följane hjälpvetor: KON + CIV + FOD + UTB + INK 4 Tenis besrivning av urval och estimation Vi har en population U beståene av N personer. De parametrar vi är intresserae av är vanligtvis funtioner av två totaler Y y och Z U z, är y är väret på variabel y för person och z väret på en annan variabel för samma person. Vanligtvis är y (och även z) en iotom variabel,.v.s. 1 om person har stuerae egensap y (4.1) 0 för övrigt U
STATISTISKA CENTRALBYRÅN 2013-04-12 6(7) Vanligtvis är vi ocså intresserae av parametrar för reovisningsgrupper. Låt oss benämna essa U,..., U,..., 1 U, är U U D. Totalen för reovisningsgrupp an srivas Y U y (4.2) D 1 är y för U y. 0 för övrigt. Z bilas på liartat sätt. En generell parameter för reovisningsgrupp ( an ocså avse hela Y populationen) an srivas C, är C är en onstant. Z Den vanligaste parametern är en procentuell anel, som erhålles när C 100 och z 1 för alla, och y är efiniera enligt (4.1). Om vi låter N vara antalet personer i reovisningsgrupp, å an parametern srivas P U 100 (4.3) N y Vi rar ett obunet slumpmässigt urval (OSU) s av storleen n från populationen U, men p.g.a. övertäcning och bortfall har vi enast svarsmängen r av storleen m att utföra beräningarna på. Den onventionella estimatorn (för Y ), har å följane form: N Ŷ y r (4.4) m I estimator (4.4) använs ingen hjälpinformation. I syfte att erhålla en estimator me minre urvalsfel och bortfallssevhet än estimator (4.4) utnyttjar vi hjälpinformation i estimationen. Vi bilar en hjälpvetor x, som anger till vila ategorier av hjälpvariablerna som person hör. Från RTB och Utbilningsregistret framställer vi hjälptotalerna U x. Vi utnyttjar enna hjälpinformation i en alibreringsestimator. Kalibreringsestimatorn för totalen Y har följane utseene:
STATISTISKA CENTRALBYRÅN 2013-04-12 7(7) Y ˆ * w r g y (4.5) är f 1 ˆ för r, * så att = total vit för objet = inlusionssannolihet för objet = satta svarssannolihet är et antas att personer svarar me samma sannolihet och oberoene av varanra esignvit bortfallsvit justeringsfator som baseras på hjälpinformationen och g * 1 x x x U * x r x ) r 1 ( (4.6) Y Vi sattning av en parameter av typen C sattas respetive total Z me hjälp av alibreringsviterna * g. Anmärning: Den tenisa besrivningen ovan gäller estimation av storheter i barnpopulationerna. Urvalet av förälrar har oc i enna unersöning ragits i två steg. I et första steget rogs ett OSU av barn och i et anra steget rogs för varje utvalt barn ett OSU av en föräler. Designviterna är i etta fall onstruerae så att hänsyn tas till att förälrar me många barn har större sannolihet att omma me i urvalet än förälrar me få barn, samt att förälrar som är ensamma vårnashavare har större sannolihet att omma me än förälrar me gemensam vårna (givet första steget). I övrigt genomförs alibreringen på i princip samma sätt som för barnpopulationerna. Referenser Lunström S. och Särnal C.-E. (2001). Estimation in the Presence of Nonresponce an Frame Imperfection. Stocholm: Statistics Sween Anersson C. och Norberg L. (1998). A User s Guie to CLAN 97 a SASprogram for computation of point- an stanar error estimates in sample surveys. Statistics Sween Särnal, Swensson och Wretman (1992): Moel Assiste Survey Sampling. New Yor: Springer Verlag.