STATISTISKA CENTRALBYRÅN 2011-11-17 1(6) Kalibreringsrapport 1 Inlening I en totalunersöning uppommer fel om vi inte lycas få svar från alla personer (bortfall) om e avvier från e svarane me avseene på unersöningsvariablerna. Detta fel allas för bortfallsfel. Kunsap om bortfallsfelet an i regel bara fås på ett iniret approximativt sätt genom att utnyttja registervariabler. Bortfallsfel an reuceras genom att använa ett effetivt uppräningsförfarane (vägning som ompenserar för bortfallet). I följane avsnitt reovisas hur et görs i enna unersöning. 2 Hjälpinformation Viss hjälpinformation utnyttjas vanligtvis även före estimationen, t.ex. för bilane av stratifierae urvalsesigner. Denna unersöning är oc en totalunersöning ingen stratifiering har gjorts. Bortfall föreommer oc i unersöningen i avseene att reucera bortfallsfelet använs hjälpinformation i estimationen. Det centrala arbetet för att få go valitet på sattningarna, å alibreringsestimatorn använs, är att använa star hjälpinformation. I följane avsnitt besrivs etta arbete för enna unersöning. 2.1 Tänbara hjälpvariabler Vi val av hjälpvariabler är et tre riterier som sa beatas (se Lunström Särnal 2001): Det första riteriet är att variabeln samvarierar väl me svarsbenägenheten (-sannoliheten). Det är et vitigaste riteriet eftersom et leer till en minsning av bortfallssevheten för alla sattningar. Det anra riteriet är att variabeln samvarierar väl me (vitiga) målvariabler. Om så är fallet minsar bortfallsbiasen för e sattningar som byggs upp av essa målvariabler. Även variansen minsar för essa sattningar. Det treje riteriet är att variabeln avgränsar (vitiga) reovisningsgrupper. Det leer framförallt till minsa varians i sattningar för essa reovisningsgrupper.
STATISTISKA CENTRALBYRÅN 2011-11-17 2(6) I en unersöning frågor av siftane aratär är et främst riterierna (i) (iii) som an beatas. Tänbara hjälpvariabler, et vill säga variabler som tros uppfylla essa riterier, hämtaes ifrån RTB (Registret över totalbefolningen). Hjälpvariablerna är efinierae enligt tabell 1. Tabell 1. Tänbara hjälpvariabler Variabel (benämning) Kategorier (oer) KÖN 1 = Man 2 = Kvinna ÅLDER 1 = 24 2 = 25 29 3 = 30 39 4 = 40 FÖDELSELAND 1 = Noren 2 = Utanför Noren REGION (Nuts3) 1 = SE1 Östra Sverige 2 = SE2 Söra Sverige 3 = SE3 Norra Sverige INKOMST (t r) 1 = -25 2=26-125 3=126-- UTBILDNING 1 = Gymnasial utbilning 2 = Eftergymnasial utbilning ortare än tre år 3 = Eftergymnasial utbilning tre år eller längre CIVILSTÅND STUDIETAKT UTBILDNINGSOMRÅDE 1 = Gift eller registrerat partnersap 2 = Övriga 1=Helti, 100 % 2=Delti<100% 1=Data/IT 2=Eonomi, aministration försäljning 3=Frisvår roppsvår 4=Hotell, restaurang turism 5=Hälso- sjuvår samt socialt arbete 6=Journalisti information 7=Jurii 8=Kultur, meia esign 9=Lantbru, jurvår, trägår, sog fise 10=Miljövår miljösy 11=Peagogi unervisning 12=Samhällsbyggna byggteni 13=Säerhetstjänster 14=Teni tillverning 15=Transporttjänster 16=Övrigt I följane avsnitt analyserar vi variablerna i tabell 1 för att slutligen bestämma en hjälpvetor.
STATISTISKA CENTRALBYRÅN 2011-11-17 3(6) 3 Analys av hjälpinformation 3.1.1 Kriterium 1: Variabeln samvarierar me svarsbenägenheten För att se huruvia hjälpvariablerna uppfyller et första riteriet, stueras sambanet mellan en iotoma variabeln svarane/bortfall hjälpvariablerna. Det görs genom att beräna anel svarane i olia grupper, bestäma av respetive hjälpvariabel. Vi stora sillnaer mellan svarsanelarna utgör variabeln en star aniat till hjälpvariabel. Tabell 2 Satta procentuell anel svarane förelat på ön. Män Kvinnor Svarsanel (%) 58,6 69,2 Tabell 3 Satta procentuell anel svarane förelat på åler. -24 25-29 30-39 40- Svarsanel (%) 58,0 60,5 68,5 79,9 Tabell 4 Satta procentuell anel svarane förelat på föelselan. Noren Övriga värlen Svarsanel (%) 65,4 59,4 Tabell 5 Satta procentuell anel svarane förelat på NUTS-region. Östra Söra Norra Svarsanel (%) 61,6 66,6 66,6 Tabell 6 Satta procentuell anel svarane förelat på civilstån. Gift/RP Övriga Svarsanel (%) 75,1 62,0 Tabell 7 Satta procentuell anel svarane förelat på inomst (t r). -25 26-125 126- Svarsanel (%) 59,9 64,9 70,1 Tabell 8 Satta procentuell anel svarane förelat på utbilning. Gymnasial Svarsanel (%) 65,0 63,5 75,5
STATISTISKA CENTRALBYRÅN 2011-11-17 4(6) Tabell 9 Satta procentuell anel svarane förelat på stuietat. Helti Delti Svarsanel (%) 64,0 76,3 Tabell 10 Satta procentuell anel svarane förelat på utbilningsområe. Data/IT Eonomi, aministr ation försäljnin g Frisvår roppsvår Hotell, restauran g turism Hälso sjuvår samt socialt arbete Svarsanel (%) 55,2 64,3 73,4 63,7 70,6 Journalist i informati on Jurii Kultur, meia esign Lantbru, jurvår, trägår, sog fise Miljövår miljösy Svarsanel (%) 74,6 66,7 57,9 68,9 76,9 Miljövår Peagogi Samhälls Säerhets Teni miljösy unervisn ing byggna byggteni tjänster tillverni ng Svarsanel (%) 68,1 64,0 61,7 63,6 70,8 Övrigt Svarsanel (%) 78,6 Tabellerna 2-10 tyer på att hjälpvariablerna alla hjälpvariabler är stara beträffane riterium 1, utom NUTS-region föelselan som är något svagare. 3.1.2 Kriterium 3: Variabeln avgränsar (vitiga) reovisningsgrupper Om hjälpvariabeln avgränsar vitiga reovisningsgrupper an valiteten bli bättre i essa grupper. Framförallt blir sattningarna särare om hjälpvariabeln väl avgränsar reovisningsgruppen. Kalibreringsestimatorn ger onsistenta sattningar i en meningen att estimatorn ger exata sattningar för utnyttjae registertotaler. Hjälpvariablerna ön, åler utbilningsområe avgränsar vitiga reovisningsgrupper i föreliggane unersöning. Det gör även NUTSregion, föelselan utbilning.
STATISTISKA CENTRALBYRÅN 2011-11-17 5(6) 3.2 Slutligt val av hjälpvetor Efter en sammanvägning av analysen ring ovanståene riterier samt efter ontroll av viternas förelning använs följane hjälpvetor: Utbilningsområe+ön+åler+civilstån+inomst+stuietat+NUTSRegi on+föelselan+utbilning Tenis besrivning av urval estimation Vi har en population U beståene av N personer. De parametrar vi är intresserae av är vanligtvis funtioner av två totaler Y = y = U z, är y är väret på variabel y för person z väret på en annan variabel för samma person. Vanligtvis är y ( även z) en iotom variabel,.v.s. 1 om person har stuerae egensap y = (4.1) 0 för övrigt U Vanligtvis är vi ocså intresserae av parametrar för reovisningsgrupper. Låt oss benämna essa U1,..., U,..., U D, är U = U. Totalen för reovisningsgrupp an srivas Y = U y (4.2) D =1 är y för U y =. 0 för övrigt. bilas på liartat sätt. En generell parameter för reovisningsgrupp ( an ocså avse hela Y populationen) an srivas θ = C, är C är en onstant. Den vanligaste parametern är en procentuell anel, som erhålles när C = 100 z = 1 för alla, y är efiniera enligt (4.1). Om vi låter N vara antalet personer i reovisningsgrupp, å an parametern srivas
STATISTISKA CENTRALBYRÅN 2011-11-17 6(6) P U = 100 (4.3) N y På grun av att bortfall har föreommit i unersöningen, har vi enast svarsmängen r av storleen m att utföra beräningarna på. Därför måste ompensation för bortfallet göras. Den onventionella estimatorn (för Y ), har följane form: N Yˆ = y r (4.4) m I estimator (4.4) använs ingen ytterligare hjälpinformation än stratifieringsinformationen. I syfte att erhålla en estimator me minre bortfallssevhet än estimator (4.4) utnyttjar vi hjälpinformation i estimationen. Vi bilar en hjälpvetor x, som anger till vila ategorier av Utbilningsområe+ön+åler+civilstån+inomst+stuietat+NUTSRegi on+föelselan+utbilning som person hör. Vi framställer hjälptotalerna U hjälpinformation i en alibreringsestimator. x utnyttjar enna Kalibreringsestimatorn för totalen Y har följane utseene: Yˆ w = r v y (4.5) är v 1 ( x x ) x = 1 + ( (4.6) x U r x ) r Y Vi sattning av en parameter av typen θ = C sattas respetive total me hjälp av alibreringsviten v. Referenser: Lunström S. Särnal C.-E. (2001). Estimation in the Presence of Nonresponce an Frame Imperfection. Stolm: Statistics Sween