Bortfall i longitudinella Silke Burestam, doktorand Statistiska institutionen Stockholms Universitet Projekt: Moderna statistiska undersökningsmetoder ett nätverkn Finansieras av Hemsida: Riksbankens http://www.statistics.su.se/ modernsurveys/ Jubileumsfond I projektet ingår statistiska institutionerna i Stockholm och Linköping samt psykologiska institutionen vid Stockholms universitet Projektets inriktning Webb med närbesln rbesläktade problem icke sannolikhetsurval Bortfall i surveyer Bortfall i longitudinella Dagens presentation: En studie av bortfallet i IDA En variant av GREG estimatorn AGREG Hur AGREG kan tillämpas longitudinellt Bortfall Ett växande v problem Minskad andel svarade i alla typer av Bättre förstf rståelse ger möjlighet m att öka svarsfrekvenser och att förbf rbättra skattningar Här r dels en studie av hur det kan se ut, dels förbättrade estimat IDA - studien IDA Individual development and adaption Alla barn i klass i Örebro 1965 Datainsamling under grundskolan, vid 27-år r och vid 4 år 189, varav 728 har deltagit i samtliga Endast kvinnor i min studie
Grundskolan Ett flertal enkäter till barn och föräldrar, f lärare, l kamrater, registerdata. Kontakter med BUP, betyg, utdrag ur brottsregister (pojkar) Genomgående ende lågt l bortfall (över( 90% deltagande) Symptomenkäten ten åk k 8: 69 flickor av 589 frånvarande. 11 påp pryo eller utflyttade rest. 58 sjuka eller okänt skäl 2% av dessa 58 i BUP s register 9 % av dem som deltog i enkäten 27 års undersökningen Postenkät t till samtliga som någon n gång g deltagit i IDA 1 individer ströks Frågor kring utbildning & arbete, familjesituation, relationer, fritidssysselsättning, ttning, alkoholvanor, föreningsmedlemskap f etc. 4 års undersökningen Bortfallet Till största del personliga intervjuer 44 kvinnor borta ur gruppen därav några n som begärt utträde Liknande frågor som vid 27 + hälsorelaterade h frågor Ung lika stort vid 27 som vid 4. Bortfallsorsaker ej dokumenterade vid 27 86,1 % - efter ytterligare insatser 89,2 % vid 4 Bortfallsorsaker 4 Deltagit Fys/psyk sjuk Ej antr Vägran n 549 14 72 68 % 86,1 0,5 2,2 11, 100 Deltagande i antal vuxen Bortfallet vid 27 Deltagande antal n % Ingen 21 Endast en Två 88 529 14 8 Fler kvinnor bland de svarande Högre intelligenspoäng ng Högre betyg 68 100
Projektandan De som varit med länge l deltar även som vuxna? Andra barndomsvariabler Små skillnader för f r föräldrars f utbildning Trasslig barndom signifikant skillnad: Antal undersökningsår i grundskolan 1 2 4 Deltagande i vuxen 0 1 2 4 (7%) 9 (15%) 47 (78%) 8 (9%) 12 (1%) 70 (78%) 1 (1%) 14 (18%) 65 (81%) 8 (2%) 5 (1%) 47 (85%) 21 (%) 88 (14%) 529 (8%) Total 60 (100%) 90 (100%) 80 (100%) 408 (100%) 68 (100%) Ej nätverkn nätverk Nätverk> Båda vuxen 85% 67% 6% Samvariation? Samanfattning barndomsvariabler Familjer med sociala problem byter oftare bostadsort Tendensen kvarstår r men svagt då d trasslig uppväxt xt uteslutits Inte längre l signifikant De tre signifikanta faktorerna samvarierar Bortfallet består r av barn som... Har föräldrar f med lägre l utbildning Flyttar ofta Har kontakt med sociala nätverkn Data insamlat vid 27 relaterat till bortfall vid 4. Civilstånd och barn påverkar p ej Påverkar gör: g Utbildning Längre arbetslöshet shet Föreningsmedlemskap Spritkonsumtion Åter samvariation De som har det trassligt som barn är r i högre h grad borta under skol kningar De utgör r sedan bortfall i vuxenna pga trassligt liv. Sociala anpassning är r den absolut starkaste förklaringsvariabeln till bortfallet genom åren. IDA en homogen grupp jämngamla, fåf invandrare, här h enbart kvinnor Sammanfattning Faktorer som kön, k ålder, nationalitet etc har inte studerats IDA intressant komplement till sedvanliga bortfallsstudier
DEL 2 - AGREG Information från n tidigare Relevant för f r undersökningsvariabeln Man vill utnyttja sås mycket som möjligtm Problem: Hur utnyttja hjälpinformationen? Efterstratifiering, kalibrering, GREG-estimator estimator? Alla begränsar antal hjälpvariabler, annars växer v variansen Valet blir subjektivt GREG - AGREG Många hjälpvariabler, minimerad varians är r det möjligt? AGREG baseras påp GREG estimatorn Ett exempel Vi vill veta hur många m hundar som finns i sverige Vi drar stickprov och ringer och frågar om folk har hund 70% svarar, 2,8 % säger s sig ha hund Vi vet antal registrerade hundar i sverige Vi frågar om deras hundar är r registrerade Vi gissar att jägare j har fler hundar, vi frågar efter yrke Vi tror att rasen påverkar p om man är r hemma mer, vi frågar efter ras osv. Till slut har vi 20 hjälpvariabler mer el. mindre korrelerade. Den högra h delen av formeln tar inte hänsyn h till hur starkt sambandet är Vi kan se intuitivt se att många m hjälpvariabler ger hög g varians Vårt förslag: f Vi inför r en faktor a, i estimatorn Minskad varians är r målet m Alltså minimerar vi variansen i uttrycket I stora drag: Titta påp vad som varierar och derivera map a. Vi får f r efter ett antal antaganden och insättning av skattningar följande f uttryck där bla a variansen mellan x och y finns med. a kommer att fåf ett värde v mellan 0 och 1 (eg. mellan 0.5 och 1) Är r B känt k (teoretiskt) blir a=1 En skattning av a för f r varje hjälpvariabel Hjälpvariablerna x, x 1 2 x i får r olika tyngd beroende påp korrelation med y Högt korrelerade hjälpvariabler får f r större betydelse för f r skattningen. Vi kan ta med alla hjälpvariabler och formeln balanserar dessa. Ger förhoppningsvis f möjlighet m att använda nda många hjälpvariabler och förbf rbättrade skattningar t ex bortfall
Simuleringsstudie Multivariat normalfördeland rdeland population N 10 000 individer y och 10 hjälpvariabler x 1, x 2 x 10 Varierande korrelation med y 10 000 stickprov (OSU) a a n=25, 50, 100 och 500 4 skattningar av totalen från n varje stickprov: Ht, GREG, GREG alla, AGREG Jämförelse mellan de empiriska varianserna Resultat varianser vid osu Kvoten mellan variansen för f r AGREG och resp skattning vid OSU Hur varierar A? Korrelationer påp ung. 0.8, 0.7, 0.5, 0. och 0,2 (från n en simulering) Skeva stickprov Skeva stickprov har dragits Urvalssannolikhet beroende påp x 1. Inte helt tydlig tendens. I mycket skeva urval kommer AGREG, GREG- alla och GREG vara ung. likvärdiga. Fler simuleringar behövs Fler simuleringar behövs: Fler hjälpvariabler, 10 är r inte speciellt mycket i sammanhanget Se hur skevheten i stickprovet påverkar p resultaten variera skevheten Verkligt datamaterial Och slutligen... Koppla ihop AGREG med den longitudinella ansatsen Använda nda svaren från n tidigare som hjälpvariabler. T ex svaren från n första f och andra undersökningen som hjälpvariabler i tredje omgången Simulering och verkligt material.