F2 Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik (kap 2.5, 4) Planeringen av en statistisk undersökning Tre huvudfrågor: Vem ska undersökas? Vad ska undersökas? Hur ska undersökningen göras? Ursprung: Linda Wänström Vem ska undersökas? Population En mängd av element som vi vill studera egenskaper och attityder för. Måste definieras och avgränsas i tid och rum Populationsstorlek: N Målpopulation Den population man idealt vill undersöka Element, enhet, individ, unit, object, individual, subject Människor, bilar, företag, olika händelser, Ram Register eller annan förteckning över populationens urvalsenheter Urvalsenheten kan vara detsamma som elementet eller vara en grupp av element. Undersökningspopulation/rampopulation Populationen som definieras av den faktiska ramen Vem ska undersökas? Ramen kan vara Register Tidpunkter/intervall Områden ( area sampling, områdesurval) Tex alla stadens kvarter på en karta Register finns över Befolkning, tex medlemmar, anställda Folkbokförda i landet finns i RTB RTB=registret över totalbefolkningen Telefonabonnenter Företag 1
Undertäckning och övertäckning Undertäckning Utgörs av de element som ingår i målpopulationen men ej i rampopulationen Övertäckning Utgörs av de element som ingår i rampopulationen men ej i målpopulationen Krav på en bra ram Identifiering av urvalsenheterna Aktuell Inga dubbletter/vetskap om dubbletter Kännedom om enheternas ordning Tillgång till värden på bakgrunds- och hjälpvariabler Vad ska undersökas? Utgå från målsättning och frågeställningar (syfte) Definiera variabler (operationalisera) Hur ska variablerna beskrivas? Medelvärde Totalvärde Varians standardavvikelse Parameter En konstant storhet som karakteriserar en variabel i populationen Dummytabeller Tomma tabeller och diagram som görs i planeringsstadiet Hur ska undersökningen göras? Totalundersökning Undersökning av alla element i populationen Vill redovisa resultat i små delgrupper Liten population Urvalsundersökning Undersökning av ett urval av element från populationen Snabbare och billigare Kan använda bättre mätmetoder felen i resultaten kan bli mindre Kan ställa fler och mer detaljerade frågor Enda alternativ vid förstörande prövning 2
Hur ska undersökningen göras? Sekundärdata Data som redan är insamlad (för annat syfte). Primärdata Data som samlas in för första gången Exempel: Arbetskraftsundersökningarna (AKU) AKU genomförs varje månad. Syftet med undersökningarna är att beskriva aktuella sysselsättningsförhållanden och att ge information om utvecklingen på arbetsmarknaden. AKU är en urvalsundersökning som genomförs varje månad. Urvalsindividerna besvarar frågor om sin arbetsmarknadssituation under en specifik vecka i referens-månaden. Uppgifterna hämtas huvudsakligen in via telefonintervjuer, utförda av SCB Intervju. Resultaten av de månadsvisa undersökningarna publiceras kort efter referensperiodens slut. Dessa ligger också till grund för skattningar av kvartals- och årsgenomsnitt. Se http://www.scb.se/templates/product 23262.asp Från och med 1995 har också en kompletterande EU-AKU genomförts, under de första sex åren en gång om året och därefter varje månad, med kvartal som redovisningsperiod. I EU-AKU är det hushåll som är undersökningsobjekt i motsats till i den nationella AKU-undersökningen där individer är undersökningsobjekt. Urvalsstorleken för 16 64 år har varierat över tiden. Under 1963 1969 ökade kvartalsurvalen från 6 500 till 12 000 individer. Från och med 1970 var månadsurvalen 18 000 individer. Urvalet utökades sedan under perioden 1976 1977 till som högst 24 000 för att sedan, under 1988 1995, ligga kring 18 000 med en lägsta nivå på 17 000 åren 1996 2000. Under 2001 skedde en successiv urvalsökning till 21 000 individer i juli, detta för att klara ställda krav på en utökad regional redovisning. Från och med år 2001 förändrades målpopulationen till att omfatta åldersintervallet 15 74 år. Omläggningen medförde en urvalsökning i storleksordningen 1 000 individer till totalt 22 000 individer. Urvalsstorleken var 2001-2003 totalt 21 000 individer, 2004-2005 19 000 (nerdragningen var en kostnadstäckning för omläggningen till nya AKU). År 2006-2007 ökade urvalet åter och var då 21 500. Uppgift: Utgå från AKU-undersökningarna Vilken var målpopulationen före 2001? Vilken är målpopulationen numera? Vilka element består populationen i den Svenska undersökningen av? Vilka element består populationen i EUundersökningen av? Är AKU en total- eller urvalsundersökning? Om vi antar att ramen består av alla folkbokförda i Sverige under sista dagen i månaden innan finns det risk för övertäckning? Undertäckning? 3
Sekundärdata Innan man samlar in egen data (primärdata) kan man undersöka om det finns statistik tillgänglig Finns svaren direkt? Behöver nya bearbetningar göras? Datamaterial finns ofta sparade i register eller databaser. Kan även vara komplement till primärdata Officiell statistik Officiell statistik Skall finnas för allmän information, utredningsverksamhet och forskning. Den skall vara objektiv och allmänt tillgänglig. (SFS2001:99) Produceras av SCB samt 24 myndigheter Ex Arbetsmiljöverket, Brottsförebyggande rådet, CSN, Finansinspektionen, Högskoleverket, Konjunkturinstitutet, Riksförsäkringsverket, Socialstyrelsen (se KD sid 105) Allmänt tillgänglig, i elektronisk form Objektiv Skydd för personlig integritet enligt PuL Kvalitetsdeklareras Publiceras i Sveriges Officiella Statistik (SOS) Finansieras via anslag, ej uppdragsfinansierad Uppdelad efter kön Nationalräkenskaper Ett bokföringssystem med transaktioner och balanser för Sverige Baserat på administrativa register och statistiska undersökningar Behöver: företagsregister, befolkningsdata, prisindex, klassifikationer Används bl.a. för att beräkna BNP Årsberäkningar Preliminära efter 1 år, definitiva efter 2 år Kvartalsberäkningar Preliminära efter 60 dagar Var finns statistiken? Publikationer Tidigare: tryckta publikationer Numera: elektroniskt www.scb.se Exempel på publikationer Statistisk Årsbok (SÅ) Årsbok för Sveriges Kommuner (ÅSK) Statistiska Meddelanden (SM) SCBs tidskrift Välfärd Webbmagasinet artikulerat Andra exempel GIS Befolkningspyramid 4
Användning av registerdata Register: en fullständig förteckning över objekten i en viss objektmängd eller population. Uppgifter kan pga kvalitetsbrister saknas för vissa objekt. Uppgifter som objektens identitet ska finnas så att registret kan uppdateras och utökas med nya variabelvärden för respektive objekt. För att bedöma användbarheten bör man veta hur det är upplagt och hur det hålls aktuellt Användning Sammanställning av registerdata Bas för undersökningar som urvalsram Komplement till primärdata Registerbaserade undersökningar forts. Fyra basregister är grunden för SCB:s registersystem Befolkningsregistret (RTB) Folkbokförda befolkningen Uppdateras 1 gång/vecka Syfte: Producera löpande befolkningsstatistik Utgöra underlag för urvalsram Utgöra basregister för olika statistiska undersökningar Aktivitetsregistret Företagsregistret Fastighetsregistret Databaser LOUISE Longitudinell databas för utbildning, inkomst och sysselsättning Omfattar alla mellan 16-64 år varje år från 1990, från 1995 även alla över 64 LINDA OSU 300 000 personer 1994 Kompletteras med nya personer varje år Inkomstförhållanden och förändringar för enskilda personer För- och nackdelar med att använda sekundärdata Fördelar Billigare per element Kan användas i kombination med primärdata Minskad uppgiftslämnarbörda Nackdelar Risk för inaktuella uppgifter Undersökningens ursprungliga syfte ej detsamma Ändrade definitioner på variablerna Ändrade avgränsningar av population och element Data ej sparade i ursprungligt skick Underrapportering i administrativa register 5