Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

Relevanta dokument
Vem ska undersökas? Vem ska undersökas? Planeringen av en statistisk undersökning. Tre huvudfrågor: Vad ska undersökas? Hur ska undersökningen göras?

Planeringen av en statistisk undersökning

Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp

Några begrepp. Vad är statistik? Data. Grundläggande begrepp Olika slag av undersökningar

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Förra gången (F7) Officiell statistik Befolkningsstatistik. Slumpmässiga urval. Icke-slumpmässiga urval

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Kvantitativa metoder del 2. Kandidatprogrammet i folkhälsovetenskap, HT -11

Hur gör de egentligen?

Vad är officiell statistik? Föreläsning 2

Föreläsning 1: Introduktion. Vad är statistik?

Vad är statistik? Kapitel 1 handlar om. Praktisk statistik kapitel 1. Vad är statistik? Grundbegrepp

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

Integration analys: Integration Etablering på arbetsmarknaden

Introduktion Kritiskt förhållningssätt Olika typer av undersökningar

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Hur går en statistisk undersökning till?

Förskoleverksamhet och skolbarnsomsorg: Barn och personal per 15 oktober 2009 UF0123

Arbetskraftsbarometern 2008 UF0505

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Introduktion Olika typer av undersökningar Kritiskt förhållningssätt (kap. 1, 2.1, 2.2) Kursupplägg

Kostnader för utbildningsväsendet

Arbetskraftsbarometern 2010 UF0505

Kapitalvinster och kapitalförluster, preliminär 2007

Undersökning av förtroendevalda i kommuner och landsting 2007 ME0001

Integration - Analys 2008 LE0105

Befolkningens studiedeltagande Höstterminen 2007

Kursupplägg. Kursinnehåll. Exempel på undersökningar: Högskolestudenters levnadsvillkor

Elevpaneler för longitudinella studier 2014 Panel 8 UF0501 Innehåll

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

Befolkningens studiedeltagande Höstterminen 2009 UF0507

Komvux: elever, kursdeltagare och utbildningsresultat

Namnstatistik 2010 BE0001

Statistikens betydelse och nytta för samhället

STATISTIKENS FRAMSTÄLLNING

Kommunala hälso- och sjukvårdsinsatser till äldre personer och personer med funktionsnedsättning 2013 HS0116 och HS0117

Demografisk analys 2011 Innehållsförteckning Administrativa uppgifter... Kvalitetsdeklaration... 4

Namnstatistik 2008 BE0001

Demografisk analys: På egna ben. En beskrivning av ungas flytt från föräldrahemmet

Sjukfall. Referensår A. Allmänna uppgifter SF0203

Kostnader för utbildningsväsendet UF0514

Insatser för barn och unga enligt SoL och LVU 2008 SO0211

Hälso- och sjukvård som kommunen ansvarar för enligt 18 hälso- och sjukvårdslagen (1982:763), HSL Statistikår: 2008, juni (mätmånad) SO0309 och SO0310

Nominerade och valda, Allmänna val

Omförhandling och byten av elavtal 2011 EN0305

Innehållsförteckning. Socialstyrelsen BESKRIVNING AV STATISTIKEN SO Socialtjänstavdelningen/Statistikenheten (7)

Dagersättning sjukförmåner

Gymnasieskolan: Sökande och intagna 1997

Skogsentreprenörer 2013 JO0504

Underhållsstöd. Referensår. A. Allmänna uppgifter SF0102

Konjunkturstatistik, löner för landsting 2002 AM0109

KVALITETSDEKLARATION

Statistik om hälso- och sjukvårdspersonal antal legitimerade och arbetsmarknadsstatus

Småorter; arealer, befolkning 2005 MI0811

Industrins kapacitetsutnyttjande 2010 NV0701

Underhållsstöd. Referensår. A. Allmänna uppgifter och 2000 SF0102

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Rådet för den officiella statistiken. Riktlinjer för beslut om innehåll och omfattning av den officiella statistiken

Laboration 3: Urval och skattningar

Förskoleverksamhet och skolbarnsomsorg: barn och personal per 15 oktober 2008 UF0117

Arbetskraftsbarometern 2011 UF0505

Population. Antal tänder. Urval

Arbetsplatsområden utanför tätort 2010 MI0815

Bostadsbidrag till barnfamiljer m.fl Referensåret 2012 SF0105

Särskola för vuxna (Särvux) 2008 UF0110

Föreläsning G60 Statistiska metoder

Kvalitetsdeklaration Statistik om kommunala hälso- och sjukvårdsinsatser 2017

Longitudinell Integrationsdatabas för sjukförsäkrings- och arbetsmarknadsstudier (LISA) 2009 AM9901

Vad tycker medborgarna om nedskräpningen i sin kommun? - En analys av tilläggsfrågor från medborgarundersökningen

Arbetskraftsbarometern September Augusti 2001

Kostnader för utbildningsväsendet UF0514

Statistik om kommunala hälso- och sjukvårdsinsatser Innehållsförteckning. Beskrivning av statistiken HS0116 1(7) HS0116

Adress: Adolf Fredriks kyrkogata 8, Stockholm Kontaktperson: Joakim Söderberg Telefon: A.5 Producent

Svenskundervisning för invandrare (SFI): elever, kursdeltagare och utbildningsresultat 2008/2009 UF0108

Inlämningsuppgift 1: Beslutsunderlag, 1,5hp

Kostnader för utbildningsväsendet UF0514

Enkätmetodik felkällor. Kandidatprogrammet i folkhälsovetenskap, HT -11

IT bland individer 2005

Assistansersättning Referensår

Introduktion till statistik för statsvetare

Graviditeter, förlossningar och nyfödda barn 2013 HS0107

Vattenuttag och vattenanvändning i Sverige 2005 MI0902

Kvinnor och män i statistiken 11

Gymnasieskolan: elever per 15 oktober 2010 UF0103

Skogsentreprenörer 2015 JO0504

Återbetalning av studiestöd 2010

Skogsentreprenörer 2011 JO0504

Gymnasieskolan: elever per 15 oktober 2011 UF0103

Statistiska centralbyråns författningssamling

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Grundskolan: Slutbetyg 2007/08 UF0101

Samhällets utgifter för kultur Referensår Produktkod KU0501

KVALITETSDEKLARATION Ohälsomått

Industrins kapacitetsutnyttjande 2008, 2009 NV0701

Hushållens boende 2015 HE0111

Samhällets utgifter för kultur Referensår Produktkod KU05

Hyror i bostadslägenheter (HiB)

Skador och förgiftningar behandlade i sluten vård HS0112

Småorter; arealer, befolkning 2010 MI0811

Konkurser och offentliga ackord

Transkript:

F2 Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

Planeringen av en statistisk undersökning Tre huvudfrågor: Vem ska undersökas? Vad ska undersökas? Hur ska undersökningen göras?

Grundläggande begrepp Innan vi kan göra uttalanden måste vi samla in data Vi har ofta inte råd/tid att undersöka en hel population Population En mängd av enheter som vi vill studera egenskaper och attityder för. Måste definieras och avgränsas i tid och rum Populationsstorlek: N Element, enhet, individ, unit, object, individual, subject Människor, bilar, företag, olika händelser, Stickprov, urval (sample) En observerad delmängd av populationen Stickprovsstorlek: n Variabel X, Y, Z,.. En egenskap som kan variera mellan olika enheter i populationen

Planering av en undersökning Vi har ett problem Vi vill ha mera kunskap innan vi fattar beslut Vi vill kunna bedöma kvaliteten på det beslutsunderlag vi får

Beskrivande frågeställning Problemet avgör typ av undersökning Beskrivande frågeställning Hur många (är positiva)? Hur har andelen (tveksamma) ändrats sedan förra mätningen? Hur skiljer sig åsikterna åt mellan könen? Mellan olika inkomstgrupper? Lämpligt med en survey (totalundersökning eller urvalsundersökning)

Urvalsundersökning eller totalundersökning? Man väljer ofta urvalsundersökning Kan ge högre kvalitet Totala felet kan bli mindre Tid/råd att anstränga sig för att resultatet ska bli så riktigt som möjligt Ex. fler påminnelser till bortfall

Förklarande frågeställning Förklarande frågeställning Råder det orsakssamband mellan X och Y? Dvs påverkar X Y eller finns det bakomliggande variabler Z som kan förklara det (numeriska) sambandet? Hur stor är effekten av X på Y givet att alla andra påverkande variabler hålls konstanta?

Primärdata vs sekundärdataundersökning Antag beskrivande frågeställning Finns uppgifterna redan insamlade, sekundärdata? Leta i officiella statistiken, olika databaser, utredningar osv. Primärdataundersökning Vem ska undersökas? Vad ska undersökas? Hur ska undersökningen göras?

Vem ska undersökas? Målpopulation Den population som vi idealt vill undersöka, som vi vill dra slutsatser till Rampopulation (Undersökningspopulation) den population som vi har en ram/ett register över Ram Register eller annan förteckning över populationens enheter

Vem ska undersökas? Definiera målpopulationen genom att avgränsa den i tid och rum Ex. Medlemmar i en förening, tidpunkt? De som betalat årets medlemsavgift? Ingår de i målpopulationen? De finns antagligen kvar i registret (ingår i rampopulationen) Nya medlemmar som ej hunnit bli registrerade? Bör ingå i målpopulationen, men finns ej med i rampopulationen.

Vem ska undersökas? Täckningsfel Avvikelser mellan mål- och rampopulation Över-och undertäckningsfel Viktigt: man får inte definiera bort enheter i målpopulationen som man vet är tex svåranträffbara risk för systematiska fel. Ex personer med hemligt telefonnummer

Vem ska undersökas? Ramen kan vara Register Tidpunkter/intervall Områden ( area sampling, områdesurval) Tex alla stadens kvarter på en karta Register finns över Befolkning, tex medlemmar, anställda Folkbokförda i landet finns i RTB RTB=registret över totalbefolkningen Telefonabonnenter Företag

Vem ska undersökas? Ex. Populationen statistiker Definition? Medlem i någon statistisk förening? Arbetar med statistik? Krav på formell kompetens? Statistiker enligt SSYK 96 (se KD sid 158)

Egenskaper hos en bra ram Identifiering av enheterna För att kunna nå dessa Namn, adress, tel.nr, e-mail För att kunna samköra med andra register Personnummer, organisationsnummer Aktuell Inga brev i retur, hög täckningsgrad Kunskap om hur ramen är ordnad/sorterad Ex efter bokstavsordning, ålder, bostadsområde

Egenskaper hos en bra ram Även viktigt att andra variabler finns i ramen som kan användas tex vid urvalet (tex som stratifieringsvariabler) Kunskap om hur många gånger varje enhet finns i ramen. Vi kan bestämma chansen (sannolikheten) att bli utvald för varje enhet

Vad ska undersökas? Parameter Konstant storhet som karakteriserar en variabel i populationen Ex. medelvärde, andel, total Exempel Medelinkomst hos en grupp anställda Andel kvinnor i företaget Totala utbetalda lönesumman varje månad N=antalet anställda De storheter/parametrar som efterfrågas måste vara vägledande för vilka frågor som ska ställas och hur i frågeformuläret Utgå från VAD man vill undersöka

Hur ska undersökningen göras? Antag att vi bestämt oss för en urvalsundersökning Slumpmässigt urval? Icke-slumpmässigt urval? Olika urvalsmetoder: senare Antag slumpmässigt urval Varje urvalsenhet har en känd sannolikhet (chans) större än 0 att bli utvald Urvalsenhet: elementet eller grupper av element

Sekundärdata Finns det statistik tillgänglig? Finns svaren direkt? Behöver nya bearbetningar göras? Datamaterial finns ofta sparade i register eller databaser. Kan även vara komplement till sekundärdata

Officiell statistik Officiell statistik Skall finnas för allmän information, utredningsverksamhet och forskning. Den skall vara objektiv och allmänt tillgänglig. (SFS2001:99) Produceras av SCB samt 24 myndigheter Ex Arbetsmiljöverket, Brottsförebyggande rådet, CSN, Finansinspektionen, Högskoleverket, Konjunkturinstitutet, Riksförsäkringsverket, Socialstyrelsen (se KD sid 105) Allmänt tillgänglig, i elektronisk form Objektiv Skydd för personlig integritet enligt PuL Kvalitetsdeklareras Publiceras i Sveriges Officiella Statistik (SOS) Finansieras via anslag, ej uppdragsfinansierad Uppdelad efter kön

Var finns statistiken? Publikationer Tidigare: tryckta publikationer Numera: elektroniskt www.scb.se Exempel på publikationer Statistisk Årsbok (SÅ) Årsbok för Sveriges Kommuner (ÅSK) Statistiska Meddelanden (SM) SCBs tidskrift Välfärd Webbmagasinet artikulerat Andra exempel GIS Befolkningspyramid

Användning av registerdata Register: en fullständig förteckning över objekten i en viss objektmängd eller population. Uppgifter kan pga kvalitetsbrister saknas för vissa objekt. Uppgifter som objektens identitet ska finnas så att registret kan uppdateras och utökas med nya variabelvärden för respektive objekt. För att bedöma användbarheten bör man veta hur det är upplagt och hur det hålls aktuellt Användning Sammanställning av registerdata Bas för undersökningar som urvalsram Komplement till primärdata

Registerbaserade undersökningar forts. Fyra basregister är grunden för SCB:s registersystem Befolkningsregistret (RTB) Aktivitetsregistret Företagsregistret Fastighetsregistret

Databaser LOUISE Longitudinell databas för utbildning, inkomst och sysselsättning Omfattar alla mellan 16-64 år varje år från 1990, från 1995 även alla över 64 LINDA OSU 300 000 personer 1994 Kompletteras med nya personer varje år Inkomstförhållanden och förändringar för enskilda personer

För- och nackdelar med att använda sekundärdata (se KD s. 119) Fördelar Billigare per element Kan användas i kombination med primärdata Minskad uppgiftslämnarbörda Nackdelar Risk för inaktuella uppgifter Undersökningens ursprungliga syfte ej detsamma Ändrade definitioner på variablerna Ändrade avgränsningar av population och element Data ej sparade i ursprungligt skick Underrapportering i administrativa register