F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval

Relevanta dokument
Ytterligare urvalsmetoder och skattningsmetoder

Tidigare exempel. Några beteckningar. Stratifierat urval

Urvalsmetoder: Stratifierat urval (kap 9.5)

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 1: Introduktion. Vad är statistik?

Urvalsökningar. Precisionen i en skattning är normalt proportionell mot 1/ n där n är urvalsstorleken

När gör hjälpinformation mest nytta - vid urval eller estimering?

Exempel i stickprovsteori

Introduktion till statistik för statsvetare

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Population. Antal tänder. Urval

Företagsklimatet i Kronobergs län 2018

Företagsamheten Kronobergs län

Laboration 3: Urval och skattningar

Laboration 3: Urval och skattningar

Företagsamheten 2017 Kronobergs län

Planeringen av en statistisk undersökning

Inlämningsuppgift 1: Beslutsunderlag, 1,5hp

Lektionsanteckningar 11-12: Normalfördelningen

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

1989, Statistiska centralbyrån ISSN Printed in Sweden Garnisonstryckeriet, Stockholm 1989

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Bortfall i longitudinella undersökningar

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

, s a. , s b. personer från Alingsås och n b

Företagsklimatet i Kronobergs län 2019

Sammanfattande omdöme på företagsklimatet i kommunen Kronobergs län

STATISTIKENS FRAMSTÄLLNING

KVANTITATIV FORSKNING

Företagsklimatet 2016 Kronobergs län

Vem ska undersökas? Vem ska undersökas? Planeringen av en statistisk undersökning. Tre huvudfrågor: Vad ska undersökas? Hur ska undersökningen göras?

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Sammanfattande omdöme på företagsklimatet i kommunen Kronobergs län

Metodeffekter i urvalsundersökningar där deltagarna får välja mellan pappers- och webbenkät

Förra gången (F7) Officiell statistik Befolkningsstatistik. Slumpmässiga urval. Icke-slumpmässiga urval

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.

Samplingfördelningar 1

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

Introduktion Kritiskt förhållningssätt Olika typer av undersökningar

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Tatjana Nahtman Karin Dahmström

F9 SAMPLINGFÖRDELNINGAR (NCT

Studietyper, inferens och konfidensintervall

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

Företagsklimatet i Växjö kommun 2017

Rapport till SPF om vårdval 21 november 2014

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Mer information om arbetsmarknadsläget i Kronobergs län, oktober 2016

Peter Nofors. i Kronobergs län. n dessutom. med förra året. Efterfrågan. procent. ling.

Kvantitativa metoder del 2. Kandidatprogrammet i folkhälsovetenskap, HT -11

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

3.1 Urval ramar, företagsregister. Daniel Thorburn Ekonomisk statistik Höstterminen 2009

Evalvering av Census 2011

Väljarnas förtroende för Miljöpartiet

Ekonomisk statistik Economic statistics. Masterkurs Daniel Thorburn Höstterminen 2010 Stockholms Universitet

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Lokalt företagsklimat Ranking 2017

Företagsamheten 2018 Kronobergs län

Rapport till Den Nya Välfärden om effekterna av halverade arbetsgivaravgifter m.m. februari 2006

Rapport till Företagarna december 2011

Hur skriver man statistikavsnittet i en ansökan?

SCB:s Partisympatiundersökning

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Tatjana Nahtman Karin Dahmström

Tentamen Tillämpad statistik A5 (15hp)

Slumpmässiga urval med Minitab LWn /

Rapport till Den nya välfärden om effekterna av halverade arbetsgivaravgifter augusti/september 2005

Rapport till Unionen om egenföretagare juli 2016

Maj DN/IPSOS JANUARI DECEMBER. POLITISK BAROMETER 22 Maj 2018 David Ahlin, Björn Benzler, Ipsos

Mer information om arbetsmarknadsläget i Kronobergs län, januari 2016

Mer information om arbetsmarknadsläget i Kronobergs län, december 2016

Föreläsning 12: Repetition

Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Mer information om arbetsmarknadsläget i Kronobergs län i slutet av november månad 2013

Föreläsning 11: Mer om jämförelser och inferens

Lager av barrsågtimmer 2010 JO0305

Föreläsning G60 Statistiska metoder

Datainsamling från individer möjligheter & begränsningar

Att välja statistisk metod

Kronobergs samverkansområde för tätortsluft. Kronobergs Luftvårdsförbund Eva Hallgren Larsson

Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1

Rapport till Konsumentföreningen Stockholm december 2003

TMS136. Föreläsning 10

Elevpaneler för longitudinella studier 2014 Panel 8 UF0501 Innehåll

Transkript:

F10 Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval Anta att man vill göra ett urval som täcker ett stort geografiskt område vill använda besöksintervju som insamlingsmetod Praktiskt omöjligt med OSU Tvåstegs gruppurval Slumpmässigt urval av grupper (kluster) Primära urvalsenheter (Pue) Kan dras med exempelvis stratifierat urval/osu PPS = Probability proportional to size Slumpmässigt urval av element inom grupper Kan anpassa det så att alla element i populationen får samma inklusionssannolikhet Vanliga formler för medelvärde och totalvärde kan användas Basurval vanligt att återanvända samma Puer (samt intervjuare) 1

Exempel PPS-urval av Pue (från KD s. 287) Inklusionssannolikheten ska vara proportionell mot något storleksmått Dra ett PPS-urval, från stratumet Kronobergs län, av 3 kommuner där sannolikheten är proportionell mot folkmängden i kommunen Kommun Alvesta Folkmängd 19035 Kumulativ folkmängd 19035 Slumptal 000000-019035 Lessebo 8433 27468 019036-027468 Ljungby 27140 54608 027469-054608 Markaryd 9927 64535 054609-064535 Tingsryd 13484 78019 064536-078019 Uppvidinge 9912 87931 078020-087931 Växjö 73770 161701 087932-161701 Älmhult 15448 177149 161702-177149 Panelundersökningar Syftet med en undersökning kan vara att bestämma förändringen mellan två tidpunkter av en parameter Oberoende tvärsnittsdata Skattningar från två helt separata urval Paneldata Skattningar från samma urval/delvis samma urval Panelen består av de element som är desamma vid de två tidpunkterna Om en panelundersökning sträcker sig under en lång tid brukar den kallas longitudinell undersökning Kohortundersökning: personer födda under en viss tid följs under en period Nackdel med panelundersökningar: bortfallet ökar vartefter tiden går (drop-outs) 2

Panelundersökning Känd undersökning: AKU Totala urvalet varje månad består av 8 paneler Varje panel utfrågas med 3 månaders mellanrum under 2 år Varje månad byts 1/8 av panelen ut mot nya personer Roterande panelundersökning Panelundersökning Man kan få bättre skattningar av förändringar om man använder paneldata jämfört med tvärsnittsdata Varför? 3

Urval från sällsynta populationer Anta att vi vill undersöka en population sällsynt population - som utgör en liten del av en större population Ingen ram Screening Vi kan dra ett stort urval av element från den större populationen med en billig metod och sedan avgöra om elementen tillhör den sällsynta populationen Ex. telefonintervju Urvalet kan ses som ett slumpmässigt urval från den sällsynta populationen Urval från sällsynta populationer Problem: Kan behöva göra ett mycket stort urval Man kan utnyttja hjälpinformation Risk för felklassificering 4

Efterstratifiering Vid stratifierat urval behöver vi en ram sorterad efter stratifieringsvariabeln Anta att vi tror att det finns ett samband mellan undersökningsvariabeln och en viss variabel som vi skulle vilja stratifiera efter för att få precisionsvinst Vi har inte tillgång till denna variabel förrän efter datainsamlingen Vi vet fördelningen för variabeln i populationen Vi kan efterstratifiera för att få högre precision på skattningarna Efterstratifiering Dra ett OSU av element från populationen Klassificera varje element till ett visst stratum En efterstratifierad skattning av populationsmedelvärdet fås som Skattningen är approximativt VVR Variansen för skattningen är approximativt densamma som vid PSU-urval Förutsättning: Det ska finnas minst två observationer i varje stratum 5

Exempel (från KD s 292) OSU av 230 småhus Skatta medelkostnaden i populationen Husets ålder Antal hus i området Antal hus i urvalet Medelkostnad kr < 5 år 500 28 3500 5-10 år 1500 84 6700 > 10 år 2500 128 9200 Uppgift Vi drog tidigare ett OSU på n = 4 från följande population. Vi vet att i populationen finns det 7 kvinnor och 13 män. Dra ett nytt OSU på n = 8. Skatta medellängden i populationen med hjälp av efterstratifiering. Använd kön som stratifieringsvariabel Ram Längd 1. Karin 162 2. Håkan 186 3. Daniel 177 4. Pär 186 5. Hans 171 6. Gösta 169 7. Raul 170 8. Johan 188 9. Anita 168 10. Linda 169 11. Jessica 163 12. Gebre 175 13. Ellinor 159 14. Nicklas 175 15. Lars 168 16. Mikael 167 17. Peter 173 18. Mattias 179 19. Birgitta 157 20. Elisabet 158 Slumptal 18236 87267 96895 84803 83031 27087 56857 87431 93491 55950 72705 61329 29239 95179 00687 21151 26135 75180 11112 80844 43502 87558 51575 43361 58093 23652 67709 64440 6

Kvotskattningar Vi vill använda en hjälpvariabel vid skattning av undersökningsvariabeln Vi känner till medelvärdet eller totalvärdet för hjälpvariabeln i populationen Det finns en positiv korrelation mellan undersökningsvariabeln och hjälpvariabeln Vi kan bilda en kvotskattning för att få en säkrare skattning av medelvärdet eller totalvärdet i populationen (högre precision) Kvotskattningen är inte VVR, men om n > 20 är felet försumbart Kvotskattning av totalvärdet för variabel X i populationen OSU utan återläggning. Parameter: Punktskattning: 7

Kvotskattning av medelvärdet för variabel X i populationen OSU utan återläggning. Parameter: Punktskattning: Exempel (från KD s 294) Vi vill skatta den totala omsättningen i en population av N=100 företag. Vi tror att det råder en positiv korrelation mellan Z=antalet anställda och X=omsättning. Det finns 805 anställda totalt. Genom OSU fås n=20 företag som visar sig ha en medelomsättning på 2.5 milj kr. Antalet anställda var i genomsnitt 8.5. OSU-skattning: Kvot-skattning 8

Uppgift Vi vill skatta totala antalet rökta cigaretter under ett år på ett företag med 200 anställda. Vi tror att det finns en positiv korrelation mellan antal rökta cigaretter och antal sjukdagar. Totala antalet sjukdagar under året är 400. Genom OSU drar vi 30 anställda. I urvalet är medelantalet rökta cigaretter (per person och år) 300 och medelantalet sjukdagar (per person och år) 3. Skatta totala antalet rökta cigaretter under året på företaget genom att a) ej ta hänsyn till hjälpinformation samt b) ta hänsyn till hjälpinformation. a) OSU-skattning: b) Kvot-skattning 9