Urvalsmetoder: Stratifierat urval (kap 9.5)

Relevanta dokument
Tidigare exempel. Några beteckningar. Stratifierat urval

F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Ytterligare urvalsmetoder och skattningsmetoder

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Introduktion till statistik för statsvetare

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Exempel i stickprovsteori

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Laboration 3: Urval och skattningar

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Laboration 3: Urval och skattningar

Föreläsning G60 Statistiska metoder

TMS136. Föreläsning 10

Lektionsanteckningar 11-12: Normalfördelningen

F9 SAMPLINGFÖRDELNINGAR (NCT

STATISTIKENS FRAMSTÄLLNING

Studietyper, inferens och konfidensintervall

Föreläsning 1: Introduktion. Vad är statistik?

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Tentamen Tillämpad statistik A5 (15hp)

När gör hjälpinformation mest nytta - vid urval eller estimering?

Lager av barrsågtimmer 2010 JO0305

, s a. , s b. personer från Alingsås och n b

Ekonomisk statistik Economic statistics. Masterkurs Daniel Thorburn Höstterminen 2010 Stockholms Universitet

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Population. Antal tänder. Urval

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning 7: Punktskattningar

Inlämningsuppgift 1: Beslutsunderlag, 1,5hp

Föreläsning 12: Repetition

1989, Statistiska centralbyrån ISSN Printed in Sweden Garnisonstryckeriet, Stockholm 1989

Samplingfördelningar 1

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning 5. Kapitel 6, sid Inferens om en population

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Föreläsning 7: Punktskattningar

Urvalsökningar. Precisionen i en skattning är normalt proportionell mot 1/ n där n är urvalsstorleken

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 8:

¼ = 1 k = n N. = n. ¼ = 1 k. N n (n 1) = N n ^p^q. n (n 1) = N n n^p (1 ^p)

Lager av barrsågtimmer 2001

Bortfall i longitudinella undersökningar

Metodeffekter i urvalsundersökningar där deltagarna får välja mellan pappers- och webbenkät

Slumpmässiga urval med Minitab LWn /

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Hushållens icke-vinstdrivande organisationer 2005

Läs noggrant informationen nedan innan du börjar skriva tentamen

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.

SF1901 Sannolikhetsteori och statistik I

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning G70 Statistik A

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Kompendium med extra övningsuppgifter

Kalibreringsrapport. Utländska doktorander

3.1 Urval ramar, företagsregister. Daniel Thorburn Ekonomisk statistik Höstterminen 2009

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Jörgen Säve-Söderbergh

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Konfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta

F10 Problemlösning och mer om konfidensintervall

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

TMS136. Föreläsning 11

Föreläsning 7: Punktskattningar

KVANTITATIV FORSKNING

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Grundläggande matematisk statistik

Hyror i bostadslägenheter (HiB)

FÖRELÄSNING 7:

Statistik RAPPORT. Bodil Mortensson Lena Otterskog Gunnel W ahlstedt. Statistiska centralbyrån Statistics Sweden Potatis konsumtion och fritidsodling

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

4 Diskret stokastisk variabel

Punktskattning 1 Ett exempel

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F22, Icke-parametriska metoder.

Lösningstips till de flesta uppgifterna i fjärde upplagan av Statistisk dataanalys

Transkript:

F4 Urvalsmetoder: Stratifierat urval (kap 9.5)

Tidigare exempel Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler till lön är kön, ålder, anställningsform, antal år i anställning osv. OSU kan pga slumpen ge ett urval med för många män exempelvis medellönen kan då överskattas

Stratifierat urval Populationen delas in i L st. strata men N i element, i = 1,, L Från varje stratum drar man ett slumpmässigt urval av n i element Alla strata blir representerade i stickprovet Inklusionssannolikhet: n i /N i

Några beteckningar

Skattning av medelvärdet i populationen Stratifierat urval med OSU i varje stratum: Parameter: Punktskattning: Skattade variansen för skattningen:

Skattning av totalvärdet i populationen Stratifierat urval med OSU i varje stratum: Parameter: Punktskattning: Skattade variansen för skattningen:

Exemplet forts. Vi vet att kvinnor och män har olika lön Det finns ett samband mellan kön och lön Dela in populationen i två grupper, kvinnor och män, och dra ett OSU av personer från varje grupp (=från varje stratum) Kön är då en stratifieringsvariabel

Stratum Kvinnor Män N i 200 300 Exempel n i?? Totalt N=500 n=35 Vi har en population med 200 kvinnor och 300 män och vill dra ett urval av n = 35 personer Hur ska vi fördela n=35 mellan grupperna, dvs hur många kvinnor ska väljas och hur många män? Hur ska urvalet allokeras? Vi kan exempelvis göra ett proportionellt stratifierat urval (PSU)

Proportionellt stratifierat urval (PSU) Fördela urvalet i samma proportioner som strata förhåller sig till hela populationen 200 n1 = 35 = 35 0,4 = 14 500 n 300 = 35 = 35 0,6 500 2 = 21 Vi kan välja 14 kvinnor och 21 män genom OSU från varje stratum Generellt väljer vi ni element från stratum i enligt följande: n = n i N N i

Skatta medellön, µ Stratum N i n i x i s i Kvinnor 200 14 23 4 Män 300 21 26 3.5 Väg ihop skattningarna från respektive stratum x str = 200 23 + 300 26 500 = 24.8 Variansen för skattningen blir:

Skattning av andel (proportion) i populationen Stratifierat urval med OSU utan återläggning från varje stratum Parameter: Punktskattning: Skattade variansen för skattningen:

Stratifierat urval Vi kan få högre precision (lägre varians) i skattningen vid stratifierat urval jämfört med OSU-urval När får vi det? När vi delar in populationen i strata (grupper) som är homogena med avseende på undersökningsvariabeln Om grupperna är lika (homogena) inom sig, så får vi lägre varians inom varje grupp (stratum) Målet när vi delar in populationen i strata är att de ska bli så lika inom strata som möjligt och så olika mellan strata (heterogena) som möjligt med avseende på undersökningsvariabeln

Stratifierat urval Att välja antal strata och stratumgränser Hur ska vi välja antal strata samt stratumgränser så strata blir så homogena som möjligt? Ju fler strata desto mindre precisionsvinst Stratumgränser? Om undersökningsvariabeln är lön och vi vet att det finns relativt tydliga grupperingar med höga, mellan och låga löner kan vi försöka bilda strata utifrån dessa grupper. Problem?

Problem? Vi vill ha homogena strata med avseende på undersökningsvariabeln ex lön och vill dela in populationen så att vi får ett strata med låg lön och ett med hög lön alternativt ett med låg, ett med mellan och ett med hög lön. Vi har inte tillgång till värden på undersökningsvariabeln lön! Vi måste ta hjälp av någon stratifieringsvariabel (hjälpvariabel) som vi tror har ett SAMBAND med undersökningsvariabeln Vi måste ha en ram sorterad efter stratifieringsvariabeln Om vi tror att kön har ett samband med lön kan vi dela in populationen i två strata: män och kvinnor. Om vi tror att ålder har ett samband med lön kan vi försöka hitta homogena strata med avseende på ålder (stratifieringsvariabeln) och om det finns ett samband mellan ålder och lön så hoppas vi att strata även blir homogena med avseende på lön (undersökningsvariabeln)

Planering av ett stratifierat urval Vilken stratifieringsvariabel ska väljas? Hur många strata? Var ska stratumgränserna dras? Hur ska allokeringen göras? Hur ska stickprovet fördelas?

Allokering Vi drar ett OSU utan återläggning ur varje stratum hur ska vi välja hur många element som ska dras från varje stratum? Proportionell allokering Proportionellt stratifierat urval (PSU) Välj proportionellt sett lika många element ur varje stratum som stratumet utgör av populationen Ex om stratum 1 utgör 30% av populationen välj 30% av stickprovsstorleken från stratum 1 Se till att alltid dra minst 2 element från varje stratum! Om ett stratum är litet kan man istället för ett PSU välja att göra en totalundersökning i detta stratum

Allokering Vi kan istället för PSU välja att dra lika många element från varje stratum Exempelvis då vi är intresserade av att göra gruppjämförelser såsom att jämföra mäns och kvinnors medellöner Optimal allokering (Neyman allokering) Variansen för skattningen minimeras Dra fler element från stratum med större varians och färre från stratum med mindre varians n i fås från följande: