Tidigare exempel. Några beteckningar. Stratifierat urval

Relevanta dokument
Urvalsmetoder: Stratifierat urval (kap 9.5)

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval

Ytterligare urvalsmetoder och skattningsmetoder

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Introduktion till statistik för statsvetare

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Exempel i stickprovsteori

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Laboration 3: Urval och skattningar

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Laboration 3: Urval och skattningar

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Lektionsanteckningar 11-12: Normalfördelningen

Studietyper, inferens och konfidensintervall

Ekonomisk statistik Economic statistics. Masterkurs Daniel Thorburn Höstterminen 2010 Stockholms Universitet

Föreläsning 1: Introduktion. Vad är statistik?

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Föreläsning G60 Statistiska metoder

, s a. , s b. personer från Alingsås och n b

Tentamen Tillämpad statistik A5 (15hp)

F9 SAMPLINGFÖRDELNINGAR (NCT

När gör hjälpinformation mest nytta - vid urval eller estimering?

Lager av barrsågtimmer 2010 JO0305

Slumpmässiga urval med Minitab LWn /

TMS136. Föreläsning 10

1989, Statistiska centralbyrån ISSN Printed in Sweden Garnisonstryckeriet, Stockholm 1989

STATISTIKENS FRAMSTÄLLNING

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Hushållens icke-vinstdrivande organisationer 2005

Lager av barrsågtimmer 2001

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Population. Antal tänder. Urval

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Inlämningsuppgift 1: Beslutsunderlag, 1,5hp

Konfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta

Bortfall i longitudinella undersökningar

Hur skriver man statistikavsnittet i en ansökan?

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

3.1 Urval ramar, företagsregister. Daniel Thorburn Ekonomisk statistik Höstterminen 2009

FÖRELÄSNING 8:

¼ = 1 k = n N. = n. ¼ = 1 k. N n (n 1) = N n ^p^q. n (n 1) = N n n^p (1 ^p)

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Metodeffekter i urvalsundersökningar där deltagarna får välja mellan pappers- och webbenkät

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning G60 Statistiska metoder

Samplingfördelningar 1

Föreläsning G70 Statistik A

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

F22, Icke-parametriska metoder.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Repetitionsföreläsning

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Monte Carlo-simulering. EG2205 Föreläsning 15 18, vårterminen 2015 Mikael Amelin

Modellprognos för konjunkturlönestatistikens definitiva utfall för mars 2016-februari 2017

Urvalsökningar. Precisionen i en skattning är normalt proportionell mot 1/ n där n är urvalsstorleken

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

TMS136. Föreläsning 11

Modellprognos för konjunkturlönestatistikens definitiva utfall december 2016-november 2017

TMS136. Föreläsning 13

TENTAMEN I STATISTIKENS GRUNDER

Kommun och landsting 2016

Jörgen Säve-Söderbergh

FACIT (korrekta svar i röd fetstil)

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Kalibreringsrapport. Utländska doktorander

Modellprognos för konjunkturlönestatistikens definitiva utfall januari 2018 december 2018

Modellprognos för konjunkturlönestatistikens definitiva utfall för oktober 2017 september 2018

Modellprognos för konjunkturlönestatistikens definitiva utfall april 2017-mars 2018

KVANTITATIV FORSKNING

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning 7: Punktskattningar

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

FÖRELÄSNING 7:

F3 Introduktion Stickprov

Föreläsning 7: Punktskattningar

STATISTIKENS FRAMSTÄLLNING

STATISTISK ANALYS AV KOMPLEXA DATA

Drivmedel. STATISTISKA CENTRALBYRÅN Pm 1(5) MP/PR P. Nilsson M.Ribe

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Transkript:

Tidigare exempel F4 Urvalsmetoder: (kap 9.5) Ursprung: Linda Wänström Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler till lön är kön, ålder, anställningsform, antal år i anställning osv. OSU kan pga slumpen ge ett urval med för många män exempelvis medellönen kan då överskattas Några beteckningar Populationen delas in i L st. strata men N i element, i = 1,, L Från varje stratum drar man ett slumpmässigt urval av n i element Alla strata blir representerade i stickprovet Inklusionssannolikhet: n i /N i 1

Skattning av medelvärdet i med OSU i varje stratum: Skattning av totalvärdet i med OSU i varje stratum: Exemplet forts. Vi vet att kvinnor och män har olika lön Det finns ett samband mellan kön och lön Dela in i två grupper, kvinnor och män, och dra ett OSU av personer från varje grupp (=från varje stratum) Kön är då en stratifieringsvariabel Stratum Kvinnor Män Totalt N i 200 300 N=500 Exempel n i?? n=35 Vi har en population med 200 kvinnor och 300 män och vill dra ett urval av n = 35 personer Hur ska vi fördela n=35 mellan grupperna, dvs hur många kvinnor ska väljas och hur många män? Hur ska urvalet allokeras? Vi kan exempelvis göra ett proportionellt stratifierat urval (PSU) 2

Proportionellt stratifierat urval (PSU) Fördela urvalet i samma proportioner som strata förhåller sig till hela 200 n = 35 = 35 0,4 500 1 = 14 300 n2 = 35 = 35 0,6 = 21 500 Vi kan välja 14 kvinnor och 21 män genom OSU från varje stratum Generellt väljer vi ni element från stratum i enligt följande: Ni ni = n N Stratum Skatta medellön, µ N i n i x i s i Kvinnor 200 14 23 4 Män 300 21 26 3.5 Väg ihop skattningarna från respektive stratum Variansen för skattningen blir: Skattning av andel (proportion) i med OSU utan återläggning från varje stratum Vi kan få högre precision (lägre varians) i skattningen vid stratifierat urval jämfört med OSU-urval När får vi det? När vi delar in i strata (grupper) som är homogena med avseende på undersökningsvariabeln Om grupperna är lika (homogena) inom sig, så får vi lägre varians inom varje grupp (stratum) Målet när vi delar in i strata är att de ska bli så lika inom strata som möjligt och så olika mellan strata (heterogena) som möjligt med avseende på undersökningsvariabeln 3

Att välja antal strata och stratumgränser Hur ska vi välja antal strata samt stratumgränser så strata blir så homogena som möjligt? Ju fler strata desto mindre precisionsvinst Stratumgränser? Om undersökningsvariabeln är lön och vi vet att det finns relativt tydliga grupperingar med höga, mellan och låga löner kan vi försöka bilda strata utifrån dessa grupper. Problem? Problem? Vi vill ha homogena strata med avseende på undersökningsvariabeln ex lön och vill dela in så att vi får ett strata med låg lön och ett med hög lön alternativt ett med låg, ett med mellan och ett med hög lön. Vi har inte tillgång till värden på undersökningsvariabeln lön! Vi måste ta hjälp av någon stratifieringsvariabel (hjälpvariabel) som vi tror har ett SAMBAND med undersökningsvariabeln Vi måste ha en ram sorterad efter stratifieringsvariabeln Om vi tror att kön har ett samband med lön kan vi dela in i två strata: män och kvinnor. Om vi tror att ålder har ett samband med lön kan vi försöka hitta homogena strata med avseende på ålder (stratifieringsvariabeln) och om det finns ett samband mellan ålder och lön så hoppas vi att strata även blir homogena med avseende på lön (undersökningsvariabeln) Planering av ett stratifierat urval Vilken stratifieringsvariabel ska väljas? Hur många strata? Var ska stratumgränserna dras? Hur ska allokeringen göras? Hur ska stickprovet fördelas? Allokering Vi drar ett OSU utan återläggning ur varje stratum hur ska vi välja hur många element som ska dras från varje stratum? Proportionell allokering Proportionellt stratifierat urval (PSU) Välj proportionellt sett lika många element ur varje stratum som stratumet utgör av Ex om stratum 1 utgör 30% av välj 30% av stickprovsstorleken från stratum 1 Se till att alltid dra minst 2 element från varje stratum! Om ett stratum är litet kan man istället för ett PSU välja att göra en totalundersökning i detta stratum 4

Allokering Vi kan istället för PSU välja att dra lika många element från varje stratum Exempelvis då vi är intresserade av att göra gruppjämförelser såsom att jämföra mäns och kvinnors medellöner Optimal allokering (Neyman allokering) Variansen för skattningen minimeras Dra fler element från stratum med större varians och färre från stratum med mindre varians n i fås från följande: Ram Slumptal 1. Fredrik 26135 75180 11112 80844 2. Johan 43502 87558 51575 43361 3. Ann-Britt 58093 23652 67709 64440 4. Gunnar 18236 87267 96895 84803 5. Mona 83031 27087 56857 87431 6. Peter 93491 55950 72705 61329 7. Daniel 8. Per 29239 95179 00687 21151 9. Katarina Säg att vi vill dra ett OSU av n 10. Carl 1 = 9 kvinnor från N 1 = 20 kvinnor och n 2 = 21 män av N 2 = 50 män. 70. Anders Uppgift Antag att vi har en ram med N=20 anställda på statistiska institutionen. Vi vill ha ett urval med n=4 anställda. Dra ett stratifierat urval (efter kön) från följande ram med hjälp av följande slumptal. Skatta medellängden i samt beräkna ett 95%igt k.i. runt skattningen. Ram Längd 1. Karin 162 2. Håkan 186 3. Daniel 177 4. Pär 186 5. Hans 171 6. Gösta 169 7. Raul 170 8. Johan 188 9. Anita 168 10. Linda 169 11. Jessica 163 12. Gebre 175 13. Ellinor 159 14. Nicklas 175 15. Lars 168 16. Mikael 167 17. Peter 173 18. Mattias 179 19. Birgitta 157 20. Elisabet 158 Slumptal 18236 87267 96895 84803 83031 27087 56857 87431 93491 55950 72705 61329 29239 95179 00687 21151 26135 75180 11112 80844 43502 87558 51575 43361 58093 23652 67709 64440 5