Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Relevanta dokument
Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Tidigare exempel. Några beteckningar. Stratifierat urval

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urvalsmetoder: Stratifierat urval (kap 9.5)

Ytterligare urvalsmetoder och skattningsmetoder

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

F9 SAMPLINGFÖRDELNINGAR (NCT

TMS136. Föreläsning 10

Exempel i stickprovsteori

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Introduktion till statistik för statsvetare

Föreläsning G60 Statistiska metoder

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 1: Introduktion. Vad är statistik?

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Population. Antal tänder. Urval

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Föreläsning 12: Repetition

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Studietyper, inferens och konfidensintervall

Samplingfördelningar 1

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

, s a. , s b. personer från Alingsås och n b

Matematisk statistik för B, K, N, BME och Kemister

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 7:

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Grundläggande matematisk statistik

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

10. Konfidensintervall vid två oberoende stickprov

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

F9 Konfidensintervall

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Föreläsning 7. Statistikens grunder.

Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

9. Konfidensintervall vid normalfördelning

Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp

Laboration 3: Urval och skattningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Laboration 3: Urval och skattningar

Föreläsning 8: Konfidensintervall

FÖRELÄSNING 8:

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 7: Punktskattningar

Mer om konfidensintervall + repetition

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Föreläsning 11: Mer om jämförelser och inferens

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

SF1901 Sannolikhetsteori och statistik I

Kapitel 9 Egenskaper hos punktskattare

TENTAMEN I STATISTIKENS GRUNDER 2

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

KVANTITATIV FORSKNING

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

TMS136. Föreläsning 7

Föreläsning 4: Konfidensintervall (forts.)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Matematisk statistik KTH. Formelsamling i matematisk statistik

Hur skriver man statistikavsnittet i en ansökan?

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Något om sannolikheter, slumpvariabler och slumpmässiga urval

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Repetitionsföreläsning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Diskussionsproblem för Statistik för ingenjörer

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

TMS136. Föreläsning 11

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Transkript:

Urval F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4) Ursprung: Linda Wänström Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta inte möjlig För dyrt Tar för lång tid Urvalsundersökning innehåller ofta mindre totalt fel Vi är intresserade av att skatta en parameter i med hjälp av en skattning från urvalet Hur ska urvalet dras? Slumpmässiga urval (sannolikhetsurval) Varje element i skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald. Urvalsenheten kan vara det enskilda elementet eller grupper av element Vi ska titta på: Obundet slumpmässigt urval (OSU) Stratifierat urval Systematiskt urval Enstegs gruppurval (klusterurval) Fördelar med slumpmässiga urval Vi kan använda inferensteori för att dra slutsatser från stickprovet (urvalet) till Vi kan beräkna VVR skattningar av okända parametrar Vi kan mäta osäkerheten i skattningarna 1

Icke-slumpmässiga urval: Några element har 0 sannolikhet att väljas och/eller några element har en okänd sannolikhet att väljas Kan finnas tillfällen då de kan vara motiverade, men man får inte låtsas att urvalet är draget slumpmässigt och dra slutsatser till som om så vore fallet. Kvoturval ( quota sampling ) Intervjuaren väljer respondenter; val utifrån egna preferenser. Vissa kvoter skall fyllas så att urvalet med avseende på vissa bakgrundsvariabler blir som i. Icke-slumpmässiga urval forts. Användning av telefonkatalogen som ram Frivilliga ( voluntary ) svarande/försökspersoner ( självval ) annonsering vid läkemedelsstudier svar på webbenkäter Bekvämlighetsurval ( convenience sampling ) kvalitetskontroll då man tar de översta i ett parti varor. val av vänner och släktingar som får svara svar från hotellgäster/resenärer på en enkät som ligger på rummet Icke-slumpmässiga urval forts. Typiska element ( purposive sampling, judgement sampling ) Kan vara element valda subjektivt så att (man tror) att alla kategorier blir representerade för att t ex snabbt pejla opinionen; typiska element. Även vid provundersökningar. Snöbollsurval då ingen ram finns över personerna. Utgå från en känd grupp av personer med en speciell egenskap. Fråga om vilka de i sin tur känner som har denna egenskap osv; man fångar in allt större del av. Icke-slumpmässiga urval forts. Risker med icke-slumpmässiga urval Systematiska fel i slutsatser För bestämning av bortfallets storlek krävs en ram; här blir bortfallet dolt och okänt. 2

Repetition Vi vill välja ett så bra urvalsförfarande som möjligt Egenskaper hos en punkskattning Skattning (t.ex. punktskattning): Slumpvariabel (stokastisk variabel) Avvikelse: VVR skattning: Repetition forts. Varians för skattningen: Standardavvikelsen för skattningen kan kallas medelfelet (standard error) Repetition forts. Om en skattning har en liten standardavvikelse/liten osäkerhet har den hög precision Mått på osäkerheten i skattningen: Samplingfördelning Repetition forts. Centrala gränsvärdessatsen 3

Urval Vi vill alltså göra en så bra urvalsundersökning som möjligt. Vi kan påverka: Hur ramen ska konstrueras Hur urvalet ska dras Hur stort urvalet ska vara Hur punktskattningen av den okända parametern ska bestämmas Vi vill välja en urvalsdesign som är så bra som möjligt till en given kostnad Bra: hög precision OSU Anta att vi ska dra n element från en population med N st. OSU: Obundet Slumpmässigt Urval Varje element har samma sannolikhet att bli valt och denna inklusionssannolikhet är n/n Varje tänkbart stickprov om n element har samma sannolikhet Vi styr inte urvalet. Det är slumpen som styr vilka element som väljs Med återläggning Dragningarna blir oberoende av varandra Utan återläggning Skattning av medelvärdet i Punktskattning: Skattade variansen för skattningen: OSU med återläggning Konfidensintervall för µ OSU utan återläggning: Om n > 30 fås, enligt CGS, ett 95%igt k.i. som: OSU utan återläggning 4

Skattning av totalvärdet i Punktskattning: Skattade variansen för skattningen: OSU med återläggning Exempel X = Månadslön (i 1000-tals kr.): N = 500, n = 35, x = 25, s 2 = 20 Ett 95%igt k.i. för medellön µ blir Med återläggning Utan återläggning OSU utan återläggning Exempel X = Månadslön (i 1000-tals kr.): N = 500, n = 35, x = 25, s 2 = 20 Ett 95%igt k.i. för totallön τ blir Med återläggning Skattning av andel (proportion) i Punktskattning: Skattade variansen för skattningen: OSU med återläggning Utan återläggning OSU utan återläggning 5

Exempel X = 1 om månadslön > 30 000, 0 annars N = 500, n = 35, p = 0.4 Ett 95%igt k.i. för andelen (proportionen) P blir Med återläggning Skattning av totala antalet ettor i Punktskattning: Skattade variansen för skattningen: OSU med återläggning Utan återläggning OSU utan återläggning Exempel X = 1 om månadslön > 30 000, 0 annars N = 500, n = 35, p = 0.4 Ett 95%igt k.i. för A blir Med återläggning Bestämning av stickprovsstorlek n Val av stickprovsstorlek n beror på vilken precision på skattning vi vill ha. Vi kan tex säga att standardavvikelsen för skattningen ej får överskrida ett visst tal D. Exempel: Skattning av medelvärde: Utan återläggning Problem? 6

Beräkning av stickprovsstorlek n Vid skattning av medelvärde µ, OSU utan återläggning, där vi vill att standardavvikelsen för skattningen ska vara högst D Vid skattning av proportion P, OSU utan återläggning, där vi vill att standardavvikelsen för skattningen ska vara högst D Exempel Anta att vi vill skatta µ, medellön på ett viss företag, med N = 500 anställda, och tror att variansen på företaget ligger runt σ 2 = 25. Vi kommer dra ett OSU utan återläggning och vill att felmarginalen ska vara högst 2 OSU i praktiken Ram Identifiering av element Slumpmekanism Slumptalstabell Datoriserad slumptalsgenerator Exempel: vi är intresserade av att skatta medellönen i en population Ram Slumptal 1. Fredrik 26135 75180 11112 80844 2. Johan 43502 87558 51575 43361 3. Ann-Britt 58093 23652 67709 64440 4. Gunnar 18236 87267 96895 84803 5. Mona 83031 27087 56857 87431 6. Peter 93491 55950 72705 61329 7. Daniel 8. Per 29239 95179 00687 21151 9. Katarina 10. Carl Säg att vi vill dra ett OSU utan återläggning av n = 30 personer från N = 70 personer*. Vi väljer 2- siffriga slumptal: 70. Anders *Ofta har vi en mycket större population än N = 70 och vi tar ofta ett större stickprov än n = 30. 7

Uppgift Antag att vi har en ram med N=20 anställda på statistiska institutionen. Vi vill ha ett urval med n=4 anställda. Dra ett OSU utan återläggning från följande ram med hjälp av följande slumptal. Skatta medellängden i samt beräkna ett 95%igt konfidensintervall runt skattningen Ram Längd 1. Karin 162 2. Håkan 186 3. Daniel 177 4. Pär 186 5. Hans 171 6. Gösta 169 7. Raul 170 8. Johan 188 9. Anita 168 10. Linda 169 11. Jessica 163 12. Gebre 175 13. Ellinor 159 14. Nicklas 175 15. Lars 168 16. Mikael 167 17. Peter 173 18. Mattias 179 19. Birgitta 157 20. Elisabet 158 Slumptal 18236 87267 96895 84803 83031 27087 56857 87431 93491 55950 72705 61329 29239 95179 00687 21151 26135 75180 11112 80844 43502 87558 51575 43361 58093 23652 67709 64440 8