Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Relevanta dokument
Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

Tidigare exempel. Några beteckningar. Stratifierat urval

Urvalsmetoder: Stratifierat urval (kap 9.5)

Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Föreläsning 4. Kapitel 5, sid Stickprovsteori

F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval

F9 SAMPLINGFÖRDELNINGAR (NCT

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Exempel i stickprovsteori

Introduktion till statistik för statsvetare

Ytterligare urvalsmetoder och skattningsmetoder

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

TMS136. Föreläsning 10

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Föreläsning G60 Statistiska metoder

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Population. Antal tänder. Urval

Lektionsanteckningar 11-12: Normalfördelningen

Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval

Föreläsning 1: Introduktion. Vad är statistik?

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Samplingfördelningar 1

Studietyper, inferens och konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 12: Repetition

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

, s a. , s b. personer från Alingsås och n b

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

FÖRELÄSNING 7:

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

F9 Konfidensintervall

10. Konfidensintervall vid två oberoende stickprov

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Föreläsning 7: Punktskattningar

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 7: Punktskattningar

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1

9. Konfidensintervall vid normalfördelning

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

Föreläsning 7. Statistikens grunder.

FÖRELÄSNING 8:

Föreläsning 7: Punktskattningar

Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp

Mer om konfidensintervall + repetition

Föreläsning 11: Mer om jämförelser och inferens

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Laboration 3: Urval och skattningar

Kapitel 9 Egenskaper hos punktskattare

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Laboration 3: Urval och skattningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

KVANTITATIV FORSKNING

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Föreläsning 8: Konfidensintervall

Föreläsning 4: Konfidensintervall (forts.)

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

SF1901 Sannolikhetsteori och statistik I

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

TENTAMEN I STATISTIKENS GRUNDER 2

Diskussionsproblem för Statistik för ingenjörer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

TMS136. Föreläsning 11

F10 Problemlösning och mer om konfidensintervall

Grundläggande matematisk statistik

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

TMS136. Föreläsning 7

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Thomas Önskog 28/

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Repetitionsföreläsning

Transkript:

F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4)

Urval Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta inte möjlig För dyrt Tar för lång tid Urvalsundersökning innehåller ofta mindre totalt fel Vi är intresserade av att skatta en parameter i populationen med hjälp av en skattning från urvalet Hur ska urvalet dras?

Slumpmässiga urval (sannolikhetsurval) Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald. Urvalsenheten kan vara det enskilda elementet eller grupper av element Vi ska titta på: Obundet slumpmässigt urval (OSU) Stratifierat urval Systematiskt urval Enstegs gruppurval (klusterurval)

Fördelar med slumpmässiga urval Vi kan använda inferensteori för att dra slutsatser från stickprovet (urvalet) till populationen Vi kan beräkna VVR skattningar av okända parametrar Vi kan mäta osäkerheten i skattningarna

Icke-slumpmässiga urval: Några element har 0 sannolikhet att väljas och/eller några element har en okänd sannolikhet att väljas Kan finnas tillfällen då de kan vara motiverade, men man får inte låtsas att urvalet är draget slumpmässigt och dra slutsatser till populationen som om så vore fallet. Kvoturval ( quota sampling ) Intervjuaren väljer respondenter; val utifrån egna preferenser. Vissa kvoter skall fyllas så att urvalet med avseende på vissa bakgrundsvariabler blir som i populationen.

Icke-slumpmässiga urval forts. Användning av telefonkatalogen som ram Frivilliga ( voluntary ) svarande/försökspersoner ( självval ) annonsering vid läkemedelsstudier svar på webbenkäter Bekvämlighetsurval ( convenience sampling ) kvalitetskontroll då man tar de översta i ett parti varor. val av vänner och släktingar som får svara svar från hotellgäster/resenärer på en enkät som ligger på rummet

Icke-slumpmässiga urval forts. Typiska element ( purposive sampling, judgement sampling ) Kan vara element valda subjektivt så att (man tror) att alla kategorier blir representerade för att t ex snabbt pejla opinionen; typiska element. Även vid provundersökningar. Snöbollsurval då ingen ram finns över personerna. Utgå från en känd grupp av personer med en speciell egenskap. Fråga om vilka de i sin tur känner som har denna egenskap osv; man fångar in allt större del av populationen.

Icke-slumpmässiga urval forts. Risker med icke-slumpmässiga urval Systematiska fel i slutsatser För bestämning av bortfallets storlek krävs en ram; här blir bortfallet dolt och okänt.

Repetition Vi vill välja ett så bra urvalsförfarande som möjligt Egenskaper hos en punktskattning Parameter: Skattning (t.ex. punktskattning): Slumpvariabel (stokastisk variabel) Avvikelse: VVR skattning:

Repetition forts. Varians för skattningen: Standardavvikelsen för skattningen kan kallas medelfelet (standard error)

Repetition forts. Om en skattning har en liten standardavvikelse/liten osäkerhet har den hög precision Mått på osäkerheten i skattningen: Centrala gränsvärdessatsen

Samplingfördelning Repetition forts.

Urval Vi vill alltså göra en så bra urvalsundersökning som möjligt. Vi kan påverka: Hur ramen ska konstrueras Hur urvalet ska dras Hur stort urvalet ska vara Hur punktskattningen av den okända parametern ska bestämmas Vi vill välja en urvalsdesign som är så bra som möjligt till en given kostnad Bra: hög precision

OSU Anta att vi ska dra n element från en population med N st. OSU: Obundet Slumpmässigt Urval Varje element har samma sannolikhet att bli valt och denna inklusionssannolikhet är n/n Varje tänkbart stickprov om n element har samma sannolikhet Vi styr inte urvalet. Det är slumpen som styr vilka element som väljs Med återläggning Dragningarna blir oberoende av varandra Utan återläggning

Skattning av medelvärdet i Parameter: µ Punktskattning: Skattade variansen för skattningen: OSU med återläggning OSU utan återläggning populationen x Vˆ Vˆ n = i = 1 ( X ) ( X ) n x 1 = 1 N i = 1 n N 2 s n 2 s n

Konfidensintervall för µ OSU utan återläggning: Om n > 30 fås, enligt CGS, ett 95%igt k.i. som:

Parameter: Skattning av totalvärdet i Punktskattning: populationen Skattade variansen för skattningen: OSU med återläggning OSU utan återläggning

Exempel X = Månadslön (i 1000-tals kr.): N = 500, n = 35,, s 2 = 20 Ett 95%igt k.i. för medellön µ blir Med återläggning x = 25 Utan återläggning

Exempel X = Månadslön (i 1000-tals kr.): N = 500, n = 35,, s 2 = 20 Ett 95%igt k.i. för totallön τ blir Med återläggning x = 25 Utan återläggning

Skattning av andel (proportion) i Parameter: Punktskattning: populationen Skattade variansen för skattningen: OSU med återläggning OSU utan återläggning

Exempel X = 1 om månadslön > 30 000, 0 annars N = 500, n = 35, p = 0.4 Ett 95%igt k.i. för andelen (proportionen) P blir Med återläggning Utan återläggning

Skattning av totala antalet ettor i Parameter: Punktskattning: populationen Skattade variansen för skattningen: OSU med återläggning OSU utan återläggning

Exempel X = 1 om månadslön > 30 000, 0 annars N = 500, n = 35, p = 0.4 Ett 95%igt k.i. för A blir Med återläggning Utan återläggning

Bestämning av stickprovsstorlek n Val av stickprovsstorlek n beror på vilken precision på skattning vi vill ha. Vi kan tex säga att standardavvikelsen för skattningen ej får överskrida ett visst tal D. Exempel: Skattning av medelvärde: Problem?

Beräkning av stickprovsstorlek n Vid skattning av medelvärde µ, OSU utan återläggning, där vi vill att standardavvikelsen för skattningen ska vara högst D Vid skattning av proportion P, OSU utan återläggning, där vi vill att standardavvikelsen för skattningen ska vara högst D

Exempel Anta att vi vill skatta µ, medellön på ett viss företag, med N = 500 anställda, och tror att variansen på företaget ligger runt σ 2 = 25. Vi kommer dra ett OSU utan återläggning och vill att felmarginalen ska vara högst 2

OSU i praktiken Ram Identifiering av element Slumpmekanism Slumptalstabell Datoriserad slumptalsgenerator

Exempel: vi är intresserade av att skatta medellönen i en population Ram Slumptal 1. Fredrik 26135 75180 11112 80844 2. Johan 43502 87558 51575 43361 3. Ann-Britt 58093 23652 67709 64440 4. Gunnar 18236 87267 96895 84803 5. Mona 83031 27087 56857 87431 6. Peter 93491 55950 72705 61329 7. Daniel 8. Per 29239 95179 00687 21151 9. Katarina 10. Carl 70. Anders Säg att vi vill dra ett OSU utan återläggning av n = 30 personer från N = 70 personer*. Vi väljer 2- siffriga slumptal: *Ofta har vi en mycket större population än N = 70 och vi tar ofta ett större stickprov än n = 30.