Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Relevanta dokument
Föreläsning G04: Surveymetodik

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

F10 ESTIMATION (NCT )

Föreläsning G70 Statistik A

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

S0005M V18, Föreläsning 10

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

2. Konfidensintervall för skillnaden mellan två proportioner.

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

1. Test av anpassning.

Föreläsning G70 Statistik A

Introduktion till statistik för statsvetare

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Grundläggande matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i matematisk statistik

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

================================================

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

a) Beräkna E (W ). (2 p)

Föreläsning 2: Punktskattningar

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

TMS136: Dataanalys och statistik Tentamen med lösningar

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Lycka till! I(X i t) 1 om A 0 annars I(A) =

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

θx θ 1 om 0 x 1 f(x) = 0 annars

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

Datorövning 2 Fördelningar inom säkerhetsanalys

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

4.2.3 Normalfördelningen

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

Lösningsförslag

Datorövning 2 Fördelningar inom säkerhetsanalys

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Borel-Cantellis sats och stora talens lag

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Genomsnittligt sökdjup i binära sökträd

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Föreskrift. om publicering av nyckeltal för elnätsverksamheten. Utfärdad i Helsingfors den 2. december 2005

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Avd. Matematisk statistik

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

TENTAMEN I MATEMATISK STATISTIK

Induktion och Binomialsatsen. Vi fortsätter att visa hur matematiska påståenden bevisas med induktion.

Mätbar vetskap om nuläget och tydliga målbilder om framtiden. Genomför en INDICATOR självvärdering och nulägesanalys inom tre veckor

Lösningar och kommentarer till uppgifter i 1.1

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Tentamen i Sannolikhetsteori III 13 januari 2000

STATISTIK FÖR LÄKARSTUDENTER

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Armin Halilovic: EXTRA ÖVNINGAR

Sannolikhetslära. c 2015 Eric Järpe Högskolan i Halmstad

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

Kompletterande kurslitteratur om serier

Några grundläggande begrepp och termer i statistikteorin

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Kundundersökning Kommuninfo/ Kuntainfo: Enkät om kommunens informationsverksamhet

Transkript:

Föreläsig 5 732G04 Surveymetodik 732G19 Utredigskuskap I

Dages föreläsig Klusterurval Estegs klusterurval Tvåstegs klusterurval Klusterurval med PPS 2

Klusterurval De urvalsdesiger som diskuterats hittills baseras på att vi slumpar ut eskilda elemet (exempelvis persoer) ur populatioe och drar slutsatser om dessa. Iblad vill vi dock av tids- eller kostadsskäl geeralisera urvalsförfaradet till att omfatta grupper av elemet. Estegs klusterurval: vi delar i populatioe i grupper kluster som vi seda slumpmässigt väljer ut ågra av. Seda udersöker vi alla eheter i de utvalda klustre (dessa kallas primära eheter). Exempel: Vi är itresserade av iodeklassares situatio i skola. Vi väljer slumpmässigt ut ett atal kommuer i ladet, och udersöker iodeklassara i dessa kommuer. Tvåstegs klusterurval: vi delar först i populatioe i kluster som vi slumpmässigt väljer ut ågra av (primära eheter). Seda gör vi slumpmässiga urval iom respektive kluster och udersöker dessa utvalda elemet (sekudära eheter). Exempel: Det ises att det fis måga iodeklasser i varje kommu. Därför drar ma i ett adra steg ett OSU om iodeklasser i varje utvald kommu och udersöker elevera i dessa klasser. 3

Defiitioer N: atal kluster i populatioe M 0 : atal elemet i populatioe M i : atal elemet i kluster i : stickprovsstorlek (atal utvalda kluster) x ij : mätvärde för elemet j frå kluster i 4

Estegs klusterurval OSU av kluster: lämpar sig om klustre är ugefär av samma storleksordig Vätevärdesriktig skattig Kvotskattig: ej vätevärdesriktig skattig, me kräver midre iformatio om populatioe PPS-urval (Probabilities Proportioal to Size) av kluster: om klustre är olika stora Exempel: Atag att klustre är Sveriges kommuer. Ett OSU av kluster skulle då kua leda till att vi övervägade får små kommuer i urvalet, och e lite total stickprovsstorlek. 5

Estegs klusterurval med OSU För varje utvalt kluster beräkas klustermedelvärde x i = 1 M i M i x ij j=1 och klustertotal T i = M i x i = M i x ij j=1 Eftersom kluster utgör de primära ehetera blir klustertotale det vi ormalt betraktar som mätvärde! 6

Estegs klusterurval med OSU E vätevärdesriktig skattig av populatiosmedelvärdet μ u ges av: μ u = N M 0 μ T = N μ T där μ M T = 1 0 T i Variase beräkas som: Var μ u = N M 0 2 s T 2 1 N där s 2 T = 1 1 T 2 i T 2 Itervall ka beräkas eligt: μ u ± z α 2 N M 0 2 s T 2 1 N 7

Estegs klusterurval med OSU För 0/1-data (adelar) görs skattige på precis samma sätt (ma räkar alltså ite som P(1-P) här) För populatiostotale bestäms kofidesitervallet eligt: M 0 μ u ± M 0 z α 2 N M 0 2 s T 2 1 N 8

Exempel I e kommu vill ma udersöka skolbars idrottsaktiviteter. Det fis 19 skolor med totalt 2210 skolbar i kommue. Ma gör ett OSU om 5 skolor, och vill beräka det geomsittliga atalet timmar i vecka som bare idrottar. Följade tabell iehållade utvald skola, atal bar i skola och det totala atalet veckotimmar bare idrottar tas fram. Skola Atal bar Totalt atal veckotimmar 1 165 231 2 258 327 3 88 144 4 136 186 5 177 211 Bestäm ett 95% kofidesitervall för det geomsittliga atalet timmar i vecka som skolbare idrottar. 9

Estegs klusterurval med OSU, kvotskattig Räkemetodik som lämpar sig är vi gjort ett estegs klusterurval baserat på OSU är klustre är olika stora. Populatiosmedelvärdet puktskattas eligt μ R = T i M i och ett kofidesitervall för populatiosmedelvärdet bildas geom μ R ± z α 2 1 N 1 1 1 M 2 T 2 i + μ 2 R M 2 i 2 μ R T i M i 10

Exempel Ett fackförbud ikommer med klagomål till e matkedja om att persoale arbetar för mycket. Blad matkedjas 50 butiker väljer ma slumpmässigt ut 5 butiker och tillfrågar varje aställd hur måga timmar i vecka de i geomsitt arbetar. Följade resultat erhålles. Butik Atal aställda Total arbetstid/vecka 1 10 423 2 12 501 3 5 168 4 17 692 5 8 325 Beräka ett 95% kofidesitervall för de geomsittliga arbetstide. 11

Estegs klusterurval med OSU, kvotskattig Skattigara blir desamma vid adelar. För puktskattig och kofidesitervall för total multipliceras puktskattig respektive felmargial med M 0 (om dea är käd!). 12

Estegs klusterurval med PPS-urval (Probabilities Proportioal to Size) Metodik som lämpar sig om klusterstorlekara är väldigt olika stora och vi vill göra ett gaska litet urval. N: atal kluster i populatioe M 0 : atal elemet i populatioe : stickprovsstorlek (atal utvalda kluster) M i : atal elemet i kluster i Urvalet görs med återläggig och urvalssaolikhetera är proportioella mot klusterstorlek, varje kluster dras med saolikhete: M i M 0 13

Estegs klusterurval med PPS-urval Klustermedelvärde x i = 1 M i M i x ij j=1 Vätevärdesriktig puktskattig av populatiosmedelvärdet μ PPS = x PPS = 1 x i Vätevärdesriktig puktskattig av populatiosadele P P PPS = p PPS = 1 p i 14

Estegs klusterurval med PPS-urval Kofidesitervall för x PPS ± z α 2 1 x i 2 x PPS 2 1 Kofidesitervall för P p PPS ± z α 2 1 1 p i 2 p PPS 2 15

Exempel Iom e kocer vill ma udersöka hur måga semesterdagar per aställd som i geomsitt tas ut uder augusti måad. Ma väljer ut 5 avdeligar med återläggig och med saolikheter proportioella mot avdeligaras storlek blad koceres företag. Vid varje avdelig oteras det totala atalet uttaga semesterdagar uder augusti måad det seaste året. Avdelig Atal aställda Totalt atal semesterdagar 1 38 79 2 115 240 3 55 91 4 58 113 5 42 66 Beräka ett 95% kofidesitervall för det geomsittliga atalet semesterdagar de aställda tar ut uder augusti måad. 16

Urvalsdimesioerig vid estegs klusterurval Urvalsdimesioerig vid klusterurval baserat på OSU är svårt, eftersom klusterstorlekara ofta varierar och förhadsuppskattig av populatiosvariase är svår då de är mer komplex ä valigt. För PPS-urval är dock formlera ekla: Om vi accepterar bredde B i ett kofidesitervall med sigifikasivå väljs 4 z α 2 där 2 σ x i B 2 2 σ 2 x i är variase för klustermedelvärdea i populatioe. 17

Tvåstegs klusterurval med OSU Iblad ka det vara praktiskt väldigt krågligt och tidsödade att udersöka samtliga elemet i varje kluster. Då ka ma istället välja ut ett visst atal elemet i de olika klustre till udersökige. N: atal kluster i populatioe M 0 : atal elemet i populatioe M i : atal elemet i kluster i : atal utvalda kluster m i : atal utvalda elemet i kluster i x ij : mätvärde för elemet (idivid) j i kluster i 18

Tvåstegs klusterurval med OSU Vi beräkar medelvärdet i urvalet frå varje kluster x i = 1 m i m i x ij Vätevärdesriktiga skattigar av respektive P ges då av μ u2 = N 1 M 0 M i x i P u2 = N M 0 1 M i p i (otera idexet 2 för tvåstegs klusterurval) 19

Exempel I e kommu udersöks grudskollärara (totalt fis det 722 grudskollärare i hela kommue) med avseede på deras utbildig. Frå kommues totalt 19 grudskolor görs ett OSU om 5 skolor och på varje skola görs ett OSU om 50% av lärara. För varje lärare ihämtas iformatio om det totala atalet fortbildigstimmar det seaste året. Skola Atal utvalda lärare Medelatal timmar Stadardavvikelse 1 15 28 5 2 23 31 7 3 19 23 4 4 24 37 6 5 16 28 6 20

Tvåstegs klusterurval med OSU, kvotskattig Puktskattig av populatiosmedelvärdet μ R2 = M i M i x i Puktskattig av populatiosadele P R2 = M i p i M i För totaler multipliceras puktskattige av populatiosmedelvärdet med M 0 21

Tvåstegs klusterurval med PPS-urval Populatiosmedelvärdet skattas eligt μ PPS2 = 1 x i och ett kofidesitervall bildas eligt μ PPS2 ± z α 2 1 x i 2 x PPS 2 ( 1) 22

Tack för idag! Nästa tillfälle: Föreläsig 6, torsdag 15 maj 10-12, T2 23