Är icke-sannolikhetsurval aldrig representativa?

Relevanta dokument

Webbpanelundersökningar

Handisam. Beräkningsunderlag för undersökningspanel

Statistiska synpunkter på politiska opinionsundersökningar

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Kvalitet i webbpanelundersökningar. Kvalitetsmått. Beskrivningsmått mått för att beskriva, värdera och tolka

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

Kvalitet i webbpanelundersö kningar

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Föreläsning G60 Statistiska metoder

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Kvalitet i webbpanelundersö

Studietyper, inferens och konfidensintervall

F9 SAMPLINGFÖRDELNINGAR (NCT

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F9 Konfidensintervall

Konfidensintervall i populationsbaserade studier varför behövs de? Therese Andersson Sandra Eloranta

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Urvalsundersökningar vetenskapliga aspekter och internationella utblickar

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning 1: Introduktion. Vad är statistik?

Att bedöma webbpaneler och webbpanelundersökningar. - exempel på numeriska mått och verbala beskrivningar

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.

Föreläsning 7: Punktskattningar

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning 7: Punktskattningar

Statistikens betydelse och nytta för samhället

Föreläsning 5. Kapitel 6, sid Inferens om en population

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

OMNIBUSRAPPORT VG REGIONEN

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Urvalsmetoder: Stratifierat urval (kap 9.5)

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

Hur går en statistisk undersökning till?

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

Attityder kring SBU:s arbete. Beskrivning av undersökningens upplägg och genomförande samt resultatredovisning

Introduktion till statistik för statsvetare

Dataanalys kopplat till undersökningar

Surveyföreningen - Webpaneler i praktiken

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Lastbilsundersökningen: Hantering av överrapporterat stillestånd

Föreläsning 5: Att generalisera

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Föreläsning G60 Statistiska metoder

Kvalitet för den officiella statistiken

Slöjd och hantverk Vanor och värderingar Linn Annerstedt, Annika Bergström och Jonas Ohlsson [SOM-rapport nr 2017:5]

Vad beror benägenheten att återvinna på? Annett Persson

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning G60 Statistiska metoder

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

KVANTITATIV FORSKNING

Föreläsning 5: Att generalisera

Hur man tolkar statistiska resultat

West Pride. Författare: Frida Tipple [SOM-rapport nr 2019:36]

Allmänhetens attityder till studieförbunden 2013

Statistik 1 för biologer, logopeder och psykologer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Provmoment: Ladokkod: Tentamen ges för: Tentamen VVT012 SSK05 VHB. TentamensKod: Tentamensdatum: Tid:

Tidigare exempel. Några beteckningar. Stratifierat urval

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen

Naturskyddsföreningen Attityder till flygskatt

Föreläsning 7: Punktskattningar

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Population. Antal tänder. Urval

Parade och oparade test

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Jubileumssatsningarna. Författare: Frida Tipple och Ulrika Andersson [SOM-rapport nr 2018:27]

Evenemangskonsumtion. Linn Annerstedt och Maria Solevid [SOM-rapport nr 2017:13]

7.3.3 Nonparametric Mann-Whitney test

Thomas Önskog 28/

Christer Nordh/ Förvaltningstjänster för premiepensionen Undersökning bland allmänheten 15 och äldre februari 2013

Ledtidsanpassa standardavvikelser för efterfrågevariationer

Jubileumssatsningarna. Linn Annerstedt och Maria Solevid [SOM-rapport nr 2017:12]

Gymnasiedagarna Besökarintervjuer GYMNASIEDAGARNA

Enkätmetodik felkällor. Kandidatprogrammet i folkhälsovetenskap, HT -11

Nationella prov, Uppdrag granskning

Hur skriver man statistikavsnittet i en ansökan?

Statistik och epidemiologi T5

Konsten att fånga, sammanfatta och tolka resultat och mätningar. Marie Lindkvist Epidemiologi och global hälsa

7.5 Experiment with a single factor having more than two levels

Kunskap = sann, berättigad tro (Platon) Om en person P s har en bit kunskap K så måste alltså: Lite kunskaps- och vetenskapsteori

Väljarnas förtroende för Miljöpartiet

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

, s a. , s b. personer från Alingsås och n b

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Uppföljningsundersökning. Lärare. Teknisk rapport

Allmänheten om kollektivavtal

Reumatikerförbundet: Upplevelse av förpackningar för dagligvaror T Leif Hansson. Datum:

Fjärrvärme 2011 E.ON. Jon Andersson, Projektnummer:

Tentamen Tillämpad statistik A5 (15hp)

Statistikens grunder HT, dagtid Statistiska institutionen

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

Vad är statistik? Kapitel 1 handlar om. Praktisk statistik kapitel 1. Vad är statistik? Grundbegrepp

Transkript:

Surveyföreningens webbpanelseminarium 2011-02-03 Är icke-sannolikhetsurval aldrig representativa? Jan Wretman Webbpanelkommittén 1

Det kommer att handla om: Begreppet representativitet. Bedömning av skattningars kvalitet, speciellt vid icke-sanolikhetsurval. Webbpanelundersökningar, speciellt marknadsundersökningar. 2

Vad är representativitet? Stickprovet liknar i någon mening den population man är intresserad av? Man kan på något sätt generalisera från stickprovet till populationen? Vad betyder det? 3

Representativitet, exempel på olika språkbruk: Samma fördelning som i populationen m.a.p. vissa bakgundsvariabler. Alla inressanta grupper i populationen finns representerade i stickprovet. Varje enskild medlem i stickprovet är en typisk representant för populationen. 4

(Representativitet, olika språkbruk, forts.) Alla i populationen har haft lika chans att komma med i stickprovet. Urvalet har gjorts enligt någon metod som möjliggör bra skattningar. 5

Hur används termen nu? Termen representativitet förefaller numera undvikas av professionella statistiker. Icke-statistiker, som gjort ett urval på något icke-statistiskt sätt, brukar ibland försvara sig genom att säga att urvalet i alla fall är representativt. Oklart vad man då menar. 6

Beträffande olika användningar av termen representativitet, se: Tore Dalenius: Statistisk tidskrift, 1953. William Kruskal och Frederick Mosteller: International Statistical Review, 1979-80 (fyra artiklar). 7

Vad har en undersökning för kvalitet? Alla slutsatser från urvalsundersökningar är osäkra. Hur osäkra? Hur mycket kan man lita på resultaten? Bryr sig användaren om hur stor osäkerheten är? Är kvalitetsnivån acceptabel i relation till undersökningens syfte? 8

Kvaliteten beror av många olika saker, bl.a. 1. Mätteknik: Är undersökningens syfte klart? Är frågorna relevanta för detta syfte? Kan den svarande förstå frågorna? Går frågorna att besvara? Är frågorna korrekt översatta? Kan vi lita på att svaren är riktiga? Kan eventuell intervjuare ha påverkat svaren? 9

2. Urval: Är undersökningspopulationen väldefinierad? Urvalsförfarande? Täckningsproblem? Bortfall? Hur har man fått den slutliga mängden av svarande? 10

3. Databearbetning: Databehandlingsfel? Hur har skattningarna beräknats? Vägning? 11

Temat för detta seminarium : Kvalitetsfrågor som har med urval att göra. (Vi tar inte upp mätteknik och databehandling.) Speciellt webbpanelundersökningar. 12

Olika typer av samhällsundersökningar, t.ex: Officiell statistikproduktion. Undersökningar inom samhällsvetenskaplig forskning. Opinionsundersökningar. Marknadsundersökningar. 13

Olika undersökningar kan ha olika kvalitetskrav: Officiell statistik. Ligger till grund för viktiga beslut. Höga kvalitetskrav. Felaktigheter framkallar kritik. Marknadsundersökningar. Viktiga för uppdragsgivaren? Vet uppdragsgivaren vad han ska använda resultaten till? Vaga kvalitetskrav. Felaktigheter kommer sällan att upptäckas. Ingen kommer att kritiseras. 14

Att bedöma skattningars kvalitet: Urval: Population Stickprov Estimation: Population Stickprov Hur stickprovet har erhållits är viktigt. 15

Två stora klasser av urvalsförfaranden: Sannolikhetsurval Icke-sannolikhetsurval 16

Sannolikhetsurval: Väldefinierad population. Varje medlem i populationen ska ha en känd sannolikhet (större än noll) att väljas ut. Vanligen görs urvalet från någon form av urvalsram. 17

Icke-sannolikhetsurval: Allt som inte är sannolikhetsurval, t.ex. självselektion, kvotaurval, purposive selection, snöbollsurval. 18

En skattnings kvalitet: Från givna stickprovsdata har vi beräknat en skattning av en viss populationsparameter. Hur bra är denna skattning? Vad har den för noggrannhet? Ligger skattningens värde nära det för oss okända värdet på populationsparametern? 19

FALL 1: Strikt sannolikhetsurval Vanligt att beräkna ett konfidensintervall: skattning ± felmarginal. Vi vet inte om det just erhållna intervallet täcker parametervärdet eller ej, men vi vet att intervallet har beräknats enligt en metod, som har följande attraktiva egenskap: 20

I det långa loppet (d.v.s. en tänkt lång serie upprepade undersökningar) skulle vi få intervall som med viss önskad relativ frekvens (t.ex. 95%) täcker det sanna parametervärdet. Detta gäller oavsett hur populationen ser ut. 21

Vi vet fortfarande inte om det just erhållna intervallet täcker det sanna parametervärdet eller ej. Men vi hoppas att vi inte har fått ett av dessa sällsynta misslyckade intervall, som inte täcker det sanna parametervärdet. 22

Konfidensintervallet i sig är inget absolut mått på skattningens noggrannhet. Men man kanske kan säga att ju kortare konfidensintervall, desto högre noggrannhet hos skattningen. 23

FALL 2: Icke-sannolikhetsurval. Ingen teori eller metod finns för att förse skattningen med ett osäkerhetsintervall. Uttalanden om skattningens egenskaper måste bli baserade på diverse information och kunskaper som man råkar ha tillgång till, och som kan variera från fall till fall. 24

Inga vedertagna numeriska kvalitetsmått. I stället för kvalitetsdeklaration kan man tänka sig en beskrivning av hur undersökningen har gått till från början till slut (inklusive vissa numeriska mått). Beskrivningsmått snarare än kvalitetsmått. Flera mått i stället för ett enda. 25

Förmågan att ta fram en sådan här beskrivning (med tillhörande beskrivningsmått) är en sorts kvalitetsindikator i sig. Det visar om undersökaren har läget under kontroll. Användaren får dra slutsatsen att kvaliteten är den man kan förvänta sig under de beskrivna omständigheterna. 26

Since no theoretical treatment is possible for nonprobability sampling methods, no general results can be obtained. Each application of a nonprobability sampling method must be evaluated individually. (Graham Kalton, Encyclopedia of Statistical Sciences, 1988) 27

I samband med en beskrivning kan man t.ex. fråga: Finns det skäl att tro att de svarande skiljer sig från populationen m.a.p. undersökningsvariabelns fördelning? Hur ser de svarandes fördelning ut m.a.p. vissa bakgrundsvariabler, jämfört med populationen? Hur var det med personers villighet att medverka i undersökningen? 28

Sannolikhetsurval kontra icke-sannolikhetsurval: Blir det bättre resultat med sannolikhetsurval än med icke-sannolikhetsurval? Inte säkert. Men vid icke-sannolikhetsurval saknas teori för att mäta osäkerheten. 29

Undersökningar med icke-sannolikhetsurval visar sig ibland fungera bra, ibland mindre bra. När gäller det ena, och när gäller det andra? Skulle man kunna studera denna fråga med någon sorts vetenskaplig systematik? 30

Problem: Ett växande problem med sannolikhetsurval är det ökande bortfallet. Även om man från början hade sannolikhetsurval, men om bortfallet är stort, så får man i praktiken betrakta de svarande som ett ickesannolikhetsurval från populationen. Vad hade man då för nytta av sannolikhetsurval? 31

Webbpanelundersökningar: Urval i två faser Urval: Population Panel Stickprov Estimation: Population Panel Stickprov 32

Två frågor om urvalet: Hur har panelen skapats? Hur har stickprovet för den specifika undersökningen valts från panelen? 33

FALL 1: Panelen rekryterad genom ickesannolikhetsurval. Ett överdrivet exempel (för att på ett naivt sätt tydliggöra vilka mekanismer som kan finnas): Skatta hur många procent i populationen som gillar en produkt P. 34

Antag att alla som gillar P samtidigt är sådana som gärna är med i en panel, medan alla som inte gillar P är sådana som vägrar att vara med i en panel. Ett stickprov av personer från panelen kommer att innehålla enbart personer som gillar P. 35

Då hjälper det inte ifall panelen har samma fördelning som populationen m.a.p. kön, ålder, utbildning etc. Det hjälper inte heller ifall urvalet från panelen till den specifika undersökningen har gjorts slumpmässigt. (Exemplet slut) 36

Exempel på uttalanden (1):... eftersom det inte går att göra slumpmässiga urval i en webbundersökning, så får man vara nöjd med att försöka göra det näst bästa så bra som möjligt. [Vi] har kontrollerat [vår] panel och anser att den är representativ, med undantag för personer som är äldre än 70-75 år. (Referat i Qvintensen från Surveyföreningens seminarium om politiska opinionsundersökningar.) 37

Exempel på uttalanden (2): Researchers should avoid nonprobability online panels when one of the research objectives is to accurately estimate population values. [...] Claims of representativeness should be avoided when using these sample sources. (AAPOR, 2010) 38

FALL 2: Panelen rekryterad i samband med omnibusundersökning. Antag: Omnibus med sannolikhetsurval. Antag: Sannolikhetsurval från panelen. Problem: Stort bortfall. 39

Påhittat (men kanske inte helt orealistiskt) räkneexempel: Omnibus Rekrytering Profilunders. Panelunders. 40% svarande 40% av dessa vill gå med i panel 70% av de föregående blir kvar 40% av de utvalda svarar 40

Räkneexempel, forts: Efter profilundersökningen kvarstår i panelen ung. 11% av det ursprungliga stickprovet. (0,4 0,4 0,7 = 0,112) 41

Räkneexempel, forts: Panelen kan i realiteten knappast ses som erhållen genom sannolikhetsurval från populationen. Sedan tilkommer bortfallet i den specifika undersökningen. 42

Räkneexempel, forts: Fast man eftersträvat formellt sannolikhetsurval i båda urvalsfaserna, så kan man (p.g.a. det stora bortfallet) till slut ändå inte räkna som om det vore sannolikhetsurval. Man är hänvisad till samma sorts resonemang som när man drar slutsatser från icke-sannolikhetsurval. 43

Räkneexempel, forts: Om huvudprincipen är att undersökningen ska vara så billig som möjligt, finns det då anledning att lägga ner pengar på sannolikhetsurval, som ändå inte kommer att fungera? En svår fråga, som skulle behöva studeras mer systematiskt. (Räkneexemplet slut) 44

Några avslutande frågor: Marknadsundersökningar via webbpanel = = en sorts lägre division av undersökningar? Man får vad man betalar för? Man vet inte så mycket om resultatens kvalitet? Beställaren bryr sig inte om resultatens kvalitet? Bättre än ingenting? Hur ska man studera dessa saker? 45