732G04 Surveymetodik 7.5hp. Jörgen Säve-Söderbergh

Relevanta dokument
732G19 Utredningskunskap I 7.5hp. Tommy Schyman Kalle Wahlin

732G01/732G40 Grundläggande statistik (7.5hp)

Föreläsning G70 Statistik A

Föreläsning G60 Statistiska metoder

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Föreläsning G60 Statistiska metoder

Laboration 3 Inferens fo r andelar och korstabeller

732G70, 732G01 Statistik A 7hp

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Statistik 1 för biologer, logopeder och psykologer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Laboration 3: Urval och skattningar

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Föreläsning 5. Kapitel 6, sid Inferens om en population

Laboration 3: Urval och skattningar

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Datoro vning 1-2 Statistisk analys av kodade svar

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

DATORÖVNING 3: MER OM STATISTISK INFERENS.

OBS! Vi har nya rutiner.

Hur går en statistisk undersökning till?

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Att välja statistisk metod

Statistiska undersökningar

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Datorövning 2 Statistik med Excel (Office 2007, svenska)

LABORATIONER. Det finns en introduktionsfilm till Minitab på

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Enkätmetodik felkällor. Kandidatprogrammet i folkhälsovetenskap, HT -11

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Föreläsning 1: Introduktion. Vad är statistik?

Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik

EXAMINATION KVANTITATIV METOD vt-11 (110204)

2 Dataanalys och beskrivande statistik

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

OBS! Vi har nya rutiner.

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Stockholms Universitet Statistiska institutionen Termeh Shafie

Föreläsning 7: Punktskattningar

Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl

Olika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Kritisk granskning av forskning

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

F3 Introduktion Stickprov

SOPA62 - Kunskapsproduktion i socialt arbete

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning G60 Statistiska metoder

Tentamen: Vetenskapliga perspektiv på studie- och yrkesvägledning, 7,5hp distans (D1) & campus (T1), ht12

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Syfte med undervisningen är att du ska få utveckla din förmåga att...

Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald

F9 SAMPLINGFÖRDELNINGAR (NCT

Statistiska undersökningar - ett litet dokument

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

EXAMINATION KVANTITATIV METOD

Bearbetning och Presentation

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Laborationer i statistik för A:1, Lab 1

FACIT (korrekta svar i röd fetstil)

Tentamen Metod C vid Uppsala universitet, , kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Studiehandledning S0001M Matematisk statistik Läsperiod 2, HT 2017

Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp

Börja med att ladda ner Kommuner2007.xls från kursens hemsida.

Studiehandledning. Socialpsykologi 1, SOGA30 Delkurs 3: Att undersöka människors samspel, 7,5 hp. Höstterminen 2016

Transkript:

732G04 Surveymetodik 7.5hp Jörgen Säve-Söderbergh jorgen.save-soderbergh@liu.se

Statistikämnet och utredningar Hur tolkar man statistiken? Går statistiken att lita på? Var kommer statistiken ifrån? Egeninsamlade data (primärdata) Redan insamlade data (sekundärdata)

Kursupplägg 7 föreläsningar 3 lektioner 1 datorövning 2 seminarium Projektarbete om insamling och analys av primärdata (3.5hp) Tentamen (4hp)

Kurslitteratur Huvudlitteratur Räkna på urval! av Anders Nordgaard Rekommenderad bredvidläsning Från datainsamling till rapport av Karin Dahmström Tillämpad statistik av Wahlin Föreläsningsunderlag på kurshemsida (LISAM) Examination Skriftlig tentamen 26 november kl 8-12 [28 januari 2016 8-12] Hjälpmedel: fusklapp och miniräknare Aktivt deltagande i arbete och redovisning av projektarbetet

Föreläsning 1-2 732G04 Surveymetodik

Dagens föreläsning(ar) Introduktion till statistisk undersökningsmetodik Repetition Populationer, stickprov Variabler (typer, skalor) Diagram Chitvå-test Beskrivande mått Introduktion till projektet Insamling av primärdata

Statistisk undersökningsmetodik (kvantitativ metod) Grundtanke Kontakta ett stort antal personer, och till varje person ställa frågor med ett antal i förväg konstruerade svarsalternativ för att sedan med statistiska metoder bearbeta och dra slutsatser från denna information. Stickprov används för att dra slutsatser om populationen som stickprovet dragits ur. Egenskaper Tillåter exakta slutsatser (?) Kostnadseffektivt: möjlighet att med statistiska metoder dra säkra slutsatser om populationen baserat på ett förhållandevis litet och billigt stickprov.

Population och stickprov Målpopulation Den population som vi vill undersöka Rampopulation Den population som vi faktiskt kan undersöka Urvalsram (Eventuellt) register över rampopulationen Stickprov (Normalt slumpmässigt) urval av enheter från rampopulationen Urvalsenhet De enheter som blivit utvalda i stickprovet

Variabler Variabel: resultatet av upprepade mätningar eller observationer av ett fenomen En variabel är detsamma som en fråga i sammanhanget av statistiska undersökningar Kvalitativa variabler: variabler som ej mäts numeriskt (i sifferform) Kvantitativa variabler: variabler som mäts numeriskt Diskreta kvantitativa variabler Kvantitativa variabler som endast antar heltalsvärden Kontinuerliga kvantitativa variabler Kvantitativa variabler som kan mätas med många decimalers noggrannhet

Nominalskala Hos kvalitativa variabler. När variabelns möjliga värden bara kan betraktas som ickenumeriska grupper utan inbördes ordning. Exempel: Bedömer du att generalindex kommer att stiga under april månad? Variabeln ( )Ja ( )Nej Variabelns möjliga värden

Ordinalskala Hos kvalitativa eller kvantitativa variabler. När variabelns värden kan betraktas som grupper, antingen numeriska eller ej, som kan rangordnas. Exempel kvalitativ variabel på ordinalskala: Hur bedömer Du Din närmaste chefs ledaregenskaper? ( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga ( ) Ganska dåliga ( ) Mycket dåliga Exempel kvantitativ variabel på ordinalskala: Hur många anställda har ert företag? ( ) 0-5 ( ) 6-15 ( ) 16-50 ( ) 51-

Metrisk skala Hos kvantitativa variabler. När variabeln direkt mäts i numeriska värden. Exempel: Den dagliga försäljningen i en butik... 2011-10-19 16530 kr 2011-10-20 21465 kr 2011-10-21 8972 kr..

Att åskådliggöra fördelningen för variabler En variabels fördelning är en sammanställning över vilka värden variabeln kan anta och hur ofta respektive värde antas. Fördelningar beskrivs oftast i diagramform men kan också sammanställas i tabeller Fördel diagram: läsaren kan snabbt ta till sig informationen Nackdel diagram: detaljnivån minskar jämfört med en tabell Olika angreppssätt används för att beskriva fördelningar för Kvalitativa variabler Kvantitativa diskreta variabler Kvantitativa kontinuerliga variabler

Exempel Företagshälsovården vid ett företag sänder ut en enkät där de anställda bland annat får svara på frågan Hur bedömer Du Din närmaste chefs ledaregenskaper? ( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga ( ) Ganska dåliga ( ) Mycket dåliga Resultaten sammanställs i följande tabell Åsikt (x) Antal (f) Mycket goda 42 Ganska goda 61 Varken bra eller dåliga 84 Ganska dåliga 23 Mycket dåliga 10 Totalt 220

Att åskådliggöra fördelningen för en kvalitativ variabel: stapeldiagram 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% Mycket goda Ganska goda Varken bra eller dåliga Ganska dåliga Mycket dåliga

Alternativ metodik för att åskådliggöra fördelningen för en kvalitativ variabel: cirkeldiagram Mycket goda Varken bra eller dåliga Mycket dåliga Ganska goda Ganska dåliga 5% 10% 19% 38% 28%

Exempel En annan fråga på enkäten löd Hur många dagar i veckan motionerar Du? ( ) Ingen ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 Resultaten sammanställs enligt Antal dagar (x) Antal (f) Andel (%) 0 84 38 1 41 19 2 51 23 3 22 10 4 8 4 5 6 3 6 5 2 7 3 1 Totalt 220 100%

Att åskådliggöra fördelningen för en diskret kvantitativ variabel: stolpdiagram 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% 0 1 2 3 4 5 6 7 Antal motionsdagar per vecka Stolpdiagrammet är likt stapeldiagrammet, men ritas med smalare staplar

Exempel Dygnsmedeltemperatur (grader Celsius) i centrala Linköping under juli månad 2011. Dag 1 2 3 4 5 6 7 Temp 20.9 20.7 19.1 16.6 18.7 19.8 19.1 Dag 8 9 10 11 12 13 14 Temp 19.2 18.6 18.4 17.3 17.8 16.0 14.7 Dag 15 16 17 18 19 20 21 Temp 16.1 16.7 18.2 15.6 18.7 19.0 18.6 Dag 22 23 24 25 26 27 28 Temp 19.7 20.1 17.0 19.1 18.4 18.4 20.8 Dag 29 30 31 Temp 20.1 19.0 19.9

Att åskådliggöra fördelningen för en kvantitativ variabel: histogram 35% 30% 25% 20% 15% 10% 5% 0% -15.9 16.0-16.9 17.0-17.9 18.0-18.9 19.0-19.9 20.0- Dygnsmedeltemperatur (grader Celsius)

Tänk på att inte kapa diagram!

Exempel Vid ett experiment lät man 51 personer välja vilken av tre informationsbroschyrer A, B eller C man fann mest informativ och pålitlig. Följande resultat erhölls. Broschyr Antal personer (f) A 13 B 21 C 17 Totalt 51 Finns det några skillnader i popularitet mellan broschyrtyperna på 5% signifikansnivå?

Chitvå-test för analys av frekvenstabell Krav: det råder oberoende mellan grupperna i tabellen. Innebörden i detta är att samma element (person) endast får ingå i en grupp. max 20% av de förväntade frekvenserna är mindre än 5 alla förväntade frekvenser är större än 1. Steg 1: Välj signifikansnivå och formulera hypoteser H 0 : Det finns inga skillnader i frekvens mellan grupperna H a : Det finns skillnader i frekvens mellan grupperna Steg 2: Bestäm testvariabeln χ 2 = V i=1 O i E i 2 E i där V = antalet grupper i frekvenstabellen

Chitvåtest för analys av frekvenstabell Steg 3: Ska vi tro på H 0 eller H a? Om testvariabeln är större än 2 χ V 1;α där V är antalet grupper i frekvenstabellen, förkastas H 0. Chitvå-test är alltid enkelsidiga åt höger! Steg 4: Dra slutsats

Chitvåtest för analys av frekvenstabell Minitab: Stat -> Tables -> Chi-Square Goodness-of-Fit Test Chart of Observed and Expected Values Chart of Contribution to the Chi-Square Value by Category 20 Expected Observed 0.9 0.8 Value 15 10 5 Contributed Value 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 Category 1 2 3 0.0 1 2 Category 3 Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1 Test Contribution Category Observed Proportion Expected to Chi-Sq 1 13 0.333333 17 0.941176 2 21 0.333333 17 0.941176 3 17 0.333333 17 0.000000 N DF Chi-Sq P-Value 51 2 1.88235 0.390

Exempel Finns det ett samband mellan föräldrarnas politiska åskådning och ens egen? Man drog ett OSU om 365 personer och frågade dels om moderns, dels om ens egen politiska tillhörighet (vänster eller höger). Följande resultat erhålles. Respondenten vänster Respondenten höger Modern vänster Modern höger 98 141 67 59 Går det att på 5% signifikansnivå att påvisa något samband mellan respondenternas och föräldrarnas politiska åskådning?

Exempel (forts) 70% 60% 50% 40% 30% 20% 10% 0% Respondenten vänster Modern vänster Respondenten höger Modern höger

Chitvåtest för korstabell Krav: det råder oberoende mellan cellerna. Innebörden är att samma element (person) inte får förekomma i flera celler i tabellen max 20% av de förväntade frekvenserna är mindre än 5 alla förväntade frekvenser är större än 1 Steg 1: Välj signifikansnivå och formulera hypoteser H 0 : Det finns inga skillnader i fördelning mellan grupperna (alternativt: det finns inget samband mellan grupperna) H a : Det finns skillnader i fördelning mellan grupperna (alternativt: det finns samband mellan grupperna)

Chitvåtest för korstabell Steg 2: Beräkna testvariabeln χ 2 = W Oi E i 2 i=1 E i där W = antalet celler i korstabellen (exklusive marginalfrekvenser) Steg 3: Ska vi tro på H 0 eller H a? Om testvariabeln är större än 2 χ (r 1)(c 1);α där r är antalet rader i korstabellen och c är antalet kolumner, förkastas H 0. Kom ihåg att chitvå-test alltid är enkelsidiga åt höger! Steg 4: Dra slutsats

Chitvåtest för korstabell Minitab: Stat -> Tables -> Chi-Square Test Chi-Square Test: C1; C2 Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts C1 C2 Total 1 98 141 239 108.04 130.96 0.933 0.770 2 67 59 126 56.96 69.04 1.770 1.460 Total 165 200 365 Chi-Sq = 4.934; DF = 1; P-Value = 0.026

Krav för att använda chitvå-test 1. Oberoende 2. Max 20% av de förväntade frekvenserna < 5 3. Alla förväntade frekvenser > 1 Hur gör vi om inte dessa krav uppfylls? Strategi 1: (Logisk) Sammanslagning Exempel: Hur många träningspass i veckan genomför du? 0-2 3-4 5-6 7- K 12 (9.68) 10 (12.58) 0 (2.90) 8 (4.84) M 8 (10.32) 16 (13.42) 6 (3.10) 2 (5.16) Förväntade frekvenser inom parentes 0-2 3-4 5- K 12 (9.68) 10 (12.58) 8 (7.74) M 8 (10.32) 16 (13.42) 8 (8.26)

Strategi 2: Fishers exakta test En exakt beräkningsmetod för specialfallet 2 * 2-tabell. Exempel: Tror Du att generalindex går upp i år? p = 0.464286 Ja Kvinnor 1 4 Män 2 1 Nej

Beskrivande mått för variabler Beskrivande mått används för att sammanfatta en variabels fördelning. Exempel: En population består av 8 socialdemokrater (kodat som 1) 10 moderater (2) 4 folkpartister (3) 1 miljöpartist (4) Olika metoder används beroende på variabelns skala.

Variabler på nominalskala Typvärde Andelar Konfidensintervall för andelar * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

Variabler på ordinalskala Median Kvartiler Kvartilavstånd Andelar Konfidensintervall för andelar * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

Variabler på metrisk skala Medelvärde Standardavvikelse Median Kvartiler Kvartilavstånd Andelar Konfidensintervall för medelvärde * Konfidensintervall för andelar * Hypotesprövning för medelvärde * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

Samband mellan variabler på nominalskala eller ordinalskala Chitvå-test Samband mellan variabler på metrisk skala Korrelationskoefficient Regressionsanalys

Projektarbete insamling och analys av primärdata: Syfte Syfte: att träna i första hand planering men också genomförande av en statistisk undersökning av den typ som ofta används för att inskaffa underlag för beslut. Tyngdpunkten i genomförandet ligger på konstruktion av frågeformulär bearbetning och analys av insamlade data (primärdata) rapportering (muntligt och skriftligt), särskilt resultatredovisning i tabeller och diagram och tolkning av dessa. Projektet genomförs i grupper om 4-5 personer.

Projektarbete insamling och analys av primärdata: Tillvägagångssätt Definiera ett undersökningsproblem. Definiera målpopulation och översätt denna i en rampopulation. Bestäm hur stickprovet ska dras. För detta projekt krävs att få in svar från 50 personer per gruppmedlem. Fundera över vilka data som behövs för att man ska kunna besvara frågeställningarna och hur data ska bearbetas och analyseras. Glöm ej att fundera över hur bortfall så långt som möjligt ska undvikas, hur bortfallet kan undersökas och hur effekter av det slutliga bortfallet ändå ska hanteras.

Projektarbete insamling och analys av primärdata: Tillvägagångssätt (forts) Konstruera frågeformulär. Frågeformuläret ska bestå av omkring 12-15 frågor som är relevanta för problemområdet. Genomför datainsamling Genomför datorbearbetning av insamlade data. Använd särskilt korstabellering (inklusive chitvå-test) och illustrativa diagram, så att olika samband kan beskrivas och studeras. Det kan också, beroende på undersökningsproblemet, vara intressant att analysera samband mellan kvantitativa variabler med hjälp av regressionsanalys. Skriv en rapport.

Projektarbete insamling och analys av primärdata: Rapport I rapporten ska följande finnas formulering av undersökningsproblemet med kort problembakgrund undersökningsplan enkäten faktiskt genomförd bearbetning och analys av undersökningsdata med hjälp av tabeller, diagram och beskrivande mått, liksom analyser med chitvå-test och eventuellt regressionsanalys. något om hur bortfallet kan tänkas påverka resultaten slutsatser, där det är viktigt att tillse att frågeställningarna i inledningen faktiskt besvaras. Rapporten ska vara på ca 20 sidor plus bilagor.

Projektarbete insamling och analys av primärdata: Enkätseminarium Under detta seminarium kommer enkäterna och dess frågor att diskuteras. Grupperna presenterar (väldigt) kort sitt undersökningsproblem så att seminariedeltagarna blir insatta i vad som ska undersökas, och därefter redovisas de olika enkätfrågorna med tillhörande motiveringar. Denna presentation görs med fördel med hjälp av Powerpoint och beräknas ta ungefär 10 minuter per grupp. Därefter kommenterar opponentgruppen enkäten och slutligen får övriga deltagare komma med synpunkter. De olika synpunkter som tas upp på detta seminarium tar grupperna med sig och fortsätter utveckla sin enkät. När de anser sig klara med enkäten skickas den till handledaren (Jörgen) för slutligt godkännande. Datainsamlingen får ej påbörjas innan handledare godkänt enkäten!

Projektarbete insamling och analys av primärdata: Projektseminarium Vid projektseminariet redogör varje arbetsgrupp för sitt arbete, och en opponentgrupp kommer med synpunkter och därefter vidtar diskussion. Respektive författargrupp redovisar sitt arbete under cirka 15 minuter. Enkäten samt viktiga tabeller och/eller diagram visas med PowerPointstöd. Opponentgruppen ska noggrant ha läst igenom rapporten, reflekterat över den och ska under opponeringen lyfta fram några viktiga synpunkter. Härefter följer diskussion av arbetet med tyngdpunkt på metodfrågor under ca 15 minuter. Opponentgruppen ska också skriftligen (ca en sida) förse författare och lärare med sina synpunkter på rapporten, och denna text överlämnas i samband med opponeringen. Det råder obligatorisk närvaro vid projektseminariet och för att bli godkänd på projektarbetet krävs aktivt deltagande i både redovisning och opponering.

Hållpunkt Projektarbete insamling och analys av primärdata: Tidplan Moment V 44 måndag V 44 tisdag V 44 onsdag V 44 torsdag-fredag V 45 tisdag V 45 onsdag fredag V 46 måndag tisdag V 46 onsdag Projektintroduktion, gruppindelning Gruppindelning definitiv. Inlämning av förslag till undersökningsproblem Definition av målpopulation och val av urvalsdesign klar. Börja med frågeformulär Datorlaboration om inmatning av enkätdata och analys av sådana Arbete med frågeformulär, inkl. pilotundersökning Enkätseminarium. Enkäten skickas senast måndag 15:00 till: Opponentgruppen (framgår av kurshemsidan) Lärare (jorgen.save-soderbergh@liu.se) Skriv tydligt 732g04 Enkät Era namn som ärendemening i mailet till mig. Datainsamling Sammanställning av inkomna frågeformulär: kodning och analys Rapportskrivning V47 onsdag Rapport klar (12:00) V47 torsdag Seminarium med redovisning. Obligatorisk närvaro.

Om enkäter och enkätkonstruktion En enkätundersökning genomförs genom att till slumpmässigt utvalda individer sprida ett frågeformulär med i förväg konstruerade svarsalternativ för att sedan med statistiska metoder bearbeta denna information och dra slutsatser om populationen som stickprovet dragits ur. Data från en enkätundersökning är exempel på primärdata, till skillnad från information från exempelvis register vilket kallas sekundärdata. Viktiga begrepp är, precis som vanligt inom statistiken, population och stickprov: vi definierar en population som vi önskar dra slutsatser om och drar sedan ett stickprov (om inte populationen är så liten och välavgränsad att alla individer i populationen kan undersökas) med hjälp av någon av de metoder vi lärt oss i kapitel 9 (Dahmström). Resultaten från stickprovet används för att dra slutsatser om populationen. Även begreppet variabel spelar en stor roll: när vi genomför en enkätundersökning betraktas varje fråga som en variabel.

Förberedelser Första steget i arbetet med en enkätundersökning är att formulera undersökningens syfte och översätta detta syfte i en problemformulering. Problemformuleringen kan med fördel uttryckas i form av en punktlista med konkreta men övergripande frågor. Problemformuleringen har en nyckelroll vid konstruktion av enkäter. Nästa steg är att definiera målpopulation, den grupp av individer som vi vill dra slutsatser om och omsätta målpopulationen i en rampopulation, som utgörs av de individer som vi faktiskt vet (åtminstone i teorin) att vi kan få tag i. Vi väljer sedan en lämplig urvalsdesign (för mindre undersökningar oftast OSU) för att ur rampopulationen kunna göra ett stickprov som är så representativt för målpopulationen som möjligt.

Enkätkonstruktion 1. Inled enkäten med bakgrundsfrågor (ålder, kön och liknande). 2. Eftersträva enkelhet i frågorna: korta, koncisa frågor som är neutralt formulerade. 3. Håll nere antalet frågor. För denna undersökning omkring 12-15 frågor. 4. Se till att det finns svarsalternativ för samtliga tänkbara åsikter på varje fråga. 5. Undvik att låta respondenten hoppa för mycket i enkäten (av typen Du som svarat Nej på fråga 12, gå direkt till fråga 15). Konstruera istället enkäten så att man successivt betar av respondenterna efter hur de indelas av enkätfrågorna. 6. Undvik att be respondenten att rangordna svarsalternativ (frågor av typen Sätt en etta på det tvättmedel du helst köper, en tvåa på det som du näst helst köper och så vidare). 7. Avsluta gärna enkäten med en öppen fråga.

Följeinformation Informera i introduktionsbrev eller i enkätens ingress alltid om Vad undersökningen handlar om. Vem som har skickat enkäten (och på vems uppdrag). När enkäten senast ska besvaras. Varför det finns identifikationsnummer, om sådant finns. Identifikationsnummer används ofta vid postenkäter, för att man ska veta vilka som har besvarat enkäten och vilka som behöver få en påminnelse. Var, när och hur man kan ta del av resultaten av undersökningen. Vem man ska vända sig till (namn och telefonnummer) om man har frågor eller problem att fylla i enkäten. (Ej nödvändigt om undersökningen genomförs genom på stan-urval). Tänk i detta sammanhang på att aldrig utlova anonymitet i studien för det kan aldrig garanteras. Däremot kan och bör man se till att de ifyllda enkäterna hanteras konfidentiellt och detta bör också framgå i introduktionsbrevet eller ingressen.

Bortfallshantering Totalbortfall När enkäten inte har besvarats alls. Totalbortfall inträffar på grund av att respondenten inte har tid, vilja eller möjlighet att besvara enkäten. Det kan också bero på problem med det register som har använts, exempelvis genom att registret är föråldrat så att den utvalda respondenten inte bor kvar på den adress enkäten utsänts till och därmed aldrig får den. Partiellt bortfall När en eller flera av frågorna på enkäten inte har besvarats eller inte har besvarats korrekt. Partiellt bortfall inträffar särskilt på känsliga frågor, exempelvis sådana som berör respondentens ekonomi.

Bortfallshantering Redan innan enkäten sänds ut finns det flera åtgärder som kan vidtas för att minska bortfallet. Lägg mycket arbete på utformningen av introduktionsbrevet och enkäten. Se till att layouten är snygg och professionell. Se till att det finns tillräckligt med tid för respondenten att besvara enkäten. Skicka ut minst en påminnelse. Lotta gärna ut priser bland dem som besvarar enkäten (exempelvis biobiljetter eller lotter). Dock måste en tävlingsfråga läggas till.

Hansen-Hurvitz bortfallsplan Vid totalbortfall Dra ett OSU (stickprovsstorleken bestäms av tid och ekonomi) bland de som fått en enkät men inte svarat på den. Kontakta dessa respondenter på ett annat sätt än det tidigare. Vanligt är att använda telefonintervju i detta steg. För att spara tid kan man nöja sig med att bara ställa de viktigaste frågorna till de respondenter som vi får kontakt med i denna fas. Den stora frågan när det handlar om bortfall är kan bortfallet betraktas som slumpmässigt? Genom att separat studera data från den ursprungliga undersökningen och bortfallsuppföljningen kan vi utreda om det föreligger några markanta skillnader mellan materialen eller om bortfallet kan betraktas just som slumpmässigt. Vi kan ta ett steg ytterligare genom att väga ihop resultaten från den ursprungliga undersökningen och bortfallsuppföljningen. Detta görs genom att använda metodik för stratifiering, där vi betraktar de som svarade i den ursprungliga undersökningen som ett stratum och de som besvarade bortfallsuppföljningen som ett annat stratum.

Substitution Vid totalbortfall eller partiellt bortfall Om antalet svarande är så pass litet att ingen analys kan göras kan man tillämpa substitution. Man fyller då på med respondenter som vill svara tills önskad stickprovsstorlek uppnåtts. Det inses att man därmed inte får reda på om bortfallet kan betraktas som slumpmässigt: individer som tillhör den grupp som av ett eller annat skäl inte vill besvara enkäten i första urvalet kommer heller inte att vilja göra det vid substitutionen. Det är därför viktigt att fundera över om stickprovet efter substitution kommer att vara representativt för målpopulationen.

Kodning Kodning innebär att översätta svarsalternativen på varje fråga i sifferform, och att mata in dessa siffror i en statistisk programvara i datorn. Den som kodar har stor frihet, men även här kan några generella råd ges. Avvakta med att påbörja kodningsarbetet tills alla enkäter har kommit in. Syftet med detta är att eventuella problem då kan hanteras på ett enhetligt sätt. Börja sedan med att tilldela varje enkät ett löpnummer. Detta löpnummer skrivs också in i första kolumnen i programvaran. Arbetsbladet i den statistiska programvaran läggs sedan upp på ett sådant sätt att varje kolumn innehåller en fråga och varje rad en respondents enkätsvar.

Kodning av frågor med endast ett tillåtet svarsalternativ Exempel: Vilken är Din huvudsakliga sysselsättning? ( ) Anställd ( ) Egen företagare ( ) Studerande ( ) Pensionär/långtidssjukskriven ( ) Arbetslös ( ) Annat, nämligen Vi har alltså att göra med en kvalitativ fråga (variabel) eftersom svarsalternativen ej fås i sifferform. Frågan kodas med löpnummer 1, 2, 3, 4, 5 eller 6. Kommentarer skrivna under alternativet annat skrivs in i en egen kolumn eller i ett separat dokument. Kommentarerna kan inte analyseras med statistiska metoder men bör ändå sammanställas och presenteras i rapporten. Innehar företaget F-skattesedel? ( ) Ja ( ) Nej En sådan fråga kodas vanligen enligt Ja = 1, Nej = 0 Om frågan dessutom skulle ha ett Vet ej-alternativ kodas detta exempelvis med 2. Försök så långt det är möjligt att konstruera frågor med endast ett tillåtet svarsalternativ, för det är denna typ av frågor som är enklast att analysera.

Kodning av frågor med flera tillåtna svarsalternativ Exempel: Vilka av följande faktorer anser Du tala för internethandel? Fyll gärna i flera alternativ. ( ) Möjlighet att handla när och var som helst ( ) Lägre priser ( ) Enkelt att jämföra varor ( ) Tidsvinst ( ) Stort utbud av varor ( ) Bekvämt att få varorna hemkörda ( ) Annat, nämligen ( ) Vet ej Eftersom flera svarsalternativ är tillåtna inses att kodning med löpnummer ej skulle fungera. Lösningen är istället att låta varje svarsalternativ utgöra en egen kolumn på arbetsbladet och om ett specifikt alternativ är markerat kodas det som 1, annars som 0. Nackdelen med frågor med flera tillåtna svarsalternativ är att det är svårt att göra några statistiska analyser, bortsett från diagram, av resultaten. Frågor av denna typ bör därför så långt det är möjligt undvikas.

Öppna frågor Exempel: Vad är Din månadsinkomst före skatt? kr Skriv in resultaten på arbetsbladet som de är, men för analysernas skull är det ofta nödvändigt att klassindela variabeln i efterhand. Alternativt: Vad är Din månadsinkomst före skatt? ( ) Upp till 10 000 kr ( ) 10 001-20 000 kr ( ) 20 001-30 000 kr ( ) 30 001-40 000 kr ( ) 40 001-50 000 kr ( ) Mer än 50 000 kr Fördel: för respondenten mindre utelämnande att besvara en så pass känslig fråga som inkomst med ett kryss i ett intervall än att faktiskt skriva in den exakta summan Nackdel: på förhand kan det vara svårt att bestämma klassernas bredd och att man därför råkar få väldigt många kryss i en enda klass, vilket försvårar eller omöjliggör analys av korstabeller baserade på frågan.

Kodning av partiellt bortfall Exempel: Fråga 7: Använder Du internetbank? ( ) Ja ( ) Nej Om Du svarade Nej på fråga 7, fortsätt till fråga 9. Om Du svarade Ja, fortsätt till fråga 8. Fråga 8: Hur länge har Du använt internetbank? ( ) Upp till 1 år ( ) 2-3 år ( ) 4-5 år ( ) 6 år eller fler Om svar saknas på en fråga där respondenten inte förutsätts svara (legalt partiellt bortfall) sätts en speciell bortfallskod. Denna väljer man ofta som ett negativt tal som ligger långt borta från de vanliga siffrorna man kodar med, ofta 99. Vid analys måste de legala partiella bortfallen tas speciell hänsyn till, normalt genom att de tas bort ur tabeller och diagram. Om svar saknas på en fråga där respondenten förutsätts svara (illegalt partiellt bortfall) lämnas cellen tom.

Statistisk bearbetning 1. Rita diagram över svarsfördelningen på varje fråga. Viktigt: ta hänsyn till vilken typ av fråga (variabel) det handlar om, eftersom olika diagramtyper används för kvalitativa, diskreta kvantitativa och kontinuerliga kvantitativa variabler. 2. Beräkna beskrivande mått för varje fråga. Även här är det viktigt att hålla reda på vilken variabeltyp respektive fråga är av. 3. Sök samband. Bilda korstabeller (kvalitativa variabler) eller beräkna korrelationskoefficienten/gör regressionsanalys (kvantitativa variabler). 4. Bilda, där så är intressant, konfidensintervall och genomför hypotesprövning.

Arbetsgång 1. Formulera syfte och problemformulering samt genom att definiera målpopulation och rampopulation. 2. Välj om undersökningen ska göras som en totalundersökning, där samtliga enheter i populationen ska ingå, eller som en urvalsundersökning, i vilken ett urval av enheter undersöks. Vi måste också välja stickprovsstorlek och denna bestäms framförallt av tillgänglig tid och budget. 3. Utforma enkäten. 4. Vi prövar nu vår enkät på ett litet antal försökspersoner vi gör en så kallad pilotundersökning. Korrigera enkäten efter vad som framkommer här. 5. Genomför datainsamling genom att skicka ut enkäten. Genomför bortfallsuppföljning. 6. Koda in svaren i statistisk programvara. 7. Analysera resultaten utifrån syfte och problemformulering. rapport. 8. Ge självkritik, genom att kritiskt betrakta ditt arbete och fundera över vad som fungerade bra och vad som kunnat göras annorlunda eller kanske bättre.