Kvantitativa (analys) metoder Roland Sjöström
Metod En metod är ett redskap och ett sätt att lösa problem för att komma fram till ny kunskap. Allt som bidrar till detta kan kallas metod. Det innebär inte att alla metoder klarar en kritisk granskning lika bra. 2006-01-29 Roland Sjöström 2
Mål l med en undersökning Ge bra rekommendationer Dra bra slutsatser Göra bra analyser & tolkningar Samla rätt data med hög kvalitet Vilken roll få slumpen spela? Stor/liten 2006-01-29 Roland Sjöström 3
Tolkning av data 2006-01-29 Roland Sjöström 4
Mål l i förarbetetf Ha rätt perspektiv Förstå sitt undersökningsområde Praktiskt och teoretiskt Fördjupa sig inom rätt frågeområden Inte för få Bra balans Ställa rätt frågor Självklart!? (Kvalitativ intervju ett intervjutillfälle?) (Ställa frågor rätt) 2006-01-29 Roland Sjöström 5
Kvalitativa data Data som inte på en meningsfullt sätt går att översätta i sifferform Skilja mellan orka/tycka och precision i analysen 2006-01-29 Roland Sjöström 6
All statistik handlar om. 2006-01-29 Roland Sjöström 7
Tre faser Nedbrytning Datainsamling Uppbyggnad Logiska nivåer? jmfr syfte - slutsatser t 2006-01-29 Roland Sjöström 8
Mål l med förelf reläsningen/seminariet Du ska efter detta pass känna till (med fokus på kvantitativa undersökningar): relationerna mellan de logiska nivåerna i en undersökning/avhandling vad som ingår i respektive logisk nivå fällor och fel 2006-01-29 Roland Sjöström 9
"U-et" Syfte Ref. ram preciserad uppgift ansats & metod Mätteknik & mätinstrument Grunddata Beslutsanalys Rekommendationer Slutsatser Analys & tolkning "Beskrivning" Värdering av metod m m Fältarbete 2006-01-29 Roland Sjöström 10
Beslutsanalys (problemanalys) Mål Ta fram ett helikopter eller panoramaperspektiv över det som ska undersökas 2006-01-29 Roland Sjöström 11
Beslutsanalys (problemanalys) Vad ska resultatet användas till och av vem? dvs en tydlig och väl avgränsad beslutsfråga Diagnos av beslutsfrågan (diagnosis; grekiska betyder undersöka, söka orsaken till något.) kräver en analysmodell (analys= sönderdelning), t.ex. träddiagram målet är att dela upp beslutsfrågan i delfrågor och bakomliggande faktorer Centrala begrepp 2006-01-29 Roland Sjöström 12
Syfte Mål: Ange vilken typ av slutsatser som ska dras Vanligt fel: Slutsatsområden, t.ex. faktorer som påverkar ej formulerad så att det går att avgöra om syftet är uppfyllt eller ej Typer av syften explorativa, beskrivande, förklarande, förutsägande 2006-01-29 Roland Sjöström 13
syfte Referensram Mål: förklara hur data ska analyseras nedbrytning av syftet i analyserbara delar hypotetisk modell (gärna grafisk) Teori - att referera och relatera Referensram - att reflektera vad betyder teorin för mitt problem När är reframen tillräckligt bra? olyckor/tusen mil utförsåkning 2006-01-29 Roland Sjöström 14
Preciserad uppgift (konkreta undersökningsfr kningsfrågor) gor) Mål: Precisera de frågor eller frågeområden som undersökningen ska ge svar på Motsvaras ofta av rubriker i analysavsnittet Hur? Varför? Vanligt fel hur och varför blev det just dessa frågor? Avgränsningar logiska och resursmässiga 2006-01-29 Roland Sjöström 15
Målpopulation De företag/organisationer/individer som ska beskrivas och analyseras. Ramfel nettopopulation 100-200 per målpopulation analysgrupp bruttopopulation undertäckning övertäckning 2006-01-29 Roland Sjöström 16
Representativitet Undersöka björnar 2006-01-29 Roland Sjöström 17
Inferensproblem Inferens är att dra slutsatser om en målpopulation på grundval av resultaten från de enheter i målpopulationen som faktiskt har undersökts - gäller alla undersökningar där inte samtliga enheter har undersökts - representativa (bedömning görs på förhand) inomformulärsbortfall => svars % varierar mellan frågor (mindre än ca 70% bearbetningsbara svar => skepsis) minska bortfall - bra formulär, säkra deltagande (t.ex. ringa), belöning?, påminnelse analys av bortfall 2006-01-29 Roland Sjöström 18
Inferensproblem, forts Urvalets storlek - Två grupper ska undersökas, 5.000 ftg resp 500 ftg, vi har resurser att genomföra 100 intervjuer - Hur ska vi fördela dem? 2006-01-29 Roland Sjöström 19
syfte Mätteknik Inleds med en reflektion över hur data ska analyseras Handlar om konsten att inte förstöra en del av informationsinnehållet i ett svar genom att mäta på fel sätt operationalisering av begrepp användning av variabler mätskalor konstruktion av enskilda frågor konstruktion av hela formulär 2006-01-29 Roland Sjöström 20
Operationalisering av begrepp = översätta begrepp och frågor till något n som respondenten förstf rstår Faktorer som påverkar en tjänst people Produkt process Phys. Ev.. fysisk produkt kärnvärde icke fysisk 2006-01-29 Roland Sjöström 21
Variabel Flervalsfrågor Viktigaste konkurrenter 2006-01-29 Roland Sjöström 22
Analys & mätteknikm - utgår från preciserade uppgiften (de konkreta undersökningsfrågorna), ansats, metod för datainsamling - Nominalskala bör vara uttömmande och uteslutande 0 man 0 kvinna - Ordinalskala (rangordningar - hur göra) 0 inst helt 0 inst delvis 0 varken eller... 2006-01-29 Roland Sjöström 23
Mätteknik, forts - Intervallskala inst. inte alls 0 0 0 0 0 inst. helt udda/jämn antal - Kvotskala, intervallskala med absolut nollpunkt (omsättning? tid?) (ej ordinalskala) - öppna frågor - "ingen åsikt/uppfattning" - möjlighet att lägga till 2006-01-29 Roland Sjöström 24
Respondentens tre nivåer Kvalité, pris Strategier Helhetsbedömningar 2006-01-29 Roland Sjöström 25
Konstruktion av formulär - Instruktioner (vid enkät) - Ordningsföljd logisk för respondenten - Ej inleda med känsliga frågor för respondenten - Tidsordning - Fakta & kännedom, allmän åsikt, specifik åsikt, skäl för åsikt, intensitet i åsikt - Filterfrågor - Kontrollfrågor - Provintervjuer 2006-01-29 Roland Sjöström 26
Prövning av formulär - intressant för respondenten - begripligt språk för respondenten - fri från ledande inslag - ej väcka försvarsinstinkter - fri från oavsiktliga emotionellt, socialt, politiskt etc laddade ord -tidsåtgång Respondenten som "expert" 2006-01-29 Roland Sjöström 27
Frågors ordningsföljd Komplexitet Början och slut av uppräkning melodifestivalen 5-6 alternativ Överspillningseffekten 2006-01-29 Roland Sjöström 28
Källa: Expressen 12 mars 2005 2006-01-29 Roland Sjöström 29
Laddade ord & ledande frågor Frågor avgr i tid och rum i övrigt neutrala Inte tillåta - förbjuda 2006-01-29 Roland Sjöström 30
Kodning & Analys Enhet Antal Medel Nedre Övre Min max 1 16 3,31 2,77 3,85 1 5 2 36 3,86 3,62 4,11 2 5 3 48 3,58 3,28 3,89 1 5 4 73 3,53 3,35 3,72 1 5 Är några av medelvärdesskillnaderna signifikanta? 5 203 3,49 3,36 3,72 1 5 2006-01-29 Roland Sjöström 31
Analys 2 Är tabellen signifikant, dvs skiljer sig fördelningen från slumpen? Utbildning * kön Crosstabulation Count Utbildning Total Grundskola Gymnasium 2-3 år Gymnasium 4 år Högskoleingenjör Civilingenjör Annat kön Kvinna Man Total 8 50 58 28 168 196 19 245 264 10 92 102 26 229 255 2 12 14 93 796 889 2006-01-29 Roland Sjöström 32
Val av analysmetoder en (beroende variabel) nominal skalnivå ordinal intervall kvot nominal Skalnivå prediktor (x) Skalnivå prediktor (x) nominal Skalnivå prediktor (x) ordinal intervall nominal intervall ordinal intervall stopp stopp stopp stopp Chi-två Cont. coeff Diskriminant analys Spearman s Rank korr. Regression med dummy var. (0/1) Regressions analys 2006-01-29 Roland Sjöström 33
ingen (beroende variabel) Val av analysmetoder nominal skalnivå ordinal intervall kvot Faktoranalys med dummy var. Klusteranalys överkurs Faktoranalys Klusteranalys 2006-01-29 Roland Sjöström 34
Analys av skillnader Chi-två test Män/kvinnor resturang 1/2 Utan väntevärde är tabellen svårtolkad 2 = (O-E) 2 E (O) 2 = -N E Ur tabell testvärde (95% nivån) ca 4 för fyrfältare ca 9 för niofältare nästan 16 för 16 fältare (eg. 15) 2006-01-29 Roland Sjöström 35
Medelfel och konf intervall Exemplet testförsäljning Avsikten med denna test kan vara flera men här koncentrerar vi oss på volymen. Anta att det krävs en viss minsta volym för att produkten ska anses bli lönsam och för att företaget därför ska gå vidare till en fullskaleförsäljning. Testförsäljningar är dessutom ofta kostsamma och företagen försöker begränsa dem till ett fåtal marknader. Antag att företag X bedriver testförsäljning på tre marknader. Kravet för att produkten ska gå vidare till fullskaleförsäljning är att den i genomsnitt säljs i minst 100 exemplar per marknad. 2006-01-29 Roland Sjöström 36
Medelfel och konf intervall, forts. Antal sålda produkter Marknad 1 Marknad 2 Marknad 3 130 120 86 Medelvärdet i denna testförsäljning är klart över 100, närmare bestämt 112. Målet borde vara uppfyllt och det borde bara vara att gå vidare. Men, på grund av den stora spridningen visar det sig att testförsäljningen inte har uppfyllt målet med 95 procents sannolikhet. 2006-01-29 Roland Sjöström 37
T-test Det kritiska värdet för denna test erhålls ur en tabell för t- fördelning där antalet frihetsgrader är n-1, dvs 2 och alfa=0,05. Det kritiska värdet är 4,3 och eftersom det beräknade värdet inte överstiger det kritiska värdet måste hypotesen att målet var uppfyllt förkastas. (Det kritiska värdet är ca 4 för få frihetsgrader och ca 2 för +100 frihetsgrader.) Först vid 80 procent (istället för 95) är testförsäljningen "signifikant", dvs man kan med 80 procents säkerhet påstå att försäljningen kommer att uppgå till minst 100 enheter i snitt per marknad. 2006-01-29 Roland Sjöström 38
Jämföra två medelvärden Tre olika grundläggande förutsättningar Känd varians i mätningarna (sample); ovanligt Varians okänd men antas vara lika (inte heller vanligt) Varians okänd men antas vara olika För att testa skillnader mellan två medelvärden använder man sig vanligtvis av en t-test. Den andra och tredje situationen innebär att man måste räkna ut medelvärde och medelfel för de två grupperna. Detta görs på motsvarande sätt som för ett medelvärde. Skillnaden i t-testet är att man jämför skillnader i medelvärde och dividerar med det totala medelfelet. 2006-01-29 Roland Sjöström 39
Variansanalys (Anova( Anova) I sin enklaste variant ett F-test som är en direkt vidareutveckling av t-testet Två centrala begrepp Mellangruppsvarians Totala variansen för alla som ingår i undersökningen i relation till det totala genomsnittet Inomgruppsvarians Totala variansen inom de olika grupperna i relation till deras respektive genomsnitt F-test=---------------- mellangruppsvarians inomgruppsvarians 2006-01-29 Roland Sjöström 40
Variansanalys, forts Om t.ex. kvinnor och män verkligen har samma åsikt så är inomgruppsvariansen densamma. Ju mer mellangruppsvariansen överstiger inomgruppsvariansen desto större är chansen att de har olika uppfattning => att nollhypotesen kan förkastas Tre grupper, t.ex. olika utbildningsprogram ger samma tolkning En grupp kan medföra att nollhypotesen förkastas => viktigt att gå vidare i analysen (t.ex. Bonferroni-test) 2006-01-29 Roland Sjöström 41
Medelvärdesanalyser trubbigt instrument Människor är olika trygga eller otrygga positiva eller skeptiska benägenhet att uttrycka vad de egentligen anser etc en del instämmer i det mesta medan andra tar avstånd en tredje grupp svara alltid någonstans mitt emellan Medelvärden tenderar alltså att bli ett mycket trubbigt instrument annat än för återkommande undersökningar där avsikten är att mäta avvikelser från tidigare undersökningar 2006-01-29 Roland Sjöström 42
Analys av likheter Korrelations- och enkel regressionsanalys Används ofta som substitut Stora likheter En avgörande skillnad Korrelation - gemensam varians Regression - prediktering av värde bästa skattning utan regression?? linjära samband 2006-01-29 Roland Sjöström 43
Regressionsanalys Anses ha använts första gången av Francis Galton (1822-1911) samband mellan föräldrars och barns längd tendens mot mitten kallades regression inom geovetenskap regression då strandlinjen förskjuts utåt; drar sig tillbaka inom biologi och beteendevetenskap betyder regression tillbakagång till mera primitiva funktions- eller utvecklingsnivåer hos en individ eller ett organ. I statistiska sammanhang betyder regression att en storhet beror av en eller flera storheter. Kopplingen till "tillbakagång" är att alla värden relateras till medelvärdet, dvs man mäter avvikelser från det förväntade värdet som är medelvärdet. 2006-01-29 Roland Sjöström 44
Linjär r regression Y ^ Y e Y=¾+ßX X 2006-01-29 Roland Sjöström 45
Multipel regression Flera variabler R 2 Multikollinearitet x 1 =a+b 2 x 2 +b 3 x 3 analysera R 2 Regression på faktorer 2006-01-29 Roland Sjöström 46
Korrelation En av de mest kända formlerna utvecklades av en medarbetare till regressionens "grundare" Galton som hette Karl Pearson. Pearsons formel var en vidareutveckling av Galtons grundläggande idé om dragning mot ett medelvärde och kallas produktmomentkorrelationskoefficient. Likhet med regression? 2006-01-29 Roland Sjöström 47