Kvantitativa (analys) metoder. Roland Sjöström

Relevanta dokument
Kvantitativa (analys) metoder

Att välja statistisk metod

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

OBS! Vi har nya rutiner.

Föreläsning 1: Introduktion. Vad är statistik?

Repetitionsföreläsning

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Statistik Termin 10, Läkarprogrammet, HT16

, s a. , s b. personer från Alingsås och n b

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Uppgift 1. Produktmomentkorrelationskoefficienten

Hypotestestning och repetition

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Föreläsning G60 Statistiska metoder

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

F3 Introduktion Stickprov

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

för att komma fram till resultat och slutsatser

kodnr: 2) OO (5p) Klassindelningar

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Laboration 3: Urval och skattningar

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Allmänna anvisningar: - Nästkommande tentamenstillfälle: Tidigast två veckor efter det att resultatet från denna tenta blivit inregistrerat.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Statistik 1 för biologer, logopeder och psykologer

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Höftledsdysplasi hos dansk-svensk gårdshund

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Kritisk granskning av forskning

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Sammanfattning av dugga 2

KVANTITATIV FORSKNING

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning G70 Statistik A

Kvantitativ metod. Föreläsning Kristin Wiksell

Statistiska undersökningar

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

FACIT (korrekta svar i röd fetstil)

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Metod1. Intervjuer och observationer. Ex post facto, laboratorie -, fältexperiment samt fältstudier. forskningsetik

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

ANOVA Mellangruppsdesign

Föreläsning 12: Regression

Fråga nr a b c d 2 D

Kvantitativa metoder och datainsamling

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

import totalt, mkr index 85,23 100,00 107,36 103,76

OBS! Vi har nya rutiner.

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

OBS! Vi har nya rutiner.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Laboration 3: Urval och skattningar

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Laboration 3 Inferens fo r andelar och korstabeller

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Mall och manual för granskning av interventionsstudier

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Anvisningar till rapporter i psykologi på B-nivå

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Statistik 1 för biologer, logopeder och psykologer

Lösningar till SPSS-övning: Analytisk statistik

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Transkript:

Kvantitativa (analys) metoder Roland Sjöström

Metod En metod är ett redskap och ett sätt att lösa problem för att komma fram till ny kunskap. Allt som bidrar till detta kan kallas metod. Det innebär inte att alla metoder klarar en kritisk granskning lika bra. 2006-01-29 Roland Sjöström 2

Mål l med en undersökning Ge bra rekommendationer Dra bra slutsatser Göra bra analyser & tolkningar Samla rätt data med hög kvalitet Vilken roll få slumpen spela? Stor/liten 2006-01-29 Roland Sjöström 3

Tolkning av data 2006-01-29 Roland Sjöström 4

Mål l i förarbetetf Ha rätt perspektiv Förstå sitt undersökningsområde Praktiskt och teoretiskt Fördjupa sig inom rätt frågeområden Inte för få Bra balans Ställa rätt frågor Självklart!? (Kvalitativ intervju ett intervjutillfälle?) (Ställa frågor rätt) 2006-01-29 Roland Sjöström 5

Kvalitativa data Data som inte på en meningsfullt sätt går att översätta i sifferform Skilja mellan orka/tycka och precision i analysen 2006-01-29 Roland Sjöström 6

All statistik handlar om. 2006-01-29 Roland Sjöström 7

Tre faser Nedbrytning Datainsamling Uppbyggnad Logiska nivåer? jmfr syfte - slutsatser t 2006-01-29 Roland Sjöström 8

Mål l med förelf reläsningen/seminariet Du ska efter detta pass känna till (med fokus på kvantitativa undersökningar): relationerna mellan de logiska nivåerna i en undersökning/avhandling vad som ingår i respektive logisk nivå fällor och fel 2006-01-29 Roland Sjöström 9

"U-et" Syfte Ref. ram preciserad uppgift ansats & metod Mätteknik & mätinstrument Grunddata Beslutsanalys Rekommendationer Slutsatser Analys & tolkning "Beskrivning" Värdering av metod m m Fältarbete 2006-01-29 Roland Sjöström 10

Beslutsanalys (problemanalys) Mål Ta fram ett helikopter eller panoramaperspektiv över det som ska undersökas 2006-01-29 Roland Sjöström 11

Beslutsanalys (problemanalys) Vad ska resultatet användas till och av vem? dvs en tydlig och väl avgränsad beslutsfråga Diagnos av beslutsfrågan (diagnosis; grekiska betyder undersöka, söka orsaken till något.) kräver en analysmodell (analys= sönderdelning), t.ex. träddiagram målet är att dela upp beslutsfrågan i delfrågor och bakomliggande faktorer Centrala begrepp 2006-01-29 Roland Sjöström 12

Syfte Mål: Ange vilken typ av slutsatser som ska dras Vanligt fel: Slutsatsområden, t.ex. faktorer som påverkar ej formulerad så att det går att avgöra om syftet är uppfyllt eller ej Typer av syften explorativa, beskrivande, förklarande, förutsägande 2006-01-29 Roland Sjöström 13

syfte Referensram Mål: förklara hur data ska analyseras nedbrytning av syftet i analyserbara delar hypotetisk modell (gärna grafisk) Teori - att referera och relatera Referensram - att reflektera vad betyder teorin för mitt problem När är reframen tillräckligt bra? olyckor/tusen mil utförsåkning 2006-01-29 Roland Sjöström 14

Preciserad uppgift (konkreta undersökningsfr kningsfrågor) gor) Mål: Precisera de frågor eller frågeområden som undersökningen ska ge svar på Motsvaras ofta av rubriker i analysavsnittet Hur? Varför? Vanligt fel hur och varför blev det just dessa frågor? Avgränsningar logiska och resursmässiga 2006-01-29 Roland Sjöström 15

Målpopulation De företag/organisationer/individer som ska beskrivas och analyseras. Ramfel nettopopulation 100-200 per målpopulation analysgrupp bruttopopulation undertäckning övertäckning 2006-01-29 Roland Sjöström 16

Representativitet Undersöka björnar 2006-01-29 Roland Sjöström 17

Inferensproblem Inferens är att dra slutsatser om en målpopulation på grundval av resultaten från de enheter i målpopulationen som faktiskt har undersökts - gäller alla undersökningar där inte samtliga enheter har undersökts - representativa (bedömning görs på förhand) inomformulärsbortfall => svars % varierar mellan frågor (mindre än ca 70% bearbetningsbara svar => skepsis) minska bortfall - bra formulär, säkra deltagande (t.ex. ringa), belöning?, påminnelse analys av bortfall 2006-01-29 Roland Sjöström 18

Inferensproblem, forts Urvalets storlek - Två grupper ska undersökas, 5.000 ftg resp 500 ftg, vi har resurser att genomföra 100 intervjuer - Hur ska vi fördela dem? 2006-01-29 Roland Sjöström 19

syfte Mätteknik Inleds med en reflektion över hur data ska analyseras Handlar om konsten att inte förstöra en del av informationsinnehållet i ett svar genom att mäta på fel sätt operationalisering av begrepp användning av variabler mätskalor konstruktion av enskilda frågor konstruktion av hela formulär 2006-01-29 Roland Sjöström 20

Operationalisering av begrepp = översätta begrepp och frågor till något n som respondenten förstf rstår Faktorer som påverkar en tjänst people Produkt process Phys. Ev.. fysisk produkt kärnvärde icke fysisk 2006-01-29 Roland Sjöström 21

Variabel Flervalsfrågor Viktigaste konkurrenter 2006-01-29 Roland Sjöström 22

Analys & mätteknikm - utgår från preciserade uppgiften (de konkreta undersökningsfrågorna), ansats, metod för datainsamling - Nominalskala bör vara uttömmande och uteslutande 0 man 0 kvinna - Ordinalskala (rangordningar - hur göra) 0 inst helt 0 inst delvis 0 varken eller... 2006-01-29 Roland Sjöström 23

Mätteknik, forts - Intervallskala inst. inte alls 0 0 0 0 0 inst. helt udda/jämn antal - Kvotskala, intervallskala med absolut nollpunkt (omsättning? tid?) (ej ordinalskala) - öppna frågor - "ingen åsikt/uppfattning" - möjlighet att lägga till 2006-01-29 Roland Sjöström 24

Respondentens tre nivåer Kvalité, pris Strategier Helhetsbedömningar 2006-01-29 Roland Sjöström 25

Konstruktion av formulär - Instruktioner (vid enkät) - Ordningsföljd logisk för respondenten - Ej inleda med känsliga frågor för respondenten - Tidsordning - Fakta & kännedom, allmän åsikt, specifik åsikt, skäl för åsikt, intensitet i åsikt - Filterfrågor - Kontrollfrågor - Provintervjuer 2006-01-29 Roland Sjöström 26

Prövning av formulär - intressant för respondenten - begripligt språk för respondenten - fri från ledande inslag - ej väcka försvarsinstinkter - fri från oavsiktliga emotionellt, socialt, politiskt etc laddade ord -tidsåtgång Respondenten som "expert" 2006-01-29 Roland Sjöström 27

Frågors ordningsföljd Komplexitet Början och slut av uppräkning melodifestivalen 5-6 alternativ Överspillningseffekten 2006-01-29 Roland Sjöström 28

Källa: Expressen 12 mars 2005 2006-01-29 Roland Sjöström 29

Laddade ord & ledande frågor Frågor avgr i tid och rum i övrigt neutrala Inte tillåta - förbjuda 2006-01-29 Roland Sjöström 30

Kodning & Analys Enhet Antal Medel Nedre Övre Min max 1 16 3,31 2,77 3,85 1 5 2 36 3,86 3,62 4,11 2 5 3 48 3,58 3,28 3,89 1 5 4 73 3,53 3,35 3,72 1 5 Är några av medelvärdesskillnaderna signifikanta? 5 203 3,49 3,36 3,72 1 5 2006-01-29 Roland Sjöström 31

Analys 2 Är tabellen signifikant, dvs skiljer sig fördelningen från slumpen? Utbildning * kön Crosstabulation Count Utbildning Total Grundskola Gymnasium 2-3 år Gymnasium 4 år Högskoleingenjör Civilingenjör Annat kön Kvinna Man Total 8 50 58 28 168 196 19 245 264 10 92 102 26 229 255 2 12 14 93 796 889 2006-01-29 Roland Sjöström 32

Val av analysmetoder en (beroende variabel) nominal skalnivå ordinal intervall kvot nominal Skalnivå prediktor (x) Skalnivå prediktor (x) nominal Skalnivå prediktor (x) ordinal intervall nominal intervall ordinal intervall stopp stopp stopp stopp Chi-två Cont. coeff Diskriminant analys Spearman s Rank korr. Regression med dummy var. (0/1) Regressions analys 2006-01-29 Roland Sjöström 33

ingen (beroende variabel) Val av analysmetoder nominal skalnivå ordinal intervall kvot Faktoranalys med dummy var. Klusteranalys överkurs Faktoranalys Klusteranalys 2006-01-29 Roland Sjöström 34

Analys av skillnader Chi-två test Män/kvinnor resturang 1/2 Utan väntevärde är tabellen svårtolkad 2 = (O-E) 2 E (O) 2 = -N E Ur tabell testvärde (95% nivån) ca 4 för fyrfältare ca 9 för niofältare nästan 16 för 16 fältare (eg. 15) 2006-01-29 Roland Sjöström 35

Medelfel och konf intervall Exemplet testförsäljning Avsikten med denna test kan vara flera men här koncentrerar vi oss på volymen. Anta att det krävs en viss minsta volym för att produkten ska anses bli lönsam och för att företaget därför ska gå vidare till en fullskaleförsäljning. Testförsäljningar är dessutom ofta kostsamma och företagen försöker begränsa dem till ett fåtal marknader. Antag att företag X bedriver testförsäljning på tre marknader. Kravet för att produkten ska gå vidare till fullskaleförsäljning är att den i genomsnitt säljs i minst 100 exemplar per marknad. 2006-01-29 Roland Sjöström 36

Medelfel och konf intervall, forts. Antal sålda produkter Marknad 1 Marknad 2 Marknad 3 130 120 86 Medelvärdet i denna testförsäljning är klart över 100, närmare bestämt 112. Målet borde vara uppfyllt och det borde bara vara att gå vidare. Men, på grund av den stora spridningen visar det sig att testförsäljningen inte har uppfyllt målet med 95 procents sannolikhet. 2006-01-29 Roland Sjöström 37

T-test Det kritiska värdet för denna test erhålls ur en tabell för t- fördelning där antalet frihetsgrader är n-1, dvs 2 och alfa=0,05. Det kritiska värdet är 4,3 och eftersom det beräknade värdet inte överstiger det kritiska värdet måste hypotesen att målet var uppfyllt förkastas. (Det kritiska värdet är ca 4 för få frihetsgrader och ca 2 för +100 frihetsgrader.) Först vid 80 procent (istället för 95) är testförsäljningen "signifikant", dvs man kan med 80 procents säkerhet påstå att försäljningen kommer att uppgå till minst 100 enheter i snitt per marknad. 2006-01-29 Roland Sjöström 38

Jämföra två medelvärden Tre olika grundläggande förutsättningar Känd varians i mätningarna (sample); ovanligt Varians okänd men antas vara lika (inte heller vanligt) Varians okänd men antas vara olika För att testa skillnader mellan två medelvärden använder man sig vanligtvis av en t-test. Den andra och tredje situationen innebär att man måste räkna ut medelvärde och medelfel för de två grupperna. Detta görs på motsvarande sätt som för ett medelvärde. Skillnaden i t-testet är att man jämför skillnader i medelvärde och dividerar med det totala medelfelet. 2006-01-29 Roland Sjöström 39

Variansanalys (Anova( Anova) I sin enklaste variant ett F-test som är en direkt vidareutveckling av t-testet Två centrala begrepp Mellangruppsvarians Totala variansen för alla som ingår i undersökningen i relation till det totala genomsnittet Inomgruppsvarians Totala variansen inom de olika grupperna i relation till deras respektive genomsnitt F-test=---------------- mellangruppsvarians inomgruppsvarians 2006-01-29 Roland Sjöström 40

Variansanalys, forts Om t.ex. kvinnor och män verkligen har samma åsikt så är inomgruppsvariansen densamma. Ju mer mellangruppsvariansen överstiger inomgruppsvariansen desto större är chansen att de har olika uppfattning => att nollhypotesen kan förkastas Tre grupper, t.ex. olika utbildningsprogram ger samma tolkning En grupp kan medföra att nollhypotesen förkastas => viktigt att gå vidare i analysen (t.ex. Bonferroni-test) 2006-01-29 Roland Sjöström 41

Medelvärdesanalyser trubbigt instrument Människor är olika trygga eller otrygga positiva eller skeptiska benägenhet att uttrycka vad de egentligen anser etc en del instämmer i det mesta medan andra tar avstånd en tredje grupp svara alltid någonstans mitt emellan Medelvärden tenderar alltså att bli ett mycket trubbigt instrument annat än för återkommande undersökningar där avsikten är att mäta avvikelser från tidigare undersökningar 2006-01-29 Roland Sjöström 42

Analys av likheter Korrelations- och enkel regressionsanalys Används ofta som substitut Stora likheter En avgörande skillnad Korrelation - gemensam varians Regression - prediktering av värde bästa skattning utan regression?? linjära samband 2006-01-29 Roland Sjöström 43

Regressionsanalys Anses ha använts första gången av Francis Galton (1822-1911) samband mellan föräldrars och barns längd tendens mot mitten kallades regression inom geovetenskap regression då strandlinjen förskjuts utåt; drar sig tillbaka inom biologi och beteendevetenskap betyder regression tillbakagång till mera primitiva funktions- eller utvecklingsnivåer hos en individ eller ett organ. I statistiska sammanhang betyder regression att en storhet beror av en eller flera storheter. Kopplingen till "tillbakagång" är att alla värden relateras till medelvärdet, dvs man mäter avvikelser från det förväntade värdet som är medelvärdet. 2006-01-29 Roland Sjöström 44

Linjär r regression Y ^ Y e Y=¾+ßX X 2006-01-29 Roland Sjöström 45

Multipel regression Flera variabler R 2 Multikollinearitet x 1 =a+b 2 x 2 +b 3 x 3 analysera R 2 Regression på faktorer 2006-01-29 Roland Sjöström 46

Korrelation En av de mest kända formlerna utvecklades av en medarbetare till regressionens "grundare" Galton som hette Karl Pearson. Pearsons formel var en vidareutveckling av Galtons grundläggande idé om dragning mot ett medelvärde och kallas produktmomentkorrelationskoefficient. Likhet med regression? 2006-01-29 Roland Sjöström 47