Statistiska analyser C2 Bivariat analys. Wieland Wermke

Relevanta dokument
Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Uppgift 1. Produktmomentkorrelationskoefficienten

OBS! Vi har nya rutiner.

Linjär regressionsanalys. Wieland Wermke

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

OBS! Vi har nya rutiner.

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Repetitionsföreläsning

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Att välja statistisk metod

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

Psykologi som vetenskap

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

OBS! Vi har nya rutiner.

Kvantitativ strategi Univariat analys 2. Wieland Wermke

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Lösningar till SPSS-övning: Analytisk statistik

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Statistik 1 för biologer, logopeder och psykologer

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

OBS! Vi har nya rutiner.

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

KVANTITATIV FORSKNING

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Hypotestestning och repetition

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Medicinsk statistik II

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Statistik Termin 10, Läkarprogrammet, HT16

Statistik och epidemiologi T5

F3 Introduktion Stickprov

SF1901 Sannolikhetsteori och statistik I

Statistik 1 för biologer, logopeder och psykologer

Mata in data i Excel och bearbeta i SPSS

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Kvantitativ strategi viktiga begrepp 3. Wieland Wermke

Statsvetenskapliga metoder, Statsvetenskap 2 Metoduppgift 4

Föreläsning 7: Punktskattningar

Statistiska undersökningar

Föreläsning 7: Punktskattningar

Statistik och epidemiologi T5

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Vetenskaplig metod och statistik

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

2.1 Minitab-introduktion

Intro till SPSS Kimmo Sorjonen (0811)

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Tillämpad statistik Naprapathögskolan. Henrik Källberg Tel

Forsknings- och undersökningsmetodik Skrivtid: 4h

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

OBS! Vi har nya rutiner.

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Allmänna anvisningar: - Nästkommande tentamenstillfälle: Tidigast två veckor efter det att resultatet från denna tenta blivit inregistrerat.

Kursnamn: Vetenskapsteori och grundläggande forskningsmetod

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

F9 SAMPLINGFÖRDELNINGAR (NCT

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

HYPOTESPRÖVNING sysselsättning

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Gamla tentor (forts) ( x. x ) ) 2 x1

Ex post facto forskning Systematisk, empirisk undersökning. om rökning så cancer?

7.5 Experiment with a single factor having more than two levels

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

SOPA62 - Kunskapsproduktion i socialt arbete

Stokastiska signaler. Mediesignaler

Medicinsk statistik II

Analytisk statistik. Tony Pansell, optiker Universitetslektor

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tentamen Metod C vid Uppsala universitet, , kl

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Transkript:

+ Statistiska analyser C2 Bivariat analys Wieland Wermke

+ Bivariat analys n Mål: Vi vill veta något om ett samband mellan två fenomen n à inom kvantitativa strategier kan man undersöka detta genom att söka statistiska mönster mellan (minst) två variabler n à Variabel: en egenskap som varierar i ett urval observationsenheter

+ Bivariat analys n Om man vet hur två variabler samvarierar, kan man, om man känner till värdet i ena variabeln, förutsäga värdet på den andra variabeln (med större säkerhet än om man bara gissar) n https://www.youtube.com/watch? v=vfjabh12c6s

+ Bivariat analys n En ökning/minskning av ett fenomen leder till en ökning/minskning av ett annat fenomen (samvariation), det kan vara: n ensidiga samband: t.ex. högre intelligens kan leda till bättre betyg i skolan, men inte tvärtom n ömsesidiga samband: en mer förtroendefull organisationskultur leder till bättre prestationer av medarbetare n skensamband: ju längre människor är, ju högre utbildning har de, här är det egentligen en annan variabel som verkar i bakgrunden

+ Samband Kausalitet? n När vi vill undersöka orsak-verkan, måste vi bestämma oss innan vi räknar vad som är n den beroende variabeln, dvs. den variabeln som påverkas n den oberoende variabeln, dvs. den variabeln som påverkar n Men kan man sedan verkligen påstå att ett samband är kausalt? n Omvänt samband, ömsesidigt samband, slumpen, skensamband? n Statistiskt samband utan kausalitet, kausalitet utan statistiskt samband?

+ Hur kan man hävda kausalitet? n Dessa steg behövs för att kunna uttala sig om kausalitet: n det finns ett samband i en riktning n det finns en teori att ett kausalt sammanhang är möjligt och plausibelt (före-efter, oberoende-beroende) n Alla andra möjliga faktorer är kontrollerade/ uteslutna n Exempel: högre Intelligens à högre betyg (bara ett möjligt samband ang. betyg???)

+ Hur kan man hävda kausalitet? n Dessa steg behövs för att kunna uttala sig om kausalitet: 1) A går i tiden före B. n det finns ett samband i en riktning n det 2) finns A och en teori B berör att ett varandra kausalt sammanhang i tid och rum. är möjligt och plausibelt (före-efter, oberoende-beroende) 3) Om A inträffar så är det nödvändigt att B inträffar. n Alla andra möjliga faktorer är kontrollerade/ uteslutna En orsak är en nödvändig del av ett komplex av n Exempel: villkor högre vilka Intelligens tillsammans à högre är tillräckliga betyg (bara ett för möjligt verkan samband ang. betyg???)

+ Hur kan man hävda kausalitet? n Mycket tankearbete vad det gäller undersökningsdesign! n Vilka variabler måste samlas in hur för att kontrollera sambandet? n Hur ska data samlas in, vad är ett passande urval? n Kan man kanske använda experiment där man försöker utesluta alla påverkande variabler? n Vilken form av randomisering av undersökningsgrupperna? n Stark teori och förankring i tidigare forskning! n Om du inte kan vara helt säkert på en kausal relation, bättre att då uttrycka att det finns bara ett SAMBAND (som också kan vara riktat)

+ En första ingång: korstabeller (nominal/ordinal) n I en korstabell definierar den ena variabeln rader, den andra kolumner n Korstabeller kan ha n absoluta siffror n procentandel (antal kategori/antal n * 100) n Vid korstabeller med procent kan man på olika sätt bestämma sig, om man vill sammanfatta rader eller kolumner, eller båda

+ Korstabeller n Hur ser relationen mellan mattebetyg och tentamensångest ut? Mattebetyg * Tentamensångest dikotomiserat Crosstabulation! Mattebetyg Total IG G VG MVG Tentamensångest dikotomiserat ingen/lite tentamensånge st tentamensånge st Total Count 0 2 2 % of Total 0.0% 4.0% 4.0% Count 0 24 24 % of Total 0.0% 48.0% 48.0% Count 6 10 16 % of Total 12.0% 20.0% 32.0% Count 4 4 8 % of Total 8.0% 8.0% 16.0% Count 10 40 50 % of Total 20.0% 80.0% 100.0%

+ Olika samband i diagram y ** ** *** *** ** ** Positivt (+ 1.00) x y ** * ** * *** ** * * ** ** ** ** *** * ** Neutralt (noll) (± 0.00) x y ** *** *** ** *** ** Negativt (- 1.00) x y ** ** *** ** ** ** ** ** ** ** ** Non-linjärt (±0.00) x Ex. Positivt samband mellan provpoäng och betyg Inget samband mellan har och betyg Negativt samband mellan frånvaro och betyg Grad av njutning i samband med alkohol Ju högre X desto högre Y Källa: Tom Wikman, Åbo Akademi X har inget samband med Y Ju högre X desto lägre Y Ju högre X desto högre Y till en viss nivå sedan lägre 11

+ Statistiska samband: Korrelation n om vi känner en undersökningsenhets ena egenskap kan vi också säga något om en annan egenskap hos undersökningsenheten (mer än om vi gissar) n Med vilken säkerhet kan vi förutsäga ett samband = sambandets styrka n Om osäkerheten i vår förutsägelse är hög (mycket gissning), är sambandets styrka låg n Om osäkerheten i vår förutsägelse är låg, är sambandets styrka hög

+ Statistiska samband: Vad betyder det? n vad betyder det att vi kan förutsäga ett värde genom kunskap av ett annat värde med 30% säkerhet? n vilket betyder att det är en risk att vi ligger fel med vår gissning i 70% av fallen? n 1) TÄNKA: Teorier och hypoteser om möjliga samband n 2) RÄKNA: Analysarbete utifrån insamlade data (lättaste delen) n 3) TÄNKA: Tolka statistiska samband man får som resultat n Jämför olika samband, för att se sambandets betydelse

+ Relationer mellan nominala/ dikotoma kategorier n Nominalmått (dikotoma data, distans mellan kategorier har ingen information, t.ex. ja/nej) utgår från korstabeller (oftast fyrfältare) n som innehåller antalet observationer (absolut eller i procent) n samt deras kombinationer t.ex. i form av randsumman (kolumn- och radsumma) n Man relatera alla möjligheter till varandra och får ett mått (t.ex. Phi, Cramer s V, Lambda)

+ Korrelationsmått Phi ϕ = 22 *35 33*10 (33+ 22)(35 +10)(33+ 35)(22 +10) Gör en längre utbildning en bättre hälsa? Exempel: phi=0.19 à Ett svagt positivt samband φ = bc ad (a + b)(c + d)(a + c)(b + d)

+ Exempel med SPSS, PSPP n Hur stor är sambandet mellan studieämne (personal 0, ped 1) och motivation (inte motiverat 0, motiverat 1)? Symmetric Measures Value Approx. Sig. Nominal by Nominal Phi.389.019 Cramer's V.389.019 N of Valid Cases 52! En signifikant (men oriktat) svagt positivt samband! Möjlig tolkning: pedagogerna är lite mer motiverade

+ Sambandsstyrka n Förslag på en interpretation/tolkning: 0: ingen samband (korrelation) 0 0,2 mycket svagt samband 0,21 0,4 svagt samband 0,41 0,6 mellanstarkt samband 0,61 0,8 starkt samband 0,81 0,99 mycket starkt samband 1 perfekt samband 0-0,2 mycket svagt negativt samband -0,21-0,4 svagt negativt samband -0,41-0,6 mellanstarkt negativt samband -0,61-0,8 starkt samband -0,81-0,99 mycket starkt negativ samband -1 perfekt negativt samband

+ Oridnala Variabler: Parjämförelse Upphandling av kompetensutveckling för avdelningen: 1 2 3 4 5 6 7 1 2 3 4 5 6 7 Exempel: att upphandla 2 = bättre 1 = lika 0 = sämre Samma logik som en Allsvenska-Tabell!!

+ Ordinala variabler: att jämföra rangordningar n Eller man rangordnar alla x och alla y och sedan jämför rangordningen (man ställer två lister bredvid varandra) med varandra n Många överenstämmelser: små/små och stor/stor = stort samband (konkordant), eller små/stor och stor/små (diskordant) n Lista 1: 12345678 Lista 2: 12345678 (samband= 1) n Lista 1: 12345678 Lista 2: 87654321 (samband= -1)

+ Sambandsmått mellan ordinala kategorier n Alla metoder har vissa nackdelar som man hittar i alla metodböcker eller på internet n Det finns många olika mått: Kendall s tau a,b,c, Guttman s gamma, Yule s Q n Som för sin del också ha olika fördelar och nackdelar

+ Exempel (SPSS, PSPP) n Finns det ett samband mellan ointresse i statistik och betyget i matte? n Betyg och ointresse behandlas som ordinalskalvariabler Ordinal by Ordinal Symmetric Measures Value Asymp. Std. Approx. T b Approx. Sig. Error a Kendall's tau-b -.358.108-3.218.001 Kendall's tau-c -.311.097-3.218.001 Gamma -.541.157-3.218.001 N of Valid Cases 50 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.! Ett signifikant, men inte riktat svag/mellan negativ samband. Möjlig tolkning: med bättre betyg, växande intresse

+ Samband mellan två intervallskalvariabler n Ett sambandsmått mellan två intervallskalavariabler är Pearsons r, som bygger på relationer mellan variablers varians n Variansen anger hur observationsenheter koncentreras runt variabelns medelvärde n Relationen kallas kovarians n Vilket visar, för varje observation och båda variabler, avståndet mellan observationen och medelvärdet n Varje observation har i ett koordinatsystem därmed en viss position

+ Kovarians Sxy y (beroende variabel)!!! x (oberoende variabel)

+ Pearsons r n Kovariansen liksom variansen är beroende av variabelns mått/dimension (se varians-standardavvikelse) n det betyder man inte kan jämföra varianser med olika dimensioner n därför standardiseras det även här (för att få värde mellan -1 och 1) n man delar kovariansen med produkten av båda variablernas standardavvikelses produkt

+ Exempel n Finns det ett samband mellan tentamensångest och tolkningsångest ang. statistiska data? Correlations Tentamensångest Tolkningsångest Tentamensång Tolkningsånge est st Pearson Correlation 1.714 ** Sig. (2-tailed).000 N 52 52 Pearson Correlation.714 ** 1 Sig. (2-tailed).000 N 52 52 **. Correlation is significant at the 0.01 level (2-tailed).! Ett signifikant och starkt positivt samband Har du tentamensångest så finns det en stor chans att du också har tolkningsångest

+ Analys av olika skalnivåer

+ Samband mellan variabler med olika skalnivåer n Vad gör man om man söker en samband mellan två variabler med olika skalnivå? n Man använder då måttet för den lägre skala n Man förlorar dock informationer n Resultatet är inte helt precis n Ordinal/Intervall behandlas som ordinal/ordinal n Nominal/Ordinal behandlas som nominal/nominal

+ Parametriska och icke parametriska sambandsmått n Parameter standardavvikelse, medelvärde och normalfördelning 1. nominal, ordinal har inget medelvärde och standardavvikelse, följer inte normalfördelningen 2. intervall, kvot har medelvärde, standardavvikelse och följer normalfördelning n 1: behöver icke parametriska metoder n kan alltid användas, men är inte de mest precis metoder n 2: behöver parametriska metoder