I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska



Relevanta dokument
Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Att välja statistisk metod

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Höftledsdysplasi hos dansk-svensk gårdshund

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Medicinsk statistik II

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Linjär regressionsanalys. Wieland Wermke

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

ANOVA Mellangruppsdesign

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Föreläsning 11 (ej på tentan): Tillämpningar och vidareutvecklingar

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

OBS! Vi har nya rutiner.

ANOVA Faktoriell (tvåvägs)

Statistik Termin 10, Läkarprogrammet, HT16

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

7.5 Experiment with a single factor having more than two levels

chi 2 : A B A: B: p-värde: A B K M K M phi A B Ja Ja Nej Nej (2 tentor av 8)

Kort manual till SPSS 10.0 för Mac/PC

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Statistik och epidemiologi T5

Hypotestestning och repetition

kodnr: 2) OO (5p) Klassindelningar

Repetitionsföreläsning

Statistiska analyser C2 Bivariat analys. Wieland Wermke

InStat Exempel 4 Korrelation och Regression

Medicinsk statistik II

Föreläsning G60 Statistiska metoder

7.5 Experiment with a single factor having more than two levels

OBS! Vi har nya rutiner.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

10.1 Enkel linjär regression

OBS! Vi har nya rutiner.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Parametiskt vs. icke-parametriskt

MSG830 Statistisk analys och experimentplanering

OBS! Vi har nya rutiner.

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Multipel Regressionsmodellen

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Regressions- och Tidsserieanalys - F4

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Statistik 1 för biologer, logopeder och psykologer

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Föreläsning 12: Regression

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Samhällsvetenskaplig metod, 7,5 hp

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Uppgift 1. Deskripitiv statistik. Lön

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Statistik 1 för biologer, logopeder och psykologer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Repetitionsföreläsning

Sänkningen av parasitnivåerna i blodet

Statistiska samband: regression och korrelation

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

FACIT!!! (bara facit,

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Regressions- och Tidsserieanalys - F1

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Regressions- och Tidsserieanalys - F3

Statistisk försöksplanering

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Regressions- och Tidsserieanalys - F3

Kent W. Nilsson. Falun

Bygga linjära modeller! Didrik Vanhoenacker 2007

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Transkript:

Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser Multivariata analyser Multivariata analyser Forskningsfrågor Finns det skillnad mellan personer med psykos, depression eller ångest avseende livskvalitet? Finns det skillnader över tid mellan baseline, tre månader och sex månader avseende god livskvalitet för personer med psykos? Skiljer sig grupper med olika psykiatri diagnoser och utbildningsnivå åt avseende livskvalitet? I vilken grad kan högt blodtryck förklaras av saltintag, vikt och fysisk aktivitet? I vilken grad kan god eller dålig hälsa förklaras av utbildningsnivå, religion och inställning till goda kostvanor? Statistiska analyser (tre eller fler grupper/mättillfällen/variabler) Parametriska Icke-parametriska Skillnader mellan tre eller fler grupper vid samma tidpunkt Oberoende ANOVA Kruskal Wallis Skillnader inom samma grupp över tid (tre eller fler mätpunkter) Beroende ANOVA Friedman Samband mellan tre eller fler variabler Multipel regression Logistisk regression

Multivariata statistiska analyser Parametrisk analys: ANOVA (ANalysis Of Variance) Variansanalys Oberoende och beroende mätningar Icke-parametriska analyser: Kruskal-Wallis - oberoende mätningar Friedman - beroende mätningar Multivariat parametrisk statistisk analys Varför ANOVA? Många t-test ökar risken för Typ I-fel Typ I-fel = förkastar nollhypotesen trots att den är sann Ex. När forskaren behåller analysresultaten och säger att de är korrekta men egentligen så finns ingen skillnad eller inget samband. Fördelen med ANOVA är att endast ett enda test utförs (F-test). ANOVA utnyttjar all information samtidigt Multivariat parametrisk statistisk analys ANOVA används när vi vill 1. Undersöka skillnaden mellan 3 eller fler grupper vid ett mättillfälle=oberoende ANOVA. Forskningsfråga: Finns det skillnad i livskvalitet mellan personer med 1. psykos, 2. depression och 3. ångest? 1 2 3 Livskvalitet

Multivariat parametrisk statistisk analys ANOVA används när vi vill 2. Undersöka skillnaden mellan 3 eller fler mättillfällen av samma grupp eller följa en grupp över tid = beroende ANOVA. Forskningsfråga: Finns det skillnader över tid mellan baseline, tre månader och sex månader avseende god livskvalitet för personer med psykos? Baseline 3 månader 6 månader Multivariat parametrisk statistisk analys ANOVA Huvudsyftet är att analysera varianser Utgångspunkten för ANOVA är beräkningen av materialets samlade varians Variansen = standardavvikelsen i kvadrat=s 2 Arbetsordning Steg 1 ANOVA (F-test) Steg 2 Post-hoc test (eftertest) Multivariat parametrisk statistisk analys Grupperingsvariabeln, studerar effekten av en variabel på nominal skalnivå (den oberoende variabeln) kategoridata. Effektvariabeln är en variabel på intervall/kvot skalenivå (den beroende variabeln). 1. Psykos Grupp 1 2. Depression Grupp 2 Effektvariabel (livskvalitet) 3. Ångest Grupp 3

Multivariat parametrisk statistisk analys ANOVA steg 1 F-testet ger en samtidig jämförelse mellan samtliga gruppers medelvärden F-testet visar endast om det finns åtminstone en statistiskt signifikant medelvärdesskillnad mellan grupperna Multivariat parametrisk statistisk analys ANOVA steg 2 Post hoc test (eftertest) används för att ta reda på mellan vilka grupper eller vilka mätningar det finns en signifikant skillnad Post hoc test kontrollerar risken för Typ I- fel i högre utsträckning än vanliga t-test (Fisher LSD, Tukey HSD, Scheffé m.fl.) Variationskällor Det intressanta är att studera variationer i variabelvärden och vad dessa variationer beror på När skillnader mellan olika grupper undersöks är det storleken på variationerna mellan grupperna som studeras För att kunna uttala sig om skillnader mellan grupperna måste variationer inom grupperna också studeras

Envägs oberoende ANOVA Total varians Mellangruppsvarians (Between) Behandlingseffekt Experimentella fel Individuella skillnader Inomgruppsvarians (Within) Individuella skillnader Experimentella fel 1 3 2 Envägs oberoende ANOVA Forskningsfråga: Finns det skillnad i livskvalitet mellan personer med 1. psykos, 2. depression och 3. ångest? Beroende variabel: livskvalitet Oberoende variabel (grupperingsvariabeln): diagnosgrupper, t.ex. 1) psykos, 2) depression, 3) ångest. Kruskal-Wallis Den icke-parametriska motsvarigheten till oberoende variansanalys Jämför mean ranks för varje grupp, medelvärdena rangordnas Eftertest (parvisa jämförelser) kan göras för hand eller med Mann-Whitney

Friedman testet Den icke-parametriska motsvarigheten till envägs variansanalys för upprepade mätningar. Jämför mean ranks. Tvåvägs ANOVA (variansanalys) Två oberoende variabler (två förklarande grupperingsvariabler). Ex. diagnos och utbildning Vi kan statistiskt pröva effekterna av de båda faktorerna separat för att se om huvudeffekterna är signifikanta. Forskningsfråga: Skiljer sig grupper med olika psykiatri diagnoser och utbildningsnivå åt avseende livskvalitet? Tvåvägs ANOVA (variansanalys) Vi kan dessutom pröva faktorerna tillsammans för att se om de samvarierar (om en signifikant interaktionseffekt föreligger). Två faktorer (variabler) sägs interagera (det finns en interaktionseffekt) om skillnader i nivåer hos den ena faktorn beror på (påverkas av) nivån hos den andra faktorn.

En tvåvägs variansanalys besvarar tre frågor: Finns det någon huvudeffekt (main effect) av faktor A? Ex. diagnos: psykos, depression och ångest. Finns det någon huvudeffekt (main effect) av faktor B? Ex. utbildningsnivå: högskola, gymnasium, folkskola. Finns det någon interaktionseffekt (interaction effect) av faktor A och B? Korrelation (samband) och regression sid 105 i E Statistiska analyser Parametriska Icke-parametrisk Samband mellan 2 variabler Pearson s produktmoment- Spearman s rangkorrelation korrelation Regressionsanalys Samband mellan >2 variabler Multipel regressionsanalys Logistisk regressionsanalys

Sambandsanalyser Uppgiften är att undersöka: 1. Om det finns något samband mellan två variabler. 2. Och om ja, beskriva hur sambandet ser ut. För sambandsanalyser finns två tekniker: 1. Korrelation (r): talar om sambandet är positivt eller negativt och hur starkt sambandet är mellan variablerna. Ex. r =.63 eller r = -.42. (Spridningsdiagram) 2. Regression: används för att förutsäga (predicera) värdet på en variabel utifrån kunskapen om en annan Förutsättningar Oberoende mätningar Materialet ska vara normalfördelat Intervall- eller kvotskala

Även om vi i en studie finner en hög korrelation (ett starkt samband) är det inte säkert att det därför finns ett orsakssamband (kausalsamband). Skensamband, varning! (sid 113 E) Finns anledning att varna för okritisk användning av metoder för att studera samband. Man bör vara försiktig vid tolkningen av sambandsmått. Linjär regressionsanalys Pearsons r uttrycker sambandets styrka. Den säger inget om hur snabbt y ökar med x y är den beroende variabeln x är den oberoende variabeln (förklaringsvariabel) Med hjälp av regressionssambandet kan vi beräkna förväntade värden för y på givna värden på x. Vi gör en prediktion eller förutsägelse. Y regressionslinje lutning= regressionskoefficienten intercept 0 X

Spridningsdiagram 220 200 180 160 140 a) regressionslinje 120 Självförtroende 100 80 60 40 b) regressionslinje -2 0 2 4 6 8 10 VASTREM Smärta Multipel regression Resultatet av multipel regression är en ekvation som representerar den bästa prediktionen av en förklarad variabel utifrån flera kontinuerliga eller dikotoma förklarande variabler. Att särskilja effekten av enskilda förklaringsvariabler. Inga kausala/orsaks samband analyseras. Regression fungerar bäst när varje förklarande variabel har starkt samband med den förklarade variabeln men inte med de andra förklarande variablerna. OBS! Extrema värden (outliers) kan påverka regressionslösningen i hög grad och måste därför hanteras.

Logistisk regression, sid 222 i E Samband mellan mer än två variabler. Icke-parametriskt test. Om den beroende variabeln (y) är dikotom. Logistisk regression kan även användas när det finns fler än två nivåer på den beroende variabeln. De oberoende variablerna kan vara kontinuerliga, diskreta, dikotoma eller en blandning. Forskningsfråga: I vilken grad kan god eller dålig hälsa förklaras av utbildningsnivå, religion och inställning till goda kostvanor?