Kvantitativ metod och grundläggande statistik. Introduktion

Relevanta dokument
17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

19/10/14. Kvantitativ metod och grundläggande statistik. Olika typer av studier. Experiment. Klinsika prövningar. Representativt (randomiserat) urval

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

OBS! Vi har nya rutiner.

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Uppgift 1. Produktmomentkorrelationskoefficienten

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Parade och oparade test

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Gamla tentor (forts) ( x. x ) ) 2 x1

Medicinsk statistik II

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Hur skriver man statistikavsnittet i en ansökan?

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Statistik och epidemiologi T5

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Statistik Termin 10, Läkarprogrammet, HT16

EXAMINATION KVANTITATIV METOD vt-11 (110319)

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Hypotestestning och repetition

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Medicinsk statistik II

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F22, Icke-parametriska metoder.

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

SOPA62 - Kunskapsproduktion i socialt arbete

Kent W. Nilsson. Falun

Att välja statistisk metod

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Lösningar till SPSS-övning: Analytisk statistik

SOPA62 - Kunskapsproduktion i socialt arbete

Statistik och epidemiologi T5

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

OBS! Vi har nya rutiner.

7.5 Experiment with a single factor having more than two levels

2.1 Minitab-introduktion

Mata in data i Excel och bearbeta i SPSS

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

2. Test av hypotes rörande medianen i en population.

OBS! Vi har nya rutiner.

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

Föreläsning G60 Statistiska metoder

OBS! Vi har nya rutiner.

7.3.3 Nonparametric Mann-Whitney test

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Medicinsk statistik I

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Studietyper, inferens och konfidensintervall

EXAMINATION KVANTITATIV METOD

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

a) Facit till räkneseminarium 3

Repetitionsföreläsning

Mall och manual för granskning av interventionsstudier

Föreläsning G70 Statistik A

DELMOMENT INOM GRUNDUTBILDNINGEN I BIOLOGI/MOLEKYLÄRBIOLOGI HT Kod:... Nr Fråga Svarsalternativ (ringa in rätt svar)

Medicinsk statistik I

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Transkript:

Kvantitativ metod och grundläggande statistik Introduktion Epidemiologi och grundläggande statistik VARFÖR?! Sjuksköterskeutbildningen och sjuksköterskans yrkesutövning ska vila på vetenskaplig grund Kritiskt förhållningssätt, att kunna läsa artiklar och bedöma om slutsatser är rimliga utifrån metod och resultat Värdera grad av evidens Värdera vad som är kliniskt relevant Viktigt att tidigt skolas in i detta reflekterande tänkande En s k generisk färdighet som man förväntas ha efter en universitetsutbildning. Andra exempel på sådana är att kunna uttrycka sig klart och tydligt muntligen och i skrift Egna uppsatsen kanske innehåller någon statistik? Arne Johannisson 1

Epidemiologi Läran om sjukdomars utbredning i befolkningen Kortvariga förlopp, ex influensaepidemi Långvariga förlopp, ex astma, diabetes Prevalens = sjukdomsförekomst vid mättillfällena, mäts i procent Incidens = nyinsjuknande mellan mättillfällena, mäts i procent Kvantitativ forskningsmetodik Ej motpol till kvalitativ metodik - båda kompletterar varandra Utgångspunkt: Positivistiskt paradigm Central fråga: Hur är olika fenomen relaterade till varandra? Antaganden: Vetenskapen är objektiv Det finns regelbundenhet Regelbundenheten går att studera Ambition: Dra slutsatser baserade på observationer Det går att generalisera från observationer till population Arne Johannisson 2

Olika typer av studier Experiment Kliniska prövningar interventionsstudier 1. Manipulation 2. Kontroll 3. Randomisering b) Observationsstudie Retrospektiv, t ex fallkontrollstudie Tvärsnittsstudie Prospektiv, t ex kohortstudie Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Arne Johannisson 3

Olika typer av urval OSU - obundet slumpmässigt urval: alla har samma möjlighet att få delta. Systematiskt urval: personuppgifter hämtas från register Stratifierat urval: tvåstegsurval; först val utifrån egenskap ex yrke, därefter OSU Konsekutivt urval: urval utifrån egenskap ex alla som fått höftledsfraktur under ett år Bortfall Skiljer sig de i bortfallet från de övriga i undersökningsgruppen? Osäkerheten i resultaten och slutsatserna ökar med stigande bortfall Kontrollera effekter av bortfall Studera nyckelvariabler Följa upp orsaker Externt bortfall = de som inte svarat alls Internt bortfall = de som skickat in formulär men som inte besvarat vissa eller alla frågor Arne Johannisson 4

Variabel = Egenskap som kan variera Det vi studerar/mäter Beroende variabel (dependent variable) Utfallsvariabeln Det vi studerar Det som påverkas Beroende av den oberoende variabeln Oberoende variabel (independent variable) Variabler som påverkar utfallet Förklaringsvariabler Oberoende av den beroende variabeln Exempel: 1. Hur påverkar intervention X patienters upplevda hälsa? Intervention X = oberoende Upplevd hälsa = beroende 2. Vilka av faktorerna sjukdomsgrad, ålder, kön och BMI förklarar bäst graden av upplevd hälsa? Sjukdomsgrad, ålder, kön och BMI = oberoende Upplevd hälsa = beroende Mätnivåer Nominal (kvalitativ variabel; t ex kön, boendeform) Kategorier utan kvantitativ mening Klassificering 0 = kvinna 1 = man Ordinal (kvalitativ variabel; t ex symptomsvårighet) Ojämna (okända) intervall Ordning 0 1 2 3 4 Intervall (kvantitativ variabel; t ex temperatur enl. Celsius och Fahrenheit) Jämna intervall men absoluta magnituder okända och noll-punkten arbiträr Ordning + differens. -1 0 1 2 3 4 Kvot (kvantitativ variabel; t ex blodtryck, lab-prover) Jämna intervall med kända absoluta magnituder och noll-punkt Ordning + differens + kvot 0 1 2 3 4 5 Arne Johannisson 5

Kvalitativa data, tabell Frekvenser: antal och procent Stapeldiagram 100% 80% 23 60% 40% 34 Direkta sjv-kostnader Hjälp & vård i hemmet Indirekta kostnader 20% 42 0% Årlig totalkostnad (%) Hagell et al. Mov Disord 2002; 17: 1213-1220. Arne Johannisson 6

Grafisk presentation kvalitativa data: Cirkeldiagram Tänk på: Tydlighet framför kosmetik Yrsel Nej Ja lite Ja ganska mycket Ja mycket 55,00% 5,00% Yrsel Nej Ja lite Ja ganska mycket Ja mycket 10,00% 30,00% Jakobsson. Vård i Norden 2005; 76: 62-63. Kvantitativa data, fördelningar Grafisk presentation: Histogram 600 500 Normalfördelning (symmetrisk) 400 Antal 300 200 100 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 Åldersgrupper Medelvärde Median 600 Positiv snedfördelning 600 Negativ snedfördelning 500 500 400 400 Antal 300 Antal 300 200 200 100 100 0 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 Åldersgrupper Åldersgrupper Median Median Medelvärde Medelvärde Arne Johannisson 7

Kvantitativa data Centralmått (Central tendencies) Medelvärde (mean, m, X ) Summan av alla mätvärden dividerat med antalet individer Median (md) Det värde som delar fördelningen i två lika stora delar efter sortering från lägsta till högsta värde Typvärde (mode) Det vanligast förekommande värdet Obs nr Ålder 7 21 10 29 8 30 2 31 5 32 6 36 3 45 4 50 1 58 9 58 n = 10 390 390 X 39,0 10 md = 34 mode = 58 Spridningsmått vid normalfördelning Standardavvikelse (standarddeviation, SD, s) den genomsnittliga avvikelsen från medelvärdet Medelvärde 2 SD = ca 95% av observationerna Obs nr 1 Värde (x i ) 5 x i x -4 ( x i x) 16 2 15 6 36 3 10 1 1 4 8-1 1 5 15 6 36 6 10 1 1 7 3-6 36 8 6-3 9 72 0 136 s 72 X 9,0 8 2 ( X i X ) 136 n 1 7 19,4286 4,41 2 Arne Johannisson 8

Normalfördelningens egenskaper Spridningsmått för ej normalfördelade variabler Kvartilavstånd (interquartile range, IQR, q 1,q 3 ) Omfattar 50% av alla värden (varav 25% ligger över och 25% under medianen), oavsett fördelning Variationsvidd (range) Skillnaden mellan lägsta och högsta värdet Obs nr Värde 7 3 1 5 8 6 4 8 3 10 6 10 2 15 5 15 q 1 = 5,5 q 2 (= md) = 9 q 3 = 12,5 IQR Min Max Lägsta och högsta observerade värdena Arne Johannisson 9

Grafisk presentation: Boxplot 25% max q 3 Variationsvidd (range) 25% 25% q 2 (= md) IQR 25% q 1 min Grafisk presentation: Boxplot 30 Time to complete the PDQ-39 (minutes) 25 20 15 10 5 0 HY I-II HY III HY IV-V Hagell et al. Qual Life Res 2004; 13: 1545. Arne Johannisson 10

Låt dig inte luras och luras inte... Jakobsson. Vård i Norden 2005; 76: 62-63. Låt dig inte luras och luras inte... Jakobsson. Vård i Norden 2005; 76: 62-63. Arne Johannisson 11

Användning av deskriptiv statistik Centralmått Mätnivå Medel Median Typvärde Spridningsmått SD IQR Min Max / Variationsvidd Totalt antal Kvot X X X X X X (X) Intervall X X X X X X (X) X X X X (X) Snedfördelad intervall/kvot Ordinal X X X X (X) Nominal X X X: Används normalt i första hand (X): Kan användas men tveksam funktion som spridningsmått Precision, konfidensintervall Populationsvärden okända Stickprovsvärdet = bästa uppskattningen Precisionen ökar med stickprovets storlek Konfidensintervall (confidence interval, CI) Kan beräknas utifrån stickprovets storlek, medelvärde och spridning Med detta intervall har vi en given sannolikhet, ofta 95% (95% CI), för att inkludera det sanna medelvärdet. Ett hypotetiskt exempel: m 50 50 50 50 50 n 30 90 60 60 60 s 20 20 20 10 30 Beräkning: SE (standard error) = 95% CI = 95% CI 42.8 57.2 45.8 54.2 44.8 55.2 47.4 52.6 42.2 57.8 s n X 1. 96SE Arne Johannisson 12

Ett exempel Jämförande statistik: Hypotesprövning Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Population Skillnader mellan värden i grupper/stickprov Verklig eller slumpmässig skillnad? Arne Johannisson 13

Hypotesprövning Med hypotesprövning vill vi bestämma oss för vilken av dessa två hypoteser vi vill lita på: Nollhypotesen (H 0 ): Det föreligger ingen skillnad mellan grupperna i populationen. Mothypotesen (H 1 ): Det föreligger en reell skillnad mellan grupperna i populationen (mothypotesen negerar nollhypotesen). Hypoteserna testas med en testfunktion (analysmetod) under antagandet att nollhypotesen är sann. Baseras på medelvärden och spridningsmått eller fördelning av stickprovens variabelvärden, proportioner. Statistisk signifikans Sannolikheten att en åtminstone så stor observerad skillnad, effekt, el. dyl. hade erhållits om nollhypotesen (H 0 ) var sann (pvärde). Om den här sannolikheten (p-värdet) är väldigt liten, ofta mindre än 5% (p<0.05), så väljer vi att tro att mothypotesen är sann. P-värde P-värdet kan anta värden mellan 0 och 1 Ju lägre P-värde, desto mindre risk att felaktigt dra slutsatsen att en skillnad föreligger (förkasta H 0 ). Arne Johannisson 14

Statistisk signifikans P-värdet säger INTE någonting om skillnadens storlek eller (kliniska) betydelse! P-värdet bestäms av Effektens storlek (t. ex. skillnaden mellan grupper) Gruppstorlek Spridning inom grupper En illustration Förhållande mellan gruppstorlek och skillnad i medelvärden för att skillnaden skall bli statistiskt signifikant (P<0.05) n Skillnad 4 14.70 9 9.80 25 5.88 64 3.68 100 2.94 400 1.47 900 0.98 Norman & Streiner (2000). Biostatistics - the bare essentials. Arne Johannisson 15

Val av analysmetod Styrs av: Vad man vill jämföra Upprepade observationer, samma individer (skillnad inom en grupp över tid) Observationer från olika individer (skillnad mellan grupper) Två eller flera tidpunkter/grupper Data Mätnivå (nominal vs. ordinal vs. intervall/kvot) Fördelning (ungefärlig normalfördelning?) Spridning i respektive grupp (ungefär lika?) Huvudindelning av analysmetoder Parametriska metoder Utgår från medelvärden och normalfördelning Förutsätter: kvantitativa variabler normalfördelning lika spridning Icke-parametriska metoder Utgår från rangordning och proportion Okänsliga för variabeltyp, snedfördelning och olikheter i spridning 600 600 500 500 400 400 Antal 300 Antal 300 200 200 100 100 0 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 Åldersgrupper Åldersgrupper Medelvärde Median Median Medelvärde Arne Johannisson 16

Parametrisk hypotesprövning: Kvantitativ, normalfördelad variabel Jämförelse av medelvärden i två olika grupper (oberoende observationer) Är skillnaden mellan grupperna så pass stor att det kan anses sannolikt att det finns en verklig skillnad? Testfunktion: t-test (oparad, unpaired) t s 2 x 1 x 2 ( 1/ n1 1/ n2) = Skillnad i medelvärden SE av medelvärdesskillnaden Liknande funktion vid parvis jämförelse (samma grupp över tid) Sannolikheten att erhålla det observerade värdet för t om det inte föreligger reell skillnad = P-värdet Ju högre t, desto lägre P-värde Ett exempel nature neuroscience volume 5 no 7 july 2002 Arne Johannisson 17

Icke-parametrisk hypotesprövning: Icke normalfördelad/ordinalskalevariabel Observationerna rangordnas Fördelningen av rangtalen jämförs mellan grupperna (oberoende observationer: Mann-Whitney U-test) Grp A: 54 62 64 66 71 74 Grp B: 38 42 48 53 59 60 70 74 Rang: 1 2 3 4 5 6 7 8 9 10 11 12 13,5 Rangsumma, grp A: 5+8+9+ +13,5 = 57,5 Rangsumma, grp B: 1+2+3+ +13,5 = 47,5 Sannolikheten att erhålla den observerade fördelningen av rangsummor då ingen skillnad föreligger = P-värdet Fördelningen av rangtalen jämförs mellan positiva och negativa förändringar (parvis jämförelse: Wilcoxon signedrank test) Skillnad t1-t2 Rangtal 29 5,5 41 7 0 12 2-5 1 19 4-13 3 29 5,5 Pos. rangsumma: 5,5+7+2+4+5,5 = 24 Neg. rangsumma: 1+3 = 4 Ett exempel nature neuroscience volume 5 no 7 july 2002 Arne Johannisson 18

Grafisk presentation (boxplot) 80 P = 0.002 70 UPDRS motor score (0-108) 60 50 40 30 20 10 0 Preop 3 yrs postop Hagell et al. Nat Neurosci 2002; 5: 627-628. Ett annat exempel... Arne Johannisson 19

Jämförelse mellan mer än två grupper Parametriska metoder Oberoende observationer: Analysis of variance (ANOVA) Testfunktionen F (tolkas som t) Beroende observationer: Repeated-measures ANOVA Icke-parametriska metoder Oberoende observationer: Kruskal-Wallis ANOVA Beroende observationer: Friedman test Tolkas som t-test/mann-whitney U-test/Wilcoxon signed-rank test men över samtliga jämförda grupper Post-hoc test: Visar mellan vilka av grupperna som en skillnad föreligger ANOVA - förutsättningar Fler än två grupper Slumpmässigt urval från varje grupp. Vi antar att grupperna: är normalfördelade kan ha olika medelvärde har samma spridning, varians, i2. (standardavvikelsen 2 ) 1 2 3 Population 1 Population 2 Population 3 Arne Johannisson 20

Icke-parametrisk hypotesprövning: Proportioner/kvalitativa variabler Skiljer sig fördelningen av individer mellan de olika kategorierna från vad man kan förvänta sig om det inte är någon skillnad? Frisk Sjuk Kvinnor a c Män b d Testfunktion: Chi-2-test (Chi-square) ( O E E 2 2 ) Skillnaden mellan den observerade (O) och förväntade (E, expected) fördelningen Sannolikheten att erhålla det observerade Chi-2-värdet = P-värdet Ju högre Chi-2-värde, desto lägre P-värde Föreligger det en könsskillnad i förekomsten av hypertoni bland personer med diabetes? OBSERVERAT Ej hypertoni Kvinnor 133 Män 154 totalt 287 Förväntade värden = E E = radsumma x (kolumnsumma/totalsumma) Hypertoni totalt 137 270 128 282 265 552 287 x (270/552) = 287 x 0,49 = 140 287 x (282/552) = 287 x 0,51 = 146 265 x (270/552) = 265 x 0,49 = 130 265 x (282/552) = 265 x 0,51 = 135 FÖRVÄNTAT Ej hypertoni Hypertoni Kvinnor 140 130 Män 146 135 ( O E E 2 2 ) 2 = 1,582 P = 0,208 Utav kvinnorna (n=270) var det 137 (50,7%) som hade hypertoni, bland männen (n=282) var denna siffra 128 (45,4%). Skillnaden var inte signifikant (P=0,208). Arne Johannisson 21

Ett exempel från statistikprogrammet SPSS Två oberoende grupper, ett mättillfälle, undersökningsvariabeln kvalitativ. Diabetesbehandling * Hypertoni (bltr eller beh) Crosstabulation Hypertoni (bltr eller beh) Nej Ja Total Diabetesbehandling Enbart kost Count 82 86 168 Expected Count 87,2 80,8 168,0 Tablettbehandling Count 102 111 213 Expected Count 110,6 102,4 213,0 Insulinbehandling Count 89 54 143 Expected Count 74,2 68,8 143,0 Ins + tabl.behandl Count 13 14 27 Expected Count 14,0 13,0 27,0 Total Count 286 265 551 Expected Count 286,0 265,0 551,0 Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Squar 8,291 a 3,040 Likelihood Ratio 8,366 3,039 Linear-by-Linear Association 3,085 1,079 N of Valid Cases 551 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 12,99. Inte bara skillnader Hypotesprövning och P-värden kan beräknas för flertalet typer av analyser Tolkningen av P-värdet utgår dock alltid (om inget annat anges) från nollhypotesen, t. ex. Korrelation/sambandsanalys: H 0 : Det föreligger inget samband Förklaringsmodeller: H 0 : Oberoende variabeln X förklarar inte värdet på beroendevariabeln Y Riskbedömning: H 0 : X ökar inte risken för sjukdom Arne Johannisson 22

Korrelation Samvarierar variabel X linjärt med variabel Y? Grafiskt: Spridningsdiagram (scatterplot) Y Y X Positiv linjär samvariation X Negativ linjär samvariation Korrelation Parametrisk metod Pearson s (produkt-moment) korrelation (r) Kvantitativa variabler Normalfördelning Icke-parametrisk metod Spearman s korrelation (r s,, rho) Vid data på ordinalskalenivå och/eller kvantitativa icke normalfördelade variabler Utgår från rangordning Okänslig för variabeltyp, snedfördelning och olikheter i spridning Arne Johannisson 23

Korrelationskoefficienten Korrelationskoefficienten (r) uttrycker graden av linjär samvariation Varierar mellan -1 och 1 Tecknet framför anger riktning Positivt r = positiv korrelation (Y ökar när X ökar) Negativt r = negativ korrelation (Y minskar när X ökar) Värdet (oavsett riktning) anger styrkan r nära 1 = stark positiv korrelation r nära -1 = stark negativ korrelation r nära 0 = svag korrelation Styrkan anger i vilken utsträckning punkterna samvarierar linjärt, dvs fördelar sig utmed en rät linje Några hypotetiska exempel r = 1 r = 0.65 r = 0 Y Y Y r = 0.90 X X r = -0.80 r = 0 X Y Y Y X X X Arne Johannisson 24

Fler exempel Anger inte lutningen, endast graden av linjäritet i samvariationen Mäter inte icke-linjära samband r = 0.90 r = 0.90 r = lågt Y Y Y X X X Tolkning av korrelationskoefficienten Statistisk signifikans H 0 : r = 0 i populationen, den erhållna korrelationen är så liten att den sannolikt inte skulle finnas i populationen. H 1 : r = sannolikt större än 0 i populationen. Tolkas med försiktighet Styrkan (r) Exempel på riktlinjer <0.20: Dålig 0.20-0.35: Svag 0.35-0.65: Måttlig 0.65-0.85: Stark >0.85: Mycket stark Situationsberoende Arne Johannisson 25

Korrelation: Användningsområden Främst förberedande metod Explorativt för att generera hypoteser och sambandsmodeller Utveckling och utvärdering av mätinstrument, enkäter, etc. Ett exempel Ruggiero. Research in Nursing & Health 2003; 26: 434-444. Arne Johannisson 26