Kvantitativ metod och grundläggande statistik Introduktion Epidemiologi och grundläggande statistik VARFÖR?! Sjuksköterskeutbildningen och sjuksköterskans yrkesutövning ska vila på vetenskaplig grund Kritiskt förhållningssätt, att kunna läsa artiklar och bedöma om slutsatser är rimliga utifrån metod och resultat Värdera grad av evidens Värdera vad som är kliniskt relevant Viktigt att tidigt skolas in i detta reflekterande tänkande En s k generisk färdighet som man förväntas ha efter en universitetsutbildning. Andra exempel på sådana är att kunna uttrycka sig klart och tydligt muntligen och i skrift Egna uppsatsen kanske innehåller någon statistik? Arne Johannisson 1
Epidemiologi Läran om sjukdomars utbredning i befolkningen Kortvariga förlopp, ex influensaepidemi Långvariga förlopp, ex astma, diabetes Prevalens = sjukdomsförekomst vid mättillfällena, mäts i procent Incidens = nyinsjuknande mellan mättillfällena, mäts i procent Kvantitativ forskningsmetodik Ej motpol till kvalitativ metodik - båda kompletterar varandra Utgångspunkt: Positivistiskt paradigm Central fråga: Hur är olika fenomen relaterade till varandra? Antaganden: Vetenskapen är objektiv Det finns regelbundenhet Regelbundenheten går att studera Ambition: Dra slutsatser baserade på observationer Det går att generalisera från observationer till population Arne Johannisson 2
Olika typer av studier Experiment Kliniska prövningar interventionsstudier 1. Manipulation 2. Kontroll 3. Randomisering b) Observationsstudie Retrospektiv, t ex fallkontrollstudie Tvärsnittsstudie Prospektiv, t ex kohortstudie Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Arne Johannisson 3
Olika typer av urval OSU - obundet slumpmässigt urval: alla har samma möjlighet att få delta. Systematiskt urval: personuppgifter hämtas från register Stratifierat urval: tvåstegsurval; först val utifrån egenskap ex yrke, därefter OSU Konsekutivt urval: urval utifrån egenskap ex alla som fått höftledsfraktur under ett år Bortfall Skiljer sig de i bortfallet från de övriga i undersökningsgruppen? Osäkerheten i resultaten och slutsatserna ökar med stigande bortfall Kontrollera effekter av bortfall Studera nyckelvariabler Följa upp orsaker Externt bortfall = de som inte svarat alls Internt bortfall = de som skickat in formulär men som inte besvarat vissa eller alla frågor Arne Johannisson 4
Variabel = Egenskap som kan variera Det vi studerar/mäter Beroende variabel (dependent variable) Utfallsvariabeln Det vi studerar Det som påverkas Beroende av den oberoende variabeln Oberoende variabel (independent variable) Variabler som påverkar utfallet Förklaringsvariabler Oberoende av den beroende variabeln Exempel: 1. Hur påverkar intervention X patienters upplevda hälsa? Intervention X = oberoende Upplevd hälsa = beroende 2. Vilka av faktorerna sjukdomsgrad, ålder, kön och BMI förklarar bäst graden av upplevd hälsa? Sjukdomsgrad, ålder, kön och BMI = oberoende Upplevd hälsa = beroende Mätnivåer Nominal (kvalitativ variabel; t ex kön, boendeform) Kategorier utan kvantitativ mening Klassificering 0 = kvinna 1 = man Ordinal (kvalitativ variabel; t ex symptomsvårighet) Ojämna (okända) intervall Ordning 0 1 2 3 4 Intervall (kvantitativ variabel; t ex temperatur enl. Celsius och Fahrenheit) Jämna intervall men absoluta magnituder okända och noll-punkten arbiträr Ordning + differens. -1 0 1 2 3 4 Kvot (kvantitativ variabel; t ex blodtryck, lab-prover) Jämna intervall med kända absoluta magnituder och noll-punkt Ordning + differens + kvot 0 1 2 3 4 5 Arne Johannisson 5
Kvalitativa data, tabell Frekvenser: antal och procent Stapeldiagram 100% 80% 23 60% 40% 34 Direkta sjv-kostnader Hjälp & vård i hemmet Indirekta kostnader 20% 42 0% Årlig totalkostnad (%) Hagell et al. Mov Disord 2002; 17: 1213-1220. Arne Johannisson 6
Grafisk presentation kvalitativa data: Cirkeldiagram Tänk på: Tydlighet framför kosmetik Yrsel Nej Ja lite Ja ganska mycket Ja mycket 55,00% 5,00% Yrsel Nej Ja lite Ja ganska mycket Ja mycket 10,00% 30,00% Jakobsson. Vård i Norden 2005; 76: 62-63. Kvantitativa data, fördelningar Grafisk presentation: Histogram 600 500 Normalfördelning (symmetrisk) 400 Antal 300 200 100 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 Åldersgrupper Medelvärde Median 600 Positiv snedfördelning 600 Negativ snedfördelning 500 500 400 400 Antal 300 Antal 300 200 200 100 100 0 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 Åldersgrupper Åldersgrupper Median Median Medelvärde Medelvärde Arne Johannisson 7
Kvantitativa data Centralmått (Central tendencies) Medelvärde (mean, m, X ) Summan av alla mätvärden dividerat med antalet individer Median (md) Det värde som delar fördelningen i två lika stora delar efter sortering från lägsta till högsta värde Typvärde (mode) Det vanligast förekommande värdet Obs nr Ålder 7 21 10 29 8 30 2 31 5 32 6 36 3 45 4 50 1 58 9 58 n = 10 390 390 X 39,0 10 md = 34 mode = 58 Spridningsmått vid normalfördelning Standardavvikelse (standarddeviation, SD, s) den genomsnittliga avvikelsen från medelvärdet Medelvärde 2 SD = ca 95% av observationerna Obs nr 1 Värde (x i ) 5 x i x -4 ( x i x) 16 2 15 6 36 3 10 1 1 4 8-1 1 5 15 6 36 6 10 1 1 7 3-6 36 8 6-3 9 72 0 136 s 72 X 9,0 8 2 ( X i X ) 136 n 1 7 19,4286 4,41 2 Arne Johannisson 8
Normalfördelningens egenskaper Spridningsmått för ej normalfördelade variabler Kvartilavstånd (interquartile range, IQR, q 1,q 3 ) Omfattar 50% av alla värden (varav 25% ligger över och 25% under medianen), oavsett fördelning Variationsvidd (range) Skillnaden mellan lägsta och högsta värdet Obs nr Värde 7 3 1 5 8 6 4 8 3 10 6 10 2 15 5 15 q 1 = 5,5 q 2 (= md) = 9 q 3 = 12,5 IQR Min Max Lägsta och högsta observerade värdena Arne Johannisson 9
Grafisk presentation: Boxplot 25% max q 3 Variationsvidd (range) 25% 25% q 2 (= md) IQR 25% q 1 min Grafisk presentation: Boxplot 30 Time to complete the PDQ-39 (minutes) 25 20 15 10 5 0 HY I-II HY III HY IV-V Hagell et al. Qual Life Res 2004; 13: 1545. Arne Johannisson 10
Låt dig inte luras och luras inte... Jakobsson. Vård i Norden 2005; 76: 62-63. Låt dig inte luras och luras inte... Jakobsson. Vård i Norden 2005; 76: 62-63. Arne Johannisson 11
Användning av deskriptiv statistik Centralmått Mätnivå Medel Median Typvärde Spridningsmått SD IQR Min Max / Variationsvidd Totalt antal Kvot X X X X X X (X) Intervall X X X X X X (X) X X X X (X) Snedfördelad intervall/kvot Ordinal X X X X (X) Nominal X X X: Används normalt i första hand (X): Kan användas men tveksam funktion som spridningsmått Precision, konfidensintervall Populationsvärden okända Stickprovsvärdet = bästa uppskattningen Precisionen ökar med stickprovets storlek Konfidensintervall (confidence interval, CI) Kan beräknas utifrån stickprovets storlek, medelvärde och spridning Med detta intervall har vi en given sannolikhet, ofta 95% (95% CI), för att inkludera det sanna medelvärdet. Ett hypotetiskt exempel: m 50 50 50 50 50 n 30 90 60 60 60 s 20 20 20 10 30 Beräkning: SE (standard error) = 95% CI = 95% CI 42.8 57.2 45.8 54.2 44.8 55.2 47.4 52.6 42.2 57.8 s n X 1. 96SE Arne Johannisson 12
Ett exempel Jämförande statistik: Hypotesprövning Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Population Skillnader mellan värden i grupper/stickprov Verklig eller slumpmässig skillnad? Arne Johannisson 13
Hypotesprövning Med hypotesprövning vill vi bestämma oss för vilken av dessa två hypoteser vi vill lita på: Nollhypotesen (H 0 ): Det föreligger ingen skillnad mellan grupperna i populationen. Mothypotesen (H 1 ): Det föreligger en reell skillnad mellan grupperna i populationen (mothypotesen negerar nollhypotesen). Hypoteserna testas med en testfunktion (analysmetod) under antagandet att nollhypotesen är sann. Baseras på medelvärden och spridningsmått eller fördelning av stickprovens variabelvärden, proportioner. Statistisk signifikans Sannolikheten att en åtminstone så stor observerad skillnad, effekt, el. dyl. hade erhållits om nollhypotesen (H 0 ) var sann (pvärde). Om den här sannolikheten (p-värdet) är väldigt liten, ofta mindre än 5% (p<0.05), så väljer vi att tro att mothypotesen är sann. P-värde P-värdet kan anta värden mellan 0 och 1 Ju lägre P-värde, desto mindre risk att felaktigt dra slutsatsen att en skillnad föreligger (förkasta H 0 ). Arne Johannisson 14
Statistisk signifikans P-värdet säger INTE någonting om skillnadens storlek eller (kliniska) betydelse! P-värdet bestäms av Effektens storlek (t. ex. skillnaden mellan grupper) Gruppstorlek Spridning inom grupper En illustration Förhållande mellan gruppstorlek och skillnad i medelvärden för att skillnaden skall bli statistiskt signifikant (P<0.05) n Skillnad 4 14.70 9 9.80 25 5.88 64 3.68 100 2.94 400 1.47 900 0.98 Norman & Streiner (2000). Biostatistics - the bare essentials. Arne Johannisson 15
Val av analysmetod Styrs av: Vad man vill jämföra Upprepade observationer, samma individer (skillnad inom en grupp över tid) Observationer från olika individer (skillnad mellan grupper) Två eller flera tidpunkter/grupper Data Mätnivå (nominal vs. ordinal vs. intervall/kvot) Fördelning (ungefärlig normalfördelning?) Spridning i respektive grupp (ungefär lika?) Huvudindelning av analysmetoder Parametriska metoder Utgår från medelvärden och normalfördelning Förutsätter: kvantitativa variabler normalfördelning lika spridning Icke-parametriska metoder Utgår från rangordning och proportion Okänsliga för variabeltyp, snedfördelning och olikheter i spridning 600 600 500 500 400 400 Antal 300 Antal 300 200 200 100 100 0 0 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 Åldersgrupper Åldersgrupper Medelvärde Median Median Medelvärde Arne Johannisson 16
Parametrisk hypotesprövning: Kvantitativ, normalfördelad variabel Jämförelse av medelvärden i två olika grupper (oberoende observationer) Är skillnaden mellan grupperna så pass stor att det kan anses sannolikt att det finns en verklig skillnad? Testfunktion: t-test (oparad, unpaired) t s 2 x 1 x 2 ( 1/ n1 1/ n2) = Skillnad i medelvärden SE av medelvärdesskillnaden Liknande funktion vid parvis jämförelse (samma grupp över tid) Sannolikheten att erhålla det observerade värdet för t om det inte föreligger reell skillnad = P-värdet Ju högre t, desto lägre P-värde Ett exempel nature neuroscience volume 5 no 7 july 2002 Arne Johannisson 17
Icke-parametrisk hypotesprövning: Icke normalfördelad/ordinalskalevariabel Observationerna rangordnas Fördelningen av rangtalen jämförs mellan grupperna (oberoende observationer: Mann-Whitney U-test) Grp A: 54 62 64 66 71 74 Grp B: 38 42 48 53 59 60 70 74 Rang: 1 2 3 4 5 6 7 8 9 10 11 12 13,5 Rangsumma, grp A: 5+8+9+ +13,5 = 57,5 Rangsumma, grp B: 1+2+3+ +13,5 = 47,5 Sannolikheten att erhålla den observerade fördelningen av rangsummor då ingen skillnad föreligger = P-värdet Fördelningen av rangtalen jämförs mellan positiva och negativa förändringar (parvis jämförelse: Wilcoxon signedrank test) Skillnad t1-t2 Rangtal 29 5,5 41 7 0 12 2-5 1 19 4-13 3 29 5,5 Pos. rangsumma: 5,5+7+2+4+5,5 = 24 Neg. rangsumma: 1+3 = 4 Ett exempel nature neuroscience volume 5 no 7 july 2002 Arne Johannisson 18
Grafisk presentation (boxplot) 80 P = 0.002 70 UPDRS motor score (0-108) 60 50 40 30 20 10 0 Preop 3 yrs postop Hagell et al. Nat Neurosci 2002; 5: 627-628. Ett annat exempel... Arne Johannisson 19
Jämförelse mellan mer än två grupper Parametriska metoder Oberoende observationer: Analysis of variance (ANOVA) Testfunktionen F (tolkas som t) Beroende observationer: Repeated-measures ANOVA Icke-parametriska metoder Oberoende observationer: Kruskal-Wallis ANOVA Beroende observationer: Friedman test Tolkas som t-test/mann-whitney U-test/Wilcoxon signed-rank test men över samtliga jämförda grupper Post-hoc test: Visar mellan vilka av grupperna som en skillnad föreligger ANOVA - förutsättningar Fler än två grupper Slumpmässigt urval från varje grupp. Vi antar att grupperna: är normalfördelade kan ha olika medelvärde har samma spridning, varians, i2. (standardavvikelsen 2 ) 1 2 3 Population 1 Population 2 Population 3 Arne Johannisson 20
Icke-parametrisk hypotesprövning: Proportioner/kvalitativa variabler Skiljer sig fördelningen av individer mellan de olika kategorierna från vad man kan förvänta sig om det inte är någon skillnad? Frisk Sjuk Kvinnor a c Män b d Testfunktion: Chi-2-test (Chi-square) ( O E E 2 2 ) Skillnaden mellan den observerade (O) och förväntade (E, expected) fördelningen Sannolikheten att erhålla det observerade Chi-2-värdet = P-värdet Ju högre Chi-2-värde, desto lägre P-värde Föreligger det en könsskillnad i förekomsten av hypertoni bland personer med diabetes? OBSERVERAT Ej hypertoni Kvinnor 133 Män 154 totalt 287 Förväntade värden = E E = radsumma x (kolumnsumma/totalsumma) Hypertoni totalt 137 270 128 282 265 552 287 x (270/552) = 287 x 0,49 = 140 287 x (282/552) = 287 x 0,51 = 146 265 x (270/552) = 265 x 0,49 = 130 265 x (282/552) = 265 x 0,51 = 135 FÖRVÄNTAT Ej hypertoni Hypertoni Kvinnor 140 130 Män 146 135 ( O E E 2 2 ) 2 = 1,582 P = 0,208 Utav kvinnorna (n=270) var det 137 (50,7%) som hade hypertoni, bland männen (n=282) var denna siffra 128 (45,4%). Skillnaden var inte signifikant (P=0,208). Arne Johannisson 21
Ett exempel från statistikprogrammet SPSS Två oberoende grupper, ett mättillfälle, undersökningsvariabeln kvalitativ. Diabetesbehandling * Hypertoni (bltr eller beh) Crosstabulation Hypertoni (bltr eller beh) Nej Ja Total Diabetesbehandling Enbart kost Count 82 86 168 Expected Count 87,2 80,8 168,0 Tablettbehandling Count 102 111 213 Expected Count 110,6 102,4 213,0 Insulinbehandling Count 89 54 143 Expected Count 74,2 68,8 143,0 Ins + tabl.behandl Count 13 14 27 Expected Count 14,0 13,0 27,0 Total Count 286 265 551 Expected Count 286,0 265,0 551,0 Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Squar 8,291 a 3,040 Likelihood Ratio 8,366 3,039 Linear-by-Linear Association 3,085 1,079 N of Valid Cases 551 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 12,99. Inte bara skillnader Hypotesprövning och P-värden kan beräknas för flertalet typer av analyser Tolkningen av P-värdet utgår dock alltid (om inget annat anges) från nollhypotesen, t. ex. Korrelation/sambandsanalys: H 0 : Det föreligger inget samband Förklaringsmodeller: H 0 : Oberoende variabeln X förklarar inte värdet på beroendevariabeln Y Riskbedömning: H 0 : X ökar inte risken för sjukdom Arne Johannisson 22
Korrelation Samvarierar variabel X linjärt med variabel Y? Grafiskt: Spridningsdiagram (scatterplot) Y Y X Positiv linjär samvariation X Negativ linjär samvariation Korrelation Parametrisk metod Pearson s (produkt-moment) korrelation (r) Kvantitativa variabler Normalfördelning Icke-parametrisk metod Spearman s korrelation (r s,, rho) Vid data på ordinalskalenivå och/eller kvantitativa icke normalfördelade variabler Utgår från rangordning Okänslig för variabeltyp, snedfördelning och olikheter i spridning Arne Johannisson 23
Korrelationskoefficienten Korrelationskoefficienten (r) uttrycker graden av linjär samvariation Varierar mellan -1 och 1 Tecknet framför anger riktning Positivt r = positiv korrelation (Y ökar när X ökar) Negativt r = negativ korrelation (Y minskar när X ökar) Värdet (oavsett riktning) anger styrkan r nära 1 = stark positiv korrelation r nära -1 = stark negativ korrelation r nära 0 = svag korrelation Styrkan anger i vilken utsträckning punkterna samvarierar linjärt, dvs fördelar sig utmed en rät linje Några hypotetiska exempel r = 1 r = 0.65 r = 0 Y Y Y r = 0.90 X X r = -0.80 r = 0 X Y Y Y X X X Arne Johannisson 24
Fler exempel Anger inte lutningen, endast graden av linjäritet i samvariationen Mäter inte icke-linjära samband r = 0.90 r = 0.90 r = lågt Y Y Y X X X Tolkning av korrelationskoefficienten Statistisk signifikans H 0 : r = 0 i populationen, den erhållna korrelationen är så liten att den sannolikt inte skulle finnas i populationen. H 1 : r = sannolikt större än 0 i populationen. Tolkas med försiktighet Styrkan (r) Exempel på riktlinjer <0.20: Dålig 0.20-0.35: Svag 0.35-0.65: Måttlig 0.65-0.85: Stark >0.85: Mycket stark Situationsberoende Arne Johannisson 25
Korrelation: Användningsområden Främst förberedande metod Explorativt för att generera hypoteser och sambandsmodeller Utveckling och utvärdering av mätinstrument, enkäter, etc. Ett exempel Ruggiero. Research in Nursing & Health 2003; 26: 434-444. Arne Johannisson 26