Kvantitativ metod och grundläggande statistik Olika typer av studier Experiment 1. Manipulation 2. Kontroll 3. Randomisering Klinsika prövningar Observationsstudier Retrospektivstudie Tvärsnittsstudie Prospektivstudie Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering 1
Variabler = De egenskaper vi studerar/ mäter Beroende variabel (dependent variable) Utfallsvariablen Det vi studerar Det sompåverkas Beroende av de oberoende variablen Oberoende variabel (independent variable) Variabler som påverkar utfallet Förklaringsvariabler Oberoende av den beroende variablen Exempel 1. Hur påverkar interventionen X patientens upplevad hälsa? Interventionen X = oberoende Upplevdhälsa = beroende 2. Vilka av faktorerna sjukdomsgrad, ålder, kön, och BMI förklarar bäst graden av upplevd hälsa? Sjukdomsgrad, ålder, kön och BMI = oberoende Upplevd hälsa = beroende Mätnivåer Nominal (kvalitativ variabel; t ex kön, boendeform) Kategorier utan kvantitativ mening Klassificering 0=kvinna 1=man Ordinal (kvalitativ variabel; t ex symtom svårighetsgrad) Ojämna (okända) intervall Ordning 01 23 4 Intervall (kvantitativ variabel; t ex temperatur enlig Celcius & Fahrenheit) Jämna intervaller med absulota magnituder okända och noll-punkt arbiträr Ordning + differens -1 0 1 2 3 Kvot (kvantitativ variabel; t ex blodtryck, lab-prover) Jämna intervall med absoluta magnituder och noll-punk Ordnign + differens + kvot 0 1 2 3 4 5. 2
Grafisk presentation av kvalitativa data Histogram Normalfördelning (symetrisk) Medelvärde Median Positiv snedfördelning Negativ snedfördelning Median Medelvärde Medelvärde Median Kvantitativa data Centralmått (Central tendencies) Medelvärde (mean, m, x) Summan av alla mätvärden dividerat med antalet observationer Median (md) Det värde som delar fördelningen I två likastoradelar efter sortering från lägsta till högsta värde Typvärde (mode) Det vanligast förekommande värdet Obs nr Ålder 7 21 10 29 8 30 2 31 5 32 6 36 3 45 4 50 1 58 9 58 n=10 Σ=390 m=390/10=39,0 md = 34 mode = 58 Spridningsmått vid normalfördelning Standardavvikelse (standarddeviations, SD,s) den genomsnittliga avvikelsen från medelvärdet Medelvärdet ± 2 SD 0 ca 95% av alla observationer Obs nr Värde (xi) xi- m (xi- m)2 1 5-4 16 2 15 6 36 3 10 1 1 4 8-1 1 5 15 6 36 6 10 1 1 7 3-6 36 8 6-3 9 Σ 72 0 136 M=72/8=9,0 SD= Σ(xi- m)2/(n- 1)= 136/7=4,41 3
Normalfördelning Spridningsmått för ej normalfördelade variabler Kvartilavstånd (interquartiale range, IQR, q1,q3) Omfattar 50% av alla observationer(varav 25% ligger över och 25% ligger under medianen) oavsett fördelning Obs nr värde 7 3 1 5 8 6 4 8 3 10 q1=5,5 q2=md=9 IQR Variationsvidd (range) Skillnaden mellan lägsta och högsta värdet 6 10 2 15 5 15 q3=12,5 Min-max Lägsta och högsta värdet Boxplott IQR Max q1 q2=md q3 Min Variationsvidd (range) 4
Användning av deskriptiv statistik CentralmåF SpridningsmåF Mätnivå Medel Median Typvärde SD IQR Min- Max/ VariaQonsvidd Totalt antal Kvot O X X O X X (X) Intervall O X X O X X (X) Snedfördelad intervall/kvot O X O X (X) Ordinal O X O X (X) Nominal O O O: Används normalt i första hand X: kan användas (X): kan användas men tveksamt som spridningsmått Precision, konfidensintervall Populationsvärden okända Stickprovsvärden = bästa uppskattningen Precisionen ökar med stickprovets storlek Konfidensintervall (confidence intervall, CI) Kan beräknas utifrån stickprovets storlek, medelvärde och spridning Med detta intervall har vi en given sannolikhet, ofta 95% (95% CI), för att inkludera det sanna medelvärdet m n SD 95% CI 50 30 20 42.8-57.2 50 90 20 45.8-54.2 50 60 20 44.8-55.2 50 60 10 47.4-52.6 50 60 30 42.2-57.8 Beräkning: SE (standard error) = SD / n 95% CI = m±1.96 SE Ett exempel 5
Jämförande statistik: Hypotesprövning Representativt (randomiserat) urval Population Stickprov Slutsatser Generalisering Population Skillnader mellan värden i grupper/stickprov Verklig eller slumpmässig Hypotesprövning Med hypotesprövning vill vi bestämma vilken av dessa två hypotesr vi vill lita på Nollhypotesen (H 0 ) Det föreligger ingen skillnad mellan grupperna i populationen Mothypotesen (H 1 ) Det föreligger en reell skillnad mellan grupperna i populationen Hypoteserna testas med en testmetod (analysmetod) där man gör antagandet att nollhypotesen är sann Baseras på medelvärde och spridningsmått eller fördelning av stickprovens variabelvärden, proportioner. Statistisk signifikans Sannolikheten att det inte finns en mätbar skillnad mellan grupperna om nollhypotesen (H 0 ) är sann. P-värde Vad är sannolikheten för vår observerade resultat om H 0 är sann => om p-värdet är litet (p< 0.05) så förkastas H 0 P-värdet kan anta värden mellan 0 och 1 Ju lägre p-värde, desto» Mindre risk att felaktigt dra slutsatsen att en skillnad föreligger (förkasta H 0 ) 6
Statistisk signifikans P-värdet säger INTE något om skillnadens storlek eller kliniska betydelse P-värdet bestäms av Effektens storlek (t ex skillnaden mellan grupperna) Gruppstorlek Spridning inom gruppen Val av analysmetod Styrs av: Vad man vill jämföra» Upprepade observationer, samma individer (skillnad inom en grupp över tid)» Observationer från olika individer (skillnad mellan grupper)» Typ eller fler tidpunkter/grupper Data» Mätnivå (nominal vs. ordinal vs. intervall/kvot)» Fördelning (ungefärlig normalfördelning?)» Spridning I respektive grupp (ungefär lika?) Huvudindelning av analysmetoder Parametriska metoder Utgår från medelvärden och normalfördelning Förutsatser Kvantitativa variabler Normalfördelning Lika spridning Icke-parametriska metoder Utgår från rangordning och proportion Okänsliga för variabeltyp, snedfördelning och olikheter i spridning Medelvärde Median Median Medelvärde 7
Parametrisk hypotesprövning: Kvantitativ, normalfördelad variabel Jämförelse av medelvärden i två olika grupper (oberoende observationer) Är skillnaden mellan grupperna så pass stor att det kan ses som sannolikt att det finns en verklig skillnad? T-test (oparat, unpaired) t= Skillnaden i medelvärden / SE av medelvärdesskillnaden Liknande funktion vid parvis jämförelse (sammagrupp över tid) Sannolikheten att erhålla det observerade värdet jämfört med t om det inte föreligger reell skillnad = p-värde Ju högre t, desto lägre p-värde Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Table 2. Results of exercise tests and tests of muscle strength and endurance before and a=er the training period.*+ 8
Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Icke-parametrisk hypotesprövning: Icke normalfördelade/ordinalskalevariabel Observationerna rangordnas Fördelningen av rangtalen jämförs mellan grupperna (oberoende observationer: Mann-Whitney U-test) Fördelningen av rangtalen jämförs mellan positiva och negativa förändringar (parvis jämförelse: Wilcoxon signedrank test) Sannolikheten att erhålla den observerade fördelningen av rangsummor då ingen skillnad föreligger = p-värde Mann-Whitney U-test: Test mellan grupper Grupp A: 54 62 64 66 71 74 Grupp B: 38 42 48 53 59 60 70 74 Rang: 1 2 3 4 5 6 7 8 9 10 11 12 13.5 Rangsumma (W A ), Grupp A: 5 + 8 + 9 +10 + 12 + 13.5= 57.5 Rangsumma (W B ), Grupp B: 1 + 2+ 3 + 5 + 6 + 7 + 11 + 13.5 = 47.5 Förkasta H 0 om medelrangerna W A /n A och W B /n B skiljer sig mycket från varandra W A /n A = 57.5 / 6 = 9.6 W B /n B = 47.5 / 8 = 6.0 9
Wilcoxon signed-rank test: Mellan mättillfällen Skillnad t1- t2 Rangtal 29 5.5 41 7 0 12 2-5 1 19 4-13 3 29 5.5 Positivt rangsumma (W + ): 5.5 + 7 + 2 +14 + 5.5 = 24 Negativ rangsumma (W - ): 1 + 3 = 4 Förkasta H 0 om W + och W - skiljer sig mycket från varandra Grafisk presentation (boxplot) Jämförelse mellan mer än två grupper Parametriska metoder Oberoende observationer Analys of variance (ANOVA) Testfunktion F (tolkas som t) Beroende observationer Repeated-measures ANOVA Icke-parametriska metoder Oberoende observationer Kruska-Wallis ANOVA Beroende observationer Friedmans test Parametriska metoder Tolkas som t-test/mann-whitney U-test/Wilcoxon signed-rank test men över samtliga grupper Post-hoc test: Visar mellan vilka av grupperna som skillnaderna föreligger 10
ANOVA - fortsättning Fler än två grupper Slumpmässigt urval från varje grupp VI antar att grupperna: Är normalfördelade Kan ha olika medelvärden Har samma spridning, varians σ 2, (standardavvikelsen 2 ) Icke-parametrisk hypotesprövning: Proportioner/kvalitativa variabler Skiljer sig fördelningen av individer mellan de olika katagorierna från vad man kan förvänta sig om det inte är någon skillnad? Kvinnor Män Frisk a b Sjuk c d Test funktion: Chi-2-test (Chi-square) Skillnaden mellan den observerade (O) och förväntade (e, expected) fördelningen Sannorlikheten att erhålla det observerade Chi-2-värdet = p-värde Ju högre Chi-2-värde, desto lägra p- värde Föreligger det en könsskillnad i förekomsten av hypertoni bland personer med diabetes? OBSERVERAT Kvinnor Män Totalt Ej hypertoni 133 154 287 Hypertoni 137 128 265 Totalt 270 282 552 Förväntat värde = e e = radsumman x (kolumnsumman/totalsumman) 287 x (270/552) = 287 x 0.49 = 140 287 x (282/552) = 287 x 0.51 = 146 265 x (270/552) = 265 x 0.49 = 130 265 x (282/552) = 265 x 0.51 = 135 FÖRVÄNTAT Kvinnor Män Ej hypertoni 140 146 Hypertoni 130 135 Utav kvinnorna (n=270) var det 137 (50.7%) som hade hypertoni, bland männen (n=282) var det 128 (45.5%). Skillnaden var inte statiskt signifikant (p=0.208) 11
Inte bara skillnader Hypotesprövning och p-värde kan beräknas för flertalet typer av anaylser Tolkningen av p-värde utgår dock alltid (om inget annat anges) från nollhypotesen: Korrelation/sambandsanalys:» H 0 : Det föreligger inget samband Förklaringsmodeller:» H 0 : Observerade variablen X förklarar inte värdet på beroendevariabeln Y Riskbedömningar:» H 0 : X ökar inte risken för sjukdom Korrelationer Samvarierar variable X linjärt med variabel Y? Grafiskt: Spridningsdiagram (scatterplot) Korrelation Parametrisk metod Pearson s korrelation (r) Kvantitativa variabler Normalfördelning Icke-parametrisk metod Spearman s korrelation (r s, r ho ) Vid data på ordinalskalenivå och/eller kvantitativa icke normalfördelade variabler Utgår från rangordning Okäsnlig för variabeltyp, sendfördelning och olikheter I spridning 12
Korrelationskoefficienten Korrelationskoefficienten (r) uttrycker graden av linjär samvariation Varierar mellan -1 och 1 Tecken framför anger riktning Positivt r Värdet (oavsett riktning) anger styrkan (lutningen) Några exempel på korrelationer Tolkning av korrelationskoefficienten Statistisk signifikans H 0 : r = 0 i populationen, H 1 : r = större än 0 i populationen Styrkan Situationberoende Riktlinjer» <0.20: Dålig» 0.20-0.35: Svag» 0.35-0.65: Måttlig» 0.65-0.85: Stark» >0.85: Mycket stark 13
Assessment of exercise capacity in women with type 2 diabetes. Segerström Å, Glans F, Eriksson K, Groop L, Thorsson O, Wollmer P. Clinical Physiology & Functional Imaging [serial online]. September 2008;28(5):294-298. Upper Body Muscle Strength and Endurance in RelaMon to Peak Exercise Capacity during Cycling in Healthy Sedentary Male Subjects. Segerstrom, Asa; Holmback, Anna; Elzyri, Targ; Eriksson, Karl- Fredrik; Ringsberg, Karin; Groop, Leif; Thorsson, Ola; Wollmer, Per Journal of Strength & CondiMoning Research. 25(5):1413-1417, May 2011. Table 3. Pearson's correlaqon coefficient between measurements of muscle strength and endurance of the upper body and [laqn capital V with dot above]o2peak and WRpeak.* 2 Statistiska tester Sammanfattning Statistiska test Kvantitativa data Kvalitativa data Ett stp T-test Två eller fler stp Ett stp Chi-två Två eller fler stp Oberoende t-test Beroende Parat t-test Oberoende Mann-Whiteny Beroende Wilcoxon 14
15