Statistik en introduktion

Varför kurs i vetenskaplig metod? Statistik en introduktion Frida Eek Framtida forskning? Projektarbete? Förståelse! Tolkning! Kritisk granskning/utvärdering! frida.eek@med.lu.se Statistik 2 Medicinsk statistik LITTERATURTIPS Jonas Björk Praktisk statistik för medicin och hälsa Upplägg Föreläsning 1 Datatyper Lägesmått och spridningsmått Punktskattning och tillhörande osäkerhet Introduktion till hypotesprövning Föreläsning 2 Mer om hypotesprövning Introduktion till statistiska test: Gruppjämförelser Introduktion till korrelation och linjär regression Statistik en överblick Studiepopulation Stickprov Datainsamling Deskriptiv statistik används för att beskriva urvalet/study sample/försökspersonerna dvs dem du gjort mätningarna på! Statistiska test används för att uttala dig om den bakomliggande populationen ( alla ) Skattningar och hypotes-prövningar slutsatser Analytisk statistik Analys Beskrivning Deskriptiv statistik 1

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Studiedesign: Tvärsnitt eller upprepade mätningar? -Paired or nonpaired data? ( repeated measurements ) Hur många grupper? (1, 2 eller fler?) Samples size: Stort eller litet urval? Fördelning: Normalfördelat eller snedfördelat? (Symmetriskt eller assymetriskt) Variabeltyper och mätnivåer Variabel=något/en egenskap som kan anta olika värden Nominalskala Kategorisk eller metrisk/numerisk data? Ordinal eller rangskala Intervall skala Kvotskala Skalor Skala för observationerna Kvalitativa data Nominal Ordinal Intervall Olika kategorier Ja Kvantitativa (metriska) data Rangordning Nej Avstånd mellan kat. Nollpunkt Ja Ja oklart ---- Ja Ja ---- ---- Ja ---- Exempel 1 Man 2 Kvinna 5. Ja, hela tiden 4 Ja, ofta 3 Ja, ibland 2 Ja, någon gång 1. Nej, aldrig Temperatur Kvot Ja Ja Ja Ja Ålder, vikt Summering av de viktigaste distinktionerna Kategorisk data: Nominalskala: Olika kategorier, ingen inbördes rangordning. (Ex husdjurs-art, utbildningsprogram/ämne, typ av diagnos osv) Om endast två möjliga värden (man/kvinna, sjuk/frisk) kallas det även binär eller dikotom variabel. Ordinalskala: Kategorier med inbördes rangordning, men man kan ej säga exakt hur stor skillnaden är mellan varje kategori. Eventuella nummer är endast etiketter. Man vet att tex 5 (= alltid ) är mer än 3 (= ibland ), men inte hur mycket mer (och kanske inte precis lika mycket mer som 3(= ibland ) är jämfört med 1 ( aldrig )). Numerisk data Numerisk/metrisk/kvantitativ skala: värdet står för något exakt, siffran betyder något i sig. Ex längd, vikt, reaktionstid, antal barn, antal kattungar. Lika intervall mellan varje steg på skalan. Man vet att 3 kattungar är 1 kattunge mer än 2 kattungar (och lika många fler som 5 kattungar är jämfört med 4 kattungar!). Man vet att någon som är 20 år är dubbelt så gammal som någon som är 10 år. Numeriska/kvantitativa skalor kan vara antingen diskreta (kan anta endast heltal, tex antal barn (eller kattungar!)) eller kontinuerliga (kan ha vilket värde som helst inkl decimaler, tex reaktionstid, vikt). 2

Spelar skalnivå någon roll? Val av deskriptiv presentation styrs av skalnivå Val av test: (kombinationen av) olika skalnivåer passar för olika test. Typ av test avgörs därför bland annat av skalnivå (i kombination med studiedesign, sample size och huruvida ev metriska variabler är normalfördelade eller ej) Deskriptiv statistik Beskriver gruppens data/värde på ett överskådligt sätt (utan att presentera alla individuella värden), grafiskt eller numeriskt. Valet av hur data bäst ska presenteras/beskrivas görs utifrån hur data ser ut Symmetriska kontinuerliga/metriska data Asymmetriska kontinuerliga/metriska data Ordinaldata Nominaldata Nominaldata: Varför procent? Vare sig medel eller median är relevant Procent, typvärde Här: Skåne= 39% Småland= 29% Halland = 32% 3

Metriska data (Intervall-kvotskala) Viktiga frågor: Var ligger tyngdpunkten? Hur stor är spridningen? 178 cm 171 cm 175 cm 184 cm 181 cm x n 171 cm 162 cm 171178 184 175 181162 171 174,6 7 Medel: 174.6 + Lätt att tolka och förstå (med varsamhet vid ordinalskala!) - Känsligt för extremvärden/outliers Alternativ till medelvärde: Rangordning Centralmått för rangordnad data 171 cm 178 cm 184 cm 175 cm 181 cm 162 cm 171 cm Median det mittersta värdet när man sorterat observationerna i storleksordning Typvärde det mest förekommande värdet (används oftare vid kategorisk data) Längd 162 171 171 175 178 181 184 162 cm 171 cm 171 cm 175 cm 178 cm 181 cm 184 cm 1 2.5 2.5 4 5 6 7 Rang 1 2,5 2,5 4 5 6 7 När ska man använda vad? Fördelningen (av den metriska variabeln som ska beskrivas) avgör! Normalfördelat/symmetriskt eller snedfördelat/assymmetriskt? Symmetriska kontinuerliga data Tyngdpunkten ligger mitt i Medel = median Exempel: IQ, BMI Använd medel! 4

Asymmetriska kontinuerliga data Data förskjutet Medel < median ELLER medel > median Exempel: Många biologiska prover Använd median! I bilden: Medel =22,8, median =19.6 Ordinaldata Md=5 Md=3 Det numeriska värdet är bara en etikett Tex självskattningsskalor Egentligen: använd median. I praktiken används dock ofta medelvärde (för ex självskattningsskalor) Symmetrisk data Medel Centralmått Asymmetrisk data Ordinal data Nominal data Median Median (medel?) --- (typvärde) Spridning Spridningsmått Liten spridning Beskriver hur pass koncentrerade data är kring centralvärdet Är inte beroende av var tyngdpunkten ligger Stor spridning Precis som för centralvärde används olika mått för symmetriska och asymmetriska data Symmetri spridningsmåttet baseras på medelvärdet Asymmetri spridningsmåttet baseras inte på medelvärdet 5

Hur beskriva spridning (av kvantitativa variabler)? Genomsnittlig avvikelse från medelvärdet? Denna summa skulle dock bli noll! Genom att kvadrera varje term slipper man detta problem Detta kallas för variansen x i n x x i x 2 n Hur beskriva spridning? Genom att ta roten ur variansen får man standardavvikelsen (standarddeviationen) sd x x Detta spridningsmått har samma enhet som det man mäter i n 2 Varians och standardavvikelse Standardavvikelse sd (standard deviation) genomsnittlig avvikelse från medelvärdet x x x 2 i x i x i 171-3.6 12.96 162-12.6 158.76 181 6.4 40.96 175 0.4 0.16 184 9.4 88.36 178 3.4 11.56 171-3.6 12.96 x 174,6 SS =325,72 (Sum of squares) 178 cm 181 cm 184 cm 162 cm 175 cm 2 x 2 i x sd n sd 171 cm 171 cm 46,5 46,5 6,8 Andy Field Andy Field L. PUENTE-MAESTU ET AL. Comparison of effects of supervised versus self-monitored training programmes in patients with chronic obstructive pulmonary disease. Eur Respir J. 2000 Mar;15(3):517-25. 6

Percentiler/Kvartiler Percentiler delar in grupppen i 100 lika delar Kvartiler delar in gruppen i 4 lika stora delar Variationsvidd= differensen mellan max och min BMI 19 20 21 21 22 23 24 24 Rang 1 2 3,5 3,5 5 6 7 8 25e percentilen Lägre kvartilen 20,5 Median 21,5 75e percentilen Övre kvartilen 23,5 Percentiler/kvartiler Percentilen anger det värde nedanför vilket en viss procent av observationerna av variablen hamnar 10% av urvalet har ett värde lägre än (eller lika med)10:e percentilen 20% har ett värde lägre än 20:e percentilen Etc Kvartilerna delar in gruppen i 4 lika stora delar q 25 n n 1 1 100 100 25:e perc/q1: 1 1 Eek et al. Cortisol, sleep, and recovery - Some gender differences but no straight associations.psychoneuroendocrinology. 2012 Jan;37(1):56-64 Carlsson et al. Salivary cortisol and self-reported stress among persons with environmental annoyance. Scand J Work Environ Health ; 2006 Apr;32(2):109-20 Centralmått Spridningsmått Symmetrisk data Medel Varians eller standardavvikelse Asymmetrisk data Median Percentiler Ordinal data Median (medel..) Nominal data (Typvärde) --- Percentiler (sd) 7

Normalfördelningen Bestäms entydigt av medelvärde (M) och standardavvikelse (S) Värden för standardiserad normalfördelning (M=0, S=1) finns i tabeller Hur vet vi om data är normalfördelade? Jämför medel och median Storlek på SD (i förhållande till medel)? Boxplot Histogram Svårt att avgöra i små sample, men extrema outliers avslöjas Testa symmetri/normalfördelning (skewness, kurtosis, Kolmogorov smirnov-test) Grafisk koll: box-plot Max Upper quartile Median Lower quartile Min Symmetriskt eller assymmetriskt? Johansson G et al. Role stress among first-line nurse managers and registered nurses - a comparative study. Journal of Nursing Management, April 2013, 21(3):449-458 8

NON-PARAMETRIC STATISTICAL ANALYSIS IN THE MEASUREMENT OF OUTDOOR GAMMA EXPOSURE. Radiation Protection Dosimetry (2007), Vol. 124, No. 4, pp. 378 384 bmi Descriptives Mean 95% Confidence Lower Bound Interv al for Mean Upper Bound Median Variance Std. Dev iation Minimum Maximum Range Statistic 25.0390 24.9636 25.1143 24.5779 14.647 3.82714 14.20 56.17 41.97 KrTot Descriptives Mean 95% Confidence Lower Bound Interv al for Mean Upper Bound Median Variance Std. Dev iation Minimum Maximum Statistic Std. Error 8546,9098 261,42205 8034,4864 9059,3333 1874,8800 928555778,2 30472,21321,00 1275911 1275910,56 Descriptive Statistics bmi Valid N (listwise) N Range Minimum Maximum Mean Std. Variance Deviation Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic 9912 41.97 14.20 56.17 25.0390.03844 3.82714 14.647 9912 Size of SD? Vad gör man om data är snedfördelad? Anpassa statistiken/test (välj icke-parametrisk statistik) eller Anpassa data, om det går och är lämpligt: Ta bort orealistiska outliers? Transformera? 9

Log-transformering (logaritmering) av data Outliers/extremvärden Log transformation Få extrema värden kan få stor påverkan på resultatet (spec i små grupper), om man inte är medveten om och hanterar dem! Olika alternativ: Ta bort? Om det är uppenbart fel Inmatnings/läsningsfel? Ändra/korrigera? Omkoda: (Ex näst högsta värdet+ 1)? Vilken strategi som än väljs: BESKRIV i metod!! Varför bry sig om fördelningen? Parametriska vs icke-parametriska test Val av statistiskt test baseras delvis på fördelningen av data Parametric Non-parametric Parametriskt eller icke-parametriskt test? Based on Normal distribution necessary? Value Yes Rank No Effect estimated with CI? Yes No P-values Yes Yes Statistisk inferens och Hypotesprövning 10

Statistik en överblick Urval (sample) vs population Studiepopulation Skattningar och hypotes-prövningar slutsatser Stickprov Analytisk statistik Datainsamling Analys Beskrivning Deskriptiv statistik Urvalet består av de individer du undersökt vet du redan allt om du behöver inte gissa Populationen är alla de individer du inte undersökt (+ de du undersökt), men som du vill kunna säga något om du VET inget om dem men du vill kunna dra slutsatser om dem Statistisk inferens (att dra slutsatser om populationen baserat på information från urvalet) Nationalencyklopedin: induktiv vetenskap där man drar slutsatser ur empiriska data under en osäkerhet orsakad av slumpmässighet i data Estimat Data/information från urvalet används för att uttala sig om populationen Estimat (av olika parameter, ex medelvärde) Hypotestestning Populationens meddellängd är okänd Uppmätt medellängd= 174,6 cm Estimerad/uppskattad medellängd= 174,6 cm Standard error/standardfel Uppskattningen/estimatet är aldrig exakt Det finns viss osäkerhet i uppskattningen. Denna osäkerhet kan uttryckas i standard error (SE/SEM) eller standardfel Precision: Variation sd SE SE n SE beror på spridning av data (stor eller liten varians?) antal observationer I vårt lilla urval är SE = 2,78 cm sd n 2 11

Precision: Sample size = 10 M = 10 M = 9 M = 9 M = 11 M = 8 M = 10 M = 12 M = 10 M = 11 4 Mean = 10 SD = 1.22 3 Frequency 2 1 0 6 7 8 9 10 11 12 13 14 Sample Mean Andy Field. Discovering statistics using SPSS Sammanfattning, såhär långt.. Punktskattningen Urvalet används för att göra en uppskattning om populationen ( gissa ) Punktskattningen kan tex vara medelvärde Osäkerhet Standardfelet är ett mått på osäkerheten vår uppskattning Ju mindre SE, desto större säkerhet/precision I vår uppsakkning/ gissning Konfidensintervall Standardfelet kan användas att beräkna ett konfidensintervall Med en viss sannolikhet/säkerhet, täcker CI populationens sanna värde. Vidden på CI beror på Storleken på SE (mao variansen och storleken på urvalet) Konfidensgrad hur säkra vill vi vara? Konfidenensintervall -definition Om 95% konfidensgrad Definition: OM vi (i teorin) skulle göra 100 urval och beräknade ett CI för varje urval, skulle 95 av 100 täcka populationens sanna värde. Eller, lite förenklat: Med 95% sannolikhet, täcker CI populationens sanna värde. Motsvarande tolkning för andra konfidensgrader, tex 90% eller 99% (95% absolut vanligast!) Confidence interval -uträkning Generell formel för CI: point estimate constant SE Konstanten beror på konfidensgraden 95% 1,96 (eller 2, för huvudräkning ) Högre konfidensgrad innebär högre konstant, och bredare konfidensintervall Konfidensgrad på 90% ger en konstant = 1.64 Konfidensgrad på 95% ger en konstant = 1.96 Konfidensgrad på 99% ger en konstant = 2.58 Konstanterna kommer från Normalfördelningen. 12

Beräkning av konfidensintervall Generell formel för konfidensintervall Skattning ± konstant*se Konfidensgrad på 90% ger en konstant = 1.64 Konfidensgrad på 95% ger en konstant = 1.96 Konfidensgrad på 99% ger en konstant = 2.58 Konstanterna kommer från Normalfördelningen. Konfidensintervall exempel Study sample: 100 individer med medellängd 150,4 SD 29 x cse 150,4 1,962,9 144,7 156,1 Medellängden i populationen är, med 95% sannolikhet, någonstans mellan 144,7 cm och 156,1 cm I en vuxen population, med mindre spridning: Urval: Medellängd 176,0 cm, sd 12 cm. x cse 176,0 1,961, 2 173,6-178,4 CI för andelar Referensintervall p(1-p) 95% CI= p +/- 1.96x n Ett referensintervall säger något om spridningen i målpopulationen Istället för att använda SE används standardavvikelsen, s. Referensintervall exempel Stickprov om 100 nyfödda (fullgångna) barn Medelvikt: 3490 g SD:320 g 95% Referensintervall: 3490+/-1.96 x 390 =2 726-4 254 g Tolkning: 95% av alla nyfödda väger mellan 2726 och 4 254 g 13

Sammanfattning Konfidensintervall och referensintervall är beräknade baserat på data från stickprovet men drar slutsatser om målpopulationen! KONFIDENSINTERVALL: Medelvärdet i målpopulationen ligger med 95% säkerhet inom gränserna REFERENSINTERVALL: 95% av individerna i målpopulationen har ett värde inom gränserna Förutsättningar för konfidens- och referensintervall Stickprovet måste vara representativt för målpopulationen Kontinuerlig data måste vara approximativt normalfördelade Stickprovet är normalfördelat Eller Stickprovet stort (och variabeln normalfördelad i populationen) Konfidensintervall kan också användas för andra punktskattningar, tex effektestimat: Medelvärdesskillnader Regressionskoefficienter Oddskvoter HYPOTESPRÖVNING Vad är en hypotes? Ett antagande som man vill testa Nollhypotes(H0) : Det finns ingen skillnad/effekt (..mellan två grupper/metoder/behandlingar i populationen) Alternativhypotes (H1) Det finns en skillnad/effekt ( mellan två grupper/behandlingar/metoder i populationen) Alternativhypotesen Preciserar aldrig exakt HUR stor skillnad/effekt Handlar INTE om urvalet (utan populationen)! Ensidig eller tvåsidig: Tvåsidig det finns en skillnad (..avseende vad, mellan vilka!) Ensidig: anger riktning på skillnaden (variabel X ökar, eller minskar, eller a>b eller b>a ). Dvs, man har ett antagande om hur skillnaden ser ut 14

Statistical hypotheses are based on the concept of proof by contradiction. Egentligen är det nollhypotesen som testas! Resultatet är att H0 antingen accepteras, eller förkastas Frågan är: kan vi, med utgångspunkt i den information vi har från vårt urval/sample, förkasta nollhypotesen? I populationen H 0 -är sann? (dvs, det finns ingen skillnad) -är inte sann? (dvs, det finns en skillnad) I vårt urval ser vi en skillnad mellan grupperna. Dvs, H 0 verkar INTE vara sann Detta kan bero på: 1. Slumpen 2. Att H 0 inte är sann, dvs det FINNS en skillnad mellan grupperna i populationen! Normalfördelningskurvan p-värdet P-value Probability value Signifikansnivå Sannolikheten att du skulle få ett likadant (eller mer extremt) resultat som du fått i ditt urval (tex medelvärdesskillnad mellan två grupper) OM nollhypotesen vore sann, dvs det finns ingen skillnad mellan grupperna i populationen. Även kallad α-nivå Gränsen mellan när sannolikheten att resultatet beror på slump anses försumbar respektive inte försumbar. Vanligtvis 5% p=0.05 Om p 0.05, förkastas Ho. Dvs vi tror att där FINNS en skillnad (i populationen!). Om p>0.05, kan vi inte ignorera risken att vi hade kunnat få detta resultat, även om H0 vore sann. Dvs, vi kan INTE förkasta H0. 15

CI och p-value Varför konfidensintervall? Hypotesprövning kan genomföras med både p-värde och CI (förutsatt att data är normalfödelade) Båda metoderna leder till samma slutsats (givet samma signifikansnivå/konfidensgrad) Konfidensgrad+ signifikansnivå= 1 Om H 0 ligger utanför 95% CI är p < 5% Om H 0 ligger innanför 95% CI är p > 5% Konfidensintervallet kan användas för hypotesprövningen. Om nollhypotesen (tex mean difference=0, RR=1) ligger utanför CI, kan nollhypotesen förkastas Fördelen med CI jämfört med bara p-värde, är att CI säger inte enbart om resultatet är signifikant, utan ger även en uppskattning om storleken på effekten/skillnaden! Statistisk signifikans - klinisk relevans Lågt p-värde Statistisk signifikans: Det finns en skillnad Hur stor är skillnaden? Klinisk relevans: Har skillnaden någon betydelse? Skattning av storleken på effekten behövs! Andy Field Sammanfattning hypotesprövning: Förkasta H 0 (dvs, slutsats att det finns en skillnad i populationen) om: H 0 ligger utanför CI p < signifikansnivån Frågor?? Förkasta inte H 0 om: H 0 ligger innanför CI p > signifikansnivån Kom ihåg 1: H 0 kan aldrig bevisas! Kom ihåg 2:Vare sig CI eller p vill säga något om urvalet! 16

Sammanfattning Deskriptiv statistik används främst för att presentera och beskriva den undersökta gruppen Baserat på resultaten från den undersökta gruppen (urvalet/sample), görs uppskattningar (estimat) av variabler i populationen Analytisk/inferentiell statistik (statistiska test) används för att dra slutsatser om populationen Valet av statistiskt test baseras på: Urvalsstorlek (sample size) Typ av variabler kombinationen av IV (oberoende-) och DV (beroende variabel) Fördelning av data Studiedesign 17