Agenda Statistik Termin 10, Läkarprogrammet, VT15 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande begrepp och beskrivande statistik Forskningsprocessen Skalnivåer Centralmått och spridningsmått Figurer; histogram och boxplot Normalfördelning Statistisk inferens och standardfel Konfidensintervall Hypotesprövning P-värde Olika typer av statistiska test Agenda (forts.) Forskningsprocessen Exempel på typisk forskning Case-control studie Randomiserad interventionsstudie Frågestund Data Identifiera variabler Initial observation (Forskningsfråga) Generera teori Generera hypoteser Mäta variabler Samla data för att testa teori Presentera data grafiskt Anpassa modell Analysera data Den heliga treenigheten Data - skalnivåer Intern validitet: Strukturell design Hypoteser Kontroll över påverkande variabler Design Extern validitet: Urvalsplan Nominal Ordinal Intervall Kvot Konstruktvaliditet Definition av konstrukt Operationalisering Reliabilitet Mätning Analys Slutsatsvaliditet Estimat av kovarians Estimat av urvalsfel Utvärdera hypoteser 1
Nominalskala Kategorier Kryssa för det alternativ som stämmer in på dig. Är du? Kvinna Man Ja Nej Data - skalnivåer Uppfyller patienten kriterierna för diagnosen? Data - skalnivåer Ordinalskala Kategorier som är rangordnade Hur uppfattar du din egen hälsa? Ringa in siffran framför det påstående som stämmer bäst med hur du uppfattar din hälsa. 1. Min hälsa är mycket dålig 2. Min hälsa är ganska dålig 3. Min hälsa är ganska bra 4. Min hälsa är mycket bra Data - skalnivåer Data - skalnivåer Intervallskala Kontinuerlig, lika långa intervall, godtycklig nollpunkt Kvotskala Kontinuerlig, lika långa intervall, absolut nollpunkt Vilken temperatur har patienten? Hur mycket väger du? kg Hur lång är du? cm Skalnivåer Skala Kvantitet Lika intervall Nominal Nej Ordinal Ja Nej Nej Intervall Ja Ja Nej Kvot Ja Ja Ja Absolut nollpunkt Diskutera med grannen bredvid: Vilka variabler är relevanta i det forskningsområde som jag är intresserad av? Vilka skalnivåer befinner de sig på? Typ av data och skalnivå har betydelse för hur vi sedan analyserar och presenterar våra data 2
Data Data Variabel Gender Weight Height Health Kodning 0=kvinna, 1=man vikt i kilogram längd i centimeter Hur upplever du din egen hälsa? 1 = Mycket dålig, 2 = Ganska dålig, 3 = Ganska bra, 4 = Mycket bra ; Vilken skalnivå? Data Variabel Kodning Variabeltyp Gender 0=kvinna, 1=man Nominalskala Weight vikt i kilogram Kvotskala Height längd i centimeter Kvotskala Health Hur upplever du din egen hälsa? 1 = Mycket dålig, 2 = Ganska dålig, 3 = Ganska bra, 4 = Mycket bra Ordinalskala Parametrisk statistik vs. Icke-parametrisk statistik - ett sätt att klassificera olika statistiska test - distinktionen baseras på vissa antaganden om populationen samt typ av data Parametrisk statistik Kräver att data är normalfördelad (storlek på urval) Data ska vara i intervall- eller kvotskala (ev. ordinal) Ytterligare antaganden för olika test Medelvärde och standardavikelse Icke-parametrisk statistik Okänd eller skev bakomliggande fördelning (storlek på urval) Alla typer av skalor Median, variationsvidd, kvartilavstånd 3
Pie chart Histogram Histogram Pie chart Histogram Centralmått och spridningsmått Centralmått Spridningsmått Egenskaper Typvärde (T) Variationsvidd Icke-param. Median (Md) Kvartilavstånd Icke-param. Medelvärde (M) Standardavvikelse (Sd) Parametrisk 4
Hur många standardglas har du druckit den senaste veckan? 0 0 2 4 4 4 5 6 6 6 8 9 10 11 12 12 14 15 16 17 Hur många standardglas har du druckit de senaste 7 dagarna? n = 20 Q1 = 4 Median (Md) = 7 ((6+8)/2) Q3 = 12 Kv. avst. = Q3 Q1 = 12 4 = 8 Sd = M = X n S 2 = Sd 2 (x M) 2 n 1 M = 8,05 Sd = 5,18 S 2 = 26,79 Boxplot eller lådagram N = 100 Scatterplot 25 25 Högsta värde (max) 75% = 3:e kvartil Median 25% = 1:a kvartil Illustrera samband mellan två variabler: styrka och riktning Minsta värde (min) Statistisk inferens Normalfördelningskurvan (Gauss kurva) Att dra slutsatser om egenskaperna hos en population på basis av egenskaperna hos ett urval. Population 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD Urval 5
Standardfel Konfidensintervall Standardfelet (SE) = Standardavvikelsen hos populationen SE är ofta okänd men kan estimeras baserat på avvikelserna från medelvärdet i urvalet SE kan användas för att estimera ett kofindensintervall (CI) runt vårt urvals parameter Punktskattning av en variabels medelvärde i populationen är alltid osäker eftersom den gjorts utifrån enbart en del av populationen urval Därför bildas ofta ett intervall inom vilket det sanna medelvärdet med viss sannolikhet ligger Ett sådant intervall kallas konfidensintervall (CI) CI anges med sannolikheterna 95%, 99% eller 99.9% 95 % betyder att populationens medelvärde kommer hamnar inom detta intervall i 95 % av urvalen Bygger alltså på ett antagande om normalfördelning CI kan även estimeras för andra parametrar; regressionskoefficienter, oddskvoter mm. Exempel på tavlan. Hypotesprövning Normalfördelningskurvan (Gauss kurva) Att förkasta eller att inte förkasta H 0, det är frågan. 0.5 % 2.5% 2.5% 0.5 % -2.58 SD -1.96 SD -1SD M Md T +1SD +1.96 SD 68.3% 95 % 99 % +2.58 SD Nollhypotes H 0 Det finns inget samband mellan rökning och alkoholkonsumtion Mothypotes Hypotesprövning Riktad och oriktad hypotes Riktad hypotes Det finns ett positivt samband mellan rökning och alkoholkonsumtion Oriktad hypotes Det finns ett samband mellan rökning och alkoholkonsumtion Det finns ett positivt samband mellan rökning och alkoholkonsumtion 6
Hypotesprövning Logiken vid hypotesprövning 1. Ange nollhypotes (H 0 ) och mothypotes 2. Beräkna vad vi kan förvänta oss om H 0 är sann. 3. Jämför det faktiska resultatet med vad vi kunde förvänta oss enligt 2. Statistisk beräkning. 4. Om utfall och förväntan ej stämmer överens förkasta H 0. Annars behåll H 0. Hypotesprövning Signifikansnivå (alfa-värde) (p < 0.05) Vad betyder det? Givet att H 0 är sann och studien upprepas många gånger med hjälp av slumpvis dragna urval från samma population så kommer färre än 5 % av dessa resultat vara mer inkonsistenta med H 0 än vad föreliggande resultat är Probability = p Andra vanliga nivåer: p < 0.01 p < 0.001 Hypotesprövning Typ-I fel: att förkasta nollhypotesen trots att den är sann i populationen Typ-II fel: att behålla nollhypotesen trots att den inte gäller i populationen Effektstorlek och power Begränsningar med signifikanstestning Säger inget om storleken av samband/skillnad Påverkas av sample-storlek Svårt att jämföra studier som är olika stora Två studier som egentligen har samma resultat kan ge motsatta slutsatser Effektstorlek - Ger ett mått på omfattningen av ett resultat oberoende av sample-storlek Power - Genom beräkning av power för ett test kan man uppskatta risken för ett typ-ii fel. Cohens d hur många SD ligger två medelvärden ifrån varann r Utrycker graden av samvarians mellan två variabler r 2 Effektstorlek utrycker hur mycket varians i en variabel som kan förklaras av en annan Odds-kvot proportion ökad risk för ett visst utfall vid en slutpunkt Hazard-kvot Proportion ökad risk för ett visst utfall över flera tidpunkter Power Power beror på en rad faktorer -Typ av test - effektstorlek - Design; mellan- eller inomgruppsjämförelser - signifikansnivå - riktad eller oriktad hypotes - relativa gruppstorlekar Powerberäkning kan utföras - I designfasen för att ex. bestämma hur många deltagare som krävs för att upptäcka en skillnad eller ett samband med en viss storlek - Efter att data samlats in för att bestämma vilken power ett test har 7
Effektstorlek och power Desto större effektstorlek desto färre deltagare krävs för att upptäcka en skillnad eller ett samband, dvs att få ett signifikant testvärde Desto mindre effektstorlek desto fler deltagare krävs Parametrisk statistik vs. Icke-parametrisk statistik - ett sätt att klassificera olika statistiska test - distinktionen baseras på vissa antaganden om populationen samt typ av data Parametrisk statistik Kräver att data är normalfördelad (storlek på urval) Data ska vara i intervall- eller kvotskala (ev. ordinal) Ytterligare antaganden för olika test Medelvärde och standardavikelse Icke-parametrisk statistik Okänd eller skev bakomliggande fördelning (storlek på urval) Alla typer av skalor Median, variationsvidd, kvartilavstånd Transformering av data om ej normalfördelad Kontinuerligt utfall (exv. livskvalitet, smärta) Skillnad mellan grupper 2 relaterade grupper Beroende t-test (parametriskt) Wilcoxon signed rank test (icke-parametriskt) 2 oberoende grupper Obereonde t-test (parametriskt) Mann-Whitney U-test (icke-parametriskt) 3 el flera grupper ANOVA (parametriskt) Kruskal Wallis (icke-parametriskt) Kontinuerliga variabler (exv. livskvalitet, smärta) Samband mellan variabler Korrelation Pearsons r (parametriskt) Spearmans rho (icke-parametriskt) Regression Enkel (en prediktor) Multipel (flera prediktorer) 8
Kategoriskt utfall (exv. död-levande, sjuk-frisk) Chi2-test (oberoende grupper) McNemars test (beroende grupper) Logistisk regression (prediktorer kategoriska el. kontinuerlig) Kaplan Meier kurvor (överlevnad) Cox regression (överlevnad) Studiedesign Fråga: vilka är riskfaktorerna för stroke? Design: case-control design Jämföra personer som haft stroke med kontroller som inte haft stroke (samma ålder och kön) Analysmetod: Logistisk regression Hur mycket bidrar olika riskfaktorer till utfallet stroke? Odds ratio Relativ förändring i odds (chansen för en viss händelse) när riskfaktor x ökar med ett steg. Resultat från logistisk regression där man kan inkludera flera prediktorer och titta på deras unika bidrag Population attributable risk Proportionen fall som inte skulle förekomma om riskfaktor(er) x inte förelåg 9
Studie Fråga: ger kroppstemperatur 33 C respektive 36 C någon skillnad i överlevnad hos personer som haft hjärtstillestånd? Design: randomiserad klinisk studie Jämföra utfall över tid (död resp. levande) mellan två grupper. Analysmetod: Kaplan-Meier kurva med Cox regression (hazard ratio). Hazard ratio Chansen att en händelse förekommer i en betingelse/chansen att en händelse förekommer i den andra betingelsen Baseras på flera tidpunkter - studera överlevnad över tid 10
Statistikprogram SPSS Standard men dyrt; finns som pröva på http://www14.software.ibm.com/download/data/web/en_us/trialprogram s/w110742e06714b29.html PSPP Gratis, men begränsat https://www.gnu.org/software/pspp/get.html R Gratis, mycket flexibelt, dock inlärningströskel http://www.r-project.org/ Litteratur Litteratur Johan Bring & Adam Taube Jonas Björk 11
Litteratur David Machin, Micheal J. Campell, Stephen J. Walters Tack för mig! 12