Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016 Jonas Björk E-post: jonas.bjork@med.lu.se
Medicinsk statistik III Innehåll och läsanvisningar Statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka (power) En grupp, två grupper Kontinuerliga och binära utfall Avsnitt 6.4, 8.4 och 10.4 Tolkning av p-värden Statistiska vs. diagnostiska test Avsnitt 9.2
1. Binära utfall Binära utfall Sjuk / frisk Positiv / negativ Reaktion / ingen reaktion... Dikotomiseringar
1. Binära utfall Dikotomiseringar Kontinuerliga data CRP > 15 Systoliskt blodtryck >160 mmhg Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+),?, - Information kastas bort väsentlig eller ovidkommande?
1. Binära utfall Binära utfall - Exempel Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen? 2. Kan vi vara säkra på att den verkliga andelen glutenintoleranta är över 2%?
1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel n = 7 207, a = 212 positiva Prevalens q =a / n = 0,029 = 2,9% Om a 5 och (n a) 5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad c = 1,96, SE = Medelfel (Standard error) SE q(1 q) n 0,0290,971 7207 0,0020 q c SE 0,0291.960,0020 0,029 0,004 2,9% 0,4% Felmarginal ± 0,4% 95% KI: 2,5-3,3%
2. Dimensioneringsberäkningar - en grupp Uppskatta en andel Hur stor ska studien vara? Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk Hur stor studien bör vara bestäms av Andelen q (okänd för oss, men vi kan kanske gissa) Önskad felmarginal F Utnyttja formel för 95% KI, lös ut n: I boken finns motsvarande formel för ett medelvärde (formel 6.3)
1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q 1 = a 1 / n 1, q 2 = a 2 / n 2 Differens q 1 q 2 -Ex. prevalensdifferens, riskdifferens Kvot q 1 / q 2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) Oddskvot OR = 1 / 2 Odds 1 = q 1 / (1 q 1 ), 2 = q 2 / (1 q 2 )
1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q 1 = 357 / 686 0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q 2 = 276 / 689 0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?
1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel SE q (1 q ) n (1 q n 2 ) 0,5200,480 686 0,401 0,599 689 1 1 2 2 1 q 0,0267 Om a 1 5, (n 1 a 1 )5, a 2 5 och (n 2 a 2 )5 kan ett 95% KI för RD bildas som RD1.96 SE 0,121,960,0267 0,12 0,052 7 17 fler per 100
1. Binära utfall Antal som behöver behandlas NNT = Numbers Needed to Treat Från föregående problem: Riskdifferens RD = 357 / 689 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade NNT = 1 / RD 1 / 0,12 8,3 vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 1 / RD 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt
1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(rr) = ln(1,25) 0,223 gånger (25%) högre risk om enbart tamoxifen ges Medelfel SE 1 q n 1 1 1 q n 2 2 1 0,480686 95% KI för RR bildas på log-skalan som 1 0,599689 ln( RR) 1,96 SE 0,2231,960,0739 0,223 0,145 0,223 0,145 0,223 0,145 e 1,08 e 1, 44 0,0739 1,08 1,44 gånger högre risk
1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101 6,2 Odds för exponering bland kontroller: 573/158 3,6 70% riskökning bland rökare 95% KI: 1,3 till 2,3 (30 till 130% riskökning)
2. Dimensioneringsberäkningar - två grupper Statistisk styrka Sannolikheten a priori att H 0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)
2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156)
2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper
3. 2. Statistisk Dimensioneringsberäkningar styrka Gruppstorlek vs. effektstorlek
Percent 2. Dimensioneringsberäkningar Syreupptagningsförmåga Replikera tidigare resultat i en ny studie Låg Medel/Hög 25% 20% 15% 10% 5% s pooled 8 30 40 50 60 30 40 50 60 Statistics a Uppskat tad max imal sy reupptagningsf örmåga [ ml/(kg*min) N Mean Valid Missing 36 9 38.50 Percentiles 25 50 75 33.00 38.50 43.00 a. Intensitetsnivå i konditionsträning = Låg Statistics a Uppskat tad max imal sy reupptagningsf örmåga [ ml/(kg*min) N Mean Valid Missing 99 30 43.82 Percentiles 25 50 75 38.00 43.00 49.00 a. Intens it ets niv å i konditionsträning = Medel/Hög
2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.) Två oberoende grupper, medelvärdesjämförelse n k k 2 1 2 2 s 5% signifikansgräns k 1 = 1.96 80% statistisk styrka k 2 = 0.84 Ex. Syreupptagningsförmåga 5.0, s 8, / s 0.625 n A n B 8 2 1.96 0.84 5 2 40 Standardiserad effektstorlek per grupp
2. Dimensioneringsberäkningar Dimensioneringsberäkningar - Allmänt Redovisas först och främst för primär frågeställning. Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in Gör beräkningen under olika antaganden om, s Standardiserad effektstorlek = / s avgörande Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen Ta hänsyn till förväntad deltagandefrekvens Utnyttja tidigare studier inom området! I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter
32. Statistisk Dimensioneringsberäkningar styrka Program för dimensioneringsberäkningar PS Power and Sample Size Calculation Enkelt, lätt att använda Kan laddas ned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/main/ PowerSampleSize G*Power 3 Mer avancerat, något svårare att använda Kan laddas ned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
2. Dimensioneringsberäkningar Diskutera med bänkgrannen... Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5? Standardavvikelsen s är 12 istället för 8 i båda grupperna? 90% statistisk styrka krävs (k 2 = 1,28)?
3. 2. Statistisk Dimensioneringsberäkningar styrka Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999)
2. Dimensioneringsberäkningar Fall-kontrollundersökning Hur många fall och kontroller behövs? Förväntad OR =1.7 enligt tidigare studie Rökprevalens i den befolkning vi studerar? Utnyttja PS Power Sample Size
4. 3. Tolkning av p-värden Statistiskt vs. Diagnostiskt test Statistisk styrka = Sensitivitet Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261)
3. Tolkning av p-värden Tolkning av p-värden Modernt förhållningssätt Sifting the evidence what s wrong with significance tests? P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga: Vilka belägg mot nollhypotesen finns i insamlade data? Undvik skarp signifikansgräns Ex. p = 0,04 och p =0,06 är två snarlika resultat som båda ger måttliga evidens mot nollhypotesen P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & Smith BMJ 2001;322:226-231)
3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen
3. Tolkning av p-värden Sannolikheten att H 0 är sann FPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband