Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Relevanta dokument
Statistisk styrka Dimensioneringsberäkningar

Medicinsk statistik II

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Medicinsk statistik I

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Medicinsk statistik II

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

F3 Introduktion Stickprov

Epidemiologi (II) Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund

Statistik och epidemiologi T5

Hur skriver man statistikavsnittet i en ansökan?

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Svensk Dialysdatabas. Blodtryck och blodtrycksbehandling PD. Klinikdata hösten 2005 Översikt åren

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Svensk Dialysdatabas. Blodtryck och blodtrycksbehandling HD. Klinikdata hösten 2005 Översikt åren

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Epidemiologi T5. Kursmål epidemiologi. Kursmål epidemiologi. Kunna förklara och använda grundläggande epidemiologiska begrepp

TENTAMEN TEORI. EXAMENSARBETE 1 (LÄLA53/LÄMA53) TERMIN 5, HT 2012, , kl

Hypotestestning och repetition

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Föreläsning G60 Statistiska metoder

Studiedesign och effektmått

Studiedesign: Observationsstudier

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Analys av proportioner

Statistik för teknologer, 5 poäng Skrivtid:

Följande resultat erhålls (enhet: 1000psi):

Epidemiologi I. Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund Enheten för miljöepidemiologi

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Statistik och epidemiologi T5

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Lösningar till SPSS-övning: Analytisk statistik

Svensk Dialysdatabas. Fosfat och PTH HD och PD. Klinikdata hösten 2005 Översikt åren

Statistik 1 för biologer, logopeder och psykologer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Statistik Termin 10, Läkarprogrammet, HT16

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Introduktion till Biostatistik. Hans Stenlund, 2011

Vad är p-värde? P-värde belysande exempel. Bayesians ansats MSG Staffan Nilsson, Chalmers 1

Läs anvisningarna innan Du börjar

Föreläsningsanteckningar till kapitel 9, del 2

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Granskningsmall för randomiserad kontrollerad prövning

Föreläsning 5. Kapitel 6, sid Inferens om en population

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

EXAMINATION KVANTITATIV METOD vt-11 (110204)

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

, s a. , s b. personer från Alingsås och n b

EPIDEMIOLOGI Kompendium för kursen i Yrkes- och Miljömedicin Termin 10, läkarutbildningen i Lund

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Medicinsk statistik I

Uppgift 1. Produktmomentkorrelationskoefficienten

Datorlaboration 7. Simuleringsbaserade tekniker

Hypotestest och fortsättning av skattningar och konfidensintervall

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

TMS136. Föreläsning 13

Trafikbuller och upplevelser av grönområden i närmiljön

Hur man tolkar statistiska resultat

Föreläsning G60 Statistiska metoder

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Uppgift 1. Deskripitiv statistik. Lön

ST-fredag epidemiologi och biostatistik 2017

Svensk Dialysdatabas. Anemibehandling HD. Klinikdata hösten 2005 Översikt åren

Epidemiologi del 2. Anders Beckman. MD, PhD Lunds Universitet. A Beckman Regional forskarutbildning

Kodkombination: T5V De sista fyra siffrorna i pers.nr:... Namn: Pers.nr:

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Publikationer/Statistik. Publikationer/Statistik. Publikationer/Statistik

Att förebygga stroke är att behandla stroke

Parade och oparade test

FACIT (korrekta svar i röd fetstil)

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Namn: Pers.nr: G: Minst 65 % Kod: T5V16 -

Problem med analyser av EQ-5D data. Philippe Wagner Tomasz Czuba Jonas Ranstam

Differentiell psykologi

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

OBS! Vi har nya rutiner.

Fel och fel. slumpmässiga och systema4ska fel i epidemiologiska studier Katja Fall Vetenskapligt förhållningssä>

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Konfidensintervall, Hypotestest

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Examinationsuppgift 2014

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Transkript:

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016 Jonas Björk E-post: jonas.bjork@med.lu.se

Medicinsk statistik III Innehåll och läsanvisningar Statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka (power) En grupp, två grupper Kontinuerliga och binära utfall Avsnitt 6.4, 8.4 och 10.4 Tolkning av p-värden Statistiska vs. diagnostiska test Avsnitt 9.2

1. Binära utfall Binära utfall Sjuk / frisk Positiv / negativ Reaktion / ingen reaktion... Dikotomiseringar

1. Binära utfall Dikotomiseringar Kontinuerliga data CRP > 15 Systoliskt blodtryck >160 mmhg Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+),?, - Information kastas bort väsentlig eller ovidkommande?

1. Binära utfall Binära utfall - Exempel Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen? 2. Kan vi vara säkra på att den verkliga andelen glutenintoleranta är över 2%?

1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel n = 7 207, a = 212 positiva Prevalens q =a / n = 0,029 = 2,9% Om a 5 och (n a) 5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad c = 1,96, SE = Medelfel (Standard error) SE q(1 q) n 0,0290,971 7207 0,0020 q c SE 0,0291.960,0020 0,029 0,004 2,9% 0,4% Felmarginal ± 0,4% 95% KI: 2,5-3,3%

2. Dimensioneringsberäkningar - en grupp Uppskatta en andel Hur stor ska studien vara? Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk Hur stor studien bör vara bestäms av Andelen q (okänd för oss, men vi kan kanske gissa) Önskad felmarginal F Utnyttja formel för 95% KI, lös ut n: I boken finns motsvarande formel för ett medelvärde (formel 6.3)

1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q 1 = a 1 / n 1, q 2 = a 2 / n 2 Differens q 1 q 2 -Ex. prevalensdifferens, riskdifferens Kvot q 1 / q 2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) Oddskvot OR = 1 / 2 Odds 1 = q 1 / (1 q 1 ), 2 = q 2 / (1 q 2 )

1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q 1 = 357 / 686 0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q 2 = 276 / 689 0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?

1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel SE q (1 q ) n (1 q n 2 ) 0,5200,480 686 0,401 0,599 689 1 1 2 2 1 q 0,0267 Om a 1 5, (n 1 a 1 )5, a 2 5 och (n 2 a 2 )5 kan ett 95% KI för RD bildas som RD1.96 SE 0,121,960,0267 0,12 0,052 7 17 fler per 100

1. Binära utfall Antal som behöver behandlas NNT = Numbers Needed to Treat Från föregående problem: Riskdifferens RD = 357 / 689 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade NNT = 1 / RD 1 / 0,12 8,3 vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 1 / RD 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt

1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(rr) = ln(1,25) 0,223 gånger (25%) högre risk om enbart tamoxifen ges Medelfel SE 1 q n 1 1 1 q n 2 2 1 0,480686 95% KI för RR bildas på log-skalan som 1 0,599689 ln( RR) 1,96 SE 0,2231,960,0739 0,223 0,145 0,223 0,145 0,223 0,145 e 1,08 e 1, 44 0,0739 1,08 1,44 gånger högre risk

1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101 6,2 Odds för exponering bland kontroller: 573/158 3,6 70% riskökning bland rökare 95% KI: 1,3 till 2,3 (30 till 130% riskökning)

2. Dimensioneringsberäkningar - två grupper Statistisk styrka Sannolikheten a priori att H 0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)

2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156)

2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper

3. 2. Statistisk Dimensioneringsberäkningar styrka Gruppstorlek vs. effektstorlek

Percent 2. Dimensioneringsberäkningar Syreupptagningsförmåga Replikera tidigare resultat i en ny studie Låg Medel/Hög 25% 20% 15% 10% 5% s pooled 8 30 40 50 60 30 40 50 60 Statistics a Uppskat tad max imal sy reupptagningsf örmåga [ ml/(kg*min) N Mean Valid Missing 36 9 38.50 Percentiles 25 50 75 33.00 38.50 43.00 a. Intensitetsnivå i konditionsträning = Låg Statistics a Uppskat tad max imal sy reupptagningsf örmåga [ ml/(kg*min) N Mean Valid Missing 99 30 43.82 Percentiles 25 50 75 38.00 43.00 49.00 a. Intens it ets niv å i konditionsträning = Medel/Hög

2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.) Två oberoende grupper, medelvärdesjämförelse n k k 2 1 2 2 s 5% signifikansgräns k 1 = 1.96 80% statistisk styrka k 2 = 0.84 Ex. Syreupptagningsförmåga 5.0, s 8, / s 0.625 n A n B 8 2 1.96 0.84 5 2 40 Standardiserad effektstorlek per grupp

2. Dimensioneringsberäkningar Dimensioneringsberäkningar - Allmänt Redovisas först och främst för primär frågeställning. Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in Gör beräkningen under olika antaganden om, s Standardiserad effektstorlek = / s avgörande Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen Ta hänsyn till förväntad deltagandefrekvens Utnyttja tidigare studier inom området! I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter

32. Statistisk Dimensioneringsberäkningar styrka Program för dimensioneringsberäkningar PS Power and Sample Size Calculation Enkelt, lätt att använda Kan laddas ned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/main/ PowerSampleSize G*Power 3 Mer avancerat, något svårare att använda Kan laddas ned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3

2. Dimensioneringsberäkningar Diskutera med bänkgrannen... Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5? Standardavvikelsen s är 12 istället för 8 i båda grupperna? 90% statistisk styrka krävs (k 2 = 1,28)?

3. 2. Statistisk Dimensioneringsberäkningar styrka Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999)

2. Dimensioneringsberäkningar Fall-kontrollundersökning Hur många fall och kontroller behövs? Förväntad OR =1.7 enligt tidigare studie Rökprevalens i den befolkning vi studerar? Utnyttja PS Power Sample Size

4. 3. Tolkning av p-värden Statistiskt vs. Diagnostiskt test Statistisk styrka = Sensitivitet Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261)

3. Tolkning av p-värden Tolkning av p-värden Modernt förhållningssätt Sifting the evidence what s wrong with significance tests? P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga: Vilka belägg mot nollhypotesen finns i insamlade data? Undvik skarp signifikansgräns Ex. p = 0,04 och p =0,06 är två snarlika resultat som båda ger måttliga evidens mot nollhypotesen P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & Smith BMJ 2001;322:226-231)

3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen

3. Tolkning av p-värden Sannolikheten att H 0 är sann FPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband