Introduktion till studiedesign och biostatistik Amelie Plymoth, PhD, MPH, MSc Postdoktor, Institutionen för Medicinsk Epidemiologi och Biostatistik (MEB) amelie.plymoth@ki.se
Övergripande syfte med VetU Efter genomgången läkarutbildning skall studenten ha: Kompetens i vetenskapligt tänkande och färdigheter? söka, kritiskt granska, presentera och tillämpa vetenskaplig information Bli konsumenter av vetenskaplig litteratur! för att kunna ge patienten högkvalificerad vård och fortlöpande utveckla din egen kompetens Alla läkare måste inte vara forskare, men alla läkare måste kunna förstå och ta till sig forskning. Detta är inte bara nödvändigt för att hålla sig uppdaterad med en snabbt utvecklande kunskapsmängd utan en vetenskaplig attityd är dessutom av stor vikt i det dagliga kliniska arbetet. 120116
Upplägg Hur vet vi egentligen vad vi vet? 60 min Paus 20 min Vad beror skillnaden på? 60 min Amelie Plymoth May 8, 2012 3
Studiedesign eller, hur vet vi egentligen det vi vet?
Introduktion- Studiedesign Bakgrund à Avgörande moment för att kunna besvara frågeställning à För/nackdelar Studiedesign à Experimentella studier à (Icke-experimentella) Observationsstudier Namn Efternamn May 8, 2012 5
Studiedesign- 2 huvudtyper Experimentella studier (Interventionsstudier) Forskarna/Klinikerna gör ett aktivt försök att förändra naturens gång och observera effekterna. Observationsstudier (Icke-experimentella) Forskarna låter naturen ha sin gång. Forskarna mäter men ingriper inte. Förändra sjukdomsdeterminant (tex exponering eller beteende) eller ett sjukdomsförlopp (genom behandling) Utformade som experiment i andra vetenskaper Namn Efternamn May 8, 2012 6
Tips! Världsomsegling på den sju haven Vet ni vilken sjukdom som studerades i den första kliniska prövningen (experimentell studie)? Namn Efternamn May 8, 2012 7
Exempel- skörbjugg Bristsjukdom som uppstår till följd av för lågt intag av C-vitamin och leder bland annat till slemhinne-blödningar Namn Efternamn May 8, 2012 8
Skörbjugg Namn Efternamn May 8, 2012 9
Skörbjugg Känt sedan medeltiden Länge påtagligt problem vid upptäcktsresor à 80% besättningen vad Magellans världsomsegling dog av skörbjugg Orsaken uppdagades av den Skotske marinläkaren James Lind är 1747 och publicerades 1753 Namn Efternamn May 8, 2012 10
Skörbjugg och C-vitamin James Lind observerade att vid Lord Ansons världsomsegling avled 380 av 510 män i besättningen av skörbjugg (sic!) Han började med att göra en systematisk översikt av litteraturen Sedan utförde han en kontrollerad studie (den första) där han testade 6 olika behandlingar på 12 sjömän som alla drabbats av skörbjugg Namn Efternamn May 8, 2012 11
Skörbjugg och C-vitamin Alla 12 sjömännen fick samma mat och bodde ihop à 2 fick en pint havsvatten per dag à 2 fick 25 huttar var av elixir vitriol (!) à 2 fick en liter cider om dagen à 2 fick 2 skedar vinäger dagligen à 2 fick 2 apelsiner och 1 citron var dag à 2 fick en blandning av muskot, vitlök och lite annat smått och gott Namn Efternamn May 8, 2012 12
Skörbjugg och C-vitamin The consequence was that the most sudden and visible good effect were perceived from the use of oranges and lemons Namn Efternamn May 8, 2012 13
Skörbjugg och C-vitamin- Linds slutsats? Insiktsfullt nog drog Lind slutsatsen att, studien är för liten och måste upprepas av andra forskare Namn Efternamn May 8, 2012 14
Medicinska experiment James Lind utförde den första kliniska prövningen, men hur gör man medicinska experiment idag? Namn Efternamn May 8, 2012 15
Typer av medicinska experiment Okontrollerade försök Kontrollerade försök/prövningar Randomiserade kontrollerade försök/prövningar Variationer Namn Efternamn May 8, 2012 16
Okontrollerade försök Vid ett okontrollerat försök jämför man symptom eller dylikt före och efter insättande av en ny behandling Varje studiedeltagare jämförs därmed med sig själv, före den insatta behandlingen (eller med förväntade värden) Sällan lämpligt (svårt att säga om utfallet (tillfrisknande) berodde på interventionen (behandlingen), men kan vara OK vid obotliga sjukdomar (tex ALS) Namn Efternamn May 8, 2012 17
Okontrollerade försök- problem Naturlig sjukdomsvariation (Sjukdomen går upp och ned) Spontant tillfrisknande (pat. hade ändå tillfrisknat utan att ha genomgått behandlingen) Placebo (Patientens förväntning och förhoppning) Försöksledaren/forskarens önskemål (övertolkar resultaten, ej blindat experiment) Namn Efternamn May 8, 2012 18
Typer av medicinska experiment Okontrollerade försök Kontrollerade (icke-randomiserade) försök/prövningar Randomiserade kontrollerade försök/prövningar Namn Efternamn May 8, 2012 19
Kontrollerade (icke-randomiserade) försök Istället för att jämföra besvär före och efter insättande av behandling, jämförs olika patientgrupper som erhåller olika behandling. Patienterna fördelas i grupperna på ett ej slumpmässigt sätt (exempelvis patienternas eget önskemål). Det finns nästan alltid ett gott skäl till varför en patient får en viss behandling. Namn Efternamn May 8, 2012 20
Kontrollerade försök- problem? Kontrollgrupp finns men deltagarna ej slumpmässigt utvalda att ingå i den ena eller andra gruppen Svårt att fördela patienterna till de olika behandlingsgrupperna så att prognosen/symptomen blir lika. Patientens eller forskarens önskemål för den enskilda patienten är ofta kopplat till patientens prognos/symptom (läkaren ger patienten den behandling denne tror är bäst för patienten). Därför fördelar vi patienterna slumpmässigt, vi randomiserar. Namn Efternamn May 8, 2012 21
Typer av medicinska experiment Okontrollerade försök Kontrollerade försök/prövningar Randomiserade kontrollerade försök/prövningar Namn Efternamn May 8, 2012 22
Randomiserade kontrollerade försök Utvidgning av det kontrollerade försöket. Patienterna fördelas till olika behandlingsgrupper med hjälp av slumpen. Därmed skapas jämförbara grupper med hänsyn tagen till såväl kända som okända förvillelsefaktorer (confounders) (tex ålder, kön) Namn Efternamn May 8, 2012 23
Randomiserade kontrollerade försök För att studera utfallet/effekten (hjärt-kärlsjukdom) av intervention (salt reduktion) Deltagare- slumpmässigt fördelade intervention/kontroll grupp à olikheter mellan olika patienter (t.ex. kroppsvikt, rökning, saltkänslighet mm mm) fördelas lika mellan interventionsgrupp och kontrollgrupp. Om grupperna är tillräckligt stora blir fördelningarna av dessa variabler nästan exakt lika i interventionsgruppen och kontrollgruppen, UTOM när det gäller just interventionen. Då har man eliminerat tillblandning (confounding) av effekter från dessa störande variabler (Bonita et al., Basic Epi 2nd Edition 2006) Name Surname 8 May 2012 24
Randomiserade kontrollerade försökvarför? Andra studiedesigner, inkluderande icke-randomiserade kontrollerade försök, kan finna associationer mellan interventionen (saltreduktion) och utfallet/effekten (hjärtkärlsjukdom). Men dessa studiedesigner kan inte utesluta möjligheten att den funna associationen orsakades av en tredje faktor (confounder, kroppsvikt, rökning) som är kopplad till både interventionen och utfallet. Namn Efternamn May 8, 2012 25 Sibbald et al., BMJ 1998;316:201.
Men Hur ska man med ett experiment (randomiserat eller inte) kunna studera om: à Rökning orsakar cancer? à Radioaktivstrålning leder till sämre betyg i skolan? Det är svårt att tänka sig randomiserade studier av detta. Skulle inte vara etiskt Namn Efternamn May 8, 2012 26
Studiedesign- två huvudtyper Experimentella studier Forskarna gör ett aktivt försök att förändra naturens gång och observera effekterna. Observationsstudier (Icke-experimentella) Forskarna låter naturen ha sin gång. Forskarna mäter men ingriper inte. Förändra sjukdomsdeterminant (tex exponering eller beteende) eller ett sjukdomsförlopp (genom behandling) Utformade som experiment i andra vetenskaper Namn Efternamn May 8, 2012 27
Observationsstudier I en observationsstudie studeras samband mellan olika variabler på samma sätt som i ett experiment, men à Fördelningen av olika individer mellan olika behandlingsgrupper tillåts ske av sig själv Enkelt uttryckt observerar man samband i naturen: à Exempelvis, drabbas rökare oftare av cancer än icke-rökare? Namn Efternamn May 8, 2012 28
Observationsstudier Dåtid Nutid Framtid Kohortstudie Fall-kontrollstudie Tvärsnittsstudie Namn Efternamn May 8, 2012 29
Kohort= enhet som skickas ut i fält Kohortstudien- studiernas moder Vad har Gustaf tagit för bild här? Någon klassiker? Namn Efternamn May 8, 2012 30
Kohortstudier Kohortstudier (uppföljningsstudier) = prospektiva/longitudinella studier En grupp individer följs över tid efter utfall av någon typ (sjukdom) Risken för detta utfall (sjukdom) korreleras till någon typ av exponering (behandling eller dyl.) Namn Efternamn May 8, 2012 31
Studiedesign- kohortstudier Namn Efternamn May 8, 2012 32
Kohortstudier Tillåter uträknande av (bland annat): à Incidens = antal nya fall per tidsenhet Ex. 21 nya fall av influensa (från fem landsting) v.47 à Relativ risk = risken (incidensen) i en grupp delat med risken i en jämförelsegrupp Ex. 15 gånger högre risk att drabbas av lungcancer bland rökare än bland icke-rökare Namn Efternamn May 8, 2012 33
Studies of Work Environment and Disease Epidemiology- Infections (SWEDE-I) JobbochSmi)a Generell populationskohort. Vi studerar olika exponeringar bland yrkesverksamma i Eskilstuna. I analysen studera effekten av dessa exponeringar för utfallet av Influensa Liknande Infektioner (förkylning, gastroenterit & influensa) Mål: (1) Identifiera och kvantifiera arbetsrelaterade riskfaktorer för vanliga virusinfektioner. (2) Finna spridningsvägar i olika arbetsmiljöer för att skapa bättre underlag för epidemiologisk modellering. Behövs för prediktion och planering när stort sjukdomsutbrott förutspås. Multidisciplinärt projekt (specialister epidemiologi, infektionssjukdomar, virologi, yrkesmedicin, IT-baserad e- epidemiologi, beteendevetenskap) Olof Nyrén, Amelie Plymoth 8 May 2012 34
SWEDE-I Population based disease surveillance Eskilstuna (pop. 90 000, compliance, exponeringsprevalens) Inclusion criteria: 25-63 years, employed Questionnaires (n=4-5): webb and paper Sjukrapporteringen (deltagar initierad, event driven): Webb, IVR Nasal swab (analyze Rhino, RSV, Influenza A&B, Corona tot. 14 luftvägsvirus) Pilot: Mar 15 - May 31 (n=100) Main study: Aug 2011 - Jun 2012 (n=2000) SCB urval www.jobbochsmitta.se Olof Nyrén, Amelie Plymoth 8 May 2012 35
Namn Efternamn May 8, 2012 36
Kohortstudier- problem Bortfall! à Människor har en tendens att flytta eller att inte längre vilja bli studerade Sällan lämpligt för att studera mycket ovanliga sjukdomar (kräver stora patientmaterial) Enorm kostnad Namn Efternamn May 8, 2012 37
Fall-kontrollstudier- en retrospektiv förenkling av kohortstudien Börja med att identifiera personer som drabbats av en viss sjukdom (=fall) Till dessa väljs sedan jämförelsepersoner (kontroller) Dessa grupper jämförs sedan med avseende på den studerade exponeringen (= rökning i detta fall) Namn Efternamn May 8, 2012 38
Fall-kontrollstudier Effektivt och billigt! Möjliggör studier av ovanliga sjukdomar Bra när induktionstiden är lång, man behöver inte vänta på att tillräckligt många skall insjukna. Namn Efternamn May 8, 2012 39
Study Participants, Gambia & Thailand Proteomics Pilot Case-control studies HCC Cases HCC with cirrhosis HCC without cirrhosis Controls Cirrhosis patients Chronic HBV carriers Standardization - Age (within 5 year groups): 18-65 years - Gender - Place of residence - The Gambia (n=27) & Thailand (n=75),
Biostatistik: Vad beror skillnaden på? Och kan vi vara säkra på att den finns?
Kolesterol: Exempel Markör för hjärt-kärlsjukdom Flera mått à Totalkolesterol à LDL-kolesterol à HDL-kolesterol Korrelerar väl med risk för hjärt-och kärlsjukdom och stroke Alexandra Jauhiainen May 8, 2012 42
Studie på kolesterolsänkande medicin Mäta totalkolesterol på ett urval av patienter à Behandling A (placebo eller standard-behandling) à Behandling B (nytt preparat) Alexandra Jauhiainen May 8, 2012 43
Kolesterol: Data Treat A Treat B 12 14 16 18 20 22 24 response Alexandra Jauhiainen May 8, 2012 44
Kolesterol: Data (2) Observed difference Density 0.00 0.05 0.10 0.15 Treat A Treat B Finns det någon skillnad mellan behandlingarna? 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 45
Kolesterol: Data (3) Hypothetical difference Hypothetical difference Hypothetical difference Density 0.00 0.05 0.10 0.15 Density 0.00 0.05 0.10 0.15 Density 0.00 0.05 0.10 0.15 0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Hypothetical difference Hypothetical difference Hypothetical difference Density 0.00 0.05 0.10 0.15 Density 0.00 0.05 0.10 0.15 Density 0.00 0.05 0.10 0.15 Alexandra Jauhiainen 0 5 10 15 20 25 30 0 5 10 15 20 25 30 0 5 10 15 20 25 30 May 8, 2012 46
Kolesterol: Dataanalys När kan vi säga att det finns en sann skillnad i effekt mellan behandlingarna? Vad menar vi med sann effekt? Density 0.00 0.05 0.10 0.15 Observed difference Treat A Treat B 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 47
Analys: Steg 1 Antaganden: Observationer från underliggande fördelningar med väntevärden (medelvärden) µ 1 respektive µ 2. 1. Skatta väntevärdena ˆµ 1 = x = 20.36 ˆµ 2 = ȳ = 15.54 Density 0.00 0.05 0.10 0.15 µ 2 µ 1 ˆ = 4.82 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 48
Analys: Steg 2 Hur påverkar varians? 2. Skatta varians ŝ 2 1 = 1 n ŝ 2 2 = 1 n n (x i x) 2 = 6.68 i=1 n (y i ȳ) 2 = 7.89 i=1 Density 0.00 0.05 0.10 0.15 µ 2 µ 1 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 49
Analys: Steg 3 Skatta ett intervall som med viss säkerhet täcker över det sanna värdet på Δ. 3. Konfidensintervall med grad 0.95. I µ2 µ 1 = I =( 6.54, 3.09) Density 0.00 0.05 0.10 0.15 µ 2 µ 1 Hur ska vi tolka intervallet? 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 50
Tolkning konfidensintervall Intervall med grad 0.95. Om vi kan upprepa proceduren (välja patienter, skapa intervall) 100 gånger kommer approximativt 95 av 100 intervall täcka över det sanna värdet på skillnaden Δ. May 8, 2012 Alexandra Jauhiainen 51 0 20 40 60 80 100 8 6 4 2 0 Confidence Interval
Kolesterol: Intervall - Hypoteser När vi gör konfidensintervall testar vi en hypotes. Nollhypotes: det finns ingen skillnad i effekt. Mothypotes: det finns skillnad i effekt H 0 : µ 1 = µ 2 H 1 : µ 1 = µ 2 Density 0.00 0.05 0.10 0.15 µ 2 µ 1 Om vårt intervall inte innehåller 0 tror vi på mothypotesen vi förkastar nollhypotesen! 5 10 15 20 25 30 Alexandra Jauhiainen May 8, 2012 52
Testa hypotes Vi kan ekvivalent till ett intervall göra ett hypotestest istället. H 0 : µ 1 = µ 2 Vi vill ha ett test som à Förkastar H 0 när den är falsk à Inte förkastar H 0 när den är sann Vad för test? à Baserat på observerade värden (Δ och s 2 ) och antaganden à Låt vårt test vara ett numeriskt värde U Om U stor är H 0 inte trolig Density 0.00 0.05 0.10 0.15 H 1 : µ 1 = µ 2 µ 2 µ 1 5 10 15 20 25 30 Om U liten är H 0 trolig Alexandra Jauhiainen May 8, 53 2012
Testa hypotes (2) [alt. använda intervall] Vad riskerar vi att göra för fel? à förkasta H 0 när den är sann α = P (U >c H 0 ) à ej förkasta H 0 när den är falsk β = P (U <c H 1 ) NB: Intervallet vi valde hade konfidensgrad 1-α = 0.95 (dvs α=0.05). Det är vanligt att välja c så att α=0.05. Andra vanliga väl är 0.01 och 0.001. Alexandra Jauhiainen May 8, 2012 54
Testa hypotes (3) Hur gör man? à Hitta lämpligt U. U = à Hitta lämpligt c (med hjälp av antaganden). c =2.02 s 2 1 /n 1 +s 2 2 /n 2 =5.64 Density 0.00 0.05 0.10 0.15 µ 2 1,2 5 10 15 20 25 30 µ 1 Alexandra Jauhiainen May 8, 2012 55
Slutsats Vi har att U > c. à H 0 förkastas till förmån för H 1, dvs vi tror mer på H 1! à Preparat B har statistikt signifikant bättre effekt som kolesterolsänkande medicin än preparat A. Samma slutsats som när vi gjorde ett intervall! Alexandra Jauhiainen May 8, 2012 56
P-värden P-värden förekommer ofta i artiklar och litteratur i samband med studier. Istället för att välja nivån α på vårt test kan vi istället titta på hur extrema våra observationer är med hjälp av U. P-värde = P(få ett lika eller mer extremt värde på U än vi observerade) Små p-värden indikerar att H 0 är falsk. Vi förkastar om p-värdet < α. Alexandra Jauhiainen May 8, 2012 57
Generella slutsatser Vilka slutsatser kan man dra generellt? à H 0 förkastas: H 1 sann. à H 0 förkastas inte: H 0 kan vara sann, men behöver inte vara det. Det är viktigt att kunna formulera om sitt syfte/frågeställning till hypoteser! Alexandra Jauhiainen May 8, 2012 58
Utfall H 0 sann H 0 falsk U > c (vi förkastar) Intervall täcker inte 0. Ren slump ger skillnad. Confounding Bias U < c (vi förkastar inte) Intervall täcker över 0. Sann skillnad mycket liten (obetydlig) Låg styrka Alexandra Jauhiainen May 8, 2012 59
Sammanblandning/confounding Uppstår när den uppmätta effekten (tex hjärt-kärlsjukdom) av en viss exponering (saltreduktion) är sammanblandad med effekten av någon annan faktor (vikt, rökning) Alexandra Jauhiainen May 8, 2012 60
Sammanblandning/confounding- Exempel I början av 1970-talet gjordes en studie, som visade på ett klart positivt samband mellan kaffedrickande och hjärtsjukdom. Denna studie dementerades fort då andra forskare visade att detta samband berodde på en confounding faktor (rökning) som gav upphov till detta skensamband. De som drack mycket kaffe var ofta storrökare. Alexandra Jauhiainen May 8, 2012 61
Sammanblandning- Exempel Rökning (confounder) Association (rökning ej effekt av kaffedrickande) Associerat utfall (oberoende av exponeringen) Kaffedrickande (exponering)? Skensamband Hjärtsjukdom (effekt) Alexandra Jauhiainen May 8, 2012 62
Sammanblandning (confounding)- definition En confoundingfaktor är: à Associerad med sjukdomen i fråga à Associerad med exponeringen à Inte en effekt av exponeringen Alexandra Jauhiainen May 8, 2012 63
Selektionsbias Uppstår när det finns en systematisk skillnad mellan egenskaperna hos de personer som valts ut för studien och egenskaperna hos dem som inte valts ut. Alexandra Jauhiainen May 8, 2012 64
Referenser Modern epidemiology [electronic resource] / Kenneth J. Rothman, Sander Greenland, and Timothy L. Lash. Sannolikhetsteori och statistikteori med tillämpningar / Gunnar Blom Alexandra Jauhiainen May 8, 2012 65