Kausalitet: grafiska modeller Anna Myléus MD PhD Allmänmedicin Epidemiologi and global hälsa Umeå University
Innehåll Begreppet kausalitet Epidemiologisk design Störfaktorer Grafisk modell som stöd
Kausalitet Orsak och verkan A leder till B Orsakssamband
Cause i epidemiologi
Intuitiv ide om kausalitet
Är intuitionen alltid korrekt?
Problemet med kausalitet Under vilka förutsättningar kan man anta att en statistisk association/korrelation är kausal?
Historiskt Kochs postulat Kochs Postulates
Multipla orsaker till sjukdom Web of causation
Chinese Boxes Orsaker på olika nivåer - grunden multilevel Ecoepidemiologi
Rothmans pies Sufficient: If the factor is present, the effect will always occur. Necessary: If the factor is absent, the effect cannot occur. The whole pie is sufficient to cause the disease There can be more than one pie
Example TB Necessary: mycobacterium tuberculosis (A) The whole pie is sufficient to cause the disease E poverty D low nutrition Etc
Hill s causal criteria view points
Kausalitet och studiedesign
Centrala aspekter Tid (tvärsnitt / tidsföljd) Observationsenhet (individ / grupp) Referensgrupp (ja / nej) Startpunkt (sjukdom / exponering) Kontroll över exponering (observation / experimentell) Urval (individer / grupper)
Aggregerade data Data ej knutet till individer. Bra vid nya fenomen eller när man har begränsad kunskap hypotesgenererande Fall-rapport (ett intressant fall) Case serie / kliniska studier (flera patienter/fall) Övervakning (passiv / aktiv) Register (populationsbaserade) Uppsökande av fall tex utrotning av smittkoppor Lancet. 2002 Jan 12;359(9301):145-9.
Exempel fallrapport
Klinisk epidemiologi Kliniska case-serier Epidemiologiska metoder tillämpade på grupper av patienter, t.ex. för utvärdering av medicinsk behandling eller kliniska beslut Consequtive cases Ofta multicenterstudier
Kliniska studier Samma möjligheter till design som epidemiologiska Studiegrupp av patienter KLINISK EPIDEMIOLOGISK Studiegrupp Patienter Befolkningen Nämnaren (storleken på ursprungsgruppen) Kontroll av exponering Vanligen okänd Hög Känd Slutsater Om patienter Om populationen Låg
Exempel klinisk studie Figure 6. Children with Autism Spectrum Disorders (ASDs) in IAN Research - Age of First Concern by Diagnosis http://iancommunity.org/cs/ian_research_reports/ian_research_report_sep_2007
Klinisk fall-studie vs register CHD = Coronary Heart Disease
Register Systematisk ordnad förteckning eller systematisk samling data - finns flera olika typer (se nästa sida) Populationsbaserade case-serier dvs innehåller alla fall inom ett visst område och viss period systematisk insamling avsedd för statistik och forskning
Ekologiska studier Exponering och utfall är mätta i en population (aggregerade data) och sedan testas associationer eller korrelationer dem emellan. Analysmetod Gruppen (populationen) är enheten som analyseras Definierad population, många alt: geografiskt, socioekonomiskt, ålder, födelseplats etc Jämförelser över tid och/eller mellan områden Distribution av hälsa och/eller riskfaktorer
Exempel ekologisk studie Benedict W Wheeler et al. BMJ 2008;336:542-545 Fig 1 Trends in rates of antidepressant prescribing in 12-19 year olds per 100 000 population in UK9 and mortality due to suicide or events of undetermined intent in 12-17 year olds per one million population in England and Wales,10 1993 to 2005. 2008 by British Medical Journal Publishing Group
Observationstudier med individdata Primär exponering Andra exponeringar som kan störa / påverka utfallet, så kallade confounders Utfall (sjukdom / dödsfall / hälsa)
Tvärsnittsstudie (Cross sectional) Undersökning som studerar exponering, andra faktorer och utfall vid en viss bestämd tidpunkt. Kallas även prevalens studie.
Exempel tvärsnittstudie
Kohort studie Utgångspunkten är en grupp personer hos vilka exponeringen karakteriseras och de följs sedan över tid för att undersöka om exponeringen påverkar risken för utfallet. Gruppen (kohorten) väljs utifrån vissa egenskaper Prospektiv kohortstudie Retrospektiv kohortstudie historisk kohortstudie
Exempel prospektiv kohortstudie
European Birth Cohorts for Environmental Health Research http://ehp.niehs.nih.gov/1103823/
Fall-referent (fall-kontroll) studie Utgångspunkten är en grupp individer som har utfallet (sjukdomen) och sedan väljer man en grupp kontroller (utan utfallet) varefter man studerar hur exponeringen i dessa två grupper skiljer sig. Viktigt med tydlig definition av fallen (diagnoskriterier) Kontroller väljs så att de representerar den grupp som fallen kommer ifrån Exponeringen identifieras retrospektivt
Varför en fall-kontroll studie? Ovanliga sjukdomar Storleken på studien Undvika stora mängder oanvända data Klokt användande av resurser Sjukdomar med lång latens Tidseffektivt Klokt användande av resurser
Exempel fall-kontroll studie Celiaki (CD) hos barn Incident population-baserad fall-referentstudie < 2 år Frågeformulär CD cases 475 Cases 455 Referents 950 Questionnaire answered Referents 856 Child health clinic record Cases 428 Referents 693 Matched set with one case and one/two referents BVC journaler Cases 392 (83%) Referents 623 (66%)
Randomised controlled trial (RCT) Experiment behandlingen eller preventionen som undersöks (exponeringen) är fördelad slumpvis (randomisering) till endel av individerna i studien men ej till andra. Prospektiv och utgår från exponeringen/icke-exp (manipulering av exponeringen) Har en kontrollgrupp Randomisering I kliniska studier: blindning
Blindning Görs för att undvika medvetna och omedvetna förväntningseffekter och störningar Enkel blindning = patienten vet inte vilken grupp Dubbel = varken patient eller behandlare vet vem Trippel = varken patient, behandlare eller den som analyserar data vet vem som får vad
Potential outcome / counterfactual The potential outcomes that would have been observed under each exposure value Also known as counterfactual outcomes because, for some subjects, they are the outcomes that at would have been observed under an exposure value that the subject did not actually experience (Refer to a counter to the fact situation)
Problem - Can only know one outcome for each individual Avarage effects
Causation comparing the same people under different conditions Association comparing different people under different conditions
Under which conditions can association be considered causation? This is the data we have
Quasi-experiment Liknar experiment men saknar någon/något av de aspekter som gör det till ett experiment (RCT) dvs prospektiv/kontrollgrupp/randomisering. Naturliga experiment (tex ändrade rekommendationer, katastrofer) Samhällsinterventioner (tex intervention utan slumpvis randomisering)
Så hur välja design? Sammanfattning Hur mycket vet man sedan innan? Hur ser forskningsfrågan ut? Typ av utfall? Typ av exponering? Tid och kostnader? Fördelar och nakdelar?
Störningar
Enkel översikt Validity Internal External Random error Systematic error Selection bias Information bias Confounding
Validitet Hur giltiga är resultaten? Intern var studien korrekt, visar resultatet i studiegruppen det sanna värdet? Extern kan resultaten generaliseras?
Två typer av error SLUMPVIS Källa: urval Uttrycks som: P-värden Konfidensintervall (i.e. presition) Påverkar alla analyser SYSTEMATISK Källa: design Uttrycks som bias: Selection bias Information bias confounding Påverkar frekvens och associationsanalyser Precision Bias True value Estimate
Error and sample size
Bias Avsaknad av intern validitet Allt som ger en systematisk störning från sanningen Delas in i tre typer: Selektionsfel Informationsfel Confounding Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002;359:448-452. Delgado-Rodriguez M. Llorca J. Bias. J epidemiol community Health 2004;58:635-641
Selektionsfel Urval och inklusion av deltagare är gjorde på ett sådant sätt att grupperna ej är jämförbara Är grupperna man vill studera lika vad gäller viktiga faktorer? Fall-kontroll studier representerar kontrollerna populationen de kommer från? Cohortstudier - hur är urvalet gjort? Tex healthy-workereffect eller stugsittar-effekten RCT - Loss to follow-up Vem tackar nej till att delta?
Informationsfel finns två typer Slumpvis (nondifferential missclassification) i förhållande till sjukdomsstatus hos dem man undersöker Systematiskt (differential missclassification) det som ger upphov till bias
Informationsfel Systematiska informationsfel ger upphov till nonrandom/differential miss-classification = bias Exempel: Fall-kontroll studie - Recall bias Under/överrapportering Observations bias mätningar/datainsamling sker olika beroende på om fall eller inte (alt om exponerad eller inte) Klassificeringar sker olika beroende på exponerad/fall Avhopp som inte är oberoende av exponering/fall
Confounding Sambandet mellan exponering och utfall påverkas av en tredje variabel som är relaterad till både exponering och utfall. Skall ej vara en intermediär variabel.
Exempel vanliga confounders Ålder Kön Utbildningsnivå Yrke Rökning Etc etc etc
Sammanfattningsvis
Under vilka förutsättningar kan man anta att en statistisk association/korrelation är kausal?
Generellt hantering av störningar Om risken för störningar är stor kan jag välja en annan design eller metod för datainsamling? Tillräckligt stor studiegrupp hanterar random Selection bias måste hanteras på design-nivå kan ej hanteras på analysnivå Information bias planera studien noggrant (alltså design-nivån) kan ej hanteras på analysnivå Confounding är randomisering möjligt? hanteras på design och/eller analysnivå
Hantera confounding Designnivå vilka potentiella confounders finns det? Expertkunskap Teoretisk modell Kunskap om patofysiologiska eller psychosociala pathways för att kunna identifiera dem Hur hantera dessa? Design begränsning eller matchning (observationsstudier) Analys förutsätter att man samlat in information OBS! de två sätten ovan utesluter varandra
Begränsa deltagandet Design inklusions/exclusionskriterier Balansgång mellan intern validitet (homogenitet i studiegruppen) och extern validitet Deltagande tex ålderspann, kön, etc
Matchning Design - parvis (individ) eller frekvens (strata) Tar hand om vissa faktorer men svårt att få bra matchning Fall-kontrollstudie - kontroller väljs utifrån specifika karakteristika hos fallen (tex kön och/eller ålder) Den variabeln man väljer att matcha för är lika för fall och kontroll och kan ej påverka associationen Kan ej analyseras OBS! risk för över-matchning
Stratifiering Analys dela upp (stratifiera) studiepop efter den variabel man misstänker är en confounder associationen opåverkad inom varje strata Förutsätter att det inte finns någon meningsfull variation inom varje strata Begränsning pga antalet stratifieringar Ger en möjlighet att upptäcka även effektmodifiering
Multivariata modeller Analys - metoder för att justera (ta hänsyn till) effecten av en eller flera confounders Effektivt och ej begränsat av power såsom stratifieringar Ofta black box kraftfull men på bekostnad av att man kanske inte riktigt förstår sitt data OBS! Kan endast justera för de faktorer som man har information om och kan inkludera
Grafiska modeller Stöd för att bygga sin teoretiska modell relevant för forskningsfrågan Ett sätt att öka förståelsen för sambanden mellan exponering, utfall och andra variabler Visar forskarnas a priori antaganden Kan hjälpa i bedömningen om vilka variabler som man behöver samla data på Kan hjälpa i bedömningen om vilka variabler som behöver justeras för i slutliga modellen Stöd i kommunikation av forskningsfynd