Kausalitet 2012-03-26. Kausalitet. Vad är kausal inferens? Seminariets agenda. P(Y a=1 =1) P(Y a=0 =1) Kausal effekt för en individ i:

Relevanta dokument
Introduktion till kausala effekter

Mendelsk randomisering

Studiedesign och effektmått

Studiedesign: Observationsstudier

Epidemiologi (II) Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

Grunderna i epidemiologi Felkällor.

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Propensity Scores. Bodil Svennblad UCR 16 september 2014

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Vad beror skillnaden på? Systematiska och slumpmässiga fel

Att mäta hälsa och sjukdom med tillgänglig information Kvantitativa metoder II: Teori och tillämpning Folkhälsovetenskap 4, termin 6

LUFTFÖRORENINGAR-DET OSYNLIGA HOTET MOT DEN HAVANDE KVINNAN?

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Allmänt. Vårt kan det användas inom medicin? Epidemiologin är en viktig del inom t. ex. folkhälsovetenskap och klinisk medicin.

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Hur hanterar man avvikande patienter? Estimander och analysmetoder i kliniska prövningar

Hur hanterar vi multipla exponeringar?

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Epidemiologi I. Läkarprogrammet Termin 5, VT Lars Rylander. Avdelningen för arbets- och miljömedicin, Lund Enheten för miljöepidemiologi

Matematisk statistik för B, K, N, BME och Kemister

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Analys av proportioner

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Fel och fel. slumpmässiga och systema4ska fel i epidemiologiska studier Katja Fall Vetenskapligt förhållningssä>

Tentamen MVE301 Sannolikhet, statistik och risk

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Bortfall Konsekvenser Varför det kan vara allvarligt med bortfall. Ann-Marie Flygare Metodstatistiker, SCB

TSFS06: Bayesianska nätverk i GeNIe - kort handledning

Ersättningsprinciper i primärvården svenska erfarenheter. 23 maj 2016

Erica Schytt. Barnmorska Föreståndare för Centrum för klinisk forskning Dalarna Docent Karolinska Institutet Professor Høgskulen på Vestlandet

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Klinisk forskningsmetodik. Olof Akre, läkare, forskare, Enheten för klinisk epidemiologi, KS

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Föreläsning 7: Punktskattningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Kausalitet: grafiska modeller. Anna Myléus MD PhD Allmänmedicin Epidemiologi and global hälsa Umeå University

LMA201/LMA521: Faktorförsök

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Design av kliniska studier Johan Sundström

Bayes i praktiken. exempel och reflektioner från en forskarutbildningskurs. Ralf Rittner, Arbets och Miljömedicin

Föreläsning 7: Punktskattningar

Epidemiologi T5. Kursmål epidemiologi. Kursmål epidemiologi. Kunna förklara och använda grundläggande epidemiologiska begrepp

Epidemiologi FoU-kurs för ST-läkare

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

4. Kunna orientera sig mellan de olika fönstren

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kvantitativa metoder och datainsamling

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Matematisk statistik för B, K, N, BME och Kemister

Paneldata och instrumentvariabler/2sls

SKATTNING AV KAUSALA EFFEKTER MED MATCHAT FALL-KONTROLLDATA

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Probabilistisk logik 2

Föreläsning 10, del 1: Icke-linjära samband och outliers

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

LABORATION 1. Syfte: Syftet med laborationen är att

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Statistisk analys av komplexa data

FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

Lösningar till SPSS-övning: Analytisk statistik

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Hur skriver man statistikavsnittet i en ansökan?

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Epidemiologisk studiedesign (Forskningsmetodik)

Bilaga till rapport 1 (10)

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

TMS136. Föreläsning 1

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

TMS136. Föreläsning 2

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 5/7/2010. Disposition. Studiedesign två huvudtyper

Lektionsanteckningar 11-12: Normalfördelningen

Regressions- och Tidsserieanalys - F7

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.

import totalt, mkr index 85,23 100,00 107,36 103,76

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581

Transkript:

Seminariets agenda Vad är kausal inferens? nna Ekman rbets- och miljömedicin Kausalitet Statistiska samband kontra kausalitet Konfounding DG ett grafiskt stöd Inverse propability weights Kausalitet ounterfactual or potential outcomes Kausalitet Kausal effekt för en individ i: Relationen mellan en händelse, orsak, och en annan händelse, verkan/effekt, där den andra händelsen förstås som en konsekvens av den första. Kausal medeleffekt: P(Y a= =) P(Y a=0 =) Randomiserad studie (detta exempel oetiskt) Kausalitet Statistiska samband kontra kausalitet Konfounding DG ett grafiskt stöd Inverse propability weights : rök inte! : rök!

Observational study Om man nu inte kan göra ett randomiserat experiment, utan får nöja sig med en observationsstudie : non-smokers : smokers : non-smokers : smokers P(Y a=0 =) P(Y a= =) P(Y= =0) P(Y= =) Samband kontra kausalitet Säg att vi ser statistisk samband mellan och i vår population. Detta kan ske på ett av tre sätt (och ett måste vara sant) P(Y a=0 =) P(Y a= =) P(Y= =0) P(Y= =) Om man i en observationsstudie lyckas få de oexponerade och de exponerade att vara lika i allt viktigt utom exponeringen, då har man utbytbarhet. Utbytbarhet ger att P(Y a= =) = P(Y= =) och P(Y a=0 =) = P(Y= =0) Men av dessa samband mellan och är bara två kausala Det sista exemplet inte kausalt samband, utan typisk konfounding. Frånvaro av utbytbarhet är konfounding Samband kontra kausalitet Åtgärda konfounding kausalitet Statistisk samband mellan och innebär INTE ett kausalt förhållande mellan och, men om har samband med OH händer före i tid Skulle följande kausala samband vara det enda möjliga X, fysisk aktivitet Y, hälsa smärta Smärta en konfounder för sambandet mellan fysisk aktivitet och hälsa Stratifiera, dela in i två grupper, smärt =0 och smärta= fysisk aktivitet hälsa fysisk aktivitet hälsa smärta=0 smärta= I ett smärt-strata finns ingen konfounding. Vi har då betingad utbytbarhet. 2

DG Directed cyclic Graphs DG - Directed cyclic Graphs Kausala diagram Komplexa modeller kan undersökas för att se vad man bör justera för i sin modell och inte. lla regler för hur dessa grafiska modeller skall hanteras har matematisk bakgrund. (Pearl) Grafisk metod att se på konfounders och på de ev. kausala samband man vill analysera. Inga cykler Pilar skall ha en kausal tolkning, inte enbart statistiska samband. Kräver stark teoretisk förankring. DG symboler/byggstenar Två variabler som inte har samband i populationen Kan skapa samband i analys genom överjustering! orsakar, en konfounder Justera för ntag att är en effekt av båda och och kommer då att ha samband inom strata av Den streckade linjen symboliserar det skapade/framkallade sambandet tletisk Förmåga kademisk förmåga Sammanfattning så här långt Skola ntag att flera skolor har selektiv antagning. Elever antas om de antingen är duktiga atleter eller duktiga akademiskt eller både och. ntag också att atletisk och akademisk förmåga är oberoende av varandra i populationen. Inom en skola skapas en negativ association. Varför? Ta en elev i skolan. Om eleven är dålig atlet, så vet vi att elev är duktig akademiskt,annars hade eleven inte antagits. och kommer ha samband i populationen om: orsakar orsakar Det finns ett som är orsak till både och och kommer ha samband i sub-population, definierad av, om är en effekt av både och. Detta är byggstenarna i kausala diagram. 3

DG Forskningsfråga: Är upplevd stress en short-term risk faktor för att ha smärta nu? Är även datoranvändningsmönster en short- term risk faktor? En teoretisk modell som vi är vana. Pearls regler Följer man Pearl s regler får vi en slut-graf som visar om vi har konfounding eller inte (givet att utgångsmodellen var korrekt). Låt oss se ett exempel Forskningsfråga: Är upplevd stress en short-term risk faktor för att ha smärta nu? Är även datoranvändningsmönster en short- term risk faktor? En DG utifrån teoretiska modellen och utifrån de variabler vi har i studien. Forskningsfråga: Är upplevd stress en short-term risk faktor för att ha smärta nu? Är även datoranvändningsmönster en short- term risk faktor? Regression: Pain(t) = stress(t) + pattern(t) + stress(t-) + pattern(t-) X: Pain (t) pattern (t). Vilka variabler måste vi justera med för att inte ha konfounding? Gratis programvara.. Fria från konfounding om vi justerar för och? Vi skall utgå från fråga Ta bort alla pilar som går från exponeringen (percived, pattern (t)) till utfallet (pain (t)). X: 4

ind samman alla föräldrar, som har ett gemensamt barn. X: Ta bort alla linjer/pilar från eller till de eventuella konfounder-variablerna X: (percived, ). Om nu exponering och utfall är separerade har vi justerat bra. Vår analys är inte konfounded, X: Givet att den kausala modellen vi började med är korrekt. (Justerat för percived,.) 5

X: Låt oss se en variant av vårt exempel om inte tar med pattern (t) som exponering i vår planerade modell. pattern (t) X: I komplicerade modeller är proceduren lite stökig eller om man har fråga (vilka konfounders bör jag justera för) så finns gratis programvara att ladda ner till hjälp. www.dagitty.net pattern (t) OS! Vi kan skapa konfounding genom att över-justera! (Skolexemplet) X och Y är nu inte separerade och vi har därför konfounding. Justera för pattern (t) så stängs denna väg, d.v.s. ingen konfounding kvar. Eller Justera för och Sammanfattning Kausalitet formaliserat Konfounding att skapar samband, justera därför Kan överjustera själv skapa samband DG: Kausala diagram ntaganden medvetandegörs och kan lättare diskuteras Se vad som bör justeras för och vad man INTE skall justera för Inga kausala antaganden in inga kausala slutsatser ut (artwright, 989) Kausala antaganden kan INTE uttryckas i den traditionella statistikens matematiska språk. 6

Hur kan vi justera i en analys? Inkludera konfounders i regressionsmodell som x-variabler. Vikta: Kausal-effekt Standardisera till mål-populationens fördelning av konfounders (average of idividual causal effect in the target population) Standardisera till de exponerades fördelning av konfoundervariabler Standardisera till de oexponerades fördelning av konfoundervariabler Vanlig justering för konfounders? P Y P Y a bstress * xstress bnobreak * xnobreak ln Effekten av stress i gruppen med bra pausmönster (nobreak=0, ) Effekten av stress i gruppen med dåligt pausmönster (nobreak>) Medel av dessa två effekter. Effekten mycket stor i en ovanlig grupp justerade effekten blir stor, men inträffar sällan i den aktuella populationen. Inference based on counterfactuals IPTW Inverse probability treatment weights En exponering i fokus. Viktar observationerna, tex Exponerade: /(sannolikheten för exp givet confounders) Oexponerade: /(sannolikheten för oexp givet confounders) IPTW en konfounder Nackont: Y = om ja Y = 0 om nej Stress: x stress = om ja x stress = 0 om nej Konfouner: Pausmönster Detta ger exponeringens effekt i en population med samma fördelning av justerings-variablerna som i datamängden (målpop). Endats denna konfounder inte troligt, men för att följa exemplet från tidigare. IPTW en konfounder Modellerar först exponeringen, stress, som Y och konfoundern, pausmönster, som x i en logistisk regression. Kan sedan, för varje observation individ räkna fram Sannolikheten att vara exponerad, givet värdet för ens egna konfoundervärden. Sannolikheten att vara oexponerad, givet värdet för ens egna konfoundervärden. IPTW en konfounder Räknar sedan ut en vikt som varje individs utfall multipliceras med. Dessa vikter kan se olika ut. Standardisering till populationens fördelning av konfounders: P stress nobreakindivid P stress 0 nobreakindivid för de exponerade för de oexponerade Modellerar sedan utfallet, ont i nacken, med enbart exponeringen, stress, som x i en logistisk regression. 7

IPTW en konfounder IPTW en exponering, många konfounders Konfounderfördelning Målpopulation Exponerad population Oexponerad population Stress Prevalens % Pga stress Stress Prevalens % Pga stress Stress Prevalens % Pga stress 0 4 0 4 0 4 28 4 29 4 28 4 Mål Exp Oexp OR 2,4 2,4 2,4 PR 2,0 2,0 2,0 PD 4 4 4 Vanlig konfounder justering OR=2,5 Nackont: Y = om ja Stress: Y = 0 om nej x stress = om ja x stress = 0 om nej Konfounders: Förutom pausmönster vid datoranvändning MI, frukostvanor, motion, arbetstimmar, krav i studier för stora, kraven i studierna påverkar hem/familjelivet, kraven hemifrån påverkar studierna, astma, diabetes, hjärt. IPTW en exponering, många konfounders proc genmod data=work.woment2 descending; class nobreak/order=internal descending param=ref; model stress = nobreak overw2 smoke2 onlysnu2 fruko2di brachef2 run; brakam2 kravpav2 pavarb2 astma2 diabet2 hjarta2/ link=logit dist=binomial type3; output out=vikt_women pred=vikt ; *** alculate vikterna, Standardized to the distribution in the total cohort; data work.vikt_women; set work.vikt_women; if stress= then iptw=/vikt; if stress=0 then iptw=/(-vikt); run; IPTW en exponering, många konfounders Vikterna som vi räknade ut på förra sidan används nu i en princip vanlig analys. proc genmod data=work.vikt_women descending; class stress/order=internal descending param=ref; WEIGHT iptw ; model nuneck = stress/ link=logit dist=binomial type3; run; IPTW en exponering, många konfounders IPTW två exponeringar, många konfounders Konfounderfördelning Målpopulation Exponerad population Oexponerad population Stress Prevalens % Pga stress Stress Prevalens % Pga stress Stress Prevalens % Pga stress 0 8 0 2 0 4 28 0 29 7 28 4 Exponering OR PR PD Stress Pausmönster=0,,8,6 0 Pausmönster=2,8,5 Mål Exp Oexp OR,8,5 2,4 PR,6,3 2,0 PD 0 7 4 Vanlig konfounder justering OR=2,2 Pausmönster Stress=0,3,2 4 Stress=,3,2 5 8

IPTW två exponeringar, många konfounders 50 45 40 35 30 4 Stress&Nobreak 25 Nobreak 0 0 stress 20 4 Unexplained 5 0 7 7 7 7 5 0 No stress Stress No stress Stress with breaks (nobreak=0,) without breaks (nobreak=2) Inference baserad på counterfactuals Positivt Rena, tydliga resultat Lätt att räkna ut prevalens, prevalens-kvot och prevalensskillnad SS : Proc Genmod med weight-commando Negativt Många justeringsvariabler med mycket partiellt bortfall kan ge mycket missing. nvänder skattade vikter som om de var de sanna värdena (bias). Inference based on counterfactuals Time-varying exposures djustment for unobserved confounding and other biases Kausalitet Statistiska samband kontra kausalitet Konfounding DG ett grafiskt stöd Inverse propability weights 9