Mendelsk randomisering 1
Föredraget en bild: Mendelsk randomisering = instrumentalvariabelanalys med gener som instrument 2
Översikt Kausalitet Instrumentalvariabler Mendelsk randomisering 3
Vad är kausalitet? Orsaksamband, orsakssammanhang Definitioner: Wikipedia Kausalitet, eller orsakssamband, innebär en form av nödvändighet i relationen mellan empiriska fenomen (ting eller händelser) Filosofi: n definitioner n filosofer Studenter tvingade att läsa statistik: p<0.05 4
Kausalitet och statistik Traditionellt sätt inte populärt Correlation is not causation by far the surest, if not the only way to establish correlation [sic] is by a series of experiments [where] variables are deliberately modified 5
Kausalitet och statistik Lösning : ignorera frågan helt och hållet Mindre bra idé? Orsakar rökning lungcancer hos människor? De flesta svarar ja idag Viktigt med kausala slutsatser viktigt med teori Inte minns för att säga när vi har fel och varför 6
(Neyman-)Rubins kausala modell Precis definition av kausalitet Formell modell. Vi kan alltså: Härleda estimatorer vad estimerar vi? Säga vilka antagande vi måste göra Alltid nödvändigt med otestbara antagande Potentiella utfall som kontrafaktiska villkor 7
Directed Acyclical graphs (DAGs) (eller riktade acykliska grafer på svenska) Grafer användbara vid kausal inferens Utvecklade framförallt av Judea Pearl Ickeparametriska strukturella ekvationsmodeller 8
Exempel på kausal DAG Noder representerar variabler Pilar möjlig direkt kausal effekt Ex. X har en direkt kausal effekt på Y, G på X osv. 9
Stigar Vägen mellan två variabler kallas stig (path) Ovan två stigar från G till Y: (G,X,Y) och (G,X,U,Y) (G,X,Y) är en riktad stig, d.v.s. samband i pilens riktning 10
Association En stig kan vara öppen eller blockerad Två variabler A och B med minst en öppen stig är inte oberoende dvs. A B 11
Öppen stig I ovanstående fall är stigen mellan A och C öppen Alltså A C Notera dock att A C B dvs. oberoende givet C Genom att betinga på en variabel kan vi stänga en stig I sista fallet är B en confounder mellan A och C 12
Blockerad stig - collider En stig kan även blockeras av en collider, dvs. en variabel med pilar in i sig från båda hållen Här har vi A C Att betinga på en collider öppnar stigen, dvs A CB 13
Exempel Av de två stigarna mellan G och Y är (G,X,Y) öppen och (G,X,U,Y) blockerad (U,X,G) och (G,X,U) är blockerade 14
Exempel Hur ska en modell för den kausala effekten av G på Y se ut? (G,X,Y) är vad vi är intresserade av och måste lämnas öppen (betinga ej på X) (U,X,G) och (G,X,U) är blockerade 15
Exempel Modellen implicerar att G U, G Y X, U och att G X, X U, X Y Vi kan testa dessa implikationer! 16
Instrumentalvariabler I vissa fall går den kausala effekten inte identifiera Effekten av X på Y ej identifierbar om U är en (eller flera) omätt confounder 17
Instrumentalvariabler I instrumentalvariabelanalys använder man ytterligare en variabel, ett instrument 18
Giltiga instrument G är ett giltigt instrument om följande är uppfyllt: 1. G U, alltså G oberoende av U 2. G X, alltså G ej oberoende av X 3. G Y X, U, alltså G oberoende av Y betingat på X och U 19
Giltiga instrument G är ett giltigt instrument om följande grundantagande är uppfyllt: 1. G U, alltså G oberoende av U 2. G X, alltså G ej oberoende av X 3. G Y X, U, alltså G oberoende av Y betingat på X och U Kan krävas ytterligare antagande! 20
G giltiga instrument? 21
G giltiga instrument? 22
G giltiga instrument? 23
G giltiga instrument? 24
G giltiga instrument? 25
Vilka slutsatser kan dras? Med grundantaganden och kategoriska variabler: Test av kausal effekt av X på Y Gränser (och endast det) för storleken på den kausala effekten 26
Mendelsk randomisering Vi låter gener vara instrument Gregor Mendel genetikens fader En gen finns i flera varianter (alleler) Vid befruktning slumpmässigt vilka alleler man får 27
Exempel Låt X vara alkoholkonsumtion och Y vara kardiovaskulär sjukdom Genotypen ALDH2 påverkar metabolism av alkohol Dålig metabolism mindre konsumtion 28
Problem stratifierad population Olika allelfrekvens i olika subgrupper av populationen Olika sjukdomsfrekvens i olika subgrupper av populationen Betinga på P! 29
Linkage disequilibrium Vissa närliggande gener har en tendens att ärvas tillsammans 30
Pleiotropi En gen kan ha flera funktioner 31
Genetisk heterogenitet Flera gener påverkar exponeringen 32
Mer komplicerat exempel 33
Avslutning Antaganden som måste göras är starka Ofta ej möjliga att testa Kräver kunskap om generna och deras effekter Analysmetoderna inte helt färdiga Kräver att man är insatt i teorin 34
Referenser Böcker Morgan & Winship Counterfactuals and causal inference Lättläst bok som tar upp både kausal inferens (inkl DAGs) och IV Pearl Causality. Lite av ett referensverk inom kausal inferens. Tar uppd et mesta. 35
Referenser Artiklar (klickbara) Didelez V, Sheehan N. Mendelian randomization as an instrumental variable approach to causal inference. Statistical Methods in Medical Research. 2007;16(4):309-30. Didelez V, Meng S, Sheehan NA. Assumptions of IV methods for observational epidemiology. Statistical Science. 2010;25(1):22-40. Pearl J. Causal inference in statistics: An overview. Statistics Surveys. 2009;3:96-146. Pearl J. Causal diagrams for empirical research. Biometrika. 1995;82(4):669-88. 36
37