Propensity Scores. Bodil Svennblad UCR 16 september 2014

Relevanta dokument
Introduktion till kausala effekter

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR

SKATTNING AV KAUSALA EFFEKTER MED MATCHAT FALL-KONTROLLDATA

Studietyper, inferens och konfidensintervall

Real life och registerstudier Karin Lisspers Falun 19 februari 2018 What is evidence? RCT-studier - patienter i verkligheten

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

Skattning av kausala effekter vid effektmodifiering genom matchning på funktioner av prognostic scores

EPIDEMIOLOGI. Läran om sjukdomsförekomst i en befolkning (Ahlbom, Norell)

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

What is evidence? Real life studier vs RCT. Real life studier vs RCT Falun februari 2017 Karin Lisspers. RCT-studier - patienter i verkligheten

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

Klinisk forskningsmetodik. Olof Akre, läkare, forskare, Enheten för klinisk epidemiologi, KS

Studiedesign: Observationsstudier

Epidemiologisk studiedesign (Forskningsmetodik)

Vad beror skillnaden på? Systematiska och slumpmässiga fel

Kausalitet Kausalitet. Vad är kausal inferens? Seminariets agenda. P(Y a=1 =1) P(Y a=0 =1) Kausal effekt för en individ i:

LUFTFÖRORENINGAR-DET OSYNLIGA HOTET MOT DEN HAVANDE KVINNAN?

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Skattar vi alltid vad vi tror? Om individuell risk och populationsrisk

Statistik 1 för biologer, logopeder och psykologer

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Introduktion till statistik för statsvetare

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Hur skriver man statistikavsnittet i en ansökan?

Att utvärdera offentlig politik med registerdata

Medicinsk statistik I

Erica Schytt. Barnmorska Föreståndare för Centrum för klinisk forskning Dalarna Docent Karolinska Institutet Professor Høgskulen på Vestlandet

Exempel på tentamensuppgifter

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Medicinsk statistik II

Matematisk statistik för B, K, N, BME och Kemister

SF1901 Sannolikhetsteori och statistik I

Bootstrapping i fall-/kontrollstudier av genetiska markörer

Paneldata och instrumentvariabler/2sls

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Matematisk statistik för D, I, Π och Fysiker

Utvärdering av samordningsförbundens verksamhet

Parade och oparade test

Resursfördelningsmodellen

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsning 11: Mer om jämförelser och inferens

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

ÖKAR DELTAGANDE I AKTIVITETSGARANTIN MÖJLIGHETEN TILL ARBETE?

Matematisk statistik för B, K, N, BME och Kemister

Introduktion till Biostatistik. Hans Stenlund, 2011

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

F23 forts Logistisk regression + Envägs-ANOVA

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Interferens i kända och okända nätverk

8.1 General factorial experiments

Tentamen i matematisk statistik

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

8 Ordlista. Svårbehandlat smärttillstånd 2 3 dagar efter en tanduttagning, Patientens egen redogörelse, t ex för sin sjukdom eller sina symtom.

Ekologiska studier, naturalistiska studier eller effectiveness-studier samma sak?

TMS136. Föreläsning 10

Evidensbaserad medicin

Borde vi mäta statistisk osäkerhet vid totalundersökningar?

7.5 Experiment with a single factor having more than two levels

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Mendelsk randomisering

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Evidensbaserad medicin (EBM)

7.5 Experiment with a single factor having more than two levels

Hypotestest och fortsättning av skattningar och konfidensintervall

Mejàre nov Disposition. Processen för en systematisk översikt. Processen. Syfte Att tillägna sig ett kritiskt förhållningssätt

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Metod och teori. Statistik för naturvetare Umeå universitet

Studiedesign MÅSTE MAN BLI FORSKARE BARA FÖR ATT MAN VILL BLI LÄKARE? 2/13/2011. Disposition. Experiment. Bakgrund. Observationsstudier

Kodkombination: T5H De sista fyra siffrorna i pers.nr:... Namn: Pers.nr:

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

GMM och Estimationsfunktioner

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Metoder för att mäta effekter av arbetsmarknadspolitiska program WORKING PAPER 2012:2

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

ANVÄNDNING AV KVALITETSREGISTER I VETENSKAPLIGA ST-ARBETEN LÄRANDESEMINARIUM 1

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Hur kan gentekniken hjälpa oss att lösa stora folkhälsfrågor? Tove Fall Institutionen för medicinska vetenskaper Uppsala Universitet

Tentamen Tillämpad statistik A5 (15hp)

Tillvägaghångssätt för skattning av körkortsmodell

Dataanalys kopplat till undersökningar

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Transkript:

Propensity Scores Bodil Svennblad UCR 16 september 2014

Jämföra två behandlingar

Randomiserad studie A B Inte alltid etiskt försvarbart Dyrt Restriktioner på studiepopulationen (generaliserbart?) Real life?

Alternativ? Observationsstudie med data tex. från register SIR DORS PAR

Exposure Utfall A Andel Tid till händelse Kontinuerligt utfall B

Vårdtillfälle 3 månader odds A = 1/3 odds B = 4/2 OR AvsB = 1/6

Tag hänsyn till åldern < 40 40-60 >60 OR OR OR Alt. Logistisk regression lll p i 1 p i =α + β bbb + γ ållll

Kön? <40 40-60 >60 Kvinna OR OR OR man OR OR OR Alt. Logistisk regression lll p i 1 p i =α + β bbb + γ ållll + δ kkk

Rökning? BMI? blodtryck? diabetes? Tidigare CVD?

lll p i 1 p i =α + β bbb + γ ållll + δ kkk + θ rrrrrrr + Begränsning i hur många kovariater vi kan ha i modellen Tumregel : Minst 10 händelser per koefficient som skall skattas (men beror dessutom på hur de är fördelade )

Val av behandling P(A)=0.5, fördelningen av andra variabler ungefär lika i båda grupperna P(A)=? Fördelningen av andra variabler ofta olika i de båda grupperna

Propensity Scores= P(beh. A observerade kovariater) Jämför utfallet för individer som fått behandling A med de som fått behandling B där sannolikheten för behandling A är lika A P(A)= 0.7 P(A)= 0.7 P(A) =0.4 B P(A) =0.4 Om vi hittar individer i de båda behandlingsgrupperna som har samma sannolikhet att få behandlingen kan vi tänka oss att slumpen avgjort vilken behandling de fått

Sannolikhet för behandling A? lll p i 1 p i =α + β bbb + γ ållll + δ kkk + θ rrrrrrr + Tumregel : Minst 10 händelser per koefficient som skall skattas (men beror dessutom på hur de är fördelade ) händelserna är nu behandling A, många fler än det faktiska utfallet vi är intresserade av!

Skattning av propensity scores Skatta koefficienterna i propensity modellen (tex. logistisk regression där utfallet är behandling A (ja/nej)) Använd de skattade koefficienterna från modellen för att beräkna sannolikheten för behandling A för varje enskild individ

Propensity score = P(A x) Kovariater som vi vill justera för Faktisk behandling Sannolikheten för behandling A

Hur används propensity scores? Matchning Stratifiering Kovariatjustering IPWT

Matchning

Hur matcha? Slumpmässig ordning på observationerna i behandlingsgruppen Matcha en i taget med den som har närmast propensity score i kontrollgruppen, ta bort båda från grupperna Definiera vad som är nära

Viss information slängs bort

Stratifiering

Balans?

Matchning/stratifiering + enkelt att förstå + enkelt att kontrollera om balans - slänger bort mycket information om propensity scores fördelningarna skiljer sig mycket åt

Kovariatjusterad analys lll p i 1 p i =α + β bbb + γ ållll + δ kkk + θ rrrrrrr + Ingår i en propensity modell som ger skattat P(A x) för varje individ Analysmodell: lll p i 1 p i =α + β bbb + γ PP

Sammanfattning 1. Sammanfattar observerade kovariater i ett score 2. Använder detta score i en analys (matchning/ stratifiering/ kovariatjustering/ipwt)

För- och nackdelar Sparar frihetsgrader pseudorandomisering Enkelt att använda Kan inte få skattningar på de enskilda variablernas effekt Justering/balans av observerade kovariater (inte sann randomisering)

Referenser 1. Rosenbaum & Rubin: Reducing Bias in Observational Studies Using Subclassification on the Propensity Score. Journal of the American Statistical Association, 1984, 79 (387): 516-524 2. D Agostino: Propensity Score methods for bias reduction in the comparison of a treatment to a non-randomized control group. Statistics in Medicine, 1998, 17: 2265-2281 3. Newgard, Hedges, Arthur, Mullins: Advanced Statistics: The Propensity Score A Method for Estimating Treatment Effect in Observational Research. Acad.Emerg. Med. 2004. 11 (9): 953-961 4. Austin: An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivariate Behavioral Research, 2011, 46:399-424 5. Austin: Optimal caliper widths for propensity-score matching when estimating differences in means and differences in proportions in observational studies. Pharmaceutical Statistics, 2010, 10 (2): 150-161