En statistikers funderingar efter bröstcancersymposiet i San Antonio, december 2011 Pär-Ola Bendahl Clinical Sciences Department of Oncology Lund University Par-Ola.Bendahl@med.lu.se 2012-02-15
En av de största bröstcancerkonferenserna Cirka 8000 deltagare 2011 Hålls andra veckan i december varje år Summerar året som gått Fokus på kliniska studier 2
Slaget vid Alamo 6 mars 1836 James Bowie Davy Crockett 3
The Riverwalk 4
Kulörta lyktor i drivor 5
Henry B Gonzalez Convention Centre 6
Statistik på SABCS Studiedesign Statistisk Grafik Överlevnadsanalys Metaanalys Bidrag från avdelningen för onkologi, LU 7
Studiedesign 8
Interimsanalyser Få av de studier som presenterades hade interimsanalyser inplanerade Allmän skepsis efter tidiga avbrott i flera viktiga studier? 9
Subgruppsanalyser på gott och ont Peter M Rothwell Lancet 2005 Subgruppsanalyser är meningsfulla och viktiga om grupperna definieras apriori utifrån sunda principer. meningslösa och ofta direkt vilseledande om grupperna definieras i efterhand. CONSORT innehåller för lite om subgruppsanalyser Kriterier för design, analys, rapportering och tolkning föreslås 10
Några punkter från Rothwells regler Significance of the effect of treatment in individual subgroups should not be reported; rates of false negative and false positive results are extremely high. The only reliable statistical approach is to test for a subgroup-treatment effect interaction. Pre hoc subgroup analyses are not intrinsically valid and should still be interpreted with caution. The false positive rate for tests of subgrouptreatment effect interaction when no true interaction exists is 5% per subgroup. The best test of validity of subgroup-treatment effect interactions is their reproducibility in other trials. Few trials are powered to detect subgroup effects and so the false negative rate for tests of subgroup-treatment effect interaction when a true interaction exists will usually be high. 11
Två exempel (från Rothwell) Kanadensisk studie Aspirin Slaganfall Män: RR = 0.52; P < 0.005 Kvinnor: RR = 1.42: P = 0.35 Ledde till att kvinnor underbehandlades i mer än 10 år ISIS-2 Aspirin vs Placebo efter hjärtinfarkt Heterogenitet stjärntecken Aspirin skadligt om man är född i tvillingarna eller vågen (RR > 1.0; N.S.) effektivt om man är född i andra stjärntecken (RR << 1.0; P<0.001) 12
Överlevnadsanalys 13
Några iakttagelser Otaliga Kaplan-Meier-grafer Ofta tråkiga standardinställningar vad gäller färger, linjetyper och bakgrunder Fokus på icke-proportionella hazarder Grafik ofta bättre än tabeller (föredrag/posters) 14
Standardgraf i Stata 15
En något mera bearbetad variant 100 Distant disease-free survival by histological grade 75 50 25 0 Number at risk Grade 1+2: Grade 3: Grade 1 or 2 Grade 3 0 5 10 Follow-up, years 155 139 102 72 53 38 16
Icke-proportionella hazarder för död i BC 17
Faktor En fundering kring skal-val Två dikotoma prognosfaktorer A och B. Mortalitet (högt vs. lågt uttryck) jämförs Resultat: Hazard Ratio 95% Confidence Interval B A 0.5 1 1.5 2 2.5 3 Hazard Ratio Vilken faktor fungerar bäst? 18
Faktor Rätt skal-val Hazard Ratio 95% Confidence Interval B A 1/4 1/2 1 2 4 Hazard Ratio 19
Kvoter presenteras (allt för) ofta på linjär skala Exempel från Oxford overview : 20
Svar från Sir Richard Peto Thanks for your comment about log scales. I agree that, for statistical readers, log scales are sometimes more appropriate. CTSU decided some years ago, however, to use arithmetic scales rather than log scales as the standard option for publishing the main results we produce. This was, and still is, mainly because we want to communicate our findings to non-statisticians, and some people are more at ease with arithmetic than with log scales (whereas anybody who can easily understand a log scale can also easily understand an arithmetic one). 21
Separata Cox-modeller för olika tidsintervall 0-5 år >5 år Faktor HR 95% CI HR 95% CI S-fas (hög vs låg) 7.4 3.0-19 0.71 0.39-1.3 pt (>20mm vs 20 mm) 2.2 1.1-4.3 0.83 0.47-1.5 ER (neg vs pos) 2.9 1.6-5.5 0.81 0.47-1.4 PgR (neg vs pos) 3.2 1.7-6.1 0.91 0.53-1.5 En modell per faktor och tidsintervall justerat för adjuvant behandling stratifierat för region 44 dödsfall i bröstcancer i det första intervallet och 76 i det andra 22
Grafik istället för tabell alt. 1 0-5 år >5 år S-fas S-fas pt pt ER ER PgR PgR 1/4 1/2 1 2 4 8 16 32 Hazard Ratio, log skala 1/4 1/2 1 2 4 8 16 32 Hazard Ratio, log skala 23
Grafik istället för tabell alt. 2 S-fas pt ER PgR 0-5 år >5 år 1/4 1/2 1 2 4 8 16 32 Hazard Ratio, log skala 24
En intressant studie 25
Riskprediktion i samband med mammografi PROCAS Predicting Risk of Cancer At Screening Modellerar Familjehistoria Livsstilsfaktorer Brösttäthet 18 SNPs Större spridning i Risk när DNA-info inkluderas Bättre diskrimination 26
Ett av våra bidrag 27
Difference Ratio Neoadjuvanta studier Lite bakgrund Förändring i biomarköruttryck från diagnos till op (Ki67) Metodarbete Ki67 proliferation in core biopsies versus surgical samples - a model for neo-adjuvant breast cancer studies. Romero Q, Bendahl PO, Klintman M, Loman N, Ingvar C, Rydén L, Rose C, Grabau D, Borgquist S. BMC Cancer. 2011 Aug 7;11:341. Resultat: 40 Bland-Altman - linear scale 16 8 Bland-Altman - multiplicative scale 20 4 2 0 1 1/2-20 1/4 1/8-40 0 20 40 60 80 Mean 1/16 5 10 20 30 40 50 60 Geometric mean 28
Hur beräknas fraktionen Ki67-postiva celler? Konsensus saknas Hot-spot eller ej? Fix nämnare? 29
Utspädningseffekt Ki67 = 27/51 = 53% eller Ki67 = 27/200 = 14% 30
Ki67, % Exempel från studien 80 Core biopsy Surgical sample 60 40 20 0 0 200 400 600 800 1000 Number of cells counted 31
Ett till med konfidensintervall 32
Stoppregeln 33
TACK FÖR VISAT INTRESSE! 34