Matematisk statistik Stockholms universitet Överlevnadsanalys baserad på upprepade oregelbundna mätningar Applicering av statistiska metoder för jämförelse av två behandlingsmetoder mot depression Tsegalem Gebereberhan Examensarbete 2008:7
Postadress: Matematisk statistik Matematiska institutionen Stockholms universitet 106 91 Stockholm Sverige Internet: http://www.math.su.se/pub/jsp/polopoly.jsp?d=5982a=30780
Matematisk statistik Stockholms universitet Examensarbete 2008:7, http://www.math.su.se/pub/jsp/polopoly.jsp?d=5982a=30780 Överlevnadsanalys baserad på upprepade oregelbundna mätningar Applicering av statistiska metoder för jämförelse av två behandlingsmetoder mot depression Tsegalem Gebereberhan maj 2008 Sammanfattning I denna rapport har ett statistiskt datamaterial analyserats. Datamaterialet kommer från 657 patienter som behandlas med två olika behandlingsmetoder mot depression, varav en aktiv och en placebo. Varje patients tillstånd mäts vid olika tidpunkter under undersökningens gång med ett standardiserat test. Patienter med responsvärde lägre än 12 anses inte längre vara depressiva. Patienter med responsvärde större eller lika med 12 är fortsatt depressiva. Olika statistiska metoder har applicerats på datamaterialet från undersökningen, främst en så kallad âsummary statisticsâ av upprepade mätningar från samma individ, samt överlevnadsanalys där passagen av responsvärdet 12 är den studerade händelsen. Försöksuppläggningen medger inte att den exakta tiden för denna händelse observeras. Vi undersöker några enkla alternativa metoder för att få en approximativ uppfattning om när den relevanta händelsen inträar. Av resultaten framgår det att, oavsett vilken av de skattade tidpunkterna som väljs, så nns det en stark statistisk signikant skillnad mellan behandlingsgrupperna aktiv och placebo. Dessutom visar resultaten att behandlingseekten på aktivgruppen är stark och att den sker i ett tidigare skede, oavsett vilken av metoderna att skatta tidpunkterna som väljs. Postadress: Matematisk statistik, Stockholms universitet, 106 91 Stockholm. E-post: tsegagb@gmail.com Handledare: Åke Svensson.
Abstract In this report has a statistical data material been analysed. The data material comes from 657 patients who has been treated with two dierent treatment methods for depression, one active and one placebo. For each patient an index of depression is measured at unequally distributed measurement occasions during the investigation made as a standardized test. Patients with response value lower than 12 are not considered depressive any longer. Patients with a response value greater or equal to 12 are still considered depressive. We have applied dierent statistical methods on the data material from the investigation, mainly a summary statistics of repeated measurements and a survival analysis where crossing of the response value 12 denes the crucial event. The observations do not give the exact time for the event. We investigate a few alternative methods to dene an approximate proxy for the relevant event. Our result is that regardless of the method to estimate the time of the event, there is a strong statistical signicant dierence between the two treatment groups, active and placebo. In addition, it shows that the eect of the active group is strong and happens in an earlier stage at any of the estimated times chosen. 2
Förord Denna rapport, vilken utgör mitt examensarbete, omfattar 30 poäng för magisterexamen i matematisk statistik med inriktning på biostatistik vid Stockholm Universitet. Arbetet har utförts på uppdrag av AstraZeneca i Södertälje. Jag vill tacka Stig Johan Wiklund och Olivier Guilbaud på AstraZeneca för deras presentation av förutsättningarna för arbetet och av själva problemställningen samt för att jag har fått chansen att utföra just detta examensarbetet. Jag vill rikta ett stort tack till min handledare, professor Åke Svenson på matematiska institutionen vid Stockholms Universitet. Åke har gett mig värdefull hjälp och goda idéer. Han också inspirerat mig under arbetets gång. Lektor Gebrenegus Ghilagaber på Stockholms Universitet vill jag tacka mycket för hans medverkan i diskussioner kring arbetet och hans goda råd. Ett hjärtligt tack riktar jag också till Yoni för hans stöd under mitt arbete med rapporten. Till slut vill jag tacka min familj och framför allt min syster Geni, för att hon har varit ett stor stöd för mig under hela min studietid i Sverige. 3
Innehåll 1. INLEDNING... 5 1.1. SYFTET MED EXAMENSARBETET... 5 1.2. RAPPORTENS UPPLÄGGNING... 6 2. BESKRIVNING AV DATAMATERIALET... 7 3. METODER... 9 3.1. UPPREPADE MÄTNINGAR... 9 3.1.1. Regressionsanalys och t-test... 9 3.1.2. Mixed modell... 12 3.1.3. Linjär mixed modell... 12 3.1.4. Kvadratisk mixed modell... 14 3.2. ÖVERLEVNADSANALYS... 15 3.2.1. Censurering... 15 3.2.2. Definitioner av kompletterande variabler... 16 3.2.3. Jämförelse av de skattade tidpunkterna time2, time3 och time4... 18 3.2.4. Genomsnittliga tidsintervaller... 20 3.2.5. SAS procedurer för analys av överlevnadsdata... 21 3.2.6. Icke-parametrisk skattning med log-ranktest... 22 3.2.7. Parameterskattning för lifereg procedur... 24 3.2.8. Coxregression (=proportional hazard modell)... 29 4. SLUTSATS OCH DISKUSSION... 36 Mätosäkerhet... 37 REFERENSER... 39 4
1. Inledning Depression är en sjukdom som många drabbas av. Omkring fem procent av alla vuxna drabbas någon gång i livet av en depression som kräver hjälp från sjukvården. Det finns många behandlingsmetoder mot depression. De bäst studerade behandlingsformerna är läkemedel och psykoterapi. Alla antidepressiva läkemedel påverkar en eller flera signalsubstanser i hjärnan. Det handlar främst om signalsubstanserna serotonin och noradrenalin. Vissa läkemedel påverkar båda medan andra har bara effekt på en av dessa signalsubstanser. Det tar oftast lång tid innan en antidepressiv medicin ger effekt och symptomen kan tom öka i inledningsfasen av medicineringen. De antidepressiva medlen är inte beroendeframkallande men de ger ofta bieffekter. Antidepressiva mediciner tas inte vid behov, utan måste trappas upp till önskad dos samt kräver även nedtrappning, när behandlingen skall avslutas. De kräver även regelbundet intag under behandlingen. Att bli symptomfri kräver oftast flera månaders behandling. Ofta krävs därefter en livsvarig medicinering, för att förhindra återfall (Ref: Vårdguiden). I många medicinska studier vill man följa patienternas depressionstillstånd och utföra upprepade mätningar vid ett tätare och mer regelbundna tillfällen. Detta för att man vill veta den exakta tiden då tillfrisknandet av depressionen sker under en behandlingsperiod. Men att genomföra en sådan mätning på patienter skulle kosta både tid och pengar samt även vara praktiskt ogenomförbart. Denna rapport baseras på en studie på ett antal depressionsdrabbade patienter, vilka behandlats antingen med ett läkemedel (aktiv), vilket har såväl en farmaceutisk effekt som en inbillningseffekt, eller med placebo som enbart ger en inbillningseffekt. I denna undersökning har mätningarna gjorts vid oregelbundna mättillfällen med varierande tidsintervaller. Detta innebär en s.k. diskreta mätning. 1.1. Syftet med examensarbetet Vi gör en statistisk analys av resultaten från en behandling med såväl ett läkemedel som med placebo på patienter med depression. Behandlingen görs på patienterna efter det att de slumpmässigt indelats i två grupper. Mätningarna har inte skett med kontinuerliga intervaller utan är diskreta, vilket medför att det blir svårare att analysera datamaterialet från undersökningen. Syftet med examensrapporten är att belysa hur man kan bearbeta ett sådant diskret datamaterial då man är intresserad av att följa patienternas tillstånd över tiden under det att patienterna genomgår behandling i form av aktiv eller placebo. 5
Våra frågeställningar är: Vilken eller vilka statistiska metoder är lämpliga att använda på data. Hur kan man behandla ett statistiskt datamaterial, där mätningarna på varje patient görs oregelbundet. Om behandlingsmetoden aktiv ger bättre resultat än placebo. Hur snabbt tillfrisknar patienterna och hur stor förbättringseffekten är för respektive behandlingsmetod. Vilken eller vilka förklaringsvariabler som kan användas för att beskriva tiden till tillfrisknandet. 1.2. Rapportens uppläggning Rapportens upplägg är på följande sätt. Vi börjar med att beskriva datamaterialet. Därefter följer ett avsnitt med tillämpningar av statistiska metoderna upprepade mätning och överlevnadsanalys samt dess resultat. I sista avsnitt presenteras slutsatser och diskussioner. 6
2. Beskrivning av datamaterialet Examensarbetet utgörs av en applicering av olika statistiska metoder på behandlingsresultaten från en behandling med ett depressionsläkemedel vilken gjorts i en jämförelse med en placebobehandling. Utvärderingen av depressionsläkemedlet görs i en jämförande studie mellan två grupper av depressionspatienter. Den ena gruppen behandlas med ett läkemedel (aktiv), vilket har såväl en farmaceutisk effekt som en inbillningseffekt. Den andra gruppen behandlas med placebo som enbart ger en inbillningseffekt. Varje patients depressionstillstånd mäts vid ett antal olika tidpunkter, under som mest 66 veckor. Resultaten skattas enligt en må-bra faktor -skala med responsvärden från 0-48. Vid ett responsvärde lägre än 12, anses patienterna inte längre vara depressiva. Antalet undersökta patienter uppgår till totalt 657, varav 327 behandlas aktiv och 330 med placebo. Patienterna har valts slumpmässigt till behandlingsgrupperna. Undersökningstillfällena har skett oregelbundet, vilket innebär att såväl tidpunkten för de olika mättillfällena som tidsintervallerna mellan dessa varierar för olika patienter. Vissa patienter fullföljer inte hela studien och andra genomgår hela studien, dock utan att passera den definierade må bra faktorn 12, vilket innebär att de inte botats från sina depressionssymptom. Rådatamaterialet innehåller följande variabler: Id: 1-657 Identifikationsnummer på patienter i studien Grupp: "Aktiv" eller "Placebo" De två grupper vilka patienterna behandlas. Time: 1-66 Mättillfällena där varje patients tillstånd, dvs. hur de mår, mäts efter oregelbundna tidsperioder. Response: 0-48 Responsvärdet är depressionstillståndet för en patient vid ett mättillfälle, enligt en må-bra faktor -skala från 0 till 48. Vid ett responsvärde lägre än 12, anses patienten inte längre vara depressiv. Responsvärdet 12 benämns i studien som MBF12. Vid första mättillfälle har alla patienter ett responsvärde större än MBF12. Detta eftersom alla deltagare är depressiva, när studien startas. Ju högre responsvärde en patient har desto mer deprimerad är därmed patienten vid undersökningens början. 7
Tabell 1 Rådata för de första fem patienterna. Obs id group time response 1 1 PLACEBO 1 31 2 1 PLACEBO 8 34 3 1 PLACEBO 17 19 4 1 PLACEBO 23 32 5 1 PLACEBO 30 35 6 1 PLACEBO 39 34 7 1 PLACEBO 44 29 8 1 PLACEBO 51 29 9 1 PLACEBO 58 28 10 2 AKTIV 1 36 11 2 AKTIV 8 24 12 3 PLACEBO 1 29 13 3 PLACEBO 9 27 14 4 AKTIV 1 29 15 4 AKTIV 10 21 16 4 AKTIV 17 14 17 4 AKTIV 22 11 18 4 AKTIV 29 10 19 4 AKTIV 36 8 20 4 AKTIV 43 18 21 4 AKTIV 50 9 22 4 AKTIV 57 6 23 5 AKTIV 1 31 24 5 AKTIV 10 16 25 5 AKTIV 15 11 Notera att antalet mättillfällen varierar för de olika patienterna och att mättningarna sker oregelbundet och med olika tidsintervaller. 8
3. Metoder Inledningsvis analyseras data i en så kallad Summary Statistics med metoder tillämpbara på upprepade mätningar. Detta till följd av att patienternas tillstånd har mäts vid ett antal upprepande mättillfällen. Först analyseras datamaterialet med hjälp av en enkel regressionsanalys för varje individ. Detta illustrerar härmed plottar av regressionssambandet för ett slumpmässigt urval antal patienter. En boxplot ger en jämförelse av skattade lutningskoefficienter mellan de två behandlingsmetoderna. Ett t-test görs för att kunna jämföra medelvärdena från de två behandlingsmetoderna. Överlevnadsanalys är huvudmetod i denna rapport. Med hjälp av överlevnadsanalysen studeras tiden till en viss händelse inträffar. I vårt fall utgörs denna händelse av att en patient passerar MBF12 för första gången. I överlevnadsanalysen har ett antal metoder tillämpats såsom parametrisk och icke-parametrisk skattning av överlevnadssannolikheter samt Coxregression som använder semiparametrisk skattning. 3.1. Upprepade mätningar 3.1.1. Regressionsanalys och t-test En regressionslinje av minsta kvadratmetoden anpassas för varje individ. Figur 1 nedan är exempel på slumpmässiga regressionsplottar från såväl aktiv som placebogrupperna. Som framgår av plottarna i Figur 1, så har patienterna olika spridningsmått på mätresultaten. Vissa patienter ligger nära regressionslinjen och andra har stor avvikelse från linjen. Såväl linjära som icke-linjära samband kan konstateras, båda med varierande spridning. I vissa framgår att för få mättningstillfällen föreligger. Efter studie av ytterligare regressionsplottar kan konstateras att merparten av regressionsplottarna för patienterna i aktivgruppen är linjära. 9
Figur 1 Plottar av regressionslinjen för åtta slumpmässigt valda individer ur såväl aktiv som placebogruppen. 10
Medelvärde och varians på den skattade lutningskoefficienten av regressionsanalysen för behandlingsgrupperna aktiv respektive placebo har beräknats. Aktivgruppen har medelvärde -0,45 och standardavvikelse 0,55 och placebogruppen -0,23 respektive 0,38. Medelvärdet av lutningskoefficienten för aktiv är mindre än för placebo. För jämförelse, se boxplotten i Figur 2. Figur 2 Boxplot för jämförelse av skattade lutningskoefficienter mellan behandlingsmetoderna aktiv och placebo. Vi har konstaterat att tidmätningarna på patienterna för respektive behandlingsgrupper är normalfördelade och att de är oberoende av varandra. För att studera skillnaden mellan den skattade lutningskoefficienten time i de två behandlingsgrupperna aktiv och placebo, görs ett tvåsampel t- test på medelvärdesskillnader. Från equality of variances i Tabell 2 ser vi att det finns en signifikant skillnad i de två varianserna med p<0.001 och att de två olika behandlingsgrupperna har signifikant skillnad, både under antagande om lika varianser eller om man antar olika varianser. 11
Tabell 2 Tvåsample t-test. The two-sample TTEST Procedure Variable Method Variances DF t Value Pr > t time Pooled Equal 655-5.79 <.0001 time Satterthwaite Unequal 574-5.78 <.0001 Equality of Variances Variable Method Num DF Den DF F Value Pr > F time Folded F 326 329 2.16 <.0001 3.1.2. Mixed modell Upprepade mätningar är när samma mätningar görs vid olika tidpunkter på samma individ eller på ett och samma mätobjekt. I de flesta situationer väljs individen eller mätobjektet slumpmässigt till en behandlingsmetod. En sådan data analyseras i en mixed modell, där både fixed och stokastiska komponenter ingår. En mixed modell skrivs oftast i följande formel: Y = XB + Zu + e där Y är en vektor som innehåller responsvärdet för alla individer. X är en designmatris och B är en parametervektor. U är en vektor som beskriver en stokastisk effekt och Z är en designmatris för stokastiska effekten. Till slut är e en vektor av mätfel (residualer), (Garrett M, Fitzmaurice, Nan M. Laird & James H. Ware 2004, Chapter 8). I en mixed modell analyseras data genom att mättillfällena plottas mot det predikterade responsvärdet. Detta görs både i en linjär och kvadratisk modell. 3.1.3. Linjär mixed modell I vår undersökning mäts inte depressionstillståndet hos patienterna vid regelbundna tidpunkter. Den första mätningen sker dock vecka 1 (time=1) för samtliga patienter i studien. 12
Nästa mättning för t.ex. som i fallet med patienten med id nummer fyra (se Tabell 1) sker vecka 10, alltså efter nio veckor från det första mättillfället. Den tredje mätningen på denna patient sker därefter vecka 17, dvs. efter sju veckors intervall och det fjärde mättillfället sker vecka 22, dvs. efter bara fem veckors intervall osv. Detta är en situation när en multilevel-modell kan tillämpas, dvs. för en analys av data med oregelbundna mättillfällen. Multilevel-modellen applicerad för våra data med time som en linjär effekt som beskrivs enligt följande ekvation (Garrett M, 2004, Chapter 17). Level 1: ( ) : response 0 j + β1 j time = β ( time) + r (1.1) Level 2: ( patient) : β 0 j = γ 00 + γ 01( grupp) + u0 j (1.2) Level 3: ( patient) : β 1 j = γ 10 + γ 11( grupp) + u1 j (1.3) Insättning av ekvation (1.2) och (1.3) i ekvationen (1.1) ger: : γ 00 γ 01( grupp) + γ 10 ( time) + γ 11( grupp * time) + 0 j 1 j ij [ u + u ( time r ] response + ) + ij (1.1). Genom att använda modellen (1.1) i en linjär mixed modell, predikterar vi responsvärdena och plottar mot time, se Figur 3. Av resultat framgår att båda behandlingarna ger en förbättringseffekt över tiden och att responsvärdet skiljer sig rejält mellan de två grupperna. Alltså, kurvan av aktivgruppen lutar brantare än placebo, vilket överstämmer med regressionanalysens resultat. Figur 3 Plot av linjära mixed modell. Output av linjärmodellen i Tabell 3 visar att variablerna time och grupp är signifikanta samt att det föreligger ett samspel mellan dem. 13
Tabell 3 Skattningar i en linjär modell. Solution for Fixed Effects Effect grupp Estimate Standard Error DF t Value Pr > t Intercept 26.94 0.36 655 75.12 <.0001 time -0.21 0.01 655-17.95 <.0001 grupp aktiv -1.48 0.51 3404-2.91 0.0036 grupp placebo 0.... time*grupp aktiv -0.09 0.02 3404-5.59 <.0001 time*grupp placebo 0.... 3.1.4. Kvadratisk mixed modell Den kvadratiska mixed modellen utgår från kvadraten av tiden (time*time), vilken plottas mot de predikterade responsvärdena. Av resultatet framgår att placebogruppens kurva har en brantare lutning uppåt än aktivgruppens. Se Figur 4. Output av kvadratiska modellen i Tabell 4 visar att samspelet mellan time i kvadrat och grupp är signifikant. Tabell 4 Skattningar i kvadratisk modell. Solution for Fixed Effects Effect grupp Estimate Standard DF t Value Pr > t Error Intercept 29.61 0.39 655 76.62 <.0001 time -0.55 0.02 655-22.55 <.0001 grupp aktiv -0.16 0.55 342-0.30 0.7636 grupp placebo 0.... time*grupp aktiv -0.30 0.03 342-7.57 <.0001 time*grupp placebo 0.... time*time 0.01 0.00 655 15.85 <.0001 time*time*grupp aktiv 0.00 0.00 342 5.19 <.0001 time*time*grupp placebo 0.... 14
Figur 4 Plot i kvadratisk mixed modell. 3.2. Överlevnadsanalys Överlevnadsanalys eller livslängdsanalys är en studie av tiden tills dess en viss händelse inträffar. (John P Klein & Melvin L. Moeschberger, 2003). I många studier utgörs denna händelse för döden, därav namnet överlevnadsanalys. Den avsedda händelsen kan dock även avse andra händelser än döden. I vårt fall är den avsedda händelsen att patient passerar MBF12, dvs. att patientens symptom dämpats så att patienten inte längre diagnostiseras som deprimerad. Överlevnadsanalys används bland annat inom medicinska studier även för t.ex. för analys av tiden fram till döden inträffar till följd av en viss sjukdom, eller för att studera tiden fram till en utveckling av en viss sjukdom. Inom överlevnadsanalys förekommer ofta att patienten inte fullföljer studien eller att den förväntade händelsen inte inträffat innan studiens slut, vilket medför s.k. censurering. 3.2.1. Censurering Det finns fyra olika former av censureringar; höger, vänster, slump respektive intervallcensurering. I denna undersökning föreligger höger- och intervallcensurering. Högercensurering: innebär att patienter fullföljer studien men inte ger den förväntade händelsen innan studien avslutas eller så kan denna vara lost to follow up, som i det andra fallet kan vara att patienten hoppar av studien. I vårt fall är högercensurering när händelsen att få ett responsvärde lägre än 12, inte inträffar innan studien avslutas. Patienten är då fortfarande depressiv vid studiens slut. 15
Intervallcensurering: Patienten når ett responsvärde lägre än 12 och det inträffar i ett känt tidsintervall men den exakta tidpunkten är inte känd. Alla patienter startar studien samtidigt vecka 1 som utgör s.k. baseline och har en sluttidpunkt som är beroende på om patienten uppvisar händelsen att ha passerat MBF12 eller att denna är censurerad, dvs. att patienten inte passerat MBF12. Om patienter når den definierad MBF12 är patienterna icke censurerade för respektive behandlingsmetoderna. 3.2.2. Definitioner av kompletterande variabler För att kunna analysera datamaterialet i en överlevnadsanalys, kompletteras det rådatamaterialet genom införande av ytterligare mätvariabler. Detta med syftet är att fastställa den exakta tidpunkten då en patient passerar MBF12. Vi vet att patienten har passerat MBF12 mellan det sista mättillfället innan den har passerat 12 gränsen och det mättillfället då MBF12 har passerats för första gången. Men den exakta tidpunkten när patienten passerat MBF12 framgår ej av själva mättningsresultatet. Det vi då kan göra är att skatta tidpunkten för när detta sker inom intervallet av de två angivna mätningarna. Vi inför därför följande variabler: start_response som är det responsvärdet vid första tidmätning (baseline) på patienter i studien. Alltså den depressionsnivån patienterna har, när studien startar. time 1 som är det sista mättillfället innan patienten passerar MBF12. time 2 som är det mättillfälle, då patienten för första gången har ett responsvärde lägre än 12. Detta innebär att har patienten passerat MBF12 någon gång mellan time1 och time2. response_time1 (m1) som är responsvärden vid mätning time1. response_time2 (m2) som är responsvärden vid mätning time2. time 3 som är det interpolerade mätvärde mellan time1 och time2, med responsvärdet 12. Det får vi genom att interpolera en rät linje mellan time1 och time2 och bestämma tidpunkten då den räta linjen skär responsvärdet 12. Time3 är därmed mindre eller lika med time2. time 4 som är det skattade värdet av regressionslinjen vi gjort ovan. En ekvation för regressionslinjens med responsvärdet satt till 12 ser ut enligt följande. Yˆ = αˆ + βˆ i t i 2 2 ˆ = i i i i i i där β ( n t y t y ) /( n t ( t ) ) och är koefficienten av lutningen. Den skattade tidpunkten time4 vid responsen 12 löser vi ut genom ekvationen, 12 αˆ + βˆ t i t = (12 αˆ) / βˆ = i där t i med i=1..657 är den skattade tidpunkten vilket vi kallar för time4, αˆ är interceptet av regressionslinjen. 16
Regressionslinjen Interpolerade linjen MBF12 time1 time3 time4 time2 Figur 5 En schematisk graf av skattade tidpunkterna. Censur Om patienterna passerar MBF12 är de icke-censurerade och sätts de till 0, annars 1. För de patienter som i studien inte visar ett responsvärde lägre än MBF 12, är deras sista mättillfälle också räknat i time2, time3 och time4. Detta innebär att för dessa patienter gäller samma tidpunkter för alla tidsvarianter. Tabell 5 visar antal och andel patienter för respektive behandlingsgrupper med hänsyn till om de är censurerade eller inte. Tabell 5 Antal och andel patienter per grupp och censur. Tabell av grupp och censur grupp censur 0 1 Total 17 Aktiv 211 32.12 64.53 57.49 Placebo 156 23.74 47.27 42.51 Total 367 55.86 116 17.66 35.47 40.00 174 26.48 52.73 60.00 290 44.14 327 49.77 330 50.23 657 100.0 0
Data materialet för de första tio patienterna med de nya införda variabler ser ut som följande: Tabell 6 Data för de första tio patienterna. start_ response_ response_ Obs id grupp response time1 time2 time1 time2 time3 time4 censor 1 1 PLACEBO 31 28. 58 58 58 58 1 2 2 AKTIV 36 24. 8 8 8 8 1 3 3 PLACEBO 29 27. 9 9 9 9.0 1 4 4 AKTIV 29 14 11 17 22 20.3 36.1 0 5 5 AKTIV 31 16 11 10 15 14 13.7 0 6 6 PLACEBO 28 13. 12 12 12 12 1 7 7 PLACEBO 41 24. 29 29 29 29 1 8 8 AKTIV 31 32 12 6 19 19.0 31.8 0 9 9 AKTIV 34 21. 62 62 62 62 1 10 10 PLACEBO 30 25. 8 8 8 8 1 Notera t.ex. att patient med id nummer ett inte når en förbättringseffekt under MBF 12 och att patienten är censurerad vid sista mättillfället som är vecka 58. Den sista mättidpunkten används då för alla tidpunkter, time1, time2, time3 och time4. Patienten har ett startrespons värde 31 (start_respons) och 28 (response_time1) vid sista mättillfället. Att värde saknas för response_time2 är en följd av att något responsvärde lägre än MBF12 inte föreligger. Response_time2 är ju det värde vid mättidpunkten time2 vilket i sin tur är det första mättillfälle efter patienten har passerat 12 gränsen. Denna patient är kodad för censur=1. Beskrivningen för patient nummer ett gäller för alla patienter som är censurerade. Patient med id nummer fyra är exempel på patient som ger en förbättringseffekt under MBF12 mellan tidsintervallet time1 och time2 (17 resp. 22) och är kodad för censur=0. 3.2.3. Jämförelse av de skattade tidpunkterna time2, time3 och time4 Innan vi analyserar de definierade tidpunkterna i överlevnadsanalysen, studerar vi dess förhållande till varandra. Detta genom att göra i en scatter-plot som visar förhållandet mellan två variabler. Alla punkter i plotten representerar patienter respektive vilken behandlingsgrupp de tillhör. 18
Figur 6 Scatter plot av de skattade tidpunkterna time2 och time3. Figur 7 Scatter plot av de skattade tidpunkterna time2 och time4. 19
Figur 8 Scatter plot av de skattade tidpunkterna time3 och time4. Scatterplottarna visar att time2 och time3 har ett linjärt förhållande med varandra men däremot inte med time4, se Figur 7. Detta på grund av att time4 som är en skattning av regressionslinjen, kan innefatta även mättidpunkter som ligger utanför tidsintervallet mellan time1 och time2. Detta till följd av att vissa patienter passerar MBF12 endast en gång medan andra patienter passerar MBF12 mer än en gång time4 är därmed en tidskattning som kan ligga innanför och utanför det angivna tidsintervallet. Vi ser i Figur 6 att time3 är mindre eller lika med time2. Punkterna på diagonalen i alla plottarna visar de censurerade patienterna inom respektive behandlingsgrupp. 3.2.4. Genomsnittliga tidsintervaller Vi börjar med att räkna enkla medelvärden av time1 och time2, för att studera den genomsnittliga tid det tar för patienter att passera MBF12 och också få fram den genomsnittliga sluttidpunkten för de som inte passerar MBF12, dvs. för censurerade patienter. Detta för båda behandlingsgrupperna, vilket tabell 7 illustrerar. Tabell 7 Genomsnittliga tider av time1 och time2 samt sluttidpunkt för censurerade patienter. Totalt 657 varav 327 (ca 49,8%) aktiva och 330 (ca 50,2%) placebo 56% passerar MBF12 44% passerar ej MBF12 Aktiv 57% Inom intervall Placebo 43% Inom intervall Aktiv 40% Censurerad vid Placebo 60% Censurerad vid [15.3-22.7] [18,2-25.6] 33,7 40,0 20
Tabell 7 visar att behandlingsmetoden aktiv ger en snabbare förbättringseffekt än placebo, då det genomsnittliga tidsintervallet för aktiv är [15.3-22.7] och för placebo [18,2-25.6]. Den genomsnittliga sista tidpunkten för de patienter som är censurerade är 33.7 för aktiv och 40 för placebo. Även om det är ganska troligt, att patienter som har högre startresponsvärde (dvs. som mår sämre vid studiens början) passerar MBF 12 senare än de som har lägre startresponsvärde (som mår bättre vid studiens början), så har vi beräknat skillnaden i tidsintervallerna i en enkel tabell nedan. Patienterna har därvid även delats upp i grupper beroende om värdena på startresponsen är >30 eller 30. Tabell 8 Genomsnittliga tider av time1 och time2 samt sluttidpunkt för censurerade patienter med uppdelade startrespons. Antal patienter vid startrespons värdet 30 341 (52%) Antal patienter vid startrespons värdet > 30 316 (48%) 63% passerar MBF 12 37% passerar ej 48% passerar MBF 12 52% passerar ej Aktiv Placebo Aktiv Placebo Aktiv Placebo Aktiv Placebo [13,5, 20,8] [16,6 24,0] 35,4 42,6 [17,5 25,3] [20,7 28,0] 32,6 37,8 56% 44% 37% 63% 60% 40% 42% 58% Tabell 8 visar att patienter som har en startresponsvärde mindre än 30 tar kortare tid att passera 12 än de som har startresponsvärde högre än 30. De utgör också en större andel. Av tabellen framgår också att aktiv gruppen passerar MBF12 på kortare tid än placebo. Som framgår av tabellen är spridningen i tidsintervallet ungefär samma (7,3 7,4 7,8 och 7,3) för de olika grupperna när de passerar MBF 12-gränsen. 3.2.5. SAS procedurer för analys av överlevnadsdata Det finns tre olika SAS procedurer för analys av överlevnadsdata. Lifreg procedur, Liftest procedur och Phreg procedur. Lifetest proceduren är en icke-parametrisk procedur som används för att skatta fördelningen för överlevnadstiden. Lifereg och phreg är regression procedur för att modellera fördelningen av överlevnadstiden för olika förklarings variabler.(ref: SAS Textbook). 21
3.2.6. Icke-parametrisk skattning med log-ranktest Kaplan-Meier kurva, som också kallas för överlevnadskurva är en vanligt använd metod för att beskriva överlevnaden i en eller flera grupper. Vill man jämföra överlevnaden mellan två eller flera grupper använder man oftast en speciell variant av signifikansanalys som kallas log-rank test. Logrank test är en icke-parametrisk test. 3.2.6.1. Överlevnadsfunktion Överlevnadsfunktionen är sannolikheten att en person lever längre än tidpunkten t och definieras som S( t) = P( T t) = P(en patient överlever längre än tiden t) där T är överlevnadstiden tills en viss händelse inträffar. (John P Klein & Melvin L. Moeschberger, 2003 Chapter 2). Skattningen av S (t) definieras enligt, S ˆ( t) = (antal patienter som lever längre än tiden t)/(totala antal patienter i studien) Låt S 1( t) och S 2 ( t) vara överlevnadsfunktionen av två grupper, aktiv resp. placebo, då nollhypotesen formuleras enligt följande: H S ( t) = S ( ) och alternativ hypotesen 0 : 1 2 t H S ( t) S ( ) för alla t > 0 1 : 1 2 t En jämförelse av två överlevnadskurvor S 1( t) och S 2 ( t) med ett p-värde mindre än 0.05 av logranktestet, avgörs en signifikant skillnad mellan behandlingsgrupperna aktiv och placebo.(john P Klein & Melvin L. Moeschberger, 2003 Chapter 7). Tillämpning av överlevnadsfunktion på vår data för de olika skattade tidpunkter time2, time3 och time4 med en Log-Rank test visar en stark statistisk signifikant skillnad mellan behandlingsmetoderna. Detta oavsett vilken skattade tidpunkter man väljer förkastas noll hypotesen, se Tabell 9. Tabell 9 Log-Rank test för skattade tidpunkter. Log-Rank Chi-Square Pr > Chi-Square Test time2 31.39 <.0001 time3 31.77 <.0001 time4 29.24 <.0001 22
En jämförelse av överlevnadskurvor för respektive behandlingsgrupper är gjort nedan i Figur 9och 10. Vi ser att tidpunkterna har ungefär samma ordning i båda behandlingsgrupperna och time3 sker tidigare än time2 och time4, ty time3 är mindre än time2. Behandlingsmetoderna har en median av överlevnadstid som har redovisats i tabell 10. Genom att titta på överlevnadskurvorna och deras medianer vid 50 % sannolikhet kan vi säga att time3 sker snabbare än time2 och time4 med medianen 29,97 för aktiv och 40,32 för placebo. Överlevnadskurvor från aktivbehandlade patienter 1,0 0,9 0,8 S(t) 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0 10 20 30 40 50 60 70 Tid i veckor time2 time3 time4 Figur 9 Jämförelser av överlevnadskurvor för de skattade tidpunkterna time2, time3 och time4 för aktiv gruppen. 23
Överlevnadskurvor från placebobehandlade patienter S(t) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 time2 time3 time4 0 0 10 20 30 40 50 60 70 Tid i veckor Figur 10 Jämförelser av överlevnadskurvor för de skattade tidpunkterna time2, time3 och time4 för placebo gruppen. Tabell 10 Median för överlevnadskurvorna ovan vid 50% sannolikhet. Skattade tidpunkter Aktiv Placebo Time2 32.09 43.14 Time3 29.97 40.32 Time4 36.77 45.16 3.2.7. Parameterskattning för lifereg procedur Den parametriska regressionsmodellen som skattas av lifereg proceduren är känd som accelererad livslängdsmodell (Accelerated Failure Time, ATF), i vilken data kan vara höger- eller intervallcensurerad. Den accelererade livslängdsmodellen skrivs enligt formeln: (John P Klein & Melvin L. Moeschberger, 2003, Chapter 2). Y t = µ + γ Z + σε (2.1) 24
där Y logaritmen av överlevnadstiden T, Y = ln(t ). Överlevnadstiden i vårt fall är time2, time3 eller time4. Design matrisen Z är definierat enligt: Z 0 = 1 om om placebo aktiv Insättning med värdet på Z i modellen (2.1) får vi, YP = µ + σε för placebo (2.2) Y = µ + γ + σε för aktiv. (2.3) A Modellerna (2.2) och (2.3) används för att skatta överlevnadstiden. Detta med hjälp av ett antal fördelningar som kan användas i en parametrisk modell. Vi har valt att använda fördelningarna exponential, Weibull, loglogistik, lognormal och gamma. De skattade tidpunkterna används i lifereg proceduren och är redovisade i tabell 11, 12 och 13 med dess parameterskattning och standardavvikelse i de olika parametrarna exponential, Weibull, logistik, lognormal och gamma i jämförelse. Parameterskattningarna för de olika tidpunkterna varierar. Time4 har större skattning på intercepten i alla fördelningar jämfört för time3 och time4. Skattning av variabeln grupp är endast för aktiv. Det visar att alla skattningar av denna grupp är negativa, vilket betyder att aktivbehandlade patienter får en snabbare tillfrisknadseffekt än placebobehandlade. Skattning av variabeln start_response varierar för alla tidpunkter. Minsta skattningen är 0,03 och fås i time4 av fördelningarna Weibull och gamma. Vi har kunnat konstatera att förklaringsvariablerna grupp och start_response ger stark signifikant skillnad med p-värde <0.001 i alla fördelningar. Alltså passar alla fördelningar vår data bra. Tabell 11 Parameterskattning baserad på den skattade tidpunkten time2 i lifereg procedur. Exponential Weibull Log Logistic Log Normal Gamma Est SE Est SE Est SE Est SE Est SE Intercept 2.68 0.30 2.90 0.20 2.36 0.21 2.40 0.21 2.13 0.20 Scale 1.00 0.00 0.66 0.02 0.49 0.02 0.82 0.03 0.85 0.03 Shape........ -.813 0.21 Weibull Shape 1.00 0.00 1.49 0.06...... grupp -0.58 0.10-0.46 0.07-0.46 0.07-0.43 0.07-0.34 0.07 start_response 0.05 0.01 0.04 0.00 0.04 0.00 0.04 0.00 0.04 0.00 25
Tabell 12 Parameterskattning baserad på den skattade tidpunkten time3 i lifereg procedur. Exponential Weibull Log Logistic Log Normal Gamma Est SE Est SE Est SE Est SE Est SE Intercept 2.54 0.31 2.74 0.23 2.08 0.24 2.12 0.23 1.75 0.22 Scale 1.00 0.00 0.75 0.03 0.55 0.02 0.93 0.03 0.95 0.03 Shape........ -.894 0.20 Weibull Shape 1.00 0.00 1.33 0.05...... grupp -0.62 0.10-0.52 0.08-0.53 0.08-0.50 0.08-0.40 0.08 start_response 0.05 0.01 0.04 0.00 0.05 0.00 0.05 0.00 0.05 0.01 Tabell 13 Parameterskattning baserad på den skattade tidpunkten time4 i lifereg procedur. Exponential Weibull Log Logistic Log Normal Gamma Est SE Est SE Est SE Est SE Est SE Intercept 2.77 0.31 3.07 0.19 2.52 0.23 2.01 0.25 3.28 0.22 Scale 1.00 0.00 0.61 0.02 0.50 0.02 1.01 0.03 0.52 0.06 Shape........ 1.34 0.25 Weibull Shape 1.00 0.00 1.62 0.07...... grupp -0.52 0.10-0.37 0.06-0.39 0.07-0.44 0.09-0.34 0.06 start_response 0.05 0.01 0.03 0.00 0.04 0.00 0.06 0.00 0.03 0.00 3.2.7.1. Kumulativa överlevnadskurvor Vi plottar kumulativa överlevnadskurvor av de skattade tidpunkterna i parametern Weibull utan att ta hänsyn till förklaringsvariablen start_response. Vi ser i plottarna nedan att behandlingsgrupperna skiljer sig över tiden. Aktivgruppen har mindre CDF (Cumulative Distribution Function) i alla tidpunkterna däremot böjer den sig något medan placebogruppen avtar ganska rakt ner över tiden. 26
Figur 11 Plot av en kumulativ fördelningsfunktion i time2 med Weibull och utan start_response. Figur 12 Plot av en kumulativ fördelningsfunktion i time3 med Weibull och utan start_response. 27
Figur 13 Plot av en kumulativ fördelningsfunktion i time4 med Weibull och utan start_response. 3.2.7.2. Intervallcensurering Som ett andra alternativ tittar vi på skattningen baserad på intervallcensurering mellan time1 och time2 i lifreg proceduren. I modellen tar vi med förklaringsvariablerna grupp och start_response, skattning och standardavvikelse av dem i olika parametrar är redovisat i tabell 14. Vi kan notera att förklaringsvariablerna grupp och start_response är stark signifikanta. Vid en jämförelse av intervallskattning och parameterskattning för högercensureringen i Tabell 11, Tabell 12 och Tabell 13, kan vi konstatera att skattningarna av intervall censurering är mindre för alla fördelningar. Tabell 14 Intervallskattning mellan time1 och time2 med förklaringsvariablerna grupp och start_response Exponential Weibull Log Logistic Log Normal Gamma Est SE Est SE Est SE Est SE Est SE Intercept 2.46 0.31 2.59 0.26 1.92 0.28 1.90 0.27 1.64 0.30 Scale 1.00 0.00 0.85 0.03 0.63 0.02 1.07 0.04 1.10 0.05 Shape........ -.469 0.25 Weibull Shape 1.00 0.00 1.17 0.05...... grupp -0.63 0.10-0.57 0.09-0.58 0.09-0.55 0.09-0.51 0.10 start_response 0.05 0.01 0.05 0.00 0.06 0.00 0.06 0.00 0.06 0.00 28
3.2.8. Coxregression (=proportional hazard modell) Coxregression mäter sannolikheten att en patient når en förbättringseffekt vid en viss tid punkt t då vi vet att patienten inte har botats innan tidpunkten t nåtts. I denna modell har förklaringsvariablerna grupp och start_response använts. Detta för att kunna skatta den förväntade tidpunkten då en patient passerar MBF12 (John P Klein & Melvin L. Moeschberger, 2003, Chapter 8). Coxmodellen beskrivs enligt formeln: λ ( t ) Z) = λ0( t exp( βζ) Z 0 = 1 om om placebo aktiv ( 0 0( t) t Z 1 ) = ( t) Alltså blir λ t Z = ) = λ för placebogruppen och λ ( λ 0 exp( β ) = för aktivgruppen där _ är regressions parameter för behandlingsgruppen aktiv och _ 0(t) är baseline. Skattning av Coxmodellen fås av, λ( t λ( t Z = 1) Z = 0) λ = 0( t) exp( β ) λ 0( t) = exp( β ) Vi lägger till förklaringsvariablen start_response i coxregressionsmodellen. Vi får då ekvationen till exp( β 1 + β 2 ) för de två förklaringsvariablerna grupp och start_response, där _ 1 är regression parameter för variabeln grupp och _ 2 är regression parameter för variabeln start_response. Resultat av proceduren phreg analys med förklaringsvariablerna grupp och start_response är redovisade i Tabell 15, Tabell 16 och Tabell 17 för respektive tidpunkterna. Tabell 15 Coxregression modell för time2. Variable time2 DF Parameter Estimate Standard Error Chi- Square Pr > ChiSq Hazard Ratio grupp 1 0.63 0.11 34.9 <.0001 1.88 start_response 1-0.06 0.01 30.1 <.0001 0.95 Vi ser att chansen att passera MBF 12 för aktiv gruppen i tidpunkten time2 är 88%.och för placebo blir, 29
λ( t λ( t Z = 0) Z = 1) = λ 0( t) λ 0( t) exp( β ) = exp( β ) = exp( 0,63186) = 0,5361 vilket motsvarar ca 54%. Tabell 16 Coxregression modell för time3. Variable time3 DF Parameter Estimate Standard Error Chi- Square Pr > ChiSq Hazard Ratio grupp 1 0.66 0.11 37.90 <.0001 1,93 start_response 1-0.06 0.01 34.08 <.0001 0.94 Av tabellen framgår att chansen att passera MBF 12 för aktiv gruppen i tidpunkten time3 är 93% och placebo gruppen blir λ( t λ( t Z = 0) Z = 1) = λ 0( t) λ 0( t) exp( β ) = exp( β ) = exp( 0,65739) = 0,5182 vilket motsvarar ca 52%. Tabell 17 Coxregression modell för time4. Variable time4 DF Parameter Estimate Standard Error Chi- Square Pr > ChiSq Hazard Ratio grupp 1 0.62 0.11 33.75 <.0001 1.86 start_response 1-0.06 0.01 32.11 <.0001 0.94 Av tabellen framgår att chansen att passera MBF 12 för aktiv gruppen i tidpunkten time4 är 86% och placebo gruppen blir: λ( t λ( t Z = 0) Z = 1) = λ 0( t) λ 0( t) exp( β ) = exp( β ) = exp( 0,61943) = 0,5383 vilket motsvarar ca 54%. Då vi har kunnat konstatera att startrespons ger en statistisk signifikant skillnad vad gäller tillfrisknadstiden (överlevnadstiden) mellan de två behandlingsmetoderna, plottar vi överlevnadstiden för några specifika kovariater med startrespons:erna 13 (lagom sjuka), 35 (sjuka) och 45 (väldigt sjuka) enligt nedan. 30
Överlevnadskurvor från aktivbehandlade patienter med start_response 13 Skattning av overlevnadsfunktionen 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 time2 time3 time4 0 0 10 20 30 40 50 60 70 Tid i veckor Figur 14 Jämförelser av överlevnadskurvor för patienter med startrespons 13 inom aktivgruppen. 1 Överlevnadskurvor från placebobehandlade patienter med start_response 13 Skattning av overlevnasfunktionen 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 time2 time3 time4 0 0 10 20 30 40 50 60 70 Tid i veckor Figur 15 Jämförelser av överlevnadskurvor för patienter med startrespons 13 inom placebogruppen. 31
Patienter med startrespons 13 och som behandlas med behandlingsmetoden aktiv tar kortast tid att bli friska, se Figur 14. Däremot kan vi konstatera att tidpunkten time4 mellan vecka 15 och vecka 30 för denna startrespons, avviker stort från de andra tidpunkterna. För placebobehandlade patienter med samma startrespons som visas i Figur 15 tar längre tid än för de aktivbehandlade patienterna. Skattning av overlevnadsfunktionen 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Överlevnadskurvor från aktivbehandlade patienter med start_response 35 0 10 20 30 40 50 60 70 Tid i veckor time2 time3 time4 Figur 16 Jämförelser av överlevnadskurvor för patienter med startrespons 35 inom aktivgruppen. 32
1 Överlevnadskurvor från placebobehandlade patienter med start_response 35 Skattning av overlevnadsfunktionen 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 time2 time3 time4 0 0 10 20 30 40 50 60 70 Tid i veckor Figur 17 Jämförelser av överlevnadskurvor för patienter med startrespons 35 inom placebogruppen. Chansen att bli frisk för aktivbehandlade patienter är mycket större än för placebobehandlade patienter med startrespons 35. Genom att studera vid 50 % sannolikhet, ser vi att aktivgruppen vid tidpunkten time2 och time3 tar ca 30 veckors tid att bli frisk medan time4 behöver ca 40 veckor. Placebobehandlade patienter med denna startrespons vid 50 % sannolikhet har däremot nästan ingen chans att bli friska. För jämförelse se Figur 16 resp. Figur 17. Tidpunkterna time2 och time3 visar inte heller någon stor skillnad för denna startrespons, då de ligger nära varandra för båda behandlingsmetoderna. 33
Överlevnadskurvor från aktivbehandlade patienter med start_response 45 Skattning av overlevnadsfunktionen 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 10 20 30 40 50 60 70 Tid i veckor time2 time3 time4 Figur 18 Jämförelser av överlevnadskurvor för patienter med startrespons 45 inom aktivgruppen. Överlevnadskurvor från placebobehandlade patienter med start_response 45 Skattning av overlevnadsfunktionen 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 10 20 30 40 50 60 70 Tid i veckor time2 time3 time4 Figur 19 Jämförelser av överlevnadskurvor för patienter med startrespons 45 inom placebogruppen 34
Patienter med en så hög startrespons som 45 har mindre än 50 % chans att bli friska. De två sista figurerna visar att chansen att bli frisk för patienter som har så hög startrespons är lägre för båda behandlingsmetoder, oavsett vilken tidpunkt man väljer. Vi konstaterar därmed att patienter med lägre startrespons behöver en kortare tid att passera MBF12 än de som har högre startrespons. 35
4. Slutsats och diskussion I den här studien har vi analyserat ett statistiskt datamaterial från 657 patienter som behandlas med två olika behandlingsmetoder mot depression, varav en aktiv och en placebo. Vi har i undersökningen definierat att responsvärde MBF 12 så att vid ett responsvärde lägre än 12 anses patienterna inte längre vara depressiva. Patienter med ett responsvärde större eller lika med 12 anses därmed fortsatt vara depressiva. Vi har applicerat olika statistiska metoder på datamaterialet från undersökningen, främst en så kallad summary statistics av upprepade mätningar, utan att ta hänsyn till MBF 12 och Överlevnadsanalys med passerandet av MBF 12 som den tidsavsedda förväntade händelsen. Upprepade mätning ger resultat att patienterna har olika spridningsmått på mätresultatet och att medelvärdet på lutningskoefficienten är större i aktivgruppen än i placebogruppen. Vid en jämförelse av den linjära- och den kvadratiska Mixed modellen konstateras att den kvadratiska mixed modellen passar bättre på data, då patienterna i de båda behandlingsgrupperna vid start av studien inte uppvisar någon signifikant skillnad. I överlevnadsanalysen konstateras om den definierade händelsen, att patienten passerar MBF 12, sker eller om denna är censurerad. Genom analysen konstateras att 367 patienter passerar MBF 12 och att detta sker i ett tidsintervall mellan time1 och time2. Vi är dock intresserade av en mer exakt tidpunkt för när patienterna passerar MBF 12, inom det framkomna tidsintervallet. Eftersom försöksuppläggningen inte medger den exakta tiden för denna händelse, undersöker vi några enkla alternativa metoder för att få en approximativ uppfattning om när den relevanta händelsen inträffar. Detta sker genom att först interpolera en rätt linje i intervallet som vi kallar för time3 och därefter beräkna skärningen av regressionslinjen i intervallet som kallas för time4. De skattade tidpunkterna time3 och time4 plus time2 används därefter i en icke-parametriska, parametriska och semiparametriska regressionsanalyser. Alternativ med intervallcensurering mellan time1 och time2 endast med parameterskattning har även tillämpats. I en icke-parameterskattning av lifetest procedur, med en så kallade Kaplan-Meier kurva, får vi fram överlevnadskurvor. Detta utan att ta hänsyn till vilken startrespons patienterna har. Med hjälp av Log-Rank test har vi kunnat konstatera att behandlingsmetoderna skiljer sig signifikant för de skattade tidpunkterna time2 time3 och time4. Överlevnadskurvorna för behandlingsgrupperna aktiv och placebo har samma struktur på tidpunkterna time2 time3 och time4. Genom att titta på medianen vid 50 % sannolikhet kan dock konstateras att tiden för tillfrisknade i tidpunkten time3 är kortare än i time2 och time4 för båda behandlingsmetoderna. En modell av en parameterskattning med fördelningarna exponential, Weibull logistik och lognormal på de skattade tidpunkterna time2 time3 och time4 har tillämpats. Detta med 36
förklaringsvariablerna grupp och start_response som i sin tur predikterar tillfrisknadstiden för en patient då denna passerar MBF12. Vid en jämförelse av parameterskattningar mellan tidskattningarna time2 time3 och time4 för variabeln grupp av aktiv skiljer sig dessa åt. Största parameterskattningen för alla fördelningar av variabeln grupp fås i time3. Fördelningarna lognormal och gamma ger nästan samma skattning i tidpunkten time2 och time4 medan time3 skiljer sig. Skillnaderna är dessutom stora. Detta innebär att behandlingsmetoderna ger kortare tillfrisknadstid vid time3 och att skillnaden mellan metoderna är större för denna tidpunkt jämfört med de andra skattade tidpunkterna. I en plot av en kumulativ fördelningsfunktion med endast med parameter Weibull framgår att båda behandlingsgrupperna, aktiv såväl som placebo, ger kortare tillfrisknadstid vid tidpunkten time3. En intervallskattning, endast med parameterskattning, har gjorts med de ovannämnda olika fördelningarna. En jämförelse mellan intervallskattningen och med de skattade tidpunkternas skattning av time2 time3 och time4, konstaterar vi att vi får lägre parameterskattning av intervallskattningen i alla fördelningarna. Från den Coxregressionen av semiparameterskattning med kovariaterna grupp och start_response, konstateras att både variablerna grupp och start_response ger stark signifikant skillnad vid alla tidpunkter. Medan skattningarna av tidpunkterna time2 och time4 är ungefär lika skiljer sig time3 åt med större skattningsvärde för aktiv gruppen. Vid en jämförelse av skattningar av överlevnadsfunktionen med olika startvärde av responsen framgår att patienter med lägre startresponsvärde tar kortare tid att nå en förbättringseffekt under MBF 12 och att de som har högre startresponsvärde tar längre tid att nå under MBF12. Detta medför att startresponsen påverkar kraftigt tillfrisknadstiden för patienter. En ytterligare sammanfattning av vårt resultat är att oavsett vilken av de skattade tidpunkterna som väljs, så finns det en stark statistisk signifikant skillnad mellan behandlingsgrupperna aktiv och placebo. Dessutom visar resultaten att behandlingseffekten på aktivgruppen är stark och att den sker i ett tidigare skede, oavsett vilken av metoderna att skatta tidpunkterna som väljs. Mätosäkerhet Enligt uppgifter från AstraZeneca vet vi att mätningarna har gjorts genom läkarsamtal med patienterna och med hjälp av ett frågebatteri. Patienternas depressionstillstånd baseras på patienternas svar samt läkarens bedömning och skattning av hur patienten mår enligt en 0-48 gradig skala. Att följa patienternas depressionstillstånd och utföra upprepade mätningar vid tätare och mer regelbundna tillfällen under undersökningsperioden skulle kosta både tid och pengar samt även vara praktiskt ogenomförbart. Därför har i denna undersökning mätningarna gjorts vid oregelbundna mättillfällen med varierande tidsintervaller. Detta innebär en s.k. diskreta mätning. Med en sådan mätmetod kan mätfel lätt uppstå. Mätmetoden medför dessutom betydande mätosäkerheter. Detta till följd av att patienten kan ha mått riktigt dåligt några dagar innan mötet med läkaren men när patienten är hos läkaren mår patienten bättre men mår sämre igen efter 37
besöket och mätningen eller omvänt. Patienten kan också ha påverkats negativt av medicinen genom de biverkningar som denna typ av mediciner oftast ger. Mätningen kan också ha påverkats av vilket humör patienten haft just den dagen då mätningen gjorts och detta på grund av andra faktorer än själva depressionen. Patienternas förmåga att kunna beskriva sitt tillstånd varierar också. Patientens tro på behandlingen kan dessutom ha rubbats till följd av medicinernas biverkningar eller att patienten har börjat tvivla på behandlingsresultatet. Det sanna mätvärdet kan därmed ha gått förlorat. Denna mätosäkerhet i data har inte tagits hänsyn till i studien. Ett fortsatt arbete med denna studie skulle därför kunna vara att analysera mätosäkerheten. 38
Referenser John P Klein & Melvin L. Moeschberger (2003): Survival Analysis,Statistics for Biology and Health. Springer. Garrett M. Fitzmaurice, Nan M. Laird & James H. Ware (2004): Applied Longitudinal Analysis. WILEY. Vårdguiden, http://www.vardguiden.se/article.asp?articleid=3409] Jack Shostak: SAS Programming in the Pharmaceutical Industry. SAS online documentation, (http://www.ats.ucla.edu/stat/sas/default.htm). SAS Textbook Examples Survival Analysis by John P. Klein and Melvin L. Moeschberger Chapter 12: Inference for Parametric Regression Models. SAS Textbook Examples Applied Survival Analysis by D. Hosmer and S. Lemeshow Chapter 8: Parametric Regression Models. 39