Magsteruppsats statstk En jämförelse mellan ndvders självuppskattade lvskvaltet och samhällets hälsopreferenser - en paneldatastude av hjärtpatenter Johan Lyth
Abstract Objectve: In recent years there has been an ncreasng nterest wthn the clncal (medcal) scence n measurng people s health. When estmatng qualty of lfe, present practse s to use the EQ-5D questonnare and an ndex whch weghs the dfferent questons. The queston s what happens f the ndvduals estmate there own health, would t dffer from the publc preferences? The am s to make a new predcton model based on the opnon of patents and compare t to the present model based on publc preferences. Method: A sample of 362 patents wth unstable coronary artery dsease from the Frsc II tral, valued ther qualty of lfe n the acute phase and after 3, 6 and 12 months. The EQ-5D queston form and also the Tme Trade-off method (TTO), a drect method of valung health was used. A regresson technque managng panel data had to be used n estmatng TTO by the EQ-5D and other varables lke gender and age. Result: Dfferent regresson technques vary n estmatng parameters and standard errors. A Generalzed Estmatng Equaton approach wth emprcal correlaton structure s the most sutable regresson technque for the data materal. A model based on the EQ-5D queston form and a contnuous age varable proves to be the best model for an ndex derved by ndvduals. The dfference between heart patents own opnon of health and the publc preferences dffers a great amount n the severe health condtons, but are rather small for healthy patents. Of the total 243 health condtons, only eght of the condtons were estmated hgher by the publc ndex. Conclusons: As the dfferences between the approaches are sgnfcantly large the choce of ndex could affect the decson makng n a health economc study.
Sammanfattnng Mål: Under senare td har ntresset för att mäta personers upplevda hälsa ökat kraftgt nom den klnska vetenskapen. Nuvarande praxs är att bestämma hälsorelaterad lvskvaltet för ndvder med hjälp av frågeformuläret EQ-5D och ett fördefnerat ndex med tllhörande vkter, skattat av samhället. Frågan är vad som händer om man låter ndvderna själva skatta sn hälsa, skljer den sg från samhällets uppfattnng? Syftet är att med hjälp av ett hjärtpatentmateral utföra en ny skattnngsmodell baserad på ndvders självupplevda hälsa och jämföra resultatet med tdgare skattnngsmodell baserad på samhällelga värderngar. Metod: Ett urval på 362 patenter med mndre hjärtnfarkt och kärlkramp från Frsc II studen fck fylla frågeformuläret EQ-5D samt skatta sn lvskvaltet drekt med Tme Trade-off (TTO) metoden vd akutfasen, samt vd 3,6 och 12 månaders uppföljnng. En regressonsteknk som klarar av paneldata användes för att skatta TTO med hjälp av EQ-5D samt eventuellt kön och ålder. Resultat: Olka regressonsteknker skljer sg åt vd skattnng av parametrar och medelfel. En Generalzed Estmatng Equatons metod med emprsk korrelatonsstruktur är den mest lämplga regressonsteknken för datamateralet. En modell med frågorna EQ-5D samt en kontnuerlg åldersvarabel vsar sg vara den bästa modellen för att skapa ett ndvduellt ndex. Av samtlga 243 hälsotllstånd skattas endast 8 tllstånd högre av det samhällelga ndexet än patentndexet. Skllnaden mellan hjärtpatenternas självuppfattade hälsa och samhällets uppfattnng skljer sg kraftgt för svåra hälsotllstånd men är ganska lten för relatvt frska patenter. Slutsatser: Då skllnaden är stor mellan synsätten kan valet av ndex påverka beslutsfattandet en hälsoekonomsk stude.
Förord Först vll jag tacka mn handledare, professor John Carstensen för all hjälp och stöttnng projektet. Vdare vll jag tacka doktorand Martn Henrksson på Centrum för utvärderng av medcnsk teknolog (CMT) för val av uppsatsämne, stor vsad entusasm och många ntressanta dskussoner. Ett stort tack vll jag även ge tll överläkare Magnus Janzon vd kardologsk avdelnng på Lnköpngs unverstetssjukhus samt CMT för datamateralet och för god pedagogsk förmåga nom hjärtsjukdomar. Ett tack rktas även tll övrga medarbetare på CMT för allmänt stort ntresse krng uppsatsen. Tll sst vll jag tacka mn opponent Luba Kulesh för mycket bra och krtsk gransknng av uppsatsen. Lnköpng, Jun 2006 Johan Lyth
Innehållsförtecknng 1 INLEDNING... 1 1.1 PROBLEMFORMULERING... 2 1.2 SYFTE... 3 1.3 UTGÅNGSPUNKT... 3 2 HUR MÄTS LIVSKVALITET... 4 2.1 KVALITETSJUSTERADE LEVNADSÅR (QALYS)... 4 2.2 MÄTINSTRUMENT FÖR LIVSKVALITET... 6 2.2.1 Drekta metoder... 7 2.2.2 Indrekta metoder... 10 3 TIDIGARE FORSKNING... 14 3.1 PREFERENSER HOS PATIENTER MED KLIMAKTERIEBESVÄR... 14 3.2 PREFERENSER HOS PATIENTER MED STROKE... 15 3.3 BEFOLKNINGSBASERAD UNDERSÖKNING MED INDIVIDUELLA PREFERENSER16 4 DATAMATERIAL OCH VARIABLER... 19 4.1 INTRODUKTION TILL FRISC II STUDIEN... 19 4.2 DATAMATERIAL... 19 4.2.1 Bortfall... 20 4.3 VARIABLER... 21 4.3.1 Responsvarabel... 22 4.3.2 Förklarngsvarabler... 23 5 METOD... 25 5.1 VAL AV METOD... 25 5.1.1 GEE-proceduren... 28 5.1.2 Utvärderngsmått för GEE... 32 6 RESULTAT... 34 6.1 JÄMFÖRELSE MELLAN OLIKA REGRESSIONSMETODER... 34 6.2 OLIKA MODELLER SKATTADE MED GEE-METODEN... 36 7 DISKUSSION... 40 7.1 RESULTATDISKUSSION... 40 7.2 METODDISKUSSION... 42 7.3 SLUTSATSER... 44 Blaga 1, Frågeformuläret EQ-5D Blaga 2, SAS-kod
1
1 Inlednng Under senare td har ntresset för att mäta personers upplevda hälsa ökat kraftgt nom den medcnska vetenskapen. Detta har vart särsklt tydlgt nom den klnska, patentnrktade forsknngen, men även när det gäller mätnng av hälsa befolknngen. Objektva mått såsom urnflöde och blodtryck beskrver patenters fysska egenskaper, men kan nte helt förklara hur personerna fråga uppfattar stuatonen de befnner sg. Därför har subjektva mått vuxt fram som komplement för att försöka fånga patenters lvskvaltet, som är det begrepp som oftast används. Lvskvaltet kan ha många defntoner, men begreppet hälsorelaterad lvskvaltet brukar användas då det handlar om lvskvaltetsförändrngar tll följd av en sjukdom eller annan funktonsnedsättnng. Det totala hälsoutfallet, tll exempel av en behandlng, blr således mer komplett då även bverknngar fångas samt förändrngar psykska och socala faktorer mäts (Henrksson och Carlsson, 2002). I hälsoekonomska analyser, då syftet många gånger är att bestämma den effektva fördelnngen av resurser samhället är det en fördel om samma mått används för att bestämma hälsorelaterad lvskvaltet. På så sätt underlättas jämförelser mellan behandlngar och patentgrupper. Det mått som regel används är kvaltetsjusterade levnadsår (QALYs), vlket är ett mått som kombnerar både lvslängd och lvskvaltet (Henrksson och Carlsson, 2002). För att kunna beräkna QALYs måste ndvdens lvskvaltet skattas och kombneras med uppskattad lvslängd. Det fnns en rad olka sätt att mäta lvskvaltet, allt från att ndvderna får fylla standardserade frågeformulär tll mer avancerade metoder där ämnet utbldad personal tllsammans med patenterna utvärderar det aktuella hälsotllståndet. 1
1.1 Problemformulerng En omdebatterad fråga dag nom hälsoekonomn är om det är patenternas eller samhällets preferenser som ska avgöra hur olka hälsotllstånd bör värderas. Vssa förespråkar att det är de ndvduella preferenserna som är vktgast då det stämmer bäst överens med välfärdsteorn som QALYs bygger på. Ett problem med att ta hänsyn tll ndvduella preferenser kan dock vara att personer med en vss sjukdom eller handkapp lär sg leva med tllståndet, copng eller det så kallade Happy slave argumentet. Andra förespråkar stället att det är samhällspreferenser som bör lgga tll grund för värderngen av patenters lvskvaltet. Detta kan motveras med att samhället och dess nvånare både är skattebetalare och potentella patenter och därmed är mest lämplga att bestämma hur samhällets resurser bör fördelas. Httlls har en stor del av forsknngen nrktats på att ta fram lvskvaltetsmodeller bestämda av samhället. Den metod, som är vanlgast förekommande dag för att bestämma hälsorelaterad lvskvaltet är skattad utfrån ett samhällsperspektv och presenterades av Paul Dolan 1997. Frågeformuläret som användes var EQ-5D, vlket består av fem stycken hälsorelaterade frågor med vardera tre svarsalternatv. Genom en multpel regresson med frågorna EQ-5D som förklarngsvarabler och Tme Trade-off (TTO) som responsvarabel, erhölls vkter för respektve tllstånd defnerat EQ-5D Lknande studer som den ovan beskrvna har gjorts med ndvduella preferenser. En stor stude där ndvder själva har fått bedöma sn hälsa gjordes av Burström med flera (2005), där resultatet ndkerade vssa skllnader mot de samhällelga preferenserna. Ett fåtal lknade studer har även gjorts med lknade metodk och för olka patentgrupper, men Gold m.fl. 2
(1996) menar att det behövs fler studer där förhållandet mellan samhällelga preferenser och patentpreferenser för olka hälsotllstånd och åkommor jämförs. Mellan jun 1996 och august 1998 gjordes en klnsk stude (Frsc II) av patenter med mndre hjärtnfarkter och kärlkramp. Ett urval, 362 patenter från Lnköpng, Västervk och Oskarshamn fck svara på frågorna EQ-5D samt besvara TTO vd fyra olka tllfällen. När uppföljnngar görs för varje ndvd vd olka tdpunkter, uppstår ett så kallat paneldataproblem. Observatonerna nom en ndvd är korrelerade med varandra och vanlg multpel regresson (OLS) blr otllräcklg. 1.2 Syfte Syftet med uppsatsen är att med hjälp av ett hjärtpatentmateral utföra en ny skattnngsmodell av EQ-5D baserad på ndvders självupplevda hälsa och jämföra resultatet med nuvarande skattnngsmodell baserad på samhällelga värderngar. Ett delproblem blr även att htta en bra regressonsmetod som klarar av paneldata. 1.3 Utgångspunkt Uppsatsens huvudfokus kommer att lgga på det beräknngsteknska och problematken krng datamateralet. Några vanlgt förekommande drekta och ndrekta metoder för att skatta hälsa kommer att presenteras, däremot ges nget utrymme åt att presentera de natonalekonomska teorer som lgger tll grund för lvskvaltetsproblematken. 3
2 Hur mäts lvskvaltet Vd analys klnska studer används ofta en metodk som kallas kostnadsnyttoanalys (CUA), vlken går ut på att jämföra behandlngar med hjälp av ett kostnadseffektmått. Vd tll exempel en klnsk stude där två patentgrupper får olka behandlng, är det ntressant att ta reda på skllnaden effekt mellan behandlngarna, men det kan även vara bra att se på kostnadsdfferensen. I en CUA bldas ett kostnadseffektmått bestående av skllnader kostnad dvderat med skllnader behandlngseffekt. Det vanlgaste sättet är att mäta behandlngseffekten QALYs, då defneras kvoten som kostnad per vunnen/förlorad QALY (Drummond m.fl., 1997). 2.1 Kvaltetsjusterade levnadsår (QALYs) Fördelen med QALYs är att både förväntad lvslängd och hälsorelaterad lvskvaltet ryms samma mått. Detta nnebär att måttet kan ta upp eventuella vnster både form av ökad lvslängd och förbättrad lvskvaltet. För att kunna mäta QALYs måste så kallade QALY-vkter användas för varje mättllfälle som utförts på ndvdernas lvskvaltet. QALY-vkterna är defnerade från 0 tll 1, där 1 står för full hälsa och 0 står för död. För att kunna omvandla ndvders lvskvaltet tll QALY-vkter bör den vara bestämd utfrån respondentens hälsopreferenser (Drummond m.fl., 1997). Vd jämförelse mellan två grupper beräknas skllnaden QALYs enklast genom att rta upp lvskvaltetsvkterna vd olka mätperoder för att sedan beräkna skllnad area mellan dessa. Den totala arean för en grupp beräknas med följande formel: QALYs = n j= 1 Q j t j (2.1) 4
I formel 2.1 står n för antalet ntervall tden är uppdelad, Q j står för genomsnttlg lvskvaltet vd peroden j och t j står för varaktgheten av det j:te ntervallet uttryckt bråkdelar av ett år (Manca m.fl., 2005). Nedan följer ett enkelt exempel för beräknng av QALYs för två behandlngar nom ramen för ett 15 månaders klnskt försök. Hälsorelaterad lvskvaltet har mätts vd fem olka tllfällen, strax efter behandlng samt vd 3, 6, 12 och 15 månader. Då patentgruppernas lvskvaltet är okänd mellan mättllfällena antas en lnjär förändrng. Arean för respektve behandlng beräknas med hjälp av ekvaton 2.1 QALYs QALYs Behandlng (0,6 + 0,7) 3 (0,7 + 0,75) 3 (0,75 + 0,8) 6 3 = + + + 0,8 2 12 2 12 2 12 12 Behandlng1 = (0,6 + 0,7) 3 3 (0,7 + 0,7) 6 (0,7 + 0,8) 3 = + 0,7 + + 2 12 12 2 12 2 12 2 = 0,88 0,93 1 QALYs Hälsorelaterad lvskvaltet 0,8 0,6 0,4 0,2 Behandlng 1 Behandlng 2 0 0 3 6 12 15 Td (månader) Fgur 2.1 Skllnaden kvaltetsjusterade levnadsår mellan två behandlngar 5
Fgur 2.1 vsar resultatet av beräknngen där det ljusa området nnefattas av både behandlng 1 och 2 och där det mörka utgör extra lvskvaltet förknppad med behandlng 1. Som synes har båda grupperna en genomsnttlg lvskvaltet på 0,6 vd tdpunkt 0 och 0,8 efter 15 månader. Båda behandlngarna ger således samma effekt på 15 månaders skt, dock har patenterna med behandlng 1 fått en behaglgare resa fram tll 15 månader. Skllnaden QALYs mellan behandlngarna, det mörka området fgur 2.1, uppgår tll 0,93-0,88=0,05 QALYs, vlket utgör lvskvaltetsvnsten förknppad med behandlng 1 jämfört med behandlng 2. Fördelen med att mäta kvaltetsjusterade levnadsår är att kvanttatva mått (levnadsår) och kvaltatva mått (Lvskvaltet) kan kombneras och olka behandlngar enklare kan jämföras. Dock fnns vss krtk mot metoden. Exempelvs om den ursprunglga lvskvalteten varerar kraftgt mellan grupper, kan resultatet QALYs mssgynna den grupp med lägst ursprungshälsa. En lösnng är att ge svårare hälsotllstånd en högre vkt som motsvarar samhällelga värderngar av patentgruppen. (Henrksson, 2002) Manca och medarbetare (2005) menar att problemet kan lösas med att en regressonsmodell med utgångspunkt från QALYs kan användas för att ge en rättvsare bedömnng. 2.2 Mätnstrument för lvskvaltet Mätnng av ndvders lvskvaltet kan hälsoekonomska sammanhang delas n två huvudkategorer, drekta och ndrekta metoder. Drekta metoder nnebär vanlgtvs att respondenterna väljer mellan olka teoretska alternatv gällande deras hälsa och utfrån det fastställs ndvdens önskade hälsa. Indrekta metoder nnebär att ndvden fyller ett frågeformulär med fördefnerade vkter (tarffer) för varje svarsalternatv. Det förekommer även frågeformulär som 6
saknar vkter och främst syftar tll att bestämma olka hälsoprofler. Enlgt fgur 2.2 kan ndrekta metoder delas n ytterlgare sjukdomsspecfka och ckesjukdomsspecfka nstrument (Henrksson och Carlsson, 2002). Metoder för mätnng av hälsorelaterad lvskvaltet Drekta metoder Indrekta metoder RS 1 SG 2 PTO 3 TTO 4 Icke-sjukdomsspecfka nstrument Sjukdomsspecfka nstrument Indexvärden Hälsoprofler 1 Ratng Scale 2 Standard Gamble 3 Person Trade-off 4 Tme Trade-off 5 Qualty of Well-Beng 6 Varant av SF-36 7 Health Utlty Index 8 Nottngham Health Profle 9 Sckness Impact Profle QWB 5 SF-6D 6 HUI 7 EQ-5D SF-36 NHP 8 SIP 9 Fgur 2.2 Olka alternatv för mätnng av hälsorelaterad lvskvaltet 2.2.1 Drekta metoder Nedan följer två vanlgt förekommande drekta metoderna, Ratng Scale och Tme Trade-off, som är relevanta för undersöknngen. Utöver dessa kan Standard Gamble och Person Trade-off metoden nämnas (Henrksson och Carlsson, 2002). 7
Ratng Scale Ratng Scale (RS) är det enklaste sättet att mäta ndvders hälsopreferenser då metoden nte nnefattar några valmöjlgheter för respondenten. Metoden nnebär att ndvden får markera på en skala hur hon värderar stt nuvarande hälsotllstånd. Utseendet på skalan kan skfta något, bland används ett nstrument med väldefnerade ändpunkter, men alternatv fnns med enbart en numrerad skala. Ett vanlgt förekommande nstrument är den vsuella analoga skalan (VAS), oftast to centmeter lång med tydlgt defnerade ändpunkter, se fgur 2.3. Skalan kan antngen vara numrerad eller nte, regel används ntervallet 0-100. Vanlgt är att ndvden markerar full hälsa respektve död på skalan, men en annan vanlg varant är att nedre ändpunkten motsvarar död och den övre full hälsa. För att kunna använda RS som QALY-vkter krävs att full hälsa respektve död är defnerade som 1 respektve 0. Om ndvden anser att hälsotllstånd värre än död (d) fnns, det vll säga d>0, eller att ndvden tycker att full hälsa (f) <100, transformeras ndvdens markerade hälsa (x) med formeln (x-d)/(f-d) (Drummond m.fl., 1997). Fördelen med RS är metodens relatva enkelhet och dess kostnadseffektvtet. En negatv aspekt med RS är att respondenten nte ställs nför någon teoretsk valstuaton, en så kallad trade-off. Det gör resultatet svårtolkat och de teoretska grunderna blr brstfällga, vlket gör omvandlng tll QALY-vkter något tveksamt. (Johannesson, 1996) Tdgare forsknng vsar även att skalan ofta blr skev då respondenten tenderar att undvka skalans ändpunkter. Det fnns dock studer som ndkerar att RS kan omvandlas tll Standard Gamble eller Tme Trade-off genom power-transformaton. (Drummond m.fl., 1997) 8
Fgur 2.3 exempel på den vsuella analoga skalan, hämtat från EQ-5D formuläret Tme Trade-off Tme Trade-off (TTO) metoden går ut på att respondenten utsätts för en valstuaton mellan två alternatv, se fgur 2.4. Det första alternatvet är att leva t år med nuvarande hälsotllstånd. Det andra alternatvet är att leva full hälsa x år. Antalet år (x) vareras tlls respondenten är ndfferent (lkgltg) mellan alternatven. Då respondenten är ndfferent, blr den förväntade nyttan samma för alternatven och ndvdens lvskvaltet h bestäms tll x/t. Ett exempel är att respondenten får reda på att den kommer att leva 10 år nuvarande hälsotllstånd. Om nu ndvden stället vll leva fem år med full hälsa, skattas hennes hälsovkt h tll 0,5 (5/10) (Johannesson, 1996). En fördel med TTO-metoden är att en trade-off görs mellan lvslängd och lvskvaltet, och att lvskvalteten är baserad utfrån ndvdens preferenser. En 9
nackdel med metoden är att valet ndvden gör är orealstskt, eftersom alternatven bygger på att man med säkerhet vet antalet levnadsår förknppade med vssa hälsotllstånd. (Johannesson, 1996) Problem med startng pont bas kan också förekomma, de fall ntervjuaren ger ett startvärde på antal år full hälsa, då valet av startvärde kan ha nverkan på det slutgltga resultatet. (Carlsson och Henrksson, 2002) Hälsonvå Full hälsa 1 Alternatv 2 Nuvarande hälsa h Alternatv 1 Död 0 Td X t Fgur 2.4 Trade-off mellan nuvarande hälsa t år och full hälsa x år 2.2.2 Indrekta metoder Det fnns en uppsjö frågeformulär som används för lvskvaltetsmätnng hälsoekonomska undersöknngar. Formulären kan främst delas n två kategorer, sjukdomsspecfka och cke-sjukdomsspecfka formulär. De ckesjukdomsspecfka är allmänt hållna och går att använda på alla populatoner, medan de sjukdomsspecfka nstrumenten används på en vss grupp och mäter förhållanden kopplade tll en vss sjukdom. De cke-sjukdomsspecfka delas n ndexvärden och hälsoprofler, där ndexvärden är frågeformulär med fördefnerade vkter (tarffer) kopplade tll varje svarsalternatv och hälsoprofler främst används för att se på förändrng av en eller flera dmensoner, men där ngen nbördes vägnng görs. De vanlgaste nstrument med ndexvärde är EQ-5D, Qualty of Well Beng (QWB), SF-6D och Health Utltes Index (HUI), medan de mest förekommande hälsoproflerna är SF-36, Nottngham Health Profle (NHP) och Sckness Impact Profle (SIP) (Henrksson och Carlsson, 2002). 10
Det nstrument som är mest ntressant för uppsatsen och därför kommer presenteras närmare är ndexnstrumentet EQ-5D. EuroQol och EQ-5D EuroQol-gruppen bldades 1987 genom att forskare från England, Fnland, Holland, Norge och Sverge slog sg samman, senare anslöt även Spanen och Tyskland. Målet var att skapa ett standardserat cke-sjukdomsspecfkt nstrument för att beskrva och värdera hälsorelaterad lvskvaltet. Formuläret skulle vara enkelt med förhoppnngen att därgenom underlätta jämförelser mellan olka sjukdomsgrupper och länder. 1990 publcerades det första nstrumentet, vlket bestod av sex dmensoner. Ett år senare togs en dmenson bort och det slutgltga nstrumentet EQ-5D tog form. De fem dmensonerna EQ-5D består av rörlghet, hygen, huvudsaklga aktvteter, smärtor/besvär och oro/nedstämdhet. Varje dmenson har tre nvåer: 1. Inga problem 2. Vssa problem 3. Svåra problem Sammanlagt fnns 3 5 =243 kombnatoner av hälsotllstånd att värdera. Utöver det nledande formuläret fnns ytterlgare två delar EQ-5D. Del två består av VAS-termometern och avslutande del består av ytterlgare åtta frågor rörande tdgare sjukdomshstora, ålder, kön, utbldnng, arbetsstuaton osv. Se blaga 1 för första delen av formuläret (EQ-5D User Gude, 1996). För att praktskt tllämpa nstrumentet krävdes en tarff för hälsotllstånden. För att koppla vkter tll olka hälsotllstånd behövdes ett stort datamateral, baserat på samhällets preferenser, därför gjordes en omfattande datansamlng 1993. Studen utfördes på vuxna cke-sjukhuslggande personer England, Skottland 11
och Wales. Ett slumpmässgt urval gav 6080 adresser, varav 5324 personer gck att kontakta. Av dessa gck 3395 personer med på en ntervju stt eget hem. Sammanlagt användes 92 tränade ntervjuare studen. Fullständga svar krävdes för att gå vdare tll analys, vlket nnefattade 2997 personer (Dolan, 1997). Syftet med studen var att med hjälp av TTO-mätnng ta fram samhällsbestämda ndexvärden för samtlga 243 hälsotllstånd. Då det skulle bl praktskt omöjlgt att få fram alla varanter av hälsotllstånd och dessutom få power beräknngarna, valdes stället ett fåtal hälsotllstånd för att sedan skatta resten utfrån en regressonsmodell. För att få tllräcklgt stor säkerhet skattnngarna valdes 42 tllstånd ut av de 243. Varje respondent svarade därefter för 12 slumpmässgt utvalda hälsotllstånd, samt värderade full hälsa ( 11111 ) och död. Respondenten fck veta att tllstånden gäller 10 år följt av död. Därefter väljer den ntervjuade hur många år (x) full hälsa som motsvarar 10 år nuvarande hälsotllstånd. För hälsotllstånd skattade bättre än död bestämdes TTO med x / 10 och för eventuella hälsotllstånd sämre än död med x /( 10 x). Sammanlagt uppgck antalet observatoner tll 12 2997 = 35964 (Dolan, 1997). En Generalzed Least-Squares (GLS) regressonsteknk användes med responsvarabeln 1-TTO och med de fem dmensonerna som förklarngsvarabler. Eftersom en generell samhällsbaserad tarff skulle konstrueras, var bakgrundsvarabler såsom kön, ålder och tdgare sjukdomserfarenhet nte ntressant. En Random Effects (RE) modell användes, eftersom om en respondent skattar ett tllstånd lägre/högre än genomsnttet, tenderar resterande tllstånd också skattas lägre/högre än genomsnttet. RE består därför av två komponenter, e t +µ, där e t står för den tradtonella feltermen för varje ndvd och µ står för hur stor del nterceptet för den :te respondenten skljer sg från totala nterceptet (Dolan, 1997). 12
Dolan kom så smånngom fram tll följande modell, eftersom den ansågs ha bra förklarngsgrad och var enkel att förstå. Y = 1 (0,081+ 0,069MO+ 0,176M 2 + 0,104SC + 0,006S 2 + 0,036UA+ 0,022U 2 + 0,123PD+ 0,140P2 + 0,071AD+ 0,094A2 + 0,269N 3) MO, 1 om rörlghet är nvå 2; 2 om nvå 3; 0 annars. M2, 1 om rörlghet är nvå 3; 0 annars. SC, 1 om hygen är nvå 2; 2 om nvå 3; 0 annars. S2, 1 om hygen är nvå 3; 0 annars. UA, 1 om vardaglga aktvteter är nvå 2; 2 om nvå 3; 0 annars. U2, 1 om vardaglga aktvteter är nvå 3; 0 annars. PD, 1 om smärtor/besvär är nvå 2; 2 om nvå 3; 0 annars. P2, 1 om smärtor/besvär är nvå 3; 0 annars. AD, 1 om oro/nedstämdhet är nvå 2; 2 om nvå 3; 0 annars. A2, 1 om oro/nedstämdhet är nvå 3; 0 annars. N3, 1 om någon dmenson är nvå 3; 0 annars Ett problem med modellen vd praktsk tllämpnng jämfört med teorn är att nterceptet (α) blr svårtytt. Enlgt teorn med QALYs ska 11111 värderas tll 1. I det här fallet blr 11111 =1-0,081=0,919. För att komma undan med problemet antar Dolan att α står för mnsta avsteg från full hälsa, det vll säga används endast vd tllstånd sklda från 11111 (Dolan, 1997). Tabell 2.1 Exempel på ndexberäknng Full hälsa 1 Konstant (Avvkelse från full hälsa) -0,081 Rörlghet (nvå 1) 0 Hygen (nvå 1) 0 Huvudsaklga aktvteter (nvå 3) -0,094 Smärtor/besvär (nvå 2) -0,123 Oro/nedstämdhet (nvå (2) -0,071 N3 (Åtmnstone en dmenson nvå 3) -0,269 Skattat värde för 11322 0,362 13
3 Tdgare forsknng I detta avsntt presenteras artklar som jämfört ndvduella och samhällelga preferenser med hjälp av TTO och EQ-5D eller VAS. 3.1 Preferenser hos patenter med klmakterebesvär Zethraeus och Johannesson (1999), jämförde Dolans modell med hjälp av patenter med klmakterebesvär (Menopausal symptoms). I undersöknngen deltog 104 kvnnor som behandlades på en klnk Södertälje under peroden februar - oktober 1995. Metod: Kvnnor mellan 45-60 år vlka behandlats med hormonbehandlng mnst en månad nkluderades studen. Kvnnorna delades därefter n grupperna mld eller svår, efter hur stora besvär de hade. Två olka TTO-frågor ställdes tll kvnnorna, en baserad på lvskvalteten nnan hormonbehandlngen och en baserad på nuvarande lvskvaltet med hormonbehandlng. Två sjuksköterskor utförde ntervjuerna och den första frågan var: Anta att du måste leva 30 år med de symptomen du hade nnan du startade hormonbehandlngen. Markera på skalan nedan hur många år full hälsa följt av död som är lkvärdgt med 30 år med dna symtom följt av död. Frågan upprepades sedan för nuvarande tllstånd med hormonbehandlng. I samband med frågorna användes EQ-5D både för tllståndet före och under hormonbehandlngen. Medelvärden för de två grupperna, mld och svår, beräknades både före och under hormonbehandlng och jämfördes med samhällelga vkter för att se skllnad behandlngseffekt mellan metoderna. Därefter sammanfördes 14
mätperoderna för TTO och medelvärden beräknades för varje hälsotllstånd, vlka sedan jämfördes med Dolans vkter. Resultat: Bland de 54 patenter med mlda besvär ökade lvskvalteten genomsntt med 0,18 enheter på en skala från 0 tll 1. Motsvarande öknng beräknat med samhällelga vkter var 0,20 enheter, vlket nte är en sgnfkant skllnad. Bland resterande 47 patenter med svåra besvär, ökade lvskvalteten med 0,42 enheter, med patent TTO och 0,57 enheter med samhällelga vkter. Detta nnebar att Dolans formel hade en sgnfkant högre förbättrng än patenternas TTO. Totalt fanns 16 olka hälsotllstånd, från 11111 tll 11233, hos patenterna om hälsotllståndet före och under hormonbehandlng räknas n. Sorterades hälsotllstånden efter samhällelga vkter, blev skllnaden mellan de åtta mest fördelaktga tllstånden obefntlg mellan patenternas TTO och de samhällelga vkterna. Däremot skljde sg sju av åtta av de svårare tllstånden kraftgt, med 0,52 enheter som mest. Resultatet vsar att patenterna vd de svårare tllstånden skatter sn lvskvaltet högre än det samhällelga ndexet. 3.2 Preferenser hos patenter med stroke Polsky med flera (2001) jämförde samhällelga preferenser mot ndvduella preferenser en klnsk undersöknng gällande en ny medcn för en vss typ av stroke. Datamateralet samlades n mellan 1992 och 1994 54 center USA och Kanada. Metod: 897 patenter blev randomserade tll en av tre behandlngsgrupper. Patenterna fyllde de fem dmensonerna och VAS, efter tre månaders uppföljnng. 649 15
patenter gck vdare tll analys, av resterande 248 patenter hade 134 avldt, 11 var nte tllgänglga och 103 valde att nte fylla formuläret. Multpel regresson användes för att skapa en predktonsmodell, med EQ-5D som förklarngsvarabler och VAS som beroende varabel. Värdena från predktonsmodellen jämfördes sedan med de samhällelga värdena från Dolans modell. Sgnfkanta skllnader testades med ett t-test för parade observatoner. Resultat: Interceptet modellen låg på 85,6 på en skala från 0 tll 100 då patenter fyllt 11111, men nte svarat motsvarande 1 på VAS. Rörlghet (-25,2) tätt följt av smärta/besvär (-23,5) var de dmensoner med störst parameterskattnngar vd nvå 3. Vardaglga aktvteter och Hygen hade lknande koeffcenter för motsvarande nvå, oro/nedstämdhet skljde sg från mängden med koeffcenten -2,6 vd nvå 3. Denna parameter är dock cke-sgnfkant och osäker då endast 15 patenter svarade 3 på nvån. 223 av de 243 hälsotllstånden skattade av patenterna var högre än Dolans motsvarande värden och av dessa var 95 % sgnfkant högre. Av de 20 resterande var 12 tllstånd bland de av Dolan 16 högst värderade tllstånden. 3.3 Befolknngsbaserad undersöknng med ndvduella preferenser Burström med flera (2006), jämförde Dolans modell mot ndvduella preferenser med hjälp av en hälsoundersöknng Stockholm. En enkät skckades 1998 ut tll 4950 personer mellan 20-88 år. I enkäten ngck frågorna EQ-5D, bakgrundsvarabler (ålder, kön mm), TTO och RS form av VAS. 16
Metod: TTO bestod av en horsontell lnje markerad med 0,1,2,...,10 år. Markerngar för varje halvår var även utsatta, men nte numrerade. TTO-frågan var enlgt följande: Föreställ dg att du har fått reda på att du har 10 år kvar att leva. I samband med detta får du reda på att du kan välja att leva 10 år dn nuvarande hälsa eller välja att ge upp några år för att leva en kortare perod full hälsa. Markera med ett kors på lnjen antalet år full hälsa du tycker är lkvärdgt med 10 år dn nuvarande hälsa. RS bestod av en VAS-skala markerad från 0 tll 100, där ändpunkterna motsvarar död respektve full hälsa. Indvderna fck därmed nte anta att det fanns hälsotllstånd sämre än död eller att full hälsa är sklt från 100, som är fallet tll exempel VAS EQ-5D. Partellt bortfall EQ-5D ersattes med 1:or och 21 TTO-observatoner med värdet 0 togs bort, på grund av mssuppfattnng av respondenten. Tll analysen användes de ndvder som svarade fullständgt på EQ-5D, TTO och VAS. En multpel regresson användes för att skatta parametrarna och tllhörande medelfel skattades med Whte s heteroscedastcty consstent covarance matrx, eftersom ndkatoner på cke-konstant varans fanns. Resultat: Totalt användes 2549 enkäter, vlket motsvarar 51,5 % svarsfrekvens. 70,7 % svarade 1 på TTO-frågan, motsvarande 20,1 % satte RS tll 1, 40,2 % hade RS>0,95 och 46,9 % svarade 11111 på EQ-5D. Totalt antal hälsotllstånd uppgck tll 66 stycken och medelvärdet för TTO (0,919) var sgnfkant högre än RS (0,853), motsvarande medel för Dolans ndex var 0,848. 17
Flera modeller presenterades, som nte tas upp här. Genomgående vsade sg ålderklasserna 70-79 år (b=-0,052) och 80-89 år (b=-0,184) ha sgnfkanta effekter. Könsvarabeln var även den sgnfkant (b=0,013;se(b)= 0,006), men N3-termen gav ngen sgnfkant effekt. Generellt sett var parameterskattnngarna för nvå 2 ungefär storlek med Dolans. Koeffcenterna för Nvå 3 var dock mycket mndre än de samhällsskattade, ett undantag är vardaglga aktvteter som var något högre (b=-0,100). Rörlghet (b=-0270) tätt följt av Oro/nedstämdhet (-0,174) hade störst nverkan på lvskvalteten enlgt modellerna. 18
4 Datamateral och varabler I detta kaptel beskrvs kortfattat den stude och tllhörande datamateral som nyttjas uppsatsen. Därefter görs en varabelbeskrvnng av både responsvarabeln och förklarngsvarablerna. 4.1 Introdukton tll Frsc II studen Studen som lgger tll grund för uppsatsen består av 3489 patenter drabbade av mndre hjärtnfarkt eller svår (nstabl) kärlkramp. Sjukdomen som benämns nstabl kranskärlssjukdom drabbar årlgen crka 20000 personer Sverge och är den vanlgaste orsaken tll hjärtntensvvård (Janzon, 2003). Frsc II som studen heter, nnefattar 58 sjukhus Sverge, Danmark och Norge och genomfördes mellan jun 1996 och august 1998. Kvnnor som passerat klmakteret samt män över 40 år (nlagda på sjukhus på grund av bröstsmärtor tll följd av begränsat blodflöde tll hjärtat) nkluderades studen. Patenterna randomserades tll en av fyra kategorer (Janzon, 2003): Operaton med läkemedelsbehandlng Operaton med placebo Icke-operaton med läkemedelsbehandlng Icke-operaton med placebo 4.2 Datamateral I Frsc II gjordes ett urval av patenter som vd fyra tdpunkter svarade på EQ- 5D, RS form av VAS och TTO. 362 patenterna från Lnköpng, Västervk och Oskarshamn fck fylla EQ-5D och VAS, samt ntervjuades angående TTO vd sammanlagt fyra tllfällen. Mättllfällen för samtlga nstrument ägde rum vd 1-19
3 dagar efter nläggnng, samt vd 3, 6 och 12 månaders uppföljnng. Den första ntervjun genomfördes nnan patenterna fck behandlng och ägde rum på sjukhuset. De två efterföljande mättllfällena gjordes va hembesök hos patenterna och det ssta mättllfället gjordes va telefon. TTO-frågan som användes är enlgt följande: Föreställ dg att du har 10 år kvar att leva med dn nuvarande hälsa. Om du stället kunde leva en kortare perod, men full hälsa, hur många år full hälsa är då lkvärdgt med 10 år dtt nuvarande hälsotllstånd? Respondenterna fck därefter markera stt svar på en horsontell skala mellan 0 och 10 år och svaret dvderades därefter med 10 för att få lvskvaltet på ntervallet 0-1. Specaltränade sjuksköterskor användes vd samtlga mätnngar av TTO. I tabell 4.1 följer en kort sammanfattnng av egenskaper hos urvalsgruppen vd sjukhusankomsten. Tabell 4.1 Studepopulatonens karaktärstka Varabel Kategor Procent Kön Man 69,0 Kvnna 31,0 Ålder <60 år 23,5 60-70 år 38,7 >70 år 37,8 4.2.1 Bortfall Av de möjlga 362 4 = 1448 observatonerna kan 1259 observatoner användas tll analys, då dessa omfattar både TTO och EQ-5D. Av bortfallet på totalt 189 observatoner beror 125 observatoner på att respondenten nte deltagt av okänd anlednng, 22 observatoner på att TTO nte gjorts, 29 observatoner på att totalt 9 ndvder avldt nom tdsntervallet för studen och 13 observatoner beror på partellt bortfall på EQ-5D. Det partella bortfallet är ganska jämt fördelat mellan frågorna med 2,0,3,5 och 3 saknade värden på dmenson 1-5. 20
För att fnna eventuella felaktga TTO-värden användes VAS som jämförelsenstrument. Dfferensen mellan TTO och VAS beräknades och medeldfferensen blev 0,07 med standardavvkelsen 0,16, se fgur 4.1. Värden som lgger 3 standardavvkelser från medelvärdet togs bort, vlket nnebär dfferenser mndre än -0,41 eller större än 0,55. 3 standardavvkelser valdes eftersom tllvägagångssättet nte är perfekt, och för att undvka att onödgt många observatoner tas bort. Totalt uteslöts 12 observatoner och kvar återstår 1247 observatoner, vlket nkluderar 323 patenter. 400 300 Antal 200 100 Medelvärde =0,07 Standardavvkelse =0,16 0-0,90-0,60-0,30 0,00 0,30 0,60 N =1 228 Fgur 4.1 Dfferens mellan TTO och VAS 4.3 Varabler Varabler som testas uppsatsen är frågorna EQ-5D form av dummys, samt bakgrundvarablerna kön och ålder. Stöd för att nkludera kön och ålder analysen ges av Burström med flera (2006), vlka funnt sgnfkanta effekter av varablerna. Andra sjukdomsspecfka varabler kommer nte testas då syftet 21
med uppsatsen främst är att skatta dmensonerna EQ-5D och jämföra dessa med vkterna Dolans samhällsreferensmodell. 4.3.1 Responsvarabel Som responsvarabel används TTO med ntervallet 0-1. Fgur 4.2 vsar att TTOvarabeln är skevt fördelad tll höger, Kolmogorov-Smrnov-test förkastade även normalfördelnngsantagandet (p<0,010). Det går att frågasätta om TTOvarabeln är kontnuerlg då ntervallet 0-1 används och då de allra flesta ndvder svarat jämna tondelar. Dock kommer TTO-varabeln ändå behandlas som kontnuerlg, eftersom en jämförelse med Dolans formel på så vs underlättas. Ett fåtal observatoner nnefattar värden mttemellan totalen, tll exempel 0,95. Av respondenterna skattar 80,3 % sn hälsorelaterade lvskvaltet tll 0,7 eller högre. 29,1 % av respondenterna vll nte byta bort några år, vlket motsvarar 1 på TTO-skalan. 400 300 Antal 200 100 Medelvärde =0,81 0 0,00 0,20 0,40 TTO 0,60 0,80 1,00 Standardavvkelse =0,19 N =1 247 Fgur 4.2 Fördelnng av TTO för samtlga observatoner. 22
Medelvärdet för TTO uppgår tll 0,81 nkluderat alla observatoner, se tabell 4.2. TTO-värdena ökar ganska kraftgt mellan första mättllfället och efter 3 månader, vlket trolgtvs beror på behandlngseffekter. Mellan andra och ssta mättllfället är TTO-värdena relatvt stabla med endast en margnell öknng vd ssta mättllfället. Vd ssta tdpunkten sjunker deltagandet med 16 ndvder, detta kan bero på att telefonntervju användes. Att ntervjumetod ändras kan ha vss nverkan på resultatet. Tabell 4.2 TTO-medelvärden för olka tdpunkter N Mnvärde Maxvärde Medel Standardavvkelse TTO, 1-3 dagar 323,10 1,00,76,21 TTO, 3 månader 320,10 1,00,82,18 TTO, 6 månader 311,30 1,00,82,18 TTO, 12 månader 293,20 1,00,84,16 Totalt 1247,10 1,00,81,19 4.3.2 Förklarngsvarabler För att få vkter för varje nvå och dmenson görs dmensonerna EQ-5D om tll dummyvarabler. Som tdgare nämnts kommer kategorvarabeln kön att ngå. Åldersvarabeln delas n tre kategorer, yngre än 60 år, mellan 60 och 70 år och över 70 år. Indelnngen kommer från Frsc II-materalet och verkar ändamålsenlg då grupperna blr ungefär lka stora, se tabell 4.1. Ålder kontnuerlg form testas även. Då det kan vara ntressant att kontrollera om en extra negatv effekt fnns av att nneha mnst en 3:a bland dmensonerna, kommer Dolans N3-term att testas. Eftersom patenterna första mättllfället nte har startat sn behandlng ännu skljer sg TTO mot resterande mättllfällen, se tabell 4.2, en dummyvarabel (td) kommer därför att skapas. Tdsvarabelns främsta syfte är nte att förklara behandlngseffekter, utan fnna eventuella 23
nteraktoner mellan dmenson och td. Samtlga dummyvarabler kommenteras tabell 4.3. Tabell 4.3 Dummy- och kategorvarabler EQ1_2 1 om rörlghet är 2; 0 annars. EQ1_3 1 om rörlghet är 3; 0 annars. EQ2_2 1 om hygen är 2; 0 annars. EQ2_3 1 om hygen är 3; 0 annars. EQ3_2 1 om vardaglga aktvteter är 2; 0 annars. EQ3_3 1 om vardaglga aktvteter är 3; 0 annars. EQ4_2 1 om smärtor/besvär är 2; 0 annars. EQ4_3 1 om smärtor/besvär är 3; 0 annars. EQ5_2 1 om oro/nedstämdhet är 2; 0 annars. EQ5_3 1 om oro/nedstämdhet är 3; 0 annars. N3 1 om någon dmenson är 3; 0 annars. Td 1 om mättllfälle 2,3 eller 4; 0 annars. Kön 1 om man; 0 om kvnna. Ålder 1 om ålder<60; 2 om 60<=ålder<=70; 3 om ålder<70. Tabell 4.4 vsar svarsfrekvensen för respektve fråga och nvå. Enlgt tabellen är hygen den dmenson som patenterna har mnst problem med, endast 6 ndvder (0,5 %) svarar en 3:a och 32 patenter (2,6 %) svarar en 2:a. Överlag fnns få treor, där vardaglga aktvteter står för högst andel med 78 stycken (6,2 %). Den enda fråga som har fler 2:or än ettor är smärtor/besvär. Tabell 4.4 Svarsfrekvens för varje dmenson och nvå (N=1247) Dmenson\Nvå 1 2 3 EQ1 (Rörlghet) 78,2% 21,4% 0,4% EQ2 (Hygen) 97,0% 2,6% 0,5% EQ3 (Vardaglga aktvteter) 74,0% 19,8% 6,2% EQ4 (Smärtor/besvär) 40,8% 55,7% 3,5% EQ5 (Oro/nedstämdhet) 63,7% 35,0% 1,4% 24
5 Metod Nedan förs en dskusson om problem med att observatoner är korrelerade nom ett vsst kluster, det här fallet ndvder, samt vlken typ av regressonsteknk som bör användas. Två alternatva metoder presenteras för att lösa problemet. 5.1 Val av metod Det fnns två sätt att hantera datamateralet. Antngen kan en regresson göras på en av tdpunkterna (tvärsnttsstude) eller nkludera samtlga observatoner (paneldatastude). Paneldatastuder kallas bland även för Repeated Measures. I paneldatastuder, kallas förklarngsvarabler som nte förändras över td för tdsstatonära varabler och de som förändras för tdsvarerande varabler. (Lpstz m.fl., 1994) Kön och ålder vd nkluson är typska tdsstatonära varabler medan EQ-5D är tdsvarerande varabler. Ett problem som uppstår vd dessa studer är att observatonerna för en och samma ndvd ofta är korrelerade. (Olsson, 2002) Eftersom regressonsanalys bygger på att observatoner är oberoende uppstår problem och det yttrar sg främst att medelfelen för parametrarna blr mndre än vad de borde vara, vlket kan leda tll att felaktga slutsatser dras, då p-värdena blr för små. (Krkwood och Sterne, 2003) Det fnns främst två regressonsteknker för att ta hänsyn tll korrelaton nom grupper eller ndvder, 1. Random Effects models (RE) och 2. Generalzed Estmatng Equatons approach (GEE), vlka här presenteras närmare (Krkwood m.fl., 2003). 1. Random Effects Models (RE) RE-modeller eller mxade modeller som de bland kallas, består av två delar, fxa varabler som väljs på förhand och slumpmässga effekter. RE-modeller kan 25
skattas med hjälp av proceduren Mxed SAS. (Olsson, 2002) En RE-modell med den kontnuerlga responsvarabeln y kan för varje ndvd skrvas enlgt ekvaton 5.1 nedan. y = X β + Z u + e (5.1) Där y är en n 1 responsvektor för ndvd, X är en n p matrs som nnehåller varabler med fxa effekter, exempelvs EQ-5D-frågorna, β är en p 1 parametervektor för de okända fxa effekterna, Z är en n q matrs med varabler för slumpmässga effekter, exempelvs ndvder, och µ är en q 1vektor med slumpmässga effekter. Vd normalfördelad data antas att u ~N(0,D) och resdualerna e är oberoende och normalfördelade. D är en kovaransmatrs med dmensonen q q. (Olsson, 2002) RE bygger oftast på Maxmum Lkelhood skattnngar (ML) och kräver att en korrekt kovaransmatrs defneras för slumpeffekterna för att få konsstenta skattnngar. (Scott m.fl., 1988) Det fnns alternatv tll ML form av Restrcted Maxmum Lkelhood (REML) och Mnmum Norm Quadratc Unbased Estmaton (MINQUE). REML är snarlk ML då det är en teratv metod och anses vara lte bättre vd små stckprov. MINQUE är tll skllnad från de andra ngen teratv metod och kräver nget fördelnngsantagande, dock är metoden begränsad valet av kovaransmatrs, exempelvs tdsberoende korrelaton kan nte antas. (Wu m.fl., 2001) 2. Generalzed Estmatng equaton regresson (GEE) GEE presenterades första gången av Lang och Zeger Bometrka (1986). GEE togs specellt fram för data där den beroende varabeln är bnär, eftersom nga sådana modeller fanns vd tdpunkten. GEE är specalserad på 26
paneldataproblem och fungerar även bra att använda på data med kontnuerlg responsvarabel (Armtage, m.fl., 2002). GEE kombnerar två tllvägagångssätt, Quas-lkelhood skattnng (QLS) och Robust Standard Error (RSE). QLS tar hänsyn tll de två första momenten; medelvärde och varans, och bygger nte som ML på sannolkhetsfördelnngen. I de fall responsvarabeln är normalfördelad blr dock parameterskattnngarna dentska med skattnngar från en RE-modell. Korrelatonen på ndvdnvå behandlas med hjälp av en Workng Correlaton Structure, då den faktska korrelatonsstrukturen ofta är okänd. Om fel korrelatonsstruktur väljs nnebär det ändå att parameterskattnngarna är korrekta (konsstenta) om stckprovet är tllräcklgt stort, men valet av struktur kan påverka skattnngarna och dess effektvtet (Krkwood m.fl., 2003). Vanlga medelfel även kallade modellbaserade, bygger på att en korrekt sannolkhetsfördelnng använts och skattas utfrån ML. RSE använder stället resdualerna för att skatta medelfelen och är därmed nte lka beroende av en korrekt sannolkhetsfördelnng. Om stckprovet är tllräcklgt stort kommer RSE att vara korrekta även om sannolkhetsfördelnngen på responsvarabeln är tveksam. (Krkwood m.fl., 2003) GEE är en vdareutvecklng av Generalzed Lnear Models (GLIM) som tll skllnad mot OLS kan anta andra fördelnngar än normalfördelnngsfallet. GLIM klarar av alla fördelnngar tllhörande exponentalfamljen, exempelvs kan responsvarabeln vara bnär eller possonfördelad. (Dunlop 1994) GEE klarar även av obalanserad data på grund av olka antal observatoner per ndvd, om observatonerna antas vara ett slumpmässgt bortfall. (Dunlop 1994) Om datan är obalanserad och bortfallet nte är slumpmässgt påverkas resultatet ändå nte nämnvärt, om antalet bortfallna värden är ltet förhållande tll hela 27
datamateralet (Armtage, 2002). För balanserad data med få observatoner per ndvd rekommenderas unstructured korrelatonsmatrs, för obalanserad data rekommenderas någon tdsberoende korrelaton, exempelvs M-beroende eller Autoregressv korrelaton. (Horton 1999) För att undersöka om parameterskattnngarna verkar rmlga körs modeller med olka korrelatonstrukturer. En OLS-skattnng och RE-modell kommer också att testas. Nedan följer en redogörelse för hur parametrarna skattas, vlka korrelatonsmatrser som kan användas, samt hur medelfelen skattas. Huvuddragen är hämtade från SAS-manualen (http://v8doc.sas.com) 5.1.1 GEE-proceduren Låt Yj, j = 1,..., n, = 1,..., K vara den j:te observatonen för ndvd. Då fnns n stycken mätnngar per ndvd och sammanlagt k = 1 Låt vektorn för mätnngarna på ndvd vara n mätnngar hela försöket. Y = Y,..., Y n ]' och med [ 1 motsvarande medelvärdesvektor µ = µ ]'. Låt V stå för [,..., µ n 1 kovaransmatrsen tll Y. Låt vektorn beståendes av förklarngsvarabler för den j:te mätnngen på ndvd vara X = x,..., x ]'. j [ j1 jp Ekvaton 5.2 nedan llustrerar den multvarata modell som skattar β- koeffcenterna. K µ ' 1 S( β ) = V ( Y µ ( β )) = 0 β = 1 (5.2) 28
Eftersom GEE är en vdareutvecklng av GLIM kan olka länkfunktoner g µ ) = η = x ' β väljas beroende på vlken fördelnng som Y antas följa. Där ( j j µ tll exempel η = µ normalfördelnngsfallet och η = ln( ) är en logt-länk, 1 µ vlken används vd logstsk regresson. (Olsson, 2002) Matrsen p n och har följande struktur: nedan består av samtlga partella dervator av funktonen ovan µ ' β x11 g' ( µ 1) = M x1p g' ( µ 1) L L xn 1 g' ( µ n ) M x n p g' ( µ n ) För att skatta kovaransen mellan olka ndvder och få fram V, måste en lämplg korrelatonsmatrs konstrueras. Denna korrelatonsmatrs brukar kallas för Workng Correlaton Matrx och benämns R (α ). Sambandet mellan kovaransmatrsen V och korrelatonsmatrsen R (α ) vsas ekvaton 5.3. V = φa R (5.3) 1/ 2 1/ 2 ( α) A Där A är en n n dagonal matrs bestående av samtlga varanser för Y. φ står för dsperson parameter, vlken justerar varansen modellen och fås genom formeln nedan ) φ = 1 K n N p = 1 j= 1 e 2 j där N står för det totala antalet mätnngar och p är antalet parametrar modellen. De standardserade 29
resdualerna bygger på Pearson resduals och beräknas enlgt följande: e j yj µ j =. (Lang m.fl., 1986; Olsson, 2002) v µ ) ( j Ibland är nte korrelatonsmatrsen R (α ) känd och måste skattas på lämplgt vs. Nedan följer några vanlgt förekommande matrser för att defnera korrelatonen mellan ndvderna. Fxed: Corr ( Y, Y ) = r. j k jk Används om korrelatonsstrukturen är känd och där användaren själv defnerar de olka korrelatonerna. Independent: 1 j = k Corr( Yj, Yk ) = 0 j k Korrelatonsmatrsen är oberoende, vlket motsvarar GLIM. m-dependent: 1 t = 0 Corr( Yj, Yk ) = α t t = 1,2,..., m 0 t > m Här beror korrelatonen på avståndet mellan observatoner, där m är satt tll ett vsst tdsavstånd där korrelatonen antas vara obefntlg efteråt. Korrelatonen vd tdsavståndet 0 är 1 och korrelatonen fram tll tdpunkten m skattas med följande formel: ) K K α t = (( ( n t)) p) φ eje, j+ t. = 1 = 1 j n t 1 30
Exchangeable: Corr( Y, Y j k 1 ) = α j = k j k Här antas att alla korrelatoner är lka stora, oberoende av tdsavståndet. Den gemensamma korrelatonen fås enlgt följande. α ) K = (( n ( n 1)) p) φ = 1 1 K = 1 j k e j e k Unstructured: 1 j = k Corr( Yj, Yk ) = α jk j k Här beräknas samtlga korrelatoner mellan ndvder och tdpunkter. k ( k 1) Sammanlagt skattas korrelatoner. Följande formel används: 2 α ) jk = K 1 [( K p) φ] = 1 e j e k Autoregressve AR(1): t Corr( Yj, Y, j+ t ) = α for t = 0,1,2,..., n j Här antas att korrelatonen avtar ju längre tdpunkten är mellan observatonerna. Korrelatonen vd tdsavståndet 0 är 1 och korrelatonen vd tdsavståndet 1 fås genom formeln: ) α K = (( ( n 1)) p) φ = 1 1 K j = 1 j n 1 e e, j+ 1 Exempel på en teratv process: 1. Först beräknas en ursprunglg β genom att använda tll exempel OLSskattnngar. 31
32 2. Sedan beräknas R baserad på de standardserade resdualerna, rådande β och den valda strukturen på R. 3. Kovaransmatrsen V beräknas. 4. Koeffcenterna uppdateras nu med hjälp av formeln nedan: + = = = + ) ( ' ' 1 1 1 1 1 1 K K r r µ Y V β µ β µ V β µ β β 5. Steg 2-4 upprepas tlls modellen konvergerar. Beräknng av parametrarnas medelfel: Robust Standard Error eller Sandwch estmator kan sedan skattas med formel 5.4 nedan. 1 0 1 1 0 = Ι Ι Ι Σ e (5.4) Där β µ V β µ Ι = = K 1 1 0 ' är den modellbaserade kovaransestmatorn tll β och β µ V Y V β µ Ι = = K Cov 1 1 1 1 ) ( ', där ))' ˆ ( ˆ))( ( ( ) ( β β Cov µ Y µ Y Y = 5.1.2 Utvärderngsmått för GEE GEE bygger som bekant på QLS vlket betyder att de vanlga utvärderngsmåtten GLIM, Akakes Informaton Crteron (AIC) och loglkelhood test (-2LL) nte fnns tllgänglga (Olsson, 2002). Det är därmed svårare att ta beslut om vlken modell som ska föredras vd en utvärderng. I
GEE fnns en varant av Log Lkelhood, vars värde stger vd en bättre modell, dock går nte att mäta om en modell är sgnfkant bättre då dfferensen nte följer en χ 2 -fördelnng. Den varant som stället är att föredra är Generalzed Score statstcs, vlken är en varant på eller type3-test, som kontrollerar effekten av nynsatta varabler modellen. En nackdel med GEE är att det nte fnns någon form av stegvs väljfunkton vlket gör att modeller måste testas manuellt. 33
6 Resultat 6.1 Jämförelse mellan olka regressonsmetoder Nedan tabell 6.1 följer en presentaton av parameterskattnngarna för den enklaste regressonsmodellen bestående av dmensonerna EQ-5D. Tre olka korrelatonsstrukturer för GEE, en Mxad metod samt OLS fnns representerade. Intercepten skljer sg nte nämnvärt och samtlga koeffcenter är negatva. Parameterskattnngarna skljer sg nte dramatskt åt mellan metoderna, men dfferenser fnns. GEE med konstant korrelaton (Exchangeable) har dentska skattnngar med OLS. GEE med emprsk korrelaton (Unstructured) och GEE med autoregressv korrelaton (Ar1) och den mxade metoden överensstämmer ganska väl förutom på hygenvarabeln. De flesta dmensonerna har låga p- värden för samtlga nvåer, dock blr nte Hygen sgnfkant för någon nvå eller metod. Rörlghet blr klart sgnfkant för nvå 2, men nvå 3 skljer sg åt mellan metoderna, där effekt går att påvsa för de tre ssta metoderna, men nte för de två första. Tabell 6.1 Parameterskattnngar för 5 olka metoder. Varabel GEE (Un) GEE(Ar1) GEE (Exch) Mxed (Un) OLS Intercept 0,901* 0,907* 0,908* 0,905* 0,908* Rörlghet, nvå 2-0,073* -0,076* -0,088* -0,070* -0,088* Rörlghet, nvå 3-0,187-0,184-0,184*** -0,188*** -0,184*** Hygen, nvå 2-0,021-0,016 0,006-0,022 0,006 Hygen, nvå 3-0,079-0,048-0,073-0,087-0,073 Vardaglga aktvteter, nvå 2-0,076* -0,078* -0,088* -0,076* -0,088* Vardaglga aktvteter, nvå 3-0,133* -0,136* -0,151* -0,136* -0,151* Smärtor/besvär, nvå 2-0,052* -0,051* -0,051* -0,051* -0,051* Smärtor/besvär, nvå 3-0,147* -0,148* -0,142* -0,147* -0,142* Oro/nedstämdhet, nvå 2-0,058* -0,063* -0,061* -0,062* -0,061* Oro/nedstämdhet, nvå 3-0,112** -0,124** -0,096*** -0,107** -0,096*** *p-värde <0,0001,** p-värde <0,01, *** p-värde <0,05 34
Den emprska korrelatonen för GEE (Unstructured) uppgår som högst tll 0,40 mellan tdpunkt 2 och 3 och som lägst tll 0,19 mellan tdpunkt 0 och 3. Korrelatonen tenderar att avta med avståndet td, se tabell 6.2 nedan. Tabell 6.2 Workng Correlaton Matrx för GEE(Unstructured) Td0 Td1 Td2 Td3 Td0 1.00 0.32 0.31 0.19 Td1 0.32 1.00 0.30 0.24 Td2 0.31 0.30 1.00 0.40 Td3 0.19 0.24 0.40 1.00 Enlgt tabell 6.3, är medelfelen för parametrarna vd OLS och GEE (Exchangeable) förhållandevs lka och lgger övervägande lägre än både GEE (Unstructured) och GEE (Ar1). Medelfelen för den mxade modellen lgger tll och med lägre än OLS vd några tllfällen. De högre parameterskattnngarna samt lägre medelfel gör att Rörlghet på nvå 3 blr sgnfkant på 5 % nvån, med OLS (p=0,0170) och GEE (Exchangeable) (p=0,0164) och Mxad modell (0,0176), medan den blr cke-sgnfkant för GEE (Unstructured) (p=0,0871) och GEE (Ar1) (p=0,0824). Tabell 6.3 Parameterskattnngarnas medelfel för 5 olka metoder. Varabel GEE (Un) GEE (AR1) GEE(Exch) Mxed (Un) OLS Intercept 0,0076 0,0076 0,0070 0,0082 0,0071 Rörlghet, nvå 2 0,0142 0,0147 0,0123 0,0122 0,0124 Rörlghet, nvå 3 0,1094 0,1061 0,0767 0,0788 0,0770 Hygen, nvå 2 0,0330 0,0326 0,0289 0,0272 0,0291 Hygen, nvå 3 0,0773 0,0716 0,0676 0,0600 0,0679 Vardaglga aktvteter, nvå 2 0,0139 0,0147 0,0127 0,0121 0,0127 Vardaglga aktvteter, nvå 3 0,0247 0,0249 0,0201 0,0191 0,0202 Smärtor/besvär, nvå 2 0,0106 0,0108 0,0099 0,0097 0,0100 Smärtor/besvär, nvå 3 0,0259 0,0260 0,0262 0,0260 0,0263 Oro/nedstämdhet, nvå 2 0,0116 0,0124 0,0098 0,0098 0,0099 Oro/nedstämdhet, nvå 3 0,0365 0,0389 0,0383 0,0353 0,0385 35