Prediktion av vårdrelaterade sjukdomar i Västerbotten Författare: Peter Fjällström Handledare: Patrik Rydén Student Institutionen för matematik och matematisk statistik Ht 2017 Examensarbete, 30 hp
Sammanfattning Vårdrelaterade infektioner, VRI, är ett av de största hoten mot patientsäkerheten i hälso- och sjukvården. Inte bara i Sverige utan också i resten av världen. I den här uppsatsen så har vi analyserat data från punktprevalensmätningar för VRI, PPM- VRI, som utförts i Västerbotten mellan åren 2008-2015. Utifrån det givna datat har vi skapat modeller med både logistisk regression, LR, och linjär diskriminant analys, LDA. Vi jämför sedan de två metodernas förmåga att prediktera VRI med avseende på specificitet, enskilda modeller konstruerades både för hela Västerbotten men också för enskilda sjukhus och avdelningar. Vidare så undersöker vi om information kring patienters komorbiditet, alltså förekomsten av andra sjukdomar förutom den primära, kan öka metodernas prestanda. Av våra två metoder var det LR som presterade bäst med en specificitet på 32.79 % och LDA hade en specificitet på 31.20 %. För båda metoderna så visade det sig att modellen för Västerbotten presterade bättre än modellerna för enskilda avdelningar och sjukhus. Vi kom också fram till att information om patienters komorbiditet kan hjälpa till att öka specificiteten, men vi hade för få observationer (90 st med VRI och 90 st utan VRI) för att kunna ge ett definitivt svar. En överlevnadsanalys utfördes för att bekräfta tidigare resultat om att VRI-patienter har en signifikant högre 90-dagars dödlighet, vårt resultat stämde väl överens med tidigare studier. Sammanfattningsvis visade vi på att statistiska metoder kan användas för att prediktera och analysera vilka patienter som ligger i riskzonen för att drabbas av VRI, samt att det skulle behövas ytterligare studier för att undersöka huruvida information om patienters komorbiditet skulle kunna hjälpa oss att ytterligare förbättra den prediktiva förmågan hos dessa metoder. Abstract In this paper we have analysed data from point prevalence surveys for HCAI, PPS-HCAI, in Västerbotten county between year 2008 and 2015. We have created models with both logistic regression, LR, and Linear discriminant analysis, LDA on this data. We then compared the two methods predictive abilities with regards to specificity. We also collected data about some patients comorbidity, the presence of one or more additional diseases or disorders co-occurring with a primary disease, and tested to see if this additional information could increase the predictive ability in our models. Between our two methods LR had the highest specificity with 32.79 %, the specificity of LDA were 31.20 %. In both cases the model for Västerbotten performed better than individual models for hospitals and departments. We also saw indications that information about patients comorbidity may help with model performance, although we had too few observations (90 patients with HCAI and 90 without) to be able to give a definite answer to this question. Our survival analysis confirmed the result of previous studies: That patients with HCAI have a significantly higher 90-day mortality rate than patients without. We conclude that statistical model can be used to predict and analyse what patients that likely to develop HCAI, and that further studies are needed to investigate whether information about a patients comorbidity could help improve model performance. 1
Popular science summary Healthcare-associated infections, HCAIs, can develop in patients either as a direct result of medical or surgical treatment, or from being in contact with a healthcare setting. In Sweden roughly 9 percent of the patients develops HCAI and the estimated cost for this is 6.5 billion SEK per year, previous studies have estimated that this number can be reduced up to 30 percent. In this paper we have tested and shown that statistical methods can be used to identify patients that are likely to develop HCAI, these methods can then be used to help the healthcare reduce HCAI among patients. 2
Innehåll 1 Introduktion 5 1.1 Bakgrund.......................................... 5 1.2 Frågeställning........................................ 5 1.3 Omfattning och begränsning................................ 5 1.4 Motivering.......................................... 6 2 Data 6 2.1 Komorbiditetsdata..................................... 6 2.2 Överlevnadsanalysdata................................... 6 2.3 Beskrivning av data.................................... 7 2.4 Konstruerade variabler................................... 8 2.5 Bortfall........................................... 8 3 Metod 8 3.1 Logistisk regression..................................... 8 3.1.1 Modell för Västerbotten.............................. 9 3.1.2 Modeller för respektive avdelning och sjukhus.................. 10 3.2 LDA............................................. 10 3.3 Prediktion och modellutvärdering............................. 10 3.4 Komorbiditet........................................ 11 3.5 Överlevnadsanalys..................................... 11 4 Resultat 11 4.1 Prevalens av VRI...................................... 12 4.2 Jämförelse av LR och LDA................................ 14 4.3 Modeller för Västerbotten och enskilda sjukhus..................... 15 4.4 Modeller för respektive avdelning på NUS........................ 16 4.5 Modeller för respektive avdelning på Skellefteå sjukhus................. 18 4.6 Modeller för respektive avdelning på Lycksele sjukhus................. 18 4.7 Modellprestanda...................................... 19 4.8 Komorbiditet........................................ 21 4.9 Överlevnadsanalys..................................... 21 5 Diskussion 23 Referenser 25 Appendix A Metod 27 A.1 Logistisk regression..................................... 27 A.1.1 Oddskvoter..................................... 27 A.2 Linjär diskriminantanalys................................. 28 A.3 χ 2 test........................................... 29 A.4 Överlevnadsanalys..................................... 29 A.4.1 Kaplan-Meier kurvor................................ 31 A.5 Korsvalidering........................................ 32 A.6 Specificitet & Sensitivitet................................. 33 A.7 Backward stepwise selection................................ 33 3
Appendix B Data 34 B.1 Sjukdomstillstånd...................................... 34 B.2 Variabelnamn........................................ 35 4
1 Introduktion 1.1 Bakgrund Vårdrelaterade infektioner, VRI, är ett av de största hoten mot patientsäkerheten i hälso- och sjukvården. Under de senaste åren så har prevalensen (Antalet sjuka i en viss sjukdom inom en viss population vid en given tidpunkt) av VRI legat på ungefär nio procent i Sverige. VRI innebär inte bara ett stort lidande för patienten utan leder också till höga kostnader för landstingen. Uppskattningsvis så orsakar VRI ungefär 750 000 extra vårddagar till en kostnad av ca 6,5 miljarder kronor årligen [1]. Nu är det inte möjligt att förebygga och undvika alla uppkomster av VRI, men studier visar att minst 20 till 30 procent borde kunna förebyggas [2]. Om antalet VRI i Sverige kunde minskas med 20 procent skulle det innebära en minskning med 150 000 vårddygn eller drygt 410 vårdplatser, det motsvarar en kostnad på 1,3 miljarder kronor årligen. I en granskningen som Sveriges kommuner och landsting (SKL) genomförde så stod VRI för 33.7 procent av vårdskadorna [1]. Därför har landstingen ett stort fokus på förbättringsarbetet kring VRI. En del i det här förbättringsarbetet är att år 2008 så gjordes en nationell satsning på patientsäkerhet, som en viktig del i denna infördes punktprevalensmätningar för VRI (PPM-VRI) två gånger per år för alla landsting. Dessa mätningar visar på att det finns vissa riskfaktorer för VRI, samt att vissa sjukhus och landsting har en lägre prevalens av VRI än andra. SKL har utifrån den informationen infört ett evidensbaserade åtgärdsprogram som har bidragit till en minskad förekomst av VRI i Sverige [1]. Det är inte bara i Sverige som VRI är ett problem, många länder har infört sin egen motsvarighet av PPM-VRI och åtgärdsprogram. I USA så införde Center for desiese control (CDC) ett trestegsprogram år 2009 som inkluderade prevalensmätningar och åtgärdsprogram. Mellan år 2008-2014 så minskade vissa typer av VRI, såsom blodförgiftning, med så mycket som upp till 70 % efter införandet av deras åtgärdsprogram [3]. I Europa så har vi European Centre for Disease Control (ECDC) som bildades 2005 och har sitt säte i Stockholm. ECDC jobbar för att förebygga och förmedla information kring VRI till länder i Europa. Varje land har dessutom sina egna institutioner som jobbar nationellt med förebyggande och kartläggning av VRI. 1.2 Frågeställning Vi kommer undersöka huruvida statistiska metoder kan användas för att prediktera vilka patienter i Västerbotten som ligger i riskzonen för att ådra sig VRI, samt presentera en nulägesanalys som med hjälp av oddskvoter beskriver hur olika riskfaktorer, sjukhus och avdelningar skiljer sig från varandra. Dessutom kommer vi undersöka ifall information om en patients komorbiditet, alltså närvaron av en eller flera sjukdomar eller diagnoser förutom en primär diagnos, kan hjälpa till att öka prestandan på våra modeller vid prediktion av VRI. Slutligen kommer vi försöka bekräfta tidigare resultat att VRI allvarligt påverkar dödligheten för patienten [4], samt jämföra dödligheten mellan de olika typerna av VRI 1.3 Omfattning och begränsning I den här studien så kommer vi att analysera data från PPM-VRI gjorda i Västerbotten mellan åren 2008-2015, vi begränsar oss till patienter i den somatiska vården. Vi har också infört en begränsning att inte konstruera modeller för avdelningar med färre än 20 st VRI-patienter eftersom vi då riskerar att få resultat som är beroende av ett fåtal observationer. Det här gäller både för fallet då vi jämför prestandan på våra metoder och då vi beräknar oddskvoter för riskfaktorer på enskilda avdelningar. 5
1.4 Motivering Den här frågeställningen kommer från Norrlands universitetssjukhus, NUS, och tar vid efter en pilotstudie [5]. Eftersom vi är intresserade av oddskvoter för riskfaktorer, avdelningar och sjukhus så känns logistisk regression, LR, med logitlänk som ett naturligt val av modell. Därför att vi enkelt kan beräkna oddskvoter utifrån koefficienterna i en sådan LR-modell. Man hade kunnat tänka sig en annan länkfunktion så som probit, men då hade vi inte kunnat tolka de predikterade koefficienterna på ett lika enkelt sätt. NUS hade även önskemål för hur vår referenspatient i LR-modellen skulle se ut och uppdraget innebar också att vi skulle jämföra prestandan i LR mot linjär diskriminantanalys, LDA. För att undersöka dödligheten hos patienter med VRI så utför vi en överlevnadsanalys, som är en vanlig metod för att modellera risk och tid till någon given händelse. 2 Data I denna del beskrivs hur datamaterialet har samlats in och bearbetats. Variablerna kommer också presenteras och beskrivas. All statistisk analys och databearbetning har gjorts i programmet R, [6]. Datamaterialet består av 22 st punktprevalensmätningar för VRI (PPM-VRI) på de tre sjukhusen i Västerbotten (Umeå, Skellefteå och Lycksele) under perioden januari 2008 - december 2015. Varje PPM-VRI utförs under en dag då alla patienter inskrivna på en avdelning kl 08:00 registreras och i Västerbotten utförs den här mätningen samma dag på alla tre sjukhus. Dessa PPM-VRI utförs två eller fyra gånger årligen. Totalt har data för 17 392 patienter samlats in, på grund av att data för patienter inlagda på psykiatriska avdelningar bara registrerats vid 12 av de 22 mättillfällena så exkluderas dessa patienter (totalt 1 055 patienter). Även patienter inlagda på sjukstugorna i Malå, Dorotea och Vilhelmina exkluderades då antalet patienter i denna grupp inte var tillräckligt stor (totalt 28 st). Totalt kvarstod då 16 309 patienter, 1 635 st med VRI och 14 674 st icke-vri. Vid en PPM-VRI utgår man från patientjournalen och dokumenterar varje patients alla riskfaktorer, Tabell 1, och huruvida VRI föreligger eller ej. Som definition på VRI används socialstyrelsens definition från 1979: Varje infektionstillstånd som drabbar patienter till följd av sjukhusvistelse eller behandling i öppen vård, oavsett om det sjukdomsframkallande ämnet tillförts i samband med vården eller härrör från patienten själv, samt oavsett om infektionstillståndet yppas under eller efter vården. Med vårdrelaterad infektion avses även infektionstillstånd som personal ådragit sig till följd av arbetet. Som komplettering till datat i PPM-VRI har vi också utifrån patientjournaler registrerat vilken slutenvårdsavdelning, diagnosgrupp (vilken kroppsdel som drabbats av VRI), kön, ålder och vid vilket av de tre sjukhusen som patienten låg inlagd på. 2.1 Komorbiditetsdata I sjukjournalen så finns patientens alla sjukdomar klassificerade och dokumenterade enligt International Classification of Diseases (ICD-10) [7]. För alla patienter med VRI som låg inlagda på urologen eller någon av de kirurgiska avdelningarna under perioden 2012-2015, totalt 90 st, så registrerades patientens alla ICD-10 koder från datumet för mätningen och exakt tre år bakåt. ICD-10 koder registrerades också för 90 kontroller, stratifierade så att varje VRI-patient hade en matchande kontroll med avseende på mättillfälle och avdelning. 2.2 Överlevnadsanalysdata För alla patienter med VRI vid någon av mätningarna 2013-2015 (649 st), så registrerades även huruvida patienterna var avlidna eller ej 90 dagar efter PPM-VRI, i de fall patienten var avliden så dokumenterades dödsdatum. Utöver patienterna med VRI så dokumenterades samma information 6
för 262 kontroller, antalet kontroller vid varje PPM-VRI kontrollerades så att proportionen för dessa motsvarade proportionen för VRI-patienter vid varje PPM-VRI. När det gäller dokumentationen av dödsdatum så har vi bara information om de patienter som är svenska medborgare. Så i de fall någon patient bytt nationalitet har vi ingen information om detta och vi missar ett eventuellt dödsdatum. 2.3 Beskrivning av data I Tabell 1 så kan vi se en beskrivning av de riskfaktorer som dokumenterats för varje patient, varje riskfaktor kan anta två nivåer: Ja/Nej. Utöver dessa riskfaktorer och VRI-status så dokumenterades även; slutenvårdsavdelning (39 nivåer för Umeå sjukhus, 11 nivåer för Skellefteå sjukhus och 5 nivåer för Lycksele sjukhus), diagnosgrupp (18 nivåer som identifierar vilken kroppsdel som VRI har drabbat), kön (två nivåer, man/kvinna), ålder (diskret, 0-106 år) och sjukhus (tre nivåer, Umeå/Skellefteå/Lycksele). Vid analysen av komorbiditet så används ICD-10 koder, en beskrivning av ICD-10 är följande ICD-10 är det internationella klassificeringssystemet som klassificerar och statistiskt beskriver sjukdomar och andra hälsoproblem (International statistical Classification of Diseases and related health problems), siffran 10 visar upplageversionen. Det är Världshälsoorganisationen WHO som äger rättigheterna till ICD-10 [7]. I patientjournalerna så antar ICD-10 koderna formen X00.00, X är en bokstav och 0 representerar siffror. Varje kod motsvarar då ett sjukdomstillstånd, vi har använt oss av R för att koda om från ICD-10 koder till de sjukdomstillstånd som dessa motsvarar, det är dessa sjukdomstillstånd som vi använder oss av i analysen (17 nivåer, se Tabell B1 i appendix för en komplett lista på sjukdomstillstånd). Tabell 1: Riskfaktorer CVK etc. Aktuellt kirurgiskt ingrepp KAD etc. Mekanisk ventilation Immunsuppression Antibiotika Alla centrala infarter såsom CVK, subkutan venport, perifert inlagd central kateter (PICC-line, Silastic), pulmonalisartär kateter, nyfödda barn navelven- och navelartärkateter, dialyskateter - även för peritonealdialys. Som riskfaktor räknas ingrepp som redan genomförts under aktuellt vårdtillfälle. Här ingår ingrepp som kräver incision genom hud eller slemhinna, men inte px, punktion eller endoskopi med px. Alla urinavledningar såsom KAD, suprapubisk kateter, pyelostomikateter, uretärkateter etc. Endotracheal intubering och tracheostomi med eller utan respiratorbehandling, dock inte CPAP eller liknande. Behandling och kvarstående effekt av cytostatika eller immunhämmare (cyklosporin, monoklonala ak och TNFαhämmare), kortisonbehandling 1 mån motsvarande prednisolon 15 mg/d. Barn motsvarande prednisolon 0,25 mg/kg alt 15 mg/d, beh tid >1 mån. All pågående behandling mot bakterier och svamp, inkl given och planerad profylax det aktuella dygnet (00-24). 7
2.4 Konstruerade variabler En ny variabel vid namn specgrupper skapas, variabeln är baserad på vilken slutenvårdsavdelning som patienten ligger. Grupperingen gjordes enligt Tabell 2. Den här grupperingen behövdes för att vissa avdelningar innehöll bara ett mindre antal patienter och för att underlätta jämförelse av uppkomst av VRI mellan de olika sjukhusen. Vid analysen för komorbiditet så skapades en binär variabel, komorbiditet, från ICD-10 koder. Med hjälp av Charlson Comorbidity Index så placerades patienter i två olika grupper beroende på om deras totala poäng var mindre än två eller två och uppåt. Poängskalan kommer sig mortaliteten för respektive bakomliggande sjukdom, där högre poäng indikerar en högre mortalitet [8]. Att två poäng valdes som brytpunkt grundar sig i att njursjukdomar graderas som två enligt poängsystemet och att patienter med njursjukdomar har ökad risk för VRI [9]. Tabell 2: Gruppering av specialavdelningar vid skapandet av variabeln specgrupper Medicin Kirurgi Geriatrik Gyn o BB Allmän internmedicin Allmän kirurgi Geriatrik Gynekologi Endokrinologi Kärlkirurgi Geropsykiatri Förlossning Gastroenterologi Plastkirurgi Hudklinkik Urologi Infektionsklinik Öron-näsa-hals Lungmedicin Ögon Njurmedicin Reumatologi Ortopedi Cancercenter Neurocenter Barn Ortopedisk kirurgi Hematologi Neurologi Barnmedicin Handkirurgi Onkologi Neurorehab Neonatalavdelning Neurokirurgi Barnonkologi Hjärtcentrum Thoraxkirurgi Kardiologi 2.5 Bortfall Av de patienter som ingick i PPM-VRI mätningarna så hittar vi inga uppenbara fel av de registrerade mätvärdena. Vad vi däremot inte kan kontrollera, men får anta, är att vi råkat ut för avdelningar och patienter som aldrig rapporterats in vid ett mättillfälle. David Fhager som har använt sig av samma datamaterial har i sin masteruppsats gjort en uppskattning om att 499 personer aldrig blivit registrerade under dessa totalt 22 mätningar som gjorts [10]. Vid insamlingen av komorbiditetsdatat fick två patienter med VRI, samt två kontroller, uteslutas ur analysen då patienternas personnummer registrerats felaktigt. Detta bortfall får anses som slumpmässigt saknad data på grund av att patienterna med felaktigt personnummer låg inlagda vid olika tidpunkter på olika avdelningar. 3 Metod 3.1 Logistisk regression Logistisk regression, LR, kommer att användas för att bygga modeller och med hjälp av LRmodellens koefficienter skapas oddskvoter för respektive avdelning och riskfaktor. I appendix A.1 8
står det att läsa om teorin bakom LR. Ingen utförlig variabelselektion kommer att presenteras på grund av att en pilotstudie [5] använt sig av samma datamaterial. I pilotstudien utfördes backward stepwise selection med α = 0.05, se appendix A.7. Deras resultat har bekräftats genom att applicera samma metod på hela datasetet och de signifikanta variablerna är de som ingår i Västerbottensmodellen i Tabell 5. I Tabell 5 kan vi se att vissa avdelningar inte anges som signifikanta, men då ska man ha i åtanke att vi har skapat dummyvariabler utifrån Specgrupper och testar ifall en avdelning skiljer sig från referensavdelningen som i vårt fall är Medicin. Skulle vi istället välja en annan referensavdelning så skulle även vårt signifikanstest ge ett annat resultat. Så på grund av att referenspatienten sätts godtyckligt kommer vi inte att välja bort icke-signifikanta dummyvariabler. Vidare så behåller vi, så långt det är möjligt, samma variabler som i den stora Västerbottensmodellen för att enkelt kunna göra jämförelser mellan sjukhus, avdelningar och riskfaktorer. Referenspatienten är en patient där samtliga variabler antar värdet noll, så referenspatientens risk för VRI utläses från interceptet, övriga patienter ställs i relation till referenspatienten. 3.1.1 Modell för Västerbotten Modell 1 är en LR-modell som innehåller alla prediktorer som vi bedömt som signifikanta, alla prediktorer förutom ålder är kategoriska och vi behöver därför skapa ett antal dummyvariabler för dessa. I Tabell B2 i appendix hittar vi en beskrivning av variablerna som ingår i modell (1). Vår modell blir således: p logit = log( 1 p ) =β 0 + β Kön Kön + β Ålder Ålder + β IVA IVA + β CVK CVK + β KAD KAD+ β Skellefteå Skellefteå + β Lycksele Lycksele + β Immunsupp Immunsupp+ β Mekan vent Mekan vent + β Kirurg ingrepp Kirurg ingrepp+ β Barn Barn + β Cancent Cancent + β Geriatrik Geriatrik+ β Gyn&Förlossning Gyn&Förlossning + β Hjärtcent Hjärtcent+ β Kirurgi Kirurgi + β Neurocent Neurocent + β Ortopedi Ortopedi (1) Vi kan notera att modellen inte innehåller någon dummyvariabel för medicinska enheten eller NUS, alltså är vår referenspatient inlagd på medicinska enheten på NUS och det är mot denna patient de andra sjukhusen och avdelningarna jämförs. Således är referenspatienten en nollårig kvinna inlagd på medicinska avdelningen på NUS utan några riskfaktorer. För att referenspatienten ska bli meningsfull i ett medicinskt syfte så justeras interceptet så att referenspatienten istället blir en 70-årig kvinna utan några riskfaktorer inlagda på medicinska avdelningen på NUS. Att just 70 väljs som referensålder är för att medianen för variabeln ålder är 70. Dessutom vill vi undersöka interaktionen mellan KAD och Kirurgiskt ingrepp, så vår slutgiltiga modell blir då: logit =(β 0 + 70 β Ålder ) + β Kön Kön + β Ålder (Ålder 70) + β IVA IVA+ β CVK CVK + β KAD KAD + β Skellefteå Skellefteå + β Lycksele Lycksele+ β Immunsupp Immunsupp + β Mekan vent Mekanisk vent+ β Kirurg ingrepp Kirurg ingrepp + β Barn Barn + β Cancercent Cancercent+ β Geriatrik Geriatrik + β Gyn&Förlossning Gyn&Förlossning+ β Hjärtcent Hjärtcent + β Kirurgi Kirurgi + β Neurocent Neurocent+ β Ortopedi Ortopedi + β KAD:Kirurg ingrepp KAD:Kirurg ingrepp (2) 9
3.1.2 Modeller för respektive avdelning och sjukhus En viktig avgränsning som gjorts vid skapandet av modeller för de olika avdelningarna är att vi bara tittar på avdelningar som har mer än 20 st VRI-patienter. Dels för att prestandan på våra modeller skulle bli lidande och dels för att vårt resultat skulle bli opålitligt med så få observationer. När vi bygger modeller för enskilda avdelningar och sjukhus så innehåller inte modellerna dummyvariabler för sjukhus eller avdelningar. Istället så består de endast av relevanta riskfaktorer och demografiska variabler. Vidare så kommer inte referenspatienten att justeras till att vara 70 år gammal då det inte är meningsfullt på vissa avdelningar och för att vara konsekvent så är referenspatienten därför noll år gammal på alla modeller för enskilda avdelningar. Till exempel så ser modellen för kirurgen på Skellefteå sjukhus ut enligt följande. logit =β 0 + β Ålder Ålder + β CVK CVK + β Kirurg ingrepp Kirurg ingrepp+ β Immunsupp Immunsupp + β Mekan vent Mekanisk vent + β Kön Kön+ β KAD KAD + β KAD:Kirurgiskt ingrepp KAD:Kirurgiskt ingrepp (3) Som vi kan se i ekvation (3) så saknas variabler för sjukhus, IVA och avdelning. Interceptet är heller inte ålderskorrigerat utan referenspatienten är noll år gammal kvinna som saknar riskfaktorer. 3.2 LDA I appendix A.2 kan vi läsa att LDA antar att X = X 1,...X q har en multivariat normalfördelning med ett klasspecifikt medelvärde och en gemensam kovariansmatris. Då vi har en rad dummyvariabler så är dessa antaganden ej uppfyllda. Eftersom vi är ute efter prestandan vid prediktion, som utvärderas med hjälp av korsvalidering, så går vi ändå vidare med LDA. Vi kommer däremot inte titta närmare på LDA-score eller koefficienternas värde då det ligger utanför syftet med den här uppsatsen. 3.3 Prediktion och modellutvärdering För att kunna säga något om en modells prediktionsförmåga så behövs ett mått på prestanda. Det enklaste måttet skulle vara att mäta precisionen, alltså proportionen av observationer som var korrekt klassificerade som sanna positiva eller sanna negativa. Men det här måttet är för trubbigt, i Tabell A3 ser vi en klassificeringsmatris som täcker in alla möjliga utfall vid klassificering av en binär variabel. Vi vill inte bara veta precisionen på en modell, utan vi vill också veta vilket typ av fel en modell gör, därför brukar specificitet och sensitivitet användas som prestandamått. I vårt fall ville vi hålla sensitiviteten hög eftersom tidigare studier har visat att VRI leder till ökad dödlighet bland patienter[4] och det finns också risk för att VRI-patienter smittar andra patienter. Därför valde vi att hålla sensitiviteten fixerad till 90 %, vilket i sin tur ledde till att vi använder specificitet som prestandamått. För att jämföra de två modellerna LR och LDA så kommer 5-faldig korsvalidering (5-KV) att användas, se appendix A.5. Anledningen till att datat delas in i just fem delar är för att vanligen används 5- eller 10-KV då det finns empiriskt stöd för att en sådan uppdelning ger en bra balans mellan bias/varians [11]. Vi valde 5-KV på grund av att när vi utvärderar modellprestanda på ett mindre antal observationer så riskerar vi inte att testdatat innehåller värden/nivåer som inte stötts på i träningsdatat. Notera också att när vi testar de två modellera LR och LDA mot varandra så innehåller de samma variabler. Första steget är att dela upp datat i fem lika stora delar. För att den här metoden ska fungera så bra som möjligt så stratifieras grupperna efter den variabel som har flest nivåer. Även detta görs för att undvika att testdatat innehåller värden som inte stötts på i träningsdatat, detta är speciellt viktigt när antalet observationer är begränsat, till exempel då en modell för en enskild avdelning ska utvärderas. För det här ändamålet används funktionen createfolds från paketet Caret i R. 10
I nästa steg så beräknas specificiteten vid 5-KV för de båda modellerna. Vi använder sedan specificiteten för att bedöma prediktionsförmågan för de båda modellerna. 3.4 Komorbiditet För att kunna jämföra huruvida den binära variabeln komorbiditet kan hjälpa oss att öka specificiteten för en modell så behövdes ett sätt att kunna jämföra modeller med och utan komorbiditetsvariabeln. På grund av att det fanns begränsat med observationer (88 st med VRI och 88 st kontroller) så gick det inte att träna en modell på dessa observationer, sedan tillföra komorbiditetsvariabeln och jämföra specificiteten för dessa två modeller. Istället så användes modell (4) för att prediktera sannolikheten för förekomsten av VRI på dessa 176 patienter, denna prediktion fick bli vår konstruerade variabel Pred. Sedan byggdes två modeller (5) och (6), på så sätt så kunde vi göra en jämförelse. Eftersom det var specificiteten som modellerna skulle utvärderas på så hölls även här sensitiviteten fixerad. På grund av att några patienter fick samma predikterade sannolikhet för VRI och det låga antalet observationer så blev vi tvungna att fixera sensitiviteten vid 92 % som vi kan se i Tabell 9 i resultatdelen. P red = expβ 0+β 1 x 1 +...+β qx q 1 + exp β 0+β 1 x 1 +...+β qx q (4) logit Ejkomorbiditet = β 0 + β P red P red (5) 3.5 Överlevnadsanalys logit Komorbiditet = β 0 + β P red P red + β Komorbiditet Komorbiditet (6) Givet vår data så vill vi undersöka huruvida 90-dagars dödligheten skiljer sig mellan de patienter som ådragit sig VRI under sjukhusvistelsen jämfört med de utan VRI. Vi gör även en jämförelse mellan de olika typerna av VRI för våra patienter. I appendix A.4 finns en kort beskrivning av överlevnadsanalys. Som studien är upplagd och vårt data insamlat så är all data högercensurerat då vi bara har information om huruvida en patient är avliden eller ej 90 dagar efter PPM-VRI. Man skulle kunna tänka sig att någon VRI-patient eller kontroll flyttat utanför Sveriges gränser mellan tiden för en PPM-VRI och de 90 efterföljande dagarna. På så vi skulle vi missa ett eventuellt dödsfall, men det här har vi tyvärr ingen möjlighet att kontrollera. Så vid vår analys gör vi antagandet att vi bara har högercensurerad data. Vårt resultat illustreras med hjälp av KM-kurvor, se appendix A.4.1, där vi jämför 90-dagars överlevnad för patienter med VRI mot patienter utan VRI. Vi kommer också att jämföra överlevnaden för patienter med olika typerna av VRI mot varandra. För att jämföra de olika grupperna använder vi oss av log-rank test. 4 Resultat Först presenteras en tabell med förekomst av VRI för olika grupper, vi använder χ 2 -test när vi testar för skillnad i sannolikhetsfördelning mellan dessa grupper. Notera här att ett signifikant test bara indikerar att minst en av grupperna skiljer sig från de andra, så i det fall det finns många olika 11
grupper så vet vi bara att minst en av grupperna skiljer sig från de andra och inte att alla grupper skiljer sig från varandra. Vidare så jämförs specificiteten för LR och LDA i Tabell 4, där kan vi se hur var och en av modellerna presterar på de olika sjukhusen och avdelningarna. I tabellerna 5-8 så presenteras oddskvoter för respektive variabel i varje modell, oddskvoterna kommer sig av koefficienterna från LR-modellen och de koefficienter som är signifikanta (α = 0.05) markeras med fet stil. I de fall som en variabel bara antar ett värde eller är en omöjlig händelse så kommer det att markeras med en i den cellen, till exempel så saknar de mindre sjukhusen Skellefteå och Lycksele vissa specialavdelningar som Cancercentrum. För tolkning av interceptet så är det viktigt att man har i åtanke att det är grundrisken för referenspatienten och vilken denna är. I Tabell 5 och modellen för Västerbotten så är referenspatienten en 70-årig kvinna inlagd på Medicin på NUS utan några riskfaktorer, i samma tabell och för vart och ett av sjukhusen så är referenspatienten en 70-årig kvinna inlagd på respektive sjukhus Medicinavdelning utan några riskfaktorer. För övriga modeller så är referenspatienten en 0-årig kvinna utan riskfaktorer som ligger inlagd på den avdelning som modellen avser. Resultatet för huruvida information om komorbiditet kan hjälpa till vid prediktion av VRI presenteras i Tabell 9 och det är modell 5 och 6 som testas. Här är vi bara intresserade av specificiteten före och efter att vi introducerat variabeln Komorbiditet och presenterar därför inte oddskvoter eller signifikansnivåer. Dessutom presenteras bara resultat från LR-modellen då vi hade för få observationer för att LDA skulle fungera tillfredsställande. För alla modeller som presenteras i våra tabeller så har residualanalys utförts och då specifikt residualerna (studentized Pearson residuals) vs. leverage, ingen av modellerna innehöll någon observation som hade ett högre värde än 0.48 på Cook s distance [12]. Vi kan alltså konstatera att ingen enskild observation antar så extrema värden att den påverkar vår modell nämnvärt. Vi har också testat alla modeller med Hosmer-Lemeshow Test [13], HL-test. Vi motiverar användningen av HL-test genom att vi har ett flertal binära prediktorer, samt en diskret variabel (Ålder), så bara ett fåtal observationer kan tillskrivas identiska värden på alla variabler och HL-test bör således fungera bra. Samtliga modeller visade på icke-signifikanta p-värden för HL-testet, alltså att modellen kan anses som tillräckligt bra. Till slut så presenteras resultatet för vår överlevnadsanalys i form av KM-kurvor. 4.1 Prevalens av VRI I Tabell 3 hittar vi prevalensen för olika demografiska patientgrupper, sjukhus, avdelningar och riskfaktorer. Redan här kan vi se en stor skillnad i prevalens för vissa grupper, till exempel så drabbar VRI oftare män än kvinnor, vi ser också att VRI i större utsträckning drabbar de äldre patienterna och av sjukhusen så har NUS den högsta prevalensen av VRI. För patienter med någon av riskfaktorerna närvarande så ser vi att de har en högre andel VRI än för patienter utan samma riskfaktor. Det finns olika typer av VRI-diagnos och i figur 1 presenteras ett histogram där vi kan se vilken typ av VRI som drabbar patienterna, histogrammet är baserat på samtliga 1680 VRI-diagnoser. Histogrammet är uppdelat på kön och visar hur stor procentandel av alla män och kvinnor som drabbas av respektive diagnos. Den vanligaste VRI-diagnosen för män är lunginflammation och blåskatarr, för kvinnor är det blåskatarr och Hud och mjukdelar. 12
Tabell 3: Prevalens av VRI för olika grupper med tillhörande χ 2 -test, ett signifikant p-värde indikerar att det finns en skillnad i prevalens mellan grupperna. I fallet med fler än två grupper så visar det på att minst en av grupperna skiljer sig från övriga. Grupp Alla patienter VRI Icke-VRI P-värde Prevalens N % N % N % % Totalt 16354 100 1635 100 14 674 100 10.0 Kön <0.0001 Kvinnor 8 546 52.4 750 45.9 7 796 53.1 8.8 Män 7 763 47.6 885 54.1 6 878 46.9 11.4 Åldersgrupper <0.0001 <1 år 435 2.7 25 1.5 410 2.8 5.7 1-17 år 692 4.2 58 3.5 634 4.3 8.4 18-24 år 458 2.8 32 2.0 426 2.9 7.0 25-44 år 1 497 9.2 95 5.8 1 402 9.6 6.3 45-64 år 3 167 19.4 330 20.2 2 837 19.3 10.4 65-85 år 7 507 46.0 848 51.9 6 659 45.4 11.3 >85 år 2 553 15.7 247 15.1 2 306 15.7 9.7 Sjukhus <0.0001 Lyckselse 1 641 10.1 109 6.7 1 532 10.4 6.6 NUS 11 223 68.6 1 309 80.1 9 871 67.3 11.7 Skellefteå 3 488 21.4 217 13.3 3 271 22.3 6.2 Specgrupper <0.0001 Barn 787 4.8 45 2.8 742 5.1 5.7 Cancercentrum 1 449 8.9 309 18.9 1 140 7.8 21.3 Geriatrik 1 999 12.3 246 15.0 1 753 11.9 12.3 Gyn o BB 640 3.9 13 0.8 627 4.3 2.0 Hjärtcentrum 988 6.1 108 6.6 880 6.0 10.9 Kirurgi 3 213 19.7 297 18.2 2 916 19.9 9.2 Medicin 4 455 27.3 374 22.9 4 081 27.8 8.4 Neurocenter 1 254 7.7 148 9.1 1 106 7.5 11.8 Ortopedi 1 524 9.3 95 5.8 1 429 9.7 6.2 IVA <0.0001 Ja 564 3.5 110 6.7 454 3.1 19.5 Nej 15 745 96.5 1 525 93.3 14 220 96.9 9.7 CVK <0.0001 Ja 3015 18.5 701 42.9 2 314 15.8 23.3 Nej 13 294 81.5 934 57.1 12 360 84.2 7.0 KAD <0.0001 Ja 3869 23.7 672 41.1 3 197 21.8 17.4 Nej 12 440 76.3 963 58.9 11 477 78.2 7.7 Mekanisk vent. <0.0001 Ja 383 2.3 107 6.5 276 1.9 27.9 Nej 15 926 97.7 1 528 93.5 14 398 98.1 9.6 Immunsuppression <0.0001 Ja 1646 10.1 355 21.7 1291 8.8 21.6 Nej 14 663 89.9 1 280 78.3 13 383 91.2 8.7 Kirurgiskt ingrepp <0.0001 Ja 5 140 31.5 769 47.0 4 371 29.8 15.0 Nej 11 169 68.5 866 53.0 10 303 70.2 7.8 13
Olika typer av VRI uppdelat på kön i procent 2.0 1.5 Procent 1.0 Kön Kvinna Man 0.5 0.0 Cys Blåskatarr HMi Hud, mjukdelar Pneu Lunginflammation Sep Blodförgiftning GE Smittsamma tarmsjukdomar Pye Njurbäckeninfektion Feb Feber LSi Led o skelett GiN Nedre tarmkanalen GiÖ Övre tarmkanalen Mos Munhåla och svalg Diagnosgrupp Cor Hjärta, kärl CNS Centrala nervsystemet Lga Lever/galla/bukspott/mjälte Öli Övre luftvägar Gen Genitala infektioner Öga Ögon Bron Bronkit Figur 1: I histogrammet ser vi vilken typ av VRI som drabbar män och kvinnor, procentuellt sett för respektive population 4.2 Jämförelse av LR och LDA Innan vi konstruerade modeller för att kunna jämföra LR och LDA så valde vi att begränsa oss till avdelningar med fler än 20 VRI-patienter för att undvika problem med att enskilda observationer styr resultatet. I Tabell 4 kan vi se specificiteten för samtliga testade modeller. Vi ser genast att Västerbottensmodellen presterar väldigt bra jämfört med enskilda avdelningar, för LR-modellen är det bara modellen på NUS Barnavdelning som presterar bättre och för LDA är det Neurocentrum på NUS som överpresterar Västerbottensmodellen. Vidare så ser vi att LR-modellen har en högre specificitet än LDA för Västerbottensmodellen. På fyra avdelningar (Neurocentrum på NUS, Ortopeden på NUS, Kirurgen i Skellefteå och Geriatriken i Lycksele) presterar LDA bättre än LR. Eftersom LR-modellen har den bästa prestandan för både Västerbottensmodellen och de enskilda sjukhusen så kommer vi fortsättningsvis att fokusera på LR när vi går vidare och gör modeller för enskilda sjukhus och avdelningar. 14
Tabell 4: Specificitet för modeller Sjukhus/Avdelning Modell LR LDA N Antal VRI Västerbotten 32.79 31.20 16354 1680 NUS 31.06 30.31 11223 1309 Barn 36.92 21.52 642 43 Cancer 26.06 21.57 1446 315 Geriatrik 9.80 9.34 1419 203 Hjärtcentrum 23.43 15.43 990 110 Kirurgi 28.92 26.14 1819 196 Medicin 24.59 23.74 2382 261 Neurocentrum 22.87 32.36 1258 155 Ortopeden 9.10 17.08 912 60 Skellefteå 23.87 21.56 3488 217 Kirurgi 9.34 14.39 792 84 Medicin 22.69 18.77 1635 91 Ortopedi 29.36 22.71 499 27 Lycksele 20.77 18.81 1641 109 Geriatrik 6.04 8.31 331 38 Medicin 27.74 17.37 465 37 4.3 Modeller för Västerbotten och enskilda sjukhus Nästa steg i analysen är att titta närmare på de olika sjukhusen och avdelningarna. I Tabell 5 hittar vi modeller för hela Västerbotten och vart och ett av sjukhusen. Som vi tidigare kunde se i Tabell 3 så är oddsen att drabbas av VRI högre för män, det gäller för samtliga sjukhus. Riskfaktorn KAD medför en påtagligt ökad risk för VRI, precis som tidigare studier påpekat, men patienter med KAD i Skellefteå inte har lika hög relativ risk att drabbas av VRI som på andra orter. Även Kirurgiskt ingrepp innebär en påtagligt ökad risk för VRI, så var för sig betyder både KAD och Kirurgiskt ingrepp en ökad risk för VRI. Däremot så visar samspelstermen KAD:Kirurgiskt ingrepp på att en patient som genomgår ett kirurgiskt ingrepp och KAD används så är dessa risker inte kumulativa. Som det står att läsa i appendix A.1.1 så kan man direkt beräkna oddskvoten för givna koefficienter i LR-modellen genom att använda exponentialfunktionen. För att beräkna oddskvoten för en patient med både KAD och Kirurgiskt ingrepp så måste man också beakta interaktionstermen KAD:Kirurgiskt ingrepp. Om vi utgår från Västerbottensmodellen så förändras oddskvoten för en sådan patient med exp(log(2.78) + log(2.82) + log(0.45)) 3.53, allt annat lika. Notera att vi använder oss av den naturliga logaritmen för att först konvertera oddskvoter tillbaka till koefficienter. Det blir då också tydligt via räkneregler med exponentialfunktionen och den naturliga logaritmen att vi direkt kan multiplicera oddskvoterna för att nå samma svar 2.78 2.82 0.45 3.53. Utan interaktionstermen i modellen så skulle vi istället uppskattat att en sådan patient haft en oddskvot på 2.78 2.82 7.84, interaktionstermen innebär alltså en betydande skillnad av vår skattning för en sådan patient. Med ovan resultat och att referenspatienten ligger inlagd på Medicin i åtanke så ser vi att vissa avdelningar, till exempel Gyn & förlossning, har en oddskvot som är mindre än ett. Det betyder att patienter inlagda på en sådan avdelning har lägre odds att ådra sig VRI än en patient inlagd på medicinavdelningen, allt annat lika. Vi ser också att Ålder visar på en signifikant ökning av oddsen för att drabbas av VRI, även om en oddskvot på 1.0078 inte verkar så påtaglig ska man ha i åtanke att Ålder är en diskret variabel så den procentuella skillnaden i oddskvot mellan en 20- och 80-åring blir därför 0.78 (80 20) = 46.8%, 15
så en patient som är 60 år äldre har en ökning i oddskvot med 46.8%, allt annat lika. I övrigt ser vi att oddskvoterna tenderar att vara jämförbara mellan de olika sjukhusen. Tabell 5: Modeller för Västerbotten och respektive sjukhus, oddskvoter kommer sig av LR-modellens koefficienter. Fet stil signifikant då α = 0.05. = omöjlig kombination / på den avdelningen antogs bara ett värde så variabeln ingick inte i modellen Modell Västerbotten n=16354 NUS n=11223 Skellefteå n=3488 Lycksele n=1641 Intercept 0.043 0.054 0.027 0.041 Ålder 1.0078 1.0065 1.014 1.017 Kön 1.19 1.17 1.35 1.17 CVK 2.74 2.65 3.18 2.56 IVA 0.59 0.48 1.28 0.90 KAD 2.78 3.06 1.64 2.24 Kirugiskt ingrepp 2.82 2.83 2.58 2.57 Mekanisk ventilation 2.07 2.24 1.38 2.47 Immunsuppression 1.90 1.79 2.32 2.72 Specgrupper Barn 0.9956 0.79 1.47 1 * Cancercentrum 1.35 1.12 * * Geriatrik 1.59 1.46 0.98 1 1.38 Gyn & Förlossning 0.29 0.25 1 0.43 1 0.40 1 Hjärtcentrum 0.79 0.67 * * Kirurgi 0.73 0.655 1.38 0.37 Neurocentrum 1.11 0.88 * * Ortopedi 0.53 0.42 0.80 0.85 1 Sjukhus Skellefteå 0.69 * * * Lycksele 0.63 * * * KAD:Kirurgiskt ingrepp 0.45 0.42 0.64 0.45 1 Färre än 10 patienter med VRI i gruppen. 4.4 Modeller för respektive avdelning på NUS I Tabell 6 så hittar vi modellerna för NUS. Eftersom vi har många variabler i vår modell och antalet patienter på en avdelning är betydligt färre än för hela sjukhuset så är det i många fall svårt att få fram signifikanta koefficienter, speciellt på de mindre avdelningarna. Precis som när vi jämförde prestandan på LR och LDA så har vi begränsat oss till avdelningar som har fler än 20 st VRI-patienter. När vi tittar på oddskvoter för de enskilda avdelningarna så ser vi, precis som i den större modellen, att de signifikanta oddskvoterna visar på att närvaron av en riskfaktor innebär en förhöjd risk för patienten, allt annat lika. 16
Tabell 6: Modeller för respektive avdelning på NUS, oddskvoter kommer sig av LR-modellens koefficienter. Fet stil signifikant då α = 0.05. Avdelning Barn n=642 Cancer n=1446 Geriatrik n=1419 Hjärtcentrum n=990 Kirurgi n=1819 Medicin n=2382 Neurocentrum n=1258 Ortopeden n=912 Intercept 0.019 0.069 0.046 0.026 0.010 0.031 0.027 0.0091 Ålder 0.99 1.00 1.00 1.00 1.018 1.01 1.00 1.017 Kön 0.89 1.22 1.20 0.90 1.41 1.09 1.05 1.20 CVK 12.23 1.82 1.86 4.46 2.51 1.82 3.58 2.60 KAD 1.86 1 3.00 2.10 1.18 2.27 3.80 5.27 3.35 Kirurgiskt ingrepp 1.61 1.96 2.16 7.67 2.82 2.80 2.62 3.07 Mekanisk ventilation 0.97 1 0.85 1 * 2.72 1.87 0.93 1 1.19 1.15 1 Immunsuppression 1.25 2.83 1.39 0.80 1 1.58 1.78 0.51 1 1.18 1 KAD:Kir. ingrepp 0.21 1.10 1.08 0.99 0.47 0.70 0.35 0.15 1 Färre än 10 patienter med VRI i gruppen. 17
4.5 Modeller för respektive avdelning på Skellefteå sjukhus I Tabell 7 har vi modeller för respektive avdelning på Skellefteå sjukhus, eftersom Skellefteå har relativt få patienter och således få patienter på varje avdelning så blev det svårt att få fram signifikanta resultat. Här blev också vår begränsning om minst 20 VRI-patienter påtaglig då bara tre av avdelningarna nådde upp till vårt krav. I de fall som vi fick fram signifikanta oddskvoter så ser vi åter igen att riskfaktorer och patientens ålder leder till ökad risk för VRI, precis som i Västerbottensmodellen så får man ha i åtanke att variabeln Ålder visar förändringen i risk per år för vår patient. Tabell 7: Modeller för respektive avdelning på Skellefteå sjukhus, oddskvoter kommer sig av LR-modellens koefficienter. Fet stil signifikant då α = 0.05. Avdelning Kirurgi n=792 Medicin n=1618 Ortopedi n=499 Intercept 0.018 0.013 0.0035 Ålder 1.016 1.010 1.013 Kön 1.24 1.33 1.70 CVK 3.17 2.76 13.35 1 KAD 1.49 1.89 1.12 1 Kirurgiskt ingrepp 1.52 1.57 3.10 Mekanisk ventilation 0.35 2.62 1.14 1 Immunsuppression 2.23 2.34 2.16 1 KAD:Kir. ingrepp 0.94 1.57 3.43 1 1 Färre än 10 patienter med VRI i gruppen. 4.6 Modeller för respektive avdelning på Lycksele sjukhus I Tabell 8 presenteras modeller för Kirurgen och Medicinavdelningen i Lycksele, på övriga avdelningar så fanns det inte tillräckligt många patienter med VRI för att bygga meningsfulla modeller. Vidare så var det bara fåtalet koefficienter som blev signifikanta och kunde användas för att skapa användbara oddskvoter, åter igen så är dessa oddskvoter större än 1 och det innebär att patienter med dessa riskfaktorer löper en signifikant ökad risk att drabbas av VRI, allt annat lika. 18
Tabell 8: Modeller för respektive avdelning på Lycksele sjukhus, oddskvoter kommer sig av LR-modellens koefficienter. Fet stil signifikant då α = 0.05. Avdelning Kirurgi n=608 Medicin n=465 Intercept 0.0033 0.027 Ålder 1.02 1.01 Kön 1.49 0.66 CVK 1.22 1 2.17 KAD 1.29 1 2.34 Kirurgiskt ingrepp 3.22 1.24 1 Mekanisk ventilation 7.19 1 1.01 1 Immunsuppression 2.55 1 3.54 1 KAD:Kir. ingrepp 0.58 1 1.15 1 1 Färre än 10 patienter med VRI i gruppen. 4.7 Modellprestanda För att kontrollera sensitiviteten till 90 % på våra modeller så måste cut-off justeras vid modellbygget. Det görs så att det predikterade värdet (log-oddsen) för alla patienter rangordnas från minsta till största värdet. Sedan väljer vi en cut-off och klassar alla patienter med högre predikterat värde än cut-off som patienter med VRI och lägre än cut-off som icke-vri. Hade vi inte haft några krav på sensitivitet så hade patienter med log-odds större än noll klassificerats som VRI-patienter och lägre än 0 som icke-vri. Det här kommer sig av kopplingen mellan log-odds och sannolikheter där log-odds = log( p 1 p ) och att i standardfallet så klassificeras sannolikheter större än 0.5 som VRIpatienter och mindre än 0.5 som icke-vri. Så när sannolikheten är 0.5 får vi log( 0.5 1 0.5 ) = log(1) = 0. Vi har i vår jämförelse mellan LR och LDA valt cut-off så att sensitiviteten är 90 %, men det går också välja ett annat värde på cut-off och på så vis ändras också sensitiviteten och specificiteten. Genom att variera cut-off över alla predikterade värden och beräkna sensitivitet och specificitet för varje fall så kan man skapa en ROC-kurva, vilket vi gjort och presenterar i figur 2. Figur 2 visar ROC-kurva för vår Västerbottensmodell som togs fram med hjälp av LR. Vi ser att AU C = 0.7504, vilket kan tolkas som sannolikheten att vi rankar en slumpvis vald observation som klassats som positiv högre än en slumpvis vald observation som klassats som negativ. Enkelt sagt så har vi en klassificerare som oftare klassar positiva utfall högre än negativa utfall. När vi ställer upp de predikterade värdena för samtliga observationer i figur 3 så ser vi att så är fallet. Ett annat sätt att visualisera vad som händer när cut-off ändras ser vi i figur 4. Där kan vi se sannolikheten för att en patient har VRI, givet cut-off. Precis som tidigare figurer visat så har VRIpatienter ett högre predikterat värde i genomsnitt, så i och med att cut-off sätts högre så ökar också sannolikheten för att patienten har VRI. För cut-off större än noll så ser vi att andelen patienter med VRI börjar fluktuera kraftigt och det beror på att det bara är 69 patienter kvar med så höga värden, 33 st med VRI och 36 st icke-vri. Så för varje justering av cut-off ger stora förändringar med avseende på andelen VRI-patienter. 19
ROC kurva för logistisk regressionsmodell 1.00 0.75 Sensitivitet 0.50 0.25 0.00 AUC= 0.7504 0.00 0.25 0.50 0.75 1.00 1 Specificitet Figur 2: ROC-kurva för predicering av VRI-patienter i Västerbotten med hjälp av logistisk regression Predikterade värden för patienter med och utan VRI 0 Predikterat värde 2 4 VRI Icke VRI Figur 3: Predikterade värden (log-odds) för VRI-patienter och icke-vri patienter i Västerbotten 20
Sannolikhet för VRI hos patienter med högre värde än cut off 1.00 Andel patienter med VRI 0.75 0.50 0.25 4 2 0 Cut off Figur 4: Andel patienter med VRI givet ett specifikt värde på cut-off, där patienter med högre värde än cut-off predikteras som VRI och lägre som icke-vri 4.8 Komorbiditet Med bara 88 VRI-patienter och 88 kontroller så blev det väldigt svårt för någon av modellerna att prestera bra prediktioner. LDA misslyckades helt och ingen jämförelse mellan LR och LDA kunde göras här. LR-modellen med komorbiditet presterade något bättre än modellen utan och resultatet kan vi se i Tabell 9, på grund av att ett par patienter fick samma predikterade värde så blev vi tvungna att justera sensitiviteten till 92 %. Med det i åtanke så är det ändå en väldigt låg specificitet jämfört med de tidigare modeller som baserades på fler observationer. I Tabell 9 kan vi ändå konstatera att den extra informationen som Komorbiditet tillförde ledde till en marginell förbättring av specificiteten för LR. Tabell 9: Jämförelse av specificitet för LR modell med och utan information om komorbiditet, sensitiviteten kontrollerades för båda modellerna. Modell Sensitivitet Specificitet Utan komorbitet som faktor 92.0 % 6.81 % Med komorbitet som faktor 92.0 % 7.39 % 4.9 Överlevnadsanalys Som tidigare studier redan påvisat så medför VRI en påtaglig risk för patienten. För att bekräfta och understryka vikten av att kunna förebygga VRI så har vi skapat KM-kurvor. KM-kurvorna visar på 90 dagars överlevnad för både VRI och icke-vri patienter i figur 5. Som vi kan se är 90 dagars överlevnaden betydligt högre för patienter utan VRI, de exakta siffrorna är 87.8 % för kontroller och 80.8 % för patienter med VRI. P-värdet för vårt log-rank test var p=0.000112, alltså de två gruppernas överlevnadskurvor skiljer sig från varandra. 21
90 Dagars överlevnad för patienter med VRI Andel överlevande 0.5 0.6 0.7 0.8 0.9 1.0 VRI Kontrollgrupp (icke VRI) 0 20 40 60 80 Dagar Figur 5: 90 Dagars överlevnad för patienter med VRI, 649 st, prickade röda linjen. Kontroller i heldragen svart, 262 st. Log-rank testet visar på signifikant skillnad med p=0.000112 Som vi såg i figur 1 så finns det flera olika typer av VRI och alla är olika allvarliga när det gäller 90 dagars överlevnaden. I figur 6 så hittar vi överlevnadskurvor för de olika diagnostyperna. De allvarligaste typerna av VRI, sett till 90 dagars dödlighet, är lunginflammation följt av blodförgiftning. De typer av VRI som har lägst dödlighet är den som drabbar led och skelett följt av VRI i hud och mjukdelar. Bortsett från patienter med VRI i led och skelett så hade kontrollgruppen lägst 90 dagars dödlighet. Ett log-rank test, med H 0 : Alla grupper har en gemensam överlevnadskurva och H a : Minst en grupps överlevnadskurva skiljer sig från de övriga, visade på ett ytterst signifikant p-värde med p = 0.0000 22
90 Dagars överlevnad för patienter med VRI Andel överlevande 0.5 0.6 0.7 0.8 0.9 1.0 Kontrollgrupp Blåskatarr Hud, mjukdelar Led och skelett Lunginflammation Njurbäckeninfektion Blodförgiftning 0 20 40 60 80 Dagar Figur 6: 90 Dagars överlevnad för de olika varianterna av VRI, kontroller i svart heldragen linje. 5 Diskussion Vi har visat att det med hjälp av statistiska modeller går att prediktera vilka patienter som ligger i riskzonen för att ådra sig VRI, tillika prediktera vilka patienter som inte ligger i riskzonen. Genom att utnyttja resultaten från statistiska modeller kan man antingen sätta in resurser för att förbättra rutiner kring vissa av riskfaktorerna såsom KAD och CVK. Det går även använda för att skapa sig en ögonblicksbild för en patient som inkommer till en vårdavdelning, skulle patienten i fråga ha en förhöjd risk för att ådra sig VRI skulle man direkt kunna vidta förebyggande åtgärder. Alternativt kan man välja att omfördela resurser från patienter vi klassificerar som icke-vri, alltså ungefär 31 % av patienterna, till övriga patienter. Det blev tydligt att med så många variabler som vi ändå valde att ta med i våra modeller så ger fler observationer ett säkrare resultat. Det här blev ett problem för de modeller som gjordes för mindre enskilda mindre avdelningar. Speciellt dåligt presterade LDA eftersom de antaganden man gör för LDA förutsätter multivariat normalfördelade variabler och vi använde oss mest av binära variabler. Även om teorin bakom LDA förberedde oss på att vi skulle få det här utfallet så var det intressant att undersöka frågan. Det är möjligt att andra statistiska metoder så som support vector machines eller CART (classification and regression trees) skulle kunna prestera bättre än våra metoder. Men tills någon studie kan bekräfta att så är fallet så rekommenderar vi att LR-modellen för hela Västerbotten används för att prediktera VRI för enskilda patienter. Som vi nämnt finns det en förstudie i vilken utförlig variabelselektion gjorts med hjälp av 23