Bör liten bli stor? Sjukhusstorlekens betydelse för vårdens resultat och kostnadseffektivitet



Relevanta dokument
en översikt av stegen i en systematisk utvärdering

2. Metodik för systematisk litteraturgenomgång

Träning ger färdighet

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund

Screening för cancer i tjock- och ändtarm (kolorektal cancer) med flexibelt sigmoideoskop

ECONOMIC EVALUATION IN DENTISTRY A SYSTEMATIC REVIEW

Bilaga 4. SBU-projektet sjukskrivning, mall för dataextraktion för kvalitetsgranskning av studie

Hur få jämlik tillgång till högspecialiserad vård?

Träning ger färdighet

Bilaga till rapport 1 (11)

Arbetets betydelse för uppkomst av besvär och sjukdomar Nacken och övre rörelseapparaten

Evidensbegreppet. Kunskapsformer och evidens. Epistemologi. Evidens. Statens beredning för medicinsk utvärdering; SBU. Archie Cochrane

Checklista för systematiska litteraturstudier 3

Att beräkna täckningsgrad för de nationella kvalitetsregistren jämfört med Socialstyrelsens register

Träning ger färdighet

Metodguiden en webbaserad tjänst med information om olika insatser och bedömningsinstrument.

Träning ger värdighet. Koncentrera vården för patientens bästa

Vårdepisodersättning. Pilotinförande 2018 för höft- & knä-, obesitas- och ryggkirurgi 2017-XX-XX

Riktlinjer för bedömning av examensarbeten

Bilaga 3 till SBU-rapport 1 (7)

Specialiserade överviktsmottagningar

Studiehandledning. Projektplan för ett evidensbaserat vårdutvecklingsprojekt HT-12

Delprov 3 Vetenskaplig artikel

Bilaga 3: Kvalitetsbedömning av primärstudier

Analysis of factors of importance for drug treatment

Bilaga till rapport 1 (10)

Esofaguscancerkirurgi faktorer som påverkar överlevnaden

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Bilaga 2 till rapport 1 (8)

Kapitel 6: Syntes och evidensgradering

Arbetsdokument Nationella riktlinjer för rörelseorganens sjukdomar

Svensk studie avseende screening av tarmcancer erbjudande om deltagande

PREOPERATIV TVÄTT MED KLORHEXIDIN

Cancer Okänd Primärtumör - CUP

Vichyvatten för att behandla svampinfektion med candida i munhålan

RAPPORT. Kliniska riktlinjer för användning av obeprövade behandlingsmetoder på allvarligt sjuka patienter

ANTIBIOTIKA hjärta och smärta. Uppdateringar från Tandvårds Strama

Gradering av evidensstyrka ABCD

Särskilda riktlinjer och anvisningar för examensarbete/självständigt arbete, grundnivå, vid institutionen för omvårdnad

Sammanhållen Vård genom Enhetliga Arbetssätt (SVEA) Introduktion till samverkansmått för husläkarmottagningar

SBU:s sammanfattning och slutsatser

Välkomna! till kursen i Vetenskapligt Förhållningssätt Ht 2017

Resultat från 2017 års PPM* Aktuella läkemedelslistor

Uppföljning av utvecklingsuppdrag. Riksstroke -TIA. Fredrik Buchwald 1. Projektnamn Validering av TIA i RIKSSTROKE (D4)

Skador i vården 2013 första halvåret 2017

Resultat från 2018 års PPM* Aktuella läkemedelslistor

Arbetsdokument Nationella riktlinjer för rörelseorganens sjukdomar

STATENS BEREDNING FÖR MEDICINSK UTVÄRDERING

Evidensbaserad informationssökning

Öppna jämförelser i överblick 2013

Rekommendation rörande nationell och regional nivåstrukturering inom cancerområdet

Utformning av PM. Hälsa och livskvalitet Vårdkvalitet och säkerhet Vårdmiljö och resurser

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

Factors and interventions influencing health- related quality of life in patients with heart failure: A review of the literature.

Evidensgradering enligt GRADE

Efter LS 19/10 - Fortsatt analys

Utformning av PM. Hälsa och livskvalitet Vårdkvalitet och säkerhet Vårdmiljö och resurser

Checklista för systematiska litteraturstudier*

Vårdens resultat och kvalitet

2. Metodik för sökning och utvärdering av litteraturen

Ljusterapi vid depression

Hur kan vi söka och värdera vetenskaplig information på Internet?

REV Dnr: 1-563/ Sid: 1 / 8

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

SKL rapporten om vårdrelaterade infektioner 2017

Mejàre nov Disposition. Processen för en systematisk översikt. Processen. Syfte Att tillägna sig ett kritiskt förhållningssätt

Kommittédirektiv. En nationell cancerstrategi för framtiden. Dir. 2007:110. Beslut vid regeringssammanträde den 5 juli 2007

4. Behov av hälso- och sjukvård

3.1 Självskattat psykiskt välbefinnande. 3.2 Självmord i befolkningen. 3.3 Undvikbar somatisk slutenvård efter vård inom psykiatrin.

Tillstånd: Enskild tand med ringa till måttlig defekt som medför funktionsstörning Åtgärd: Inlägg metall (gjutet guld)

vårdcoacher inom SLL sammanfattande resultat

Somatostatinreceptor PET/CT vid neuroendokrina tumörer: systematisk översikt och metaanalys


Nivåstrukturering av urologisk och gynekologisk cancer i Uppsala-Örebroregionen 2015

Öppna jämförelser i överblick 2014

Överenskommelser om en förbättrad patientsäkerhet

Betydelsen av socialtjänstens organisering och ärendebelastning för kvaliteten i verksamheten vad visar befintliga studier?

BEHOV AV HÄLSO- OCH SJUKVÅRD I UPPSALA LÄN

B Johansson; Enheten för onkologi 1. Vad är evidensbaserad vård? Evidensbaserad vård. Birgitta Johansson.

Anvisningar för kodning av akut appendicit

Evidens-Baserad Medicin

Epidemiologi 2. Ragnar Westerling

Akademiska enheter inom specialistvård diabetes och neurologi utanför akutsjukhus

Bilaga 12. Etiska aspekter vid prioritering av vetenskapliga kunskapsluckor. inom ett forskningsfält. Inledning. reviderad 2015

IVBAR The Institute for Value- Based Reimbursement

Bilaga 7. Mall för kvalitetsgranskning av empiriska hälsoekonomiska studier

ÖVERBELASTNING OCH DESS KONSEKVENSER FÖR VÅRDEN LISA SMEDS ALENIUS

Litteraturunderlag till utvärdering av tandvårdsstöden

SVK i barnkirurgi i samarbete med VetU termin 10: Instruktion för projektarbete och examination

Anvisningar till rapporter i psykologi på B-nivå

Differentiell psykologi

SIR:s betydelse för IVA

Begreppet evidens. Den epistemologiska världskartan. Definitioner Evidens. Epistemologi. Kunskapsformer och evidens. Evidens

Aristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet

Sök artiklar i databaser för Vård- och hälsovetenskap

Sammanfattning. Skolverket (2005). 3

Löf SÄKER KIRURGI CHECKLISTOR ELLER RESILIENS? PELLE GUSTAFSON DOCENT, CHEFLÄKARE

Arbetsdokument Nationella riktlinjer för tandvård Tillstånd: Idiopatisk ansiktssmärta och atypisk odontalgi Åtgärd: Capsaicinkräm eller Lidokainsalva

Vårdprevention Lätt att göra rätt

Journal Club för sjuksköterskor ökar medvetenheten och kunskapen om evidensbaserad vård

Transkript:

Bör liten bli stor? Sjukhusstorlekens betydelse för vårdens resultat och kostnadseffektivitet En sammanställning och analys av vetenskaplig evidens Medical Management Centrum

Stockholm, mars 2015 Författare: Mats Brommels, Ulrika Vintmyr Ett uppdrag från Utredningen om högspecialiserad vård (S 2014:11)

Karolinska Institutet - Bör liten bli stor? Innehållsförteckning Sammanfattning 1. Bakgrund och uppdrag... 4 2. Metod... 5 3. Sökresultat och urval... 5 4. Resultat och analys... 7 4.1. Studier av samband mellan volym och utfall... 7 4.1.1 Översiktlig analys... 7 4.1.2 Diagnosspecifika primärstudier... 8 4.1.3 Generella primärstudier... 10 4.1.4 Diagnosspecifika systematiska litteraturanalyser... 11 4.1.5 Tröskelvärden... 13 4.2 Produktivitet och skalekonomier... 14 4.2.1 Kostnadsanalyser... 14 4.2.2 Stordriftsfördelar?... 16 5 Diskussion och slutsatser... 18 5.1. Medicinskt utfall... 18 5.2. Kostnader och skalekonomier... 21 5.3. Avslutande reflektioner... 22 6 Referenser... 24

Sammanfattning Denna studie har sammanställt och granskat aktuell internationell litteratur om sambanden mellan sjukhusstorlek och verksamhetens utfall, kostnader, effektivitet och om stordriftsfördelar kan påvisas. En systematisk sökning gjordes i fyra databaser, d.v.s. Cochrane (samtliga databaser), Medline (via PubMed), EMBASE samt Web of Science. Sökningen genomfördes i två steg. I steg ett avgränsades sökningen till systematiska litteraturöversikter. I steg två genomfördes en bredare sökning utan avgränsning avseende publikationsstatus, och även opublicerade studier, t.ex. konferensabstrakt inkluderades. Följande sökord användes i olika kombinationer: hospital volume, outcome, economies of scale, economies of scope, costefficiency) och MeSH (Medical Subject Headings) -termerna secondary care, tertiary healthcare. De funna artiklarnas referenslistor användes för att spåra ytterligare artiklar som belyste de aktuella frågeställningarna. En systematisk översikt av alla systematiska översikter med godtagbar kvalitet inriktade på diagnos- och åtgärdsområden hade publicerats år 2013 med material fram till halvårsskiftet 2012. Av den orsaken inkluderades endast diagnosspecifika systematiska översikter som rapporterats efter juli 2012. Primärstudier beaktades om de publicerats senare än en systematisk översikt inom samma område och utan tidsgräns om sådana helt saknades. Totalt identifierades 1 715 artiklar, varav 1 539 uteslöts efter att titel och/eller abstrakt screenats för relevans. Efter att ytterligare artiklar identifierats via referenslistor (snöbollsmetod) och bedömts för relevans granskades 276 artiklar i fulltext. Kriterierna för att inkluderas i den slutgiltiga litteraturanalysen var studierna var empiriska (på engelska eller skandinaviska språk) och analyserade samband mellan sjukhusstorlek, utfall, kostnader och effektivitet. Därtill inkluderades artiklar och utredningar om skalfördelar i sjukhusverksamhet (economies of scale and scope). Sammanlagt 96 studier granskades i detalj. Av dessa var 47 diagnosspecifika primärstudier, 4 generella primärstudier, 8 diagnosspecifika litteraturanalyser, och 13 artiklar som fokuserar på kostnader, effektivitet eller skalekonomier. Därutöver 10 generella litteraturanalyser samt 14 artiklar av diskussionskaraktär. Överlappningar mellan kategorierna föreligger och då har vi klassificerat artikeln utifrån huvudsaklig tyngdpunkt. Denna analytiska översyn av litteraturen om sambandet mellan sjukhusens verksamhetsvolym, kvalitet och medicinskt utfall samt kostnader, som är baserad på systematiska litteraturöversikter samt primärstudier rapporterade fram till slutet av år 2014, bekräftar i allt väsentligt den tidigare uppfattningen att sjukhus med höga verksamhetsvolymer har bättre utfall än sjukhus med låga verksamhetsvolymer. Vi har framförallt kunnat finna att de studier om statistiska samband mellan volym och utfall som publicerats under de senaste åren fyller alla de krav på noggrannhet i metod som förutsätts för att resultaten skall kunna betraktas som tillförlitliga. I studierna är utfallsmåtten riskjusterade och i analyserna standardiseras variablerna för skillnader i både sjukhus- och patientkarakteristika. Vad gäller sambandet mellan volym och kostnad är resultaten inte lika entydiga. Det kan inte på ett övertygande sätt hävdas att högvolymsjukhus är kostnadseffektiva. Vad gäller eventuella skalfördelar är det anmärkningsvärt att de studier som publicerats efter millennieskiftet inte omkullkastat de slutsatser som presenterats år 1999. Stordriftsfördelar kan uppnås vid låga volymer upp till 10 000 patienter på årsnivå eller 200 vårdplatser. Stordriftsnackdelar uppkommer från en sjukhusstorlek på 400 600 vårdplatser. 2

Studierna har i huvudsak gjorts på registermaterial, insamlade för administrativa ändamål, och analyserats retrospektivt. Under de senaste åren har metodkvaliteten varit god och resultaten har hög trovärdighet. Det är dock skäl att understryka att de endast anger statistisk association, och inte fastställer kausalsamband. I artiklarna förs dock diskussioner om eventuella förklaringar till det observerade positiva sambandet mellan sjukhusvolym och utfall. Medveten centralisering av patientfall inom specifika diagnos- och åtgärdsområden till välutrustade sjukhus ger organisationen och de behandlande läkarna möjlighet att kontinuerligt och med regelbundenhet handlägga patienter och öka sin erfarenhet. En likartad term är regionalisering, som innebär att ansvaret för definierade patientgrupper ges till ett eller ett fåtal sjukhus inom ett geografiskt upptagningsområde. Specialisering inom organisationer och bland specialister är en spegelbild av centralisering med delmotivet att också säkra större patientunderlag. Eftersom goda resultat vad gäller utfall i studier visat sig vara beroende inte enbart av volymer inom det aktuella diagnosoch åtgärdsområdet utan också korrelerar med höga volymer inom andra områden talar det för att fördelar kan uppnås om flera specialiserade enheter sammanförs i en gemensam sjukhusorganisation. Det möjliggör också samutnyttjande av dyra resurser, som en enskild specialitet inte kan utnyttja till dessas fulla kapacitet. Detta tros allmänt ge samordningsvinster, även om de granskade studierna inte kunnat påvisa generella kombinationsfördelar (economies of scope). Vissa studier pekar på att också mindre enheter som ingår i ett större sjukhussystem kan uppvisa lika goda resultat som stora enheter. Detta gäller särskilt verksamheter som omfattas av universitetssjukvård och karakteriseras av att de medverkar i forsknings-, utvecklings- och utbildningsverksamheter. I sådana system är det vanligare med tillämpning av evidensbaserade vårdprogram, kvalitetssystem, uppföljnings- och utvärderingssystem, resultatgranskning och god tillgång till specialistkonsultationer, vilket kan vara en förklaring till bättre resultat. 3

Karolinska Institutet - Bör liten bli stor? 1. Bakgrund och uppdrag I direktivet till utredningen om den högspecialiserade vården (Dir. 2014:56) konstateras att det finns ett behov av att se över hur den högspecialiserade vården kan koncentreras i högre grad än i dag i syfte att åstadkomma förbättrade vårdresultat, en mer jämlik vård samt ett mer effektivt utnyttjande av hälso- och sjukvårdens resurser. Direktivet hänvisar till den intensiva kunskapsutvecklingen inom hälso- och sjukvården med introduktion av nya teknologier och metoder för diagnostik och behandling, särskilt inom den högspecialiserade vården, ställer allt högre krav på utbildning och fortbildning av berörd personal samt samverkan mellan företrädare från flera specialiteter. Att uppnå den volym och kompetens som behövs för att kunna tillhandahålla en god och effektiv vård kan på sikt bli mycket svårt för många landsting. Den högspecialiserade vården utgör en mindre del av det totala vårdutbudet, men fyller en viktig funktion i vårdkedjan. Nivåstrukturering handlar om att se över hela vårdprocessen så att den samlade vården för en patient blir så god som möjligt. Att fatta beslut kring flera olika högspecialiserade vårdinsatser parallellt kan öppna upp för en lämplig fördelning av det nationella arbetet på flera vårdgivare. Utredningen har uppdragit åt Medical Management Centrum (MMC), Karolinska Institutet, att systematiskt gå igenom vetenskapliga artiklar avseende sjukhusstorleks betydelse för vårdens kvalitet/resultat och kostnader/effektivitet. Med sjukhusstorlek avses bl.a. antalet vårdplatser, produktion, budget. I uppdraget ingår att gå igenom kunskapsläget för frågeställningen, analysera resultatet och om möjligt lyfta såväl fördelar som nackdelar med stora respektive små sjukhus. Vi har valt att bryta ned den övergripande frågeställningen i följande delfrågor: - Vilken betydelse har sjukhusstorlek för vårdkvalitet/vårdutfall och kostnader/effektivitet? - Hur stark är den samlade evidensen kring sambandet mellan sjukhusstorlek och vårdkvalitet/utfall och kostnader/effektivitet? - Vilka bakomliggande faktorer till sjukhusstorlekens betydelse är identifierade i litteraturen? - I vilken utsträckning diskuteras tänkbara förklaringar till påvisade samband mellan sjukhusstorlek, vårdkvalitet/kostnader och kostnader/effektivitet? Denna rapport disponeras enligt följande. Rapporten inleds med en kort metodbeskrivning (kap 2) och redovisning av sökresultat och urval av artiklar (kap 3). Resultatredovisningen i kap 4 är sedan indelad i tre delar och inleds med en översiktlig beskrivning av litteraturen. Därefter följer en resultatsammanställning av studierna om sambandet mellan volym och utfall. Dessa har indelats i diagnosspecifika primärstudier, generella primärstudier och diagnosspecifika systematiska litteraturöversikter publicerade 2013-2014. I den tredje delen beskrivs och analyseras litteraturen om sjukhusstorlek och kostnader/effektivitet respektive skalekonomier. Framställningen avslutas med en diskussion av gjorda observationer samt reflektioner kring eventuella orsakssamband utgående från synpunkter som i huvudsak framförts i artiklarnas diskussionsavsnitt (kapitel 5).

2. Metod För att besvara ovan angivna forskningsfrågor har en litteraturanalys med systematisk sökning i följande fyra databaser genomförts: Cochrane (samtliga databaser), Medline (via PubMed), EMBASE samt Web of Science. Sökningen genomfördes i två steg. I steg ett avgränsades sökningen till systematiska litteraturöversikter. I steg två genomfördes en bredare sökning utan avgränsning avseende publikationsstatus, även opublicerade studier såsom konferensabstracts inkluderades. En kombination av nyckelord (hospital volume, outcome, economies of scale, economies of scope, cost-efficiency) och Medical Subject Headings, MeSH, (secondary care, tertiary healthcare) användes för att fånga all relevant litteratur som undersöker och analyserar förhållandet mellan sjukhusvolym och kliniska utfall och/eller kostnadseffektivitet. Sista sökningen i databaserna gjordes 2015-01-15. Därtill granskades referenslistor för att identifiera ytterligare artiklar som potentiellt inte infångats av vår sökstrategi. Syftet med litteraturanalysen är att identifiera och sammanställa den mest uppdaterade litteraturen av hög kvalitet med relevans för frågeställningen. Vi har samtidigt strävat efter att litteraturanalysen ska vara så heltäckande med avseende på diagnosområden och/eller kirurgiska metoder som möjligt. Vi har gjort vissa avgränsningar i vår litteraturanalys. Studier som enbart studerat sambandet mellan enskilda kirurgers behandlingsvolym och utfall exkluderats eftersom dessa bedömdes falla utanför den primära forskningsfrågan. Det innebär dock att vi inte systematiskt kunnat jämföra den relativa betydelsen av enskilda kirurgers behandlingsvolym mot sjukhusvolym. Samtidigt har kirurgers behandlingsvolym ingått som en viktig kontrollvariabel i flera inkluderade studier och vi har därför indirekt kunnat bedöma dess betydelse. Vår studie lider precis som flera andra litteraturanalyser av språkbias. Avgränsningen av studier publicerade enbart på engelska och skandinaviska språk kan ha inneburit att studier med ett delvis annat resultat publicerade på andra språk inte redovisas. 3. Sökresultat och urval Totalt resulterade vår sökstrategi i 1 715 artiklar, varav 1 539 uteslöts efter att titel och/eller abstract screenats för relevans. Efter att ytterligare artiklar identifierats via referenslistor (snöbollsmetod) och screenats för relevans granskades 276 full-textartiklar närmare för inkludering. För att inkluderas i litteraturanalysen krävdes att följande kriterier var uppfyllda (1) empiriska studier som mäter och kvantifierar samband mellan sjukhusstorlek (samtliga definitioner) och vårdkvalitet och/eller kostnadseffektivitet, (2) publicerade på engelska eller skandinaviska språk oberoende av publikationsstatus. Icke-empiriska studier, studier som inte har sjukhus som analysenhet och/eller förklaringsvariabel samt studier utan riskjustering för skillnad i patientsammansättning exkluderades. Sammanlagt inkluderades 96 studier i litteraturanalysen. 5

Potentiella artiklar identifierade och screenade (n=1117) Ori gina lartikla r/a bst ra c t publicera de e fte r s e nas t e SR (=598) Broa d scan f y lla i k uns ka ps l uc k or (n=6) Ex lude ra de artiklar då titel eller abst rac t int e rele v a nt/inte SR / dubbletter. (n=1056) Ex lude ra de artiklar då titel eller abstract nte i rel evant (n=483) Artiklar via snöbollsmetod (n=93) Artiklar som gra nska ts närmare för Relevans (n=276) Exk l ude ra de f ull-tex ta rt i klar (n=180) Analysenhet (n=25) Beroende var (n=2) Utanför aktuell tidsperiod (n=31) Ak t ue ll SRfinns (orgart.) (n=79) Dubbletter/Samm a emp.studie (n=15) Ejempiri sk studie ( n= 19 ) Bristfällig metodologisk kvalitet (n=9) Inkluderade studier HÄR SKA BILDEN SITTA (n=96) Figur 1. Litteratursökning och urval Såvitt vi har kunnat utröna publicerades den senaste generella systematiska litteraturanalysen ( systematic review of systematic reviews ) om sambandet mellan storlek (volym) och (kliniskt) utfall år 2013 (Pieper et al 2013). Pieper et al. (2013) är en systematisk litteraturanalys av samtliga publicerade diagnosspecifika litteraturanalyser av förhållandet mellan sjukhusvolym och kliniskt utfall fram till juli 2012. Artiklar som enbart studerade förhållandet mellan enskilda kirurgers behandlingsvolym (case-load) och kliniskt utfall hade uteslutits. Pieper et al (2013) tillämpar även strikta exklusionskriterier med avseende på metodologisk kvalitet. Vi har valt att betrakta den artikeln som en indexpublikation. Det innebär att vi valt att i vår analys endast inkludera diagnosspecifika systematiska översikter som publicerats efter juli 2012. När det gäller diagnosspecifika primärstudier har på motsvarande sätt två urvalskriterier tilllämpats 1) publicerad efter publikationsdatum för senaste diagnosspecifika litteraturanalys på aktuellt område, alternativt 2) ingen tidsgräns i det fall en systematisk litteraturanalys på diagnosområdet helt saknas. Författarna tog fram ett dataabstraktionsformulär, med vars hjälp information insamlad vid genomläsning av artiklarna strukturerades och dokumenterades för att möjliggöra jämförande analys och kategorisering av fynden. Exempel på kategorier är studiedesign, volymdefinitioner, utfallsmått, riskjustering för patientsammansättning och andra kontrollvariabler. 6

Hela materialet redovisas i en excel-fil som nås via nedanstående länk: https://www.dropbox.com/sh/rrykqms8hshnts8/aaalzxlgnyj7nfo7pgub77ija?dl=0 Detta omfattande material har kondenserats till en översiktlig tabell som finns tillgänglig i en excel-fil på: https://www.dropbox.com/sh/l8356mu0kmd6tfe/aadh62kt8p4ov94ps8rpdrcqa?dl=0 Tabell 1 är en sammanställning av de diagnosspecifika primärstudierna, tabell 2 de diagnosspecifika systematiska litteraturanalyserna och tabell 3 är en kvalitetsvärdering av de diagnosspecifika litteraturanalyserna enligt AMSTAR (Shea et al 2007). 4. Resultat och analys 4.1. Studier av samband mellan volym och utfall 4.1.1. Översiktlig analys Av de 96 artiklarna bedömer vi att 47 är diagnosspecifika primärstudier, 4 generella primärstudier, 8 diagnosspecifika litteraturanalyser, och 13 artiklar som fokuserar på kostnader, effektivitet eller skalekonomier. Kostnadsartiklarna behandlas i avsnitt 4.2. Därutöver ingår 10 generella litteraturanalyser samt 14 artiklar av diskussionskaraktär i vår översikt de analyseras i kapitel 5. Överlappningar mellan kategorierna föreligger och då har vi klassificerat artikeln utifrån huvudsaklig tyngdpunkt. För systematiska litteraturöversikter har en kvalitetsvärderingsmodell som bygger på ett verktyg för att kritiskt värdera den metodologiska kvaliteten i systematiska litteraturanalyser assessment of multiple systematic reviews (AMSTAR) framtagits av Shea et al (2007). Den ställer i huvudsak följande metodkrav på systematic reviews : att litteratursökning och urval genomförs av (minst) två oberoende forskare, att risk för publikationsbias liksom studiekvalitet kritiskt värderas samt att adekvata metoder för att syntetisera resultaten används. De senaste litteraturanalyser fäster också stor uppmärksamhet vid krav på primärstudier bl.a. genom att ta fasta på kritik som framförts mot tidigare studier. Sammanfattningsvis kan sägas att analys av samband mellan sjukhusvolym och medicinskt utfall förutsätter att utfallsmåtten riskjusteras och att man vid jämförelser korrigerar för skillnader i patientsammansättning och sjukhusens egenskaper. Vår översikt visar att hållningen år 2015 är att inga slutsatser kan dras från studier som inte beaktat dessa metodkrav. Både kraven på kvalitetsvärdering av systematiska översikter och en bedömning av hur väl de i översikterna ingående primärstudierna fyllt metodkraven genomsyrar den analys som gjorts i vår indexpublikation (Pieper et al 2013). Den sammanfattar också väl kunskapsläget vad gäller litteraturanalyser av diagnosspecifika studier. Vi återger därför artikelns innehåll i huvuddrag. Totalt ingår 32 diagnosspecifika litteraturanalyser som tillsammans täcker 14 skilda kirurgiska ingrepp. Samtliga fem artiklar inom tjock- och ändtarmscancer uppvisar tendens för att högvolym (HV) sjukhus har lägre mortalitet än lågvolym (LV) sjukhus. Författarna konstate- 7

rar dock att de senast publicerade litteraturanalyserna uppvisar relativt begränsade effekter och att sambandet tycks starkast för sambandet mellan HV och överlevnad. Till skillnad från evidensläget för tjock- och ändtarmscancer saknas en aktuell litteraturanalys inom diagnosområdet aortabråck (buk). Av de fyra publicerade artiklarna uppvisar samtliga fyra evidens eller moderat evidens för ett negativt samband mellan HV sjukhus och lägre mortalitet. Författarna påtalar att den enda metaanalys som genomförts har stora metodologiska brister. En aktuell metaanalys inom bypassoperationer/pci uppvisar små effekter till stöd för ett negativt samband mellan HV och mortalitet. Efter sammanvägning med två tidigare litteraturanalyser konkluderar författarna att det finns moderat evidens för ett volym-utfallförhållande. Baserat på två litteraturanalyser av moderat kvalitet konkluderar Pieper et al (2013) att sambandet mellan volym och utfall inom knäledskirurgi är oklart. Av samtliga diagnos-områden som ingår i översikten återfinns det starkaste sambandet mellan volym och mortalitet inom bukspottskirurgi. Två litteraturanalyser som publicerats på området uppvisar båda konsistenta och övertygande samband. Den enda litteraturanalys som finns publicerad inom artärkirurgi (nedre extremitet) tycks tala för samband mellan volym och mortalitet, även om effekterna är förhållandevis små. Pieper et al (2013) konkluderar även att det finns tillräcklig evidens till stöd för att fastställa ett negativt samband mellan HV och mortalitet inom obesitaskirurgi, matstrupscancer, en inom lungcancer, radikal prostatektomi, bröstcancer, radikal cystektomi samt nefrektomi. Vad gäller endarterektomi (halsartär) konstaterar författarna att trots att flera primärstudier stödjer samband mellan volym och utfall har den systematiska litteraturanalysen så stora metodologiska svagheter att evidensläget är svårt att bedöma. 4.1.2 Diagnosspecifika primärstudier Inledningsvis bör det noteras att de inkluderade studierna uppvisar stora inbördes skillnader i studiedesign och definition av brytpunkter för hög (HV) respektive låg volym (LV). Det medför begränsade möjligheter för att genomföra en kvantitativ syntes av resultaten. Likaså bör jämförelser av resultat och tröskelvärden inom och mellan diagnosområden göras med viss försiktighet. Majoriteten av studierna har t.ex. valt att modellera volym som en kategorisk istället för kontinuerlig variabel. En risk är därmed att s.k. outliers, dvs. extremvärden (felaktigt) ökar det statistiska sambandets styrka så att det når signifikans samt att vi har begränsad information om sambandets form (linjärt, avtagande etc.) (Richardson et al 2013). Det finns även en risk att de tröskelvärden som valts för att definiera HV resp. LV ibland är godtyckliga. Så har t.ex. volymgränser i vissa studier valts för att säkerställa lika stora patientvolymer i respektive kategori. Mot bakgrund av den relativt begränsade evidens som idag finns kring underliggande förklaringsmekanismer för volym-utfallrelationen är det slående att en majoritet av studierna inte kontrollerar för vad som i teorin torde utgöra viktiga förklaringsvariabler. Endast 8/53 (15 %) (Shi et al (2013:22); Shi et al (2013:28); Karamlou et al (2014); Lu et al (2014); Enomoto et al (2014); Porembka et al (2014; Joynt et al (2011) Falcoz et al (2014)) av de granskade primärstudierna som analyserar betydelse av sjukhusstorlek för diagnosspecifika kliniska utfall (mortalitet) har samtidigt kontrollerat för enskilda operatörers (kirurgers) behandlings-volym. 8

I tre studier kunde demonstreras att den oberoende effekten av sjukhusstorlek försvann vid kontroll för enskilda kirurgers behandlingsvolym. Långt färre - 1/53, motsvarande 2 % (Tung et al 2014) av primärstudierna - har kontrollerat för processfaktorer och rutiner för att säkerställa god vårdkvalitet. Det bör även nämnas att samtliga granskade studier mäter samband mellan diagnosspecifik (patient)volym och utfall. I ett fåtal studier (7/40) utgör total sjukhusvolym en kontrollvariabel. Vi kan även konstatera att både den publicerade och opublicerade litteraturen i hög grad är kontextbunden. Majoriteten (34 av 53) studier är publicerade i USA. Flera av dessa studier bygger dessutom på register som enbart täcker Medicare-befolkningen, dvs. individer äldre än 65 år, vilket innebär en ytterligare inskränkning i generaliserbarhet av resultaten. Näst vanligast (10) är studier från Asien, i synnerhet Japan och Taiwan. Ett mindre antal studier (6) är publicerade i Västeuropa (Storbritannien, Nederländerna, Tyskland, Frankrike, Sverige). Dessa metodologiska reservationer är självfallet viktiga att beakta i samband med att slutsatser utifrån litteratursammanställningen dras. Av dessa skäl har vi även avstått från att redovisa sambandens storlek och styrka och istället valt att indela resultaten i tre kategorier: 1) negativt signifikant samband mellan hög volym och låg mortalitet (evidens), 2) negativt ickesignifikant samband (tendens) och 3) positivt eller icke-signifikant samband (ingen evidens). Av de 43 primärstudier som har mortalitet som primärutfall uppvisar en klar majoritet (37 av 43 studier, dvs. 86 %) evidens (31 studier) eller tendens (6 studier), ett resultat som är helt i linje med de flertalet generella litteraturöversikter över volym-utfallrelationen som publicerats från 1997 och framåt (se avsnitt 6, Slutsatser och diskussion). Ingen av studierna uppvisar ett signifikant positivt samband mellan volym och mortalitet, dvs. att låg volym skulle vara gynnsamt för låg mortalitet. Samtliga sex studier som visar ett positivt samband saknar signifikans. Detta samband gäller även, om än svagare, för de studier som har komplikationer och/eller återinläggningar som primärt eller sekundärt utfallsmått. En knapp majoritet (12 av 22 studier, dvs. 55 %) uppvisar evidens (10 studier) eller tendens (2 studier) för samband mellan volym och komplikations- eller återinläggningsfrekvens. Av de resterande tio studierna visade tre ett signifikant positivt samband mellan volym och komplikationsrisk, i övriga studier kunde signifikans inte fastställas. I två tredjedelar av studierna som har fler än ett utfallsmått korrelerar komplikationsrisk och mortalitet. Av de studier som analyserat sambandet mellan volym och vårdtid respektive volym och kostnader är sambanden mindre entydiga. En knapp majoritet (6 av 11 studier) uppvisar evidens för samband mellan högre patientvolym och kortare vårdtid. När det gäller kostnader är sambandet det omvända: en knapp majoritet (7 av 13 studier) uppvisar ingen evidens för samband mellan högre volym och lägre kostnader. En sammanställning av de diagnosspecifika primärstudierna enligt diagnos eller åtgärd återfinns i Tabell 1 i elektronisk bilaga https://www.dropbox.com/sh/l8356mu0kmd6tfe/aadh62kt8p4ov94ps8rpdrcqa?dl=0 Tabellen sammanfattar de resultat som beskrivits ovan samt redovisar korrelationsstyrka (procentuell skillnad i mortalitet mellan HV och LV) i de fall det finns angivet. 9

Som påpekats tidigare har studier som inte justerat för patientsammansättning uteslutits från denna översikt. Av de 53 casemix-justerade studier som ingår i resultatsammanställningen når 9 studier upp till den högre kvalitetsgraderingen genom att justering vid sidan samsjuklighet (komorbiditet) även gjorts för socioekonomiska faktorer. I en retrospektiv studie (Singla et al 2011) analyseras 217 948 patienter med komplikationer till följd av levercirrosis under åren 1998-2006 i syfte att studera förekomsten av volymfördelar vid sådan behandling. Sjukhus delades in tre lika stora volymkategorier utifrån antal intagna med cirrosdiagnos per år; låg volym (1-40), medium volym (41-87) och hög volym (>87). I studien justerades för patientdemografi (ålder, kön, etnisk tillhörighet) samt sjukvårdsförsäkring som kan betraktas som en proxy för socioekonomi. Ett validerat komorbiditetsindex (Elixhausermetoden) som baseras på en sammanvägning av ICD-9 koder och DRG användes för att justera för samsjuklighet. En fyrgradig skala (0-3) utnyttjades för att klassificera patienter utifrån grad av samsjuklighet. Fördelen med detta index är enligt författarna att det exkluderar diagnoser som är ett resultat av behandlingskomplikationer snarare än underliggande komorbiditet (Singla et al 2011). Vid den multivariata statistiska analysen kontrollerades även för antal vårdplatser samt status som universitetssjukhus. Resultatet av analysen visar att behandling vid HV sjukhus ger lägre mortalitet: hazard ration (HR 0,88; 95% KI 0,83-0,92). Medan en volymfördel således kunde fastställas för studiens primärutfall slutenvårdsmortalitet visade analysen att vårdtid samt kostnader tenderade att vara högre vid högvolym sjukhus än lågvolym sjukhus samt att HV sjukhus i signifikant högre utsträckning var större med avseende på antal vårdplatser samt oftare hade status som universitetssjukhus. 4.1.3 Generella primärstudier Vid sidan av de diagnosspecifika primärstudier som sammanställts och redovisats ovan finns ett mindre antal studier i vilka patientvolym, sjukhusstorlek eller sjukhuskaraktäristik istället för diagnosområde eller kirurgiskt metod står i förgrunden. I en nyligen publicerad studie jämförs volym-utfallsambandet för åtta olika diagnosområden vid fem separata två-årsperioder mellan 2000 och 2009 (Reames et al 2014). I studien ingick drygt 3 miljoner patienter över 65 år som behandlats för någon av följande diagnoser: esofagektomi, kolektomi, pankreatektomi (GI); aortaklaffbyte, mitralklaffbyte, koronar-bypass (kardiologi); aortabråck, endarterektomi karotis (kärlsjukdomar). Studien baseras på en nationell administrativ databas som täcker samtliga patienter över 65 år som ingår i den statliga sjukvårdsförsäkringen Medicare. Riskjustering för skillnad i patientsammansättning gjordes för demografi (ålder, kön, etnisk tillhörighet) samt komorbiditet enligt Elixhauser-metoden. Patientvolym modellerades både som kontinuerlig och kategorisk variabel i fem inbördes lika stora kvintiler (mycket låg, låg, medel, hög, mycket hög) som varierade med diagnosområde. Ett signifikant negativt samband mellan volym och slutenvårdsmortalitet kunde fastställas för samtliga åtta ingrepp och detta samband kvarstod över tid. I fem av åtta ingrepp ökade sambandet i styrka över tid, dvs. betydelsen av hög patientvolym för lägre mortalitet ökade från 2000 till 2009. Sambandet analyserades separat för respektive två-årsperiod med hänsyn till longitudinella förändringar. Störst effekt observerades för pankreatektomi, i absoluta tal minskade den justerade odds ration från (OR 5,83: 95 % KI 3,64 9,36) år 2000 till (OR 3,08: 95 % KI: 2,07 4,57) år 2009 medan det svagaste sambandet observerades för kolektomi där 10

mortaliteten var i stort sett oförändrad (OR 1,08: 95 % KI 1,01 1,15) år 2000 jämfört med (OR 1,20: 95 % KI 1,13 1,28) år 2009. Studiens resultat indikerar enligt Reames et al att volym-utfallsambandet är stabilt över tid och tycks gälla oberoende av de tekniska innovationer som införts i sjukvården och lett till ökad patientsäkerhet och därmed förbättrad överlevnad vid kirurgiska ingrepp. Författarna framhåller även att givet avsaknad av detaljerad information om enskilda sjukhus resultat samt vid små patientvolymer såsom högriskingrepp, t.ex. pankreatektomi och esofagektomi, i vilka statistisk signifikans inte kan fastställas för resultatindikatorer är patientvolym alltjämt en relevant proxy för (indirekt mått på) kirurgisk kvalitet. För ingrepp som genomförs med större frekvens, t.ex. hjärtkirurgi och kolektomi, fungerar enligt författarna direkta mått såsom komplikationer och funktionellt utfall som tillförlitlig evidens för kirurgisk kvalitet. (Reames et al 2014). I en studie baserad på cancerregisterdata från Pennsylvania jämförs sjukhus med olika status och struktur (Friese et al 2010). I studien som baseras på data från 1998 och 1999 ingick totalt 24 618 patienter som behandlats i slutenvården för någon av följande cancerformer: kolorektal, prostata, endometriel, livmoder, hals och huvud, lungor, matstrupe, bukspottkörtel. Av sex variabler (undervisningsintensitet, antal vårdplatser, cancerprogram (NCI), cancer-program (COC), avancerad kirurgi, patientvolym) uppvisade endast status som cancerprogram (NCI) signifikant samband med 30 dagars mortalitet efter riskjustering för patientsammansättning och sjuklighet. En förklaring till att volym inte var signifikant kan enligt författarna bero på att av de inkluderade cancerkategorierna var det endast ett fåtal där ett volym-utfallsamband belagts i tidigare studier och att andra cancerformer möjligen skulle ge ett annat resultat. En studie som utnyttjar utskrivningsdata från 2008 jämför lokala sjukhus i Florida utifrån struktur och status (Carretta et a, 2013). I studien ingick knappt 2 miljoner patienter fördelade i fyra volymmässigt lika stora diagnosområden (hjärtinfarkt, hjärtsvikt, stroke och lunginflammation). Fem variabler: anslutning till sjukvårdsnätverk, vinstdrivande, universitetssjukhus, antal vårdplatser och patientvolym analyserades. Volym uppvisade ett signifikant negativt samband med 30 dagars mortalitet för alla diagnosområden med undantag av lunginflammation. Stora sjukhus (fler än 300 vårdplatser) uppvisade nästan genomgående ett signifikant positivt samband med 30 dagars mortalitet. 4.1.4 Diagnosspecifika systematiska litteraturanalyser Vi har sammanställt vår bedömning av de diagnosspecifika litteraturanalyserna i Tabell 2 (se elektronisk bilaga). https://www.dropbox.com/sh/l8356mu0kmd6tfe/aadh62kt8p4ov94ps8rpdrcqa?dl=0 I den anger vi publikationsår, antal studier som ingår i översikten, hur många som visar evidens respektive tendens eller ingen evidens samt resultat av metaanalys i de fall en sådan genomförts. Till skillnad från Pieper et al (2013) har klassificeringen evidens och moderat evidens i denna tabell slagits samman till en kategori evidens för att bättre överensstämma med den övriga resultatsammanställningen. Samtliga systematiska litteraturanalyser som publicerats åren 2013-2014 uppvisar evidens för ett positivt samband mellan hög volym och mortalitet. En kritisk granskning och värdering av 11

den metodologiska kvaliteten för respektive systematisk litteraturanalys visar att dessa generellt håller acceptabel eller hög kvalitet (se Tabell 3, elektronisk bilaga). https://www.dropbox.com/sh/l8356mu0kmd6tfe/aadh62kt8p4ov94ps8rpdrcqa?dl=0 Ibland ofullständig information har medfört att vi inte fullt ut kunnat värdera kvaliteten av ingående primärstudier. I de fall det angivits har vi dock endast inkluderat studier som riskjusterats vid summering av resultaten. Metodologiska brister i de ingående studierna har medfört att endast ett mindre antal av studierna har ingått i metaanalys eller slutlig resultatsummering. Trots att resultatsammanställningen ger en tämligen entydig bild till fördel för HV sjukhus finns vissa förbehåll som är viktiga att framhålla vid tolkning av resultaten. I likhet med de primärstudier som sammanställts och redovisas i denna rapport är de studier som ingår i de systematiska litteraturanalyserna heterogena med avseende på studiedesign, volymdefinitioner och tidsgränser avseende primärutfall (mortalitet). Det framgår t.ex. att det finns geografiska variationer, ett HV sjukhus i en region kan definieras som LV i en annan region, med begränsad jämförbarhet som följd. Det kan också konstateras att hög volym i många fall avser relativt låga volymer. Ett belysande exempel är radikal prostatektomi (RP), där studier visar att 80 procent av kirurgerna i USA utför 10 eller färre RP och endast 5 procent utför fler än 50 RP per år (Trinh et al 2013). Gemensamt för flera av de diagnosspecifika litteraturanalyserna är att avsaknaden av evidens av högsta kvalitetsgradering gör det svårt att fastställa adekvata tröskelvärden för patientvolym per år. Det har även påpekats att för vissa ingrepp saknas diagnosspecifika riskjusteringsinstrument, vilket riskerar att övervärdera effekten av patientvolym på kliniskt utfall (Eskander el al 2014). Det har noterats att sambandet kan vara starkare i vissa subgrupper, såsom de mest komplexa, högrisk- och svårt sjuka patienterna som behandlas vid intensivvårdsavdelningar (Abbenbroek et al 2014; Caputo et al 2014). I den systematiska litteraturanalysen av intensivvård konstaterades även att sambandet mellan volym och utfall var icke-linjärt och att de gynnsamma effekterna av HV avtog efter en volym motsvarande 450 patienter per år enligt en studie, medan en annan studie fastställde det övre tröskelvärdet till 711 patienter per år (Abbenbroek et al 2014). En välgjord systematisk litteraturanalys kännetecknas bl.a. av systematik vid sökning i databaser och tillämpning av strikta inklusions- och exklusionskriterier. Ett exempel på det senare är en litteraturanalys av volym-utfallsambandet för leverkirurgi (Richardson et al 2013) där sökning gjorts i Cochrane, Medline samt EMBASE för perioden 1995-2012. I studien uteslöts bl.a. studier som inkluderade data äldre än tio år i förhållande till publikationsdatum, något som är vanligt förekommande i primärstudier. Därtill inkluderades endast den senaste artikeln i de fall samma datamaterial låg till grund för flera studier för att undvika överlappning och potentiell statistisk bias. Totalt inkluderades 17 artiklar i litteraturanalysen. Till skillnad från flera av de övriga litteraturanalyser som ingår i denna översikt har Richardson et al gjort separata analyser av sambandet volym-mortalitet beroende på vilken typ av volymindelningar som gjorts i primärstudierna. I ett första steg analyseras 12 studier där en indelning i två dikotoma volymgrupper gjorts. Det sammantagna resultatet visar ett starkt samband mellan låg volym och högre mortalitet (OR 2,0: 95 % KI 1,6 2,4). I nästa steg genomfördes en meta-analys av fem av dessa 12 studier som justerat för case-mix och andra 12

kontrollvariabler. Efter riskjustering försvagades sambandet (pooled OR 1,5: 95 % KI 1,0 2,1) som precis nådde statistisk signifikans (P=0,03). Åtta studier hade fler än två volymgrupper och eftersom de lägsta och högsta volymkategorierna tenderade att vara avsevärt lägre resp. högre än vid en dikotom jämförelse valde författarna att analysera dessa separat. Denna meta-analys kunde demonstrera ett påtagligt starkare effektsamband (pooled OR 3,2: 95 % KI 1,7 5,8). Dessa åtta studier uppvisade dock stor heterogenitet (I 2 =92,8 %) sinsemellan. Författarna konkluderade att ett starkt negativt samband mellan hög volym och lägre mortalitet kan fastställas för leverkirurgi samt att ett visst belägg för ett dos-responssamband, d.v.s. jämförelser mellan mycket HV och mycket LV ger större effektutslag än jämförelser mellan HV och LV. Samtidigt är enligt författarnas beräkningar genomsnitts-volymen för LV sjukhus tre leverkirurgipatienter eller färre per år, vilket av författarna framhålls som ett mycket lågt värde som riskerar att skapa skevheter i jämförelser mellan LV och HV sjukhus (Richardson et al 2013). 4.1.5 Tröskelvärden Vid vår genomgång av inkluderade studier kan vi konstatera att endast i ett fåtal studier har tröskelvärden kunnat fastställas. Gemensamt för flera av dessa är att volym modellerats som både kategorisk och kontinuerlig variabel. Genom den senare analysmetoden kan vi få kunskap om sambandets utseende, dvs. om det är linjärt eller icke-linjärt och vid vilka volymer sambandet i så fall planar ut eller avtar, istället för jämförelser som bygger på ofta godtyckliga volymindelningar. I en välgjord studie av kirurgiska metoder vid byte av aortarot (Hughes et al 2013), i vilken totalt 13 358 patienter vid 741 nordamerikanska sjukhus ingick och resultaten baseras på inrapporterade uppgifter till ett kvalitetsregister, konstaterades att volym-utfallförhållandet var icke-linjärt oberoende av om det modellerats som kategorisk eller kontinuerlig variabel. Ett signifikant negativt samband mellan LV och högre mortalitet konstaterades och detta samband var starkast bland sjukhus som genomförde färre än 30-40 ingrepp per år, dvs. varje volymökning inom detta spann ger störst effektutslag i form av lägre mortalitet. Studien anger inte någon optimal volymnivå. Studiens design medgav inte heller kontroll för enskilda kirurgers behandlingsvolym. En studie av ortotopisk hjärttransplantation omfattande 18 226 patienter vid 141 nordamerikanska sjukhus (Arnaoutakis et al 2012) indikerar att ett nedre tröskelvärde (miniminivån) med avseende på ettårsmortalitet för patienter med låg risk går vid 10 transplantationer per sjukhus och år. För patienter med högre risk är det nedre tröskelvärdet 35 transplantationer per sjukhus och år. I studien, som inte anger någon optimal nivå, konstateras samtidigt att ett sådant högt tröskelvärde kan vara svårt att implementera i praktiken mot bakgrund av att endast 9 sjukhus i USA vid studiens publicering nådde över denna behandlingsvolym. I en studie av pediatrisk extrakorporal membranoxygenering (ECMO) publicerad 2014 (Freeman et al 2014) fastställdes det nedre tröskelvärdet (miniminivån) för förbättrad överlevnad till 22 patienter per sjukhus och år. I studien ingick 7 322 patienter under 18 år. Givet att volymgränserna är känsliga för indikationsklassificering framhåller författarna att ytterligare studier krävs för att validera den fastställda minimigränsen. I en stor studie av mortalitet och kostnader för strokevård i Japan under 2010 konstaterades ett signifikant negativt volym-utfallsamband för samtliga stroke-subgrupper (Tsugawa et al 13

2013). Studien som omfattade 66 406 patienter vid 796 sjukhus fann även att sambandet mellan volym och slutenvårdsmortalitet inte var helt linjärt och planade ut efter cirka 50 utskrivningar per halvår, dvs. att den gynnsamma effekten av hög volym planade ut efter detta tröskelvärde. Sjukhus i mellanskiktet avseende volym (51-100 patienter) uppvisade ingen statistisk säkerställd skillnad i mortalitet jämfört med högvolymsjukhus (>100 patienter). I en tysk studie från 2014 (Hentschker & Mennicken 2014), omfattande 7 980 patienter med bråck i bukaortan vid 386 sjukhus och 89 302 patienter med höftledskirurgi, indelades patienterna i fem lika stora volymgrupper för de två kirurgiska åtgärderna. Vid jämförelse med den lägsta volymgruppen (3-15 patienter per sjukhus) för aortabråck visade volymgrupp tre (26-39 patienter per sjukhus) och fyra (40-67 patienter per sjukhus) signifikant lägre mortalitet. I den högsta volymgruppen (68-209 patienter per sjukhus) kunde ingen statistisk säkerställd skillnad jämfört med lägsta volymgruppen fastställas men det kan enligt författarna bero på att endast 15 sjukhus ingick i femte volymgruppen. Någon statistiskt signifikant skillnad mellan två angränsande volymgrupper kunde inte fastställas. Vad gäller höftledskirurgi visade en jämförelse mellan den lägsta (10-58 patienter per sjukhus) och högsta volymgruppen (fler än 82 patienter per sjukhus) en statistiskt signifikant skillnad i mortalitet till fördel för högvolymsjukhusen. Skillnaderna mellan två angränsande volymgrupper var statistisk signifikant i samtliga fall utom mellan den andra och tredje gruppen. I en nyligen publicerad studie av komplex lever-, bukspottskörtel- och gallvägskirurgi (hepatico-pancreatico-biliarkirurgi, HPB) i USA utnyttjades två separata databaser Surveillance, Epidemiology and End Results (SEER-Medicare) från 1986-2002 och Nationwide Inpatient Sample (NIS) från 2002-2010 (Schneider et al 2014). Totalt ingick 10 218 patienter i SEER- Medicare-studien som indelades i tre volymgrupper: lågvolym (1-3 patienter per sjukhus per år, LV), mellanvolym (4-10 patienter per sjukhus per år, MV) samt högvolym (fler än 11 patienter per sjukhus per år, HV). Mortaliteten halverades när patienter behandlades vid högvolymsjukhus (5,4 %) jämfört med lågvolymsjukhus (10,5 %). NIS-data från 2010 användes för att fastställa i vilken utsträckning en dos-responseffekt kunde identifieras bland högvolymsjukhus, d.v.s. om utfallet kontinuerligt förbättras då volymerna höjs. År 2002 behandlades drygt hälften (56 %) av patienter vid HV-sjukhus. Schneider et al (2014) noterade att år 2010 när denna andel hade ökat till över tre fjärdedelar (78,5 %) försvann de volymbaserade skillnaderna i slutenvårdsmortalitet (HV 4,2 % vs. MV 5,2 % vs. LV 2,4 %; P=0,31). Sjukdomar som kräver denna synnerligen komplicerade operation är ovanliga och antalet behandlade patienter lågt, vilket framgår av indelningen i låg-, mellan- och högvolymsjukhus. Författarna identifierade emellertid också sjukhus, till vilka ett större antal patienter koncentrerats. Sjukhus som genomförde över 150 HPB-åtgärder per år uppvisade en signifikant lägre mortalitet (2,1 %) än sjukhus i volymspannet 11-149 HPBåtgärder (4,6 %) (P=0,04). Studien tyder på att åtminstone för komplicerade kirurgiska åtgärder ger mycket stora volymer ytterligare en kvalitetsfördel. 4.2 Produktivitet och skalekonomier 4.2.1. Kostnadsanalyser De flesta studier som analyserat relationen mellan produktionsvolym och kostnader gäller högspecialiserade verksamheter. Dessa visar en tendens mot skalfördelar, d.v.s. lägre enhetskostnader vid stigande volymer. Sambanden är emellertid inte enkla eller linjära. En tvärsnittsstudie av intensivvårdsenheter i England (O Neill et al 2000) fann visserligen att enhets- 14

kostnaderna minskade vid högre volymer (mätt som antal intensivvårdsdagar), men effekten var mest påtaglig för enheter med lägre behandlingsintensitet. Effekterna avklingar då patienternas komplexitetsgrad ökar. En av studiernas styrkor var att materialet analyserats med volym som en kontinuerlig och inte dikotom variabel. Kostnadsreduktionen följde den minskande gränsnyttans lag, d.v.s. minskade i storlek med växande volymer. Exempel på högspecialiserade verksamheter som studerats med avseende på kostnader är cochleaimplantat vid hörselnedsättning (Barton et al 2004), kirurgisk behandling av cancer i munhålan (Chen et al 2013) och pancreatikoduodenektomi (Enomoto et al 2014). I det första fallet uppstod kostnadsfördelen vid större volymer genom lägre personalkostnad per patient, och effekten planade ut vid nio operationer på barn och tjugo operationer på vuxna per år. Vid oral cancer var både kostnaden för primärbehandlingen och de totala sjukvårdskostnaderna per patient under det första året signifikant högre för sjukhus med låga volymer detsamma gällde med kirurg som observationsenhet. Sjukhus och kirurger indelades i tre volymkategorier: låg (1-39 operationer årligen för sjukhus, 1-8 operationer för kirurger), mellan (40-76 operationer och 9-21 operationer) samt hög (86-244 operationer och 22-96 operationer). Vid pancreaskirurgi hade högvolymsjukhus med höga case-load per kirurg lägre mortalitet, fem dagar kortare medelvårdtid och signifikant lägre kostnad per patient än lågvolymsjukhus med låga case load per kirurg. Tröskelvärdena var 11 operationer för sjukhus och 5 operationer för kirurger. I högspecialiserad verksamhet är patientvolymerna oftast små, vilket exemplen ovan demonstrerar. Två studier har identifierats som analyserat kostnadsbilden för större patientgrupper. Båda gjorde justeringar för både patient- och sjukhuskarakteristika. Shi et al (2013) rapporterade ett registermaterial om nära 100 000 patienter. Kostnaderna för en bröstcanceroperation var signifikant lägre på högvolymsjukhus än på lågvolymsjukhus det gällde både för sjukhusvolym (skillnaden var 12 %) och kirurgernas case-load (antal patienter per kirurg) (skillnaden var 26 %). För strokepatienter (över 66 000 i den aktuella studien) var resultaten inte lika entydiga (Tsugawa et al 2013). Sjukhusen indelades i tre kategorier: lågvolym (10-50 patienter under ett halvår), mellanstorlek (51-100 patienter) och högvolym (över 100 patienter). Lågvolymsjukhusen hade signifikant högre sjukhusmortalitet (odds-ratio 1,45) men 8 % lägre kostnad per patient än högvolymsjukhusen. Den statistiska associationen mellan volym och mortalitet var signifikant i samtliga tre grupper av strokepatienter (subaraknoidal blödning, trombotisk stroke och hemorragisk stroke). Högvolymsjukhusen hade signifikant högre enhetskostnad för subaraknoidal blödning, medan skillnaderna i de två övriga grupperna inte var signifikanta. Som också denna del av översikten visar dominerar studierna av kirurgiska åtgärder litteraturen. För dessa gäller att vårdepisoden är väl avgränsad, utfallsmåtten relativt lätta att definiera och mäta och uppföljningsperioden kan vara kort (t.ex. 30 dagar efter utskrivning). Resultaten kan svårligen generaliseras till kroniska sjukdomar med variationer i symptomgrad och återfall. Av särskilt intresse är därför att noggrannare redovisa en studie av sambanden mellan sjukhusvolym, vårdprocesser, utfall och kostnader för hjärtsviktspatienter (Joynt et al 2011). Denna registerstudie omfattade över 4 000 sjukhus i USA och fler än 1 miljon patienter. Sjukhusen kategoriserades i lågvolym (25-500 patienter under den 23 månader långa uppföljningstiden), mellan (201-400 patienter) och hög (över 400 patienter). Utfallsmåtten var sjukhusmortalitet, mortalitet efter 30 dagar och återinläggningar inom 30 dagar; samtliga riskjusterade. Den multivariata analysen gjordes med volym som kontinuerlig variabel och med standardiseringar för sjukhus- och patientkarakteristika. Av särskilt intresse var att också vårdprocessen bedömdes i form av diagnosspecifika kvalitetsindikatorer: procentandel patien- 15

ter som erhöll instruktioner inför utskrivning, bedömning av hjärtats vänsterkammarfunktion, adekvat medicinering för nedsatt vänsterkammarfunktion och rökavvänjningsrådgivning. Resultaten visade en positiv statistisk association mellan volym och sammanvägt kvalitetsindex och negativ association mellan volym och utfall (mortalitet och återinläggningar). I det senare fallet är sambandet inledningsvis lineärt, men når en platå vid 200-400 patienter behandlade under 23 månader. Ytterligare reduktion av mortalitet eller andel inläggningar sker inte efter detta volymspann. Intressant nog stiger kostnaderna per behandlad hjärtsviktspatient med ökande volymer, dock så att kostnadsökningen är mindre markant i högvolymgruppen av sjukhus. Vid en jämförelse mellan låg- och högvolymgrupperna framgick att ett högvolymsjukhus har ett kvalitetsindex som är 13,5 % högre och en återinläggningsfrekvens som är 18 % lägre än vid ett lågvolymsjukhus. Samtidigt är kostnaden per patient 400 dollar högre. Författarna anser att kvalitetsvinsten motiverar den högre kostnaden, men påpekar att långtidsuppföljning krävs för att ge ett uttömmande svar på om så är fallet. Författarna diskuterar också hur dessa resultat kan förklaras. En möjlighet är att större erfarenhet relaterad till högre volymer är parad med beredskap att följa riktlinjer och därmed leder till högre kvalitetsindex. En studie som citeras i artikeln har dock visat att följsamhet mot kvalitetsstandarderna inte automatiskt leder till bättre utfall i form av minskad mortalitet eller färre återinläggningar. Endast en studie av en rutinåtgärd identifierades. Vid blindtarmsoperation på barnpatienter fann Lee et al (2013) att universitetsanknytning, låg totalvolym av barnpatienter och låg personaltäthet (antal sjuksköterskor per vårddygn) var karakteristiskt för lågkostnadssjukhus. Kostnadsfördelar för mellanstora och stora sjukhus kunde man finna enbart vid okomplicerad blindtarmsinflammation. Den generella slutsatsen var att stora barnsjukhus har en ofördelaktig kostnadsstruktur. 4.2.2. Stordriftsfördelar? Den tidigaste identifierade studien av möjliga skalfördelar gällde urologi och publicerades år 1990 (Munoz et al 1990). Studien genomfördes på ett universitetssjukhus och analyserade kostnadsskillnader mellan urologer med högt antal patienter jämfört med urologer med lägre patientantal. De sistnämnda hade sämre utfall, högre kostnader per patient och kostnader som översteg DRG-ersättningen. För patienter med förplanerad behandling konstaterades en signifikant negativ korrelation mellan volym och enhetskostnad (Pearsons korrelationskoefficient - 0,129). Patienterna hade emellertid inte riskjusterats och författarna påpekar att effekten kan bero på att läkare med lägre volymer behandlar mer komplicerade fall. Huvuddelen av de artiklar som behandlar skalfördelar genomför ekonometrisk analys av registerdata. T.ex. Li och Rosenman (2001) fann att diagnostiska och terapeutiska åtgärder utgör substitut till kärntjänsten sluten sjukhusvård, d.v.s. att högre åtgärdsintensitet leder till kortare vårdtider (en effektivisering ). Mottagningsverksamheten är däremot komplementär till kärnverksamheten och en expansion av den är därmed kostnadsdrivande. Resultaten är kontra-intuitiva och reser frågan om den analysen enbart är av teoretiskt intresse. Slutsatsen att sjukhusen uppvisar potentiella signifikanta stordriftsfördelar skalfördelar (economies of scale) men inte kombinationsfördelar (economies of scope) bör därför betraktas med försiktighet. 16

Preyra och Pink (2006) använde historiska kostnadsdata från sjukhus i provinsen Ontario inför ett beslut om omfattande omstrukturering av sjukhussektorn (stängningar och fusioner av sjukhus). Utifrån en simulering drog författarna slutsatsen att det fanns ekonomiska fördelar att uppnå genom en strategisk konsolidering av sjukhusen. Det går dessvärre inte att utröna om någon uppföljande studie gjorts efter den genomförda omstruktureringen. Renodling av verksamheter har en nära koppling till resonemang om skalfördelar. Schneider et al (2008) diskuterar utifrån aktuell publicerad och gråzonslitteratur, en enkät till 70 sjukhus i USA och fem platsbesök om det finns en särskild ekonomisk logik bakom specialisering på snävare områden, särskilt inom kirurgi. Medicare-statistik antyder att specialiserade sjukhus har högre kvalitet (lägre mortalitet) och lägre enhetskostnader än allmänna sjukhus. Sjukhusdirektörerna relaterade resultaten till höga produktionsvolymer och hög sjuksköterske-bemanning samt effektivare lärande genom specialisering och systematiska process-förbättringsprogram. Läkarna uppfattades också ha mindre målkonflikter och prioriterings-utmaningar och större kontroll över resursbeslut än kollegorna på allmänna sjukhus. Slutsatsen från litteraturanalysen var att skalfördelar existerar upp till 10 000 behandlade patienter per år dock har inte jämförande analyser mellan specialiserade och allmänna sjukhus gjorts. Volymen motsvarar 136 vårdplatser beräknat på en medelvårdtid om 5 dygn och 100 % beläggning (171 vårdplatser vid 80 % beläggning). Vad gäller kombinationsfördelar (economies of scope) konstateras att litteraturen inte ger några entydiga svar. Marini et al (2009) jämför stiftelsesjukhus (Foundation Trust hospitals), som har en högre grad av autonomi, med direktägda sjukhus inom National Health Service i England. Kostnadsdata modellerades i en flerproduktskostnadsfunktion och de två sjukhusgrupperna jämfördes med avseende på skalfördelar. Stiftelsesjukhusen uppvisade stordriftsnackdelar jämfört med NHS-sjukhusen. De sistnämnda bedömdes potentiellt också kunna utnyttja kombinationsfördelar. En studie från Australien använde vårdepisod på sjukhus klassificerad enligt DRG (Diagnosis Related Groups) som observationsenhet (Zhao et al 2011). Relationen mellan kostnad per vårdepisod och produktionsvolym visade sig vara logaritmisk. En stark koncentration av fall låg kring 500 vårdepisoder till en snittkostnad av 10 000 dollar. Det huvudsakliga volymspannet låg mellan 10 och 10 000 vårdepisoder. I det intervallet innebar en tiodubbling av produktionsvolymen en minskning av enhetskostnaden med 10 %. Kristensen et al (2012) presenterar en ekonometrisk analys av de danska sjukhusen, baserad på kostnadsdata tre år före regionaliseringen av sjukhusvården år 2007. Analysen ger indikationer på att både skal- och kombinationsfördelar potentiellt kan uppnås, vilket tolkas som att omstrukturering (sjukhussammanslagningar) kan ge ekonomiska vinster. Dock försvinner effekterna vid en uppskalningsfaktor om 1,5, d.v.s. sedan produktionsvolymen ökat med 50 %. Resultatet pekar på att effekten är U- eller L-formad, vilket också föreslagits i tidigare publicerade artiklar. Författarna konkluderar att litteraturen är inkonsistent, att de egna resultaten kan vara knutna specifikt till den använda analysmetoden (och inte upprepbar med annan metod) och att möjligheterna att uppnå potentiella fördelar är starkt beroende av det aktuella hälso- och sjukvårdssystemet. Man konstaterar också att studier av sjukhusfusioner rätt entydigt visar att de finansiella målen med sammanslagningar inte uppnås. John Posnett publicerade år 1999 en uppmärksammad översiktartikel i British Medical Journal där han konstaterade att skalfördelar kan exploateras endast på små sjukhus med färre än 17

200 vårdplatser, att den optimala sjukhusstorleken förefaller vara 200-400 vårdplatser, och att stordriftsnackdelarna överväger då vårdplatsantalet överstiger 400-600 vårdplatser (Posnett 1999). Han upprepade argumenten i en mer omfattande analys år 2002. Han anför att forskningen snarare pekar på att optimal sjukhusstorlek bestäms av relationen mellan sjukvårdsbehoven hos den lokala befolkningen och mix av specialisttjänster på sjukhuset. Ett skalekonomiskt resonemang definierar optimal sjukhusstorlek utifrån en minsta kärna av varandra kompletterande medicinska, kirurgiska och stödtjänster nödvändiga för att upprätthålla en vård som motsvarar behoven. Effektiviseringar vid omstruktureringar (t.ex. sammanslagning av sjukhus) uppnås inte genom skalfördelar utan genom att dubblerande eller onödig kapacitet elimineras. Posnett baserar sina gränsvärden på en omfattande litteraturanalys som publicerades av Centre for Health Economics vid University of York år 1996. Samma slutsatser drogs i ett working paper från år 1997, som samlade och analyserade studier gjorda med samtliga ekonometriska metoder som tillämpats, och därutöver kostnadsstudier och studier av de ekonomiska effekterna av sammanslagningar. Som ovan framgår pekar också senare gjorda studier på att tröskelvärdena för när skalfördelarna planar ut ligger anmärkningsvärt lågt. 5 Diskussion och slutsatser Denna översyn av litteraturen om sambandet mellan sjukhusens verksamhetsvolym, kvalitet och medicinskt utfall samt kostnader, som är baserad på systematiska litteraturöversikter samt primärstudier rapporterade fram till slutet av år 2014, bekräftar i allt väsentligt den tidigare uppfattningen att sjukhus med höga verksamhetsvolymer har bättre utfall än sjukhus med låga verksamhetsvolymer. Vi har framförallt kunnat finna att de studier om statistiska samband mellan volym och utfall som publicerats under de senaste åren fyller alla de krav på noggrannhet i metod som förutsätts för att resultaten skall kunna betraktas som tillförlitliga. I studierna är utfallsmåtten riskjusterade och i analyserna standardiseras variablerna för skillnader i både sjukhus- och patientkarakteristika. Vad gäller sambandet mellan volym och kostnad är resultaten inte lika entydiga. Båda frågeställningar diskuteras mer ingående nedan. 5.1. Medicinskt utfall Den stora majoriteten av studier använder mortalitet (sjukhusmortalitet, mortalitet inom 30 dagar) som utfallsmått. Även återinläggningar inom 30 dagar och komplikationer indikerar utfall. I det sistnämnda fallet visar det sig att komplikationsfrekvenserna mer sällan skiljer sig mellan låg- och högvolymsjukhus. Däremot har högvolymsjukhusen bättre förmåga att hantera potentiellt dödliga komplikationer lågvolymsjukhus har högre mortalitet i denna patientgrupp - detta beskrivs med termen failure to rescue (FTR) (Gonzalez et al 2014). Vi har identifierat en studie som också studerar kvalitet i det fallet utnyttjas processindikatorer (Joynt et al 2011). Dessa kan i själva verket betraktas som mellanliggande variabler, vilket kommenteras mer utförligt nedan. Livskvalitet eller funktionsförmåga saknas som utfallsmått i det material av studier vi identifierat. Studierna gör i de flesta fall jämförelser mellan hög- och lågvolymsjukhus, i många fall så att de representerar högt och lågt i ett bredare spektrum. McAteer et al (2013) påpekar ett volymgränserna borde definieras a priori för att öka studierna generaliserbarhet. Mer ovanligt är att studierna har endast en cut-off -gräns. De studier som behandlar sjukhusvolym som en kon- 18