Maria Rydfjord Uppgift 2 Granskning av olika mätmetoder och instrument Scapula 1

Uppgift 2 Granskning av olika mätmetoder och instrument Disabilities of the Arm, Shoulder and Hand Outcome Questionnaire (DASH) Disabilities of the Arm, Shoulder and Hand Outcome Questionnaire (DASH) är ett utvärderingsinstrument som är utvecklat för att mäta funktionsnedsättning och symptom i övre extremitet. DASH utvecklades gemensamt av Institute for Work & Health och American Academy of Orthopaedic Surgeons (AAOS) (1). DASH består av ett självskattningsformulär där patienten får skatta hur den själv ser på sin arm-handfunktion utifrån olika perspektiv och i samband med olika dagliga aktiviteter. Det kan användas för att utvärdera alla leder i övre extremitet. Instrumentet innehåller 30 frågor och ämnen som tas upp är smärta, delaktighet, jobbförmåga och sexualfunktion. Såväl fysiska som psykiska och sociala aspekter behandlas i frågeformuläret. I frågeformuläret ombeds patienten skatta sin förmåga att utföra olika aktiviteter som t.ex. öppna en tung dörr eller bädda sängen. Patienten kryssar i ingen svårighet, viss svårighet, måttlig svårighet, stor svårighet eller omöjligt att göra baserat på hur upplevelsen har varit den senaste veckan. Patienten får även skatta i vilken utsträckning dennes problem har stört umgänget med anhöriga, vänner eller grannar, sitt vanliga arbete eller andra dagliga aktiviteter. Även värk, smärta, stickningar, svaghet och stelhet under den senaste veckan skattas. Poängen på samtliga frågor används sedan för att räkna ut en poäng på en skala från 0 till 100 där 0 är ingen funktionsnedsättning/symptom och 100 är svårast funktionsnedsättning/symptom (2). Atroshi et al (2) översatte DASH till svenska och testade reliabilitet och validitet hos den svenska versionen av DASH hos 176 patienter (57 % kvinnor), med en medelålder på 52 år (18-85 år). Patienterna hade muskuloskeletala funktionsnedsättningar i övre extremitet och var planerade att genomgå kirurgi (n 125) eller sjukgymnastik (n 51). Intern konsistens för varje DASH-skala bedömdes med Cronbach alpha och visade sig vara hög (Cronbach alpha 0,96). Test-retest reliabilitet utvärderades hos 67 av patienterna (55 % kvinnor), medelålder 51 (19-74 år). De fick genomföra DASH vid två tillfällen med i median 7 (3-17) dagars mellanrum. Test-retest reliabiliteten visades vara utmärkt med en medelskillnad i poäng på 0,7 (95% KI -1,2 2,6, p = 0,5) och en ICC på 0,92 (95% KI 0,88 0,95). ICC analyserades också separat hos patienterna som skulle genomgå kirurgi (n 30) respektive sjukgymnastik och var även där utmärkt, ICC 0,93 (95% KI 0,86-0,97) respektive ICC 0,91 (95% KI 0,84-0,96). En separat analys gjordes även hos de patienter som fyllde i formulären med mindre än 8 dagars (n 34) mellanrum och hos de som fyllde i formulären med mer än 8 dagars mellanrum, ICC var då 0,90 (95% KI 0,81-0,95) respektive 0,94 (95% KI 0,88-0,97) (2). Atroshi et al (2) undersökte även olika aspekter av validitet för det svenska DASH-formuläret. Begreppsvaliditet bedömdes genom att testa flera fördefinierade hypoteser angående förväntade förhållanden mellan DASH och andra utvärderingsmått. I överensstämmelse med författarnas hypotes sågs en positiv korrelation mellan poäng på DASH och SF-12 (värre funktionsnedsättning i övre extremitet korrelerade med sämre generell hälsa). En starkare korrelation sågs mellan låg poäng på DASH och låg poäng på SF-12:s fysiska komponent (r = 0,74, 95% KI 0,66 0,81) jämfört med den mentala hälsokomponenten (r = 0,51, 95% KI 0,38 0,62). När DASH-poängen analyserades grupperade efter hur patienterna bedömt sin allmänna hälsa på SF-12 kunde en signifikant skillnad ses mellan de fem grupperna, med lägre DASH-poäng hos de patienter som rapporterade sämre hälsa (p<0,0001). Den svenska versionens känslighet för förändring har inte undersökts (2). Hsu et al (3) genomförde en studie för att få fram normativa DASH-poäng hos unga atleter. Dessa poäng jämfördes med normativa värden i den allmänna befolkningen och en åldersmatchad kohort och resultaten 1

hos atleterna var signifikant bättre. DASH-poängen var 0 för 65,1 % av atleterna vilket innebär att det finns en signifikant takeffekt när DASH används i denna grupp (3). Patient-specifik funktionell skala (PSFS) PSFS är ett utvärderingsinstrument utvecklat av Stratford et al (4) som syftar till att utvärdera förmågan att utföra specifika aktiviteter. Patienten väljer själv ut 3-5 aktiviteter som den tycker är svåra att utföra. Patienten ombeds sedan att skatta på en 0-10-skala hur väl dessa aktiviteter kan genomföras, där 0 är kan ej utföra aktiviteten och 10 är kan utföra aktiviteten lika bra som före skada eller besvär (4). Rosengren et al (5) undersökte bland annat innehållsvaliditet och test-retest reliabilitet hos den svenska versionen av PSFS. Deltagarna var 58 patienter som opererats för artros i CMCleden. Fyrtioåtta deltagare var kvinnor och tio män. Innehållsvaliditet utvärderades genom att se om hypotesen att mer än 90 % av aktiviteterna där deltagarna rapporterade begränsningar också skulle finnas i Aktivitets och delaktighetskomponenten av ICF stämde. Innehållsvaliditeten visade sig vara utmärkt, alla aktivitetsbegränsningar som uppgavs i PSFS kunde klassificeras enligt aktivitetskomponenten i ICF. Test-retest reliabilitet utvärderades genom att ringa upp patienterna två till tre dagar efter den första bedömningen och be de skatta samma aktiviteter åter igen. ICC var 0,79 vilket tyder på en god test-retest reliabilitet. En tendens till en golveffekt kunde ses, medianvärdet för alla patienter vid första besöket var 3 med ett intervall på 0 till 8. Av alla patienterna var det 11,5 % som uppgav ett medianvärde på 0 på alla tre aktiviteter. Detta innebär att det blir en svårighet att upptäcka eventuell försämring vid uppföljningen (5). Chatman et al (6) undersökte PSFS:s test-retest reliabilitet, construct validity och känslighet för förändring hos 38 patienter med knädysfunktion. Knädysfunktion definierades som ett ortopediskt knäproblem som bidrog till en, av patienten upplevd, nedsatt funktion. Tjugo kvinnor och 18 män deltog i studien, medelålder var 47 år (19-84 år) och de hade i snitt haft problem med knäet i 11,6 veckor. Test-retest reliabilitet undersöktes genom att jämföra den initiala poängen på PSFS med en andra PSFS-poäng som togs 48 till 72 timmar efter den första bedömningen. För varje individuell aktivitet var test-retest reliabilitetskoefficienten R = 0,84 (95 % KI 0,78-0,88). De undersökte även construct convergent validity genom att jämföra poängen på PSFS med poängen på SF-36 vid två tillfällen (vid första bedömningen och två till tre veckor senare). Författarnas hypotes var att poängen på PSFS och poängen på SF-36 skala för fysisk funktion och smärta skulle uppvisa korrelationer på mellan 0,30 och 0,50. En hypotes var också att det skulle finnas liten eller ingen korrelation mellan PSFS och dimensionerna mental hälsa och rollbegränsning på SF-36. Pearsons korrelationskoefficient och 95-procentigt konfidensintervall räknades ut och visade sig stämma väl överens med hypotesen. Eftersom att PSFS är ett patient-specifikt utvärderingsmått, där målet inte är att jämföra funktionsnedsättning mellan patienter, är det något problematiskt att utvärdera validitetsaspekter (6). Medical Outcomes Study Short Form 36 (SF-36) Medical Outcomes Study Short Form 36 (SF-36) utformades för att kunna fånga patienternas perspektiv av sin sjukdom, och ersätta långa, svårförståeliga hälsoformulär. Tanken var att ha ett utvärderingsinstrument som kunde kartlägga livskvalitet på befolkningsnivå eller för en specifik sjukdomsgrupp. Det kan även användas vid klinisk forskning och som utvärderingsinstrument för patienter på olika mottagningar. SF-36 består av 36 frågor som syftar till att undersöka upplevd fysisk och psykisk funktion samt välmående under den senaste månaden. Vid redovisning av resultatet fördelas frågorna under åtta kategorier som 2

täcker in olika aspekter av hälsa. Ytterligare en fråga tillkommer och brukar redovisas separat, frågan som undersöker förändringen av upplevd hälsa jämfört med ett år sedan. Frågorna som ingår i SF-36 kommer från tidigare använda enkäter och är tänkta att representera det centrala från ursprungsformuläret så dess egenskaper bibehålls i så stor utsträckning som möjligt. Frågorna under fysisk funktion är till exempel tagna direkt från MOS Physical Funcioning Scale och frågorna under psykiskt välbefinnande är direkt tagna från The five-item mental health scale (MHI-5) (7). Efter att ha fyllt i formuläret kan man ta fram en profilerad hälsostatus utifrån de åtta kategorierna. Resultatet tolkas utifrån vilka kategorier som visar höga eller låga poäng. Förutom att redovisa resultatet utifrån de åtta kategorierna kan även en mental- och physical component summary (MCS respektive PCS) erhållas genom en algoritm, vilket ger en mer översiktlig bild av det aktuella hälsostatuset (8). För att kunna tolka resultat och få en korrekt poängsättning behövs en manual och tolkningsguide. (7). Test-retest reliabilitet var hög hos en patientgrupp med parkinsonism (n 37), medelålder 71 år. Andra testet genomfördes av samma bedömare en vecka efter första bedömningen. ICC var 0,80 eller högre för samtliga domäner utom social funktion (ICC 0,71) (9). SF-36 har översatts till svenska av Sullivan et al (10) som även reliabilitets- och validitetstestade instrumentet. Testet besvarades av 8930 personer (48,2 % män) med en medelålder på 42,7 år (15-93 år). Intern konsistens var hög i alla åtta skalorna och överlag stämde resultatet från den svenska studien väl överens med en motsvarande amerikansk studie, vilket visade på god användbarhet av den svenska versionen av SF-36 (10). Diskussion Hur förhåller sig de tre mätmetoderna till varandra utifrån mätmetodmallens rubriker? Samtliga mätmetoder är självskattade frågeformulär. Samtliga instrument mäter på en ordinalskala. SF-36 sticker ut genom att det är det enda instrumentet av de tre som mäter hälsorelaterad livskvalitet. Är mätmetoderna användbara för alla grupper? Skulle de kunna användas i den kliniska verksamhet som du utgått från i uppgift 1a? I uppgift 1a utgick jag från sjukgymnastik inom primärvård, och där anser jag att samtliga utvärderingsinstrument är mycket användbara. DASH är testat på en svensk population med god reliabilitet och validitet. Åldern på deltagarna varierade mellan 18-85 år och täckte därmed in en stor del av patienterna som söker sig till vårdcentral. Dock så är det oklart hur svenska versionen av DASH skulle fungera på barn och ungdomar yngre än 18 år. Inte heller PSFS eller SF-36 har i de studier jag kollat på använts på patienter yngre än 18 år. SF-36 används i dagsläget, till min kännedom, på vårdcentraler. PSFS rekommenderas enligt LSR:s mätdatabas till patienter i det subakuta och kroniska stadiet och borde således kunna användas i primärvårdverksamhet. Vad mäter instrumentet, vilken ICF-dimension mäts och när i vårdprocessen är instrumentet lämpligt att använda? DASH utvärderar dimensionerna kroppsfunktion, aktivitet och delaktighet i ICF. PSFS utvärderar på aktivitetsnivån i ICF, då patienten själv väljer vilka aktiviteter som ska utvärderas, beroende på vad som väljs kan även delaktighet rymmas i utvärderingsinstrumentet. I studien av Rosengren et al (5) kunde samtliga kategorier kategoriseras inom aktivitetskomponenten av ICF och 99 % av de valda aktiviteterna fanns inom domänerna rörelse, personlig vård och hemliv. SF-36 täcker in flera delar av ICF. De första tre kategorierna av SF-36 behandlar den fysiska hälsoupplevelsen, vilket relaterar till 3

ICF:s underkategori kroppsstrukturer och kroppsfunktioner. Kategori 5-8 i SF-36 kan relatera till ICF:s underkategorier aktivitet och delaktighet. SF-36 har dock ingen direkt relation till underkategorin omgivningsfaktorer i ICF. Eftersom det är patienten själv som identifierar aktiviteter i PSFS så kan det instrumentet egentligen användas när som helst i vårdprocessen. SF-36 anser jag också kan användas när som helst i vårdprocessen och med fördel från allra första början för att kunna se förändringar allt eftersom patienten flyttas framåt i vårdkedjan. DASH hade en tydlig takeffekt bland unga atleter och bör kanske inte användas hos patienter som man förväntar sig kommer få höga poäng, då inget utrymme för förbättring kommer finnas. PSFS hade istället en tendens till golveffekt, som dock kan motverkas genom att uppmuntra patienten att välja några aktiviteter som är lite lättare. Även DASH och PSFS anser jag kunna användas under hela vårdprocessen. Vilka är mätmetodernas fördelar respektive nackdelar? Fördelar med DASH är att det är enkelt att administrera. Det kräver ingen träning för att kunna utvärdera med DASH. Själva ifyllandet tar mellan 5 och 30 minuter och frågeformuläret är gratis att ladda ned. Det finns en hemsida dedikerad till DASH där det finns nyttig information och instrumentet även finns tillgängligt för nedladdning. DASH finns översatt till 27 språk och det finns även en kortversion av DASH tillgänglig (QuickDASH). En annan fördel med DASH är att det faktiskt mäter hela övre extremitet och därmed kan användas för att jämföra olika patientgrupper. Detta innebär även en nackdel då instrumentet kan bli för generiskt och inte känsligt nog. I studien av Rosengren et al (5) diskuterades att Quick DASH inte innehöll tillräckligt många aktiviteter som patienterna med CMC-artros hade besvär med och poängen blev därmed inte lika representativ som poängen på PSFS där patienterna själva valde problematiska aktiviteter. En fördel med PSFS är att det går snabbt att utföra (i snitt 4 minuter (6)) och det krävs inte någon utrustning utöver själva formuläret och en penna. Det krävs ingen träning för att utföra testet och testet finns tillgängligt gratis. En annan fördel med PSFS är just att det är ett patientspecifikt utvärderingsmått, vilket är fördelaktigt när det gäller att dokumentera och utvärdera förändring över tid i den aktivitet som patienten har valt. Att det är patientspecifikt gör också att det är svårt att jämföra individer emellan, men det är inte heller det som är syftet med instrumentet. Fördelar med SF-36 är att det är ett instrument som är väl använt och studerat. Det mäter områden som ofta faller bort i andra instrument. SF-36 tar förhållandevis kort tid att utföra, i studien av Chatman et al tog det deltagarna i genomsnitt 13 minuter att fylla i formuläret (6). Bland nackdelar kan nämnas att det tycks vara så att SF-36 får en minskad känslighet för förändring över tid vid senare sjukdomsstadier vid stroke (11). 4

Referenser 1. Hudak P, Amadio P, Bombardier C and the Upper Extremity Collaborative Group (UECG). Development of an Upper Extremity Outcome Measure: The DASH (Disabilities of the Arm, Shoulder, and Head). American Journal of Industrial Medicine. 1996;29:602-608. 2. Atroshi I, Gummesson C, Andersson B, Dahlgren E, Johansson A. The disabilities of the arm, shoulder and hand (DASH) outcome questionnaire, Reliability and validity of the Swedish version evaluated in 176 patients. Acta orthopaedica scandinavica. 2000;71(6):613 618. 3. Hsu, J. E., Nacke, E., et al. The Disabilities of the Arm, Shoulder, and Hand questionnaire in intercollegiate athletes: validity limited by ceiling effect. J Shoulder Elbow Surg 2010;19(3): 349-354. 4. Stratford, P. "Assessing disability and change on individual patients: a report of a patient specific measure." Physiotherapy Canada 1995;47(4): 258-263. 5. Rosengren 6. Chatman AB, Hyams SP, Neel JM, et al. The Patient-Specific Functional Scale: measurement properties in patients with knee dysfunction. Phys Ther. 1997;77(8):820-829. 7. Ware JE Jr, Sherbourne CD. The MOS 36-item short-form health survey (SF-36). I. Conceptual framework and item selection. Med Care. 1992;30(6):473-83. 8. Taft C, Karlsson J, Sullivan M. Do SF-36 summary component scores accurately summarize subscale scores? Qual Life Res. 2001;10(5):395-404. 9. Steffen T, Seney M. Test-retest reliability and minimal detectable change on balance and ambulation tests, the 36-item short-form health survey, and the unified Parkinson disease rating scale in people with parkinsonism. Phys Ther 2008;88(6):733-46. 10. Sullivan M, Karlsson J, Ware JE Jr. The Swedish SF-36 Health Survey I. Evaluation of data quality, scaling assumptions, reliability and construct validity across general populations in Sweden. Soc Sci Med. 1995;41(10):1349-58. 11. Hagen S, Bugge C, Alexander H. Psychometric properties of the SF-36 in the early post-stroke phase. J Adv Nurs. 2003;44(5):461-8. 5

Ändringar Som kurskamrater påpekade var källorna inte helt korrekta, vilket jag har korrigerat. I övrigt har jag utökat delen om SF-36 något. 6