Sammanfattning Data i föreliggande examensarbete är insamlat för studien Depression Screening Day, som är en studie genomförd i april 2002 av

Relevanta dokument

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Lektionsanteckningar 11-12: Normalfördelningen

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

F22, Icke-parametriska metoder.

Medicinsk statistik II

DSM-IV-kriterier för förstämningsepisoder (förkortade)

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Hur skriver man statistikavsnittet i en ansökan?

Statistik och epidemiologi T5

Vårdresultat för patienter. Elbehandling (ECT)

Studietyper, inferens och konfidensintervall

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Att välja statistisk metod

Resultatdata fö r patienter ur Kvalitetsregister ECT

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Lärare 4. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Att aktivera nedstämda föräldrar eller Beteendeterapi vid depression eller Beteendeaktivering (BA) av Martell, Jacobsen mfl

2. Test av hypotes rörande medianen i en population.

Föreläsning 12: Regression

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

F3 Introduktion Stickprov

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Differentiell psykologi

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Martina Datavs Johansson Ann-Sofie Kardell. Utvärdering av KBT i grupp för personer med depression Vid psykiatrisk mottagning 2, allmänpsyk Uppsala

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 13

Nationell Patientenkät Akutmottagningar Ordinarie mätning Hösten Landstingsjämförande rapport

7.3.3 Nonparametric Mann-Whitney test

NATIONELL PATIENTENKÄT. Barnsjukvård 2011 ÖPPEN-, SLUTEN- OCH AKUTSJUKVÅRD

Föreläsning 4: Konfidensintervall (forts.)

Resultat från 2018 års PPM* Aktuella läkemedelslistor

Differentiell psykologi

Parade och oparade test

Uppgift a b c d e Vet inte Poäng

The Calgary Depression Scale for Schizophrenics Svensk översättning: Lars helldin

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Kod: PSYK. Fall3. Man 57 år. lo poäng. 3 delar- lo delfrågor Klinisk medicin V. 29 Examinatoms totalpoäng på detta blad:

Initialfas. IPT ÄR MULTITASKING Timing balans mellan manual & Patient

Tentamen i Matematisk statistik Kurskod S0001M

Binomialfördelning, två stickprov

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Gamla tentor (forts) ( x. x ) ) 2 x1

, s a. , s b. personer från Alingsås och n b

Provmoment: Ladokkod: Tentamen ges för: Tentamen VVT012 SSK05 VHB. TentamensKod: Tentamensdatum: Tid:

a) Facit till räkneseminarium 3

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

MADRS-S (MADRS självskattning)

Vårdresultat för patienter 2017

Avd. Matematisk statistik

Repetitionsföreläsning

Behandling av nedstämdhet Hur ser dagens praxis ut?

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Statistik 1 för biologer, logopeder och psykologer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Analys av proportioner

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Exempel på observation

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Statistik och epidemiologi T5

Samplingfördelningar 1

Avd. Matematisk statistik

Man måste vila emellanåt

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Depression hos äldre i Primärvården

Bilaga 6 till rapport 1 (5)

Statistik 1 för biologer, logopeder och psykologer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 5 och 6.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Resultat från 2017 års PPM* Aktuella läkemedelslistor

NYCKELTAL NATIONELL PATIENTENKÄT

Hur man tolkar statistiska resultat

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

FÖRELÄSNING 8:

Lärare 1. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Är depression vanligt? Vad är en depression?

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Kvantitativa metoder och datainsamling

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Diagnostik av förstämningssyndrom

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Underlag för psykiatrisk bedömning

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Suicidriskbedömning för barn och ungdomar inom barn- och ungdomspsykiatrin

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Analytisk statistik. Tony Pansell, optiker Universitetslektor

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

Vårdresultat för patienter

Uppgift 1. f(x) = 2x om 0 x 1

KOD # INITIALER DATUM. Civilstånd: Ogift (0) Skild (2) Gift (3) Står pat på något antikonvulsivt läkemedel? (tex Ergenyl, valproat, Lamictal)

Agenda. Bakgrund. Diagnos och behandling vid ångest och depression. Bakgrund. Diagnostik. Depression. Ångestsyndrom. Sammanfattning- take-home message

Jag tycker jag är -2. Beskrivning av instrumentet och dess användningsområde. Översikt. Vilka grupper är instrumentet gjort för?

Transkript:

Sammanfattning Data i föreliggande examensarbete är insamlat för studien Depression Screening Day, som är en studie genomförd i april 2002 av Allmänpsykiatriska kliniken vid Akademiska sjukhuset i Uppsala. Studien avser att kartlägga förekomsten av depressioner bland patienter inom somatisk öppen och slutenvård samt att undersöka om patientens formulär för självrapportering av depression stämmer överens med läkarens bedömning. Föreliggande examensarbete ämnar främst undersöka överensstämmelsen mellan läkarens (MADRS och SPIFA) och patientens (MADRS S och DSRS) formulär. Detta har mestadels utförts genom beräkningar av Cohen s kappa. Överensstämmelsen på frågenivå mellan MADRS och MADRS S uppskattades till ˆκ (w) = 0.68. Överensstämmelsen på utfallet mellan SPIFA och DSRS uppskattades till ˆκ = 0.60. Läkarna tenderade att skatta patienterna mindre deprimerade än vad patienterna själva ansåg. 1

Tack till... min handledare Dag Jonsson vid matematiska institutionen som hjälpt mig genomföra detta arbete. Tack också till Gunilla Stålenheim, Mathilde Hedlund och Lars von Knorring vid institutionen för neurovetenskap, UAS, som gav mig möjligheten att utföra detta arbete, samt vänligt och uppmuntrande besvarade mina frågor. 2

Innehåll 1 Inledning 5 1.1 Studiens syfte........................... 5 1.2 Bakgrund till Depression Screening Day........... 5 1.3 Beskrivning av symtom vid depression............. 6 2 Studiens metod 7 2.1 Formulär för bedömning av depression............. 7 2.1.1 MADRS & MADRS S.................. 7 2.1.2 SPIFA & DSRS...................... 7 2.2 Studiens genomförande...................... 8 2.2.1 Samskattningsövning................... 8 2.2.2 Insamling av data..................... 9 2.3 Beskrivning av data........................ 9 2.3.1 Deltagare......................... 9 2.3.2 Bortfall.......................... 10 3 Statistiska metoder 12 3.1 Metod för att uppskatta reliabilitet i data........... 12 3.1.1 MADRS.......................... 12 3.1.2 SPIFA........................... 14 3.2 Metod för att uppskatta överensstämmelse mellan läkarens och patientens skattning....................... 15 3.2.1 MADRS & MADRS S.................. 15 3.2.2 SPIFA & DSRS...................... 17 3.3 Metod för att uppskatta prevalens av depression........ 17 3.4 Överensstämmelse mellan MADRS & SPIFA samt mellan MADRS S & DSRS............................. 18 4 Resultat 20 4.1 Reliabilitet i data......................... 20 4.1.1 MADRS.......................... 20 4.1.2 SPIFA........................... 20 4.2 Överensstämmelse mellan läkarens och patientens skattning.. 20 4.2.1 MADRS & MADRS S.................. 20 4.2.2 SPIFA & DSRS...................... 22 4.3 Prevalens av depression i olika patientgrupper......... 23 4.4 Överensstämmelse mellan MADRS & SPIFA samt mellan MADRS S & DSRS............................. 24 3

5 Diskussion 25 6 Referenser 28 7 Bilagor 29 4

1 Inledning 1.1 Studiens syfte Målsättningen med projektet Depression screening Day, som genomförs av Allmänpsykiatriska kliniken vid Akademiska sjukhuset i Uppsala, är att kartlägga förekomsten av depressioner bland patienter inom primärvården och inom somatisk öppen och slutenvård. Studien ämnar också undersöka om patientens självskattning av symtom på depression stämmer överens med läkarens bedömning av patientens tillstånd. Min uppgift har bestått i att utföra statistiska beräkningar på data som samlats in. Jag har således inte varit delaktig i upplägget av studien eller insamlandet av data. Jag deltog som åskådare vid ett av tillfällena då samskattningsövningen hölls. Studien är godkänd av en lokal forskningsetisk kommitté. 1.2 Bakgrund till Depression Screening Day De depressiva sjukdomarna har under de senaste decennierna ökat i frekvens och åldern för insjuknande har sjunkit.världshälsoorganisationen (WHO) har infört en metod för att mäta bördan för samhället av olika sjukdomar genom att räkna antalet förlorade år i sjukskrivning, förtidspension och för tidig död. Enligt en svensk mätning med denna metod visar det sig att depression kommer på andra plats bland sjukdomar i Sverige. Bara ischemisk hjärtsjukdom utgör en tyngre börda för samhället[?]. Den höga förekomsten av de depres siva sjukdomarna innebär att man i dagsläget räknar med en livstidsrisk på ca 23% för män och ca 43% för kvinnor att insjukna i en behandlingskrävande depression. Man har också funnit att redan vid 16 års ålder uppfyller 5% av flickorna och 1% av pojkarna kriterierna för en egentlig depression; andelen som visar tecken på en medelsvår depression är 14% för flickorna respekt ive 5% för pojkarna. Av flickorna har 7% och av pojkarna 2% gjort minst ett självmordsförsök. Efter att ha drabbats av svår depression för första gången räknar man med att en människa tillbringar 20% av den återstående livs tiden i sjukdomsfas. Den tidiga insjuknandeåldern och den starka tendensen att återkomma gör att de depressiva sjukdomarna medför stort lidande för patienten och dess anhöriga samt stora kostnader för samhället[?]. Varför depressioner har blivit vanligare finns inget enkelt svar på, men en förklaring kan vara att depressioner tidigare har klassats som kroppsliga sjukdomar, då de ofta åtföljs av rygg eller muskelvärk[?]. Det är välkänt att många deprimerade patienter som söker vård inte får korrekt diagnos eller behandling. Hos patienter som söker för kroppsliga krämpor finns ofta depression med i bilden, men den är svår att upptäcka då både patient och 5

läkare koncentrerar sig på den kroppsliga åkomman. I en stor europeisk studie visade man att av 100 deprimerade patienter i befolkningen hade 69% sökt sjukvård. Av dessa hade 41% behandlats med något läkemedel, men endast 18% hade ordinerats ett antidepressivt läkemedel. Sverige deltog ej i denna studie, men tendensen tycks vara densamma i vårt land. En studie från 1997 visar på detta; enligt den blev 21% av de deprimerade patienterna identifierade och av dessa fick 47% antidepressiv behandling. En annan bidragande orsak till att deprimerade patienter inte får rätt vård är det faktum att av dem som söker läkarvård är det endast ett fåtal som i första hand söker sig till psykiatrin. I den tidigare nämnda europeiska studien visade man att de patienter med egentlig depression under de senaste 6 månaderna i snitt hade gjort 4.4 besök hos sin distriktsläkare, 1.8 besök hos annan medicinsk specialist och 0.8 besök hos psykiater[?]. 1.3 Beskrivning av symtom vid depression De två mest väsentliga karaktärsdragen vid en episod av egentlig depression är den sänkta grundstämmningen och det klart minskade intressset, eller den minskade lusten för och glädjen av alla eller nästan alla aktiviteter. Det är en nödvändighet att något av dessa två symtom har funnits med under minst två veckor och då förekommit under större delen av dagen för att patientens tillstånd ska kunna klassas som en egentlig depression enligt DSM IV 1. Andra symtom som vanligtvis förekommer i samband med en egentlig depression är förändringar i vikt, minskad eller ökad aptit, trötthet och brist på energi samt sömnstörningar i form av för mycket eller för lite sömn. Vanligt är att den deprimerade vaknar många gånger under natten och har svårt att somna om, samt att det definitiva uppvaknadet sker tidigare än vanligt. Nedsatt självförtroende och självnedvärdering med känslor av värdelöshet, otillräcklighet och ovärdighet förekommer ofta hos den deprimerade patienten, liksom överdrivna och obefogade skuldkänslor. Patientens förmåga att tänka, fatta beslut och koncentrera sig är försämrad och man kan ibland observera en psykomotorisk hämning hos patienten som yttrar sig genom en förlångsammad mimik, som kan uppfattas som att ansiktet saknar liv. En dominerande känsla hos den deprimerade är livets meningslöshet och tankar på döden som en befriare. För att ett tillstånd ska klassas som en egentlig depression måste symtomen, enligt DSM IV, vara av klinisk valör, med vilket menas att de ska förorsaka lidande eller försämrad funktion i arbete eller sociala sammanhang hos patienten. Symtomen får heller inte kunna förklaras 1 DSM IV är förkortning av Diagnostic and Statistical Manual of Mental Disorders och är en av de två förekommande manualer enligt vilken man diagnostiserar psykiska sjukdomar[?]. 6

av en somatisk sjukdom, drogpåverkan eller en älskad anhörigs bortgång och ej heller vara sekundära till en psykotisk störning[?]. 2 Studiens metod 2.1 Formulär för bedömning av depression 2.1.1 MADRS & MADRS S MADRS står för Montgomery Åsberg Depression Rating Scale. Skalan är speciellt utformad för att vara känslig för förändringar av behandlingseffekter hos deprimerade patienter. Till grund för skattningen av en patient ligger en klinisk intervju om kärnsymtomen som förekommer vid depression. Intervjun struktureras så att man går från allmänna frågor om symtomen till mer detaljerade. På så vis kan en allt precisare skattning av var på skalan en patient befinner sig göras. MADRS består av tio frågor där bedömaren skattar patientens tillstånd med något av de fördefinierade stegen 0, 2, 4 eller 6, eller mellan dem med 1, 3 eller 5[?]. Ju högre totalpoäng desto djupare kan depressionen anses vara. Patientens totalpoäng på MADRS skalan visar vilka åtgärder som bör vidtas. Om totalpoängen är > 20 ska patienten erbjudas behandling och om den är > 40 ska patienten remitteras till psykiatrin alternativt ska ärendet handläggas i samråd med psykiater[?]. Egenbedömningen av depression, MADRS S, som fyllts i av patienten, består av nio frågor. Dessa är samma frågor som i MADRS formuläret bortsett från fråga nummer två, som ej finns med i patientens formulär. Fråga nummer två i MADRS utgörs av en observation av läkaren. Se bilaga I och II för MADRS respektive MADRS S. 2.1.2 SPIFA & DSRS SPIFA står för Strukturerad Psykiatrisk Intervju För Allmänläkare och är ett verktyg för diagnostisering av psykiska sjukdomar. SPIFA är utvecklat i Norge och används där av allmänläkare, men är utformat så att det skulle kunna användas av flera yrkeskategorier. Till grund för frågorna, som leder fram till diagnos i SPIFA, ligger DSM-systemet. Det är tänkt att SPIFA ska vara ett kort, lättadministrerat och systematiskt verktyg för kliniker. SPIFA är sammansatt av tre delar: diagnosscreening, diagnosmanual samt ett sammanställningsformulär[?]. Diagnosscreeningen för depression består av två frågor på vilka patienten måste svara ja på minst en för att eventuellt kunna diagnostiseras som deprimerad. Diagnosmanualen för depression består av sju frågor. På sammanställningsformuläret markeras positiva bedömningar. Vid 7

ja på minst fem frågor av de, sju frågorna i diagnosmanualen, tillsammans med de två första i diagnosscreeningen, anses patienten ha depression[?]. Formuläret för självbedömning av depression, som fyllts i av patienten, är enligt Depression Self Rating Scale (DSRS). DSRS är även det baserat på kriterierna för egentlig depression enligt DSM IV, och är tänkt att vara ett användbart verktyg inom den psykiatriska öppenvården[?]. Det består av 14 ja/nej frågor (15 frågor för ungdomar). För att patienten ska anses ha depression enligt detta formulär krävs ja på minst en av de två första frågorna samt totalt minst fem ja svar. Se bilaga III och IV för formulär som fyllts i av läkaren respektive patienten. 2.2 Studiens genomförande 2.2.1 Samskattningsövning Alla läkare som skulle utföra skattningar av patienter närvarade vid något av utbildningstillfällena som anordnades den 7:e och 12:e mars 2002. Under utbildningen instruerades läkarna i användning av SPIFA och MADRS. Läkarna fick praktisera genom att bedöma patienter från tre videoupptagningar. Två videoupptagningar visade en patient som intervjuades enligt MADRS manualen och en upptagning en intervju enligt SPIFA. Efter varje intervju diskuterades läkarnas bedömningar samt vad som ansågs vara lämplig bedömning för varje fråga. Som ett mått på interbedömarreliabiliteten i data beslutade man att använda skattningen av den patient (MADRS) som visades som nummer två samt den enda gjorda SPIFA skattningen. Med reliabilitet avses den grad av konsistens med vilken ett test mäter det som det mäter. Om man antar att en egenskap eller ett attribut hos ett föremål är konstant och man utför upprepade mätningar av denna egenskap och samtliga mätningar visar samma resultat anser man att det är hög reliabilitet i mätningarna[?]. I denna undersökning avser man att mäta olika symtoms grad av förekommande hos patienter. För att skattningarna i så hög grad som möjligt ska avspegla patientens sanna tillstånd och inte bero av vem som skattat patienten strävar man efter att samtliga skattare är eniga i bedömningen av en och samma patient. Som ett mått på interbedömarreliabiliteten i data används här videoupptagningar där samtliga läkare skattar samma patienter dvs egenskaperna hos patienterna är konstanta. 8

2.2.2 Insamling av data Insamlingen av data genomfördes av utvalda öppenvårdsmottagningar, slutenvårdsavdelningar och kliniker som tackat ja till deltagande i studien. Data kom att insamlas under en, för varje plats, bestämd dag på totalt 20 olika platser. Skattningarna genomfördes av 15 läkare; några av dem skattade patienter på mer än en plats. Samtliga data samlades in någon gång under måndag till fredag vecka 16, 2002. De patienter som under dagens lopp besökte en plats där insamling pågick tillfrågades om de ville delta. De som valde att delta ombads att i väntrummet fylla i de två formulären MADRS S och DSRS. Om patienten avstod från deltagande antecknades detta som bortfall. I mån av tid och resurs intervjuades slumpmässigt utvalda patienter också av en läkare. Intervjun ägde i samtliga fall rum efter det att patienten själv fyllt i formulären. 2.3 Beskrivning av data 2.3.1 Deltagare Totalt kom 396 patienter att delta i studien. Av dessa var 102 män och 294 kvinnor. Männen var mellan 13 och 90 år gamla. Kvinnorna var mellan 13 och 96 år gamla. Medelåldern för män var 47.6 år och för kvinnor 40.3 år. Hur deltagarna fördelar sig på de olika insamlingsplatserna, klinik, primärvård och slutenvård, samt på de tre åldersgrupperna, ungdom, vuxen och äldre, presenteras i tabell 1 och 2. Med klinik avses en plats dit en patient kommer på bestämd tid efter att ha remitterats dit. Patienten lämnar vanligtvis kliniken samma dag. Med primärvård avses en plats dit patienten först vänder sig för att få hjälp med någon typ av åkomma. Med slutenvård avses en plats där patienten är inskriven på en avdelning en längre tid, vanligtvis minst över natten. Med ungdom avses en person i åldern 13 20, vuxen avser en person i åldern 21 65 och med äldre avses en person som är äldre än 65 år. Kvinnor Män Totalt Klinik 139 38 177 Primärvård 113 39 152 Slutenvård 42 25 67 Totalt 294 102 396 Tabell 1: Antal patienter från respektive typ av insamlingsplats. 9

Kvinnor Män Totalt Ungdom 104 23 127 Vuxen 137 48 185 Äldre 53 31 84 Totalt 294 102 396 Tabell 2: Antal patienter från respektive åldersgrupp. Läkarskattning genomfördes på totalt 169 patienter; av dessa var 54 män och 115 kvinnor. De läkarskattade patienterna fördelade sig på insamlingsplatser och åldersgrupper enligt tabell 3 och 4. Kvinnor Män Totalt Klinik 18 10 28 Primärvård 73 27 100 Slutenvård 24 17 41 Totalt 115 54 169 Tabell 3: Antal läkarskattade patienter från respektive typ av insamlingsplats. Kvinnor Män Totalt Ungdom 11 10 21 Vuxen 71 22 93 Äldre 33 22 55 Totalt 115 54 169 Tabell 4: Antal läkarskattade patienter från respektive åldersgrupp. 2.3.2 Bortfall Totalt antecknades 188 personer direkt som bortfall pga olika anledningar, se tabell 5. Av dem var 100 kvinnor och 88 män. Den totala svarsfrekvensen var 67.8%. Svarsfrekvensen för kvinnor var 74.6% och för män 53.7%. Av de patienter som deltog i studien var det 15 som inte lämnade full ständiga svar vid ifyllning av självbedömningsformuläret DSRS, och av dem var det fem som kom att räknas till bortfallet. Deras självbedömningsformulär var nämligen så pass ofullständigt ifyllda att det inte gick att avgöra om de uppfyllde kriterierna för depression eller ej. På egenbedömningsformuläret, MADRS S, var det 17 personer som ej besvarat en eller fler frågor. Totalt saknades svar på 74 frågor. Av de personer med ofullständiga egenbedömningsformulär var det nio personer vars totalpoäng ej gick att avgöra 10

Anledning Kvinnor (100) Män (88) ville ej 47% 44% för sjuk 25% 32% tidsbrist 12% 13% dålig svenska 6% 3% uppgift saknas 10% 8% Tabell 5: Anledning till bortfall bland de som tackade nej till deltagande. grupptillhörighet på, dvs om personen skulle klassas som symtomfri, i behov av medicinering eller bör remitteras till psykiatrin. Dessa personer räknades således till bortfall vid uppskattningen av överensstämmelsen mellan läkare och patient på totalpoäng. Vid analys av överensstämmelse på frågenivå har samtliga svar som lämnats av patienterna inkluderats i analysen. SPIFA MADRS Kvinnor Män Kvinnor Män Klinik Äldre Primärvård 1* 1 1 1 Slutenvård 1 1 2 Klinik Vuxen Primärvård 1 Slutenvård 1 1 Klinik 1* 2* Ungdom Primärvård Slutenvård Totalt 3 2 6 3 Tabell 6: Bortfall pga ofullständigt ifyllt formulär av patienten. (* = ej skattad patient.) 11

3 Statistiska metoder 3.1 Metod för att uppskatta reliabilitet i data 3.1.1 MADRS För att få en uppfattning om hur pass eniga läkarna är i bedömningen av en och samma patient och därmed hur hög reliabiliteten i data är används Cohen s kappa, κ, som mått. Varje läkares skattning jämförs med medianen för samtliga läkares skattningar. Kappakoefficienten antar värden i intervallet { 1, 1} och är ett mått på överensstämmelse som korrigerats för eventuell slumpmässig överensstämmelse. Generellt anser man att ˆκ 0.75 tyder på utmärkt överensstämmelse, 0.40 < ˆκ < 0.75 tyder på måttlig överensstäm melse, och ˆκ 0.40 på dålig överensstämmelse. Kappakoefficienten definieras som: ˆκ = p o p e 1 p e (1) där p o är summan av proportionerna som överensstämmer, dvs summan av diagonalvärdena i tabell 7, k p o = p ii (2) i=0 medan p e är summan av produkterna av marginalsannolikheterna, p i och p i enligt tabell 7. k p e = p i p i (3) i=0 Median Läkarens bedömning 0 1... k Totalt 0 p 00 p 01... p 0k p 0 1 p 10 p 11... p 1k p 1..... k p k0 p k1... p kk p k Totalt p 0 p 1... p k 1 Tabell 7: Proportioner mellan läkare och medianen för samtliga läkare på en skala med k+1 kategorier. Med k avses det maximala värdet som skattningen kan anta, i detta fall är k = 6, dvs läkaren kan bedöma patienten med något av skalstegen {0,1,...,6}. 12

Eftersom skattningsskalan för MADRS utgörs av en ordinalskala, betyder det att en avvikelse med två steg, mellan två bedömare, visar på bättre överensstämmelse än en avvikelse med tre, fyra eller fem steg gör. Därför är det vid beräkning av kappakoefficienten möjligt att använda ett sk viktat kappa. Ett viktat kappavärde innebär att även de bedömningar som inte är exakt överensstämmande kommer att bidra till kappavärdets storlek. Vikterna, w ij, (i = 0,..., k; j = 0,..., k), väljs i intervallet {0, 1} så att w ii = 1, dvs exakt överensstämmelse tilldelas maximal vikt. Övriga vikter väljs genom: (i j)2 w ij = 1 (4) k 2 På så vis kommer alla bedömningar som inte överensstämmer exakt att tilldelas mindre vikt än den maximala. Läkarens bedömning och medianen anses uppträda symmetriskt, så w ij = w ji. Den viktade proportionen av överensstämmelse beräknas genom: p o(w) = k i=0 k w ij p ij (5) där proportionerna, p ij, är enligt tabell 7. Den viktade slumpmässiga överens stämmelsen beräknas genom: p e(w) = k i=0 j=0 k w ij p i p j (6) j=0 och bygger på antagandet om oberoende mellan bedömarna. Det viktade kappavärdet för varje bedömare ges slutligen av: ˆκ (w) = P o (w) P e (w) 1 P e (w). (7) För att kombinera de 15 skattningarna av kappavärdet beräknas ˆκ (w)medel genom: ˆκ (w)medel = g m=1 g m=1 ˆκ (w)m V m(ˆκ (w)m ) 1 V m(ˆκ (w)m ) Ett approximativt 100(1 α)% konfidensintervall för det kombinerade underliggande värdet κ (w)medel ges av: 1 ˆκ (w)medel ± c α/2 (9) g m=1 1 V m(ˆκ (w)m ) (8) 13

där V m (ˆκ (w)m ) = (s.e.(ˆκ (w)m )) 2 och s.e.(ˆκ (w) ) för den m:te skattningen av κ (w) uppskattas genom: där s.e.(ˆκ w ) = 1 (1 p e(w) ) k n i=0 k j=0 p ij [w ij ( w i + w j )(1 ˆκ w )] 2 D (10) D = [ˆκ w p e(w) (1 ˆκ w )] 2 (11) w i = k p j w ij (12) j=0 w j = k p i w ij. (13) i=0 För att uppskatta hur läkarnas skattningar förhåller sig till en sk gold standard 2 utförs även beräkningar av viktat kappa mot gold standard på samma vis som för medianen. Samtliga beräkningar är enligt[?]. 3.1.2 SPIFA När det gäller överensstämmelsen mellan läkarna i bedömningen av patienten som intervjuades efter SPIFA manualen är det pga de sneda marginalsannolikheterna inte rättvisande att använda kappa som ett mått på reliabiliteten. Här beräknas istället ett procenttal, p i, för hur pass bra varje läkares bedömning stämmer överens med majoritetens bedömning. Ett medelvärde för dessa procental beräknas slutligen genom: m = 1 N N p i (14) i=1 där N är antalet läkare som genomförde samskattningsövningen. 2 Med gold standard menas här en bedömning av patienten som gemensamt utförts av några personer med lång erfarenhet av MADRS skalans tillämpning. 14

3.2 Metod för att uppskatta överensstämmelse mellan läkarens och patientens skattning 3.2.1 MADRS & MADRS S Om man betraktar alla läkarskattningar och egenbedömningar, enligt MADRS formuläret, som par av observationer där ingen hänsyn tas varken till vem som skattat patienten eller till vilken fråga som besvarats kan man betrakta data som två variabler med n observationer. Antalet observationer: n = 9 (antal skattade patienter) bortfall. (15) Ett viktat kappa för överensstämmelsen mellan läkarens skattning och patientens egenbedömning beräknas på samma sätt som vid beräkningen av interbedömaröverensstämmelsen, men med patientens skattning istället för medianen, se avsnitt 3.1.1, ekvation (4) (7) för detaljer. Ett approximativt 100(1 α)% konfidensintervall för det viktade kappavärdet beräknas genom[?]: ˆκ w c α/2 s.e.(ˆκ w ) κ w ˆκ w + c α/2 s.e.(ˆκ w ) (16) där s.e.(ˆκ w ) beräknas enligt ekvation (10) (13)[?]. För att uppskatta överensstämmelse mellan läkarens och patientens skattning på totalpoängen beräknas dels ett oviktat kappa för överensstämmelse på grupptillhörighet, dels korrelationen mellan totalpoäng på MADRS och MADRS S. För beräkning av oviktat kappa införs dummyvariabler, 1, 2 och 3, där patienter med totalpoäng, 0 20 enligt läkarens skattning tilldelas 1, 21 40 tilldelas 2 och en totalpoäng > 40 ger en 3:a 3. Eftersom formuläret som fyllts i av patienten endast innehåller nio frågor beräknas de poäng som patienten bör uppnå, genom att ta motsvarande procenttal av den maximala poängen. För att läkarens skattning ska generera en 2:a krävs således en totalpoäng mellan 21 och 40, vilket motsvaras av en totalpoäng mellan 35% och 67% av 60 poäng. Totalpoängen på patientens egenbedömning ska således ligga mellan 35 67% av 54 poäng, dvs mellan 19 och 36 poäng, för att klassas som en 2:a. Ett kappavärde för överensstämmelse på totalpoäng beräknas genom: ˆκ = p o p e 1 p e (17) 3 Rekommenderade gränser för totalpoängen på MADRS, enligt vilka olika åtgärder bör vidtas[?], se avsnitt 2.1.1. 15

där och p o = p e = k p ii (18) i=0 k p i p i (19) i=0 och proportionerna, p ij, är enligt tabell 8[?]. Patientens bedömning Läkarens bedömning 1 2 3 Totalt 1 p 11 p 12 p 13 p 1 2 p 21 p 22 p 23 p 2 3 p 31 p 32 p 33 p 3 Totalt p 1 p 2 p 3 1 Tabell 8: Proportioner av läkarens och patientens bedömningar. Ett approximativt 100(1 α)% konfidensintervall för kappavärdet beräknas genom: där ˆκ c α/2 s.e.(ˆκ) κ ˆκ + c α/2 s.e.(ˆκ). (20) s.e.(ˆκ) = samt A, B och C beräknas genom[?]: A + B C (1 p e ) n (21) A = k p ii [1 (p i + p i )(1 ˆκ)] 2 (22) i=0 B = (1 ˆκ) 2 i j p ij (p i + p j ) 2 (23) C = [ˆκ p e (1 ˆκ)] 2. (24) För att uppskatta korrelationen beräknas Spearmans rho. Spearmans rho är en korrelationskoefficient som uppskattar beroendet mellan ranger för icke normalfördelade data. Spearmans rho beräknas genom: i,j θ = (r i r)(s j s) i (r i r) (25) 2 j (s j s) 2 16

där r i och s j är rangerna för totalpoängen på MADRS respektive MADRS S. För att undersöka hur pass bra överensstämmelsen är på respektive fråga mellan MADRS och MADRS S beräknas ett kappavärde för var och en av de nio frågorna. Detta genom att ta samtliga par av observationer som gjorts på respektive fråga utan hänsyn till vilken läkare som gjort skattningen. Ett viktat kappa beräknas via ekvation (4) (7), med patientens skattning istället för median. Ett konfidensintervall för viktat kappa beräknas via ekvation (10) (13) samt via ekvation (16). För att undersöka om kappa varierar mellan de platser (och därmed i stort sett av vem som skattat) som skattningarna utförts på, beräknas viktat kappa med konfidensintervall för respektive insamlingsplats där läkarskattnigar genomförts. Dessa beräkningar utföres via samma ekvationer som vid beräkning av viktat kappa för respektive fråga, se ovan. 3.2.2 SPIFA & DSRS Då formuläret för patientens självbedömning, DSRS, och formuläret som fyllts i av läkaren, SPIFA, innehåller olika antal frågor som ej är exakt överensstämmande har endast utfallet av respektive formulär jämförts, dvs om patienten har depression eller ej. För att uppskatta överensstämmelsen används kappavärdet som mått. Genom att betrakta läkarens och patientens skattning som oberoende par av 0/1 variabler, där 0 = ej depression och 1 = depression, erhålls totalt n par av observationer, där n är antalet genomförda läkarskattningar minus ev bortfall. Kappavärdet beräknas på samma sätt som vid överensstämmelse på totalpoäng, men med k = 2, se avsnitt 3.2.1, ekvation (17) (24) för detaljer. 3.3 Metod för att uppskatta prevalens av depression För att uppskatta andelen deprimerade i de olika patientgrupperna används dels patienternas självbedömningsformulär, DSRS, och dels läkarens skattning enligt SPIFA(se avsnitt 2.1.2 för beskrivning av formulären). Detta för att se om det eventuellt finns några skilllnader i prevalens av depression mellan läkarnas och patienternas uppfattning. En studie av prevalens avser att vid en fix tidpunkt uppskatta andelen som uppfyller ett visst överenskommet kliniskt kriterium[?], i detta fall kriteriet för depression. Andelen deprimerade i populationen betecknas med P. P skattas med p genom: p = d n (26) 17

Där d är antalet personer som i undersökningen uppfyller kriterierna för depression, enligt respektive formulär, d är binomialfördelad Bin(n,P). Då np 5 och nq 5 där Q = 1 P är det möjligt att använda normal approximation av den exakta binomialfördelningen. Ett konfidensintervall för den underliggande proportionen, P, ges av alla de värden på P som uppfyller: p P 1 2n P Q n c α/2. (27) Genom att definiera q = 1 p och lösa ut P ges den undre respektive övre gränsen av: (2np + c 2 α/2 1) c α/2 c 2 α/2 (2 + 1/n) + 4p(nq + 1) P L = 2(n + c 2 α/2 ) (28) och P U = (2np + c 2 α/2 + 1) + c α/2 c 2 α/2 + (2 1/n) + 4p(nq 1) 2(n + c 2 α/2 ) (29) där c α/2 är värdet som skär bort arean α/2 från de båda ändarna på normal fördelningskurvan [?]. Då np < 5 eller nq < 5 används en tabell[?] för att uppskatta konfidensintervallet för P. 3.4 Överensstämmelse mellan MADRS & SPIFA samt mellan MADRS S & DSRS För att undersöka om de båda formulären SPIFA och MADRS tenderar att ge samma utfall vid bedömning av depression bör det vara skillnad mellan populationen som har bedömts deprimerade enligt SPIFA och den population som inte har det vad beträffar totalpoäng på MADRS. För att undersöka om populationen utan depression (SPIFA=0) skiljer sig från populationen med depression (SPIFA=1) utförs test av: H 0 = Inga skillnader mellan fördelningarna för MADRS totalpoäng före kommer mellan populationerna, SPIFA=0 och SPIFA=1. Då båda fördelningarna ej kan antas vara normalfördelade, används ett icke parametriskt test, Wilcoxons rangsummetest. 18

Observationerna från stickproven ordnas i storleksordning och tilldelas ranger från 1 till N, där N = n 0 + n 1, dvs summan av stickprovsstorlekarna. Rangsummorna, R 0 och R 1 beräknas. Ett lågt värde på R 0, och därmed ett högt värde på R 1 innebär att fördelningen för SPIFA=0 är förskjuten mot lägre värden[?]. Teststatistikan som används för test av H 0 är: H = 12 n i ( R i R) 2 N(N + 1) (30) där R i är medelvärdet av rangerna i grupp i och R är medelvärdet av alla ranger. Under nollhypotesen kan fördelningen för H approximeras med χ 2 1[?]. Testet utförs på samma sätt för att kontrollera överensstämmelsen mellan formulären ifyllda av patienten, MADRS S och DSRS. 19

4 Resultat 4.1 Reliabilitet i data 4.1.1 MADRS Det totala antalet läkare som skattade patienter och deltog i samskattnings övningen var 15 st, så g = 15. Ett kombinerat viktat kappavärde, ˆκ (w)median, samt ett 95% igt konfidensintervall för detta, beräknades till: ˆκ (w)median = 0.74 (31) 0.71 ˆκ (w)median 0.77 (32) Viktat kappa för läkarnas överensstämmelse med gold standard, beräknades till: ˆκ (w)g.s = 0.62 (33) 0.55 ˆκ (w)g.s 0.68 (34) Samtliga beräkningar utförda i Matlab, se bilaga V. Samtliga läkare bedömde att patientens totalpoäng var 28 och 41 poäng. 4.1.2 SPIFA Totala antalet läkare som deltog var 15, så N = 15. 15 i=1 p i = 13.9, vilket ger m = 0.93, dvs överensstämmelse på SPIFA uppskattas vara 93%. Samtliga läkare bedömde patienten som deprimerad enligt kriterierna för SPIFA. 4.2 Överensstämmelse mellan läkarens och patientens skattning 4.2.1 MADRS & MADRS S Antalet observationer vid uppskattning av överensstämmelsen mellan läkare och patient då ingen hänsyn tas till fråga eller till vem som skattat patienten uppgick till 1480 observationer.viktat kappavärde och ett 95%-igt konfidensintervall beräkandes i SAS (se bilaga VI) till: ˆκ w = 0.68 (35) 0.64 ˆκ w 0.72 (36) Vid uppskattningen av överensstämmelse på totalpoängen baseras räkning arna på n=163 observationer, fördelade enligt tabell 9. Enkelt kappavärde samt ett 95%-igt konfidensintervall beräknades (se bilaga VI) till: 20

ˆκ total = 0.63 (37) 0.46 κ total 0.79 (38) Patientens bedömning Läkarens bedömning 1 2 3 Totalt 1 130 13 0 143 2 3 16 0 19 3 0 0 1 1 Totalt 133 29 1 163 Tabell 9: Fördelning av läkares och patienters bedömningar för totalpoäng på MADRS och MADRS S. Korrelationen mellan totalpoäng på MADRS och MADRS S, Spearmans rho, beräknades i SAS (se bilaga VI) till: ˆθ = 0.79 (39) Resultat av beräkningarna av viktat kappavärde för respektive fråga presenteras i tabell 10. Beräkningar utförda i Matlab, se bilaga VII. MADRS ˆκ (w) ˆκ (w)low ˆκ (w)high Antal obs. 1 0.71 0.61 0.81 164 3 0.65 0.55 0.74 165 4 0.71 0.60 0.82 166 5 0.60 0.43 0.77 165 6 0.71 0.63 0.80 165 7 0.66 0.57 0.76 164 8 0.56 0.44 0.68 164 9 0.60 0.47 0.72 164 10 0.65 0.52 0.79 163 Tabell 10: Viktat kappa, med 95% konfidensintervall, för överensstämmelse på respektive fråga mellan MADRS och MADRS S formuläret. Resultat av beräkningar av viktat kappa för respektive insamlingsplats presenteras i tabell 11. Beräkningar utförda i Matlab, se bilaga VII. 21

Plats ˆκ (w) ˆκ (w)low ˆκ (w)high A (63) 0.30 0.01 0.59 B (54) 0.67 0.54 0.80 C (134) 0.80 0.72 0.89 D (90) 0.58 0.40 0.76 E (27) 0.50 0.07 0.92 F (54) 0.72 0.57 0.87 H (72) 0.65 0.50 0.79 I (432) 0.69 0.62 0.76 J (180) 0.69 0.59 0.80 K (72) 0.54 0.32 0.76 L (27) 0.92 0.85 0.99 M (24) 0.52 0.18 0.87 N (38) 0.17-0.10 0.44 O (63) 0.36 0.11 0.61 P (61) 0.67 0.53 0.81 Q (35) 0.44 0.21 0.68 Tabell 11: Viktat kappa för överensstämmelse mellan MADRS och MADRS S för respektive plats, antal observationer inom parentes. 4.2.2 SPIFA & DSRS Beräkningar har utförts i SAS, se bilaga VI. Antalet observationer var 165 fördelade enligt tabell 12. Kappakoefficienten beräknades till: Ett 95% konfidensintervall beräknades till: ˆκ = 0.60 (40) 0.46 ˆκ 0.74 (41) Patientens bedömning Läkarens bedömning 0 1 Totalt 0 114 20 134 1 4 27 31 Totalt 118 47 165 Tabell 12: Fördelning för läkarens och patientens bedömningar enligt SPIFA och DSRS. 22

4.3 Prevalens av depression i olika patientgrupper Andelen med depression, enligt patienternas självbedömning (DSRS) presenteras i tabell 13, och enligt läkarskattningarna (SPIFA) i tabell 14. Beräkningar utförda i Matlab, se bilaga VIII. Grupp Deprimerade(%) Undre gräns(%) Övre gräns(%) män 18 11 27 kvinnor 34 29 40 ungdom 35 27 44 män 9 1 28 (1) kvinnor 40 31 50 vuxna 33 27 41 män 25 14 40 kvinnor 36 28 45 äldre 16 9 27 män 14 4 32 (1) kvinnor 18 9 31 klinik 34 28 42 män 13 5 29 kvinnor 40 32 49 primärvård 26 19 34 män 18 8 35 kvinnor 29 21 38 slutenvård 28 18 41 män 25 11 47 kvinnor 30 17 47 Tabell 13: Andel deprimerade(%), enligt patientens självbedömning(dsrs), samt 95% konfidensintervall för respektive grupp, (1) intervallet från tabell då Np < 5. 23

Grupp Deprimerade(%) Undre gräns(%) Övre gräns(%) män 6 2 16 (1) kvinnor 26 19 35 ungdom 19 5 43 (1) män 0 0 31 (1) kvinnor 36 10 71 (1) vuxna 26 18 36 män 9 2 31 (1) kvinnor 31 21 43 äldre 9 3 19 (1) män 5 0 25 (1) kvinnor 12 3 29 (1) klinik 25 11 45 män 0 0 31 (1) kvinnor 39 18 64 primärvård 16 10 25 män 0 0 13 (1) kvinnor 22 13 33 slutenvård 24 13 41 män 18 9 42 (1) kvinnor 29 13 51 Tabell 14: Andel deprimerade(%), enligt läkarskattningar med SPIFA, samt 95% konfidensintervall för respektive grupp, (1) intervallet från tabell då Np < 5. 4.4 Överensstämmelse mellan MADRS & SPIFA samt mellan MADRS S & DSRS Rangsummorna för populationerna beräknas med hjälp av Kruskal Wallis test i Minitab, vilket är detsamma som Wilcoxons rangsummetest. Vid jäm förelse av populationerna SPIFA=0 och SPIFA=1 vad beträffar totalpoäng på MADRS beräknades rangsummorna till, R 0 = 70.9 och R 1 = 143.2. Testet visar på en signifikant skillnad mellan de båda populationerna (p 0.0001). Vid jämförelse av populationerna DSRS=0 och DSRS=1 vad beträffar totalpoäng på MADRS S beräknas rangsummorna till, R 0 = 60.8 och R 1 = 128.7. Även detta test visar på en signifikant skillnad mellan de båda populationerna (p 0.0001). 24

5 Diskussion Vad beträffar reliabiliteten i data visar sig överensstämmelsen inom gruppen av läkare som skattat patienter vara god, ˆκ (w) = 0.74. Generellt anser man att ˆκ (w) 0.75 tyder på utmärkt överensstämmelse, medan ˆκ (w) 0.40 tyder på dålig överensstämmelse[?]. Enigheten bland läkarna i bedömningen av patienten som intervjuades enligt SPIFA var även den god. Dock är det här inte lämpligt att använda kappavärde som mått på överensstämmelse då marginalsannolikheterna är sneda. Detta till följd av att patienten, som i videoupptagningen intervjuades enligt SPIFA, av majoriteten bedömdes uppfylla alla kriterier på depression som efterfrågades. Ett sätt att eventuellt undvika problem av denna typ är att använda sig av ett mer varierat material, dvs ett där patienten inte uppfyller samtliga kriterier på depression. Detta resonemang bygger på en artikel där marginalsannolikheternas betydelse för kappakoefficientens storlek diskuteras[?]. I artikeln konstateras bla att för ett fixt värde på den observerade överensstämmelsen, p o, minimeras den slumpmässiga överensstämmelsen, p e, (därmed maximeras kappakoefficienten) då marginalsannolikheterna är likformiga. Denna egenskap hos kappakoefficienten finner författaren rimlig eftersom det i ett fall där bedömningarna är koncentrerade till ett fåtal kategorier kan vara så att beslutskriterierna för att tillhöra en viss kategori är otillräckliga för att avgöra kategoritillhörighet. Därav borde kappakoefficienten då anta ett lägre värde än i ett fall där alla kategorier används i lika stor utsträckning. När det gäller läkarnas skattningar i förhållande till gold standard är överensstämmelsen något låg, ˆκ (w) = 0.62. Detta skulle kunna bero på att en del av de läkare som skattade patienter var relativt nyutexaminerade, då de gjorde sin AT tjänstgöring under insamlingen av data. Det är därför troligt att de har mindre erfarenhet i användningen av skattningsformuläret MADRS, än vad den grupp specialister har som här utgör gold standard. Vid uppskattning av överensstämmelsen mellan MADRS och MADRS S, där man betraktar alla par av observationer som utförts utan hänsyn till vem som skattat eller till vilken fråga som besvarats, beräknas ˆκ (w) till 0.68. Detta kan tyckas vara tämligen god överensstämmelse för att vara på frågenivå; man bör dock tänka på att detta resultat beror på många faktorer och därmed är felkällorna många. Patientens poäng på skattningsskalan påverkas av vederbörandes sanna tillstånd samt av det egna kriteriet för att skatta sig med nämnda poäng. Man kan anta att det förekommer variation inom patienten vid användandet av kriteriet, dvs en och samma patient kan vid ett tillfälle skatta sig med en 1:a och vid ett annat med en 2:a, trots att patientens sanna tillstånd är detsamma. Dessutom finns det variation mellan patienter, dvs två olika patienter som antas ha samma sanna tillstånd 25

tillämpar sina egna individuella kriterier och kan på så vis komma att skatta sig med olika poäng. Läkarens skattning beror likaså av vederbörandes egna kriterier, och skattningen av en och samma patient kan på så vis variera beroende av vem som utfört skattningen. Denna variation antas man dock ha kontrollerat för då man genom samskattningsövningen fått gruppen av läkare att tillämpa ungefär samma kriterium, men dock inte exakt samma eftersom ˆκ (w) < 1.0. Överensstämmelse på kategoritillhörighet, vad beträffar totalpoängen på MADRS och MADRS S, har uppskattats med ett enkelt kappavärde. Detta för att det här kan vara rimligt att kräva exakt överensstämmelse då resultatet av totalpoängen är det som till största del avgör vilka åtgärder som ska vidtas för patienten. Kappa uppskattas här till 0.63, vilket är något lågt. Vid närmare betraktande av tabell 9 kan man anta att det låga kappavärdet till stor del beror på de 13 observationer där läkarens totalpoäng genererat 1 och patientens 2. Detta tolkas som att patienterna finner sig något mer deprimerade än vad läkarna anser. Om man återknyter detta resultat med resultatet för gruppens överensstämmelse med gold standard finner man möjligen en rimlig förklaring. Då medianen för läkarna i samskattningsövningen var lägre än vad gold standard var är det tänkbart att denna grupp av läkare har en tendens att skatta lågt. Det något låga kappavärdet behöver således inte nödvändigtvis vara ett resultat av dålig överensstämmelse mellan de båda formulären. Spearmans korrelationskoefficient för totalpoäng på de båda formulären beräknades till, ˆθ = 0.79. Detta är relativt hög korrelation, då maximal möjlig korrelation är 1.0, därmed antas totalpoängen på MADRS och MADRS S samvariera starkt. Vad beträffar överensstämmelsen mellan MADRS och MADRS S på respektive fråga ser det inte ut som att någon fråga avviker markant, dock har inga test utförts. Fråga nr 9, som har ett relativt lågt kappavärde (ˆκ (w) = 0.60) i förhållande till övriga värden, har tidigare uppmärksammats för att innehålla viss tvetydighet. Anledningen till tvetydigheten är att pessimism i bemärkelsen bristande framtidstro och föreställningar om samhällets undergång i olika bemärkelser är något annat än självförebråelser och känsla av att vara mindervärdig. Detta försök till förklaring har framförts i en diskussion på internet och är inte officiellt bekräftat. Men det är tänkbart att de två möjliga tolkningar kan ha bidragit till den låga överensstämmelsen mellan patient och läkare då de kan ha tolkat frågan på olika sätt. Variationen är stor vad beträffar kappavärden på de olika insamlingsplatserna. Antalet patienter som skattats på de olika platserna varierar också kraftigt, från 3 till 48. På tre platser är ˆκ (w) 0.40 vilket betyder att överens stämmelsen här inte är mycket bättre än slumpen. Överensstämmelsen mellan utfallet av formulären SPIFA och DSRS upp- 26

skattades till, ˆκ = 0.60, vilket är något lågt för att överensstämmelsen ska betecknas som god. Även här har läkarna en tendens att mer sällan skatta patienterna som deprimerade än vad patienterna själva gör (se tabell 12). Uppskattningen av prevalensen av depression enligt patientens formulär, DSRS, tycks stämma överens med att livstidsrisken för kvinnor att insjukna i en behandlingskrävande depression är större än livstidsrisken för män. Man finner här att en större andel kvinnor, 34%, än män, 18%, är deprimerade. Dock bör man beakta att svarsfrekvensen för män endast var 53.7%, vilket är lågt. Den största andelen deprimerade hittar man i gruppen unga kvinnor, av vilka uppskattningsvis 31% 50% är deprimerade. Skattningen av prevalens av depression, som baseras på läkarnas bedömning enligt SPIFA, pekar också den på att unga kvinnor är den åldersgrupp där störst andel är deprimerade. Dock är intervallen här mycket breda pga få observationer. Överensstämmelse mellan de båda formulären som använts av läkarna respektive patienterna tycks finnas. Resultatet av test av H 0, inga skillnader mellan fördelningar på totalpoäng för populationerna utan och med depression, visar på att det, som sig bör, finns en skillnad vad beträffar totalpoäng på MADRS respektive MADRS S. Dock förekommer det att patienter som enligt SPIFA och DSRS ej bedömts som deprimerade, på MADRS och MADRS S uppnår en totalpoäng > 20, vilket innebär att de kan tänkas vara i behov av antidepressiv medicinering. 27

6 Referenser 28

7 Bilagor I MADRS II MADRS S III SPIFA IV DSRS V Beräkning av reliabilitet (Matlab) VI Beräkningar utförda i SAS Viktat kappa för MADRS & MADRS S på frågenivå Kappa för totalpoäng på MADRS & MADRS S Spearmans rho Kappa för SPIFA & DSRS VII Beräkning av viktat kappa för olika frågor och insamlingsplatser (Matlab) VIII Beräkning av konfidensintervall för andelen deprimerade (Matlab) 29