Att bygga en språkbro mellan allmänhet och vårdpersonal

Relevanta dokument
7. Sammanfattande diskussion

Sofie Johansson Kokkinakis

Uppbyggandet av en svensk medicinsk korpus för termvalidering och termextrahering hur bra täcker SNOMED CT olika delfackområden?

MEIJERBERGS ARKIV SVENSK ORDFORSKNING GÖTEBORG 2014 FÖR UTGIVET AV STYRELSEN FÖR MEIJERBERGS INSTITUT VID GÖTEBORGS UNIVERSITET GENOM BO RALPH

Ordförråd och Ordbildning

Här följer den pedagogiska planeringen för det arbetsområde som kommer att pågå från och med vecka 5, i samarbete med SO.

Omtentamen Svenska 1 för grundlärare med inriktning fk-3 21 januari 2012

LPP Magiska dörren ÅR 4

Allmänspråk och fackspråk

Frågor och svar om Pradaxa & RE LY

Lexikon: ordbildning och lexikalisering

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Mängden utslag kan avgöra risken. Den som har psoriasis har en ökad risk för hjärtkärlsjukdomar.

Kvalitet i den svenska översättningen av Snomed CT

Artärer de ådror som för syresatt blod från lungorna ut i kroppen.

ÄLTA SKOLAS LOKALA KURSPLAN

Riktlinjer för Försäkringskassans begreppskatalog

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet

Nationell informationsstruktur och Snomed CT ökar patientsäkerheten och minskar administrationen. Anna Aldehag Med dr, enhetschef

Grammatisk teori III Praktisk analys

Centralt innehåll. I årskurs 1 3

Svensk nationell datatjänst, SND BAS Online

Läsårsplanering årskurs 4

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk

MASTER. Mining and selecting texts for easy reading. Katarina Mühlenbock

ENGA21: Engelska fortsättningskurs, 30 högskolepoäng Studiebeskrivning

Vad bestämde vi idag? En randomiserad studie om effekten av skriftlig information vid läkarbesök

Omtentamen Svenska 1 för grundlärarprogrammet med inriktning mot årskurs jan 2012

Skolans språk är ingens modersmål. Nils Fredriksson Utbildning

MEQ fall p. Anvisning: Frågan är uppdelad på 4 sidor. Poäng anges vid varje delfråga.

Tala, skriva och samtala

Remiss Remissvar lämnas i kolumnen Tillstyrkes term och Tillstyrkes def(inition) och eventuella synpunkter skrivs i kolumnen Synpunkter.

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Juridiska, svenska eller mittemellan?

Centralt innehåll årskurs 7-9

Remiss Remissvar lämnas i kolumnen Tillstyrkes term och Tillstyrkes def(inition) och eventuella synpunkter skrivs i kolumnen Synpunkter.

Grammatik för språkteknologer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

Ett riskbruk är en alkoholkonsumtion som kraftigt ökar risken för skada och ohälsa och sociala konsekvenser. För vissa personer är all användning av

Närståendes uppfattade delaktighet vid vårdplanering för personer som insjuknat i stroke

Förmaksflimmer ORSAK, SYMTOM, BEHANDLING PATIENTINFORMATION

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande:

Undervisningen i ämnet moderna språk ska ge eleverna förutsättningar att utveckla följande:

3.18 Svenska som andraspråk

Praktisk Svenska 2. Jag kan Skapa och använda olika minnesknep Studieteknik 1

Fördjupningsseminarie om den nationella informationsstrukturen NI 2015:1

Svenska mål och kriterier

Biblioteken, Futurum 2017

Ny version av den nationella informationsstrukturen, NI. Vitalis 23/ Ingela Strandh Informationsstruktur och e-hälsa, avdelningen Kunskapsstöd

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

efter knä- eller höftledsoperation

Förslag till beslut Landstingsstyrelsen föreslår landstingsfullmäktige besluta

Klarspråk på nätet - Webbredaktörens skrivhandbok av Karin Guldbrand & Helena Englund Hjalmarsson

En Sifo-undersökning om läkemedelsanvändning bland äldre

BESLUT. Datum

AMIRA TIME. Lätt version. Lärarhandledning

Skrivstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig

Kamratbedömning. Fokusera på följande:

Karp. Övningar Språkbankens höstworkshop oktober 2016

Modersmål - jiddisch som nationellt minoritetsspråk

Kursbeskrivning med litteraturlista HT-13

Till dig som behandlas med Xarelto för blodpropp i ben och lunga. Patientinformation

ESN lokala kursplan Lgr11 Ämne: Svenska

Venös insufficiens 2010

Pedagogisk planering tidningstexter

Viktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med:

Patientinformation. idag och imorgon. Sjukhusbiblioteken i Region Skåne. Medicinska bibliotekskonferensen Stockholm 17 april 2015

Kursplan för Moderna språk

Språkbruk Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord.

Sammanställning av utvärderingar kring satsningen på kapprumsbibliotek i Lerum, september 2017

Kort presentation av Korp, Sveriges nationalkorpus

Kursplan i svenska för kompletterande undervisning för svenska elever i utlandet

MÅL OCH BETYGSKRITERIER I SVENSKA

SÅ ANVÄNDER DU VALIDERATEXT.SE Lägg in text att validera

Grammatik för språkteknologer

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc.

Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga

Handledning och checklista för klarspråk

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

SVENSKA SOM ANDRASPRÅK

Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet teckenspråk för hörande

Till dig som behandlas med Xarelto för blodpropp i ben och/eller lunga. Patientinformation

Kvantitativ samhällsanalys med språkteknologiska metoder.

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Lokala rekommendationer för hantering av antikoagulantia vid endoskopiska undersökningar S:t Görans Sjukhus

10 tips. för dig som skapar internetbaserade stödprogram för vården. psykologpartners

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet

Kursplan för kurs på grundnivå

3.7.4 Modersmål - meänkieli som nationellt minoritetsspråk

729G17/729G66 Lexikal semantik och ordbetydelsebestämning. Olika ordbegrepp. Vad är ordbetydelse (1) Olika ordbegrepp

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Mediafostran och användandet av nya kommunikativa redskap påbörjas redan på nybörjarstadiet.

Terminsplanering i Svenska årskurs 9 Ärentunaskolan

Förskola 1-5år Mål Riktlinjer

Pragmatisk och narrativ utveckling

Språk och begriplighet i journaler Mia Kvist

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

INNEHÅLLSFÖRTECKNING... 1 INLEDNING ORDBOKEN I VERKTYGSLISTEN ORDBOKEN... 3

Transkript:

Att bygga en språkbro mellan allmänhet och vårdpersonal Språket i texter om hjärt-kärlsjukdomar Dimitrios Kokkinakis, forskarassistent, Maria Toporowska-Gronostaj, forskare samt Sofie Johansson Kokkinakis, fil. dr i språkvetenskaplig databehandling, samtliga verksamma vid institutionen för svenska språket Patienters delaktighet och inflytande på sin egen vård är en förutsättning för att framtidens hälso- och sjukvård ska uppskattas av medborgarna och dessutom vara kostnadseffektiv. Konsumtionen av hälso- och sjukvård har ökat på senare år i Sverige. Det har medfört ett ökat intresse för medicin och vård. Människan är inte längre en passiv hälsokonsument utan förväntas vara en medveten och aktivt medverkande part i frisk- och sjukvården. Detta ställer allt större krav på patienters och deras närståendes förmåga att i detalj förstå all den hälsorelaterade information som de dagligen exponeras för. Denna information kan vara mer eller mindre lätt att förstå dels beroende på dess utformning, dels på mottagarens förkunskaper. För att underlätta kommunikationen mellan hälsotagare och hälsogivare satsas det i utlandet och i Sverige på nätbaserad patientinformation. Det innebär att organisationer som läkemedelsproducenter, Socialstyrelsen och media via sina informationskanaler tillhandahåller mängder av information som riktas speciellt till hälsokonsumenter. Information förmedlas främst språkligt men också visuellt genom bilder eller filmer på webben. Sådana resurser är mycket värdefulla och ger grundläggande kunskaper om olika åkommor och behandlingsformer. I några fall åtföljs informationen 143

av en ordlista där de viktigaste termerna finns förklarade. Sådana ordlistor fungerar som första hjälpen för att förstå informationen. Sökningar på nätet efter mer täckande medicinska ordböcker med integrerad utförlig språklig och medicinsk information för lekmän visar dock att sådana svenska resurser lyser med sin frånvaro. Av den anledningen kan det vara berättigat att reflektera över språket i medicinska texter för att i nästa steg kunna bygga upp textbaserade relevanta medicinska ordböcker med inslag av språklig och encyklopedisk medicinsk information för lekmän. Därför är ett av syftena med vår forskning att bygga en bro i form av en dynamisk elektronisk medicinsk ordbok som ska avspegla det språk som används på webben för medicinsk kommunikation. För att kartlägga det medicinska språket har vi gjort ett antal kvantitativa och kvalitativa undersökningar som utgår ifrån analys av ordförrådet i två typer av medicinska textsamlingar inom området hjärt-kärlsjukdomar. Den ena textsamlingen riktar sig till hälsotagare och den andra till hälsogivare. Resultaten av våra undersökningar avslöjar en hel del karakteristiska drag och tendenser i de medicinska texterna. De frågor som vi försöker besvara i vår analys är: Vilka gemensamma specifika språkliga kännetecken finns i dessa texter? Vilka begrepp används av medicinska experter i deras interaktion med å ena sidan medicinskt kunniga och å andra sidan lekmän? Vilka benämningar finns för att kommunicera dessa begrepp? Vilka typiska kännetecken skiljer dessa två typer av texter åt? Urval ur ett medicinskt empiriskt textmaterial En textkorpus är en samling skrivna elektroniska texter som bearbetas för att underlätta datorbaserade studier av språket. En sådan korpus, som kartlägger sammansättningen av det svenska medicinska skrivna språket, har under de senaste två åren byggts upp och bearbetats på Institutionen för svenska språket. Korpusen utgör ett nödvändigt underlag för konstruktion av t. ex. term- och fraslistor, för studier av syntaxen och semantiken, men också för språkforskning av teoretiskt intresse. Korpusen är hämtad från webben och består av hela, sammanhängande texter, vilka representerar olika medicinska texttyper, som t. ex. beskrivning av sjukdomar, läkemedel, nya forskningsrön, föreskrifter osv. Det totala empiriska materialet 144

Lekmannakorpus När man får en blodpropp, så kallad trombos, levrar sig blodet och bildar en propp inuti ett blodkärl. Proppen gör det svårare för blodet att passera genom blodkärlet. Blodproppar är vanligast i benen, och börjar ofta i vaderna. Proppar kan någon gång bildas också på andra ställen i kroppen, till exempel i armarna, men det är inte alls lika vanligt. (Ur Sjukvårdsrådgivningen; http://www.sjukvardsradgivningen.se) Facktextkorpus Förhöjda nivåer av D-dimer i blodet är en indikator på fibrinnedbrytning in vivo, och analysen har väckt stora förhoppningar vid diagnostik av venös tromboembolism. Den primära frågan är om analysen kan vara användbar för att utesluta djup ventrombos och lungembolism vid en akutmottagning. (Ur Socialstyrelsens riktlinjer för vård av blodpropp/venös tromboembolism 2004; http://www.socialstyrelsen.se) består av 11 miljoner ord. Texterna är strukturellt och i viss mån även innehållsligt kodade i enlighet med internationella riktlinjer med hjälp av textanalysverktyg (t. ex. ordklassbestämning). Eftersom den aktuella studien fokuserar på och jämför texter inom området hjärt-kärlsjukdomar, har vi från korpusen plockat texter som handlar om ämnet och vars huvudrubrik innehåller minst ett av tio utvalda nyckelord som kännetecknar området, inklusive sammansättningar med dessa ord. Dessa tio ord är: hjärt-, propp, stroke, hemostas, koagulantia, stenos, trombos och substanserna/läkemedlen fragmin, heparin och waran. Beroende på källa delas texterna in i antingen en facktextkorpus, FK, eller en lekmannakorpus, LK. FK består av texter avsedda för läkare, t. ex. från Läkartidningen medan LK är texter avsedda för patienter, t. ex. från NetDoktor.se. Texterna består av drygt 80 000 ord vardera. Läsbarhet och frekvensband texternas svårighetsgrad För att kunna få en första överblick över sammansättningen av texterna har vi använt ett läsbarhetsmått och en placering av ord i så kallade frekvensband. Ett frekvensband är en sorterad lista över alla ord i en text med de mest frekventa orden först. Nationalencyklopedin beskriver begreppet läsbarhet som ett mått på en texts svårighetsgrad. Det finns flera olika sätt att beräkna detta, oftast med så kallade läsbarhetsindex (LIX). I Sverige är slix, ett svenskt LIX, det mest använda. slix tar hänsyn till två egen- 145

skaper hos texten; det genomsnittliga antalet ord per mening samt den procentuella andelen långa ord (ord längre än sex bokstäver). Genom att lägga samman dessa två värden får man en siffra som anger textens allmänna svårighetsgrad. Erfarenhetsmässigt vet man att texter med slix under 25 uppfattas som mycket lätta (t. ex. barnböcker), texter med slix mellan 25 35 som lätta (t. ex. lättlästa böcker). Texter med slix mellan 35 45 som medelsvåra (t. ex. dagspress), texter med slix mellan 45 55 som svåra (t. ex. officiella skrivelser) och texter med slix över 55 som mycket svåra (t. ex. facklitteratur). I enighet med vad vi förväntade oss i form av skillnad mellan de två texttyperna, visade resultatet att slix-värdet för FK var 48 och för LK var 38. Det bör betonas här att LIX är ett allmänt mått, som inte kan ange hur en bestämd person uppfattar en text. Det tar inte heller hänsyn till typografisk information som t. ex. bilder och layout. Genom att använda frekvensband har vi beräknat överlappningen, och därmed frekvensfördelningen i ordförrådet mellan de två korpusarna i förhållande till de 10 000 mest frekventa orden i hela den medicinska korpusen. Det har visat sig att orden i den första gruppen som innehåller de 1 000 mest frekventa orden motsvarar då 73 procent av alla ord i FK och 80 procent i LK. Alltså utgör dessa ord, som hör till ett grundläggande ordförråd, den största delen av textmaterialet. Kännetecknande för det grundläggande ordförrådet är att: Alla ordklasser finns representerade De flesta ord är icke-sammansatta Majoriteten utgörs av svenska ordformer Allmän vokabulär dominerar, men pga. av texternas natur förekommer också ord som syftar till kroppsdelar, sjukdomar och medicinering. I de mellanliggande frekvensbanden kunde vi observera att: Det i båda texterna endast finns en del ordklasser representerade (främst substantiv, verb och adjektiv). Ord hörande till de övriga ordklasserna finns bland de 1 000 mest frekventa orden. Antalet sammansättningar ökar snabbt i stigande frekvensband i båda texterna, men att antalet unika sammansättningsformer som t. ex. trombosprofylaxen och trombosrecidiv är mer framträdande i FK. Med andra ord finns det mindre upprepning och större variation i FK. 146

Förekomsten av medicinska begrepp som t. ex. djup ventrombos, cerebral trombos, Adam-Stokes syndrom är mycket högre i FK. Latinska och grekiska ord är mer frekventa i FK, t. ex. embolus, embollektomi och sinus coronarius. Nominaliseringar dominerar i FK. Det finns fem gånger fler substantiv än verb i t. ex. frekvensband 8 (det vill säga de ord som ligger mellan de 7 000 och 8 000 mest frekventa) i FK jämfört med fyra gånger fler i motsvarande frekvensband för LK. Antalet förkortningar och akronymer ökar stadigt. Antalet akronymer är fyra gånger större i FK än i LK. Den sista och mest intressanta gruppen är frekvensband 10, det vill säga den grupp som innehåller de ord som inte är gemensamma för de båda texterna. Undersökningsresultatet visar att ord som finns i den gruppen och som är unika för respektive text är dubbelt så många i FK jämfört med de i LK. Denna grupp innehåller ofta mycket specialiserade ämnestypiska och ämnesspecifika termer. Sammanfattningsvis kan man konstatera att de ordformer som kräver särskild uppmärksamhet vid design av ett medicinskt lexikon enligt den fördelning som nyss presenterades är: Unika eller icke-frekventa akronymer/förkortningar, t. ex. ESCS, TMR, bitr. Sammansättningar med eller utan akronymer, t. ex. ICD-grupp, NSAIDpreparat, angiotensinreceptorblockerare, vänsterkammarrekonstruktion. Medicinska icke sammansatta ordformer, t. ex. tromb, venös, klaff. Frekventa lånord, t. ex. stroke, angina pectoris, angiogram. Felstavningar (både medicinska och allmänna ord), t. ex. massspektrometri, kolecystekomi. Ordnivåundersökningar Genom att beräkna olika statistiska mått på enskilda ord i de två texttyperna kan man få en bra uppfattning om ordförrådets komplexitet och därmed finna tydliga kännetecken som skiljer fackspråkliga texter från icke-fackspråkliga. 147

LK bestod av färre antal ordformer men dessa upprepas oftare (9 gånger) än i FK (7 gånger). Den genomsnittliga längden på ordformer i FK var längre än i LK (9,5 gentemot 8,6); långa ordformer är utmärkande för facktexter. Sammansättningsformerna utgjorde 12 procent (36 procent unika) av ordformerna i FK jämfört med 10 procent (31 procent unika) i LK. Lexikal variation är ett mått på hur många likadana ord textförfattaren använt. Ju lägre värde desto fler lika ord i texten. Därmed ser man om textförfattaren upprepat sig sällan eller ofta. Distributionsanalysen visar att värdet i FK var 7 jämfört med 9 i LK. I FK fanns det en överrepresentation av akronymformer i sammansättningar, som t. ex. TNF-alfa, WPW-syndrom och BNP-test. Det finns också stora skillnader i antal enkla akronymer, som t. ex. ASA. Adjektiviska attribut Adjektiviska och participiella attribut förstärker eller kompletterar innebörden hos många substantiviska huvudord. En viktig aspekt som kan kopplas till området fraser är så kallade kollokationer, dvs. ordkombinationer bestående av två eller flera ord som vanemässigt förekommer tillsammans i det talade eller skrivna språket. Vid en frekvensjämförelse mellan de två texterna fann vi att det fanns fler adjektiv i FK (8 400 olika böjningsformer 1 700 grundformer) än i LK (6 800 olika böjningsformer 1 200 grundformer). De mest statistiskt signifikanta attributen i FK var: klinisk, randomiserad, diagnostisk, prediktiv, asymtomatisk, malign, kateterburen, neuropsykiatrisk, ischemisk och epidemiologisk, medan de i LK var: kalllad, hämtad, mycken, vanlig, läckande, blodförtunnande, lätt, oregelbunden, bra och svår. Listorna visar tydliga tecken på semantiska olikheter. I FK har attributen en tydlig fackspråksprofil, medan de i LK är mer generellt deskriptiva. Bristen på överlapp mellan listorna visar också olika kollokationspreferenser, ett viktigt element vid skapande eller förbättring av lekmannaorienterade ordböcker och inte minst uppbyggande och förbättring av termlistor. Allt detta är också till stöd för att kunna bygga, förbättra eller utvärdera metoder och datorsystem som analyserar och försöker förstå det medicinska språket. 148

Syntax och semantik Inte bara frekvensanalys av ordförrådet utan också av syntaxen kan visa tecken på skillnader mellan texterna. En hög andel nominalfraser, bisatser och passiva konstruktioner anses vara karakteristiskt för fackspråkstexter. Texterna analyserades syntaktiskt med hjälp av datorprogram. Antal nominalfraser där huvudordet var ett medicinskt begrepp, underordnande satser och antal aktiva huvudsatser var högre i LK. Skillnaden mellan passiva konstruktioner var liten, 1 200 i FK jämfört med 1 100 i LK. Däremot var ett stort antal nominal- och prepositionsfraser dominerande i FK (17 400 och 9 800 gentemot 13 800 och 7 900 i LK). Intressant var den stora förekomsten av underordnade satser med om man i LK (250 förekomster jämfört med 20 i FK). Detta kännetecknar det förklarande i LK-korpusens natur. För den semantiska analysen använde vi MeSH (Medical Subject Headings), den kontrollerade vokabulär som används vid U.S. National Library of Medicine, där de engelska termerna kompletterats med svenska översättningar gjorda av personal vid Karolinska institutets bibliotek. I FK fanns 4 620 fullständiga MeSH-matchningar (t. ex. <artär>, och 409 partiella MeSH-matchningar (t. ex. sub<araknoid> ), medan det i LK fanns 6 144 fullständiga och 277 partiella matchningar. Trots att antalet fullständiga matchningar i LK var mycket högre, visar antalet unika matchningar att det fanns högre antal olika termer i FK och högre andel upprepning i LK. Följaktligen är terminologin mer varierad i FK. Avslutning Vad kom vi då fram till i denna undersökning? Enligt fackspråksforskare finns det tydliga lingvistiska och lexikaliska kännetecken som skiljer fackspråkliga texter från andra texter. Dit hör bland annat förekomsten av nominala fraser, andelen facktermer, morfologiska, syntaktiska och semantiska egenskaper, menings- och ordlängd m. m. Vår undersökning av medicinska texter avsedda för vårdgivare respektive lekmän har bekräftat att de allra flesta generella språkliga tendenser som observerats i andra fackområden med några få undantag också stämmer på de undersökta medicinska texterna. Vår analys har visat att LK-texter verkar vara mer lättlästa än motsvarande FK-texter, men vi har inte empiriskt undersökt graden 149

av textförståelse i t. ex. en testläsargrupp. När det gäller ordförrådet visar det sig att endast en femtedel av orden i dessa texter som kan vålla problem, resten hör till allmänspråket. Men denna femtedel innehåller ganska många termer som är mycket relevanta i sammanhanget, eftersom de betecknar sjukdomar, symptom, anatomi, undersöknings- och behandlingsformer. För att underlätta förståelse av medicinska termer för den breda allmänheten skapas ofta förenklade benämningar på grekiska eller latinska termer, vilket bidrar till en ökning av synonyma termer som utgör länkar mellan fackspråket och det allmänna språket. Ett exempel är fackspråkets trombos som står för blodpropp, eller i vardagligt tal för propp. Vi har nu gjort en kartläggning av två typer av medicinska texter. Vi har identifierat vilka ord och termer som bör finnas med i ett webbaserat lexikon. Därför hoppas vi att detta kan förverkligas inom en snar framtid. 150