Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se
Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text. Syftningsfel är en typ av fel som man som skribent inte alltid lägger märke till och ett redskap som kan varna för sådana fel kan vara till nytta dels för andraspråkinlärare men också för peroner med svenska som modersmål. Typer av fel Vid närmare undersöking av syftningsfel har jag fokuserat på två olika typer av fel; semantiska och syntaktiska fel. Semantiska fel Semantiska fel är fel som som inte ger upphov till något grammatiskt fel utan helt och hållet är beläget på ett semantiskt plan. Sådana fel går inte att med säkerhet hitta med exempelvis Granska eftersom datorn inte förstår vad texten den granska betyder. Följande mening är ett exempel på ett sådant fel: Ulla gav en kostym till sin man som hon köpt på loppmarknad. Felet beror här på att det är högst osannolikt att Ulla har köpt sin man på loppmarknad. Syntaktiska fel För denna typ av fel är datorn bättre lämpad som granskare. Felet illustreras av denna mening: Bilen körde på vägen, det körde av sen. (meningen är hämtad ur Datorn som språkgranskare av Ola Knutsson). Felet är av en grammatisk typ och datorn kan, om texten är upptaggad, se felet. Att hitta fel Att hitta felen är allt annat än lätt. Jag har försökt hitta regler för att hitta fel i meningar av ovanstående typer. Det finns med största sannolikhet andra felskrivningar som kan klassas som syftningsfel men då de flesta av dessa förmodligen ligger på en semantisk nivå är de i stort sett omöjliga att hitta. Trots detta har jag försökt mig på att åtminstone varna för möjliga syftningsfel. Semantiska fel I meningen ovan, om Ulla och hennes man, är det ordet som som är nyckelordet i syftningsfelet. Som syftar tillbaka på det senaste objektet som i denna mening är sin man. Tanken är alltså att hitta konstruktioner där en mening har två obejkt och där ett som syftar tillbaka. Eftersom granska inte satsdelstaggar ord måste man ta hänsyn till att objekten kan ha olika ordklass till exempel nomen, pronomen eller personnamn. Mellan objekten kan det komma olika ordklass och sedna kommer det andra objektet. Nyckelordet som har enligt granska ordklasstaggen <hp> vilket betyder frågande/relativ pronomen. Genom att leta efter den ordklassen istället för enbart ordet som får man med andra liknande konstruktioner också. Efter lite experimenterande formulerade jag således regel1@syftningsfel (se bilaga A, kod) vilken visade sig fungera tillfredsställande. Efter lite sökning på internet fann jag denna mening: Promenadkäpp borttappad av herre med silverknopp i ändan.. Det felet upptäcks inte av den regel jag hade skrivit Patrik Dallmann 2 821107-0274
så jag började formulera en ny regel. Tyvärr hittade jag inga andra exempel av denna typ så jag fick utgå från denna mening. regel2@syftningsfel är resultatet av experimenterandet med denna mening. Syntaktiska fel Denna typ av fel borde vara lättare att hitta eftersom felet ligger på ett grammatiskt plan och alltså är påvisbart i ordklasstaggningen som Granska gör. Ändå var detta svårare att skriva en regel för än för det semantiska felet. Anledningen kan vara att de två delarna, bilen och det i meningen ovan, kan ligga långt ifrån varandra. Det är svårt att ta veta om det verkligen syftar på bilen. Jag testade också meningen Renen sprang först på vägen, därefter gömde det sig i skogen som har samma typ av fel men är lite mer komplex. Eftersom det rör sig om en annan typ av fel än det som behandlas av kategorin syftningsfel skapade jag en ny kategori som jag benämnde syftkon. I denna kategori har jag endast skrivit en regel eftersom jag lagt mer mest energi på den förra feltypen. Regeln hittar felet i båda meningarna men varnar två gånger för varje fel av någon anledning som jag inte har lyckats utröna. Utvärdering av regler För att testa reglerna använde jag mig av nedanstående meningar. 1. Haft värk i natt i höger öra som nu försvunnit. 2. Elsa hittade en käpp i en låda med silverhandtag. 3. Promenadkäpp borttappad av herre med silverknopp i ändan. 4. Ulla gav en kostym till sin man som hon köpt på loppmarknad. 5. Eva gav ett ben till sin hund som hon låst in i sovrummet. 6. Bilen körde på vägen, det körde av sen. 7. Renen sprang först på vägen, därefter gömde det sig i skogen. Meningarna 1, 3, 4 och 6 hittade jag på internet genom söking på google, de övriga skrev jag själv. Mening 2 är medvetet skriven för att vara tvetydig. Dessa meningar använde jag för att konstruera reglerna. Målet med varje reglerna var att hitta felet i var och en av meningarna och helst inte ge några falska larm. Det sista lyckades endast delvis. Därefter testade jag reglerna på en korpus på drygt 10000 ord bestående av artiklar från Dagens Nyheters webplats. Reglerna kan i de flesta fall upptäcka den typ av fel som de är konstruerade för. Dock ger samtliga refler upphov till stora mängder falsklarm. Totalt hittade reglerna fel i nästan var tredje mening. Jag läste en del av texten och undersökte de fel som reglerna varnade för och hittade inte ett enda verkligt fel. I och för sig är förmodligen denna typ av fel relativt ovanlig i nyhetstext. Det skulle kanske har varit bättre precision om reglerna testats på en korpus bestående av texter skrivna av andraspråksinlärare. Patrik Dallmann 3 821107-0274
Slutsats Det är möjligt att skriva regler för att upptäcka möjliga syftningsfel, både semantiska och syntaktiska, och varna för dem. Däremot är mängden falsklarm så stor att de i pratiken blir oanvändbara. Det är möjligt att man kan konstruera bättre regler än de jag har skrivit men jag tror att det krävs ganska mycket utveckling innan man får ett användbart redskap. Speciellt i fallet med semantiska fel kan datorer idag inte veta vad som är rätt och fel eftersom den inte förstår textens betydelse. Och även om den skulle förstå verbet köpa och vad en man är så kanske den inte vet huruvida man kan köpa en man på loppmarknad eller inte. Man får alltså dra slutsatsen att det än så länge är upp till skribenten att hålla reda på vad han eller hon egentligen vill att det ska stå. Patrik Dallmann 4 821107-0274
Appendix A, Kod category syftningsfel info("risk för syftningsfel") link("""") regel1@syftningsfel x1(wordcl = nn wordcl = pn wordcl = pm), y(wordcl!= nn & wordcl!= pn & wordcl!= vb)*, x2(wordcl = nn wordcl = pn wordcl = pm), z(wordcl = hp) mark(x1 x2 z) regel2@syftningsfel x1(wordcl = nn wordcl = pn wordcl = pm), y2(wordcl!= nn & wordcl!= pn & wordcl!= vb)+, x2(wordcl = nn wordcl = pn wordcl = pm), z(wordcl = pp) mark(x1 x2 z) category syftkon info("möjligt kongruensfel i syftning") link("""") regel1@syftkon x(wordcl = nn wordcl = pn wordcl = pm), y1(wordcl!= nn & wordcl!= pn)*, y2(wordcl = nn wordcl = pn wordcl = pm), m(cht = mid)?, y3(wordcl!= pn)*, z((wordcl = pn wordcl = hp) & (gender!= x.gender num!= x.num)) mark(x z) Patrik Dallmann 5 821107-0274