Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274



Relevanta dokument
Grim. Några förslag på hur du kan använda Grim. Version 0.8

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Introduktion till språkteknologi. Datorstöd för språkgranskning

Litteraturvetenskap Ger dig en akademisk grund att stå på

Mäta effekten av genomförandeplanen

Lärarmaterial BROTT PÅ NÄTET. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: Författare: Christina Wahldén

Flera kvantifierare Bevis Direkt bevis Motsägelse bevis Kontrapositivt bevis Fall bevis Induktionsprincipen. x y (x > 0) (y > 0) xy > 0 Domän D = R

Generellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:

Word- sense disambiguation

Satsdelar subjekt, predikat, direkt objekt, indirekt objekt och predikatsfyllnad

känna till några vanliga myter och motiv i litteraturen, vilka speglar frågor som har sysselsatt människor under olika tider

Får jag be om ordet!

Planering Historia Antikens världar HT/2015. ÅK 7 Namn:

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Varför Genomförandeplan?

En tjuv i huset VAD HANDLAR BOKEN OM? LGR11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR PÅ FÖLJANDE FÖRMÅGOR LGRS11 CENTRALT INNEHÅLL SOM TRÄNAS

SAMUEL HÖR GUD ROPA 2:A SÖNDAGEN UNDER ÅRET (ÅRGÅNG B) 18 JANUARI Tidsram: minuter.

Vi hoppas att ni har glädje av berättelsen om Undra och Lollo som ska träna sina krångelhänder så de blir hjälparhänder!

Att överbrygga den digitala klyftan

ELEVHJÄLP. Diskussion s. 2 Åsikter s. 3. Källkritik s. 11. Fördelar och nackdelar s. 4. Samarbete s. 10. Slutsatser s. 9. Konsekvenser s.

Hur går det till att lära svenska? En studie om svenska som andraspråksinlärares talade språk

asse och Maja cyklar till deckarkontoret. Vem tror du skriver de falska artiklarna? frågar Lasse flåsande när de

FTEA12:2 Filosofisk metod. Att värdera argumentation I

Lära känna skrivbordet

Att skriva Hur utformar man en Social berättelse? Lathund för hur en Social berättelse kan skrivas

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

Jämförelse av miljöenkäter. till personal vid Högskolan i Gävle. Undersökningar gjorda i maj 2002 resp i dec. 2003

Lathund för webbredaktörer. Så skriver du på webben

Har/hade-bortfall i svenskan Hur finit är ett naket supinum?

Tentamen Marco Kuhlmann

Nu är lägret officiellt öppnat. Öppningen gick traditionsenligt till med flagghissning och välkomsttal. Sidan 2

Lexikon: ordbildning och lexikalisering

Ett hopp för stallet VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS SIDAN 1. Lärarmaterial

Skejtarna i rampen VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR LGRS 11 CENTRALT INNEHÅLL SOM TRÄNAS

Spinderella Tarantella 1 - en dramatisering

Kapitel 2 Kapitel 3 Brevet Nyckeln

Våga Visa kultur- och musikskolor

Verb. "Verb" är ord som är namn på en handling eller visar att någon eller något är i ett visst tillstånd. Ordet verb betyder ursprungligen "ord".

Kaninen som rymde Lärarmaterial

- Nej. Sa jag - Det betyder Gamla. Araber. I. String. Sa Herbert - Ha ha ha ha.

Lära tillsammans som grund för utveckling erfarenheter från förskolan. Sunne 3-4 februari 2010 Katina Thelin

Peter Ottosson 31/ Introduktionskurs i datateknik II1310

Routerinställning. Denna guide tar dig genom de enkla steg som behövs för att ställa in routern så den fungerar trådlöst.

Ämnesprov, läsår 2012/2013. Historia. Årskurs. Texthäfte till delprov B

Användarmanual HOIF.org

Olga hittar Finn MARIE DUEDAHL

Utskrift av inspelat samtal hos Arbetsförmedlingen

Bengt Alvång grafisk form & illustration av Maluni

Delaktighet inom äldreomsorgen

Repetition ordklasser och satsdelar Bas och Fortsättning (s. 8-95)

Förskola. Handläggare Vårt diarienummer Datum Sidan 1(6) Norum/Westerman- Annerborn

Slutrapport för JMDB.COM. Johan Wibjer

Koreanska (SOV) kiho-ka saca-l l cha-ass-ta Keeho-NOM lejon-ack sparka-pret-ind Keeho sparkade lejonet/ett lejon.

PASCALE VALLIN JOHANSSON & EDITH HELSNER

Svara på frågorna/diskutera med dina klasskamrater när du har läst kapitlet!

Ali & Eva KAPITEL 7 LÄSFÖRSTÅELSE KORTA SVAR

12 Programstege Substantiv

Hej, snälla! ORDLISTA CHRISTINA WAHLDÉN ARBETSMATERIAL FÖR LÄSAREN

Övningar till avsnitt 3 - Leva inifrån och ut

ITiS Våren Projektet gjort av: Cathrine Bolinder Lena Christensen Mattias Helander

Kundkategorisering i Rebus

Egenmäktigt förfarande i gymnasieklass

MAR S VÄRLDSBÖNDAGEN

Lärarmaterial. Erik tävlar. Vad handlar boken om? Mål och förmågor från Lgr 11: Eleverna tränar på följande förmågor: Författare: Torsten Bengtsson

Metod- PM: Påverkan på Sveriges apotek efter privatiseringen

Kapitel 1 - Hej Hej jag heter Lisa och går på Hästskolan. Min bästa vän heter Wilma. Jag tycker att vår rektor är lite läskig. Hon heter Svea och hon

KREATIVA BÖNESÄTT. en praktisk hjälp till dig som är ledare! Initiativtagare till materialet: Maria Melin

Uppsats på grundnivå. Independent degree project first cycle. Litteraturvetenskap B 7,5 hp

Kapitel 1 - Hörde du ljudet? sa Laura. - Vad för ljud? Alla pratar ju sa Minna. - Ljudet från golvet, sa Laura. Arga Agneta blängde på Laura och

Från tal till skrift. Susan Nieland Välkomna!

Vad tycker du om sfi?

Låt eleverna öva på att dra slutsatser om textens handling genom att leta ledtrådar i texten.

Short Toe (Brachydactyly) Hos Staffordshire Bull Terrier.

q Tacka Gud för maten m

Utbildning Club Frågor & svar

============================================================================

Efter fem tsunamier av motstånd

Från sömnlös till utsövd

Tranbärets månadsbrev september 2015

Svenska från början. 1 Studieförbundet Vuxenskolan

-Ja, tack. -Är du rädd för något? -Nej! -Känns det bättre nu? -Ja. -Hejdå!

SLALOMINGÅNGAR hur svårt kan det vara?

Information om Aptus bokning- och låssystem i Brf Göteborgshus 42

Kan man veta om Bibeln är sann? Eller HUR kan man veta om Bibeln är sann?

Grammatik för språkteknologer

Det finns möjlighet att skicka SMS från ett flertal ställen i Rebus-systemet, detta dokument går igenom alla ställen där det fungerar.

Nr659. l. Hustruns släktnamn bör kunna användas såsom makarnas gemensamma. Mot. 1971:659 7

Lgr 11 Centralt innehåll och förmågor som tränas:

Arbeta med media i klubben

Allan Zongo. Vad handlar boken om? Mål och förmågor som tränas: Eleverna tränar på följande förmågor: Författare: Henrik Einspor

Läsnyckel Amulett Bok fyra: Det sista rådet av Kazu Kibuishi översatt av Marie Helleday Ekwurzel

Snacket går. Lärarhäfte med kopieringsunderlag. Catarina Littman Carin Rosander BONNIERS

BILAGA TILL RUTIN DOKUMENTATION SOL & LSS

Att fortsätta formas

Dubbelt En elev plockar upp en näve kuber. En annan ska ta upp dubbelt så många.

Periodisering i Rebus

Underlag för bedömning enskilda elevsvar

Stina Inga. Ur antologin nio, utgiven av Black Island Books och Norrbottens länsbibliotek, 2002 ISBN Intervju: Andreas B Nuottaniemi

Kristianstads kommun ITiS-rapport Maj ett temaarbete av 3-5 Parkskolan. Agneta Andrée Karin Falkå Eva Nordahl Caroline Nilsson Johan Rönndahl

Rapport 5 preliminär, version maj Fokusgrupper med coacher. Projekt Världen i Skåne, Polismyndigheten i Skåne

Transkript:

Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se

Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text. Syftningsfel är en typ av fel som man som skribent inte alltid lägger märke till och ett redskap som kan varna för sådana fel kan vara till nytta dels för andraspråkinlärare men också för peroner med svenska som modersmål. Typer av fel Vid närmare undersöking av syftningsfel har jag fokuserat på två olika typer av fel; semantiska och syntaktiska fel. Semantiska fel Semantiska fel är fel som som inte ger upphov till något grammatiskt fel utan helt och hållet är beläget på ett semantiskt plan. Sådana fel går inte att med säkerhet hitta med exempelvis Granska eftersom datorn inte förstår vad texten den granska betyder. Följande mening är ett exempel på ett sådant fel: Ulla gav en kostym till sin man som hon köpt på loppmarknad. Felet beror här på att det är högst osannolikt att Ulla har köpt sin man på loppmarknad. Syntaktiska fel För denna typ av fel är datorn bättre lämpad som granskare. Felet illustreras av denna mening: Bilen körde på vägen, det körde av sen. (meningen är hämtad ur Datorn som språkgranskare av Ola Knutsson). Felet är av en grammatisk typ och datorn kan, om texten är upptaggad, se felet. Att hitta fel Att hitta felen är allt annat än lätt. Jag har försökt hitta regler för att hitta fel i meningar av ovanstående typer. Det finns med största sannolikhet andra felskrivningar som kan klassas som syftningsfel men då de flesta av dessa förmodligen ligger på en semantisk nivå är de i stort sett omöjliga att hitta. Trots detta har jag försökt mig på att åtminstone varna för möjliga syftningsfel. Semantiska fel I meningen ovan, om Ulla och hennes man, är det ordet som som är nyckelordet i syftningsfelet. Som syftar tillbaka på det senaste objektet som i denna mening är sin man. Tanken är alltså att hitta konstruktioner där en mening har två obejkt och där ett som syftar tillbaka. Eftersom granska inte satsdelstaggar ord måste man ta hänsyn till att objekten kan ha olika ordklass till exempel nomen, pronomen eller personnamn. Mellan objekten kan det komma olika ordklass och sedna kommer det andra objektet. Nyckelordet som har enligt granska ordklasstaggen <hp> vilket betyder frågande/relativ pronomen. Genom att leta efter den ordklassen istället för enbart ordet som får man med andra liknande konstruktioner också. Efter lite experimenterande formulerade jag således regel1@syftningsfel (se bilaga A, kod) vilken visade sig fungera tillfredsställande. Efter lite sökning på internet fann jag denna mening: Promenadkäpp borttappad av herre med silverknopp i ändan.. Det felet upptäcks inte av den regel jag hade skrivit Patrik Dallmann 2 821107-0274

så jag började formulera en ny regel. Tyvärr hittade jag inga andra exempel av denna typ så jag fick utgå från denna mening. regel2@syftningsfel är resultatet av experimenterandet med denna mening. Syntaktiska fel Denna typ av fel borde vara lättare att hitta eftersom felet ligger på ett grammatiskt plan och alltså är påvisbart i ordklasstaggningen som Granska gör. Ändå var detta svårare att skriva en regel för än för det semantiska felet. Anledningen kan vara att de två delarna, bilen och det i meningen ovan, kan ligga långt ifrån varandra. Det är svårt att ta veta om det verkligen syftar på bilen. Jag testade också meningen Renen sprang först på vägen, därefter gömde det sig i skogen som har samma typ av fel men är lite mer komplex. Eftersom det rör sig om en annan typ av fel än det som behandlas av kategorin syftningsfel skapade jag en ny kategori som jag benämnde syftkon. I denna kategori har jag endast skrivit en regel eftersom jag lagt mer mest energi på den förra feltypen. Regeln hittar felet i båda meningarna men varnar två gånger för varje fel av någon anledning som jag inte har lyckats utröna. Utvärdering av regler För att testa reglerna använde jag mig av nedanstående meningar. 1. Haft värk i natt i höger öra som nu försvunnit. 2. Elsa hittade en käpp i en låda med silverhandtag. 3. Promenadkäpp borttappad av herre med silverknopp i ändan. 4. Ulla gav en kostym till sin man som hon köpt på loppmarknad. 5. Eva gav ett ben till sin hund som hon låst in i sovrummet. 6. Bilen körde på vägen, det körde av sen. 7. Renen sprang först på vägen, därefter gömde det sig i skogen. Meningarna 1, 3, 4 och 6 hittade jag på internet genom söking på google, de övriga skrev jag själv. Mening 2 är medvetet skriven för att vara tvetydig. Dessa meningar använde jag för att konstruera reglerna. Målet med varje reglerna var att hitta felet i var och en av meningarna och helst inte ge några falska larm. Det sista lyckades endast delvis. Därefter testade jag reglerna på en korpus på drygt 10000 ord bestående av artiklar från Dagens Nyheters webplats. Reglerna kan i de flesta fall upptäcka den typ av fel som de är konstruerade för. Dock ger samtliga refler upphov till stora mängder falsklarm. Totalt hittade reglerna fel i nästan var tredje mening. Jag läste en del av texten och undersökte de fel som reglerna varnade för och hittade inte ett enda verkligt fel. I och för sig är förmodligen denna typ av fel relativt ovanlig i nyhetstext. Det skulle kanske har varit bättre precision om reglerna testats på en korpus bestående av texter skrivna av andraspråksinlärare. Patrik Dallmann 3 821107-0274

Slutsats Det är möjligt att skriva regler för att upptäcka möjliga syftningsfel, både semantiska och syntaktiska, och varna för dem. Däremot är mängden falsklarm så stor att de i pratiken blir oanvändbara. Det är möjligt att man kan konstruera bättre regler än de jag har skrivit men jag tror att det krävs ganska mycket utveckling innan man får ett användbart redskap. Speciellt i fallet med semantiska fel kan datorer idag inte veta vad som är rätt och fel eftersom den inte förstår textens betydelse. Och även om den skulle förstå verbet köpa och vad en man är så kanske den inte vet huruvida man kan köpa en man på loppmarknad eller inte. Man får alltså dra slutsatsen att det än så länge är upp till skribenten att hålla reda på vad han eller hon egentligen vill att det ska stå. Patrik Dallmann 4 821107-0274

Appendix A, Kod category syftningsfel info("risk för syftningsfel") link("""") regel1@syftningsfel x1(wordcl = nn wordcl = pn wordcl = pm), y(wordcl!= nn & wordcl!= pn & wordcl!= vb)*, x2(wordcl = nn wordcl = pn wordcl = pm), z(wordcl = hp) mark(x1 x2 z) regel2@syftningsfel x1(wordcl = nn wordcl = pn wordcl = pm), y2(wordcl!= nn & wordcl!= pn & wordcl!= vb)+, x2(wordcl = nn wordcl = pn wordcl = pm), z(wordcl = pp) mark(x1 x2 z) category syftkon info("möjligt kongruensfel i syftning") link("""") regel1@syftkon x(wordcl = nn wordcl = pn wordcl = pm), y1(wordcl!= nn & wordcl!= pn)*, y2(wordcl = nn wordcl = pn wordcl = pm), m(cht = mid)?, y3(wordcl!= pn)*, z((wordcl = pn wordcl = hp) & (gender!= x.gender num!= x.num)) mark(x z) Patrik Dallmann 5 821107-0274