Innehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson

Relevanta dokument
Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad

Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?

Grundläggande textanalys, VT2013

Behov av språklig granskning. Granska och automatisk språkgranskning av svensk text. Datorn som språkgranskare

Föreläsningens innehåll. Granska. 1. Granskas regelspråk 2. Parsning i Granska 3. Språkgranskning i Granska 4. Granska-laborationen

Inkongruens och särskrivna sammansättningar en beskrivning av två typer av fel och möjligheten att granska dem automatiskt

Inkongruens och särskrivna sammansättningar

Granskas regelspråk. Ola Knutsson. Uppdaterad IPLab, Nada, KTH

Bootstrapping för substantivtaggning

Grundläggande Textanalys VT Språkgranskning (2) Eva Pettersson

Grundläggande Textanalys VT Språkgranskning (2) Eva Pettersson

3. Granskas regelspråk

Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001

Granskas regelspråk. Tentativ version, Ola Knutsson IPLab, Nada, KTH

Parsning i Granska. Föreläsningens innehåll. Granskas uppbyggnad. Inspiration och förebilder. Regelmatchning/parsning. Granskas regelspråk

Obesvarade frågor från F4

Gränssnitt för FakeGranska. Lars Mattsson

Innehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG

Identifiering av ordvitsar med Granska

Automatisk utvinning av felaktigt särskrivna sammansättningar

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Datorn har utvecklats till vårt viktigaste. Datorn som språkgranskare SPRÅKTEKNOLOGI OLA KNUTSSON

Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Introduktion till språkteknologi. Datorstöd för språkgranskning

Kungliga Tekniska Högskolan Patrik Dallmann

En arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ

2. Utgångspunkter och angreppssätt för automatisk språkgranskning

språkgranskning, ht 2007

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Skrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier

Stavningskontroll. Metoder och tillämpningar inom språkteknologin. ht Allmänt om språkgranskning. Stavningskontroll.

Majoritetsgranskaren ett sätt att förbättra grammatikgranskare genom att kombinera dem LINDA NORELIUS

Grammatik, det fixar väl datorn?

DATORSTÖDD SPRÅKGRANSKNING OCH

Maskinöversättning och språkgranskning, ht 2006

Maskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi

Institutionen för Lingvistik. NP-detektion UTVÄRDERING OCH FÖRSLAG TILL FÖRBÄTTRINGAR AV GRANSKAS NP-REGLER

Statistisk grammatikgranskning

Obesvarade frågor från F1

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Så här fungerar Stava Rex

Språkgranskningsverktyg, vt 2009

Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson

Automatisk språkgranskning av svensk text

En vanlig dag på jobbet

Kongruensböjningen av adjektivet påverkas av substantivets genus och numerus.

Språkgranskningsverktyg, vt 2009

Språkgranskningsverktyg, vt 2008

Morfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)

Lathund för Stava Rex

METALL/STRÖM DETEKTOR

Kungl. Tekniska högskolan NADA Grundformer med Stava

Arbetsuppgift Skrivning och Grammatik v. 1

Grammatifix Svensk grammatikkontroll i MS Word

Granskaprojektet: Rapport från arbetet med granskningsregler och kommentarer. *** Rickard Domeij Ola Knutsson IPLab, Nada, KTH

Lathund för SpellRight

Skriftspråk i förändring möter förlegade skrivstöd

Språkteknologi. Språkteknologi

FTEA12:2 Filosofisk metod. Att värdera argumentation I

Missplel ett generellt verktyg för generering av stavfel

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

Word- sense disambiguation

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Grundläggande textanalys. Joakim Nivre

TvärGranska Interaktiv webbmiljö för språkgranskning med inriktning mot andraspråksinlärare

Hjälpmedel för regelkonstruktion

Vardag - Äldreboendet Björkgården

FOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide

Grammatisk teori II Attributvärdesgrammatik

Stava Rex. för Google Docs. Manual för Stava Rex för Google Docs

Grundläggande textanalys, VT2013

Maskinöversättning och språkgranskning F5 Allmänt om språkgranskning + ordkontroll

Centralt innehåll och förmågor som tränas enligt Lgr 11:

SAMMANSÄTTNINGAR Lena Öhrman

Satsdelar. Carina

Mobil streckkodsavläsare

Lingvistik I Delmoment: Datorlingvistik

Studiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is.

Kunskapsgraf. Fredrik Åkerberg Tommy Kvant 1 Introduktion. 2 Relaterade projekt.

Datum: Date: Provkodr: KTR1 Exam code:

Minifakta om igelkottar

Lathund för Stava Rex

Lgr 11 Centralt innehåll och förmågor som tränas:

Matematiska lägesmått med en micro:bit

Lärarhandledning Vi berättar och beskriver

Att orientera i den närliggande natur- och utemiljön med hjälp av kartor, såväl med som utan digitala verktyg. Kartors uppbyggnad och symboler.

Lärarhandledning Vi berättar och beskriver

Datorn som hjälp vid språkgranskningen

språkgranskning, ht 2007

Källkritik. Källkritik och frikyrkor.

Bedömda elevexempel i årskurs 4 6

Leo och olyckan Lärarmaterial

Karp. Övningar Språkbankens höstworkshop oktober 2016

Föreläsning 2. Operativsystem och programmering

Bilverkstäder. Stemming. Tvetydigheter tas bort. Slå ihop till samma ord. Språkteknologiska stöd vid sökning och kategorisering

En explorativ studie av språkgranskningsverktyg

Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen efter textens form och innehåll. (SV åk 1 3)

Transkript:

GRAMMATIKKONTROLL I GRANSKA Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder för grammatikkontroll Granska Granskas regelspråk Att skriva regler i Granska Inför laborationen Datorstöd för skrivande Problemställning Vad är det vi vill att programmet skall utföra? Planering Textproduktion Revidering/granskning Detektera felet Lokalisera felet Beskriva felet Skapa rättningsförslag

Vilka metoder finns? Granskas uppbyggnad Tokeniseraren Regler Statistik och maskininlärning Hybrider Metoden kan bedömas på feldetektionsnivå eller på systemnivå. Lexikon!SUC & SAOL" Statistik!SUC" Regler!300 regler" Ordböjningsfunktion Taggaren Regelmatcharen Grafiskt gränssnitt Interaktion med användaren Första av allt: Namngivning av regelkategori och regler Kvinnan kvinna nn.utr.sin.def.nom hade ha vb.prt.akt.aux köpt köpa vb.sup.akt en en dt.utr.sin.ind ny ny jj.pos.utr.sin.ind.nom hus hus nn.neu.plu.ind.nom bil bil nn.utr.sin.ind.nom category regler info("exempelregler") link("www" "namn på länk") regelnamn@regler X() action(scrutinzing)

ex2@regler X(wordcl=nn & spec=ind & case=nom), % hus Y(wordcl=nn) % bil corr(x.join(y.text)) ex1@regler X(text="ett"), Y(wordcl=nn & gender=utr) corr(x.form(gender:=y.gender)) ex2@regler X(text="gå"), Y(text="över"), Z(text="nån"), Z2(text="efter"), Z3(text="vatten") mark(z) corr(z.replace("ån")) info("misstänkt fel: det heter nog gå över ån efter vatten") ex3@regler X(wordcl=nn & spec=ind & case=nom), Y(wordcl=nn) corr(x.join(y.text))

ex4@regler X1(wordcl=dt), X2(wordcl=jj), en elakt hund X3(wordcl=nn & (gender!=x2.gender num!=x2.num spec!=x2.spec) & (gender=x1.gender & num=x1.num & spec=x1.spec)) action (scrutinizing) corr (X2.form(gender:=X3.gender, num:=x3.num, spec:=x3.spec)) Generering av ersättningsförslag Här ligger några trevligt restauranger. Problem: Om varje ord i lexikonet kopplas explicit till alla dess böjningsformer blir lexikonet väldigt stort. Lösning: Basformen trevlig slås upp i lexikonet. Varje basform i lexikonet har en böjningsregel. Med hjälp av böjningsregeln för trevlig hittas den rätta formen trevliga. Anropas med metoden form(x.särdrag:=särdragsvärde) Varning: Granska granskar sig själv! Viktiga metoder för ersättningsförslag insert (Y)# tar Y som text, t.ex. Y.text och sätter in det före det angivna objektet, X.insert!Y" join (Y)#tar Y som text enligt: X.join!Y.text" och sätter ihop dem till en textsträng!ord" delete#tar bort det angivna objektet, enligt: X.delete!". replace(y) tar Y som text, Y.text, och ersätter det angivna objektet med Y, enligt X.replace!Y.text" form(x.särdrag:=särdragsvärde) Särskrivna sammansättningar En ljus hårig sjuk sköterska satt vid en bar disk. Mellan 12 och 16 kollar vi glykolhalt och spolar vatten och olja på din bil. Jag har köpt en ny rygg säck. Han dömdes för miss handel av hovrätten.

Särskrivna sammansättningar: några lösningar Utnyttja kongruens/inkongruens: ett cykel ställ Stava: cykelställ är en godkänd sammansättning Satsgränsigenkänning!Ejerheds algoritm" Accepterande regler Taggning av felaktiga konstruktioner Här taggas hylla som nomen: Vi har köpt en bok hylla sa Per. Här taggas hylla som verb: Vi har köpt en bok hylla på IKEA sa Per. Anpassa sig till taggaren? Tillgång till fler tolkningar av ordet + lexikal sannolikhet Hur man skriver regler för att hitta felaktiga särskrivningar I grova drag för t.ex. språk granskning eller signal detektionsteori: 1. Leta upp två substantiv i obestämd form som står i följd. Korrekta detektioner: I grova drag för t.ex. språk granskning eller signal detektionsteori 2. Ta bort så många falska alarm som möjligt. Ställ ytterligare krav på matchningen. Viktigaste kravet: det första substantivet får inte tillhöra gruppen substantiv som kan utgöra en måttapposition, t.ex. grupp, antal, rad, massa. Falska alarm: Jag kan tänka mig att en massa bedömare har gjort en rad studier i ämnet.

3. Använd Stava Särskrivningsregel ex5@regler språk granskning språkgranskning X(wordcl=nn & spec=ind & case=nom & nntype! = set & nntype!=dat), Y(wordcl=nn & spec=ind & spell_ok(smart_concat(x.text, Y.text), X.token)) Stava Felstavat!# # # # # Rättstavat! Inget alarm## # Felet signaleras corr(x.join(y.text)) info("felaktig särskrivning") Uppgift 1: skriv en regel som upptäcker och åtgärdar formfel som i: Jag har spela grammofon. Jobba gärna i par Fråga! Lösning? Men vad gör Granska? Jag såg ett räddt barn.!!!!räddt!!!!misstänkt stavfel (stav1@stavning) Stava!!!!rädda!!!!räddat!!!!rädde Jag såg ett rätt barn.!!!!rätt barn!!!!misstänkt särskrivning (sär_jj_nn3@sär)!!!!rättbarn

Uppgift 2: skriv en regel som upptäcker och åtgärdar fel som: Jag såg ett räddt barn. Jag såg ett rätt barn. Sammanfattning Det finns flera olika metoder för grammatikkontroll. I Granskas regelspråk skriver man regler för på förhand utpekade feltyper. Det svåra med regelskrivandet är dragkampen mellan falska alarm och missade fel.