språkgranskning, ht 2007
|
|
- Gunnar Pettersson
- för 7 år sedan
- Visningar:
Transkript
1 Maskinöversättning och språkgranskning, ht 2007 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1
2 Föreläsningsöversikt Kursöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll: feligenkänning Stavningskontroll: felkorrigering Inlämningsuppgift 2
3 Kursplan - Syfte 5 poäng, grundnivå, huvudområde: språkteknologi Mål: Kursen ger grundläggande kunskaper om metoder, datastrukturer och algoritmer som används vid maskinöversättning och i språkgranskningssystem. 3
4 Kursplan - Innehåll Kursen behandlar olika metoder för maskinöversättning och datorstödd översättning, bl.a. regelbaserade system som arbetar med särdragsstrukturer. Kursen behandlar också metoder för språkgranskning och för användning av kontrollerat språk. 4
5 Examination Aktivt deltagande i undervisningen Muntlig presentation av fördjupningsuppgift Genomförande av laborationer och inlämningsuppgifter med skriftlig rapportering. Kursen betygsätts enligt följande: inlämningsuppgift om stavningskontroll: 0,5 poäng labb om grammatikkontroll: 1 poäng labb om statistisk maskinöversättning: 1 poäng labb om regelbaserad maskinöversättning: 1,5 poäng fördjupningsuppgift inom valfritt område: 1 poäng 5
6 Språkgranskning Stavningskontroll Grammatikkontroll Stilkontroll Applikationer för svenska: Microsoft Word SCARRIE Granska (Stava) Skribent 6
7 Vad förväntas av det ideala stavningskontrollprogrammet? Känna igen och larma för alla felstavade ord Känna igen och acceptera alla rättstavade ord Ge ett korrekt rättningsförslag för alla felstavade ord 7
8 Mer realistiska förväntningar Känna igen och larma för de mest frekventa och lättidentifierade felstavningarna Känna igen och acceptera alla rättstavade ord, som är tillräckligt frekventa i språket Ge ett troligt rättningsförslag för alla felstavade ord (frekvens) 8
9 Stavningskontrollens två delar 1) Feligenkänning att hitta felen 2) Felkorrigering att ge ersättningsförslag 9
10 Feligenkänning i Microsoft Word
11 Felkorrigering i Microsoft Word
12 Feligenkänning Isolerade ord stavfel som resulterar i icke-ord: och --> coh Ord i kontext stavfel som resulterar i riktiga ord (real word errors): jag er dålig på att stava språk tekn olog i är kul bättre korrigeringsförslag: det är sår t att stava Word 2003 föreslår: såret, svårt, sårat, såt, sått 12
13 Feligenkänningsstrategier Lexikon Fullformslexikon vs stamlexikon Lexikonstorleken avgörande: För stort lexikon = många fel missas (låg täckning) För litet lexikon = många falska alarm (låg precision) Trigram av tecken Används mest inom OCR Ovanliga trigram antas utgöra felstavningar 13
14 Feligenkänning m.h.a. lexikon Problem: språket är produktivt omöjligt att lista alla ord i lexikonet Brist på täckning kan lura skribenten att faktiskt stava fel, t. ex. särskriva sammansättningar: jätte trött 14
15 Feligenkänning m.h.a. lexikon Kompletterande strategier: Morfologiska regler för t.ex. avledningar Sammansättningsregler Egennamnsigenkänning Samförekomst: Stoet och dess fol -> fel eller föl? Tillåt användaren att lägga till egna ord i lexikonet 15
16 Feligenkänning: sammansättningar Enklast strategi: ord = ord + ord dator + lingvistik = datorlingvistik Förfinad strategi: ord = förled + ord flicka + klänning = flickklänning äpple + paj = äppelpaj kvinna + parti = kvinnoparti cigarr + rök = cigarrök 16
17 Feligenkänning: sammansättningar Lösning: Lista alla fogeformer i lexikonet Problem: Sammansättningar bildas rekursivt och fogeformen kan ändras i flerledade sammansättningar: kakdeg ---> pepparkaksdeg barnbokhylla/barnbokshylla 17
18 Feligenkänning: sammansättningar Sms-analys minskar antalet falska alarm Sms-analys kan dock öka antalet missade fel! Missade fel i Word97: kotakt kontakt makelera makulera medalg medalj cykelsäll cykelställ särkskilt särskilt 18
19 Några frågeställningar kring feligenkänning Hur göra med sällsynta/fackspråkliga ord, som ligger nära felskrivningar av frekventa ord? verv/värv (verv = kraft, livfullhet, glöd enligt SAOL) boke/boken (boke = bokvirke) Dialektala ord? Hur sträng bör man vara? (mej, direktörn) 19
20 Feligenkänning: sammanfattning Måste ta hänsyn till kontexten: Real Word Errors Två strategier: Lexikon, vanligast Trigram, främst inom OCR Ordlistans storlek är avgörande: För stort lexikon -> många fel missas För litet lexikon -> många falska alarm Språket är produktivt kompletterande strategier behövs 20
21 Felkorrigeringens två delar 1) Ta fram ett antal korrigeringskandidater 2) Rangordna korrigeringskandidaterna 21
22 Felkorrigering: feltyper Kompetensfel Fonetiska fel: restaurang ---> resturang Homofonfel: gott ---> gått Performansfel Insättning språkteknologii Borttagning spåkteknologi Substitution sprokteknologi Transposition spårkteknologi 22
23 Felkorrigering: feltyper Kompetensfel eller performansfel? tunnt Feltyp ofta inte nödvändig att fastställa för att få fram lämpligt korrigeringsförslag, dock: Kompetensfel: hemta ---> hämta, hämtade Performansfel: hemta --> hemtam 23
24 Felkorrigering: empiriskt grundade iakttagelser De flesta felstavningar är performansfel (insättning, borttagning, substitution eller transposition) De flesta felstavningar påverkar inte ordets längd med mer än en bokstav Första bokstaven i ordet är sällan felaktig Tangenternas placering påverkar Bokstävernas frekvenser påverkar 24
25 Korrigeringsstrategier Minimum Edit Distance Likhetsnycklar N-gramsbaserade tekniker Regelbaserade tekniker Probabilistiska tekniker Neurala nätverk 25
26 Minimum Edit Distance Stränglikhet Minsta antalet editeringsoperationer som behövs för att omvandla en sträng till en annan Editeringsoperationer: Insättning Borttagning Substitution (alt. borttagning + insättning) Transposition (alt. borttagning + insättning) 26
27 Minimum Edit Distance dist(0,0) = 0 dist(i,0) = i dist(j,0) = j dist(i-1, j) + 1 (insättning) dist(i,j) = min dist(i, j-1) + 1 (borttagning) dist(i-j, j-1)+ d(s i, t j ) (substitution) där i är strängen s fram till i:te tecknet, och j är strängen t fram till j:te tecknet, och d(s i,t j ) är 0 om s i =t j och 1 i övriga fall 27
28 Minimum Edit Distance r ä n g n a r e g n a r substitution + insättning + borttagning = 3 28
29 Minimum Edit Distance 29
30 Minimum Edit Distance 30
31 Minimum Edit Distance 31
32 Likhetsnycklar Strängar matchas mot nycklar Ord som stavas på liknande sätt har likadana eller nästan likadana nycklar 32
33 Likhetsnycklar: SOUNDEX SOUNDEX: Indexing on Sound Odell & Russel, 1918 (!) Fonetisk likhet Vokaler ignoreras Konsonanter grupperas tillsammans om de liknar varandra fonetiskt Användning: Flygbokningssystem (Davidson 1962) 33
34 Likhetsnycklar: SOUNDEX 1) Behåll det första tecknet 2) Ersätt efterföljande tecken enligt nedan: a, e, i, o, u, y, h, w: 0 b, f, p, v: 1 c, g, j, k, q, s, x, z: 2 d, t: 3 l: 4 m, n: 5 r: 6 3) Ta bort alla nollor 4) Ta bort alla på varandra följande dubbletter 5) Spara de tre första siffrorna 34
35 Likhetsnycklar: SOUNDEX disappoint disapont ---> D > D215 Ersättningsförslag för disapont: disband, disbands, disbanded, disbanding, disbandment, disbandments, dispense, dispenses, dispensed, dispensing, dispenser, dispensers, dispensary, dispensaries, dispensable, dispensation, dispensations, deceiving, deceivingly, despondent, despondency, despondently, disobeying, disappoint, disappoints, disappointed, disappointing, disappointedly, disappointingly, disappointment, disappointments, disavowing 35
36 N-gramsbaserade tekniker Stränglikhet: andelen gemensamma n-gram (trigram) Likhet(i, j) = 2C/(n+n ) där n är antalet trigram i i och n är antalet trigram i j och C är antalet trigram gemensamma för i och j 36
37 N-gramsbaserade tekniker Hur lika är concider och consider? ##c #co con onc nci cid ide der er# r## ##c #co con ons nsi sid ide der er# r## C (antalet gemensamma trigram) = 7 n (antalet trigram i concider) = 10 n (antalet trigram i consider) = 10 Likhet(concider, consider) = 2C/n+n = 14/20 = 0,70 37
38 N-gramsbaserade tekniker Hur lika är concider och cider? ##c #co con onc nci cid ide der er# r## ##c #ci cid ide der er# r## C (antalet gemensamma trigram) = 6 n (antalet trigram i concider) = 10 n (antalet trigram i cider) = 7 Likhet(concider, cider) = 2C/n+n = 12/17 = 0,71 38
39 N-gramsbaserade tekniker Modifierat likhetsmått: Likhet(i, j) = C/max(n, n ) Likhet(concider, consider) = 7/10 = 0,70 Likhet(concider, cider) = 6/10 = 0,60 39
40 Felkorrigering: sammanfattning Två uppgifter Ta fram ersättningsförslag Rangordna ersättningsförslagen Kompetensfel vs performansfel Exempel på korrigeringsstrategier: Minimum Edit Distance Likhetsnycklar N-gramsbaserad korrigering 40
41 Hemuppgift Antag att en skribent av misstag har skrivit in käran. Antag vidare att ett stavningskontrollprogram har kommit fram till att det rör sig om en felstavning och att möjliga ersättningsförslag är tjäran och kärran. Hur skulle dessa ersättningsförslag rangordnas enligt det (modifierade) n-gramsbaserade måttet? Illustrera dina uträkningar! Hur skulle ersättningsförslagen rangordnas enligt Minimum Edit Distance? Illustrera genom att rita upp matriserna! Kommentera dina resultat. Är rangordningen lika bra för alla typer av skribenter? Skulle båda alternativen finnas med bland ersättningsförslagen om man istället hade använt sig av likhetsnycklar på samma sätt som i SOUNDEX? Varför/varför inte? Kommentera! 41
42 Referenser Karen Kukich, 1992, Techniques for Automatically Correcting Words in Text Daniel Jurafsky & James H. Martin, 2000 (avsnitt ), Speech and Language Processing Roger Mitton, 1996, Spellchecking by Computer. 42
Maskinöversättning och språkgranskning, ht 2006
Maskinöversättning och språkgranskning, ht 2006 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll:
Läs merSpråkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Läs merSpråkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Läs merGrundläggande Textanalys VT 2014. Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se
Grundläggande Textanalys VT 2014 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Denna gång Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merGrundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2015 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Referatuppgiften 10 minuters muntlig presentation av vetenskaplig artikel med 5 minuters efterföljande diskussion
Läs merMaskinöversättning och språkgranskning F5 Allmänt om språkgranskning + ordkontroll
Maskinöversättning och språkgranskning 2008 F5 Allmänt om språkgranskning + ordkontroll Språkgranskningsverktyg Datorprogram som fungerar som skrivstöd genom att kontrollera språkriktighet och ev. stil
Läs merGrundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Denna gång Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merGrundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2017 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Först några ord om referatuppgiften Sammanfatta en vetenskaplig artikel, vilket ger färdigheter i att: läsa
Läs merStavningskontroll. Metoder och tillämpningar inom språkteknologin. ht Allmänt om språkgranskning. Stavningskontroll.
Föreläsningsöversikt Metoder och tillämpningar inom språkteknologin, ht 2006 Språkgranskning evapet@stp.lingfil.uu.se Allmänt om språkgranskning Stavningskontroll Grammatikkontroll Stilkontroll Några exempel
Läs merGrundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word. Eva Pettersson UU/Convertus
Grundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word Eva Pettersson UU/Convertus evapet@stp.lingfil.uu.se Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll
Läs merSkrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord
Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord
Läs merSkrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier
Skrivstöd Christian Hardmeier (efter Joakim Nivre) 205-- Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Stavning fungerar som bildningsmarkör Standardiserad stavning
Läs merInnehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad
Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Läs merMålet är att ge maskiner förmågan att plocka ut information ur
Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merIntroduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Läs merEn arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ
DATORER Så klarar man språkkontrollen RICKARD DOMEIJ Är datorns språkkontroll skribentens bästa vän? Eller kommer den mest med löjliga förslag? I april gav Svenska språknämnden ut Datorn granskar språket,
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Läs merInnehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson
GRAMMATIKKONTROLL I GRANSKA Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder för grammatikkontroll Granska Granskas regelspråk Att skriva regler i Granska Inför laborationen
Läs merStränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N
Stränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N Examensarbete Stockholm, Sverige 2008 Stränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N Examensarbete i datalogi
Läs merMissplel ett generellt verktyg för generering av stavfel
Missplel ett generellt verktyg för generering av stavfel Linus Ericson TRITA-NA-E04045 NADA Numerisk analys och datalogi Department of Numerical Analysis KTH and Computer Science 100 44 Stockholm Royal
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merInnehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG
Innehåll SPRÅKGRANSKNINGSVERKTYG F1:INTRODUKTION Ola Knutsson KTH CSC, knutsson@csc.kth.se Språkgranskningsverktyg Språk vs. skrivet språk Språkriktighet och grammatikalitet, vad är en bra text? Felanalysens
Läs merObesvarade frågor från F4
Obesvarade frågor från F4 Antal ord i sista upplaga av SAOL 90 000 el 120 000? Varför har barnförbjuden tagits bort och barnförbjuda införts? Formellt singularis, reellt pluralis Mången fotbollsspelare
Läs merStatistisk Maskinöversättning eller:
729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...
Läs merSpråkgranskningsverktyg. F1: Introduktion
Språkgranskningsverktyg F1: Introduktion Kursplan http://www.selma.uu.se/publik/main?af=0200&funktion=kplan&kurs=5ln442&startv=200804 Kurssida http://stp.lingfil.uu.se/~evapet/undervisning/sgv08/ Språkgranskningsverktyg
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merSpråkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 8 Scania Checker evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kontrollerat språk Scania-svenska Scania Checker Demo 2 Kontrollerat språk Delmängd av naturligt språk Restriktioner
Läs merKungl. Tekniska högskolan NADA Grundformer med Stava
Kungl. Tekniska högskolan NADA Grundformer med Stava Språkteknologi 2D1418 Höstterminen 2004 Författare: Andreas Pettersson az@kth.se 1. Bakgrund Om man automatiskt ska plocka ut de informationsbärande
Läs merIdentifiering av ordvitsar med Granska
Identifiering av ordvitsar med Granska jonord@kth.se Inledning För att försöka identifiera ordvitsar med Granska användes ett litet urval av ordvitsar hämtade från olika ställen. Målet med identifiering
Läs merb) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
Läs merKom igång med SpellRight
Kom igång med SpellRight SpellRight är ett program som rättar engelska stavfel. Programmet är i första hand avsett för personer som har svenska som modersmål och skriver på engelska som andraspråk. Starta
Läs merVad kan statistik avslöja om svenska sammansättningar?
Vad kan statistik avslöja om svenska sammansättningar? 199 Vad kan statistik avslöja om svenska sammansättningar? Ur Språk & stil NF 16, 2006 Av JONAS SJÖBERGH och VIGGO KANN I många språktekniska datortillämpningar
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merspråkgranskning, ht 2007
Maskinöversättning och språkgranskning, ht 2007 Föreläsning 3 Grammatikkontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll Språkgranskningssystem
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merTDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merDatorlingvistik och språkteknologi
Datorlingvistik och språkteknologi Mats Dahllöf Institutionen för lingvistik och filologi Att bearbeta språk i datorer med känslighet för språket som språk: Språkvetenskapligt forskningsområde: datorlingvistik
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2014 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merHur hanterar stavningskontrollerna. texter skrivna av skolbarn? en utvärdering av Stava Rex och Microsoft Word 2007.
Institutionen för lingvistik Språkteknologiprogrammet Hur hanterar stavningskontrollerna texter skrivna av skolbarn? en utvärdering av Stava Rex och Microsoft Word 2007. Kandidatuppsats i språkteknologi
Läs merEva Ansell Ulrika Nilsson WORD 2008 MICROSOFT. för Mac
Eva Ansell Ulrika Nilsson MICROSOFT WORD 2008 för Mac 1. Introduktion till Word 2008 för MAc A. Docendo-pedagogiken...6 B. Hämta övningsfiler...7 C. Starta programmet...8 D. Avsluta programmet...8 E. Programfönstret...9
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merÖsterlengymnasiet 2009-08-14
Österlengymnasiet 2009-08-14 Pedagogik vid läs- och skrivsvårigheter/dyslexi Lyckad dyslexipedagogik kräver Yrkesskicklighet Attityd Tid Undervisning Som om det finns en elev med dyslexi Kommunikation
Läs merTaggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger
Läs merCristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Läs merTDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Läs merSkäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.
Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten
Läs merNederländska I A 15 högskolepoäng. Välkommen till Nederländska I A, 15 högskolepoäng
STOCKHOLMS UNIVERSITET Institutionen för slaviska och baltiska språk, finska, nederländska och tyska Nederländska avdelningen Höstterminen 2018 Kursinformation med litteraturförteckning Nederländska I
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merUppgift 1 (grundläggande konstruktioner)
Uppgift 1 (grundläggande konstruktioner) a) Skriv ett program som låter användaren mata in 7 heltal och som gör utskrifter enligt nedanstående körexempel. Mata in 7 heltal: 1 0 0 3 1 1 1 Tal nr 2 var en
Läs merVad är en databas? Databaser. Relationsdatabas. Vad är en databashanterare? Vad du ska lära dig: Ordlista
Databaser Vad är en databas? Vad du ska lära dig: Använda UML för att modellera ett system Förstå hur modellen kan översättas till en relationsdatabas Använda SQL för att ställa frågor till databasen Använda
Läs merAnvända SpellRight 2 i Word 2010
Använda SpellRight 2 i Word 2010 1. Skriva i Word 1. Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer
Läs merKursplan för kurs på grundnivå
Kursplan för kurs på grundnivå Lingvistik IV Linguistics IV 30.0 Högskolepoäng 30.0 ECTS credits Kurskod: LIN400 Gäller från: VT 2016 Fastställd: 2014-09-03 Ändrad: 2015-08-20 Institution Institutionen
Läs merLathund för Stava Rex
Lathund för Stava Rex för PC Stava Rex är ett avancerat svenskt rättstavningsprogram som kan rätta grava stavfel, lättförväxlade ord samt enklare grammatikfel. Stava Rex klarar av att rätta text i de vanligaste
Läs merTDDC30 Programmering i Java, Datastrukturer och Algoritmer Lektion 5. Laboration 4 Lådplanering Exempel på layout, ett GUI-baserat program Frågor
TDDC30 Programmering i Java, Datastrukturer och Algoritmer Lektion 5 Laboration 4 Lådplanering Exempel på layout, ett GUI-baserat program Frågor 1 Laboration 5 - Introduktion Syfte: Öva på självständig
Läs merSPRÅKTEKNOLOGIPROGRAMMET
SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Mats Dahllöf Institutionen för lingvistik och filologi Augusti 2012 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system
Läs merProjektförslag. Datalingvistisk projektkurs VT mars 2007
Projektförslag Datalingvistisk projektkurs VT 2007 26 mars 2007 Möjliga projekt Utvärdering Att utvärdera ett befintligt program/system utifrån ett datalingvistiskt perspektiv. Exempel: Utvärdera hur ett
Läs merMatematiska metoder för språkvetare, 7,5 hp
Vårterminen 2017 Kurskod: LIN420 Matematiska metoder för språkvetare, 7,5 hp Kursbeskrivning Version: 19/3 2017 Institutionen för lingvistik, Avdelningen för datorlingvistik Undervisande lärare Kursansvarig
Läs merViTal. Talsyntes. Användarhandledning
ViTal Talsyntes Användarhandledning Introduktion ViTal är ett program som utvecklats för att med hjälp av artificiellt tal vara ett stöd vid läsning och skrivning. ViTal kan användas både i undervisning
Läs merDatorn har utvecklats till vårt viktigaste. Datorn som språkgranskare SPRÅKTEKNOLOGI OLA KNUTSSON
SPRÅKTEKNOLOGI Datorn som språkgranskare OLA KNUTSSON Datorerna kan inte bara rätta stavfel utan också särskrivningar, böjningsfel, syftningsfel och grammatiska fel. Men fortfarande förslår språkgranskningsprogrammen
Läs merFOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide
FOR BETTER UNDERSTANDING Kom igång med WordFinder Snabbguide Installationsanvisning 1 Sätt i programskivan i datorn. Installationsprogrammet startar automatiskt. En gemensam startbild för WordFinder Professional,
Läs merKursbeskrivning med litteraturlista HT-13
Kursbeskrivning med litteraturlista HT-13 Skriftlig språkfärdighet, 7,5 hp Delkurs inom Italienska I, 30 hp. Består av: I. Italiensk grammatik med inlämningsuppgifter, 6 hp, och II. Skriftlig produktion,
Läs merSpråkvetenskapliga och psykologiska perspektiv inom logopedi, 15 hp
1(5) 8LOG14 Språkvetenskapliga och psykologiska perspektiv inom logopedi, 15 hp Linguistic och Psychological Perspectives for Speech-Language Pathology, 15 credits Programkurs Medicinska fakulteten Gäller
Läs merSOLP02, Rättssociologi i teori och praktik, 15 högskolepoäng Socio-Legal Theory and Practice, 15 credits Avancerad nivå / Second Cycle
Samhällsvetenskapliga fakulteten SOLP02, Rättssociologi i teori och praktik, 15 högskolepoäng Socio-Legal Theory and Practice, 15 credits Avancerad nivå / Second Cycle Fastställande Kursplanen är fastställd
Läs merNederländska I 30 högskolepoäng Termin 1 (15 högskolepoäng) Välkommen till Nederländska I, 30 högskolepoäng
STOCKHOLMS UNIVERSITET Institutionen för baltiska språk, finska och tyska Nederländska avdelningen Höstterminen 2014 Kursinformation med litteraturförteckning Nederländska I 30 högskolepoäng Termin 1 (15
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merKursplaneöversättaren. Lina Stadell
Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad
Läs merSocialpsykologiska teorier, 7,5 hp
Socialpsykologiska teorier, 7,5 hp Masterprogrammet i psykologi, HT- 13 Psykologiska institutionen Stockholms universitet Kursansvarig: Charlotte Alm Övergripande syfte och innehåll Syftet med kursen är
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs mer2. Utgångspunkter och angreppssätt för automatisk språkgranskning
Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet
Läs merFöreläsningar Lektioner Laborationer Projekt Tentamina Inlämningsuppgifter Seminarier Annat. D-sektionen IT
1 (6) Matematisk grundkurs Sändlista Kurskod Examinator Inger Klein Jonas Detterfelt Siv Söderlund Jakob Pogulis Bengt Josefson Göran Forsling TTIT02 Bengt Josefson Kursen gavs Årskurs 1 Kursens delar
Läs merGrammatik, det fixar väl datorn?
Grammatik, det fixar väl datorn? rickard.domeij@sprakradet.se Innehåll Fixar den det? Hur? Då slipper man alltså själv? Ska man stänga av skiten då? Men hur fan ska man då göra? :/ 1 Babelfish Ska är vi
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merKursplan för kurs på grundnivå
Kursplan för kurs på grundnivå Tyska I German I 30.0 Högskolepoäng 30.0 ECTS credits Kurskod: TYS101 Gäller från: HT 2018 Fastställd: 2018-02-07 Institution Institutionen för slaviska och baltiska språk
Läs merSpellRight. för Mac. Innehåll. Rättstavning på engelska. Inställningar...13 Allmänt...13 Ordlistor...15. SpellRight för Mac i korthet...
Rättstavning på engelska SpellRight för Mac Innehåll SpellRight för Mac i korthet....2 Kom igång snabbt....2 Installation....2 Olika användare, olika inställningar....3 Kontroll av text....3 SpellRight
Läs merObjektorienterad Programmering Övningsuppgifter
Objektorienterad Programmering Övningsuppgifter Våren 2009 1. Skriv ett program som utför beräkning av fakultet för heltal. Nedan följer ett exempel på hur programmet skulle kunna fungera. ~pem> java factorial
Läs merSkriftspråk i förändring möter förlegade skrivstöd
Skriftspråk i förändring möter förlegade skrivstöd Ylva Hård af Segerstad Hasselgren, fil.dr i allmän språkvetenskap Sylvana Sofkova Hashemi, fil.dr i allmän språkvetenskap Skriftspråket spelar allt större
Läs merObjektorienterad programmering och Java
Objektorienterad programmering och Java Sändlista Inger Klein Jonas Detterfelt Siv Söderlund Johan Högdahl Jonas Kvarnström Peter Dalenius Kurskod Examinator TDDC69 Jonas Kvarnström Kursen gavs Årskurs
Läs merTentamen 2016-01-13. Marco Kuhlmann
TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga
Läs merMaskinöversättning och språkgranskning. F6: Grammatikkontroll
Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.
Läs merWord- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merINSTITUTIONEN FÖR SPRÅK OCH LITTERATURER
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER JP1300 Japanska, fortsättningskurs II, 30 högskolepoäng Japanese, Intermediate Course 2, 30 higher Fastställande Kursplanen är fastställd av Institutionen för språk
Läs merSpråkteknologiska stöd. Förskolor. Stemming. Slå ihop till samma ord
Språkteknologiska stöd Språkteknologiska stöd Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Stemming, trunkering, frågeexpansion Långa frågor och frassökning Stavningsstöd
Läs merDAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Läs merÄEND01, Engelska 1, 30 högskolepoäng English 1, 30 credits Grundnivå / First Cycle
Humanistiska och teologiska fakulteterna ÄEND01, Engelska 1, 30 högskolepoäng English 1, 30 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av Prodekanen med ansvar för grundutbildning
Läs merKSMB43, Matkultur: Konsumtion och produktion, 15 högskolepoäng Food Culture, Consumption and Production, 15 credits Grundnivå / First Cycle
Samhällsvetenskapliga fakulteten KSMB43, Matkultur: Konsumtion och produktion, 15 högskolepoäng Food Culture, Consumption and Production, 15 credits Grundnivå / First Cycle Fastställande Kursplanen är
Läs merEMG:s väg till examensarbeten av mycket hög kvalitet
EMG:s väg till examensarbeten av mycket hög kvalitet Rolf Zale Institutionen för ekologi, miljö och geovetenskap rolf.zale@emg.umu.se Grundsyn Under examensarbetet ska studenten koncentrera sig på uppgiften
Läs merAnvända Stava Rex i Word 2010
Använda Stava Rex i Word 2010 1. Skriva i Word Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer de ord
Läs merLathund för SpellRight
Lathund för SpellRight för PC SpellRight är ett avancerat rättstavningsprogram för personer med svenska som modersmål, som skriver på engelska som sitt andraspråk. Programmet rättar grava stavfel, lättförväxlade
Läs merG2E, Grundnivå, har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
Ekonomihögskolan FEKH19, Företagsekonomi: Examensarbete i strategic management på kandidatnivå, 15 högskolepoäng Business Administration:Bachelor Degree Project in Strategic Management Undergraduate Level,
Läs merVad är en databas? Databaser. Relationsdatabas. Vad är en databashanterare? Vad du ska lära dig: Ordlista
Databaser Vad är en databas? Vad du ska lära dig: Använda UML för att modellera ett system Förstå hur modellen kan översättas till en relationsdatabas Använda SQL för att ställa frågor till databasen Använda
Läs merHjälper dig att kontrollera din text efter felstavningar och lättförväxlade ord. Manual
ClaroStava svenska PC med tal Ett rättstavningsprogram artnr 12315 Hjälper dig att kontrollera din text efter felstavningar och lättförväxlade ord. Manual ClaroStava delas upp på två knappar. Kontroll:
Läs merInnehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Läs merSå här fungerar Stava Rex
Så här fungerar Stava Rex Stava Rex är ett program som rättar stavfel och grammatikfel i svensk text. Stava Rex kan rätta grava stavfel och hjälper till att skilja på lättförväxlade ord. Stava Rex kan
Läs mer