Maskinöversättning och språkgranskning F5 Allmänt om språkgranskning + ordkontroll
|
|
- Kristina Hedlund
- för 6 år sedan
- Visningar:
Transkript
1 Maskinöversättning och språkgranskning 2008 F5 Allmänt om språkgranskning + ordkontroll
2 Språkgranskningsverktyg Datorprogram som fungerar som skrivstöd genom att kontrollera språkriktighet och ev. stil i text. Språkriktighet och stil bedöms i relation till en given norm
3 Språkgranskningsområden Stavningskontroll Stilkontroll Avstavning Grammatikkontroll
4 Deluppgifter för ett språkgranskningsprogram Känna igen fel Diagnosticera dem Rätta el. föreslå rättelser
5 Önskemål Igenkänning fullständighet (recall) alla fel ska kännas igen träffsäkerhet (precision) inga falska alarm Diagnos korrekt diagnos ska ställas/väljas tillräckligt specifik för att ge grund för rättelse el. rättelseförslag
6 Önskemål, forts. Rättelseförslag Träffsäkerhet Formulering med hänsyn tagen till användaren
7 Olika användare Den vane användaren Journalister Tekniska skribenter Inlärare Barn etc.
8 Användaranpassning Lexikon Terminologi Grammatik Kontrollerat språk
9 Kommersiella språkgranskningsprogram för svenska WORD Tansa Skribent Scania Checker etc.
10 Språklig norm Preskriptiv, ej deskriptiv, lingvistik Skriftspråk, ej talspråk Vem fastställer normen för det svenska standardspråket? Svenska Akademien Språkrådet (f.d. Svenska språknämnden)
11 Svenska Akademien Svenska Akademien instiftades 1786 av Gustaf III. Den främsta uppgiften skulle vara att arbeta på svenska språkets "renhet, styrka och höghet", dvs. dess klarhet, uttrycksfullhet och anseende. För att uppnå det målet skulle Akademien bland annat utarbeta en ordbok och en grammatik. Svenska Akademiens ordlista Svenska Akademiens ordbok Svenska Akademiens grammatik
12 Svenska Akademiens ordlista SAOL (1986), 11 upplagan av Svenska Akademiens Ordlista c:a uppslagsord SAOL (2006), 13 upplagan Ungefärligt antal uppslagsord? Vilka stilar och ämnesområden urskiljs?
13 Användning av SAOL Huvudkälla för svensk stavning vid manuell stavningskontroll. Källa till flera svenska stavningsprogram. Uppslagsord originalversionen = grundform Manuellt bruk uppblåst version = böjningsform Maskinellt bruk
14 Ex. på uppslag i SAOL(1986) form -en s. 1 pl. -ar i sms. som gjutform, bakform 2 pl. -er skapnad, gestalt, yttre beskaffenhet -beständig -bröd -bunden -enlig -experiment -fast -fel -flaska tekn. -franska bröd -fråga s. -fulländad -fulländning -förändring -ge el. giva -givare -givning -gjuta -kurva sport. -känsla -lära -lös -löshet -maskin tekn. -massa -ord t.ex. pronomen, preposition -pressa tekn. -pressning -ren adj. -rik-rikedom -rytteri -sak -sand tekn. -skön -spruta v. tekn. -sprutning -språk -stridig -sträng adj. -svacka s. sport. -system -topp sport. -verktyg -vilja -värld 1form a 1 -an -or s. liten öppning i ugns vägg för tillförsel av blästerluft m.m. 2 -ade v. ge form åt; gestalta; skapa m.m.; sms. se under form -ad -at adj.
15 Svenska Akademiens ordbok Svenska Akademiens ordbok, SAOB, är en historisk ordbok som beskriver svenskt skriftspråk från 1521 till våra dagar. Man har hunnit från A till Trivsel. Deskriptiv, inte preskriptiv
16 Språkrådet Språkrådet (f.d. Svenska språknämnden) är Sveriges officiella språkvårdsorgan. Rådet är en del av den nya språkmyndigheten Institutet för språk och folkminnen. Språkrådet ger bland annat ut Språk- och skrivråd.
17 Mål för ordkontroll Skrivfel Fel som beror på bristande uppmärksamhet och som leder till icke-ord,t.ex. coh Rätt ord men fel i sammanhanget, t.ex. Föredraget vad intressant. Den här karten med inlagda höjdschatteringar blev årets karta både 2006 och 2007 (UNT )
18 Stavningskontroll, forts. Stavfel Fel som beror på bristande kunskap, t.ex alldrig, altid, undervisitet, åtminstonde bad design, stekt kyckling lever Tjära vän!
19 Stilkontroll Avvikelser från standardspråket Ålderdomlig, byråkratisk, talspråklig etc. Uttryck Ordval, t.ex. ity, pimpad Böjningsform, t.ex. sig/sej, de/dom Struktur, t.ex. större än jag/ större än mig; före middagen/innan middagen
20 Huvudmetoder för feligenkänning vid stavningskontroll Lexikalisk Avstämning mot lexikon (lab) Problem med produktiva ordbildningar Statistisk avstämning mot trigram (Nylander 2000) problem med täckning Grafotaktisk avstämning mot grafotaktiska regler (Nylander 2000) problem med täckning
21 Avstavning i svenska Mekanisk avstavning enkonsonantregeln En konsonant till nästa rad, men Bryt ej ck, ng som betecknar ett ljud (fonem) vid sammansättningsgräns Morfematisk avstavning Avstavning mellan ordled Den morfematiska avstavningen lanserades i SAOL 1986
22 Omskrivningsregler för stavelseigenkänning vid mek. avstavning SYLL1 (C1) V (C2) V {a, e, i, o, u,...} C1 {b, c, d, f,...} C2 {b, c, d, f,.., ck, ng,...} (från Sågvall Hein 97) Introduktion till språkteknologi 1997
23 Avstavning enl. den mekaniska och den morfematiska principen mekanisk morfematisk fyrkant fyr-kant fyr-kant ankor an-kor ank-or elitutbildning eli-tutbildning elit-utbildning andras and-ras andr-as (annan) andras and-ras an-dras (andra) bildrulle bild-rulle bild-rulle bildrulle bild-rulle bil-drulle (från Sågvall Hein 97) Introduktion till språkteknologi 1997
24 Ordfel som kräver grammatikkontroll Ett stor hus Böckerna var intressant. En av de många fallen Där samlade då hela universitetets spridda administration (UNT ) Det är tänkbart att vi flyttar ut Skandalhuset, men jag kan inte föregripa utvecklingen (UNT ) En idé har varit att göra Carolina till bli universitetets ansikte med en informationsdisk i entrén för studenter och besökare (UNT )
25 Vad förväntas av det ideala ordkontrollprogrammet? Känna igen och larma för alla felskrivna ord Känna igen och acceptera alla rättstavade ord Ge ett korrekt rättningsförslag för alla felskrivna ord
26 Mer realistiska förväntningar Känna igen och larma för de mest frekventa och lättidentifierade felstavningarna Känna igen och acceptera alla rättstavade ord, som är tillräckligt frekventa i språket Ge ett troligt rättningsförslag för alla felstavade ord (frekvens)
27 Feligenkänningsstrategier Trigram av tecken Larmar för ovanliga teckenkombinationer Används främst inom OCR Lexikon Fullformslexikon eller stamlexikon Lexikonstorleken avgörande: För stort lexikon = många fel missas (låg täckning) För litet lexikon = många falska alarm (låg precision)
28 Feligenkänning mha lexikon Problem: språket är produktivt omöjligt att lista alla ord i lexikonet Brist på täckning kan lura skribenten att faktiskt stava fel, t. ex. särskriva sammansättningar: jätte trött
29 Feligenkänning mha lexikon, forts Kompletterande strategier: Morfologiska regler för t.ex. avledningar Sammansättningsregler Egennamnsigenkänning Tillåt användaren att lägga till egna ord i lexikonet
30 Feligenkänning: sammansättningar Enklast strategi: ord = ord + ord dator + lingvistik = datorlingvistik Förfinad strategi: ord = förled + ord flicka + klänning = flickklänning äpple + paj = äppelpaj kvinna + parti = kvinnoparti cigarr + rök = cigarrök
31 Feligenkänning: sammansättningar, forts Sammansättningsanalys minskar antalet falska alarm Sammansättningsanalys kan dock öka antalet missade fel kotakt kontakt makelera makulera medalg medalj cykelsäll cykelställ särkskilt särskilt
32 Felkorrigering: feltyper Kompetensfel Fonetiska fel: restaurang ---> resturang Homofonfel: gott ---> gått Performansfel Insättning språkteknologii Borttagning spåkteknologi Substitution sprokteknologi Transposition spårkteknologi
33 Felkorrigering: empiriskt grundade iakttagelser De flesta felstavningar är performansfel (insättning, borttagning, substitution eller transposition) De flesta felstavningar påverkar inte ordets längd med mer än en bokstav Första bokstaven i ordet är sällan felaktig Tangenternas placering påverkar Bokstävernas frekvenser påverkar
34 Korrigeringsstrategier Minimum Edit Distance Likhetsnycklar N-gramsbaserade tekniker Regelbaserade tekniker Probabilistiska tekniker Neurala nätverk
35 Minimum Edit Distance Stränglikhet Minsta antalet editeringsoperationer som behövs för att omvandla en sträng till en annan Editeringsoperationer: Insättning Borttagning Substitution (alt. borttagning + insättning) Transposition (alt. borttagning + insättning)
36 Minimum Edit Distance r ä n g n a r e g n a r
37 Minimum Edit Distance r ä n g n a r e g n a r substitution + borttagning + insättning = 3
38 Likhetsnycklar Strängar matchas mot nycklar Ord som stavas på liknande sätt har likadana eller nästan likadana nycklar
39 Likhetsnycklar: SOUNDEX (1) SOUNDEX: Indexing on Sound Odell & Russel, 1918 (!) Fonetisk likhet Vokaler ignoreras Konsonanter grupperas tillsammans om de liknar varandra fonetiskt Användning: Flygbokningssystem (Davidson 1962)
40 Likhetsnycklar: SOUNDEX (2) Behåll det första tecknet Ersätt efterföljande tecken enligt nedan: a, e, i, o, u, y, h, w: 0 b, f, p, v: 1 c, g, j, k, q, s, x, z: 2 d, t: 3 l: 4 m, n: 5 r: 6 Ta bort alla nollor Ta bort alla på varandra följande dubbletter Spara de tre första siffrorna
41 Likhetsnycklar: SOUNDEX (3) disappoint disapont ---> D > D215 Ersättningsförslag för disapont: disband, disbands, disbanded, disbanding, disbandment, disbandments, dispense, dispenses, dispensed, dispensing, dispenser, dispensers, dispensary, dispensaries, dispensable, dispensation, dispensations, deceiving, deceivingly, despondent, despondency, despondently, disobeying, disappoint, disappoints, disappointed, disappointing, disappointedly, disappointingly, disappointment, disappointments, disavowing
42 N-gramsbaserade tekniker Stränglikhet: andelen gemensamma n-gram (trigram) Likhet(i, j) = 2C/(n+n ) där n är antalet trigram i i och n är antalet trigram i j och C är antalet trigram gemensamma för i och j
43 N-gramsbaserade tekniker Hur lika är concider och consider? ##c #co con onc nci cid ide der er# r## ##c #co con ons nsi sid ide der er# r## C (antalet gemensamma trigram) = 7 n (antalet trigram i concider) = 10 n (antalet trigram i consider) = 10 Likhet(concider, consider) = 2C/n+n = 14/20 = 0,70
44 N-gramsbaserade tekniker Hur lika är concider och cider? ##c #co con onc nci cid ide der er# r## ##c #ci er# r## cid ide der C (antalet gemensamma trigram) = 6 n (antalet trigram i concider) = 10 n (antalet trigram i cider) = 7 Likhet(concider, cider) = 2C/n+n = 12/17 = 0,71
45 Vidareläsning, för den som vill Karen Kukich, 1992, Techniques for Automatically Correcting Words in Text Daniel Jurafsky & James H. Martin, 2000 (avsnitt ), Speech and Language Processing Stina Nylander, 2000, Statistics and Phonotactical Rules in Finding OCR errors. Roger Mitton, 1996, Spellchecking by Computer.
Språkgranskningsverktyg. F1: Introduktion
Språkgranskningsverktyg F1: Introduktion Kursplan http://www.selma.uu.se/publik/main?af=0200&funktion=kplan&kurs=5ln442&startv=200804 Kurssida http://stp.lingfil.uu.se/~evapet/undervisning/sgv08/ Språkgranskningsverktyg
Språkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Språkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Feligenkänning Felkorrigering Produktivt bildade ord Kort om labben 2 Vad förväntas av det ideala stavningskontrollprogrammet?
Maskinöversättning och språkgranskning, ht 2006
Maskinöversättning och språkgranskning, ht 2006 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll:
språkgranskning, ht 2007
Maskinöversättning och språkgranskning, ht 2007 Föreläsning 2 Stavningskontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kursöversikt Allmänt om språkgranskning Allmänt om stavningskontroll Stavningskontroll:
Grundläggande Textanalys VT 2014. Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se
Grundläggande Textanalys VT 2014 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Denna gång Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2015 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Referatuppgiften 10 minuters muntlig presentation av vetenskaplig artikel med 5 minuters efterföljande diskussion
Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Denna gång Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Grundläggande Textanalys VT Språkgranskning (1) Eva Pettersson
Grundläggande Textanalys VT 2017 Språkgranskning (1) Eva Pettersson eva.pettersson@lingfil.uu.se Först några ord om referatuppgiften Sammanfatta en vetenskaplig artikel, vilket ger färdigheter i att: läsa
Stavningskontroll. Metoder och tillämpningar inom språkteknologin. ht Allmänt om språkgranskning. Stavningskontroll.
Föreläsningsöversikt Metoder och tillämpningar inom språkteknologin, ht 2006 Språkgranskning evapet@stp.lingfil.uu.se Allmänt om språkgranskning Stavningskontroll Grammatikkontroll Stilkontroll Några exempel
Innehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG
Innehåll SPRÅKGRANSKNINGSVERKTYG F1:INTRODUKTION Ola Knutsson KTH CSC, knutsson@csc.kth.se Språkgranskningsverktyg Språk vs. skrivet språk Språkriktighet och grammatikalitet, vad är en bra text? Felanalysens
Grundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word. Eva Pettersson UU/Convertus
Grundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word Eva Pettersson UU/Convertus evapet@stp.lingfil.uu.se Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll
Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord
Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord
Obesvarade frågor från F4
Obesvarade frågor från F4 Antal ord i sista upplaga av SAOL 90 000 el 120 000? Varför har barnförbjuden tagits bort och barnförbjuda införts? Formellt singularis, reellt pluralis Mången fotbollsspelare
Skrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier
Skrivstöd Christian Hardmeier (efter Joakim Nivre) 205-- Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Stavning fungerar som bildningsmarkör Standardiserad stavning
Introduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
En arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ
DATORER Så klarar man språkkontrollen RICKARD DOMEIJ Är datorns språkkontroll skribentens bästa vän? Eller kommer den mest med löjliga förslag? I april gav Svenska språknämnden ut Datorn granskar språket,
Innehåll. Grammatikkontroll i Granska. Problemställning. Datorstöd för skrivande. Vilka metoder finns? Granskas uppbyggnad
Grammatikkontroll i Granska Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning Granska Granskas regelspråk Att skriva regler i Granska Kort
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Grundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
Missplel ett generellt verktyg för generering av stavfel
Missplel ett generellt verktyg för generering av stavfel Linus Ericson TRITA-NA-E04045 NADA Numerisk analys och datalogi Department of Numerical Analysis KTH and Computer Science 100 44 Stockholm Royal
Maskinöversättning. F Anna Sågvall Hein
Maskinöversättning F1 2008 Anna Sågvall Hein Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och
Språkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 8 Scania Checker evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kontrollerat språk Scania-svenska Scania Checker Demo 2 Kontrollerat språk Delmängd av naturligt språk Restriktioner
Målet är att ge maskiner förmågan att plocka ut information ur
Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:
Kungl. Tekniska högskolan NADA Grundformer med Stava
Kungl. Tekniska högskolan NADA Grundformer med Stava Språkteknologi 2D1418 Höstterminen 2004 Författare: Andreas Pettersson az@kth.se 1. Bakgrund Om man automatiskt ska plocka ut de informationsbärande
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi
Lingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Vårdat, enkelt och begripligt!
skriv för webben Här hittar du några enkla råd om skrivande. Vi riktar oss speciellt till dig som skriver på webben men råden kan användas av alla. Läs gärna mer i Språkrådets Svenska skrivregler för övergripande
Lösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Innehåll GRAMMATIKKONTROLL I GRANSKA. Datorstöd för skrivande. Problemställning. Ola Knutsson
GRAMMATIKKONTROLL I GRANSKA Ola Knutsson knutsson@csc.kth.se Innehåll Datorstöd för skrivande Olika metoder för grammatikkontroll Granska Granskas regelspråk Att skriva regler i Granska Inför laborationen
FOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide
FOR BETTER UNDERSTANDING Kom igång med WordFinder Snabbguide Installationsanvisning 1 Sätt i programskivan i datorn. Installationsprogrammet startar automatiskt. En gemensam startbild för WordFinder Professional,
Grim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Lathund för Stava Rex
Lathund för Stava Rex för PC Stava Rex är ett avancerat svenskt rättstavningsprogram som kan rätta grava stavfel, lättförväxlade ord samt enklare grammatikfel. Stava Rex klarar av att rätta text i de vanligaste
Vad kan statistik avslöja om svenska sammansättningar?
Vad kan statistik avslöja om svenska sammansättningar? 199 Vad kan statistik avslöja om svenska sammansättningar? Ur Språk & stil NF 16, 2006 Av JONAS SJÖBERGH och VIGGO KANN I många språktekniska datortillämpningar
Stränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N
Stränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N Examensarbete Stockholm, Sverige 2008 Stränglikhet Manchester United vs Manchester Utd. B A R A N S Ö L E N Examensarbete i datalogi
Svårigheter med kurslitteraturen
Svårigheter med kurslitteraturen Forskningsanknuten kurs Litteraturen är skriven i syfte att presentera forskningsresultat och ofta argumentera för vissa lösningar; undantag: uppfriskningslitteraturen
Använda SpellRight 2 i Word 2010
Använda SpellRight 2 i Word 2010 1. Skriva i Word 1. Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer
Datorn har utvecklats till vårt viktigaste. Datorn som språkgranskare SPRÅKTEKNOLOGI OLA KNUTSSON
SPRÅKTEKNOLOGI Datorn som språkgranskare OLA KNUTSSON Datorerna kan inte bara rätta stavfel utan också särskrivningar, böjningsfel, syftningsfel och grammatiska fel. Men fortfarande förslår språkgranskningsprogrammen
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Maskinöversättning och språkgranskning. F6: Grammatikkontroll
Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.
Få ett utökat ordförråd och därmed förbättrad läsförståelse och förmåga att uttrycka sig.
Mål med Mango Språk Få ett utökat ordförråd och därmed förbättrad läsförståelse och förmåga att uttrycka sig. Kunna förstå och använda uttryck såsom idiom, ordpar och ordspråk. Behärska olika strategier
Textstil/tonalitet med Acrolinx
Textstil/tonalitet med Acrolinx Magnus Merkel magnus.merkel@fodina.se Fodina Language Technology FRÅGOR Hur förbättrar man texter med ett skribentstödsverktyg? Är läsbarhetsmått ett bra hjälpmedel? Visar
Teoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Datorlingvistik och språkteknologi
Datorlingvistik och språkteknologi Mats Dahllöf Institutionen för lingvistik och filologi Att bearbeta språk i datorer med känslighet för språket som språk: Språkvetenskapligt forskningsområde: datorlingvistik
Använda Stava Rex i Word 2010
Använda Stava Rex i Word 2010 1. Skriva i Word Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer de ord
LADDA NER LÄSA. Beskrivning. Viktiga ord i svenska : stavning PDF ladda ner
Viktiga ord i svenska : stavning PDF ladda ner LADDA NER LÄSA Beskrivning Författare: Anna Ericsson-Nordh. Viktiga ord-serien Nu kan dina elever hitta enkla förklaringar av grundbegreppen i svenska, matematik
Lathund för SpellRight
Lathund för SpellRight för PC SpellRight är ett avancerat rättstavningsprogram för personer med svenska som modersmål, som skriver på engelska som sitt andraspråk. Programmet rättar grava stavfel, lättförväxlade
Kursplaneöversättaren. Lina Stadell
Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad
Hur gör man? Skrivprocessen. Vilka regler gäller? Skribentens verktygslåda. Att skriva. En beskrivning av studenters skrivprocess
Från n tanke till färdig f text. En beskrivning av studenters skrivprocess Maria Ohlsson Institutet för språk och folkminnen Att skriva Alla måste kunna skriva Alla kan lära sig skriva Att skriva = ett
Kursplan i svenska. Mål att sträva mot för år F-5
Kursplan i svenska En av skolans viktigaste uppgifter är att skapa goda möjligheter för elevernas språkutveckling. Skolans undervisning ska ge eleverna möjlighet att använda och utveckla sina färdigheter
Projektförslag. Datalingvistisk projektkurs VT mars 2007
Projektförslag Datalingvistisk projektkurs VT 2007 26 mars 2007 Möjliga projekt Utvärdering Att utvärdera ett befintligt program/system utifrån ett datalingvistiskt perspektiv. Exempel: Utvärdera hur ett
Språkgranskningsverktyg. Felmodellering
Språkgranskningsverktyg Felmodellering Varför felmodellering? Återkoppling till användaren Vad kan betraktas som ett fel? Hur kan det beskrivas? Hur kan det förklaras? Hur kan det åtgärdas? Utvärdering
Att använda Stava Rex i Word 2007
Att använda Stava Rex i Word 2007 1. Skriva i Word Skriv av följande mening med fel och allt: Stänga av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer de ord som Word uppfattar
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Automatisk generering av grammatikövningar utifrån grammatiskt analyserad text
Automatisk generering av grammatikövningar utifrån grammatiskt analyserad text Magisteruppsats i Språkteknologi, 30hp Institutionen för lingvistik och lologi Uppsala Universitet Camilla Liljhammar, camlilj@stp.lingl.uu.se
LADDA NER LÄSA. Beskrivning. Svenska Akademiens grammatik PDF LÄSA ladda ner
Svenska Akademiens grammatik PDF LÄSA ladda ner LADDA NER LÄSA Beskrivning Författare: Ulf Teleman. Detta är den svenska standardgrammatiken, avsedd för universitetsstuderande, forskare, av svenska språket
Statistisk Maskinöversättning eller:
729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...
Till särskrivningens försvar. Nils Dverstorp Europeiska språkdagen 25 september 2015
Till särskrivningens försvar Nils Dverstorp Europeiska språkdagen 25 september 2015 Ordbildningslära Två principer för att skapa nya ord: Avledning Sammansättning Avledning Till en stam fogas ett prefix
Praktisk Svenska 2. Jag kan Skapa och använda olika minnesknep Studieteknik 1
Förmågor som eleverna ska utveckla i svenska Praktisk Svenska 1 Praktisk Svenska 2 Praktisk Svenska 3 Kunskapskrav i svenska Formulera sig och kommunicera i tal och skrift. Jag kan Formulera positiva tankar
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Har du koll på språkgranskningen? 15 februari 2018 Sara Rösare och Anki Mattson
Har du koll på språkgranskningen? 15 februari 2018 Sara Rösare och Anki Mattson Det här är Språkkonsulterna Vi gör världen begriplig! Vi är specialister på Begriplighet Lättläst Bank- och försäkringsspråk
Tekniken bakom språket
Tekniken bakom språket Red. Rickard Domeij Småskrift utarbetad av SPRÅKRÅDET 2008 NORSTEDTS AKADEMISKA FÖRLAG INNEHÅLL Språkteknologi för språken i Sverige 13 Rickard Donieij Tekniken bakom språket 13
foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8
Facit till övning 1 foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8 Några problem: 1) lång resp. kort variant av en vokal, är de
Statistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Eva Ansell Ulrika Nilsson WORD 2008 MICROSOFT. för Mac
Eva Ansell Ulrika Nilsson MICROSOFT WORD 2008 för Mac 1. Introduktion till Word 2008 för MAc A. Docendo-pedagogiken...6 B. Hämta övningsfiler...7 C. Starta programmet...8 D. Avsluta programmet...8 E. Programfönstret...9
Grundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2014 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Hjälper dig att kontrollera din text efter felstavningar och lättförväxlade ord. Manual
ClaroStava svenska PC med tal Ett rättstavningsprogram artnr 12315 Hjälper dig att kontrollera din text efter felstavningar och lättförväxlade ord. Manual ClaroStava delas upp på två knappar. Kontroll:
Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter
Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,
Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp
Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp astställda av institutionsstyrelsen 2012-05-09. Gäller fr.o.m. ht 12. elkurs 1: et talade språket, 7,5 hp örväntade studieresultat
Acapela TTS. Inställningar och korrigering av uttal. Emma och Erik
Acapela TTS Inställningar och korrigering av uttal Emma och Erik Innehåll Inledning... 3 Inställning av talsyntesens parametrar... 4 Förklaring av Flikar... 5 Info... 5 General... 5 Pauses... 5 Reading...
2. Utgångspunkter och angreppssätt för automatisk språkgranskning
Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet
Språkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Cristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Grundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Allt fler svenskar skriver dagligen texter. Kontrollera språkkontrollen FRAMTIDEN OLA KARLSSON
FRAMTIDEN Kontrollera språkkontrollen OLA KARLSSON Stavnings- och grammatikkontroll används flitigt trots att den fungerar dåligt för många användare. Det visar flera undersökningar. Språknormerna i programmen
RÄTTNINGSMALL. Delprov A. Språkform och språknorm (2013) MÅLSPRÅK SVENSKA. Anvisningar
1 MÅLSPRÅK SVENSKA Delprov A. Språkform och språknorm (2013) RÄTTNINGSMALL Anvisningar I var och en av de följande tjugo meningarna finns det ett brott mot olika slags skriftspråksnormer som gäller för
Xenotag Probabilistisk uppmärkning av xenoglosser baserat på tecken-n-gram
Xenotag Probabilistisk uppmärkning av xenoglosser baserat på tecken-n-gram Martin WARIN STP, Uppsala Universitet m warin@hotmail.com Abstract Här beskrivs en metod att identifiera ord i en text vilka är
Utveckling av lexikala resurser för ett språkgranskningssystem för svenska
Utveckling av lexikala resurser för ett språkgranskningssystem för svenska Leif-Jöran Olsson ljo@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Uppsala universitet Institutionen
LÄSLANDET - BOKSTÄVER OCH ORD
LÄSLANDET - BOKSTÄVER OCH ORD Programmet består av 21 övningar som övar förmågan att känna igen bokstäver och ord. Här tränas såväl läsning som stavning och bokstavsordning. Du får hela tiden stöd av inspelat
Fonetisk text och förkortningar i. Dialog Nova och Polycom Dialog
Fonetisk text och förkortningar i Dialog Nova och Polycom Dialog Fonetisk text och förkortningar i Dialog Nova och Polycom Dialog Version: 3.1 Dok.nr: 10.0183 A1 Producerat av: Polycom Technologies AB
Använd WordFinder optimalt! Lathund med nyttiga tips och trix.
Använd WordFinder optimalt! Lathund med nyttiga tips och trix. Logga in på tjänsten WordFinder Logga in på ditt konto på WordFinder om du har personligt konto Har du redan ett personligt konto på WordFinder,
SÅ HÄR SKRIVER VI PÅ HÖGSKOLAN I BORÅS. Skrivhandbok för begripliga texter
SÅ HÄR SKRIVER VI PÅ HÖGSKOLAN I BORÅS Skrivhandbok för begripliga texter INNEHÅLLSFÖRTECKNING Inledning... 3 Varför och till vem?... 4 Skriv direkt till din läsare... 5 Använd rubriker... 6 Vägled läsaren...
DAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Kursplan i svenska grundläggande kurs W
kursplan svenska w.doc Malmö stad Komvux Malmö Södervärn Kursplan i svenska grundläggande kurs W Språk är människans främsta redskap för reflektion, kommunikation och kunskapsutveckling. Genom språket
Att lära sig skriva i IT-samhället
Att lära sig skriva i IT-samhället Ylva Hård af Segerstad Sylvana Sofkova Hashemi Institutionen för lingvistik Göteborgs Universitet Projektets syfte Att undersöka barns och ungdomars skrift med olika
Hur man programmerar. Exempel på problemlösning i Python
Hur man programmerar Exempel på problemlösning i Python Problemet Som vokaler i engelska språket räknar vi i denna uppgift bokstäverna aeuio, och som konsonanter alla andra bokstäver utom y (y fungerar
Identifiering av ordvitsar med Granska
Identifiering av ordvitsar med Granska jonord@kth.se Inledning För att försöka identifiera ordvitsar med Granska användes ett litet urval av ordvitsar hämtade från olika ställen. Målet med identifiering
Uttalskorrigering med hjälp av Fonetisk text
Uttalskorrigering med hjälp av Fonetisk text Handitek Gewa AB BOX 92, MALMVÄGEN 55, 191 22 SOLLENTUNA TEL: 08-594 694 00 TEXTTEL: 08-594 694 18 FAX: 08-594 694 19 E-MAIL: info@gewa.se WEB: www.gewa.se
när du arbetar med uppsatser och andra långa texter
Tricks i Word när du arbetar med uppsatser och andra långa texter Åsa Kronkvist Högskolan Kristianstad Våren 2007 Innehåll Dags att skriva uppsats?... 3 Att tänka på innan du börjar... 3 Spara klokt...
Kom igång med SpellRight
Kom igång med SpellRight SpellRight är ett program som rättar engelska stavfel. Programmet är i första hand avsett för personer som har svenska som modersmål och skriver på engelska som andraspråk. Starta
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Innehåll B-nivå B.1 Två olika konsonanter i rad; i slutet och i början av ord.
Innehåll B-nivå B.1 Två olika konsonanter i rad; i slutet och i början av ord. / -ljudet B.3 Ljudgrupper med annorlunda vokalljud ild ind old ost B.4 Tre konsonanter i början av ord. B.5 Trigrafen -tch
BLOCK 1. 1A. Att komma igång
BLOCK 1 1A. Att komma igång Blocket omfattar sidorna 8 23 i läseboken och sidorna 7 8 i grammatikboken samt hörövningar. 1. Vem är du? 2. Vilka fyra färdigheter är viktiga vid språkinlärning? 3. Hur många
Centralt innehåll: Lokal Pedagogisk Planering i svenska. Ämnesområde: Skolfotot och Huset. Ansvarig lärare: Annika Svartling Andersson
Lokal Pedagogisk Planering i svenska Ämnesområde: Skolfotot och Huset Ansvarig lärare: Annika Svartling Andersson mail: annika.svartling.andersson@edu.upplandsvasby.se Centralt innehåll: Skillnader i språkanvändning
Automatisk utvinning av felaktigt särskrivna sammansättningar
Automatisk utvinning av felaktigt särskrivna sammansättningar Sofia Hedén Institutionen för lingvistik och filologi Språkteknologiprogrammet Kandidatuppsats i språkteknologi, 15 hp 8 juni 2017 Handledare:
Språket, individen och samhället VT08
Språket, individen och samhället VT08 Döva och språk Skriftsystem och läsning Ellen Breitholtz Föreläsningens upplägg 1. Döva och språk 2. Skriftsystem och läsning 1. Döva och språk Internationell manifestation
Kamratbedömning. Fokusera på följande:
Kamratbedömning Läs följande texter som dina klasskamrater har skrivit. Nu ska du ge konstruktiv kritik till dessa texter. Det vill säga, du ska kunna säga vad som är positivt och vad som är bra i texten,