Språkgranskningsverktyg. Grammatikkontroll i Word
|
|
- Ida Göransson
- för 8 år sedan
- Visningar:
Transkript
1 Språkgranskningsverktyg Grammatikkontroll i Word
2 Allmänt om grammatikkontroll Grammatikkontrollprogrammen inriktas mot en i förväg definierad felrepertoar. Fastställs vanligen genom analys av korpusmaterial. Texten analyseras och felregler tillämpas på den analyserade texten. Utvärdering sker med avseende på recall och precision. Jämförbara felrepertoarer i de svenska grammatikkontrollprogrammen (Granska, Word, Scarrie)
3 Word: Grammatifix Grammatifix är resultat av ett utvecklingsprojekt som genomfördes av Lingsoft, Inc., ett finskt språkteknologiskt företag. Lingsoft har licensierat Grammatifix till Microsoft som grammatikkontrollkomponent i den svenska versionen av Microsoft Office Grammatifix finns också som en fristående produkt och i en specialversion för kontroll av finlandssvenska.
4 Huvudgrupper av fel Grammatikfel SWECG Typografiska fel Reguljära uttryck över teckensträngar Stilistiska avvikelser Lexikal taggning
5 Grammatikkontroll med SWECG Grammatikkontrollen bygger på morfologisk och syntaktisk analys med hjälp av SWECG (Constraint Grammar, CG, for Swedish) Analysen resulterar i en platt struktur en taggad version av texten. På den taggade versionen tillämpas felregler.
6 Constraint Grammar CG bygger på lokala regler och skiljer sig därigenom från tidigare formella grammatikmodeller som t.ex. frasstrukturgrammatik. I CG finns inga globala meningsregler; reglerna beskriver förhållanden mellan närstående delar av satsen. Den resulterande analysen blir ytligare än den som en frasstruktur genererar; å andra sidan lämnar den inga delar helt oanalyserade. CG, inkl. dess morfologiska komponent TWOL (tvånivåmorfologi), är resultat av datorlingvistisk forskning som utförts vid Institutionen för lingvistik vid Helsingfors universitet. Båda programmen skapades ursprungligen för allmän språkanalys utan särskild inriktning mot grammatikkontroll.
7 Grundversionen av CG Förberedande bearbetning Lexikal analys Morfologisk disambiguering Morfosyntaktisk mappning Tilldelning av möjliga syntaktiska funktioner Syntaktisk disambiguering Se vidare Birn 1998,
8 Förberedande bearbetning Tokenisering Ord Förkortningar (t.ex. bl.a.) Skiljetecken Fasta förbindelser som man vill behandla som enheter, t.ex. till hands, så snart som, som fungerar som adverb resp. konjunktion
9 Lexikal analys Morfologisk analys SWETWOL Lexikonbaserad morfologisk analys Segmentering i stammar och affix Alla alternativ presenteras Tillståndsgrammatik (finite state) Morfologisk heuristik t.ex. entreprenöriella Se vidare: Svensk tvånivågrammatik (Karlsson 1992), vist.pdf
10 Ett exempel Dessa entreprenöriella faktorer hade än så länge dämpat explosionen. Efter tokenisering: *dessa entreprenöriella faktorer hade än_så_länge dämpat explosionen $.
11 Efter morfologisk analys "<*dessa>" "denna" <**c> <DEM> <MD> DET UTR/NEU DEF PL "denna" <**c> <DEM> PRON UTR/NEU DEF PL NOM "<entreprenöriella> "<faktorer>" "faktor" N UTR INDEF PL NOM "<hade>" "ha" <AUX> V ACT PAST "<än_så_länge>" "än_så_länge" <COLLOCATION> ADV "<dämpat>" "dämpa" V ACT SUPINE "dämpa" <PCP2> A NEU INDEF SG NOM "<explosionen>" "explosion" N UTR DEF SG NOM <$.> "$." CLB <PUNCT>
12 Ex. på en disambigueringsregel (informellt uttryckt) For a word, W, ambiguous between V SUPINE and <PCP2> A NEU, select the V reading if, somewhere to the left of W, there is a form of the verb ha, and if, between ha and W, there is no other verb and no clause boundary indicator, and if W is not preceded by a neuter indefinite singular determiner or by a coordinator, and if W is not followed by a neuter indefinite singular noun or by a coordinator.
13 Syntaktisk analys (efter morfosyntaktisk mappning, tilldelning av möjliga syntaktiska funktioner samt disambiguering) "<*dessa>" "denna" <**c> <DEM> <MD> DET UTR/NEU DEF PL "<entreprenöriella>" "entreprenöriella" <NON-SWETWOL> A UTR/NEU DEF/INDEF PL "<faktorer>" "faktor" N UTR INDEF PL "<hade>" "ha" <AUX> V ACT "<än_så_länge>" "än_så_länge" <COLLOCATION> "<dämpat>" "dämpa" V ACT "<explosionen>" "explosion" N UTR DEF SG "<$.>" "$." CLB
14 Anpassning av SWECG för grammatikkontroll Förberedande bearbetning Lexikal analys Disambiguering ******************* Taggning av varje Feligenkänningsregler, dvs. regler som väljer ut de korrekta taggarna
15 Ett exempel Det finns många engelska lånord vilkas diskontinuerliga stavningen inte tycks bereda språkbrukarna några problem. Vad är fel? Finns feltypen med i Scarrie-typologin?
16 Efter morfologisk analys många mången <ID> DET UTR/NEU INDEF PL NOM mången PRON UTR/NEU INDEF PL NOM engelska engelsk A UTR/NEU DEF SG NOM engelsk A UTR/NEU DEF/INDEF PL NOM engelska N UTR INDEF SG NOM lånord lån-ord N NEU INDEF SG/PL NOM vilkas vilken <WH><CLB><MD> DET UTR/NEU INDEF PL GEN vilken <WH> <CLB> PRON UTR/NEU INDEF PL GEN diskontinuerliga diskontinuerlig A UTR/NEU DEF SG NOM diskontinuerlig A UTR/NEU DEF/INDEF PL NOM stavningen stavning N UTR DEF SG NOM
17 Efter disambiguering många mången <ID> DET UTR/NEU INDEF PL NOM engelska engelsk A UTR/NEU DEF/INDEF PL NOM lånord lån-ord N NEU INDEF SG/PL NOM vilkas vilken <WH> <CLB> PRON UTR/NEU INDEF PL GEN diskontinuerliga diskontinuerlig A UTR/NEU DEF SG NOM stavningen stavning N UTR DEF SG NOM
18 Taggning och feligenkänning Varje analys tilldelas två taggar: en feltagg och en ok-tagg, t.ex. många mången <ID> DET UTR/NEU INDEF PL NOM Feligenkänningsreglerna väljer rätt tagg.
19 Efter feligenkänningsregler många mången <ID> DET UTR/NEU INDEF PL engelska engelsk A UTR/NEU DEF/INDEF PL lånord lån-ord N NEU INDEF SG/PL vilkas vilken <WH> <CLB> PRON UTR/NEU INDEF PL diskontinuerliga diskontinuerlig A UTR/NEU DEF/INDEF PL stavningen stavning N UTR DEF SG
20 En felregel i CG Regeln har fyra delar el. <..> /ett speciellt ord/ Operator =s! (select) el. =s0 (remove) Kontextvillkor
21 Ex. på regler ;For a word in focus, select the error tag (0 N-DEF) ;if the word itself is a noun in definite form (-2 GEN) ;if the second word to the left is a genitive (-1 A-DEF)) ;if the first word to the left is an adjective in ;definite form
22 Feligenkänningsgrammatiken Totalt 659 regler Till varje regel kopplas ett felmeddelande, som omfattar benämning på felet förklaring rättelse
23 Ett felmeddelande Benämning: Substantivets bestämdhetsform Förklaring: Kontrollera ordformen (0). Om ett substantiv styrs av en genitiv, t.ex. (-2), bör det stå i obestämd form Rättelse: (0 N DEF)=>(0 N INDEF) ==================================== Förklaring och rättelse i det aktuella exemplet: Förklaring: Kontrollera ordformen stavningen. Om ett substantiv styrs av en genitiv, t.ex. vilkas, bör det stå i obestämd form. Rättelse: stavningen => stavning
24 Ytterligare exempel högtrycksrygg förskjuts norrut. ( <ett> =s!@err (1C N-UTR))
25 Kontextvillkor Polaritet Positiv el. negativ Position Target 0 Absolut 1,2.., -1, -2 Obunden *1, *2..,-1*, -2* Länkad (flera villkor..) R+1, R+2, *R. L-1,L-2,..*L Försiktig läsning villkoret är uppfyllt bara om läsningen är entydig Mängd Allt som refereras till i kontextvillkoren måste deklareras som en mängd, t.ex. set set elements (N-NEU (N NEU))
26 Möjligheter och problem Fel i mycket lokala kontexter kan beskrivas enkelt och väl Grundläggande konflikt mellan disambiguering och feligenkänning, vilket gör formalismen som helhet svår att överblicka Svårt att beskriva fel som spänner över längre kontexter Svårt att fånga alla specifika kontexter för ett visst fel
27 Ett exempel Det bruna trasorna ser intressanta ut. Femtiofem brunsmutsiga tygbitar kanske inte verkar vara mycket för världen, men när textilfragmenten är drygt 300 år gamla och härrör från drottning Kristinas kläder ser det bruna trasorna genast mycket intressantare ut.
28 Feltyper 1. Bestämdhetsform hos substantiv:... samhällets 2. Bestämdhetsform hos adjektiv:... sin energi Numeruskongruens: determinerare och substantiv:... statliga monopolet Numeruskongruens: adjektiv och substantiv: upplagor Genuskongruens: determinerare och substantiv:... laget Genuskongruens: adjektiv och substantiv: ledarskap...
29 Feltyper, forts, 7. Maskulinform hos adjektiv:... den kvinnan. 8. Predikativkongruens: Den nya apparaturen är inte att använda. 9. Supinum utan ''ha'': Där borde nog polisen in med detsamma. 10. Dubbelt supinum: Vi hade velat 11. Dubbelt passiv: Saken har försökts att ner. 12. S-passiv efter vissa verb: Huset ämnar 13. Infinitiv utan ''att'': Han kunde inte undvika hennes blick.
30 Feltyper, forts 14. Infinitiv med ''att'': Sverige började klassa Antalet finita verb: I Ryssland är betalar(@err) nästan ingen någon skatt Inget finit verb: Det bli(@err) viktigt. 17. Inget verb: Ingenting här.(@err) 18. Placering av adverb i bisats:... att den lär knappast(@err) gå över Placering av negerat led i bisats:... påstår att lite stryk gör ingen(@err) skada. 20. Ordföljd i indirekt frågesats: Jag undrar vad gör(@err) de de unga männen i Finland.
31 Feltyper, forts. 21. Genuskongruens: pronomen och substantiv:... av de tre aggregaten 22. Pronomenets form efter preposition: Jag tänker på som kommer sist. 23. Infinitiv efter preposition:... för myndigheters och företags miljöarbete. 24. Dubbel negation:... om man inte har pengar eller familj Prepositionsbruk vid tvåledad konjunktion:... vare sig i Lund eller Malmö(@ERR). 26. Konstruktionen ''möjligast'' + adjektiv: Han körde med möjligast(@err) stora snabbhet.
32 Språklig norm Finns det några grammatiska feltyper i SWECG som inte finns med i Scarrietypologin? Vilka? Är det skillnader i den språkliga normen?
Obesvarade frågor från F1
Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll
Läs merMaskinöversättning och språkgranskning. F6: Grammatikkontroll
Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.
Läs merOrdklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)
Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den
Läs merspråkgranskning, ht 2007
Maskinöversättning och språkgranskning, ht 2007 Föreläsning 3 Grammatikkontroll evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll Språkgranskningssystem
Läs merGrundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word. Eva Pettersson UU/Convertus
Grundläggande textanalys, VT 2011 Stavnings- och grammatikkontroll i Microsoft Word Eva Pettersson UU/Convertus evapet@stp.lingfil.uu.se Föreläsningsöversikt Allmänt om grammatikkontroll Allmänt om stilkontroll
Läs merGrammatifix Svensk grammatikkontroll i MS Word
2D1418, Språkteknologi Grammatifix Svensk grammatikkontroll i MS Word Innehållsförteckning Sida 1 Inledning 3 2 Grammatifix 3 2.1 Detektering av grammatiska fel i Grammatifix 4 2.1.1 Förbehandling 4 2.1.2
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2014 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merGrundläggande Textanalys VT Språkgranskning (2) Eva Pettersson
Grundläggande Textanalys VT 2016 Språkgranskning (2) Eva Pettersson eva.pettersson@lingfil.uu.se Översikt Förra gången Stavningskontroll Allmänt om stavningskontroll Feligenkänning Felkorrigering Samarbetsuppgift
Läs merStavningskontroll. Metoder och tillämpningar inom språkteknologin. ht Allmänt om språkgranskning. Stavningskontroll.
Föreläsningsöversikt Metoder och tillämpningar inom språkteknologin, ht 2006 Språkgranskning evapet@stp.lingfil.uu.se Allmänt om språkgranskning Stavningskontroll Grammatikkontroll Stilkontroll Några exempel
Läs merParsningens olika nivåer
Parsning Språkteknologi DH418 Ola Knutsson Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merSpråkgranskningsverktyg. Grammatikkontroll med Scarrie
Språkgranskningsverktyg Grammatikkontroll med Scarrie Strategi för grammatikkontroll Vision Fullständig parsning enligt en heltäckande grammatik som skiljer ut avvikande konstruktioner och diagnosticerar
Läs merSvårigheter med kurslitteraturen
Svårigheter med kurslitteraturen Forskningsanknuten kurs Litteraturen är skriven i syfte att presentera forskningsresultat och ofta argumentera för vissa lösningar; undantag: uppfriskningslitteraturen
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merNORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Morfologisk analys och disambiguering som stöd i skapandet av frekvensordlistor Fredrik Westerlund, Sjur Nørstebø Moshagen, Eva Grava og Juhani Birn Kilde:
Läs merObesvarade frågor från F4
Obesvarade frågor från F4 Antal ord i sista upplaga av SAOL 90 000 el 120 000? Varför har barnförbjuden tagits bort och barnförbjuda införts? Formellt singularis, reellt pluralis Mången fotbollsspelare
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merMorfologi, särdrag, lexikon och syntax. När är det bra med morfologi? Vad är ett ord? Morfem. Stam och affix
Morfologi, särdrag, lexikon och syntax Ordbildning och ordböjning Automatisk morfologisk analys Lexikon Särdrag, attribut och värden Syntax När är det bra med morfologi? Stavnings- och grammatikkontroll
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2011 Några skillnader mellan svenska och engelska 1 Inledning
Läs merOrdklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,
Läs merORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Läs merInnehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?
Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning. Granska Att skriva regler i Granska.
Läs merVarför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?
Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merGrammatik skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning
Läs merOrdklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?
Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar
Läs merIntroduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merFraser, huvuden och bestämningar
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin
Läs merKorpuslingvistik vt 2007
Korpuslingvistik vt 2007 Metoder för annotering I Beáta B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk segmentering/analys,
Läs mer2. Utgångspunkter och angreppssätt för automatisk språkgranskning
Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Datorlingvistisk grammatik Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf Mars 2012 Några skillnader mellan svenska och engelska 1 Inledning likheter
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade
Läs merSpråkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 7 Chartparsning i allmänhet och UCP i synnerhet evapet@stp.lingfil.uu.se 1 Djupstruktur och ytstruktur Jag läste en bok igår Igår läste jag en bok 2 Chartparsning - bakgrund Utvecklades
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merSyntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax
Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer
Läs merMorfologi och automatisk morfologisk analys och generering. Varför är morfologi viktigt? Vad är ett ord (idag vs. i dag)
Morfologi och automatisk morfologisk analys och generering Språkteknologi DH2418 Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver
Läs merDatorn har utvecklats till vårt viktigaste. Datorn som språkgranskare SPRÅKTEKNOLOGI OLA KNUTSSON
SPRÅKTEKNOLOGI Datorn som språkgranskare OLA KNUTSSON Datorerna kan inte bara rätta stavfel utan också särskrivningar, böjningsfel, syftningsfel och grammatiska fel. Men fortfarande förslår språkgranskningsprogrammen
Läs merFrasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Läs merSatser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Satser och satsdelar Översikt i stolpform. Terminologin följer
Läs merORDKLASSERNA I. Ett sätt att sortera våra ord
ORDKLASSERNA I Ett sätt att sortera våra ord Vilka ordklasser finns det? Hur många kan ni komma på? 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Hur sorterar man orden? Morfologiskt Syntaktiskt Semantiskt SUBSTANTIV
Läs merKODNING AV MAXIMALA GRAMMATISKA ENHETER Manual
KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala
Läs merSvensk minigrammatik
Svensk minigrammatik För dig som vill repetera dina kunskaper i svensk grammatik Materialet är producerat av Mats Nyström.Det kan laddas hem på www.rlconsulting.se Materialet får ej saluföras. INNEHÅLLSFÖRTECKNING
Läs merSYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. o Ofta fogas
Läs merSvenska GRAMMATIK: ÖVNINGAR OCH SVAR
Svenska 1-2-3-4 GRAMMATIK: ÖVNINGAR OCH SVAR This is a document containing all the grammar exercises and answers from the website www.svenska.digital ADJEKTIV: Alla mina (fin) saker Jag har många saker.
Läs merSidan 1. Mångtydighet. Ordföljd och informationsstruktur. En situation. Fri ordföljd. Finska kasus. Bunden ordföljd
Mångtydighet Ordföljd och informationsstruktur Föreläsning 9 Lingvistik grundkurs Magnus Merkel 2006-02-16 Igår sköt jag en e med gevär på 100 meter. Hade du ett så långt gevär? Nej, jag menar att jag
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv10/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2010 Satser Satserna utgör den mest mångfacetterade
Läs merParsningens olika nivåer
Parsning Språkteknologi DH418 Ola Knutsson 008 Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)
Läs mer2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.
Ordklasser SUBSTANTIV 1. Substantiv kan delas in i följande grupper: egennamn (Nilsson, Kalle, Märsta, SAAB) växter (gräs, träd, buske) personer (häxa, flicka, svensk) djur (lejon, hund, spindel) föremål,
Läs merSvenska 1-2-3-4 GRAMMATIK
Svenska 1-2-3-4 GRAMMATIK This is a document containing all the grammar explanations and examples from the website www.svenska.digital ADJEKTIV A - Normal konstruktion: en X ett X + t många X + a den X
Läs merOrd och morfologi. Morfologi
Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Läs merSvenska 1-2-3-4 GRAMMATIK ÖVNINGAR OCH SVAR
Svenska 1-2-3-4 GRAMMATIK ÖVNINGAR OCH SVAR This is a document containing all the grammar exercises and answers from the website www.svenska.digital ADJEKTIV ÖVNINGAR: Alla mina (fin) saker Jag har många
Läs merFÖR ÅR 2 9 HILLERSTORPSSKOLAN KULLTORPSSKOLAN
Hillerstorp 2004-01-07 ARBETSPLAN I ENGELSKA FÖR ÅR 2 9 HILLERSTORPSSKOLAN KULLTORPSSKOLAN Arbetsplan i engelska år 2-9 Övergripande för alla år gäller: Att aktivt öva den muntliga förmågan. Progressiv
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merHuvudordklasser. ursinnig, god, glad äta, dricka, cykla. Övriga ordklasser. fort, borta, ute
Ordklasser Huvudordklasser NAMN substantiv adjektiv verb EXEMPEL misse, hus, mjölk ursinnig, god, glad äta, dricka, cykla Övriga ordklasser NAMN adverb pronomen räkneord prepositioner konjunktioner subjunktioner
Läs merOlika typer av satser
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Olika typer av satser Översikt i stolpform. Terminologin
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs mer1 Vilka ord är substantiv? Läs texten.
3 Ordklasser Ordklasser har du säkert hört talas om förut. Men varför finns det ordklasser? Hur ska man veta vilka ord som hör till vilken ordklass? Och varför ska man veta det? Tänk dig att du har alla
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Stavningskontroll - Granska
Läs merDjupstruktur och ytstruktur
Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs merÖversikt i stolpform. Terminologin följer i stort sett Gunlög Josefsson (2009), Svensk universitetsgrammatik för nybörjare, Lund: Studentlitteratur.
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2014 Ord och ordklasser Översikt i stolpform. Terminologin följer
Läs merLabb 2: Syntax och ordklasstaggning. Att arbeta med grammatiskt analyserade data
Labb 2: Syntax och ordklasstaggning Att arbeta med grammatiskt analyserade data Labb 2 Arbete med grammatiskt analyserad text Vilka ord finns i texten? Hur många ordtyper innehåller den? Hur ser fördelningen
Läs merTaggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001
Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger
Läs merSatslära introduktion
Satslära introduktion Dolores Meden Dolores Meden 2010-08-27 1 Skillnaden mellan ordklass och ett ords funktion (syntax): * ett ords tillhörighet i en ordklass är konstant och påverkas inte av användningen
Läs merSidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ?
Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs Magnus Merkel 2006-02-13 Greta Jansson är 96 år. Han växte upp på landsbygden när man hade
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ är konstruktioner (fraser) som innehåller ett predikat och ett subjekt (Josefssons, s. 151, definition, som är en vanlig definition).
Läs merOrdklasser och satsdelar
Ordklasser och satsdelar Vi kommer under de kommande fyra veckorna att arbeta med ordklasser och satsdelar. Under det här arbetsområdet kommer du att få öva på följande förmågor: formulera sig och kommunicera
Läs mer13. Tema Fritid 4 10 SFI gruppens fritid Övning 3, Modul 5 Fritid hobby Fritid idrott och spel Nöje och umgänge
1. Alfabetet, uttal 8 Alfabetet Övning 1 11, Modul 1 2. Enkla ord och meningar 28 3. Att hälsa och presentera sig 10 Hälsningsfraser och avskedsfraser Övning 1 12, Modul 1 4. Tema Mat 8 Mat Övning 1 6,
Läs merLingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2016) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Från form till betydelse pragmatik semantik analys generering syntax morfologi Skolans
Läs merFundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen).
Satsschema Huvudsats Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen). Naturliga fundament är: kända pronomen, pronominella adverb (då, där, här), bekanta substantiv, tidsadverb
Läs merSkriftspråk i förändring möter förlegade skrivstöd
Skriftspråk i förändring möter förlegade skrivstöd Ylva Hård af Segerstad Hasselgren, fil.dr i allmän språkvetenskap Sylvana Sofkova Hashemi, fil.dr i allmän språkvetenskap Skriftspråket spelar allt större
Läs merSpråkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:
Grammatikprov svenska Nu är det dags att kolla av vad eleverna lärt sig under vårens grammatik arbete. Efter påsklovet tar vi paus från veckans-ord och pluggar grammatik. För att det inte ska bli för mycket
Läs merStudiebrev 12. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.
Háskóli Íslands Svenska lektoratet Höstterminen Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is Studiebrev 12 Nu är det dags att börja repetera inför provet! I detta studiebrev kommer
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merHemtentamen HT13 Inlämning senast Lärare: Tora Hedin
Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara
Läs merSvenska utan gränser. Studentlitteratur. Louiza Lindbäck. - på sfi, universitet och företag UNIVERSITÄTSBIBLIOTHEK KIEL - ZENTRALBIBLIOTHEK -
Svenska utan gränser - på sfi, universitet och företag Louiza Lindbäck UNIVERSITÄTSBIBLIOTHEK KIEL - ZENTRALBIBLIOTHEK - Studentlitteratur Inledning 5 Förord 7 Innehåll 15 Sverigekarta 16 Alfabetet 17
Läs merANDREAS ISSA SVENSKA SPRÅKET
ANDREAS ISSA SVENSKA SPRÅKET Kopieringsförbud! Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden. Den som bryter mot lagen om upphovsrätt kan
Läs merAtt analysera andraspråkstexter
Handledare: Britta Herder Examinator: Sofia Ask G3 GO1183 15 hp 2011-01-30 G2 G3 Avancerad nivå Att analysera andraspråkstexter En undersökning av två analysmetoder: processbarhetsteorin och performansanalysen
Läs merAntal filmklipp. Sfi - steg
1. Alfabetet, uttal 8 Alfabetet Övning 1-11, Modul 1 2. Enkla ord och meningar 28 3. Att hälsa och presentera sig 10 Hälsningsfraser och avskedsfraser Övning 1-12, Modul 1 4. Tema Mat 8 Mat Övning 1-6,
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merAntal filmklipp. Sfi - steg
1. Alfabetet, uttal 8 Alfabetet Övning 1-11, Modul 1 2. Enkla ord och meningar 29 3. Att hälsa och presentera sig 10 Hälsningsfraser och avskedsfraser Övning 1-12, Modul 1 4. Tema Mat 8 Mat Övning 1-6,
Läs merDATORSTÖDD SPRÅKGRANSKNING OCH
Institutionen för lingvistik Stockholms Universitet VT-2000 DATORSTÖDD SPRÅKGRANSKNING OCH ANDRASPRÅKSINLÄRARE Lena Öhrman I denna uppsats undersöks vilka fel några andraspråksinlärare gör när de lär sig
Läs merGrim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Läs merORDKLASSERNA I SVENSKA SPRÅKET
ORDKLASSERNA I SVENSKA SPRÅKET SUBSTANTIV 1 Namn på saker, människor, djur, växter. Du kan sätta en, ett eller flera, den det eller de framför ordet. Konkreta substantiv: stol, bord, gubbe, boll (du kan
Läs merFörord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.
Förord Grammatikövningar för Sfi består av två delar, del 1 2, för kurserna B C resp C D och liknande utbildningar. Det är ett övningsmaterial som tränar svensk basgrammatik. Utgångspunkten för uppläggningen
Läs merSpråkgranskningsverktyg, vt 2009
, vt 2009 Föreläsning 8 Scania Checker evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kontrollerat språk Scania-svenska Scania Checker Demo 2 Kontrollerat språk Delmängd av naturligt språk Restriktioner
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordklasstaggning Marco Kuhlmann Institutionen för datavetenskap Ordklasstaggning Tagga varje ord i en sekvens av ord (oftast en mening) med dess korrekta
Läs merGrundläggande textanalys, VT2013
Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Ordklasstaggning (Sätta
Läs mergrammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Läs merSUBSTANTIV = namn på saker, personer, känslor
KONKRETA = de du ta på, ex: hus, Kalle ABSTRAKTA = de du inte kan ta på, ex: mod, sanning, kärlek SUBSTANTIV = namn på saker, personer, känslor EGENNAMN Ex: Linda, Sverige, Vättern, Sydsvenskan NUMERUS
Läs merPraktisk Svenska 2. Jag kan Skapa och använda olika minnesknep Studieteknik 1
Förmågor som eleverna ska utveckla i svenska Praktisk Svenska 1 Praktisk Svenska 2 Praktisk Svenska 3 Kunskapskrav i svenska Formulera sig och kommunicera i tal och skrift. Jag kan Formulera positiva tankar
Läs merGrundläggande syntaktiska funktioner och roller
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER/SATSDELAR Grundläggande syntaktiska funktioner och roller o Exemplen nedan kan få illustrera två grundläggande
Läs merTrädrepresentation. Parentesrepresentation
- 17 - BENGT SIGURD Inst för Fonetik och Lingvistik, LUNDS Universitet Helgonabacken 12, S-22362 LUND REFERENTGRAMMATIK - EN KORT PRESENTATION Satsdelsanalvs (funktionell analvs) I analys av meningar och
Läs merSärdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,
Läs mer