Parsning I. Disposition. Parsning användingsområden. Vad menas med parsning inom språkteknologin? Top-down parsning. Parsning som sökning
|
|
- Sandra Linnéa Lindberg
- för 8 år sedan
- Visningar:
Transkript
1 Parsning I Disposition Ola Knutsson knutsson@nada.kth.se Del 1: Traditionell parsning och parsningsteknik Del 2: Alternativa metoder och synsätt Språkteknologi 2D1418 HT 2001 Parsning användingsområden Maskinell syntaktisk analys av språk Mellansteg i många tillämpningar Semantisk analys "Maskinöversättning "Grammatikkontroll "Frågebesvarande system "Dialogsystem "Informationsextraktion "Textsummering SynSem Interpretation DB DB-interface Dialog Engine Semantic Generation Vad menas med parsning inom språkteknologin? Speech Recognition Speech Synthesis User Interaction Parsning som sökning Söka efter all de träd som utgår från startsymbolen, S, och som precis passar orden i indata. 1. Vi vet hur många löv trädet skall ha orden i meningen 2. Trädet skall ha en rot, S, Dessa två krav ger upphov till två sökstrategier: toppenner (vi utgår från roten) och botten-upp (vi utgår från löven. Top-down parsning Mål-driven (goal-directed) sökning Utgår från toppnoden "Top-down, depth-first "Top-down, breadth-first 1
2 Bottom-up parsning Data-driven sökning Utgår från strängen (data) Bottom-up, breadth-first Sökstrategier top-down, bottom-up depth-firsth, breadth-first left-right, right-left, kombinationer "västerländska språk parsas oftast LR Expectation driven (top-down) "man startar med en hypotes (t ex genom att försöka hitta S) Data-driven (bottom-up) "man utgår från data Inkrementell sökning "resultatet kan presenteras efterhand (bra för vissa applikaterioner t ex dialogsystem) Top-down, depth-first En grammatik som klarar fler satstyper S VP NP VP V NP S S 4 NP 5 VP 7 6 NP 8 V PN PN 9 VP V NP PN 1) S, 2) NP VP 3) PN VP S S S NP VP AUX NP NP VP S S S S S S Kalle gillar lisa 4) kalle VP 5) kalle V NP NP VP NP VP Aux NP VP Aux NP VP VP VP 6) kalle gillar NP 7) kalle gillar PN DT NN PN DT NN PN V NP V 8) kalle gillar lisa 9) $ Jämförelse av BU / TD Exempel Top-down (TD) strategier söker endast efter konstituenter som kan komma att ingå i topnoden TD söker efter konstruktioner som inte kommer att realiseras Bottom-up (BU) försöker expandera ambiugösa tolkningar av lexikala enheter book S NP VP S VP VP V VP V NP NP DET N N book V book DET V S VP NP DET NP N book "TD-strategin expanderar ej book som NP. 2
3 Top-down, breadth-first S NP VP VP V NP S 1 S 2 VP NP V PN VP NP 4 VP 5 V DT NP N V NP 8 PN PN 9 Kalle gillar lisa 1) S, 2) NP VP 3) PN VP 4) PN V NP 5) kalle V NP 6) kalle gillar PN 7) kalle gillar lisa 8) $ Bottom-up, breadth-first Vänster-rekursion 1 8 S 4 7 NP 5 VP 6 2 V NP 3 PN PN 9 S NP VP VP V NP VP V NP PN 1) kalle gillar lisa 2) PN gillar lisa 3) PN V lisa Parsern loopar vid toppen-ner, djupet-först, vänsterhöger parsning om grammatiken innehåller vänsterekursiva regler. En vänsterrekursiv regel innebär att en icke-terminal som kan skriva om till sig själv i sin vänstraste gren. NP NP PP Kalle gillar lisa 4) PN V PN 5) NP V PN 6) NP V NP 7) NP VP 8) S 9) $ Parsningen av DCG-regler loopar om: Skriv om reglerna A --> A, B. A --> B. B --> A, C. Vänsterrekursion NP --> NP KN NP NP --> DT NN Skriv om till: NP --> NPX KN NP NP --> NPX NPX --> DT NN Tyvärr får vi inte samma syntaxträd, byt parsningsalgoritm istället. 3
4 Flertydighet Autentiskt exempel Olika typer av flertydigheter: Flertydig lexikal kategori: Ordklasstaggning med disambiguering Strukturell flertydighet: vi får flera parseträd till en sats. Attachmentambiguiteten: PP-attachment Jag ser mannen med kikaren. Han äter pizza med gaffel. Jämför: Han äter pizza med ansjovis. Coordination: Jämför: Hunden eller katten äter fisken och köttet. Hunden äter köttet och katten äter fisken. Ett förhållande som stark försvårar personvalet till riksdagen för kandidater som är bosatta inom en valkrets är när partier, utöver en lista som upptar deras namn, går fram med ytterligare en lista med samma namn i samtliga valkretsar i riket. Två relativsatser Multipla prepositionsfraser Beroende över långt avstånd? Vilka kongruerar: Ett förhållande med bosatta? Kandidater med bosatta? Ineffektiv parsning av delträd Toppen-ner parsern bygger upp giltiga träd för delar av indata som sedan förkastas, för att sedan byggs upp igen när parsern försöker bygga upp ett nytt träd En lista med samma namn i samtliga valkretsar i riket Fras: Antal analyser: En lista 4 med samma namn 3 i samtliga valkretsar 2 i riket 1 En lista med samma namn 3 En lista med samma namn i samtliga valkretsar 2 En lista med samma namn i samtliga valkretsar i riket 1 Earlyparsning (Early 1970) Dynamisk programmering, i det här fallet att spara undan delträd när de påträffas, för senare användning. Delträden läggs i en s.k. chart Använder look-up istället för att parsa igen "Look-up är mindre komplext än parsning "Early-parsern använder en Chart, en lista med N+1 ingångar "Alla ord i meningen motsvarar en position i charten där de partiella träd som byggts upp hittills lagras "När strängen genomlöpts innhåller charten en kompakt represenation av alla möjliga analyser av indata "Varje ingång i charten har tre typer av information: &delträd &hur långt man kommit i trädet &position i charten V VP NP DT N S Tre exempeltillstånd Tre operatorer S. VP, [0,0] En toppen-ner prediktion för ett speciellt S Konstituenten skall börja i startposition av indata (första 0), andra 0 anger dottens placering NP Det. Nominal, [1,2] En NP börjar i position 1, en Det har parsats, och att en Nominal står i tur. VP V NP., [0,3] Det finns ett träd VP som spänner över hela indata Prediktor: att skapa nya tillstånd som representerar toppen-ner förväntningar som genereras under parsningsprocessen. Prediktorn tillämpas på varje tillstånd som har en icke-terminal till höger om dotten som inte är en ordklasskategori. Skanner: När ett tillstånd har en ordklasskategori till höger om dotten, används skannern för att granska indata om det finns något ord med denna förutsagda ordklasskategori. Här löses en hel del flertydighet upp. 4
5 funktioner Kompletterare: När ett tillstånd når slutet till höger i en regel backar komplementeraren tillbaka och fyller i kedjan av delanalyser. När t.ex. tillståndet NP DT NN. [1,3] letar komp. Efter tillstånd som slutar på 1, t.ex. VP VB. NP, [0,1]. Detta resulterar i sin tur i ett nytt komplett tillstånd VP VB NP., [0,3]. Initiering: "lägg startsymbol till charten: S. 0, 0 Prediktion "tillstånd som har formen A α. B β, [i, j] lägg till alla regler B γ till charten Skanning "tillstånd på formen A α. B β, [i, j] och symbolen i position j är en delmängd av ordklasserna i B lägg till B ord[j], [j, j+1] till charten[j + 1] Komplettering "tillstånd på formen B γ., [j, k] &för alla tillstånd på formen A α. B β, [i, j] i chart[j] &lägg till A αb. β, [i, k] till chart[k] Example (s. 384) V VP NP delträd hur långt (punkt) VP V NP. 0, 3 Chart[0] "γ. S [0, 0] P "NP. Det Nominal [0,0] P "NP. PN [0,0] P "S. Aux NP VP [0,0] P "S. VP [0,0] P "VP. Verb [0,0] P "VP. Verb NP [0,0] P Chart[1] "Verb book. [0,1] s "VP Verb. [0,1] c "S VP. [0,1] c "VP Verb. NP [0,1] c "NP. Det Nominal [1,1] p "NP. Proper-Noun [1,1] p 0, 3 position Chart[2] "Det. [1,2] s "NP Det.Nominal [1,2] c "Nominal Noun. [2,2] p "Nominal Noun. Nominal [2,2] p Chart[3] "Noun. [2,3] s "Nominal Noun. [2,3] c "Nominal Noun. Nominal [2,3] c "NP Det Nominal. [0,3] c "VP Verb NP. [0,3] c "S VP. [0,3] c "Nominal Noun. [3,3] p "Nominal Noun. N [3,3] p S VP VP V NP S Aux NP NP γ. S NP DT N NP PN VP Verb NP VP Verb S VP Chart[0] "γ. S [0, 0] P "NP. DT N [0,0] P "NP. PN [0,0] P "S. Aux NP VP [0,0] P "S. VP [0,0] P "VP. Verb [0,0] P "VP. Verb NP [0,0] P NP DET NP 5
6 Verb book VP Verb Chart[1] "Verb book. [0,1] s "VP Verb. [0,1] c "S VP. [0,1] c "VP Verb. NP [0,1] c "NP. DT N [1,1] p "NP. PN [1,1] p Chart[2] "Det. [1,2] s "NP Det.N [1,2] c "N Noun. [2,2] p "N Noun. N [2,2] p S VP VP Verb NP NP DT N NP Det N NP DT N NP PN DT NP PN Chart[3] "Noun. [2,3] s "N Noun. [2,3] c "N Noun. N [2,3] c "NP Det N. [0,3] c "VP Verb NP. [0,3] c "S VP. [0,3] c "N. Noun [3,3] p "N. Noun N [3,3] p S VP N Noun N Early-Parsning med särdrag Utöka chartparsern till att innehålla DAG:er När kompletteringen görs unifieras DAG(A) och DAG(B) Komplettering "tillstånd på formen B γ., [j, k], dag(b) &för alla tillstånd på formen A α. B β, [i, j], dag(a) i chart[j] &lägg till A αb. β, [i, k] till chart[k] &omm unif(dag(a), dag(b)) fail VP Verb NP NP Det N N Noun Noun N Noun N Noun N Chart[2] "Det. [1,2] s "NP Det.N [1,2] c "N Noun. [2,2] p "N Noun. N [2,2] p Parsningssystem för svenska SLE- Swedish Language Engine Uppsala Chart Parser (UCP) cat: NP cat : DT agr: number:sing unif( agr : def:def ) person:third NP Det N DT NP DT N NP PN cat : NP agr : number:sing person :third def:def 6
7 Del II Finite-state parsning Parsning av ogrammatisk indata Problem med fullständig parsning Flertydigheten gör att vi får många syntaxträd Hur skall man välja ut det bästa trädet? Många meningar får ingen analys alls? Det tar för mycket tid och resurser? Behöver vi en fullständig syntaktisk analys? Robust parsning Val: teoretisk korrekthet eller effektiv tillämpbarhet? En robust parser skall ge en korrekt eller användbar analys av 90 % av meningar (Briscoe). Åtminstone följande tre problem måste lösas: 1. Chunking, vad är en mening,? 2. Disambiguation, att välja rätt analys blanda alla syntaktiskt möjliga 3. Undergeneration, eller att hantera fall som ligger utanför systemets lexikala och syntaktiska täckning. Finite-state parsing I Många språksystem behöver inte fullständig syntaktisk analys. Partiell parsning räcker ofta ganska långt ((partial shallow light) parsing) Några vanliga tillämpningsområden är informationsextrahering och även grammatikkontroll (mer senare). Informationsextrahering behöver ta fram begränsat med information för att fylla i olika typer av informationsmallar, t.ex. företagsnamn, personer och tid och plats, kanske också vem som gjorde vad mot vem. PG Gyll P G Gyllenhammar lämnar sin post som VD för Volvo. Ny VD blir Sören Gyll. Position: VD Company: Volvo In-Person: Sören Gyll Out-Person: P G Gyllenhammar 7
8 Finite-state parsning II Kaskader av regler istället för frasstrukturregler. Många regler i följd opererar på ett förändligt data. En ren och tydlig semantik samtidigt som det fungerar som ett högnivå språk för att manipulera strängar, språk och relationer. Finite-state parsning III Nomengrupper: en glad gäst, en hund, han, hunden NG --> PN (DT) (JJ) NN Verbgrupper: har spelat, att spela VG --> VB AUX VB IE VB Prepositioner: till, från, av, P --> PP Npcomp --> NN och NN PPH --> PP NP Rekursion? Om man kan skriva rekursiva regler i ett språk är det inte reguljärt. Ett utökat reguljärt språk kan ha mekanismer för rekursion Rekursion? begränsad form av rekursion används Gör skillnad mellan VL och HL Se icke-terminaler i högerledet som subrutiner. Finite-state transducers, Xerox Karttunen, Chanod, Grefenstette & Schiller (1996) Regular Expressions for Natural Language Engineering Välkänt och beprövat för morfologisk analys och generering Ganska enkla operatorer kan användas till sådant som skulle vara komplicerat att uttrycka i andra språk/formalismer: restriction: A => B _ C replacement: A -> B longest longest match replacement: B C A B Union A B konkaternering (A) Optionellt A; union med tomma strängen A+ Iteration; en eller flera konkaterneringar av A A* Kleene star; (A+) Kaskader av regler ~A komplementet(negation) A & B Snittet, skärning A B Subtraktion Indata: glada+jj define AP [Ord JJ] define NG = [[PN] [ (DT) ([AP]+) NN] [PS ([AP]+) NN]] regexp [NG NG] ] Utdata: [NG de+dt glada+jj studenterna+nn NG] 8
9 Indata: [NG de+dt glada+jj studenterna+nn NG] define HuvudN [NN => _NG] regexp HuvudN HuvudN Utdata: [NG de+dt glada+jj [HuvudN[studenterna+NN]HuvudN] NG] Tillämpningar av finite-state parsning Inforamtionsextrahering Grammatikontroll Ordklasstaggning Generell analys av fraser, huvuden och syntaktiska funktioner Finite-state parsning för grammatikkontroll Cooper & Sofkova 1998 % Den grova regeln (Broad grammar) define NP [dt jj* nn]; % de finare reglerna define Npdef[dt_def jj_def* nn_def]; define Npind[dt_ind jj_ind* nn_ind]; % Den felaktiga frasen skall finnas i NP men inte i Npdef eller Npind: NP [Npdef Npind]; Parsning av ogrammatisk input Det klassiska chomskianska: skilja mellan grammatisk meningar och ogrammatiska meningar. Syntaktiskt ogrammatiska satser kan vara semantiskt korrekta: Gröt är gott. Semantiken är starkare än syntaxen. Svenskatalare kan med sin språkkänsla avgöra att gröt är god är ogrammatiskt. Gröt är god är en syntaktisk kongruens, liksom Mannen är glad. Den semantisk kongruensen är Gröt är gott. Transduktiv lingvistik (Ramer, Transducer en automat med in- och utdata, jmf. Acceptor som tar indata och svara ja/nej. En grammatik som tilldelar alla tänkbara strängar olika typer av struktruell analys. Grammatisk/ogrammatisk mindre viktig Martin Ingvar sov två personer ogrammatisk tolkning, en person alldeles korrekt. Mänskliga lingvistiska bedömningar bygger på vilka möjliga analyser som finns för handen. Att en sträng är ogrammatisk innebär endast att vi ännu inte funnit något rimlig analys. Men för eller senare kommer en sådan tolkning att föreslå sig själv Transduktiv lingvistik 2 En transducer kan ha flera databand: Ett eller flera band för syntax (flera tolkningar) Ett eller flera band för semantik Ett band för översättningar till andra språk osv. Om nu grammatikalitet är en fråga om grad, så kan tala om grad av kompletthet 9
10 PEG (Jensen) Alla men inte enbart grammatiska satser Det är mycket svårt att dra en knivskarp gräns mellan grammatiskt och ogrammatiskt. Den språkliga kreativiteten är omfattande och skapar satser som är ogrammatiska idag men grammatiska imorgon. Språket förändras över tiden och så måste också systemen Inom språkteknologin är ogrammatiska satser vardagsmat och måste hanteras. Skrivet i PLNLP, ett Augmented Phrase Structure Language PEG (The PLNLP English Grammar: domänen är alla vanliga meningar i modern engelska. Begränsad lexikal information: morfosyntaktisk information, viss subkatergorisering PEG försöker tilldela varje sträng en någorlunda vettig analys. Eftersom semantisk analys saknas, skall PEG:s analys ses som en approximerad parsning. Istället för att producera en stor mängd analyser, tvingar PEG attachments att hänga på närmaste konstituent. PEG skall analysera tillräckligt många meningar så att det går att lösa den aktuella uppgiften. Man bör komma ihåg att inte ens människor förstår allt som sägs på modersmålet (men vi kan kommunicera ) Parsning i PLNLP Parsning i PLNLP 3 Tre typer av regler: PLNLP-regler som försöker defininera precis de centrala grammatiska strukturer som engelsktalare är överens om. DECL ---- NP NOUN* ---- Beauty ---- VERB* ---- is ---- NP NOUN* ---- truth ---- PUNC Regler som tar hand om flertydig utdata, det finns en metrik för hur analyser skall rangordnas. 3. Regler som hanterar när parsningen misslyckas, regler som försöker göra ett slags rimlig analys, s.k. Parse fitting. DECL påståendesats - Huvudet på den nivån i trädet. Påminner en del om dependency grammar med huvuden och modifierare Parse fitting Hur byggdes PEG? PEG utvecklades på empiriska grunder, från data. Grammatiken modellerades inte från given lingvistisk teori, utan formades av de fenomen som dök upp i korpusen. Naturligtvis finns det någon sorts teori i bakgrunden i all grammatikutveckling, och i PEG:s fall var det en allmänt accepterad form av konstituent analys. Korpusen innehöll affärbrev, datamanualer, studentuppsatser, och många andra källor 1983: 70 % får en entydig analys ytterligare 16 % får en flertydig analys Parse fitting när man inte kan få ihop ett S. Leta upp en huvudkonstituent: a) VP med tempus och subjekt b) VP utan tempus, men med subjekt c) Fras utan verb, t.ex. NP, PP d) Icke-finita VP e) Andra Om man hittar flera i samma kategori, väljs den längsta. Proceduren är klar om en huvudkonstituent täcker hela meningen. Om inte så läggs övriga konstituenter till på varje sida om huvudkonstituenten. 10
11 En skräckvärld av skiljetecken Snabbkommandon: Ctrl+N Nytt dokument (en ny text), Ctrl+O Öppna dokument (en gammal text), Ctrl+S Spara dokument (spara gammal/ny text), Ctrl+P Skriv ut dokument (skriver ut texten). Vad vinner man med parse fitting? 1. Man kan processa en mening för språkkontroll. 2. Utdata fungerar för någon slags semantisk analys. 3. Det är bra för att spåra problem i grammatiken. Prose fixing Om ett ord är okänt tilldelas något förvalt värde, t.ex. att ord med initial versal är namn. Detta räcker i många fall för en rimlig analys. Om kraven i grammatiken är för stränga, lättas dessa upp, s.k. relaxering. Kan t.ex. innebära att man inte bryr sig om kongruens. Om systemet trots allt inte lyckas beror detta på svagheter i den konstruerade grammatiken eller att systemet stött på ett oförutsägbart grammatiskt fel. Då används parse fitting. Rankning av analyser Antal analyser juni 1981 Dec % 36 % 1 31 % 41 % 2 6 % 11 % >2 6 % 12 % Metriken: K Score = ( Score +1) Mod Mod Mods Testmängd: 2300 meningar, upp till 63 ord, i genomsnitt 19 ord/mening Källa: Heidorn (1993) När grammatiken byggs ut får vi fler analyser och större flertydighet Det behövs en metrik för att välja bland analyserna. Lägst poäng är bäst Poängen för en fras är lika med summan av poängen hos de modifierande fraserna, poängen för varje modifierare ökas med 1 och multiplicerad med en konstant för typen av modifierare. En fras utan modifierare får 0 poäng. Metriken bygger på en flat vy på syntaktisk struktur. Varje fras har ett huvud och noll eller flera framförställda/efterställda attribut (modifierare) Två alternativa analyser med poäng Sammanfattning av föreläsningen SENT(0.23) SENT(0.122) ----VB* See ----NP(0.1) ----DT the ----NN man -----PP(0.2) ----PREP with ----DT the ----NN telescope ----VB* See ----NP(0.22) ----DT the ----NN man -----PP(0.2) ----PREP with ----DT the ---NN telescope Parsning och partiell parsning är viktiga grundidéer. Parsning kan ses som ett sökproblem Två vanliga sökstrategier: toppen-ner och botten-upp Flertydighet, vänsterrekursion och onödig analys av delträd är problem som måste hanteras. Vanliga problem är PP-attachment, koordinering och NPflertydighet PP = 0.1(0+1)+0.1(0+1)=0.2 PREP=0, DT=0 NP(2:a trädet)= 0.1(0+1)+0.1(0.2+1) 11
12 sammanfattning Dynamisk programmering används för att effektivisera parsning Ganska många tillämpningar kan använda sig av partiell parsning. Finite-state parsning är en bra och effektiv metod för detta. Alla system måste i någon mån hantera ogrammatisk indata och oförutsägbar indata. 12
Parsningens olika nivåer
Parsning Språkteknologi DH418 Ola Knutsson 008 Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)
Parsningens olika nivåer
Parsning Språkteknologi DH418 Ola Knutsson Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)
Syntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer
Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders
Partiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Tekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Tekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion
Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Grammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Frasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Automatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA
Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord
Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,
Datorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,
Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Innehåll Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Olika frastyper och regler för dessa Dependensgrammatik Olika
Fraser, huvuden och bestämningar
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin
Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?
Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning. Granska Att skriva regler i Granska.
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)
Språkets struktur och funktion, 7,5 hp
Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag
Djupstruktur och ytstruktur
Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)
Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)
Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den
2. Utgångspunkter och angreppssätt för automatisk språkgranskning
Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet
Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax?
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Innehåll Olika frastyper och regler för dessa Dependensgrammatik Olika
Matematik för språkteknologer
1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan
Teoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin
Datorlingvistisk grammatik OH-serie 1: introduktion http://stp.lingfil.uu.se/~matsd/uv/uv09/dlg/ LEKTION 1: innehåll Kursformalia Grammatik formell grammatik. Metod och data (lite). Språkteknologisk relevans.
FL 6: Definite Clause Grammars (kap. 7)
FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor
Övning 5 - Tillämpad datalogi 2013
/afs/nada.kth.se/home/w/u1yxbcfw/teaching/13dd1320/exercise5/exercise5.py October 1, 2013 1 0 # coding : latin Övning 5 - Tillämpad datalogi 2013 Automater, reguljära uttryck, syntax Sammanfattning Idag
Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?
Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar
Föreläsning 7: Syntaxanalys
DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.
Grammatisk teori III Praktisk analys
Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas
Reguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm
Syntaxanalys Douglas Wikström KTH Stockholm popup-help@csc.kth.se Reguljära uttryck Reguljära uttryck förutsätter att en mängd bokstäver är givna, ett så kallat alfabet, som oftast betecknas med Σ. Uttryck
Grammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår
Grammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Språkgranskningsverktyg, vt 2008
, vt 2008 Föreläsning 7 Chartparsning i allmänhet och UCP i synnerhet evapet@stp.lingfil.uu.se 1 Djupstruktur och ytstruktur Jag läste en bok igår Igår läste jag en bok 2 Chartparsning - bakgrund Utvecklades
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Språkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
UPPSALA UNIVERSITET Institution för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf HT 2015 (korrigerad 151126) Depdsgrammatik Dna introduktion till depdsgrammatik försöker följa d standard
DD1361 Programmeringsparadigm. Carina Edlund
DD1361 Programmeringsparadigm Carina Edlund carina@nada.kth.se Funktionell programmering Grundidéen med funktionell programmering är att härma matematiken och dess funktionsbegrepp. Matematiskt funktionsbegrepp
Lösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
DAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Tentamen Del A. Marco Kuhlmann
TDDD01 Språkteknologi (2016) Tentamen 2016-03-16 Marco Kuhlmann Tentamen består två delar, A och B. Varje del omfattar ett antal frågor à 3 poäng. Del A omfattar 8 frågor som kan besvaras kortfattat. Det
Lingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap
ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Först några definitioner: Alfabet = en ändlig mängd av tecken. Ex. {0, 1}, {a,b}, {a, b,..., ö} Betecknas ofta med symbolen Σ Sträng =
Introduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
TDDC74 Programmering: Abstraktion och modellering Datortenta , kl 14-18
TDDC74 Programmering: Abstraktion och modellering Datortenta - 017-10-7, kl 14-18 Läs alla frågorna först och bestäm dig för i vilken ordning du vill lösa uppgifterna. Uppgifterna är inte nödvändigtvis
Lingvistiskt uppmärkt text
729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform
Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Statistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Grammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
MÖSG ht 2005 Maskinöversättningssystemet MATS
MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?
Datorlingvistisk grammatik
Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys
Språkgranskningsverktyg. Grammatikkontroll med Scarrie
Språkgranskningsverktyg Grammatikkontroll med Scarrie Strategi för grammatikkontroll Vision Fullständig parsning enligt en heltäckande grammatik som skiljer ut avvikande konstruktioner och diagnosticerar
TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Inlämningsuppgift MiniPlotter
LUNDS TEKNISKA HÖGSKOLA Institutionen för datavetenskap EDAA01 Programmeringsteknik fördjupningskurs Inlämningsuppgift MiniPlotter I den här uppgiften ska ett program som ritar grafer av matematiska funktioner
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Inlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Kompilatorer och interpretatorer
1 of 6 Örebro universitet Institutionen för teknik Thomas Padron-McCarthy (Thomas.Padron-McCarthy@oru.se) Tentamen i Kompilatorer och interpretatorer för Dataingenjörsprogrammet m fl lördag 7 november
DD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 3 Per Austrin 2015-11-13 Huvudkoncept hittils: Snabb repetition Formellt språk en mängd strängar Reguljära språk den klass av formella
Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014
Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng
Föreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk
Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Svårigheter med kurslitteraturen
Svårigheter med kurslitteraturen Forskningsanknuten kurs Litteraturen är skriven i syfte att presentera forskningsresultat och ofta argumentera för vissa lösningar; undantag: uppfriskningslitteraturen
DD1361 Programmeringsparadigm HT15
DD1361 Programmeringsparadigm HT15 Logikprogrammering 3 Dilian Gurov, TCS Idag Induktiva datatyper: Träd (inte inbyggd) Binära träd utan data Binära träd med data Prolog-specifika konstruktioner Negation,
Grundläggande datalogi - Övning 9
Grundläggande datalogi - Övning 9 Björn Terelius January 30, 2009 Ett formellt språk är en (oftast oändlig) mängd strängar. Språket definieras av en syntax som är en samling regler för hur man får bilda
Datum: Date: Provkodr: KTR1 Exam code:
Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. (1) Tidigt i gryningen påbörjade han sin (2) förvandling. Han hade (3) noga planerat allting för att (4) ingenting (5) skulle kunna
Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,
Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står
Cristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
FTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
TENTAMEN I PROGRAMSPRÅK -- DVG C kl. 08:15-13:15
TENTAMEN I PROGRAMSPRÅK -- DVG C01 140605 kl. 08:15-13:15 Ansvarig Lärare: Donald F. Ross Hjälpmedel: Bilaga A: BNF-definition Betygsgräns: Kurs: Max 60p, Med beröm godkänd 50p, Icke utan beröm godkänd
Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Datorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade
Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Word- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Korpuslingvistik vt 2007
Korpuslingvistik vt 2007 Metoder för annotering II och utvärdering Beata B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk
Parsning i Granska. Föreläsningens innehåll. Granskas uppbyggnad. Inspiration och förebilder. Regelmatchning/parsning. Granskas regelspråk
Parsning i Granska Ola Knutsson Språkteknologikursen ht 2001 Föreläsningens innehåll Inspiration och förebilder Målsättningar, designval Granskas regelsyntax Regler och tillämpningar Inspiration och förebilder
Programmering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater
Programmering för språkteknologer II OH-serie: ändliga automater reguljära uttryck i Java Mats Dahllöf Ändliga automater Abstrakt maskin, tillståndsmaskin, transitionssystem. (Den enklaste typ man brukar
1 Inledning. 1.1 Programförklaring. 1.2 Innehållet. 1.3 Beteckningskonventioner - 1 -
- 1-1 Inledning 1.1 Programförklaring Detta kompendium är utvecklat för en introduktionskurs i datalingvistik som vänder sig till studenter med tidigare kännedom om grundläggande lingvistik och datavetenskap.
Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin
Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara
Lingvistik V Satsdelar, huvud- och bisatser. 729G49 23 april
Lingvistik V Satsdelar, huvud- och bisatser 729G49 23 april Form och funktion Primära satsdelar Satser Form och funktion Formklassifikationen berori huvudsakpå konstituenternas interna strukturella egenskaper
Tommy Färnqvist, IDA, Linköpings universitet. 2 Strukturer 2 2.1 Domäner... 2 2.2 Tolkningar... 3
Föreläsning 2 Semantik 729G06 Logikdelen Föreläsningsanteckningar i Programmering och logik 27 januari 2014 Tommy Färnqvist, IDA, Linköpings universitet 2.1 Innehåll Innehåll 1 Lite mer syntax 1 2 Strukturer
MÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP
MÄLARDALENS HÖGSKOLA CD5560 Formella språk, automater och beräkningsteori Användarmanual för simulatorn JFLAP Innehållsförteckning Att komma igång med JFLAP... 3 Att köra en sträng... 5 Att köra flera
Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax
Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer
Grammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Ordförråd och Ordbildning
Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande
Föreläsninsanteckningar till föreläsning 3: Entropi
Föreläsninsanteckningar till föreläsning 3: Entropi Johan Håstad, transkriberat av Pehr Söderman 2006-01-20 1 Entropi Entropi är, inom kryptografin, ett mått på informationsinnehållet i en slumpvariabel.
RoboLinguistics. Ett textförståelseprogram. Henrik Palmér, d01hp
RoboLinguistics Ett textförståelseprogram Henrik Palmér, d01hp Inledning För att styra robotar räcker det inte att som i science-fictionfilmer bara säga till dem vad de ska göra. De största kraftansträngningarna
Kritisk granskning. Innehåll - Teori
Hur göra artikelkritik Gemensam diskussion om artikel Litteraturtips Datalingvistisk metod- och fördjupningskurs höstterminen 2006 Kritisk granskning presentera innehåll neutralt koncentrera dig på en
HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng
Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är
Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap
Parsning TDP007 Konstruktion av datorspråk Föreläsning 6 Peter Dalenius Institutionen för datavetenskap 2017-02-14 2 Analys av källkod Lexikalisk analys Bildar tokensutifrån källkodens text. Syntaktisk
Föreläsning 6: Induktion
Föreläsning 6: Induktion Induktion är en speciell inferensregel. En mängd är välordnad om varje delmängd har ett minsta element Exempel: N är välordnad (under ) Låt P(x) vara ett predikat över en välordnad