Parsning I. Disposition. Parsning användingsområden. Vad menas med parsning inom språkteknologin? Top-down parsning. Parsning som sökning

Storlek: px
Starta visningen från sidan:

Download "Parsning I. Disposition. Parsning användingsområden. Vad menas med parsning inom språkteknologin? Top-down parsning. Parsning som sökning"

Transkript

1 Parsning I Disposition Ola Knutsson knutsson@nada.kth.se Del 1: Traditionell parsning och parsningsteknik Del 2: Alternativa metoder och synsätt Språkteknologi 2D1418 HT 2001 Parsning användingsområden Maskinell syntaktisk analys av språk Mellansteg i många tillämpningar Semantisk analys "Maskinöversättning "Grammatikkontroll "Frågebesvarande system "Dialogsystem "Informationsextraktion "Textsummering SynSem Interpretation DB DB-interface Dialog Engine Semantic Generation Vad menas med parsning inom språkteknologin? Speech Recognition Speech Synthesis User Interaction Parsning som sökning Söka efter all de träd som utgår från startsymbolen, S, och som precis passar orden i indata. 1. Vi vet hur många löv trädet skall ha orden i meningen 2. Trädet skall ha en rot, S, Dessa två krav ger upphov till två sökstrategier: toppenner (vi utgår från roten) och botten-upp (vi utgår från löven. Top-down parsning Mål-driven (goal-directed) sökning Utgår från toppnoden "Top-down, depth-first "Top-down, breadth-first 1

2 Bottom-up parsning Data-driven sökning Utgår från strängen (data) Bottom-up, breadth-first Sökstrategier top-down, bottom-up depth-firsth, breadth-first left-right, right-left, kombinationer "västerländska språk parsas oftast LR Expectation driven (top-down) "man startar med en hypotes (t ex genom att försöka hitta S) Data-driven (bottom-up) "man utgår från data Inkrementell sökning "resultatet kan presenteras efterhand (bra för vissa applikaterioner t ex dialogsystem) Top-down, depth-first En grammatik som klarar fler satstyper S VP NP VP V NP S S 4 NP 5 VP 7 6 NP 8 V PN PN 9 VP V NP PN 1) S, 2) NP VP 3) PN VP S S S NP VP AUX NP NP VP S S S S S S Kalle gillar lisa 4) kalle VP 5) kalle V NP NP VP NP VP Aux NP VP Aux NP VP VP VP 6) kalle gillar NP 7) kalle gillar PN DT NN PN DT NN PN V NP V 8) kalle gillar lisa 9) $ Jämförelse av BU / TD Exempel Top-down (TD) strategier söker endast efter konstituenter som kan komma att ingå i topnoden TD söker efter konstruktioner som inte kommer att realiseras Bottom-up (BU) försöker expandera ambiugösa tolkningar av lexikala enheter book S NP VP S VP VP V VP V NP NP DET N N book V book DET V S VP NP DET NP N book "TD-strategin expanderar ej book som NP. 2

3 Top-down, breadth-first S NP VP VP V NP S 1 S 2 VP NP V PN VP NP 4 VP 5 V DT NP N V NP 8 PN PN 9 Kalle gillar lisa 1) S, 2) NP VP 3) PN VP 4) PN V NP 5) kalle V NP 6) kalle gillar PN 7) kalle gillar lisa 8) $ Bottom-up, breadth-first Vänster-rekursion 1 8 S 4 7 NP 5 VP 6 2 V NP 3 PN PN 9 S NP VP VP V NP VP V NP PN 1) kalle gillar lisa 2) PN gillar lisa 3) PN V lisa Parsern loopar vid toppen-ner, djupet-först, vänsterhöger parsning om grammatiken innehåller vänsterekursiva regler. En vänsterrekursiv regel innebär att en icke-terminal som kan skriva om till sig själv i sin vänstraste gren. NP NP PP Kalle gillar lisa 4) PN V PN 5) NP V PN 6) NP V NP 7) NP VP 8) S 9) $ Parsningen av DCG-regler loopar om: Skriv om reglerna A --> A, B. A --> B. B --> A, C. Vänsterrekursion NP --> NP KN NP NP --> DT NN Skriv om till: NP --> NPX KN NP NP --> NPX NPX --> DT NN Tyvärr får vi inte samma syntaxträd, byt parsningsalgoritm istället. 3

4 Flertydighet Autentiskt exempel Olika typer av flertydigheter: Flertydig lexikal kategori: Ordklasstaggning med disambiguering Strukturell flertydighet: vi får flera parseträd till en sats. Attachmentambiguiteten: PP-attachment Jag ser mannen med kikaren. Han äter pizza med gaffel. Jämför: Han äter pizza med ansjovis. Coordination: Jämför: Hunden eller katten äter fisken och köttet. Hunden äter köttet och katten äter fisken. Ett förhållande som stark försvårar personvalet till riksdagen för kandidater som är bosatta inom en valkrets är när partier, utöver en lista som upptar deras namn, går fram med ytterligare en lista med samma namn i samtliga valkretsar i riket. Två relativsatser Multipla prepositionsfraser Beroende över långt avstånd? Vilka kongruerar: Ett förhållande med bosatta? Kandidater med bosatta? Ineffektiv parsning av delträd Toppen-ner parsern bygger upp giltiga träd för delar av indata som sedan förkastas, för att sedan byggs upp igen när parsern försöker bygga upp ett nytt träd En lista med samma namn i samtliga valkretsar i riket Fras: Antal analyser: En lista 4 med samma namn 3 i samtliga valkretsar 2 i riket 1 En lista med samma namn 3 En lista med samma namn i samtliga valkretsar 2 En lista med samma namn i samtliga valkretsar i riket 1 Earlyparsning (Early 1970) Dynamisk programmering, i det här fallet att spara undan delträd när de påträffas, för senare användning. Delträden läggs i en s.k. chart Använder look-up istället för att parsa igen "Look-up är mindre komplext än parsning "Early-parsern använder en Chart, en lista med N+1 ingångar "Alla ord i meningen motsvarar en position i charten där de partiella träd som byggts upp hittills lagras "När strängen genomlöpts innhåller charten en kompakt represenation av alla möjliga analyser av indata "Varje ingång i charten har tre typer av information: &delträd &hur långt man kommit i trädet &position i charten V VP NP DT N S Tre exempeltillstånd Tre operatorer S. VP, [0,0] En toppen-ner prediktion för ett speciellt S Konstituenten skall börja i startposition av indata (första 0), andra 0 anger dottens placering NP Det. Nominal, [1,2] En NP börjar i position 1, en Det har parsats, och att en Nominal står i tur. VP V NP., [0,3] Det finns ett träd VP som spänner över hela indata Prediktor: att skapa nya tillstånd som representerar toppen-ner förväntningar som genereras under parsningsprocessen. Prediktorn tillämpas på varje tillstånd som har en icke-terminal till höger om dotten som inte är en ordklasskategori. Skanner: När ett tillstånd har en ordklasskategori till höger om dotten, används skannern för att granska indata om det finns något ord med denna förutsagda ordklasskategori. Här löses en hel del flertydighet upp. 4

5 funktioner Kompletterare: När ett tillstånd når slutet till höger i en regel backar komplementeraren tillbaka och fyller i kedjan av delanalyser. När t.ex. tillståndet NP DT NN. [1,3] letar komp. Efter tillstånd som slutar på 1, t.ex. VP VB. NP, [0,1]. Detta resulterar i sin tur i ett nytt komplett tillstånd VP VB NP., [0,3]. Initiering: "lägg startsymbol till charten: S. 0, 0 Prediktion "tillstånd som har formen A α. B β, [i, j] lägg till alla regler B γ till charten Skanning "tillstånd på formen A α. B β, [i, j] och symbolen i position j är en delmängd av ordklasserna i B lägg till B ord[j], [j, j+1] till charten[j + 1] Komplettering "tillstånd på formen B γ., [j, k] &för alla tillstånd på formen A α. B β, [i, j] i chart[j] &lägg till A αb. β, [i, k] till chart[k] Example (s. 384) V VP NP delträd hur långt (punkt) VP V NP. 0, 3 Chart[0] "γ. S [0, 0] P "NP. Det Nominal [0,0] P "NP. PN [0,0] P "S. Aux NP VP [0,0] P "S. VP [0,0] P "VP. Verb [0,0] P "VP. Verb NP [0,0] P Chart[1] "Verb book. [0,1] s "VP Verb. [0,1] c "S VP. [0,1] c "VP Verb. NP [0,1] c "NP. Det Nominal [1,1] p "NP. Proper-Noun [1,1] p 0, 3 position Chart[2] "Det. [1,2] s "NP Det.Nominal [1,2] c "Nominal Noun. [2,2] p "Nominal Noun. Nominal [2,2] p Chart[3] "Noun. [2,3] s "Nominal Noun. [2,3] c "Nominal Noun. Nominal [2,3] c "NP Det Nominal. [0,3] c "VP Verb NP. [0,3] c "S VP. [0,3] c "Nominal Noun. [3,3] p "Nominal Noun. N [3,3] p S VP VP V NP S Aux NP NP γ. S NP DT N NP PN VP Verb NP VP Verb S VP Chart[0] "γ. S [0, 0] P "NP. DT N [0,0] P "NP. PN [0,0] P "S. Aux NP VP [0,0] P "S. VP [0,0] P "VP. Verb [0,0] P "VP. Verb NP [0,0] P NP DET NP 5

6 Verb book VP Verb Chart[1] "Verb book. [0,1] s "VP Verb. [0,1] c "S VP. [0,1] c "VP Verb. NP [0,1] c "NP. DT N [1,1] p "NP. PN [1,1] p Chart[2] "Det. [1,2] s "NP Det.N [1,2] c "N Noun. [2,2] p "N Noun. N [2,2] p S VP VP Verb NP NP DT N NP Det N NP DT N NP PN DT NP PN Chart[3] "Noun. [2,3] s "N Noun. [2,3] c "N Noun. N [2,3] c "NP Det N. [0,3] c "VP Verb NP. [0,3] c "S VP. [0,3] c "N. Noun [3,3] p "N. Noun N [3,3] p S VP N Noun N Early-Parsning med särdrag Utöka chartparsern till att innehålla DAG:er När kompletteringen görs unifieras DAG(A) och DAG(B) Komplettering "tillstånd på formen B γ., [j, k], dag(b) &för alla tillstånd på formen A α. B β, [i, j], dag(a) i chart[j] &lägg till A αb. β, [i, k] till chart[k] &omm unif(dag(a), dag(b)) fail VP Verb NP NP Det N N Noun Noun N Noun N Noun N Chart[2] "Det. [1,2] s "NP Det.N [1,2] c "N Noun. [2,2] p "N Noun. N [2,2] p Parsningssystem för svenska SLE- Swedish Language Engine Uppsala Chart Parser (UCP) cat: NP cat : DT agr: number:sing unif( agr : def:def ) person:third NP Det N DT NP DT N NP PN cat : NP agr : number:sing person :third def:def 6

7 Del II Finite-state parsning Parsning av ogrammatisk indata Problem med fullständig parsning Flertydigheten gör att vi får många syntaxträd Hur skall man välja ut det bästa trädet? Många meningar får ingen analys alls? Det tar för mycket tid och resurser? Behöver vi en fullständig syntaktisk analys? Robust parsning Val: teoretisk korrekthet eller effektiv tillämpbarhet? En robust parser skall ge en korrekt eller användbar analys av 90 % av meningar (Briscoe). Åtminstone följande tre problem måste lösas: 1. Chunking, vad är en mening,? 2. Disambiguation, att välja rätt analys blanda alla syntaktiskt möjliga 3. Undergeneration, eller att hantera fall som ligger utanför systemets lexikala och syntaktiska täckning. Finite-state parsing I Många språksystem behöver inte fullständig syntaktisk analys. Partiell parsning räcker ofta ganska långt ((partial shallow light) parsing) Några vanliga tillämpningsområden är informationsextrahering och även grammatikkontroll (mer senare). Informationsextrahering behöver ta fram begränsat med information för att fylla i olika typer av informationsmallar, t.ex. företagsnamn, personer och tid och plats, kanske också vem som gjorde vad mot vem. PG Gyll P G Gyllenhammar lämnar sin post som VD för Volvo. Ny VD blir Sören Gyll. Position: VD Company: Volvo In-Person: Sören Gyll Out-Person: P G Gyllenhammar 7

8 Finite-state parsning II Kaskader av regler istället för frasstrukturregler. Många regler i följd opererar på ett förändligt data. En ren och tydlig semantik samtidigt som det fungerar som ett högnivå språk för att manipulera strängar, språk och relationer. Finite-state parsning III Nomengrupper: en glad gäst, en hund, han, hunden NG --> PN (DT) (JJ) NN Verbgrupper: har spelat, att spela VG --> VB AUX VB IE VB Prepositioner: till, från, av, P --> PP Npcomp --> NN och NN PPH --> PP NP Rekursion? Om man kan skriva rekursiva regler i ett språk är det inte reguljärt. Ett utökat reguljärt språk kan ha mekanismer för rekursion Rekursion? begränsad form av rekursion används Gör skillnad mellan VL och HL Se icke-terminaler i högerledet som subrutiner. Finite-state transducers, Xerox Karttunen, Chanod, Grefenstette & Schiller (1996) Regular Expressions for Natural Language Engineering Välkänt och beprövat för morfologisk analys och generering Ganska enkla operatorer kan användas till sådant som skulle vara komplicerat att uttrycka i andra språk/formalismer: restriction: A => B _ C replacement: A -> B longest longest match replacement: B C A B Union A B konkaternering (A) Optionellt A; union med tomma strängen A+ Iteration; en eller flera konkaterneringar av A A* Kleene star; (A+) Kaskader av regler ~A komplementet(negation) A & B Snittet, skärning A B Subtraktion Indata: glada+jj define AP [Ord JJ] define NG = [[PN] [ (DT) ([AP]+) NN] [PS ([AP]+) NN]] regexp [NG NG] ] Utdata: [NG de+dt glada+jj studenterna+nn NG] 8

9 Indata: [NG de+dt glada+jj studenterna+nn NG] define HuvudN [NN => _NG] regexp HuvudN HuvudN Utdata: [NG de+dt glada+jj [HuvudN[studenterna+NN]HuvudN] NG] Tillämpningar av finite-state parsning Inforamtionsextrahering Grammatikontroll Ordklasstaggning Generell analys av fraser, huvuden och syntaktiska funktioner Finite-state parsning för grammatikkontroll Cooper & Sofkova 1998 % Den grova regeln (Broad grammar) define NP [dt jj* nn]; % de finare reglerna define Npdef[dt_def jj_def* nn_def]; define Npind[dt_ind jj_ind* nn_ind]; % Den felaktiga frasen skall finnas i NP men inte i Npdef eller Npind: NP [Npdef Npind]; Parsning av ogrammatisk input Det klassiska chomskianska: skilja mellan grammatisk meningar och ogrammatiska meningar. Syntaktiskt ogrammatiska satser kan vara semantiskt korrekta: Gröt är gott. Semantiken är starkare än syntaxen. Svenskatalare kan med sin språkkänsla avgöra att gröt är god är ogrammatiskt. Gröt är god är en syntaktisk kongruens, liksom Mannen är glad. Den semantisk kongruensen är Gröt är gott. Transduktiv lingvistik (Ramer, Transducer en automat med in- och utdata, jmf. Acceptor som tar indata och svara ja/nej. En grammatik som tilldelar alla tänkbara strängar olika typer av struktruell analys. Grammatisk/ogrammatisk mindre viktig Martin Ingvar sov två personer ogrammatisk tolkning, en person alldeles korrekt. Mänskliga lingvistiska bedömningar bygger på vilka möjliga analyser som finns för handen. Att en sträng är ogrammatisk innebär endast att vi ännu inte funnit något rimlig analys. Men för eller senare kommer en sådan tolkning att föreslå sig själv Transduktiv lingvistik 2 En transducer kan ha flera databand: Ett eller flera band för syntax (flera tolkningar) Ett eller flera band för semantik Ett band för översättningar till andra språk osv. Om nu grammatikalitet är en fråga om grad, så kan tala om grad av kompletthet 9

10 PEG (Jensen) Alla men inte enbart grammatiska satser Det är mycket svårt att dra en knivskarp gräns mellan grammatiskt och ogrammatiskt. Den språkliga kreativiteten är omfattande och skapar satser som är ogrammatiska idag men grammatiska imorgon. Språket förändras över tiden och så måste också systemen Inom språkteknologin är ogrammatiska satser vardagsmat och måste hanteras. Skrivet i PLNLP, ett Augmented Phrase Structure Language PEG (The PLNLP English Grammar: domänen är alla vanliga meningar i modern engelska. Begränsad lexikal information: morfosyntaktisk information, viss subkatergorisering PEG försöker tilldela varje sträng en någorlunda vettig analys. Eftersom semantisk analys saknas, skall PEG:s analys ses som en approximerad parsning. Istället för att producera en stor mängd analyser, tvingar PEG attachments att hänga på närmaste konstituent. PEG skall analysera tillräckligt många meningar så att det går att lösa den aktuella uppgiften. Man bör komma ihåg att inte ens människor förstår allt som sägs på modersmålet (men vi kan kommunicera ) Parsning i PLNLP Parsning i PLNLP 3 Tre typer av regler: PLNLP-regler som försöker defininera precis de centrala grammatiska strukturer som engelsktalare är överens om. DECL ---- NP NOUN* ---- Beauty ---- VERB* ---- is ---- NP NOUN* ---- truth ---- PUNC Regler som tar hand om flertydig utdata, det finns en metrik för hur analyser skall rangordnas. 3. Regler som hanterar när parsningen misslyckas, regler som försöker göra ett slags rimlig analys, s.k. Parse fitting. DECL påståendesats - Huvudet på den nivån i trädet. Påminner en del om dependency grammar med huvuden och modifierare Parse fitting Hur byggdes PEG? PEG utvecklades på empiriska grunder, från data. Grammatiken modellerades inte från given lingvistisk teori, utan formades av de fenomen som dök upp i korpusen. Naturligtvis finns det någon sorts teori i bakgrunden i all grammatikutveckling, och i PEG:s fall var det en allmänt accepterad form av konstituent analys. Korpusen innehöll affärbrev, datamanualer, studentuppsatser, och många andra källor 1983: 70 % får en entydig analys ytterligare 16 % får en flertydig analys Parse fitting när man inte kan få ihop ett S. Leta upp en huvudkonstituent: a) VP med tempus och subjekt b) VP utan tempus, men med subjekt c) Fras utan verb, t.ex. NP, PP d) Icke-finita VP e) Andra Om man hittar flera i samma kategori, väljs den längsta. Proceduren är klar om en huvudkonstituent täcker hela meningen. Om inte så läggs övriga konstituenter till på varje sida om huvudkonstituenten. 10

11 En skräckvärld av skiljetecken Snabbkommandon: Ctrl+N Nytt dokument (en ny text), Ctrl+O Öppna dokument (en gammal text), Ctrl+S Spara dokument (spara gammal/ny text), Ctrl+P Skriv ut dokument (skriver ut texten). Vad vinner man med parse fitting? 1. Man kan processa en mening för språkkontroll. 2. Utdata fungerar för någon slags semantisk analys. 3. Det är bra för att spåra problem i grammatiken. Prose fixing Om ett ord är okänt tilldelas något förvalt värde, t.ex. att ord med initial versal är namn. Detta räcker i många fall för en rimlig analys. Om kraven i grammatiken är för stränga, lättas dessa upp, s.k. relaxering. Kan t.ex. innebära att man inte bryr sig om kongruens. Om systemet trots allt inte lyckas beror detta på svagheter i den konstruerade grammatiken eller att systemet stött på ett oförutsägbart grammatiskt fel. Då används parse fitting. Rankning av analyser Antal analyser juni 1981 Dec % 36 % 1 31 % 41 % 2 6 % 11 % >2 6 % 12 % Metriken: K Score = ( Score +1) Mod Mod Mods Testmängd: 2300 meningar, upp till 63 ord, i genomsnitt 19 ord/mening Källa: Heidorn (1993) När grammatiken byggs ut får vi fler analyser och större flertydighet Det behövs en metrik för att välja bland analyserna. Lägst poäng är bäst Poängen för en fras är lika med summan av poängen hos de modifierande fraserna, poängen för varje modifierare ökas med 1 och multiplicerad med en konstant för typen av modifierare. En fras utan modifierare får 0 poäng. Metriken bygger på en flat vy på syntaktisk struktur. Varje fras har ett huvud och noll eller flera framförställda/efterställda attribut (modifierare) Två alternativa analyser med poäng Sammanfattning av föreläsningen SENT(0.23) SENT(0.122) ----VB* See ----NP(0.1) ----DT the ----NN man -----PP(0.2) ----PREP with ----DT the ----NN telescope ----VB* See ----NP(0.22) ----DT the ----NN man -----PP(0.2) ----PREP with ----DT the ---NN telescope Parsning och partiell parsning är viktiga grundidéer. Parsning kan ses som ett sökproblem Två vanliga sökstrategier: toppen-ner och botten-upp Flertydighet, vänsterrekursion och onödig analys av delträd är problem som måste hanteras. Vanliga problem är PP-attachment, koordinering och NPflertydighet PP = 0.1(0+1)+0.1(0+1)=0.2 PREP=0, DT=0 NP(2:a trädet)= 0.1(0+1)+0.1(0.2+1) 11

12 sammanfattning Dynamisk programmering används för att effektivisera parsning Ganska många tillämpningar kan använda sig av partiell parsning. Finite-state parsning är en bra och effektiv metod för detta. Alla system måste i någon mån hantera ogrammatisk indata och oförutsägbar indata. 12

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson 008 Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders

Läs mer

Partiell parsning Parsning som sökning

Partiell parsning Parsning som sökning Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Tekniker för storskalig parsning: Grundbegrepp

Tekniker för storskalig parsning: Grundbegrepp Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)

Läs mer

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Frasstrukturgrammatik

Frasstrukturgrammatik 729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON

Läs mer

Automatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA

Automatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord

Läs mer

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri

Läs mer

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,

Läs mer

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Innehåll Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Olika frastyper och regler för dessa Dependensgrammatik Olika

Läs mer

Fraser, huvuden och bestämningar

Fraser, huvuden och bestämningar UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin

Läs mer

Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns?

Innehåll. Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi. Datorstöd för skrivande. Vilka metoder finns? Datorstöd för skrivande och grammatikkontroll Ola Knutsson DH2418 Språkteknologi Innehåll Datorstöd för skrivande Olika metoder och system för grammatikgranskning. Granska Att skriva regler i Granska.

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)

Läs mer

Språkets struktur och funktion, 7,5 hp

Språkets struktur och funktion, 7,5 hp Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag

Läs mer

Djupstruktur och ytstruktur

Djupstruktur och ytstruktur Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)

Läs mer

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol) Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den

Läs mer

2. Utgångspunkter och angreppssätt för automatisk språkgranskning

2. Utgångspunkter och angreppssätt för automatisk språkgranskning Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet

Läs mer

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax?

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax? Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Innehåll Olika frastyper och regler för dessa Dependensgrammatik Olika

Läs mer

Matematik för språkteknologer

Matematik för språkteknologer 1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin

Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin Datorlingvistisk grammatik OH-serie 1: introduktion http://stp.lingfil.uu.se/~matsd/uv/uv09/dlg/ LEKTION 1: innehåll Kursformalia Grammatik formell grammatik. Metod och data (lite). Språkteknologisk relevans.

Läs mer

FL 6: Definite Clause Grammars (kap. 7)

FL 6: Definite Clause Grammars (kap. 7) FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor

Läs mer

Övning 5 - Tillämpad datalogi 2013

Övning 5 - Tillämpad datalogi 2013 /afs/nada.kth.se/home/w/u1yxbcfw/teaching/13dd1320/exercise5/exercise5.py October 1, 2013 1 0 # coding : latin Övning 5 - Tillämpad datalogi 2013 Automater, reguljära uttryck, syntax Sammanfattning Idag

Läs mer

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till? Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar

Läs mer

Föreläsning 7: Syntaxanalys

Föreläsning 7: Syntaxanalys DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.

Läs mer

Grammatisk teori III Praktisk analys

Grammatisk teori III Praktisk analys Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas

Läs mer

Reguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm

Reguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm Syntaxanalys Douglas Wikström KTH Stockholm popup-help@csc.kth.se Reguljära uttryck Reguljära uttryck förutsätter att en mängd bokstäver är givna, ett så kallat alfabet, som oftast betecknas med Σ. Uttryck

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Språkgranskningsverktyg, vt 2008

Språkgranskningsverktyg, vt 2008 , vt 2008 Föreläsning 7 Chartparsning i allmänhet och UCP i synnerhet evapet@stp.lingfil.uu.se 1 Djupstruktur och ytstruktur Jag läste en bok igår Igår läste jag en bok 2 Chartparsning - bakgrund Utvecklades

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Språkteknologi. Språkteknologi

Språkteknologi. Språkteknologi Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi

Läs mer

UPPSALA UNIVERSITET Institution för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf HT 2015 (korrigerad 151126) Depdsgrammatik Dna introduktion till depdsgrammatik försöker följa d standard

Läs mer

DD1361 Programmeringsparadigm. Carina Edlund

DD1361 Programmeringsparadigm. Carina Edlund DD1361 Programmeringsparadigm Carina Edlund carina@nada.kth.se Funktionell programmering Grundidéen med funktionell programmering är att härma matematiken och dess funktionsbegrepp. Matematiskt funktionsbegrepp

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

DAB760: Språk och logik

DAB760: Språk och logik DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Tentamen Del A. Marco Kuhlmann

Tentamen Del A. Marco Kuhlmann TDDD01 Språkteknologi (2016) Tentamen 2016-03-16 Marco Kuhlmann Tentamen består två delar, A och B. Varje del omfattar ett antal frågor à 3 poäng. Del A omfattar 8 frågor som kan besvaras kortfattat. Det

Läs mer

Lingvistiska grundbegrepp

Lingvistiska grundbegrepp 729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik

Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Först några definitioner: Alfabet = en ändlig mängd av tecken. Ex. {0, 1}, {a,b}, {a, b,..., ö} Betecknas ofta med symbolen Σ Sträng =

Läs mer

Introduktion till språkteknologi. Datorstöd för språkgranskning

Introduktion till språkteknologi. Datorstöd för språkgranskning Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter

Läs mer

TDDC74 Programmering: Abstraktion och modellering Datortenta , kl 14-18

TDDC74 Programmering: Abstraktion och modellering Datortenta , kl 14-18 TDDC74 Programmering: Abstraktion och modellering Datortenta - 017-10-7, kl 14-18 Läs alla frågorna först och bestäm dig för i vilken ordning du vill lösa uppgifterna. Uppgifterna är inte nödvändigtvis

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk

Läs mer

MÖSG ht 2005 Maskinöversättningssystemet MATS

MÖSG ht 2005 Maskinöversättningssystemet MATS MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys

Läs mer

Språkgranskningsverktyg. Grammatikkontroll med Scarrie

Språkgranskningsverktyg. Grammatikkontroll med Scarrie Språkgranskningsverktyg Grammatikkontroll med Scarrie Strategi för grammatikkontroll Vision Fullständig parsning enligt en heltäckande grammatik som skiljer ut avvikande konstruktioner och diagnosticerar

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Inlämningsuppgift MiniPlotter

Inlämningsuppgift MiniPlotter LUNDS TEKNISKA HÖGSKOLA Institutionen för datavetenskap EDAA01 Programmeringsteknik fördjupningskurs Inlämningsuppgift MiniPlotter I den här uppgiften ska ett program som ritar grafer av matematiska funktioner

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Kompilatorer och interpretatorer

Kompilatorer och interpretatorer 1 of 6 Örebro universitet Institutionen för teknik Thomas Padron-McCarthy (Thomas.Padron-McCarthy@oru.se) Tentamen i Kompilatorer och interpretatorer för Dataingenjörsprogrammet m fl lördag 7 november

Läs mer

DD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin

DD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 3 Per Austrin 2015-11-13 Huvudkoncept hittils: Snabb repetition Formellt språk en mängd strängar Reguljära språk den klass av formella

Läs mer

Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014

Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014 Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng

Läs mer

Föreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk

Föreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas

Läs mer

Svårigheter med kurslitteraturen

Svårigheter med kurslitteraturen Svårigheter med kurslitteraturen Forskningsanknuten kurs Litteraturen är skriven i syfte att presentera forskningsresultat och ofta argumentera för vissa lösningar; undantag: uppfriskningslitteraturen

Läs mer

DD1361 Programmeringsparadigm HT15

DD1361 Programmeringsparadigm HT15 DD1361 Programmeringsparadigm HT15 Logikprogrammering 3 Dilian Gurov, TCS Idag Induktiva datatyper: Träd (inte inbyggd) Binära träd utan data Binära träd med data Prolog-specifika konstruktioner Negation,

Läs mer

Grundläggande datalogi - Övning 9

Grundläggande datalogi - Övning 9 Grundläggande datalogi - Övning 9 Björn Terelius January 30, 2009 Ett formellt språk är en (oftast oändlig) mängd strängar. Språket definieras av en syntax som är en samling regler för hur man får bilda

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. (1) Tidigt i gryningen påbörjade han sin (2) förvandling. Han hade (3) noga planerat allting för att (4) ingenting (5) skulle kunna

Läs mer

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,

Läs mer

Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.

Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

FTEA12:2 Filosofisk metod. Att värdera argumentation I

FTEA12:2 Filosofisk metod. Att värdera argumentation I FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:

Läs mer

TENTAMEN I PROGRAMSPRÅK -- DVG C kl. 08:15-13:15

TENTAMEN I PROGRAMSPRÅK -- DVG C kl. 08:15-13:15 TENTAMEN I PROGRAMSPRÅK -- DVG C01 140605 kl. 08:15-13:15 Ansvarig Lärare: Donald F. Ross Hjälpmedel: Bilaga A: BNF-definition Betygsgräns: Kurs: Max 60p, Med beröm godkänd 50p, Icke utan beröm godkänd

Läs mer

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade

Läs mer

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning? Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

Korpuslingvistik vt 2007

Korpuslingvistik vt 2007 Korpuslingvistik vt 2007 Metoder för annotering II och utvärdering Beata B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk

Läs mer

Parsning i Granska. Föreläsningens innehåll. Granskas uppbyggnad. Inspiration och förebilder. Regelmatchning/parsning. Granskas regelspråk

Parsning i Granska. Föreläsningens innehåll. Granskas uppbyggnad. Inspiration och förebilder. Regelmatchning/parsning. Granskas regelspråk Parsning i Granska Ola Knutsson Språkteknologikursen ht 2001 Föreläsningens innehåll Inspiration och förebilder Målsättningar, designval Granskas regelsyntax Regler och tillämpningar Inspiration och förebilder

Läs mer

Programmering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater

Programmering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater Programmering för språkteknologer II OH-serie: ändliga automater reguljära uttryck i Java Mats Dahllöf Ändliga automater Abstrakt maskin, tillståndsmaskin, transitionssystem. (Den enklaste typ man brukar

Läs mer

1 Inledning. 1.1 Programförklaring. 1.2 Innehållet. 1.3 Beteckningskonventioner - 1 -

1 Inledning. 1.1 Programförklaring. 1.2 Innehållet. 1.3 Beteckningskonventioner - 1 - - 1-1 Inledning 1.1 Programförklaring Detta kompendium är utvecklat för en introduktionskurs i datalingvistik som vänder sig till studenter med tidigare kännedom om grundläggande lingvistik och datavetenskap.

Läs mer

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara

Läs mer

Lingvistik V Satsdelar, huvud- och bisatser. 729G49 23 april

Lingvistik V Satsdelar, huvud- och bisatser. 729G49 23 april Lingvistik V Satsdelar, huvud- och bisatser 729G49 23 april Form och funktion Primära satsdelar Satser Form och funktion Formklassifikationen berori huvudsakpå konstituenternas interna strukturella egenskaper

Läs mer

Tommy Färnqvist, IDA, Linköpings universitet. 2 Strukturer 2 2.1 Domäner... 2 2.2 Tolkningar... 3

Tommy Färnqvist, IDA, Linköpings universitet. 2 Strukturer 2 2.1 Domäner... 2 2.2 Tolkningar... 3 Föreläsning 2 Semantik 729G06 Logikdelen Föreläsningsanteckningar i Programmering och logik 27 januari 2014 Tommy Färnqvist, IDA, Linköpings universitet 2.1 Innehåll Innehåll 1 Lite mer syntax 1 2 Strukturer

Läs mer

MÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP

MÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP MÄLARDALENS HÖGSKOLA CD5560 Formella språk, automater och beräkningsteori Användarmanual för simulatorn JFLAP Innehållsförteckning Att komma igång med JFLAP... 3 Att köra en sträng... 5 Att köra flera

Läs mer

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Ordförråd och Ordbildning

Ordförråd och Ordbildning Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande

Läs mer

Föreläsninsanteckningar till föreläsning 3: Entropi

Föreläsninsanteckningar till föreläsning 3: Entropi Föreläsninsanteckningar till föreläsning 3: Entropi Johan Håstad, transkriberat av Pehr Söderman 2006-01-20 1 Entropi Entropi är, inom kryptografin, ett mått på informationsinnehållet i en slumpvariabel.

Läs mer

RoboLinguistics. Ett textförståelseprogram. Henrik Palmér, d01hp

RoboLinguistics. Ett textförståelseprogram. Henrik Palmér, d01hp RoboLinguistics Ett textförståelseprogram Henrik Palmér, d01hp Inledning För att styra robotar räcker det inte att som i science-fictionfilmer bara säga till dem vad de ska göra. De största kraftansträngningarna

Läs mer

Kritisk granskning. Innehåll - Teori

Kritisk granskning. Innehåll - Teori Hur göra artikelkritik Gemensam diskussion om artikel Litteraturtips Datalingvistisk metod- och fördjupningskurs höstterminen 2006 Kritisk granskning presentera innehåll neutralt koncentrera dig på en

Läs mer

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är

Läs mer

Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap

Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap Parsning TDP007 Konstruktion av datorspråk Föreläsning 6 Peter Dalenius Institutionen för datavetenskap 2017-02-14 2 Analys av källkod Lexikalisk analys Bildar tokensutifrån källkodens text. Syntaktisk

Läs mer

Föreläsning 6: Induktion

Föreläsning 6: Induktion Föreläsning 6: Induktion Induktion är en speciell inferensregel. En mängd är välordnad om varje delmängd har ett minsta element Exempel: N är välordnad (under ) Låt P(x) vara ett predikat över en välordnad

Läs mer