Innehåll. Syntax och syntaxformalismer. Definitioner från SAG. Adress till Swetwol. Argument för konstituentstruktur. Konstituentstruktur

Storlek: px
Starta visningen från sidan:

Download "Innehåll. Syntax och syntaxformalismer. Definitioner från SAG. Adress till Swetwol. Argument för konstituentstruktur. Konstituentstruktur"

Transkript

1 Syntax och syntaxformalismer Språkteknologi 2D Ola Knutsson Innehåll Dependensgrammatik Kontextfri grammatik Särdrag och särdragsstrukturer Syntaxformalismer DCG och Unifieringsbaserad grammatik i Prolog Definitioner från SAG Fras (enligt SAG): en fras är en grammatisk konstruktion som inte är en sats och som definieras efter sin inre struktur och sin distribution. Sats (enligt SAG): en sats är en konstruktion som består av subjekt (som kan saknas i vissa satstyper) och finit verbfras (predikatsled) samt optionellt vissa adverbial som hör till hela satsen. Flertalet satstyper har dessutom inledare (en satsbas eller en subjunktion). Adress till Swetwol Andra lingsoftdemosar: Konstituentstruktur Konstituenter: grupper av ord kring ett huvudord den röda hundens tofflor besegrades vid Waterloo deras gröngulblåa egendomliga egenskaper en hund Huvudord: det centrala elementet i en fras tofflor, besegrades, egenskaper NN (Nomen), VB (Verb), PP (prepositioner), JJ (Adjektiv) Nominalfraser (NP), Verbfraser (VP) Prepositionsfraser (PP), Adjektivfraser (AP) Argument för konstituentstruktur uppträder i liknande kontexter: en hund sågs i parken i parken sågs en hund sågs en hund i parken enskilda ord kan kan inte ersätta konstituenten *hund sågs i parken *i parken sågs en konstituenter kan flyttas men inte brytas upp i parken sågs en hund sågs en hund iparken *i hund en parken sågs *hund sågs i parken en 1

2 Argument mot konstituentanalys Flertydighet mellan konstituenterna är stor och när de sätts ihop ökar flertydigheten igen Ganska mycket talar för att ordbaserade system är både enklare att konstruera och effektivare att parsa. Varför dependensgrammatik? Fokus ofta på engelskan vid utveckling av grammatiska teorier. Engelskan har en ganska fast ordföljd till skillnad mot många andra språk i världen. Dependensgrammatik, hävdar en del, är bättre lämpat för språk mer friare ordföljd. Dependensgrammatik Relationer mellan ord Om A och B hör ihop: A styr B (B är beroende av A) B styr A dependens 1. Det styrande ordet har ett semantiskt oberoende 2. Det styrande ordet är bestämmande för helhetens kategori och syntaktiska uppträdande 3. Det styrande ordet upptar en position i helheten som måste ges uttryck, medan ett styrt ord optionellt. Statsrådet ensamt Statsrådet är ensamt. VB NN PP PS NN min kusin studerade vid universitet NN VB PP NN Grammatiska funktioner Subjekt, predikat, adverbial S SUBJEKT PREDIKAT PS min farbror satte på kaffet PS NN V ADV P NN Min kusin studerade vid universitetet 2

3 Grammatiska relationer i (tidig) transformationsgrammatik Subjektet = NP Problem? Sambandet grammatisk relation och fraskategori ej entydigt Subjekt kan vara en sats Subjektet kan stå efter verbet, eller markeras morfologiskt (latin). 1. Min kusin studerade vid universitet 2. Min kusin studerade för mig I 1 kan PP bytas ut mot där ej i 2 utan betydelseförändring, men vi ser ingen skillnad i traditionell konstituentanalys mellan: vid universitet och för mig. Använd formellt definierade grammatiska relationer -undvik semantiska, speciellt om en parallell semantisk beskrivning finnes Huvud, bestämmande för frasens typ den lilla mannen Subjekt, i det finita verbets närhet, jag, dojjan passar inte Direkt objekt, närmast efter verbet Jag har en ny cykel Grammatiska relationer forts. Indirekt objekt, Jag gav mannen en dator Predikativt komplement, Jag blir så glad Bisatskomplement, Hon talade inte om att hon redan kunde spela fiol. Icke-finit verbalt komplement, Hon lovade att spela fiol Partikel, Hon bar ner fiolen Kontextfri grammatik Prepositionsobjekt, Mannen står på taket Adverbial, Mannen lagade skorstenen på taket Relativsats, Mannen som står där borta Kallas också frasstrukturgrammatik Grammatiken består av regler och lexikon I lexikonet finns terminalerna (ord). Symboler som uttrycker kluster eller generaliseringar av terminalerna kallas icketerminaler (regler). Används både för generering och analys 3

4 Kontextfria grammatiker Frastrukturgrammatiker P: Regler på formen A B N: icke-terminaler: S, NP, VP, AP, N, V Σ: terminaler: kalle, cyklar, parken, i S: startsymbol: S G = <N, Σ, P, S > Derivering en räcka av regelapplikationer på en sträng Träd: en strukturell representation baserat på deriveringen Parsningsproblemet: att mappa ett träd till en sträng (snabbast möjligt) nästa föreläsning behandlar detta En minigrammatik S NP VP VP V1 (Adverbial) VP V2 NP (Adverbial) VP V3 NP NP (Adverbial) Adverbial Adverb Adverbial PP PP Prep + NP NP NN NP PM PM Pelle PM Kalle PM Göteborg NN hästen NN pojken NN boken V1 sover V2 gillar V3 ger Adverb fort Prep i Vi kan generera en sats S NP VP S NN VP S Hästen V2 NP S Hästen gillar NP S Hästen gillar pojken Att hantera kongruens Kongruens: konstituenternas morfologiska struktur anpassar sig efter huvudordet En liten bil, inte: en litet bil NP dtutrsinind jjutrsinind nnutrsinind NP dtneusinind jjneusinind nnneusinind dtutrsinind en jjutrsinind liten jjneusinind litet nnutrsinind bil Vi får en kombinatorisk explosion Särdragsstrukturer särdrag_1 värde_1 särdrag_n värde_n num SIN gender UTR spec DEF 4

5 Unifiering [num SIN] [num SIN] JA! [num SIN] [num PLU] NEJ! [num SIN] [num []]=[num SIN] [num SIN] [gender UTR]= Särdrag som grammatiska filter Verbfrasregler: VP V[subcat intranstiv] VP V[subcat transitiv] NP VP V[subcat ditransitiv] NP NP Num SIN Gender UTR S NP VP VP VB[subcat intranstiv] VP VB[subcat transitiv] NP VP VB[subcat ditransitiv] NP NP NP Pelle, hästen, pojken boken Lexikon: sover VB[subcat intransitiv] beundrar VB[subcat transitiv] ger VB[subcat ditransitiv] Genererar: Pelle sover. Genererar inte: Pelle sover hästen. Unifiering i regler S NP VP <NP NUMBER> = <VP NUMBER> Mannen är glad <NUMBER SIN> <NUMBER SIN> NP DET NOMINAL <Det AGREEMENT> = <Nominal AGREEMENT> <NP AGREEMENT> = <Nominal AGREEMENT> En grammatik definieras genom: 1. Ett lexikon 2. En uppsättning kategorier 3. En uppsättning regler Ord- terminala symboler Kategorier- icke-terminala symboler Kontextfria regler: C s Kontextkänsliga regler: C s/s1_s2 Grammatikens språk Om en mening kan härledas med grammatikens regler sägs grammatiken generera meningen. Samma språk svagt ekvivalenta Isomorfa syntaktiska strukturer starkt ekvivalenta 5

6 Chomsky-hierarkin Typ 0: Obegränsade grammatikor Typ 1: Kontextkänsliga grammatikor Typ 2: Kontextfria grammatikor Typ 3: Finite-state grammatikor Övergenerering och undergenerering Genererar: Pelle sover hästen. Genererar inte: Sover Pelle? Parsning Parsning: Att utföra bästa möjliga (av grammatiken tillåten) analys av ett språkligt påstående. Problem: Språkets tvetydighet och även grammatikens flertydighet Generering Genereringsproblemet är parsningsproblemets motsats: Att från en logisk representation skapa ett påstående i naturligt språk. Påståendet måste givetvis ha samma innebörd som den logiska formen. tvåvägsgrammatikor = grammatikor som kan användas både för analys och generering. Vad menas med syntaxformalism? Ett språk för att formalisera grammatiska regler. Ganska ofta med fokus på: en given syntaktisk teori (ofta knepiga lingvistiska relationer), några kärnmeningar, sällan något omfattande textmaterial. Representera lingvistisk kunskap i ett system För att tilldela indata en strukturell analys Syntaktiska teorier/formalismer Transformationsgrammatik (Chomsky et al) HPSG (Pollard & Sag) PATR-II Tree Adjoining Grammar Dependency Grammar och Constraint Grammar (se Parsning II) Finite-state grammars 6

7 Vilka formalism skall man välja? Närhet till grammatisk teori? Krav på effektivhet? Hur är det att arbeta i formalismen? Vilka lexikal resurser krävs? Vilken typ av analys är nödvändig? Är det bättre att implementera något eget? Teorier in i datorn Första försöket att bygga ett system baserat på transformationsgrammatik, Petrick Problem med implementationen Augmented Transition Networks (Woods 1970) Lexikon och grammatikregler separerade Samma kraft som en transformationsgrammatik skulle kunna uppnås. Constraint-based formalismer Om alla grammatiska kategorier skall formuleras som frasstrukturregler får vi en mycket stor mängd regler Grammatiska kategorier skall ses som objekt Constraint restriktioner GPSG Syftet var att skapa en unifierings-baserad formalism Frasstrukturregler utan transformationer skall vara tillräckligt för att beskriva språk Huvudmotivationen var att ta fram en enkel formalism med: En syntaktisk nivå: ytstruktur Ett slags syntaktiskt objekt: frasstrukturregeln GPSG Generalized Phrase Structure Grammar Gerald Gazdar, sent 70-tal, Gazdar, Klein, Pullum, Sag En distinktion mellan universala principer och språkspecifika regler ID-regler, immediate dominance rules Metaregler, mappningar från ID-regler till IDregler LP, linear precedence, statements, definierar generell principer bland ordningen av systernoder Immediate dominance and linear precedence Immediate Dominance = frasstrukturregler men utan någon fastlagd inbördes ordning mellan noderna på högersidan (döttrarna) i en regel. I princip är dessa språkoberoende. Linear Precedence = adderar den språkspecifika ordningen mellan dotternoderna. 7

8 HPSG (Pollard & Sag 1984) Head-driven Phrase Structure Grammar Kombinerar särdrag och principer (jfr GB) Informationen finns i lexikonet Några få principer motorn Heads (V, N, A, P) Särdragsstrukturer Head-Feature-Principle kräver att modernoden unifieras dotternoder Fall som frasstruktur inte klarar Adverbets placering i satsen Adverb kan dyka upp lite var som helst i satsen Frasstruktur har konkatenering som en viktig operator Gazdar, Klein, Pullum & Sag (1985). ID/LP-regler Immediate dominance ID VP --> V, NP, PP, AdvP Säger inte i vilken ordning V, NP, PP, AdvP kommer Linear precedence LP-regler: V < NP V < PP NP < S1 Som säger: V föregår NP, V föregår PP, NP föregår S1, när de hänger från samma nod. Om ingen position är given för AdvP så kan den förekomma var som helst Transformationsgrammatik i NLP Chomsky introducerade förändringar av trädstrukturer, s.k. Transformationer. Lingvister använde transformationer för alla möjliga grammatiska konstruktioner: Kongruens och kasus, nu används särdrag. Relationer mellan aktiva och passiva satser, nu används lexikal regler. Varierande ordföljd, nu används alternativa frasstrukturregler för detta. För att göra en transformation behövs en trädstruktur, och måste vi använda transformationer för att skapa träd blir detta omöjligt. Transformationsgrammatiker används sällan inom NLP Supertaggning I (se t.ex. Joshi & Srinivas, 1994) Först fanns orden, Sedan kommer taggarna Och därefter kom supertaggarna! Det finns en supertagg för varje syntaktisk omgivning som ett ord kan befinna sig i. Vi får fler taggar än vid ordklasstaggning. Supertaggarna hämtas från LTAG Ordet masterminded har t.ex. 6 supertaggar: transtivt verb, passivt verb, relativiserad form m.fl Supertaggning II Hur går det till? Lokal statistisk information, trigram över supertaggar. SuperTag tränades på 1 miljon ord med supertaggar. Testade på ord, 92.2 % av dessa taggades korrekt. Parsning och supertaggning: Supertaggning klarar nästan alltid att analysera meningar. För att få en komplett syntaxanalys måste supertaggar kombineras. Parsningen blir 30 ggr. snabbare med supertaggaren som förprocess. Tillämpningar: dokumentfiltrering, textförenkling, ordbetydelstaggning (hur skall ordet bank tolkas). 8

9 LFG Lexikalisk-funktionell grammatik (Lexical Functional Grammar). Är en teori för den universella grammatiken (Chomsky). Grammatiska funktioner/relationer betraktas som primitiva begrepp kan inte definieras med frasstruktur. Syntaktiska regler tillåts inte förändra grammatisk funktion hos en kosntituent. Inga transformationer ingen ytstruktur-djupstruktur Två nivåer: konstituentstruktur(c-struktur) och funktionell struktur (f-struktur) c-strukturen är ett frasstrukturträd genererat med CFG f-strukturen bestäms både av CFG:en och lexikal information The LFG Grammar Writer s workbench (Xerox) medley/ LFG för svenska, Linköping Dependency grammar Dependensgrammatik, Tesnière 1959 Formalismer/parsningssystem: Functional Dependency Grammar (Järvinen & Tapanainen, 1997) Link Grammar (Sleator & Temperely, 1993) Constraint Grammar Finite-state grammars Finite-state transducers (Karttunen et al, 1997) Finite-state intersection grammar (Koskenniemi, 1990) designing a parsing grammar (Voutilainen, 1994) bra fokus på grammatikern, som skall skriva alla dessa regler. Olika analysnivåer kan samverka: en flertydighet på en nivå kan lämnas till nästa nivå, flertydig information från en nivå ovanför kan användas för att disambiguera en lägre nivå. Mer om finite-state parsning nästa föreläsning. DCG Definite Clause Grammar En notation i Prolog för att skriva logiska grammatiker Pereira och Warren 1980 Prolog genererar automatiskt en parser för DCG-grammatiken. DCG --> Prolog HEAD -- > BODY. en möjlig form av HEAD är BODY. Konjunktionsoperatorn, DCG: s --> np(agr), vp(agr). Översätts till: s(p0, P2) :- np(agr, P0, P1), vp(agr, P1, P2). Det existerar en konstituent, s, från punkt P0 till P2 om det existerar en np mellan punkterna P0 och P1 och en vp mellan P1 och P2, och särdragsvariablerna Agr i np och vp stämmer överens. 9

10 Mer DCG När DCG-reglerna är översatta finns de endast expanderade i Prolog. icke-terminal --> icke-terminal. icke-terminal --> [hund] icke-terminal --> [så, länge] Icke-terminal --> {write ( Vilken NP va? )} Icke-terminal --> en serie av ovan sammansatta med, expand_term/2 SICStus 3 #6: Mon Feb 2 19:42:45 MET 1998?- expand_term((s --> np, vp), What). What = s(_a,_b):-np(_a,_c),vp(_c,_b)? yes?- expand_term((n --> [bilen]), Hur). Hur = n(_a,_b):-'c'(_a,bilen,_b)? yes?- expand_term((ab --> [så], [länge]), H). H = ab(_a,_b):-'c'(_a,så,_c),'c'(_c,länge,_b)? En grammatik i DCG s --> np, vp. vp --> vb. vp --> vb, np. vp --> vb, np, np. np --> dt, nn. np --> nn. Ett lexikon i DCG nn --> [pelle]. nn --> [hästen]. nn --> [pojke]. nn --> [bok]. nn --> [hus]. dt --> [en]. dt --> [ett]. vb --> [sover]. vb --> [beundrar]. vb --> [ger]. vb --> [ser]. Vad får vi ut? Vi får en parser som accepterar godkända strängar, vi får inga träd. Om vi bygger ut grammatiken kan vi få parsern att bygga syntaxträd. Varje regel skall fylla i sin struktur S --> np, vp. Skall ge s(, ), fylls i av np och vp. Np vill i sin tur fylla i med np(, ) osv. En grammatik i DCG med parseträd s(s(np, VP)) --> np(np), vp(vp). vp(vp(vb)) --> vb(vb). vp(vp(vb,np)) --> vb(vb), np(np). vp(vp(vb, NP1, NP2)) --> vb(vb), np(np1),np(np2). np(np(dt, NN)) --> dt(dt), nn(nn). np(np(nn)) --> nn(nn). 10

11 Lexikonet i DCG nn(nn(pelle)) --> [pelle]. nn(nn(hästen)) --> [hästen]. nn(nn(pojke)) --> [pojke]. nn(nn(bok)) --> [bok]. nn(nn(hus)) --> [hus]. dt(dt(en)) --> [en]. dt(dt(ett)) --> [ett]. vb(vb(sover)) --> [sover]. vb(vb(beundrar)) --> [beundrar]. vb(vb(ger)) --> [ger]. vb(vb(ser)) --> [ser]. När den första regel anropas, instanieras omedelbart dess argument till s(np, VP) Variabler NP och VP är ännu så länge oinstansierade. Därefter instanieras NP till np(dt, NN) Hela strukturen är då s(np(dt, NN), VP) DT, NN och VP saknar då sina värden, men de fås när exekveringen fortsätter. Om Prolog backtrackar så är instansieringarna ogjorda. Nyckelidén är att arbeta med information som man ännu inte har, bygg istället delvis instanierad struktur och instansiera senare. Denna teknik är Prologs styrka. Hur blir det? (del 1)?- s(träd, [pelle, sover],[]). Träd = s(np(nn(pelle)),vp(vb(sover)))??- s(t, [pelle, ser, ett, bok],[]). T = s(np(nn(pelle)),vp(vb(ser),np(dt(ett),nn( bok))))? Särdrag i grammatiken Vi vill ha ett elegant sätt att representera/uttrycka syntaktiska krav Lägger till sädrag och unifiering till våra vanliga frasstrukturregler (augmenting) Mål: Att associera komplexa särdragsstrukturer med lexikal poster och instanser av grammatiska kategorier Att styra bildningen av särdragsstrukturer för större grammatiska konstituenter baserade på komponenternas sädragsstrukturer Att framtvinga restriktioner som måste stämma överens mellan angivna delar i grammatiska konstruktioner DCG med genuskongruens s(s(np, VP)) --> np(np,_), vp(vp). vp(vp(vb)) --> vb(vb). vp(vp(vb,np)) --> vb(vb), np(np,_). vp(vp(vb, NP1, NP2)) --> vb(vb), np(np1, _),np(np2,_). np(np(dt, NN), GEN) --> dt(dt,gen), nn(nn, GEN). np(np(nn), GEN) --> nn(nn, GEN). DCG med subkategorisering s(s(np, VP)) --> np(np,_), vp(vp). vp(vp(vb)) --> vb(vb,). vp(vp(vb,np)) --> vb(vb), np(np,_). vp(vp(vb, NP1, NP2)) --> vb(vb), np(np1, _),np(np2,_). np(np(dt, NN), GEN) --> dt(dt,gen), nn(nn, GEN). np(np(nn), GEN) --> nn(nn, GEN). 11

12 Lexikon nn(nn(pelle), utr) --> [pelle]. nn(nn(hästen), utr) --> [hästen]. nn(nn(pojke), utr) --> [pojke]. nn(nn(bok), utr) --> [bok]. nn(nn(hus), neu) --> [hus]. dt(dt(en),utr) --> [en]. dt(dt(ett),neu) --> [ett]. vb(vb(sover)) --> [sover]. vb(vb(beundrar)) --> [beundrar]. vb(vb(ger)) --> [ger]. vb(vb(ser)) --> [ser]. Hur blir det? (del 2)?- s(träd,[pelle,ser,en, bok],[]). Träd = s(np(nn(pelle)),vp(vb(ser),np(dt(en),n n(bok))))? ; no?- s(träd, [pelle, ser, ett, bok],[]). no s(s(np, VP)) --> np(np,_), vp(vp). vp(vp(vb)) --> vb(vb,intrans). vp(vp(vb,np)) --> vb(vb,trans), np(np,_). vp(vp(vb, NP1, NP2)) --> vb(vb,ditrans), np(np1, _),np(np2,_). Vi bygger ut verben i lexikonet: vb(vb(sover),intrans) --> [sover]. vb(vb(beundrar), trans) --> [beundrar]. vb(vb(ger), ditrans) --> [ger]. vb(vb(ser), trans) --> [ser].?- s(t,[pelle,sover],[]). T = s(np(nn(pelle)),vp(vb(sover)))? ; no?- s(t,[pelle, sover, hasten],[]). no?- s(t,[pelle, ser, hasten],[]). T = s(np(nn(pelle)),vp(vb(ser),np(nn(hasten) )))??- s(t,[pelle, ger, hasten, en, bok],[]). T = s(np(nn(pelle)),vp(vb(ger),np (nn(hasten)),np(dt(en),nn(bok ))))? yes?- s(t,[pelle, ser, hasten, en, bok],[]). 12

13 CLE Core language engine Istället för att arbeta med en lingvistisk ren formalism (som måste kompileras till något mer effektivt) syftar CLE att vara en formalism som ligger när implementationsspråket. CLE är unifieringbaserad formalism implementerad i Prolog, som har inbyggd unifiering. I stort sett samma formlism för morfologi, syntax och semantik CLE S NP VP Förenklat i CLE: syn(s_np_vp_normal, core, doc( [Jag flyger], [d1, d3, e1], Covers all normal types of clauses ), [s:[vform=vform, type=type], np:[type=type], vp:[vform=vform] SLE The Swedish Language Engine Arbetet startade 1990, Gambäck med flera Baserat på CLE Morfologisk, syntaktisk och semantisk analys Svenska meningar analyseras och konverteras till en intern semantisk represenation. Analys och generering kan göras med samma grammatik, som dock kompileras olika. Spoken Language Translator (SLT) Domänen flygbokning, översätter frågor på engelska till svenska Även andra tillämpningar Särdragskategorier och särdragsvärden i grammatikregler np:[num=num, gen= Gen,tree=np(DET,N)] => np_det_n- [dt:[num=num,gen=gen, tree=det], nn:[num=num,gen=gen, tree=n]]. np:[num=num,gen=gen,tree=np(n)] => np_n- [nn:[num=num,gen=gen, tree=n]]. Diderichsens satsscheman lexicon(pelle,nn:[num=sin,gen=utr,tree=np(pelle)]). lexicon(hästen,nn:[num=sin,gen= utr, tree=nn(hästen)]). lexicon(bok,nn:[num=sin,gen= utr, tree=nn(bok)]). lexicon(hus,nn:[num=sin,gen=neu, tree=nn(hus)]). lexicon(en,dt:[num=sin,gen=utr, tree=dt(en)]). lexicon(ett,dt:[num=sin,gen=neu, tree=dt(en)]). lexicon(den,dt:[num=sin,gen=utr, tree=dt(den)]). lexicon(de,dt:[num=plu,gen=_, tree=dt(de)]). Paul Diderichsen, en dansk lingvist Satsscheman: Fundament Nexufält Innehållsfält Finit verb Subjekt Satsadv Infinit verb obj. Adv Pojken reste [] inte igår Igår reste pojken inte Reste pojken inte igår? Vem reste [] inte igår? 13

14 Satsscheman är bra för Beskrivning av ordföljd eller fältföljd Formalismen används både i traditionella grammatikor och för språkinlärning Skall man implementera en svenska grammatik, kan man enkelt hänvisa till paragrafer Bra för att utveckla transformationer mellan satser, hyfsat enkelt att Bra för en noggrann igenkänning och analys av satser Kan åtminstone delvis beskrivas med ändliga automater en eller flera automater för varje fält. Ordningen hos adverben? nog inte korrekt inte nog ogrammatiskt Hur viktigt är det egentligen att skilja ut ogrammatiska konstruktioner från grammatiska? Vi återkommer till analys av ogrammatisk indata Hur bygger man en grammatik? Det finns ingen bok med grammatiska regler för svenska språket Utgå från någon grammatikbok Använd stora textmängder för att se var grammatiken läcker. Testa igen på stora textmängder, upprepa Alla grammatikor läcker. Se till så att alla meningar får någon form av analys/delanalys. Det är det viktiga. Lämna flertydigheter om de är svåra eller använd heuristik för att ta bort tolkningar, 100 analyser är inget system bekänt av 14

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till? Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar

Läs mer

Föreläsningens innehåll. Syntaxformalismer. Syntax - syntaxis (grek.) Språket. Kontextfria grammatiker. Syntax och grammatik

Föreläsningens innehåll. Syntaxformalismer. Syntax - syntaxis (grek.) Språket. Kontextfria grammatiker. Syntax och grammatik Föreläsningens innehåll Syntaxformalismer Ola Knutsson knutsson@nada.kth.se Snabb repetition av Särdrag, lexikon och syntax Särdrag och särdragbaserade formalismer Översikt över olika typer av formalismer

Läs mer

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,

Läs mer

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Frasstrukturgrammatik

Frasstrukturgrammatik 729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Innehåll Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Olika frastyper och regler för dessa Dependensgrammatik Olika

Läs mer

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax?

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax? Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Innehåll Olika frastyper och regler för dessa Dependensgrammatik Olika

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol)

Ordklasstaggning med funktionsordslexikon. Språklig ytanalys med regler. Jabberwocky (Källgren, 1992) Mer Jabberwocky (Lewis Carrol) Språklig ytanalys med regler Några olika system för: Ordklasstaggning Dependensgrammatik Constraint Grammar presenteras i detalj Ordklasstaggning med funktionsordslexikon Gunnel Källgrens MorP parser Den

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri

Läs mer

Grammatisk teori III Praktisk analys

Grammatisk teori III Praktisk analys Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Grundläggande syntaktiska funktioner och roller

Grundläggande syntaktiska funktioner och roller UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER/SATSDELAR Grundläggande syntaktiska funktioner och roller o Exemplen nedan kan få illustrera två grundläggande

Läs mer

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade

Läs mer

Sidan 1. En situation. En modell för satsproduktion. Fri ordföljd. Finska kasus. Bunden ordföljd

Sidan 1. En situation. En modell för satsproduktion. Fri ordföljd. Finska kasus. Bunden ordföljd En situation Syntax 4: Satsledens ordning ( ordföljd ) Föreläsning 11 Ordföljdens funktioner generellt Centrala drag i svenskans ordföljd Huvudsatsschemat Ordföljdsvariationer Litteratur: Nusvensk Grammatik

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

FL 6: Definite Clause Grammars (kap. 7)

FL 6: Definite Clause Grammars (kap. 7) FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor

Läs mer

Fraser, huvuden och bestämningar

Fraser, huvuden och bestämningar UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin

Läs mer

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer

Läs mer

Tekniker för storskalig parsning: Grundbegrepp

Tekniker för storskalig parsning: Grundbegrepp Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)

Läs mer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders

Läs mer

Språkgranskningsverktyg. Grammatikkontroll med Scarrie

Språkgranskningsverktyg. Grammatikkontroll med Scarrie Språkgranskningsverktyg Grammatikkontroll med Scarrie Strategi för grammatikkontroll Vision Fullständig parsning enligt en heltäckande grammatik som skiljer ut avvikande konstruktioner och diagnosticerar

Läs mer

Tenta i Lingvistik 729G08 ht10 ( )

Tenta i Lingvistik 729G08 ht10 ( ) Tenta i Lingvistik 729G08 ht10 (11-08-25) Skrivningen består av ett antal uppgifter (14) som ska lösas efter bästa förmåga. Uppgifterna bedöms enligt följande skala: 5p = mycket bra svar, 4p = bra svar,

Läs mer

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan

Läs mer

Djupstruktur och ytstruktur

Djupstruktur och ytstruktur Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)

Läs mer

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Satser och satsdelar Översikt i stolpform. Terminologin följer

Läs mer

Sidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ?

Sidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ? Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs Magnus Merkel 2006-02-13 Greta Jansson är 96 år. Han växte upp på landsbygden när man hade

Läs mer

Fraser och satsled. Språkets uppbyggnad. Definitioner. Språkets uppbyggnad. De fem frastyperna. Allmänt om fraser

Fraser och satsled. Språkets uppbyggnad. Definitioner. Språkets uppbyggnad. De fem frastyperna. Allmänt om fraser Språkets uppbyggnad Fraser och satsled Språkvetenskaplig databehandling Maria Holmqvist 2011-03-11 Ord som bildar Fraser som bildar Satser som bildar Meningar/yttranden som bildar Texter/dialoger/monologer

Läs mer

Korpuslingvistik vt 2007

Korpuslingvistik vt 2007 Korpuslingvistik vt 2007 Metoder för annotering II och utvärdering Beata B. Megyesi bea@stp.lingfil.uu.se 1 Annotation: Morfo-syntaktisk analys teckenkodning meningssegmentering tokenisering morfologisk

Läs mer

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin

Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin Datorlingvistisk grammatik OH-serie 1: introduktion http://stp.lingfil.uu.se/~matsd/uv/uv09/dlg/ LEKTION 1: innehåll Kursformalia Grammatik formell grammatik. Metod och data (lite). Språkteknologisk relevans.

Läs mer

Språkets struktur och funktion, 7,5 hp

Språkets struktur och funktion, 7,5 hp Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv10/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2010 Satser Satserna utgör den mest mångfacetterade

Läs mer

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala

Läs mer

Lingvistik IV Konstituenter och frasstruktur

Lingvistik IV Konstituenter och frasstruktur Lingvistik IV Konstituenter och frasstruktur Dagens föreläsning kommer att ta upp: Konstituenter (Fraser och satser) Fraser Frasstrukturer 1. Konstituenter När vi tittar på hur en mening är uppbyggd kan

Läs mer

Parsningens olika nivåer

Parsningens olika nivåer Parsning Språkteknologi DH418 Ola Knutsson 008 Varför parsning? Grammatikkontroll Fråge-svarsystem Maskinöversättning Semantisk analys (vad menas?) Testa grammatikformaliser och grammatiker (undvika länsstolslingvistik)

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ är konstruktioner (fraser) som innehåller ett predikat och ett subjekt (Josefssons, s. 151, definition, som är en vanlig definition).

Läs mer

Konstituenter och frasstruktur. 729G49 16 April

Konstituenter och frasstruktur. 729G49 16 April Konstituenter och frasstruktur 729G49 16 April Dagens föreläsning Konstituenter (Fraser och satser) Fraser Frasstrukturer Vad hände? Mannen bet hunden man -> man (rot) + en (suffix) [bestämd betydelse]

Läs mer

Matematik för språkteknologer

Matematik för språkteknologer 1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan

Läs mer

GÖTEBORGS UNIVERSITET Institutionen för svenska språket. Introduktion till frasstrukturgrammatik

GÖTEBORGS UNIVERSITET Institutionen för svenska språket. Introduktion till frasstrukturgrammatik GÖTEBORGS UNIVERSITET Institutionen för svenska språket Introduktion till frasstrukturgrammatik Benjamin Lyngfelt 2004 Innehåll 1. Introduktion 1 1.1. Jämförelse med traditionell satsdelsanalys 2 1.2.

Läs mer

Partiell parsning Parsning som sökning

Partiell parsning Parsning som sökning Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater

Läs mer

Lingvistik V Satsdelar, huvud- och bisatser

Lingvistik V Satsdelar, huvud- och bisatser Lingvistik V Satsdelar, huvud- och bisatser 1. Form och funktion I språklig analys gör man en skillnad mellan en konstituents form, dvs hur den är morfologiskt och syntaktiskt uppbyggd, och dess funktion,

Läs mer

Automatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA

Automatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord

Läs mer

2. Utgångspunkter och angreppssätt för automatisk språkgranskning

2. Utgångspunkter och angreppssätt för automatisk språkgranskning Översikt och läsanvisning 2. Utgångspunkter och angreppssätt för automatisk språkgranskning Detta kapitel beskriver utgångspunkter och angreppssätt för automatisk språkgranskning för svenska. I kapitlet

Läs mer

Världens språk, 7,5hp vt 2012

Världens språk, 7,5hp vt 2012 Niklas Edenmyr niklas.edenmyr@lingfil.uu.se Världens språk, 7,5hp vt 2012 2. Språkets arkitektur I: Texter, meningar och satser; Huvud- och bisatser; Samordning och underordning; Grammatiska relationer;

Läs mer

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Maskinöversättning och språkgranskning. F6: Grammatikkontroll Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.

Läs mer

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,

Läs mer

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara

Läs mer

Ord och morfologi. Morfologi

Ord och morfologi. Morfologi Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande

Läs mer

Neurolingvistik - Grammatik

Neurolingvistik - Grammatik Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -

Läs mer

Satsdelar. Carina

Satsdelar. Carina Satsdelar 1 Huvudsats och bisats HUVUDSATS: Ger den viktiga informationen: verbhandlingen och vem som utför den. Kännetecken: Kan stå för sig själv. (Pojken kom inte till skolan idag). BISATS: Ger övrig

Läs mer

Syntax 1: Fraser och satsled Syntax 2: Satser och meningar

Syntax 1: Fraser och satsled Syntax 2: Satser och meningar Byggstenar Syntax 1: Fraser och satsled Syntax 2: Satser och meningar Föreläsning 6-7 Bolander kapitel 6 Lingvistik grundkurs Magnus Merkel 15 september & 17 september Sats Satsled Fraser s Ord Morfem

Läs mer

Satsled och satstruktur

Satsled och satstruktur Innehåll Satsled och satstruktur Språkvetenskaplig databehandling Maria Holmqvist 2011-03-14 Repetition: Ordklasser och fraser Satsled Satsledsanalys Syntaktiska kategorier vs. Syntaktiska relationer Satser

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk

Läs mer

Lingvistiskt uppmärkt text

Lingvistiskt uppmärkt text 729G09 Språkvetenskaplig databehandling (2018) Lingvistiskt uppmärkt text Marco Kuhlmann Institutionen för datavetenskap Korpusdata: Ett konkret exempel 1 Genom genom ADP 2 case 2 skattereformen skattereform

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. En dag upptäcker min treåriga dotter (1) att det finns kärnor i äpplen. En snabb (2) genomgång av hur och varför visar (3) sig bli

Läs mer

TDDC89 LINGVISTIK måndag 20 oktober 2008

TDDC89 LINGVISTIK måndag 20 oktober 2008 Magnus Merkel Lars Ahrenberg Institutionen för datavetenskap Linköpings universitet RÄTTNINGSMALL TDDC89 LINGVISTIK måndag 20 oktober 2008 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 p ger säkert

Läs mer

Förord KERSTIN BALLARDINI

Förord KERSTIN BALLARDINI Förord Det här häftet är avsett för dig som redan har ett visst ordförråd i svenska, men som behöver få en klar bild av vilka typer av satser som finns i språket, vilka former de har och vilken funktion

Läs mer

Trädrepresentation. Parentesrepresentation

Trädrepresentation. Parentesrepresentation - 17 - BENGT SIGURD Inst för Fonetik och Lingvistik, LUNDS Universitet Helgonabacken 12, S-22362 LUND REFERENTGRAMMATIK - EN KORT PRESENTATION Satsdelsanalvs (funktionell analvs) I analys av meningar och

Läs mer

Satslära introduktion

Satslära introduktion Satslära introduktion Dolores Meden Dolores Meden 2010-08-27 1 Skillnaden mellan ordklass och ett ords funktion (syntax): * ett ords tillhörighet i en ordklass är konstant och påverkas inte av användningen

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Kontextfria grammatiker

Kontextfria grammatiker Kontextfria grammatiker Kontextfria grammatiker 1 Kontextfria grammatiker En kontextfri grammatik består av produktioner (regler) på formen S asb S T T # Vänsterledet består av en icke-terminal (variabel)

Läs mer

Obesvarade frågor från F1

Obesvarade frågor från F1 Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB? Språkgranskningsverktyg F4: Grammatikkontroll

Läs mer

MÖSG ht 2005 Maskinöversättningssystemet MATS

MÖSG ht 2005 Maskinöversättningssystemet MATS MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Introduktion till formella metoder Programmeringsmetodik 1. Inledning

Introduktion till formella metoder Programmeringsmetodik 1. Inledning Introduktion till formella metoder Programmeringsmetodik 1. Inledning Fokus på imperativa program (ex. C, Java) program betyder härefter ett imperativt program Program bestäms i en abstrakt mening av hur

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Facit för diagnostiska provet i grammatik

Facit för diagnostiska provet i grammatik Facit för diagnostiska provet i grammatik Textutdrag: De tio vanligaste namnen på honhundar i Sverige är också vanliga kvinnonamn. Mest sällsynt är Bella med 1065 bärare, men åtskilliga av landets 11 954

Läs mer

*han är nyss bekymrad b)pp kan i motsats till de flesta andra Adj. aldrig ta en gradkvantor (som t.ex. mycket):

*han är nyss bekymrad b)pp kan i motsats till de flesta andra Adj. aldrig ta en gradkvantor (som t.ex. mycket): OM SVENSKA ADJEKTIV Sven-Göran Malmgren Adjektiviska funktioner i svenskan Nordistica Gothoburgensia 13. Acta Universitatis Gothoburgensis, Göteborg 1990. II + 231 s. ISBN 91-7346-206-3 Syftet med denna

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

DD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin

DD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 4 Per Austrin 2015-11-20 Idag Rekursiv medåkning, fortsättning Olika klasser av språk och grammatiker Parsergeneratorer Sammanfattning

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. (1) Tidigt i gryningen påbörjade han sin (2) förvandling. Han hade (3) noga planerat allting för att (4) ingenting (5) skulle kunna

Läs mer

Lexikon: ordbildning och lexikalisering

Lexikon: ordbildning och lexikalisering Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke

Läs mer

Kompositionell semantik och λ-kalkyl

Kompositionell semantik och λ-kalkyl UPPALA UIVERITET http://stp.ling.uu.se/~matsd/uv/uv05/ads1/ Institutionen för lingvistik och filologi Mats Dahllöf mats.dahllof@lingfil.uu.se Algoritmer för datorlingvistisk semantik I, Föreläsningsanteckningar,

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Lingvistiska grundbegrepp

Lingvistiska grundbegrepp 729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga

Läs mer

Lingvistik V Satsdelar, huvud- och bisatser. 729G49 23 april

Lingvistik V Satsdelar, huvud- och bisatser. 729G49 23 april Lingvistik V Satsdelar, huvud- och bisatser 729G49 23 april Form och funktion Primära satsdelar Satser Form och funktion Formklassifikationen berori huvudsakpå konstituenternas interna strukturella egenskaper

Läs mer

Struktur och funktion i satser en introduktion till satsträd Niklas Edenmyr (Inst. f. lingvistik & filologi)

Struktur och funktion i satser en introduktion till satsträd Niklas Edenmyr (Inst. f. lingvistik & filologi) truktur och funktion i satser en introduktion till satsträd Niklas Edenmyr (Inst. f. lingvistik & filologi) Innehåll 1 Förkortningar och satsträdskonventioner...2 1.1 atser och fraser och andra trädkonstituenter...2

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. Då jag föddes i juli 1918 hade mor (1) spanska sjukan, jag var i dåligt skick och (2) nöddöptes på sjukhuset. En dag fick familjen

Läs mer

UPPSALA UNIVERSITET Institution för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf HT 2015 (korrigerad 151126) Depdsgrammatik Dna introduktion till depdsgrammatik försöker följa d standard

Läs mer

Statistisk grammatikgranskning

Statistisk grammatikgranskning Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert

Läs mer

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil?

Varför är morfologi viktigt? Morfologisk analys och generering. Vad är ett ord (idag vs. i dag) Kan man inte lägga alla ord i en lexikonfil? Morfologisk analys och generering Språkteknologi för språkkonsulter Ola Knutsson 2009 Varför är morfologi viktigt? Ord är grunden i alla världens språk Alla språkteknologiska aktiviteter kräver kunskap

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Semantik och pragmatik (Serie 3)

Semantik och pragmatik (Serie 3) Semantik och pragmatik (Serie 3) Satser och logik. Mats Dahllöf Institutionen för lingvistik och filologi April 2015 1 / 37 Logik: språk tanke (Saeed kapitel 4.) Satser uttrycker (ofta) tankar. Uttrycksrikedom

Läs mer

De som (som) vi använder

De som (som) vi använder De som (som) vi använder En korpusstudie av optionellt som i svenska objektsrelativsatser Henriette Matz Institutionen för lingvistik C-uppsats 15 hp Allmän språkvetenskap Kandidatuppsats i lingvistik

Läs mer

Implementering av partikelverb för projektet Datorstödd inlärning av grammatik och språkteori

Implementering av partikelverb för projektet Datorstödd inlärning av grammatik och språkteori Stockholms Universitet 1996 Institutionen för Lingvistik Implementering av partikelverb för projektet Datorstödd inlärning av grammatik och språkteori Beáta Megyesi Påbyggnadskurs i datorlingvistik C-uppsats,

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

Grammatik skillnader mellan svenska och engelska

Grammatik skillnader mellan svenska och engelska UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning

Läs mer

Formell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet

Formell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet Formell logik Kapitel 1 och 2 Robin Stenwall Lunds universitet Kapitel 1: Atomära satser Drömmen om ett perfekt språk fritt från vardagsspråkets mångtydighet och vaghet (jmf Leibniz, Russell, Wittgenstein,

Läs mer

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. o Ofta fogas

Läs mer