Datorlingvistisk grammatik
|
|
- Leif Bengtsson
- för 8 år sedan
- Visningar:
Transkript
1 Datorlingvistisk grammatik Kontextfri grammatik, m.m. Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker, mest kontextfri. Beskriva språk m.h.a. kontextfri grammatik. Linjär precedens Konstituens Kategorisering Visst överlapp med och repetition av saker från Matematik för språkteknologer. 1 2 Formell kontra traditionell grammatik Tendenser (men mkt gemensamt, olika användning): Handkodad grammatik kontra maskinlärning Tendenser i språkteknologin, grovhuggen bild: traditionell grammatik vaghet heterogenitet implicithet robust ofta preskriptiv ej direkt implementerbar redan de gamla grekerna formell grammatik precision systematik explicithet begränsad täckning vetenskaplig, empirisk typiskt implementerbar 1900-talssak handkodning maskininlärning tal senaste decenniet personalintensivt dataintensivt - trädbanker språkspecifikt tvärspråkliga metoder allmän grammatikteori ST-orienterade metoder kvalitativ värdering kvantitativ värdering begränsad täckning fokus på robusthet 3 4
2 Kategorisk vs heuristisk analys Kategorisk regler: Objekt antingen exemplifierar en kategori eller gör det inte. Inga grader. Absoluta regler. Rätt/fel. (Grammatik i lingvistiken är ofta sådan.) Heuristiska principer: Grader av exemplifierande. Osäkerhet. Kan bygga på statistik/sannolikhetsberäkningar. (Vanligt inom språkteknologin.) Inga anspråk på 100% korrekthet. Formell grammatik: konstituens Konstituens: abstrakt del-helhetsbegrepp. Enkla konstituenter: (typiskt) ord. Sammansatta konstituenter: fraser. omedelbar vs medelbar konstituens (föräldrar dominerar barn) konstituensen placerar noderna i ett rotat träd visas t.ex. som en graf: omedelbar konstituens blir streck eller genom bracketing : [i [lådan [på [vinden]]]] 5 6 Linjär precedens = grammatikens abstrakta linjära ordning, (ordföljd och frasföljd) Syntaxträd (med kategorietiketter) S motsvarar före efter i tal NP VP motsvarar vänster höger i skrift (Kan glömmas bort, eftersom man fångar informationen gratis genom talets flöde i tiden och skriftens riktning på pappret.) det en n katt v såg det flera NP n hundar 7 8
3 Grammatisk beskrivning av noder Noderna svarar mot ord, fraser, satser och meningar. Vi vill antagligen knyta en beskrivning av det språkliga uttrycket till varje nod. Enkel sak: en kategorisymbol. Mer utvecklat: Strukturerade beskrivningar, t.ex. särdragsstrukturer (senare på kursen). Syntaxträd, vanliga begränsningar Syntaxträd brukar lyda följande begränsningar: Omedelbara konstituensen (OK) ger just en trädstruktur (utifrån ett ändligt antal noder). Träd (typ av graf): En nod har ingen förälder; alla andra har precis en; ingen cirkularitet. (Noder som saknar barn kallas löv.) Linjär precedens överensstämmer med OK: Varje fras är linjärt kontinuerlig. (Inga korsande grenar.) M.a.o. linjär precedens ger ett ordnat träd. Precis en kategori per nod Språk och grammatik i formell bemärkelse i formell, matematisk mening (Chomsky). Ett språk är en mängd strängar En grammatik definierar ett språk. En grammatik definierar en mängd syntaktiska strukturer (t.ex. träd) och därmed ett språk (eftersom vi kan läsa av en ordsträngen ur varje träd). Detta är perspektivet i matematisk lingvistik. Olika typer av formell grammatik Det finns olika typer av grammatiker som kan definiera olika klasser av oändliga språk, t.ex. Reguljära uttryck Kontextfria grammatiker (CFG) Det finns andra grammatiktyper som analyseras inom matematiska lingvistiken. Chomskyhierarkin är den mest kända uppställningen
4 Chomskyhierarkin Avser klasser av automater, grammatiker och språk. typ automat grammatik språk 0 Turingmaskin obegränsad rekursivt enumerabla 1 linjärt begränsad a. kontextkänslig kontextkänsliga 2 stackmaskin kontextfri kontextfria 3 ändlig a. linjär reguljära (reguljära uttryck) 0 3: Fallande beräkningsmässig styrka, ökande uttrycksmässiga begränsningar, mindre klasser av språk. Obegränsad grammatik, typ 0 En obegränsad grammatik (omskrivningssystem) är en kvadrupel N,T,P,Σ, där N är en mängd icke-terminaler (kategorisymboler), T är en mängd terminaler (ord), P är en mängd produktioner och Σ är en startsymbol. En produktion är av formen α β, där α är en icke-tom sträng över N T (terminaler och icke-terminaler) och β är en sträng över N T Grammatiker härledning språk Givet ett omskrivningssystem N,T,P,Σ kan man härleda: Strängen Σ (sträng av ensam startsymbol). Givet att α β P och att en sträng xαy (över N T) kan härledas (där x och y är godtyckliga strängar över N T ), så kan xβy härledas. Ett omskrivningssystem definierar det språk (i Chomskys mening) som består av alla de strängar av icke-terminaler som kan härledas. Varje språk i Chomskyhierarkin kan definieras på detta sätt. (Typ 0.) Begränsade grammatiktyper, typ 1 Givet definitionen av omskrivningssystem kan vi ställa hårdare krav på produktionerna. Typ 1, kontextkänslig grammatik: Alla produktioner är av formen X 1 CX 2 X 1 βx 2, där C N (d.v.s. är en icke-terminal), X 1,X 2 N T {ε} (d.v.s. är en terminal, icke-terminal eller tomma strängen). Alltså, C får bara skrivas om till β när det förekommer i en viss kontext, alltså X 1 och X 2. (Mellan ε och ε betyder överallt.) 15 16
5 Typ 1, alternativ definition Typ 1, kontextkänslig grammatik. Alternativt begrepp: Alla produktioner är av formen α β, där β längre än eller lika lång som α. Detta ger en annan sorts grammatik, men den har precis samma styrka som kontextkänslig grammatik enligt tidigare definition. Denna kan kallas icke-kontraktiv grammatik (men kallas även den kontextkänslig grammatik). Begränsade grammatiktyper, typ 2 Givet definitionen av omskrivningssystem kan vi ställa än hårdare krav på produktionerna. Typ 2, kontextfri grammatik Enbart produktioner av typen C β, där där C N (d.v.s. är en icke-terminal). Kontextfri i jämförelse med kontextkänslig grammatik Begränsade grammatiktyper, typ 3 Givet ett definitionen av omskrivningssystem kan vi ställa hårdare krav på produktionerna. Typ 3, högerlinjär grammatik. Enbart produktioner av typen C 1 tc 2 och C 1 t, där C 1,C 2 N (d.v.s är icke-terminaler) och t T (d.v.s. är en terminal). Alternativt begrepp: Spegelvända begreppet vänsterlinjär grammatik ger samma beräkningsmässiga styrka. Reguljära uttryck: semantik (repetition) Reguljära uttryck är ett annat sätt att definiera språk av typ 3 (s.k. reguljära språk). Basuttryck: D(ε) = {ε}. Om s Σ, där Σ är alfabetet, så D(s) = {s}. Konkatenering (ibland skrivs mer explicit R 1 R 2 istället för R 1 R 2 ): D(R 1 R 2 ) = {xy x D(R 1 ) och y D(R 2 )}
6 Reguljära uttryck: semantik (repetition) Union (alternativitet) (ibland skrivs R 1 R 2 istället för R 1 R 2 ) D(R 1 R 2 ) = {x x D(R 1 ) eller x D(R 2 )}. Kleenehölje (godtycklig självkonkatenering) D(R ) = {x 1 x 2...x n n 0 och x i D(R)} Förkortade skrivsätt: R + för RR. (R) (optionalitet i SWB 2.2.2) för R ε. Kontextfri grammatik (CFG) träd För en CFG gäller att ett träd tillåts av omm: Rotnoden (den utan förälder) är märkt med grammatikens startsymbol. Varje föäldranod med barn (=lokalt träd) matchar en regel i grammatiken. Lövnoderna (lexikala, terminala) matchar lexikoningångar. En sträng tillåts av grammatiken om det finns ett motsvarande träd Syntaxträd, regler, lexikon CFG, ännu mer formellt NP det n en katt S v såg VP det flera NP n hundar S NP VP NP det n VP v NP det en n katt v såg det flera n hundar Vanligt sätt att definiera en CFG formellt: En CFG är en kvadrupel N, T, P, Σ, där N är mängden icke-terminaler (kategorisymboler), T är mängden terminaler (ord), P är mängden av regler (inklusive lexikoningångar) och Σ är startsymbol. En CFG definierar en mängd träd och en mängd strängar icke-terminaler (alltså ett språk i Chomskys mening)
7 CFG, ännu mer formellt, exempel Exempel på en CFG, N,T,P,Σ (utifrån tidigare träd): N = {S, NP, VP det, n, v} T = {en, flera, hundar, katt, såg} P = { S NP VP, NP det n, VP v NP, det en, n katt, v såg, det flera, n hundar } Σ =S CFG och naturligt språk En CFG kommer i bästa fall att kunna fånga en delmängd (ett fragment) av ett naturligt språk. Kategorierna måste fånga alla syntaktiskt viktiga distinktioner. (De bildar en platt taxonomi.) En bra grammatik för ett fragment bör (liksom varje teoretisk redogörelse) vara så enkel så möjligt Fraser/konstituenter: distribution Distribution: Vilka grammatiska satskontexter ett uttryck kan förekomma i. Om två fraser har olika distribution så finns det grammatiska satser i vilka det ena uttrycket förekommer och där det inte kan bytas mot det andra utan att grammatikaliteten fördärvas. den lilla hunden och den stora katten har samma distribition. den lilla hunden och det stora djuret har olika distribution: Den lilla hunden är snäll. *Det stora djuret är snäll. Fraser/konstituenter: syntaktiska kategorier Grundprincip: Fraser med samma distribution tillhör samma kategori. Fraser med olika distribution tillhör olika kategorier. Vi måste kunna skilja på den lilla hunden och det stora djuret kategorimässigt. Vi använder ofta också vidare kategorier: Begreppet nominalfras täcker in många olika nominalfraser som vi måste kunna skilja på
8 Problem med atomära beskrivningar Om vi i en kontextfri grammatik har en kategori för substantiv i singularis obestämd form neutrum, nson, och en för substantiv i singularis obestämd form utrum, nsou, så blir nson och nsou lika olika som nson och VP. Viktig observation: Grammatisk information är flerdimensionell: Vi behöver molekylära /dekomponerade/faktoriserade beskrivningar. Annars kan vi inte uttrycka många generaliseringar som vi borde kunna fånga. Problem med atomära beskrivningar Om vi i en kontextfri grammatik har en kategori för substantiv i singularis obestämd form neutrum, nson, och en för substantiv i singularis obestämd form utrum, nsou, så blir nson och nsou lika olika som nson och VP. Vi måste ha massor av regler för att få till alla sekvenser av t.ex. determinerare adjektivfras substantiv (i NP), en för varje kongruensfall. (Övning: skriv ner alla regler som behövs och ange hur lexikoningångar måste se ut.) CFG tillåter ingenting enklare, p.g.a. att taxonomin är platt Problem med atomära beskrivningar Grammatisk information är flerdimensionell: Vi behöver molekylära /dekomponerade/faktoriserade beskrivningar i grammatiken. Det finns många generaliseringar som vi borde kunna fånga med som CFG inte tillåter oss att uttrycka. Exempel, två ord hund huset ordklass subst. subst. (samma) numerus sing. sing. (samma) genus utrum neutrum (olika) species obest. best. (olika) Orden har en några gemensamma särdrag och några som skiljer dem åt
Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin
Datorlingvistisk grammatik OH-serie 1: introduktion http://stp.lingfil.uu.se/~matsd/uv/uv09/dlg/ LEKTION 1: innehåll Kursformalia Grammatik formell grammatik. Metod och data (lite). Språkteknologisk relevans.
Läs merGrammatik för språkteknologer
Grammatik för språktekologer Språktekologi och grammatiska begrepp http://stp.ligfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Istitutioe för ligvistik och filologi November 2011 Dea serie Frasstrukturaalys
Läs merMatematik för språkteknologer
1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merAutomatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA
Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merFrasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merIdag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Först några definitioner: Alfabet = en ändlig mängd av tecken. Ex. {0, 1}, {a,b}, {a, b,..., ö} Betecknas ofta med symbolen Σ Sträng =
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merLite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer
Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders
Läs merFöreläsning 7: Syntaxanalys
DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.
Läs merFraser, huvuden och bestämningar
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin
Läs merMatematik för språkteknologer (5LN445) Institutionen för lingvistik och filologi VT 2014 Författare: Marco Kuhlmann 2013
UPPSALA UNIVERSITET Matematik för språkteknologer (5LN445) Institutionen för lingvistik och filologi VT 2014 Författare: Marco Kuhlmann 2013 4 Grafer En graf är en struktur av prickar förbundna med streck.
Läs merSemantik och pragmatik (serie 5)
Semantik och pragmatik (serie 5) (Predikat)logik Mängdlära överkurs (och repetition för en del). Mats Dahllöf Institutionen för lingvistik och filologi April 2015 1 / 41 Korsning av två egenskaper E 1
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade
Läs merInnehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax?
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Innehåll Olika frastyper och regler för dessa Dependensgrammatik Olika
Läs merInlämningsuppgift MiniPlotter
LUNDS TEKNISKA HÖGSKOLA Institutionen för datavetenskap EDAA01 Programmeringsteknik fördjupningskurs Inlämningsuppgift MiniPlotter I den här uppgiften ska ett program som ritar grafer av matematiska funktioner
Läs merTekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Läs merInnehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Innehåll Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Olika frastyper och regler för dessa Dependensgrammatik Olika
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merPROV I MATEMATIK Automatateori och formella språk DV1 4p
UPPSALA UNIVERSITET Matematiska institutionen Salling (070-6527523) PROV I MATEMATIK Automatateori och formella språk DV1 4p 19 mars 2004 SKRIVTID: 15-20. POÄNGGRÄNSER: 18-27 G, 28-40 VG. MOTIVERA ALLA
Läs merFL 6: Definite Clause Grammars (kap. 7)
FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor
Läs merProgrammering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater
Programmering för språkteknologer II OH-serie: ändliga automater reguljära uttryck i Java Mats Dahllöf Ändliga automater Abstrakt maskin, tillståndsmaskin, transitionssystem. (Den enklaste typ man brukar
Läs merLogisk semantik I. 1 Lite om satslogik. 1.1 Konjunktioner i grammatisk bemärkelse. 1.2 Sant och falskt. 1.3 Satssymboler. 1.
UPPSALA UNIVERSITET Datorlingvistisk grammatik I Institutionen för lingvistik och filologi Oktober 2007 Mats Dahllöf http://stp.ling.uu.se/ matsd/uv/uv07/dg1/ Logisk semantik I 1 Lite om satslogik 1.1
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merFöreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk
Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två
Läs merDAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Läs merMatematik för språkteknologer
1 / 27 Matematik för språkteknologer 2.3 (Relationer och funktioner) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 27 Dagens nya punkter Relationer Definitioner Egenskaper hos
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merKontextfri grammatik (CFG)
Kotextfri grammatik (CFG) Mats Dahllöf Ist. f ligvistik och filologi December 2015 1 / 23 Frasstrukturträd hud studt Aalys av de ord som häger lägst ed, hud studt. E graf med fler oder ä depdsaalys (fem
Läs merSemantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse
Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar
Läs merb) S Ø aa, A Ø aa» bb, B Ø aa» bc, C Ø ac» bc» 2. Låt L vara språket över 8a< som nedanstående NFA accepterar.
Salling, 070-6527523 TID : 9-14 HJÄLPMEDEL : Inga BETYGSGRÄNSER : G 18p, VG 28p SKRIV TYDLIGT OCH MOTIVERA NOGA! PROV I MATEMATIK AUTOMATEORI & FORMELLA SPRÅK DV1, 4 p 20 MARS 2002 1. Språket L över alfabetet
Läs merReguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm
Syntaxanalys Douglas Wikström KTH Stockholm popup-help@csc.kth.se Reguljära uttryck Reguljära uttryck förutsätter att en mängd bokstäver är givna, ett så kallat alfabet, som oftast betecknas med Σ. Uttryck
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs merAutomater. Matematik för språkteknologer. Mattias Nilsson
Automater Matematik för språkteknologer Mattias Nilsson Automater Beräkningsmodeller Beräkning - (eng) Computation Inom automatateorin studeras flera olika beräkningsmodeller med olika egenskaper och olika
Läs merIntroduktion till formella metoder Programmeringsmetodik 1. Inledning
Introduktion till formella metoder Programmeringsmetodik 1. Inledning Fokus på imperativa program (ex. C, Java) program betyder härefter ett imperativt program Program bestäms i en abstrakt mening av hur
Läs merUPPSALA UNIVERSITET Institution för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf HT 2015 (korrigerad 151126) Depdsgrammatik Dna introduktion till depdsgrammatik försöker följa d standard
Läs merFORSKNINGSMETODIK OCH VETENSKAPSTEORI FÖR SPRÅKVETARE: FORMELLA METODER
Mats Dahllöf, Institutionen för lingvistik, Uppsala universitet 2002-02-28 FORSKNINGSMETODIK OCH VETENSKAPSTEORI FÖR SPRÅKVETARE: FORMELLA METODER I. FORMELL METOD att arbeta vetenskapligt med formella
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 6 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2013 Tillämpningar av semantik allmänt Analys av grammatik:
Läs merSyntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax
Syntax S NP VP AdjP NP JJ AdjP JJ NP N V sleep AdvP Adv Colorless green ideas furiously DH2418 Språkteknologi Johan Boye Syntax Frågor vi vill besvara: Vilka sekvenser av ord tillhör språket? Vilka relationer
Läs merParsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion
Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som
Läs merKompositionell semantik och λ-kalkyl
UPPALA UIVERITET http://stp.ling.uu.se/~matsd/uv/uv05/ads1/ Institutionen för lingvistik och filologi Mats Dahllöf mats.dahllof@lingfil.uu.se Algoritmer för datorlingvistisk semantik I, Föreläsningsanteckningar,
Läs merGrim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Läs merNeurolingvistik - Grammatik
Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 3 Per Austrin 2015-11-13 Huvudkoncept hittils: Snabb repetition Formellt språk en mängd strängar Reguljära språk den klass av formella
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv10/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2010 Satser Satserna utgör den mest mångfacetterade
Läs merORDKLASSERNA I. Ett sätt att sortera våra ord
ORDKLASSERNA I Ett sätt att sortera våra ord Vilka ordklasser finns det? Hur många kan ni komma på? 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Hur sorterar man orden? Morfologiskt Syntaktiskt Semantiskt SUBSTANTIV
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ är konstruktioner (fraser) som innehåller ett predikat och ett subjekt (Josefssons, s. 151, definition, som är en vanlig definition).
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs mer1 Inledning. 1.1 Programförklaring. 1.2 Innehållet. 1.3 Beteckningskonventioner - 1 -
- 1-1 Inledning 1.1 Programförklaring Detta kompendium är utvecklat för en introduktionskurs i datalingvistik som vänder sig till studenter med tidigare kännedom om grundläggande lingvistik och datavetenskap.
Läs merFTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
Läs merSärdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,
Läs merSemantik och pragmatik (Serie 3)
Semantik och pragmatik (Serie 3) Satser och logik. Mats Dahllöf Institutionen för lingvistik och filologi April 2015 1 / 37 Logik: språk tanke (Saeed kapitel 4.) Satser uttrycker (ofta) tankar. Uttrycksrikedom
Läs merGrundläggande textanalys, VT2012
Grundläggande textanalys, VT2012 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv12/gta/ (Tack till ofia Gustafson-Capkovâ för material.) Repetition 2 Exempel parvspråket
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merMatematik för språkteknologer
1 / 23 Matematik för språkteknologer Mängdlära Mats Dahllöf Institutionen för lingvistik och filologi Januari 2015 Mängdlära matematik för kategorier En mängd svarar mot en helt godtycklig kategori. Elementrelationen
Läs merSidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ?
Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs Magnus Merkel 2006-02-13 Greta Jansson är 96 år. Han växte upp på landsbygden när man hade
Läs merGrafer. 1 Grafer. Grunder i matematik och logik (2015) 1.1 Oriktade grafer. Marco Kuhlmann
Marco Kuhlmann 1 En graf är en struktur av prickar förbundna med streck. Ett tidsenligt exempel på en sådan struktur är ett social nätverk, där prickarna motsvarar personer och en streck mellan två prickar
Läs merTDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg
TDDD02 Föreläsning 2 HT-2013 Reguljära uttryck och reguljära språk Lars Ahrenberg Översikt Reguljära uttryck sökproblem i texter definitioner och exempel UNIX-funktionen grep Reguljära transformationer
Läs merOrd och morfologi. Morfologi
Ord och morfologi DD2418 Språkteknologi Johan Boye Morfologi Läran om hur orden är uppbyggda av mindre betydelsebärande enheter som kallas morfem. Morfem tillhör en av två klasser: stam: den grundläggande
Läs mer7, Diskreta strukturer
Objektorienterad modellering och diskreta strukturer 7, Diskreta strukturer Sven Gestegård Robertz Datavetenskap, LTH 2013 1 Inledning 2 Satslogik Inledning Satslogiska uttryck Resonemang och härledningar
Läs merLingvistik IV Konstituenter och frasstruktur
Lingvistik IV Konstituenter och frasstruktur Dagens föreläsning kommer att ta upp: Konstituenter (Fraser och satser) Fraser Frasstrukturer 1. Konstituenter När vi tittar på hur en mening är uppbyggd kan
Läs merKontextfria grammatiker
Kontextfria grammatiker Kontextfria grammatiker 1 Kontextfria grammatiker En kontextfri grammatik består av produktioner (regler) på formen S asb S T T # Vänsterledet består av en icke-terminal (variabel)
Läs merBER AKNINGSBARHET F OR DATALOGER. Kent Petersson. Institutionen for Datavetenskap Goteborgs Universitet / Chalmers Goteborg, Sweden
BER AKNINGSBARHET F OR DATALOGER Fran till P Kent Petersson Institutionen for Datavetenskap Goteborgs Universitet / Chalmers 412 96 Goteborg, Sweden ii Kent Petersson Department of Computer Science Goteborgs
Läs merAlfabeten, strängar och språk. String
Alfabeten, strängar och språk Objektorienterad modellering och diskreta strukturer / design Språk och reguljära uttryck Ett alfabet är en ändlig icketom mängd vars element kallas symboler. Lennart Andersson
Läs merMorfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2013 Kursens lärandemål (ur kursplanen) (LM 1) förklara grunderna
Läs merFacit för diagnostiska provet i grammatik
Facit för diagnostiska provet i grammatik Textutdrag: De tio vanligaste namnen på honhundar i Sverige är också vanliga kvinnonamn. Mest sällsynt är Bella med 1065 bärare, men åtskilliga av landets 11 954
Läs mergrammatik Ordklasser, nominalfraser, substantiv
Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,
Läs merOrdklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Ordklasser Särdrag, lexikon och syntax Ola Knutsson knutsson@nada.kth.se Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv,
Läs merInstruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python
Instruktioner - Datortentamen TDDD73 Funktionell och imperativ programmering i Python Hjälpmedel Följande hjälpmedel är tillåtna: Exakt en valfri bok, t.ex. den rekommenderade kursboken. Boken får ha anteckningar,
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merOrdklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?
Ordklasser Särdrag, lexikon och syntax Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Öppna klasser: substantiv, adjektiv, verb, adverb Ständiga nybildningar
Läs merRelationer och funktioner
Relationer och funktioner Joakim Nivre Uppsala universitet Institutionen för lingvistik och filologi Översikt Relationer: Binära relationer på mängder Mängd-, graf- och matrisnotation Egenskaper hos relationer
Läs merExplorativ övning 9 RELATIONER OCH FUNKTIONER
Explorativ övning 9 RELATIONER OCH FUNKTIONER Övningens syfte är att bekanta sig med begreppet relation på en mängd M. Begreppet relation i matematiska sammanhang anknyter till betydelsen av samma ord
Läs merLexikon: ordbildning och lexikalisering
Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke
Läs mer3 Relationer och funktioner
UPPSALA UNIVERSITET Föreläsningsanteckningar Institutionen för lingvistik och filologi Grundläggande datalogi II Mats Dahllöf http://stp.ling.uu.se/~matsd/uv/uv04/gd2/ Augusti 2004 3 Relationer och funktioner
Läs merMÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP
MÄLARDALENS HÖGSKOLA CD5560 Formella språk, automater och beräkningsteori Användarmanual för simulatorn JFLAP Innehållsförteckning Att komma igång med JFLAP... 3 Att köra en sträng... 5 Att köra flera
Läs merGrafer och grannmatriser
Föreläsning 2, Linjär algebra IT VT2008 Som avslutning på kursen ska vi knyta samman linjär algebra med grafteori och sannolikhetsteori från första kursen. Resultatet blir så kallade slumpvandringar på
Läs merLabb 1 - Textbearbetning med reguljära uttryck. Formella språk. Definitioner. Chomskyhierarkin. Formella språk. Formella språk
Labb 1 - Textbearbetning med reguljära uttryck Textbearbetning: Dela upp en text i meningar Hitta alla namn i en text Hitta adjektiv i superlativ Lektion reguljära uttryck re modulen i Python Formella
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 4 Per Austrin 2015-11-20 Idag Rekursiv medåkning, fortsättning Olika klasser av språk och grammatiker Parsergeneratorer Sammanfattning
Läs merSatser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Satser och satsdelar Översikt i stolpform. Terminologin följer
Läs merViktiga frågor att ställa när ett argument ska analyseras och sedan värderas:
FTEA12:2 Föreläsning 2 Grundläggande argumentationsanalys II Repetition: Vid förra tillfället började vi se närmre på vad som utmärker filosofisk argumentationsanalys. Vi tittade närmre på ett arguments
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Kursens lärandemål (ur kursplanen) (LM 1) förklara grunderna
Läs merStatistisk grammatikgranskning
Statistisk grammatikgranskning Johnny Bigert johnny@nada.kth.se Traditionell grammatikgranskning Hitta stavningsfel och grammatiska fel: Regler Lexikon Traditionell grammatikgranskning Fördelar: Säkert
Läs merSemantik och pragmatik
Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext
Läs merKartläggning och bedömning av nyanlända elevers kunskaper och språkutveckling
Kartläggning och bedömning av nyanlända elevers kunskaper och språkutveckling Stockholm, 30 januari 2015 Sofia Engman och Mikael Olofsson, Institutionen för språkdidaktik vid Stockholms universitet Vår
Läs merGenerellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:
FTEA12:2 Föreläsning 3 Att värdera en argumentation I: Vad vi hittills har gjort: beaktat argumentet ur ett mer formellt perspektiv. Vi har funnit att ett argument kan vara deduktivt eller induktivt, att
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 3 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Lexikal semantik/begrepp (förra gången) Vaghet kontra
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merGrammatisk teori III Praktisk analys
Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas
Läs merKonstituenter och frasstruktur. 729G49 16 April
Konstituenter och frasstruktur 729G49 16 April Dagens föreläsning Konstituenter (Fraser och satser) Fraser Frasstrukturer Vad hände? Mannen bet hunden man -> man (rot) + en (suffix) [bestämd betydelse]
Läs mer