Ord, lexem, ordformer (repetition) Ord och morfem (repetition) Fraser/konstituenter (repetition) Grammatisk analys i språkteknologin
|
|
- Stina Ekström
- för 8 år sedan
- Visningar:
Transkript
1 Datorlingvistisk grammatik OH-serie 1: introduktion LEKTION 1: innehåll Kursformalia Grammatik formell grammatik. Metod och data (lite). Språkteknologisk relevans. Grammatiska begrepp (viss repetition) Frasstrukturanalys och CFG (repetition). Mats Dahllöf Institutionen för lingvistik och filologi Januari Lärandemål Efter avslutad kurs skall studenten för att förtjäna betyget Godkänd minst kunna: Lärandemål (3) analysera den syntaktiska strukturen hos meningar på svenska och engelska i termer av grammatisk valens; (1) redogöra för grammatikanalysens relevans för de viktigaste språkteknologiska delområdena; (4) analysera meningar på svenska och engelska i termer av dependensrelationer och i viss mån värdera alternativa analysmöjligheter i förhållande till varandra; (2) analysera meningar på svenska och engelska i termer av frasstruktur och i viss mån värdera alternativa analysmöjligheter; 3 4 Lärandemål (5) formulera kontextfria grammatiker för syntaktisk analys av fragment av svenska och engelska och i viss mån värdera alternativa formuleringar; (6) redogöra för hur en särdragsgrammatikformalism kan användas för att formalisera kategoritilldelning, valensbindning, kongruens och kasusstyrning; (7) hantera något datorverktyg för arbete med formella grammatiker. Grammatikens delar (repetition) FONOLOGI/ORTOGRAFI ljudförrådet, hur ljuden får kombineras (fonotax) grafemförrådet, hur grafem får kombineras (grafotax) MORFOLOGI strukturen inom ord, hur morfer bildar ord SYNTAX strukturen inom fraser(, satser och meningar) hur orden bildar större enheter 5 6 Grammatik vs semantik (repetition) Relativt svår distinktion, teoretiskt sett GRAMMATIK (form) abstrakt form, grammatikalitet SEMANTIK (innehåll) språkets relation till verkligheten, (syftning/referens) meningsfullhet och -löshet, sant och falskt Morfem (repetition) Grammatikens minsta enheter: de minsta betydelsebärande enheterna. (Jfr: fonem: de minsta betydelseskiljande enheterna.) Vissa morfem kan stå som ord (fria morfem), t.ex. hus, semester, med, se, etc. Andra morfem kan inte det (bundna morfem), t.ex. (hus)lig, (semester)n, (se)r, etc. 7 8
2 Ord, lexem, ordformer (repetition) Ord: teoretiskt ganska svåra typer av enhet. Självklar endast för vissa skrivna språk. Ordförekomster: grammatiskt sett hårt sammanbundna enheter. Betoning i uttal. Lexem: ett uppslagsord (abstrakt enhet). T.ex. verbet älska, substantivet bord. Böjningsform: Mer konkret form ett lexem kan anta. Former av älska: älska (infintiv), älskar (presens), älskande (presens particip), o.s.v. Ord och morfem (repetition) Fria morfem bildar ordformer. Andra ordformer är sammansatta, kombinationstyper: Böjning (inom ett lexem), t.ex. hus-en-s, läs-te-s. Avledning (nytt lexem från annat), t.ex. läs-lig, läs-ning, hus-lig. (Avlett lexem kan i sin tur böjas.) Sammansättning (två lexem kombineras till ett nytt), t.ex. husbåt, gulgön, citronpaj. (Sammansatt lexem kan i sin tur böjas.) 9 10 Fraser/konstituenter (repetition) Enheter som hänger ihop grammatiskt. Teoretisk motivation: fraser av en viss kategori kan förekomma i olika kontexter. (Egna enheter/moduler av struktur.) Exempel: Den lilla hunden skäller. (som subjekt) Lisa köpte den lilla hunden. (som objekt) Lisa tittade på den lilla hunden. (som prepositions rektion) Beskrivningen av (olika slag av) nominalfraser måste kunna återanvändas i olika sammanhang. Grammatisk analys i språkteknologin Grammatiken kan ses som ett första steg i förståelsen av språk som språk. Grammatiken ger en grovhuggen bild av innehållet. Relevant för i stort sett alla delområden inom ST: Man kan nästan säga att det är känslighet för grammatisk struktur som definierar språkteknologi Språkteknologisk relevans (1) Man behöver analysera grammatisk struktur i många språkteknologiska tillämpningar. Grammatik-, stavnings- och stilkontroll (givetvis). Informationssökning och -extraktion. Maskinöversättning: analys av källspråket. Språkteknologisk relevans (2) Grammatik är även viktigt i språkteknologisk generering av yttranden/text: Maskinöversättning: generering till målspråket. Dialogsystem: generera yttranden. Pedagogiska program: generera problem. Talsyntes (intonation, disambiguering, etc) Grammatisk analys ur ST-perspektiv Hur skall analysen representeras formellt? Vilken grundtyp är det? (Dependenser? Frasstrukturer? Eller?) Hur skall analysen se ut? Teorin om språket ifråga. Annotationsmanual för mänskliga uppmärkare. Hur kan vi automatiskt tilldela texter sådan här analys? (Parser.) Som bygger på inlärning? Som bygger på handskrivna regler? Trädbank En korpus med syntaktisk uppmärkning kallar man för en trädbank för det brukar ju vara något slags syntaxträd det handlar om). Den kan t.ex. användas för träning av maskininlärningsbaserade modeller eller för utvärdering. Bra trädbanker är dyra. (Varför?) Det är alltså viktigt vilken sorts syntaktisk uppmärkning man arbetar med. Konvertering från en typ av uppmärkning till en annan blir ofta en viktig fråga när man skall kombinera trädbanksdata
3 Annotationsmanual En grund för syntaktisk analys är att vi bestämmer oss för hur vi skall göra. Detta handlar först om att enas om en teori om grammatiken. Och det finns väldigt många syntaxteorier att välja på. Det handlar även mer konkret om hur olika typer av information skall kodas. Sedan måste man enas om hur man skall hantera diverse ej självklara konstruktioner inom ramverket. En mänsklig faktor kommer givetvis alltid in. Annotationsmanual, instruktion (ex. 1) Exempel (citat) från Krohmann et al. Danish Dependency Treebank Annotation guide, som avser en dependensanalys av danska. The words at and om are analyzed as special pronouns that take a verbal object, ie, in the external syntax, they are always analyzed as if they were ordinary noun phrases. At can take a finite or infinitive verb as its verbal object, whereas om only takes a finite verb as its verbal object Annotationsmanual, instruktion (ex. 2) Exempel (citat) från Krohmann et al. Danish Dependency Treebank Annotation guide, som avser en dependensanalys av danska. The adjunct label voc is used for nominals that refer to the intended listener, but serve no complement function with respect to the verb. Luk så den dør, Marie! Marie, vil du/i godt lukke den dør? Önskemål: (principiell) robusthet Grammatiken bör kunna ta hand om alla relevanta språkexempel. Grammatikteorier har ofta fullständiga meningar som norm. Ofullständiga och felaktiga uttryck är vanliga och bör hanteras Önskemål: optimal för tillämpning Vilken grammatikinformation behövs för en viss tillämpning? Vilken grammatikinformation kan man få fram givet t.ex. trädbanker och verktyg? Finkornighet (specifika kategorier) i analysen kan försvåra för maskininlärningsmetoder. (Färre belägg och svårare avgöranden.) Finkornighet kan ge för tillämpningen värdefull information. Skiljetecken Skiljetecken används, åtminstone ur en normativ synvinkel, med referens till den syntaktiska strukturen. De är därför ofta redundanta. I syntaktisk analys kan man därför välja att ha med dem som konstituenter eller ignorera dem. I ST-sammanhang kan det vara meningsfullt att pröva båda strategierna Parsing två begrepp Parsing engelska ordet för satslösning. Parsing utifrån grammatik: Räkna ut en strängs analys (ofta en trädstruktur) givet en formell grammatik. Empirisk/språkteknologiskt praktisk bemärkelse: Räkna ut den syntaktiska strukturen hos naturligt förekommande meningar. Med eller utan inblandning av en formell grammatik. Parsing för ST viktiga aspekter Vilken sorts språk? Med vilka begrepp? Hur fullständigt och bra? Med vilken grad av korrekthet/precision/recall för olika aspekter? Robusthet: hantering av ogrammatiskt och ofullständigt material, etc
4 Parsingalgoritmer (1) Algoritmer: Mekaniska (effektiva) procedurer för att lösa givna problem, eller (mer tekniskt), beräkna funktioner. Alltså: Den abstrakta principen bakom ett program. (Så att samma algoritm kan implementeras på olika sätt och i olika programspråk.) Parsing i teknisk bemärkelse (och i svenskan): syntaktisk analys i dator, både av naturligt och artificiellt språk. Parsingalgoritmer (2) Parsingalgoritm: En algoritm som givet en typ av grammatik, och en sträng av symboler räknar ut en mängd analyser (typiskt syntaxträd) som grammatiken tilldelar strängen. Olika urval analyser: alla (om grammatiken tillåter ambiguitet), bästa (utifrån någon rangordning), en enda, etc. Recognition när man bara får ett ja eller nej till frågan om grammatiken kan generera strängen Formell kontra traditionell grammatik Tendenser (men mkt gemensamt, olika användning): Handkodad grammatik kontra maskinlärning Tendenser i språkteknologin, grovhuggen bild: traditionell grammatik vaghet heterogenitet implicithet robust ofta preskriptiv ej direkt implementerbar redan de gamla grekerna formell grammatik precision systematik explicithet begränsad täckning vetenskaplig, empirisk typiskt implementerbar 1900-talssak handkodning maskininlärning tal senaste decenniet personalintensivt dataintensivt - trädbanker språkspecifikt tvärspråkliga metoder allmän grammatikteori ST-orienterade metoder kvalitativ värdering kvantitativ värdering begränsad täckning fokus på robusthet Kategorisk vs heuristisk analys Formell analys: Objekt antingen exemplifierar en kategori eller gör det inte. Inga grader. Absoluta regler. Rätt/fel. (Grammatik i lingvistiken är ofta sådan.) Heuristisk analys: Grader av exemplifierande. Osäkerhet. Kan bygga på statistik/sannolikhetsberäkningar. (Vanligt inom språkteknologin.) Inga anspråk på 100% korrekthet. Grammatikalitetsdata, exempel Svenska OK: Hon ser på honom. Hon ser honom. Honom ser hon. Svenska inte OK: *Hon ser honom på. *Henne ser honom. *Ser honom hon Grammatikalitet Ett naturligt språk erbjuder en oändlighet av (grammatiska) möjligheter: Många grammatiska strängar kommer aldrig att användas. Många grammatiska strängar är semantisk sett udda (och därför oanvändbara). Många grammatiska strängar är så komplexa att man inte kan hålla reda på deras struktur. Alltså: grammatisk användbar (i språket) (Chomsky). Korpusdata Korpus: stor samling med autentiska språkexempel (texter eller samtal), visar hur folk faktiskt använder språk (representativitet). Detta är kanske viktigare (för en lingvist/språkteknolog) än frågan om grammatikalitet. Korpusdata kan även avslöja relativa frekvenser hos olika grammatiska fenomen. En korpus innehåller säkert (normativt sett) ogrammatiska saker
5 Fraser/konstituenter: egenskaper Egenskaper som ofta talar för frasstatus: (ex. Lisa köpte den lilla hunden.) Kan flyttas. Den lilla hunden var det som Lisa köpte. Kan befrågas. Vad köpte Lisa? Den lilla hunden. Kan samordnas. Lisa köpte den lilla hunden och den stora katten. Semantiken kan stödja (och ligger bakom) våra intuitioner om frasstatus. Fraser/konstituenter: distribution Distribution: Vilka grammatiska satskontexter ett uttryck kan förekomma i. Om två fraser har olika distribution så finns det grammatiska satser i vilka det ena uttrycket förekommer och där det inte kan bytas mot det andra utan att grammatikaliteten fördärvas. den lilla hunden och den stora katten har samma distribition. den lilla hunden och det stora djuret har olika distribition: Den lilla hunden är snäll. *Det stora djuret är snäll Fraser/konstituenter: syntaktiska kategorier Grundprincip: Fraser med samma distribution tillhör samma kategori. Fraser med olika distribution tillhör olika kategorier. Vi måste kunna skilja på den lilla hunden och det stora djuret kategorimässigt. Vi använder ofta också vidare kategorier: Begreppet nominalfras täcker in många olika nominalfraser som vi måste kunna skilja på. Konstituens Frasstrukturgrammatikens abstrakta del-helhetsbegrepp: konstituens. Enkla konstituenter: (typiskt) ord. Sammansatta konstituenter: fraser. omedelbar vs medelbar konstituens (mödrar dominerar döttrar) konstituensen placerar noderna i en trädstruktur Visas som utritad graf: omedelbar konstituens blir streck eller genom bracketing : [i [lådan [på [vinden]]]] Linjär precedens = grammatikens abstrakta linjära ordning, (ordföljd och frasföljd) motsvarar före efter i tal Syntaxträd (med kategorietiketter) S VP motsvarar vänster höger i skrift (Glöms lätt bort, eftersom man fångar informationen gratis genom talets flöde i tiden och skriftens riktning på pappret.) det en n katt v såg det flera n hundar Grammatisk beskrivning av noder Noderna svarar mot ord, fraser, satser och meningar. Vi måste knyta en beskrivning av det språkliga uttrycket till varje nod. Minimalt: en kategorisymbol (som i kontextfri grammatik) Mer utvecklat: Strukturerade beskrivningar, t.ex. särdragsstrukturer. Syntaxträd, vanliga begränsningar Syntaxträd brukar definieras av följande begränsningar, som kommer att underlätta maskinell hantering: Omedelbara konstituensen (OK) ger just en trädstruktur (utifrån ett ändligt antal noder). Träd (typ av graf): En nod har ingen moder; alla andra har precis en; ingen cirkularitet. (Noder som saknar döttrar kallas löv.) Linjär precedens överensstämmer med OK: Varje fras är linjärt kontinuerlig. (Inga korsande grenar.) Precis en kategori per nod
6 Språk och grammatik i formell bemärkelse i formell, matematisk mening (Chomsky). Ett språk är en mängd strängar En grammatik definierar ett språk. En grammatik definierar en mängd syntaktiska strukturer (t.ex. träd) och därmed ett språk (eftersom vi kan läsa av strängen ur trädet). Detta är perspektivet i matematisk lingvistik. Olika typer av formell grammatik Det finns olika typer av grammatiker som kan definiera olika klasser av oändliga språk, t.ex. Reguljära uttryck Kontextfria grammatiker (CFG) Det finns andra grammatiktyper som analyseras inom matematiska lingvistiken. Chomskyhierarkin är den mest kända uppställningen Chomskyhierarkin (viss namedropping ) Avser klasser av automater, grammatiker och språk. typ automat grammatik språk 0 Turingmaskin obegränsad rekursivt enumerabla 1 linjärt begränsad a. kontextkänslig kontextkänsliga 2 stackmaskin kontextfri kontextfria 3 ändlig a. linjär reguljära (reguljära uttryck) 0 3: Fallande beräkningsmässig styrka, ökande uttrycksmässiga begränsningar, mindre klasser av språk. Obegränsad grammatik, typ 0 En obegränsad grammatik (omskrivningssystem) är en kvadrupel N,T,P,Σ, där N är en mängd icke-terminaler (kategorisymboler), T är en mängd terminaler (ord), P är en mängd produktioner och Σ är en startsymbol. En produktion är av formen α β, där α är en icke-tom sträng över N T (terminaler och icke-terminaler) och β är en sträng över N T Grammatiker härledning språk Givet ett omskrivningssystem N,T,P,Σ kan man härleda: Strängen Σ (sträng av ensam startsymbol). Givet att α β P och att en sträng xαy (över N T) kan härledas (där x och y är godtyckliga strängar över N T ), så kan xβy härledas. Ett omskrivningssystem definierar det språk (i Chomskys mening) som består av alla de strängar av icke-terminaler som kan härledas. Varje språk i Chomskyhierarkin kan definieras på detta sätt. (Typ 0.) Begränsade grammatiktyper, typ 1 Givet definitionen av omskrivningssystem kan vi ställa hårdare krav på produktionerna. Typ 1, kontextkänslig grammatik Enbart produktioner av typen X 1 CX 2 X 1 βx 2, där C N (d.v.s. är en icke-terminal), X 1,X 2 N T {ε} (d.v.s. är en terminal, icke-terminal eller tomma strängen). Alternativt begrepp: Enbart produktioner av typen α β, där β längre än eller lika lång som α. Annan sorts grammatik men samma styrka Begränsade grammatiktyper, typ 2 Givet definitionen av omskrivningssystem kan vi ställa änn hårdare krav på produktionerna. Typ 2, kontextfri grammatik Enbart produktioner av typen C β, där där C N (d.v.s. är en icke-terminal). Begränsade grammatiktyper, typ 3 Givet ett definitionen av omskrivningssystem kan vi ställa hårdare krav på produktionerna. Typ 3, högerlinjär grammatik. Enbart produktioner av typen C 1 tc 2 och C 1 t, där C 1,C 2 N (d.v.s är icke-terminaler) och t T (d.v.s. är en terminal). Alternativt begrepp: Spegelvända begreppet vänsterlinjär grammatik ger samma beräkningsmässiga styrka
7 Reguljära uttryck: semantik (repetition) Reguljära uttryck är ett annat sätt att definiera språk av typ 3 (s.k. reguljära språk). Basuttryck: D(ε) = {ε}. Om s Σ, där Σ är alfabetet, så D(s) = {s}. Konkatenering (ibland skrivs mer explicit R 1 R 2 istället för R 1 R 2 ): D(R 1 R 2 ) = {xy x D(R 1 ) och y D(R 2 )}. Reguljära uttryck: semantik (repetition) Union (alternativitet) (ibland skrivs R 1 R 2 istället för R 1 R 2 ) D(R 1 R 2 ) = {x x D(R 1 ) eller x D(R 2 )}. Kleenehölje (godtycklig självkonkatenering) D(R ) = {x 1 x 2...x n n 0 och x i D(R)} Förkortade skrivsätt: R + för RR. (R) (optionalitet i SWB 2.2.2) för R ε Kontextfri grammatik (CFG) träd För en CFG gäller att ett träd tillåts av omm: Rotnoden (den utan moder) är märkt med grammatikens startsymbol. Varje modernod med dotternoder (=lokalt träd) matchar en regel i grammatiken. Lövnoderna (lexikala, terminala) matchar lexikoningångar. En sträng tillåts av grammatiken om det finns ett motsvarande träd. det en Syntaxträd, regler, lexikon n katt S v såg VP det flera n hundar S VP det n VP v det en n katt v såg det flera n hundar CFG, ännu mer formellt Vanligt sätt att definiera en CFG formellt: En CFG är en kvadrupel N, T, P, S, där N är mängden icke-terminaler (kategorisymboler), T är mängden terminaler (ord), P är mängden av regler (inklusive lexikoningångar) och Σ är startsymbol. En CFG definierar en mängd träd och en mängd strängar icke-terminaler (alltså ett språk i Chomskys mening). CFG, ännu mer formellt, exempel Exempel på en CFG, N,T,P,Σ (utifrån tidigare träd): N = {S,, VP det, n, v} T = {en, flera, hundar, katt, såg} P = { S VP, det n, VP v, det en, n katt, v såg, det flera, n hundar } Σ =S Syntaxträd, regler, lexikon S VP Han v såg dem Han S v såg dem Teori och data En vetenskaplig teori formuleras normalt genom generella principer. (De gäller t.ex. modern svenska.) Konsekvenser av teorin kallas teorem. Dessa kan vara partikulära (gälla enskilda fall, t.ex. en enskild sats). Data: fakta om verkligheten som vi kan samla ihop genom att observera den. Eller (typiskt i grammatiken) genom att konsultera våra intuitioner. Exempelvis: En hund skäller är en grammatisk sats på svenska
8 Formalisering i grammatiken Axiomatisering: axiom och härledningsregler. Det blir helt uttryckligt vilka teorins konsekvenser (teorem) är. Önskemål: Systematik: Teorin skall vara enkel, begriplig och överskådlig. Parsing och generering utifrån en grammatik bör vara implementerbart. Bra algoritmer bör finnas. Grammatikalitetsdata Data om vilka ordsekvenser som är grammatiskt OK (grammatiska) på ett språk. Om man kan ett språk så har man intuitioner om detta. Dessa blir data mot vilka grammatiker kan bedömas. Metodproblem: Kan vanligt folk skilja mellan grammatiska och andra felaktigheter? Hypotetisk-deduktiv metod (1) Hypotetisk-deduktiv metod är en grundkomponent i vetenskapligt tänkande. Man formulerar en teori. Prövar det teorin säger mot verkligheten (data). Man avvisar (reviderar) teorin om den inte stämmer. En teori som stämmer kan betraktas som vetenskapligt hållbar om man prövat den väl, d.v.s. letat ordentligt efter potentiellt falsifierande data. Hypotetisk-deduktiv metod (2) Framställningen i Sag, Wasow och Bender följer ofta hypotetisk-deduktiva tankebanor. En teori (grammatik) ställs upp; konsekvenserna bedöms och teorin avvisas. En ny teori (grammatik) ställs upp, och utsätts för samma granskning. Vitsen är att det skall framgå VARFÖR olika komponenter i teorierna behövs Hypotetisk-deduktiv metod (3) Ställ upp en teori (hypotes, som skall prövas). Pröva teorin(s teorem) mot data. Stämmer den? NEJ: Revidera teorin (ställ upp en ny hypotes) och prova den på samma sätt. JA: Fortsätt leta efter data och pröva teorin mot dem. (Man kan ju aldrig bli säker på att teorin är OK, då det hela tiden kan komma nya data.) Eller var för tillfället nöjd med teorin. Formell grammatik historia (1) Formalisering inom logiken, sent 1800-tal (Frege, m.fl.). Kategorialgrammatik (Ajdukiewicz 1935, Bar-Hillel 1953) Immediate constituency, IC-analys, 1940-talet. Amerikansk lingvistik. Noam Chomsky mitten av 1950-talet: Transformationsgrammatik. Syntactic Structures Formell grammatik historia (2) Chomskyan revolution stor förändring av språkvetenskapen. Formell grammatik får en central ställning. Modern lingvistik : 1960-talet. Många olika skolor och teorier inom FG etableras. Datorimplementationer datorlingvistik: 1960-talet och framåt. Rik utveckling. De senaste decennierna: Formell grammatik kombineras med korpuslingvistik och maskininlärning. Tillämpningsorienterade perspektiv inom språkteknologin. 63
Datorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik
Läs merFrasstrukturgrammatik
729G09 Språkvetenskaplig databehandling (2016) Frasstrukturgrammatik Marco Kuhlmann Institutionen för datavetenskap Korpusdata 1 Folkpensionen folkpension NOUN 2 dobj 2 får få VERB 0 root 3 man man PRON
Läs merMatematik för språkteknologer
1 / 21 Matematik för språkteknologer 3.3 Kontext-fria grammatiker (CFG) Mats Dahllöf Institutionen för lingvistik och filologi Februari 2014 2 / 21 Dagens saker Kontext-fria grammatiker (CFG). CFG kan
Läs merFraser, huvuden och bestämningar
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Översikt, denna gång (och nästa?) Kursformalia, lärandemål Språkteknologi och grammatik Grunder för grammatisk analys
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade
Läs merFORSKNINGSMETODIK OCH VETENSKAPSTEORI FÖR SPRÅKVETARE: FORMELLA METODER
Mats Dahllöf, Institutionen för lingvistik, Uppsala universitet 2002-02-28 FORSKNINGSMETODIK OCH VETENSKAPSTEORI FÖR SPRÅKVETARE: FORMELLA METODER I. FORMELL METOD att arbeta vetenskapligt med formella
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merLite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer
Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ är konstruktioner (fraser) som innehåller ett predikat och ett subjekt (Josefssons, s. 151, definition, som är en vanlig definition).
Läs merPartiell parsning Parsning som sökning
Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater
Läs merLogisk semantik I. 1 Lite om satslogik. 1.1 Konjunktioner i grammatisk bemärkelse. 1.2 Sant och falskt. 1.3 Satssymboler. 1.
UPPSALA UNIVERSITET Datorlingvistisk grammatik I Institutionen för lingvistik och filologi Oktober 2007 Mats Dahllöf http://stp.ling.uu.se/ matsd/uv/uv07/dg1/ Logisk semantik I 1 Lite om satslogik 1.1
Läs merInnehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Olika språksyn. Vad är syntax?
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Innehåll Olika frastyper och regler för dessa Dependensgrammatik Olika
Läs merTekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv10/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2010 Satser Satserna utgör den mest mångfacetterade
Läs merFTEA12:2 Filosofisk metod. Att värdera argumentation I
FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:
Läs merLexikon: ordbildning och lexikalisering
Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke
Läs merFTEA21:3 Spr akfilosofi F orel asning I Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning I Martin Jönsson Att lära Varför Frege varken tror att ett ords mening är dess referens eller något mentalt. Freges egen teori om mening Tre semantiska principer Kompositionalitetsprincipen,
Läs merInnehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn
Syntax Språkteknologi DH2418 Ola Knutsson knutsson@csc.kth.se Innehåll Grundläggande begrepp Två perspektiv på syntax Frasstrukturgrammatiker Olika frastyper och regler för dessa Dependensgrammatik Olika
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Föreläsning 2, 729G09, VT15 Reguljära uttryck Lars Ahrenberg 150409 Plan för föreläsningen Användning av reguljära uttryck Formella språk Reguljära språk Reguljära
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk
Läs merInlämningsuppgift MiniPlotter
LUNDS TEKNISKA HÖGSKOLA Institutionen för datavetenskap EDAA01 Programmeringsteknik fördjupningskurs Inlämningsuppgift MiniPlotter I den här uppgiften ska ett program som ritar grafer av matematiska funktioner
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merDAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Läs merGrammatisk teori II Attributvärdesgrammatik
Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska
Läs merSemantik och pragmatik (Serie 3)
Semantik och pragmatik (Serie 3) Satser och logik. Mats Dahllöf Institutionen för lingvistik och filologi April 2015 1 / 37 Logik: språk tanke (Saeed kapitel 4.) Satser uttrycker (ofta) tankar. Uttrycksrikedom
Läs merGenerellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:
FTEA12:2 Föreläsning 3 Att värdera en argumentation I: Vad vi hittills har gjort: beaktat argumentet ur ett mer formellt perspektiv. Vi har funnit att ett argument kan vara deduktivt eller induktivt, att
Läs merAutomatateori (2) Idag: Sammanhangsfria språk. Dessa kan uttryckas med Grammatik PDA
Automatateori (2) Idag: Sammanhangsfria språk Dessa kan uttryckas med Grammatik PDA Grammatik = språkregler Ett mer kraftfullt sätt att beskriva språk. En grammatik består av produktionsregler (andra ord
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2011 Några skillnader mellan svenska och engelska 1 Inledning
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merSatser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Satser och satsdelar Översikt i stolpform. Terminologin följer
Läs merDatorlingvistisk grammatik I
Datorligvistisk grammatik I (OH-serie 1) Mats Dahllöf Istitutioe för ligvistik och filologi 060905 (Med ej visade bilder!) LEKTION 1: iehåll Kursformalia Grammatik formell grammatik. Metod och data (lite).
Läs merGrammatik för språkteknologer
Grammatik för språktekologer Språktekologi och grammatiska begrepp http://stp.ligfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Istitutioe för ligvistik och filologi November 2011 Dea serie Frasstrukturaalys
Läs merKursbeskrivning med litteraturlista HT-13
Kursbeskrivning med litteraturlista HT-13 Skriftlig språkfärdighet, 7,5 hp Delkurs inom Italienska I, 30 hp. Består av: I. Italiensk grammatik med inlämningsuppgifter, 6 hp, och II. Skriftlig produktion,
Läs merPROV I MATEMATIK Automatateori och formella språk DV1 4p
UPPSALA UNIVERSITET Matematiska institutionen Salling (070-6527523) PROV I MATEMATIK Automatateori och formella språk DV1 4p 19 mars 2004 SKRIVTID: 15-20. POÄNGGRÄNSER: 18-27 G, 28-40 VG. MOTIVERA ALLA
Läs merTala, skriva och samtala
Tal och skrift Presentationer, instruktioner, meddelanden, berättelser och beskrivningar Engelska åk 4-6 - Centralt innehåll Språkliga strategier Förstå och göra sig förstådd, delta och bidra till samtal
Läs merLingvistiska grundbegrepp
729G09 Språkvetenskaplig databehandling (2016) Lingvistiska grundbegrepp Marco Kuhlmann Institutionen för datavetenskap Vad är korpuslingvistik? Korpuslingvistik handlar om att undersöka språkvetenskapliga
Läs merLogik och modaliteter
Modallogik Introduktionsföreläsning HT 2015 Formalia http://gul.gu.se/public/courseid/70391/lang-sv/publicpage.do Förkunskaper etc. Logik: vetenskapen som studerar argument med avseende på (formell) giltighet.
Läs merGrammatik skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning
Läs merUPPSALA UNIVERSITET Institution för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf HT 2015 (korrigerad 151126) Depdsgrammatik Dna introduktion till depdsgrammatik försöker följa d standard
Läs merSvenskans struktur, 7,5 hp Tentamensexempel 1
Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merRiktlinjer för bedömning av examensarbeten
Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar
Läs merVäl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg
Betygskriterier Examensuppsats 30 hp. Betygskriterier Tregradig betygsskala används med betygen icke godkänd (IG), godkänd (G) och väl godkänd (VG). VG - Lärandemål har uppfyllts i mycket hög utsträckning
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 6 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2013 Tillämpningar av semantik allmänt Analys av grammatik:
Läs merb) S Ø aa, A Ø aa» bb, B Ø aa» bc, C Ø ac» bc» 2. Låt L vara språket över 8a< som nedanstående NFA accepterar.
Salling, 070-6527523 TID : 9-14 HJÄLPMEDEL : Inga BETYGSGRÄNSER : G 18p, VG 28p SKRIV TYDLIGT OCH MOTIVERA NOGA! PROV I MATEMATIK AUTOMATEORI & FORMELLA SPRÅK DV1, 4 p 20 MARS 2002 1. Språket L över alfabetet
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 1 http://stp.lingfil.uu.se/~matsd/uv/uv13/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2013 Kursens lärandemål (ur kursplanen) (LM 1) förklara grunderna
Läs merGrim. Några förslag på hur du kan använda Grim. Version 0.8
Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merMorfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.
UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,
Läs merFöreläsning 7: Syntaxanalys
DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.
Läs merNågra skillnader mellan svenska och engelska
UPPSALA UNIVERSITET Datorlingvistisk grammatik Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf Mars 2012 Några skillnader mellan svenska och engelska 1 Inledning likheter
Läs merKompositionell semantik och λ-kalkyl
UPPALA UIVERITET http://stp.ling.uu.se/~matsd/uv/uv05/ads1/ Institutionen för lingvistik och filologi Mats Dahllöf mats.dahllof@lingfil.uu.se Algoritmer för datorlingvistisk semantik I, Föreläsningsanteckningar,
Läs merSpråkets struktur och funktion, 7,5 hp
Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag
Läs merIdag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik
Idag: Reguljära språk Beskrivs av Reguljära uttryck DFA Grammatik Först några definitioner: Alfabet = en ändlig mängd av tecken. Ex. {0, 1}, {a,b}, {a, b,..., ö} Betecknas ofta med symbolen Σ Sträng =
Läs merNeurolingvistik - Grammatik
Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs merViktiga frågor att ställa när ett argument ska analyseras och sedan värderas:
FTEA12:2 Föreläsning 2 Grundläggande argumentationsanalys II Repetition: Vid förra tillfället började vi se närmre på vad som utmärker filosofisk argumentationsanalys. Vi tittade närmre på ett arguments
Läs merBetygskriterier. CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II.
Betygskriterier CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II. Gäller fr.o.m. ht 2016. Delkurs 1: Flerspråkighet individ och samhälle, 7,5 hp Fastställda av institutionsstyrelsen
Läs merSemantik och pragmatik
Semantik och pragmatik OH-serie 4 http://stp.lingfil.uu.se/~matsd/uv/uv12/semp/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2012 Om barnet har svårt att andas eller har ont i bröstet
Läs merLokal pedagogisk planering för årskurs 8 i ämnet moderna språk - spanska
Annerstaskolan Lokal pedagogisk planering för årskurs 8 i ämnet moderna språk - spanska Vardagliga situationer, intressen, personer, platser, aktiviteter händelser. Strategier för att uppfatta betydelsebärande
Läs merMÄLARDALENS HÖGSKOLA. CD5560 Formella språk, automater och beräkningsteori. Användarmanual. för simulatorn JFLAP
MÄLARDALENS HÖGSKOLA CD5560 Formella språk, automater och beräkningsteori Användarmanual för simulatorn JFLAP Innehållsförteckning Att komma igång med JFLAP... 3 Att köra en sträng... 5 Att köra flera
Läs merFöreläsning 5. Deduktion
Föreläsning 5 Deduktion Hur ett deduktivt system fungerar Komponenter - Vokabulär Ett deduktivt system använder ett visst slags språk som kan kallas för systemets vokabulär. I mindre formella fall är kanske
Läs merBetygskriterier. NS2019, Svenska II, 30 hp. Förväntade studieresultat För godkänt resultat på delkursen ska studenten kunna visa:
Betygskriterier NS2019, Svenska II, 30 hp Fastställda av institutionsstyrelsen 2014-05-07. Gäller fr.o.m. ht 2014. Delkurs 1. Nordiska språk och svensk språkhistoria, 7,5 hp Förväntade studieresultat För
Läs merPragmatisk och narrativ utveckling
Pragmatisk och narrativ utveckling Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Pragmatik! Pragma! handling! hur vi använder språket! hur vi handlar genom språket! Pragmatik!
Läs merSemantik och pragmatik
Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext
Läs merGrammatisk teori III Praktisk analys
Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas
Läs merRyska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat
Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på
Läs merFöreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)
Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket
Läs merFL 6: Definite Clause Grammars (kap. 7)
FL 6: Definite Clause Grammars (kap. 7) Teori Introducerar kontextfria grammatikor och några besläktade begrepp Introducerar definite clause - grammatikor, Prologs sätt att jobba med kontextfria grammatikor
Läs merProgrammering för språkteknologer II. OH-serie: Ändliga automater. reguljära uttryck i Java. Deterministiska ändliga automater
Programmering för språkteknologer II OH-serie: ändliga automater reguljära uttryck i Java Mats Dahllöf Ändliga automater Abstrakt maskin, tillståndsmaskin, transitionssystem. (Den enklaste typ man brukar
Läs merOrdförråd och Ordbildning
Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande
Läs merHur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?
Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i
Läs merSanning och lögnare. Rasmus Blanck VT2017. FT1200, LC1510 och LGFI52
rasmus.blanck@gu.se FT1200, LC1510 och LGFI52 VT2017 Vad är sanning? Vi verkar använda begreppet utan större problem till vardags. Det kanske vore intressant att ha en definition: P är sann om och endast
Läs merKontextfri grammatik (CFG)
Kotextfri grammatik (CFG) Mats Dahllöf Ist. f ligvistik och filologi December 2015 1 / 23 Frasstrukturträd hud studt Aalys av de ord som häger lägst ed, hud studt. E graf med fler oder ä depdsaalys (fem
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merOm ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Läs merNaturalism. Föreläsning Naturalismen (tolkad som en rent värdesemantisk teori) är en form av kognitivism
Naturalism Föreläsning 5 Naturalismen (tolkad som en rent värdesemantisk teori) är en form av kognitivism Som säger att värdesatser är påståenden om empiriska fakta Värdeomdömen kan (i princip) testas
Läs merSärdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser
Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,
Läs merTvå-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01
Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan
Läs merGrundläggande textanalys, VT2012
Grundläggande textanalys, VT2012 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv12/gta/ (Tack till ofia Gustafson-Capkovâ för material.) Repetition 2 Exempel parvspråket
Läs merFöreläsning 2 5/6/08. Reguljära uttryck 1. Reguljära uttryck. Konkatenering och Kleene star. Några operationer på språk
Reguljära uttryck Ändliga automater och reguljära uttryck Språk som är och inte är reguljära Konkatenering och Kleene star Två strängar u och v (på alfabetet )kan konkateneras till strängen uv Givet två
Läs merBetyg i moderna språk nu redan i år 6. Mia Smith, förstelärare Vallhamra skola, Partille
Betyg i moderna språk nu redan i år 6 Mia Smith, förstelärare Vallhamra skola, Partille Då och nu Fram till vt -18 Timplan fördelad på år 4-9 Betyg i år 7-9 Kunskapskrav för år 9 Från ht -18 Timplan fördelad
Läs merParsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion
Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som
Läs merDD1361 Programmeringsparadigm. Formella Språk & Syntaxanalys. Per Austrin
DD1361 Programmeringsparadigm Formella Språk & Syntaxanalys Föreläsning 3 Per Austrin 2015-11-13 Huvudkoncept hittils: Snabb repetition Formellt språk en mängd strängar Reguljära språk den klass av formella
Läs merKontextfria grammatiker
Kontextfria grammatiker Kontextfria grammatiker 1 Kontextfria grammatiker En kontextfri grammatik består av produktioner (regler) på formen S asb S T T # Vänsterledet består av en icke-terminal (variabel)
Läs mer729G06 Logik FÖRELÄSNING 1 ANDERS MÄRAK LEFFLER IDA/HCS
729G06 Logik FÖRELÄSNING 1 ANDERS MÄRAK LEFFLER IDA/HCS 160127 Vad är logik? Som ämne, område... 2 Läran om korrekta resonemang Följer slutsatserna av ens antaganden? 3 Alla hundar är djur. Alla enhörningar
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merFonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?
Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet
Läs merAEC 7 Ch 1-3. 1 av 10. Detta ska du kunna (= konkretisering)
AEC 7 Ch 1-3 Nu är det dags att repetera en del av det du lärde dig i franska under år 6 - och så går vi förstås vidare så att du utvecklar din språkliga förmåga i franska. Detta ska du kunna (= konkretisering)
Läs mer