Djupstruktur och ytstruktur

Relevanta dokument
Språkgranskningsverktyg, vt 2008

Språkgranskningsverktyg. Grammatikkontroll med Scarrie

För närmare upplysningar om bakgrunden till UCP samt om hur den är relaterad till tidigare arbeten, se Sägvall 80b.

Svårigheter med kurslitteraturen

SATSLÖSNING I EN LEXIKONORIENTERAD PARSER FÖR SVENSKA. Mats Dahllöf

Föreläsning 6 Datastrukturer (DAT037)

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Grafer, allmänt. Med datastrukturen graf menas vanligen: en mängd av noder (vertices) och en mängd av bågar (edges).

Anna Sågvall Hein Centrum för datorlingvistik Sturegatan 13 B, 5 tr U P P S A L A


Algoritmer och datastrukturer, föreläsning 11

Föreläsning Datastrukturer (DAT037)

MÖSG ht 2005 Maskinöversättningssystemet MATS

Ordklasser. Särdrag, lexikon och syntax. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Tekniker för storskalig parsning

Föreläsning Datastrukturer (DAT036)

Reguljära uttryck Grammatiker Rekursiv nedåkning Allmänna kontextfria grammatiker. Syntaxanalys. Douglas Wikström KTH Stockholm

Föreläsning Datastrukturer (DAT036)

Introduktion till formella metoder Programmeringsmetodik 1. Inledning

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 7 Datastrukturer (DAT037)

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Obesvarade frågor från F1

Grammatisk teori II Attributvärdesgrammatik

Ordklasser. Särdrag, lexikon och syntax. Öppna klasser. Slutna klasser. Vilka ord i lexikon? Vad skall man med en grammatik till?

Föreläsning Datastrukturer (DAT037)

Maskinöversättning och språkgranskning

Föreläsning Datastrukturer (DAT036)

Föreläsning 8 Datastrukturer (DAT037)

Partiell parsning Parsning som sökning

FÖRELÄSNING 11 DATALOGI I

ITK:P1 Föreläsning 1. Programmering. Programmeringsspråket Java. Stark typning Explicit typning Strukturerat Hög säkerhet

Tentamen Lösningar EDA698 Realtidssystem

Trädstrukturer och grafer

Föreläsning 6. Slumptal Testa slumptal Slumptal för olika fördelningar Grafer Datastrukturen graf

Föreläsning 8 Datastrukturer (DAT037)

Föreläsning 2 Programmeringsteknik och C DD1316. Programmering. Programspråk

Outline. For. I istället för att följa det normala ordningen, man ändra den. I i Java får man inte göra hopp hur som helst

DE GRAMMATISKA BESKRIVNINGARNA I SVE.UCP

Föreläsning 6 Datastrukturer (DAT037)

Föreläsning 2 Programmeringsteknik och C DD1316. Mikael Djurfeldt

Mycket kortfattade lösningsförslag till tenta i AI 6 nov 2003

Språkgranskningsverktyg, vt 2009

Övning 3 - Tillämpad datalogi 2012

Datorlingvistisk grammatik

Datatyper och kontrollstrukturer. Skansholm: Kapitel 2) De åtta primitiva typerna. Typ Innehåll Defaultvärde Storlek

Grammatisk teori III - Seminarium

729G09 Språkvetenskaplig databehandling

Exempel på ett litet Ada-program

Grundkurs i programmering, 6 hp (725G61) Dugga 1 tillfälle 3

Föreläsning 7. Träd och binära sökträd

Datastrukturer. föreläsning 8. Lecture 6 1

Tekniker för storskalig parsning

Anna-Lena Sågvall Hein CHARTANALYS OCHMORFOLOGI

Imperativ programmering. Föreläsning 2

TDDC30. Kursledning Kursledare: Jonas Lindgren. Labassistent: Jonas Lindgren Labassistent: Niklas Holma Labassistent: Erik Nilsson

Graphs (chapter 14) 1

OMTENTAMEN I DATASTRUKTURER OCH ALGORITMER DVG B kl. 14:15 19:15

Föreläsning 10. Grafer, Dijkstra och Prim

Föreläsning 10. Grafer, Dijkstra och Prim

Pythons standardbibliotek

TNK049 Optimeringslära

Föreläsning 2 Programmeringsteknik DD1310. Programmering. Programspråk

Föreläsning Datastrukturer (DAT036)

Dugga Datastrukturer (DAT036)

Programmering A. Johan Eliasson

Grammatisk teori III Praktisk analys

Grafer, traversering. Koffman & Wolfgang kapitel 10, avsnitt 4

Grundläggande textanalys. Joakim Nivre

Föreläsning 10. Grafer, Dijkstra och Prim

Innehåll. Syntax. Kan allt delas upp i små delar? Varför är syntax fascinerande? Vad är syntax? Olika språksyn

Programmering I Tobias Wrigstad fredag, 2009 augusti 28

Två fall: q Tom sekvens: () q Sekvens av element: (a b c) ; (sum-rec '(2 4 6)) = 12. q Första elementet uppfyller vissa villkor: (2 a b c)

Föreläsning 10 Datalogi 1 DA2001. Utskrift på skärmen. Syntax. print( Hej ) Hur är det? Hej. print( Hej,end= ) print( Hur är det? ) HejHur är det?

språkgranskning, ht 2007

Transportnivån. Kommunikation mellan processer. Kommunikation mellan processer. Sockets och TCP. UDP (User Datagram Protocol) Checksumman

2. Utgångspunkter och angreppssätt för automatisk språkgranskning

Föreläsning 2 Datastrukturer (DAT037)

Introduktion till språkteknologi. Datorstöd för språkgranskning

FL 6: Definite Clause Grammars (kap. 7)

Lektion 2: Sökagenter. Robin Keskisärkkä

Parsning I. Disposition. Parsning användingsområden. Vad menas med parsning inom språkteknologin? Top-down parsning. Parsning som sökning

Introduktion till programmering SMD180. Föreläsning 4: Villkor och rekursion

Användar- och systemdokumentation

OOP Objekt-orienterad programmering

Översikt. Stegvis förfining. Stegvis förfining. Dekomposition. Algoritmer. Metod för att skapa ett program från ett analyserat problem

Föreläsning 2 Programmeringsteknik DD1310. Programmering. Programspråk

Frasstrukturgrammatik

Syntax S NP VP. AdjP. sleep. ideas. DH2418 Språkteknologi Johan Boye. Syntax

Parsningens olika nivåer

F5 Selektion och iteration. ID1004 Objektorienterad programmering Fredrik Kilander

Föreläsning 7: Syntaxanalys

Implementering av Model- Based Testing i LoadRunner

FRÅN MAVEN TILL GRADLE

PAINTFEUD. Erfarenheter

Tentamen, EDA501/EDAA20 Programmering M MD W BK L

Variabler och konstanter

Dagens föreläsning Programmering i Lisp Fö 7. Sammanfattning funktionell programmering Exempel på funktionella programspråk

Transkript:

Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man.

Chomsky 1965 baskomponent transformationskomponent

Föregångare till UCP Augmented Transition Network (Woods 1970)

Uppsala Chart Processor - UCP icke-deterministisk chartparser procedurell formalism

Chart den centrala datastrukturen i en chartparser är en chart en chart är en riktad graf som består av noder (vertices) och bågar (edges) bågarna är aktiva eller passiva de aktiva bågarna representerar regler och partiellt analyserade konstituenter de passiva bågarna representerar kompletta analysresultat

Task bearbetningen sker genom ett samspel mellan aktiva och passiva bågar när en aktiv båge träffar på en passiv så bildas ett bearbetningssteg, en task bearbetningsstegen förs till en agenda (scheduling) från agendan hämtas de för exekvering (selecting) utförandet av ett bearbetningssteg leder vanligen till nya bågar och nya bågkonstellationer, som genererar nya bearbetningssteg när agendan är uttömd är parsningen avslutad resultatet av en komplett parsning representeras av en passiv båge från första till sista vertex

Bågar i UCP alla bågar i en UCP-chart innehåller uppgift om ursprungstask (Creator) alla aktiva bågar innehåller en regelsekvens (LR-Action) alla passiva bågar innehåller en särdragsstruktur (Features) med ett toppsärdrag * icke-initiala aktiva bågar innehåller en särdragsstruktur (Features) med ett toppsärdrag & en initial aktiv båge går från och till sig själv en initital aktiv båge sätter i gång en regeltillämpning eller en lexikonsökning

Exempel på en aktiv båge 1--7 Creator: 78 Features: (& = (PHR.CAT = CL TYPE = MAIN MODE = DECL NP = (START = 1 END = 7 PHR.CAT = NP NUMB = SING GENDER = UTR CASE = BASIC DEF = DEF HEAD = (LEM = SOL.NN WORD.CAT = NOUN)))) LR-Action: <* PHR.CAT> = 'VP, <* INFF> = 'FIN, <& VP> :=: <*>, STORE, MAJORPROCESS(SENT);

Exempel på en passiv båge 7--13 Creator: 112 Features: (* = (START = 7 END = 13 PHR.CAT = VP VERB.TYPE = MAIN INFF = FIN TENSE = PRES DIAT = ACT VERB = (WORD.CAT = VERB LEM = SKINA.VB)))

Processkontroll parsningen styrs av tillståndet i charten principer för scheduling bredden först eller djupet först principer för selektion bredden först eller djupet först

Uppbyggnad av charten UCP bygger en initial chart av inputsträngen i övrigt styrs chartbyggandet från språkbeskrivningen (grammatik el. lexikon)

Den procedurella formalismen bygga strukturbeskrivningar i form av särdragsstrukturer införa nya bågar i charten

Operatorerna test och tilldelning av attribut och värden kontroll införa nya bågar i charten

Test och tilldelning unifiering ( :=: ) test på likhet ( = ) not path <& val1 valn> nil atom <* val1 valn> <& val1... valn :new> <& val1 valn :last>

Kontroll sekvens (, ) oberoende disjunktion ( // ) beroende disjunktion ( / ) if then else subregel(arg) true ( continue ) false ( failure )

Nya bågar process(arg) majorprocess(arg) advance store minorstore

process(arg) en ny aktiv båge från och till den aktiva bågens slutnod i aktuell task arg är namn på en grammatikregel eller ett lexikon

majorprocess(arg) ny aktiv båge från och till den aktiva bågens begynnelsenod i aktuell task arg är namn på en grammatikregel eller ett lexikon

advance ny aktiv båge från den aktiva bågens begynnelsenod i aktuell task till den passiva bågens slutnod bågen bär med sig den regelsekvens som återstår att utföra och den särdragsstruktur som byggts upp

store ny passiv båge från den aktiva bågens begynnelsenod i aktuell task och till den passiva bågens slutnod bågen ärver den särdragsbeskrivning som byggts upp i den aktiva bågen

minorstore ny passiv båge från den aktiva bågens begynnelsenod i aktuell task och till den passiva bågens begynnelsenod bågen ärver den särdragsbeskrivning som byggts upp i den aktiva bågen

Procedurella formalismer motivering fördelar nackdelar

Versioner av UCP UCP original (Lisp) lexikonsökning morfologisk analys syntaktisk analys fonologisk analys UCP light (C) syntaktisk analys

Tillämpningar böjningsanalys och sammansättningsanalys för lexikonbyggande grammatikkontroll SCARRIE, Scania Checker maskinöversättning (MULTRA) ordpredicering (FASTY)