Frasstrukturgrammatik

Relevanta dokument
Frasstrukturgrammatik

Kontextfri grammatik (CFG)

Grammatik för språkteknologer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Datorlingvistisk grammatik I

Parsningsalgoritmer. Parsningsalgoritmer: inledning. OH-serie 1: introduktion. Parsningalgoritmer I. Algoritmer. Vad är parsning? Vad är en algoritm?

Genomsnittligt sökdjup i binära sökträd

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

REGULJÄRA SPRÅK (8p + 6p) 1. DFA och reguljära uttryck (6 p) Problem. För följande NFA över alfabetet {0,1}:

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Borel-Cantellis sats och stora talens lag

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

DEL I. Matematiska Institutionen KTH

Webprogrammering och databaser. Begrepps-modellering. Exempel: universitetsstudier Kravspec. ER-modellen. Exempel: kravspec forts:

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

= (1 1) + (1 1) + (1 1) +... = = 0

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Databaser - Design och programmering. Programutveckling. Programdesign, databasdesign. Kravspecifikation. ER-modellen. Begrepps-modellering

1. Hur gammalt är ditt barn?

Tentamen 19 mars, 8:00 12:00, Q22, Q26

Lösningar och kommentarer till uppgifter i 1.1

Digital signalbehandling Fönsterfunktioner

Tentamen Metod C vid Uppsala universitet, , kl

Egna funktioner. Vad är sin? sin är namnet på en av många inbyggda funktioner i Ada (och den återfinns i paketet Ada.Numerics.Elementary_Functions)

101. och sista termen 1

Databaser - Design och programmering. Databasdesign. Kravspecifikation. Begrepps-modellering. Design processen. ER-modellering

Fakta om Zara Larsson

Remiss Remissvar lämnas i kolumnen Tillstyrkes term och Tillstyrkes def(inition) och eventuella synpunkter skrivs i kolumnen Synpunkter.

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Fakta om plast i havet

Föreläsning 10: Kombinatorik

Kompletterande kurslitteratur om serier

Fourierserien. fortsättning. Ortogonalitetsrelationerna och Parsevals formel. f HtL g HtL t, där T W ã 2 p, PARSEVALS FORMEL

Kollektivt bindande styre på global nivå

Introduktion till statistik för statsvetare

Ny lagstiftning från 1 januari 2011

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Samtal med Karl-Erik Nilsson

Induktion och Binomialsatsen. Vi fortsätter att visa hur matematiska påståenden bevisas med induktion.

2. Konfidensintervall för skillnaden mellan två proportioner.

1. Hur gammalt är ditt barn?

Föreläsning G04: Surveymetodik

Tillämpad biomekanik, 5 poäng Plan rörelse, kinematik och kinetik

(a) om vi kan välja helt fritt? (b) om vi vill ha minst en fisk av varje art? (c) om vi vill ha precis 3 olika arter?

Systemdesign fortsättningskurs

Digital signalbehandling Alternativa sätt att se på faltning

1. Test av anpassning.

AMF. I princip är det bara möjligt att flytta privat sparande och sparande där avtalet tecknats efter den 2 februari i fjol.

Resultatet av kryssprodukten i exempel 2.9 ska vara följande: Det vill säga att lika med tecknet ska bytas mot ett plustecken.

Sannolikhetslära. c 2015 Eric Järpe Högskolan i Halmstad

Tentamen i Elektronik, ESS010, del 2 den 14 dec 2009 klockan 14:00 19:00.

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

MS-A0409 Grundkurs i diskret matematik I

4. Uppgifter från gamla tentor (inte ett officiellt urval) 6

Multiplikationsprincipen

Geometriska summor. Aritmetiska summor. Aritmetiska talföljder kallar vi talföljder som. Geometriska talföljder kallar vi talföljder som

Kundundersökning Kommuninfo/ Kuntainfo: Enkät om kommunens informationsverksamhet

RESTARITMETIKER. Avsnitt 4. När man adderar eller multiplicerar två tal som t ex

Många tror att det räcker

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Bertrands postulat. Kjell Elfström

Visst kan man faktorisera x 4 + 1

Jag läser kursen på. Halvfart Helfart

Befolkning per födelseland Reviderad metod vid framskrivningar. Version: 2

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

1. BERÄKNING AV GRÄNSVÄRDEN ( då x 0 ) MED HJÄLP AV MACLAURINUTVECKLING. n x

tullinge FLEMINGSBERG TULLINGE Kommunens avsikter för Tullinge som helhet

Universitetet: ER-diagram e-namn

Tentamen i Flervariabelanalys F/TM, MVE035

Datorövning 2 Fördelningar inom säkerhetsanalys

APPROXIMATION AV SERIENS SUMMA MED EN DELSUMMA OCH EN INTEGRAL

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 26, 9/2 2011: y + ay + by = h(x)

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

1. Hur gammalt är ditt barn?

Tommy Färnqvist, IDA, Linköpings universitet

Föreläsning F3 Patrik Eriksson 2000

TAMS15: SS1 Markovprocesser

Föreläsning 2: Punktskattningar

1. Hur gammalt är ditt barn?

b 1 och har för olika värden på den reella konstanten a.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Lycka till! I(X i t) 1 om A 0 annars I(A) =

TMS136: Dataanalys och statistik Tentamen med lösningar

Cartesisk produkt. Multiplikationsprincipen Ï Ï Ï

Introduktion till etik (2)

Uppgifter 3: Talföljder och induktionsbevis

Universitetet: ER-diagram e-namn

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F10 ESTIMATION (NCT )

Lärarhandledning Att bli kvitt virus och snuva - När Lisa blev av med förkylningen

LINJÄRA DIFFERENTIALEKVATIONER AV HÖGRE ORDNINGEN

Databaser - Design och programmering. Databasdesign. Funktioner. Relationsmodellen. Relationsmodellen. Funktion = avbildning (mappning) Y=X 2

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Parkerings- och handelsutredning Kristianstad centrum

Design mönster. n n n n n n. Command Active object Template method Strategy Facade Mediator

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Inledande kombinatorik LCB 2001

Transkript:

UALA UNIVERITET Metoder och tillämpigar i språktekologie Istitutioe för ligvistik och filologi Föreläsigsateckigar Mats Dahllöf http://stp.lig.uu.se/~matsd/uv/uv07/motist/ Oktober 2007 Frasstrukturgrammatik 1. Kostituetaalys Ma ka aalysera meigar och adra språkliga uttryck geom att dela upp dem i delar. Om vi t.ex. har e meig som E hud såg e stu, så ka vi kaske täka att E hud är e del, ja, subjektet i traditioell satslösig, och såg e stu de adra. ådaa delar kallas kostitueter. Frase såg e stu ka i si tur delas upp i predikat och objekt, alltså i såg och e stu. lutlige ka flerordiga uttryck delas upp i ord. Om vi skall visa hur vi klippt upp meige så ka vi rita så här: E hud såg e stu E hud såg e stu E hud såg e stu e stu Vi ka också skriva, lite mer kompakt, [[E hud] [såg [e stu]]]. Detta visar hur vi har klippt, och där vilka fraser vi urskiljt. 2. Frasstrukturträd I frasstrukturgrammatik beskriver ma meigars grammatik geom att kostruera träd som ta. Det är väsetlige samma träd som ova, fast ytterligare etiketter. Vi har satt i e kategorisymbol för varje ord och ersatt varje fras e kategorisymbol. (Vi ser ju ädå vilke fras som avses.) e hud såg e stu I ta träd förbids fjorto s.k. oder (kutpukter) streck. Dessa oder är etiketterade symboler. Vi har tio olika symboler:,,,,,, 1

e, hud, såg, och stu. Fyra av dessa förekommer som etiketter på två oder, ämlige,,,, och e. Det fis precis e etikett på varje od. Jag har täkt mig att sex av dessa skall stå för grammatiska kategorier, ämlige: : meig (setece, eller täk sats ) : omialfras : verbfras : ermiator (artikel) : substativ (ou) (ome) : trasitivt verb (verb som tar ett objekt) Dessa symboler kallas icke-termialer, för trä får ite sluta (termiera) i dessa. Trä skall sluta i riktiga ord, som här e, hud, såg, och stu. Dessa symboler kallas alltså termialer, eftersom trä slutar i dessa. Notera att trä är uppochedvät, rote högst upp. Rotode är de som har etikette. Ordodera, eller termialodera, kallas följdriktigt för löv(oder). Nodera motsvarar u de ordsekveser (termialsekveser) som ma ka hitta uder dem. De oder som ligger uder e aa od och som är förbuda de kallas för dea ods döttrar (dotteroder). (Och väder vi på hela så talar vi om e ods moder/moderod.) E ods döttrar visar vad ett uttryck består av. I trä ova så består t.ex. -uttrycket (hela ordsekvese) av ett -uttryck (e hud) och ett -uttryck (såg e stu). Vi ka också, t.ex, se att or hud är av kategori (ordklasse) (substativ). Vi har u tre typer av oder: Rotode: Dea är de översta ode. De är ite dotter till ågo od. Icke-termiala oder: Dessa är etiketterade icke-termialer (grammatiska begrepp) och måste ha döttrar (som ka ta oss till termialera, alltså till de riktiga orde). Termiala oder (löv): Dessa är etiketterade termialer. Eftersom vi där ått till de riktiga orde så ka vi ite ha ågra dotteroder till dessa. Det fis också e lijär ordig mella odera, som visar de valiga ordige i språket, alltså de som ges av tidsföljde i tal och de valiga läsordige frå väster till höger är gäller skrift. För att vi skall ha ett träd så måste alla oder utom e (alltså rotode) ha precis e moderod. Vi får ite heller ha korsade grear: Om e od ligger före e aa, så måste de första odes döttrar också ligga före de adra odes döttrar. 2

om vi u kostruerat träd så är klart att träd är formella saker, som vi uttömmade ka represetera i e dator. Vi ka också utföra olika automatiska maipulatioer av träd. Och vi ka också bygga träd givet regler för hur de får se ut. 3. Frasstrukturgrammatik om vi sett ova, så fis e hel del allmäa krav på sytaxträd. Me vi ka äve formulera mer specifika villkor. Och skall vi rikta i oss på att bygga träd för ett visst språk, så måste vi göra. På så sätt ka viu skriva grammatiker som är villkor på hur träd får byggas och samtidigt fågar strukture hos språk vi vill beskriva (t.ex. sveska). Vi ka täka oss e grammatik som e samlig av grammatiksatser, där varje grammatiksats tillåter e del av ett träd. Nu ka vi t.ex. vilja säga vilka ord som tillhör e viss kategori. Med e sats som hud säger vi att hud tillhör kategori (ordklasse substativ). om trädvillkor iebär att e od etikette får ha e od etikette hud som eda dotter. Ja, gällde ju precis dea del av trä ova: hud ådaa grammatiksatser kallas lexikoigågar. De säger att e visst ord (termialsymbol) tillåts och vilke kategori (icke-termial) tillhör. De reglerar ärmare bestämt de fall i vilka e icke-termial od har e (eda) termial dotter. I e lexikoigåg har vi alltsa precis e icke-termial till väster och e termial till höger. För träs ova del behövs alltså följade fyra lexikoigågar (som vi t.ex. ka skriva i bokstavsordig). e hud stu såg Vi behöver också säga i vilka fall e od får ha (e eller fler) icke-termiala döttrar. Det gör vi hjälp av s.k. omskrivigsregler. Dessa grammatiksatser säger att e od e give etikett får ha e sekves av döttrar giva etiketter. T.ex. säger grammatiksatse att e -od (alltså od etikette ) får ha e -od och e -od som döttrar agive lijär ordig. Det är alltså dea del av trä som där tillåts: Vi behöver följade tre regler för att kostruera trä i avsitt 2: 3

Ytterligare e restriktio ka vara bra att ha: Vilke symbol får stå på rotode? I trä ova står som rotodes etikett. Vi ka då säga att grammatikes startsymbol är, eftersom vi avsett att bygga träd för meigar. Grammatike bakom trä ka u sammafattas på ta sätt: Icke-termialer:,,,,,. Termialer: e, hud, såg, stu tartsymbol:. Grammatiksatser (produktioer ka ma också säga): e hud stu såg Dea grammatik tillåter fyra olika träd, ämlige dem för e hud såg e hud, e hud såg e stu, e stu såg e hud och e stu såg e stu. Atalet träd växer sabbt om vi till dea grammatik lägger till ya ord: Om vi t.ex. lägger till tre ya och tre ya, så får vi 5 5 4 = 100 träd, för vi väljer på två ställe och på ett (och vale är oberoede). 4

4.1 Exempel: samordig Vi ka också skapa e lite grammatik som tillåter oädligt måga träd. Det som kallas amordig är t.ex. möjligt: e hud såg coj och e hud e stu För att ta träd skall tillåtas behöver vi bara följade ya grammatiksatser: coj och coj Vi iför alltså kojuktioe (coj) och och tillåter att två sätts ihop till e e kojuktio ( coj ). Detta kallas alltså samordig i valig grammatik. Vi har bara lagt till ett ord och e regel, me gör att vi u ka bygga hur måga och hur stora träd som helst. E -od iförd av de ya regel ka i si tur byggas ut dea regel, som ma ser i ta exempel: coj e hud och coj och e hud e stu (Dea ka t.ex. ersätta vilke som helst i ilediges träd.) Var och e av de -oder som har expaderats regel kude lika gära ha expaderats coj. Det fis alltså i pricip iget största träd vi ka bygga på ta sätt. Det fis alltid ett äu större träd, och så verkar 5

vara i aturligt språk också, eftersom vi vad grammatike abelagar alltid ka göra meigar lägre och lägre och mer och mer ordrika, me som tur är tröttar vi gaska sabbt på såda språklig produktivitet, och v ara läsare och åhörare tappar ataglige tålamo äu sabbare. 4.2 Exempel: ositiosfraser Prepositioer står före ( är som terme ositio säger) fraser, i de allra flesta fall omialfraser. Ett sådat par brukar kallas för e ositiosfras (). Om vi gör följade tillägg till vår exempelgrammatik, så ka vi t.ex. bygga frase e hud. Vi får där bl.a. följade träd: e hud Nu har vi dock ige möjlighet att sätta i e i ett -träd. :er ka bestämma både substativ och verb. I stue hude kyts till ett substativ, a de hör ihop ett verb i slog Pelle lijale. 6

Träde för dessa exempel borde bli ågot i stil : slog p Pelle d lijale d stue d hude Dessa träd kräver e del ya regler och ord. Vi behöver iföra ågra ya sorters substativ d: defiite ou (bestämt substativ) p: proper ou (egeam). Dessa ka esamma bilda :er. d d p d hude d stue d lijale p Pelle 7

5. Grammatisk flertydighet ( ambiguitet ) Med de grammatik som vi u ifört uppstår de itressata situatioe att två olika träd ka kytas till vissa ordsekveser: p Pelle slog d stue d lijale p Pelle slog d stue d lijale Reglera tillåter oss alltså att kyta : som syster till både ärmaste substativ och till verbet. Om vi täker i termer av betydelse, ka vi täka oss att e systerod bestämmer ett ord. å lijale ka alltså säga vilke perso stue syftar på eller hur ågo slog (i vilket fall ositioe atyder att hadlar om tillhygget, eller som språkvetare brukar säga, istrumetet). Dessa två frasstrukturträd verkar alltså visa e grammatisk skillad som svarar mot e geui sematiskt tvetydighet. De regler som vi ifört visar också tvetydighete hos e som stue lijale och hude. (Bra övig: Rita upp de båda möjliga träde!) 8

Lästips Beskow, B., T. Lager, J. Nivre (1996) Elemeta i geerativ grammatik, Lud: tulitteratur. 9