UALA UNIVERITET Metoder och tillämpigar i språktekologie Istitutioe för ligvistik och filologi Föreläsigsateckigar Mats Dahllöf http://stp.lig.uu.se/~matsd/uv/uv07/motist/ Oktober 2007 Frasstrukturgrammatik 1. Kostituetaalys Ma ka aalysera meigar och adra språkliga uttryck geom att dela upp dem i delar. Om vi t.ex. har e meig som E hud såg e stu, så ka vi kaske täka att E hud är e del, ja, subjektet i traditioell satslösig, och såg e stu de adra. ådaa delar kallas kostitueter. Frase såg e stu ka i si tur delas upp i predikat och objekt, alltså i såg och e stu. lutlige ka flerordiga uttryck delas upp i ord. Om vi skall visa hur vi klippt upp meige så ka vi rita så här: E hud såg e stu E hud såg e stu E hud såg e stu e stu Vi ka också skriva, lite mer kompakt, [[E hud] [såg [e stu]]]. Detta visar hur vi har klippt, och där vilka fraser vi urskiljt. 2. Frasstrukturträd I frasstrukturgrammatik beskriver ma meigars grammatik geom att kostruera träd som ta. Det är väsetlige samma träd som ova, fast ytterligare etiketter. Vi har satt i e kategorisymbol för varje ord och ersatt varje fras e kategorisymbol. (Vi ser ju ädå vilke fras som avses.) e hud såg e stu I ta träd förbids fjorto s.k. oder (kutpukter) streck. Dessa oder är etiketterade symboler. Vi har tio olika symboler:,,,,,, 1
e, hud, såg, och stu. Fyra av dessa förekommer som etiketter på två oder, ämlige,,,, och e. Det fis precis e etikett på varje od. Jag har täkt mig att sex av dessa skall stå för grammatiska kategorier, ämlige: : meig (setece, eller täk sats ) : omialfras : verbfras : ermiator (artikel) : substativ (ou) (ome) : trasitivt verb (verb som tar ett objekt) Dessa symboler kallas icke-termialer, för trä får ite sluta (termiera) i dessa. Trä skall sluta i riktiga ord, som här e, hud, såg, och stu. Dessa symboler kallas alltså termialer, eftersom trä slutar i dessa. Notera att trä är uppochedvät, rote högst upp. Rotode är de som har etikette. Ordodera, eller termialodera, kallas följdriktigt för löv(oder). Nodera motsvarar u de ordsekveser (termialsekveser) som ma ka hitta uder dem. De oder som ligger uder e aa od och som är förbuda de kallas för dea ods döttrar (dotteroder). (Och väder vi på hela så talar vi om e ods moder/moderod.) E ods döttrar visar vad ett uttryck består av. I trä ova så består t.ex. -uttrycket (hela ordsekvese) av ett -uttryck (e hud) och ett -uttryck (såg e stu). Vi ka också, t.ex, se att or hud är av kategori (ordklasse) (substativ). Vi har u tre typer av oder: Rotode: Dea är de översta ode. De är ite dotter till ågo od. Icke-termiala oder: Dessa är etiketterade icke-termialer (grammatiska begrepp) och måste ha döttrar (som ka ta oss till termialera, alltså till de riktiga orde). Termiala oder (löv): Dessa är etiketterade termialer. Eftersom vi där ått till de riktiga orde så ka vi ite ha ågra dotteroder till dessa. Det fis också e lijär ordig mella odera, som visar de valiga ordige i språket, alltså de som ges av tidsföljde i tal och de valiga läsordige frå väster till höger är gäller skrift. För att vi skall ha ett träd så måste alla oder utom e (alltså rotode) ha precis e moderod. Vi får ite heller ha korsade grear: Om e od ligger före e aa, så måste de första odes döttrar också ligga före de adra odes döttrar. 2
om vi u kostruerat träd så är klart att träd är formella saker, som vi uttömmade ka represetera i e dator. Vi ka också utföra olika automatiska maipulatioer av träd. Och vi ka också bygga träd givet regler för hur de får se ut. 3. Frasstrukturgrammatik om vi sett ova, så fis e hel del allmäa krav på sytaxträd. Me vi ka äve formulera mer specifika villkor. Och skall vi rikta i oss på att bygga träd för ett visst språk, så måste vi göra. På så sätt ka viu skriva grammatiker som är villkor på hur träd får byggas och samtidigt fågar strukture hos språk vi vill beskriva (t.ex. sveska). Vi ka täka oss e grammatik som e samlig av grammatiksatser, där varje grammatiksats tillåter e del av ett träd. Nu ka vi t.ex. vilja säga vilka ord som tillhör e viss kategori. Med e sats som hud säger vi att hud tillhör kategori (ordklasse substativ). om trädvillkor iebär att e od etikette får ha e od etikette hud som eda dotter. Ja, gällde ju precis dea del av trä ova: hud ådaa grammatiksatser kallas lexikoigågar. De säger att e visst ord (termialsymbol) tillåts och vilke kategori (icke-termial) tillhör. De reglerar ärmare bestämt de fall i vilka e icke-termial od har e (eda) termial dotter. I e lexikoigåg har vi alltsa precis e icke-termial till väster och e termial till höger. För träs ova del behövs alltså följade fyra lexikoigågar (som vi t.ex. ka skriva i bokstavsordig). e hud stu såg Vi behöver också säga i vilka fall e od får ha (e eller fler) icke-termiala döttrar. Det gör vi hjälp av s.k. omskrivigsregler. Dessa grammatiksatser säger att e od e give etikett får ha e sekves av döttrar giva etiketter. T.ex. säger grammatiksatse att e -od (alltså od etikette ) får ha e -od och e -od som döttrar agive lijär ordig. Det är alltså dea del av trä som där tillåts: Vi behöver följade tre regler för att kostruera trä i avsitt 2: 3
Ytterligare e restriktio ka vara bra att ha: Vilke symbol får stå på rotode? I trä ova står som rotodes etikett. Vi ka då säga att grammatikes startsymbol är, eftersom vi avsett att bygga träd för meigar. Grammatike bakom trä ka u sammafattas på ta sätt: Icke-termialer:,,,,,. Termialer: e, hud, såg, stu tartsymbol:. Grammatiksatser (produktioer ka ma också säga): e hud stu såg Dea grammatik tillåter fyra olika träd, ämlige dem för e hud såg e hud, e hud såg e stu, e stu såg e hud och e stu såg e stu. Atalet träd växer sabbt om vi till dea grammatik lägger till ya ord: Om vi t.ex. lägger till tre ya och tre ya, så får vi 5 5 4 = 100 träd, för vi väljer på två ställe och på ett (och vale är oberoede). 4
4.1 Exempel: samordig Vi ka också skapa e lite grammatik som tillåter oädligt måga träd. Det som kallas amordig är t.ex. möjligt: e hud såg coj och e hud e stu För att ta träd skall tillåtas behöver vi bara följade ya grammatiksatser: coj och coj Vi iför alltså kojuktioe (coj) och och tillåter att två sätts ihop till e e kojuktio ( coj ). Detta kallas alltså samordig i valig grammatik. Vi har bara lagt till ett ord och e regel, me gör att vi u ka bygga hur måga och hur stora träd som helst. E -od iförd av de ya regel ka i si tur byggas ut dea regel, som ma ser i ta exempel: coj e hud och coj och e hud e stu (Dea ka t.ex. ersätta vilke som helst i ilediges träd.) Var och e av de -oder som har expaderats regel kude lika gära ha expaderats coj. Det fis alltså i pricip iget största träd vi ka bygga på ta sätt. Det fis alltid ett äu större träd, och så verkar 5
vara i aturligt språk också, eftersom vi vad grammatike abelagar alltid ka göra meigar lägre och lägre och mer och mer ordrika, me som tur är tröttar vi gaska sabbt på såda språklig produktivitet, och v ara läsare och åhörare tappar ataglige tålamo äu sabbare. 4.2 Exempel: ositiosfraser Prepositioer står före ( är som terme ositio säger) fraser, i de allra flesta fall omialfraser. Ett sådat par brukar kallas för e ositiosfras (). Om vi gör följade tillägg till vår exempelgrammatik, så ka vi t.ex. bygga frase e hud. Vi får där bl.a. följade träd: e hud Nu har vi dock ige möjlighet att sätta i e i ett -träd. :er ka bestämma både substativ och verb. I stue hude kyts till ett substativ, a de hör ihop ett verb i slog Pelle lijale. 6
Träde för dessa exempel borde bli ågot i stil : slog p Pelle d lijale d stue d hude Dessa träd kräver e del ya regler och ord. Vi behöver iföra ågra ya sorters substativ d: defiite ou (bestämt substativ) p: proper ou (egeam). Dessa ka esamma bilda :er. d d p d hude d stue d lijale p Pelle 7
5. Grammatisk flertydighet ( ambiguitet ) Med de grammatik som vi u ifört uppstår de itressata situatioe att två olika träd ka kytas till vissa ordsekveser: p Pelle slog d stue d lijale p Pelle slog d stue d lijale Reglera tillåter oss alltså att kyta : som syster till både ärmaste substativ och till verbet. Om vi täker i termer av betydelse, ka vi täka oss att e systerod bestämmer ett ord. å lijale ka alltså säga vilke perso stue syftar på eller hur ågo slog (i vilket fall ositioe atyder att hadlar om tillhygget, eller som språkvetare brukar säga, istrumetet). Dessa två frasstrukturträd verkar alltså visa e grammatisk skillad som svarar mot e geui sematiskt tvetydighet. De regler som vi ifört visar också tvetydighete hos e som stue lijale och hude. (Bra övig: Rita upp de båda möjliga träde!) 8
Lästips Beskow, B., T. Lager, J. Nivre (1996) Elemeta i geerativ grammatik, Lud: tulitteratur. 9