Kotextfri grammatik (CFG) Mats Dahllöf Ist. f ligvistik och filologi December 2015 1 / 23
Frasstrukturträd hud studt Aalys av de ord som häger lägst ed, hud studt. E graf med fler oder ä depdsaalys (fem ord fyra bågar) av mig. 2 / 23
Tre ibäddade träd hud studt studt 3 / 23
Vad uttrycket träd? Nodera står för kostituter (sytaktiska heter som består av ett ord eller flera). treck (bågara) uttycker kostitus (sytaktisk del-helhets-relatio). Nodera märkta med symboler för kategoribegrepp (icke-termialer) eller graford (termialer). eda fågas ordföljd av bilds väster-höger-oriterig. 4 / 23
Frasstruktur kotra depdsgrammatik Nodera står för kostituter (sytaktiska heter som består av ett ord eller flera). DG: ett ord od. treck (bågara) uttycker kostitus (sytaktisk del-helhets-relatio). DG: depds: dast mella ord. Nodera märkta med symboler för kategoribegrepp (icke-termialer) eller graford (termialer). DG: dast ordbegrepp. eda fågas ordföljd av bilds väster-höger-oriterig. amma pricip i DG. 5 / 23
Formella sytaktiska aalyser Formella sytaktiska aalyser, som frasstrukturträd eller depdsgrafer, hur räkar vi ut dem? (1) Isats av mäsklig expert (kostruktio av trädbak ). (2) Maskiilärigsbaserade metoder ka göra parser ur trädbak. Fis både för frasstruktur och depds. Viktigt i språktekologi. (3) Formella regelsystem säger exakt vilka träd som tillåts. Viktigt i sambad med frasstruktur. Aväds iblad i språktekologi. ärskilt viktigt i haterig av artificiella språk. 6 / 23
E speciell typ av formell grammatik, CFG Nu är vi på meta-ivå: Grammatik för CFG. Lite abstrakt alltså: Vad krävs/tillåts i CFG. E ädlig mägd icke-termialer (motsvarar kategorier). E ädlig mägd termialer (motsvarar ord). E icke-termial defiieras som startsymbol. E ädlig mägd grammatiksatser (produktioer ka ma också säga): varje såda har da struktur: västerled högerled västerled precis icke-termial högerled sekvs av termialer och icke-termialer 7 / 23
Ett exempel på CFG Icke-termialer:,,,,,. Termialer:, hud,, studt tartsymbol:. Grammatiksatser (produktioer ka ma också säga): hud studt 8 / 23
Tillåtet träd ligt da CFG hud studt 9 / 23
Tillåtet träd ligt da CFG hud Rätt startsymbol! studt 10 / 23
Tillåtet träd ligt da CFG hud studt Expasio ligt. OK, fis blad produktioera. 11 / 23
Tillåtet träd ligt da CFG hud studt Expasio ligt. OK, fis blad produktioera. 12 / 23
Tillåtet träd ligt da CFG hud studt Expasio ligt. OK, fis blad produktioera. Vi ka kolla alla expasioer på ta sätt. 13 / 23
Otillåtet träd ligt da CFG studt E icke-termial () på ett löv. Där skall vi ha termial! 14 / 23
Otillåtet träd ligt da CFG hud hud studt Expasio ligt. M alterativet fis ite blad produktioera. 15 / 23
Otillåtet träd ligt da CFG studt Expasio ligt. M alterativet fis ite blad produktioera. 16 / 23
Otillåtet träd ligt da CFG studt ymbol på rot. M där skall vi ha startsymbol! 17 / 23
Tillämpa CFG Desiga CFG. Beror på tillämpig, t.ex. del av aturligt språk, eller artificiellt språk. Parsigproblemet för CFG: Givet sekvs av termialer, hitta träd (om fis ågra) som visar hur sekvs ka gereras. Fis algoritmer. Rt formellt system. Vi vet exakt vad CFG är. Vi vet exakt är ett träd och därmed sekvs av termialer tillåts/ite tillåts av CFG. Vi har ite behadlat motsvarade formaliserig av depdsaalys. 18 / 23
Utöka exempel-cfg: hud coj och hud studt Vad mer krävs? 19 / 23
Nya produktioer coj och coj Nya symboler 20 / 23
Ger oädligt måga tillåta träd coj coj och och studt hud studt Varje kel ka lika gära ersättas med samordad uta att trä blir midre tillåtet. 21 / 23
Flertydighet (PP som attribut i ) p Pelle slog d PP studt prep med d lijal 22 / 23
Flertydighet (PP som adverbial i ) p PP Pelle slog d prep studt med d lijal 23 / 23