Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem ordklassetiketter och t.ex. böjningskategorier. Lemmatisering/stamning (stemming) tilldela dem lemma eller stam som avspeglar lemmat. Chunkning identifiera viss typ av fras. Mats Dahllöf Institutionen för lingvistik och filologi November 2012 Parsning tilldela meningar en syntaktisk analys. 1 2 Fraser/konstituenter principer Enheter som hänger ihop grammatiskt. Teoretisk motivation: fraser av en viss kategori kan förekomma i olika kontexter. (Egna enheter/moduler av struktur.) Exempel: Den lilla hunden skäller. (som subjekt) Lisa köpte den lilla hunden. (som objekt) Lisa tittade på den lilla hunden. (som prepositions rektion) Beskrivningen av (olika slag av) nominalfraser kan alltså återanvändas i olika kontexter. Grammatisk analys av meningar En mening och dess delar analyseras i ett sammanhang. Vad menar avsändaren? (Om något är oklart eller flertydigt.) Vilka grammatiska egenskaper har orden? Ordklass, böjningsform, andra syntaktiska egenskaper. (Morfologi.) Hur hänger orden ihop i fraser och satser? (Syntax.) Grammatiska funktioner, t.ex. attribut, subjekt, adverbial. Hos Josefsson: Satser har minst subjekt och predikat; satsförkortningar motsvarande fast utan subjekt; båda är fraser uppbyggda kring verb. 3 4
Kriterier som stödjer att något är en fras I grammatiken handlar det ofta om att tillämpa olika kriterier för att stödja eller vederlägga en viss analys. Olika kriterier kan ge olika utfall och analysen av ett visst fenomen kan vara mindre självklar. Man måste då kanske bestämma sig för ett visst synsätt. Traditionell grammatik är delvis konventionell (snarare än renodlat teoretiskt motiverad). Olika grammatikböcker kan ha olika åsikter. Kriterier/tester för fras-skap Semantiken måste ofta stödja (och ligger bakom) våra intuitioner om frasstatus. Exempel: Lisa köpte den lilla hunden. KRITERIUM: En fras kan typiskt återanvändas (med bibehållen betydelse) i olika kontexter. Jag såg den lilla hunden genom fönstret. Specialfall: Den hänger ihop när man modifierar ordföljden i en mening. Den lilla hunden var det som Lisa köpte. 5 6 Kriterier/tester för fras-skap, forts. Exempel: Lisa köpte den lilla hunden. KRITERIUM: En fras kan ofta ersättas av en kortare fras eller ett enda ord (med samma sorts betydelse). Lisa köpte hunden. Lisa köpte den. KRITERIUM: kongruens har OFTA (inte alltid) en fras räckvidd. Lisa köpte en liten hund. Lisa köpte ett litet djur. Lisa köpte de små hundarna. Kriterier/tester för fras-skap, forts. Exempel: Lisa köpte den lilla hunden. KRITERIUM: Två fraser av samma kategori kan samordnas och bilda en samordning av samma kategori. Lisa köpte den lilla hunden och den stora katten. KRITERIUM: En fras kan befrågas byt ut mot frågeord och arrangera till frågeordföljd och ges som svar på frågan. Vad köpte Lisa? Den lilla hunden. 7 8
Huvud bestämning Ett dependensexempel (1) Många fraser innehåller ett ord (huvudet) som är den centrala enheten. Övriga delar av frasen ingår i den genom sina kopplingar till huvudet och räknas som bestämningar. Inom dependensgrammatik (som i hög grad är förenlig med traditionell grammatik) beskrivs syntaxen generellt i termer av huvud-bestämning-relationer mellan ord. art subj dobj art w 0 w 1 w 2 w 3 w 4 En student läste en bok 9 10 Ett dependensexempel (2) Huvud, kriterier När vi bedömer vad som är huvud respektive bestämning så utgår vi från ett antal kriterier. Dessa kriterier är ibland ganska vaga. Deras utfall kan därför bli obestämt. Om vi skall utföra systematiska analyser behöver vi nog utgå från en viss grammatikbok eller i ST-sammanhang annotationsmanual, där vi katalogiserar konventioner för olika typer av konstruktioner. (Exempel [för danska], se: Kromann et al. copenhagen-dependency-treebank.) 11 12
Huvud, typiska egenskaper (1) Huvudet är typiskt obligatoriskt. Bestämningar kan ofta strykas; eventuellt krävs då omböjning av huvudet. Exempel (att bedöma i lämpliga meningskontexter): nu när som helst nu den gröna bilen därborta bilen en fin bil bilen han som står i hörnet han påfallande söt i smaken söt Huvud, typiska egenskaper (2, ex 1) Huvudets kategori bestämmer hela frasens kategori. Exempel (inte så strikta vad gäller antalet generationer ): Substantiv (nomen) och pronomen ger nominalfras. den gröna bilen därborta han som står i hörnet Verb ger verbfras eller sats. (De) sover ofta oroligt (Hon) gav honom en bok 13 14 Huvud, typiska egenskaper (2, ex 2) Huvudets kategori bestämmer hela frasens kategori. Fler exempel: Adjektiv ger adjektivfras påfallande söt i smaken Preposition ger prepositionsfras. på vinden Adverb ger adverbfras. mycket fort nu när som helst Huvud, typiska egenskaper (2, tillägg) Huvudordets böjning bestämmer ofta (inte alltid) motsvarande egenskap hos frasen. Exempel: Adjektivets kongruensegenskaper ger adjektivfrasens kongruensegenskaper mycket surt i smaken Bestämt substantiv ger alltid bestämd nominalfras den gula bilen (men obestämt substantiv kan vara huvud i bestämd nominalfras, som min bil) Verb i infinitiv är huvud i infinitiv(verb)fras. 15 16
Huvud, typiska egenskaper (3) Huvudet är semantiskt sett det avgörande ledet. Exempel: det regnar lite... handlar primärt om att det regnar den gröna bilen därborta... måste vara en bil påfallande söt i smaken... söt (smak) är det avgörande Huvud, typiska egenskaper (4) Huvudet väljer (kräver/tillåter) bestämningar, utifrån sin valens. Exempel: Hon ger honom en bok. *Hon ger honom. Verbet kräver två objekt, vilket de flesta verb inte gör. professor i lingvistik *person i lingvistik Substantivet accepterar en bestämning, som bara kan kopplas till ett fåtal substantiv. 17 18 Huvud, typiska egenskaper (5) Bestämningens morfologiska form beror på huvudets inverkan (kongruens/styrning). Exempel: Hon ger honom en bok. (kasusstyrning) *Hon ger han en bok. ett fint hus (kongruens) *ett fin hus flera fina hus (kongruens) *flera fint hus Huvud, typiska egenskaper (6) Bestämningarnas linjära följd beror på deras relation till huvudet. Exempel: Igår gav hon honom en bok. *Igår gav honom hon en bok. *Igår gav en bok hon honom. (Satsscheman för svenska utgår från satsdelar som bestämningar till verbet.) 19 20
Underordning/subordination/hypotax Den vanligaste typen av syntaktisk konstruktion motsats till samordning. Principer: Ett led är överordnat, huvudet (huvudord/huvudfras). Huvudets systrar är underordnade, och kallas bestämningar. Underordning, schematisk bild X 1 F X 0 E X 0 är huvud. X 0 och X 1 är av besläktade kategorier (olika nivå ). F och E: Fram-, resp. efterställda bestämningar. E och F ingen, en, eller flera döttrar. 21 22 Samordning/koordination/paratax en typ av konstruktion Jämställda led kopplas samman, med konjunktion(er). Helhetens kategori sammanfaller med de samordnade ledens kategori. De samordnade leden är semantiskt jämställda. [[det gröna äpplet] och [den röda paprikan]] (NP) [det [regnar och blåser]] (VP) [[Pelle sover] och [Lisa är vaken]] (S) Samordning, schematisk frasstruktur X X konjunktion X X: Nästan vilken kategori som helst. Vissa grammatiska drag kan ändras: en hund och en katt två fraser i singular blir en samordning i plural. 23 24
Vanliga fraser: nominalfras huvud substantiv eller pronomen bestämningar kallas attribut. Vanliga: artikel (framförställt) adjektivfras (framförställt) prepositionsfras (efterställt) relativ bisats (efterställt) andra bisatser (efterställt) infinitivfras (efterställt) Josefsson, 6.1: finkornigare attributsbegrepp Vanliga fraser: adjektivfras huvud: adjektiv bestämningar kallas adverbial. Vanliga: mer och mest (framförställda, vid perifrastisk komparation) andra adverb (framförställd, ofta gradadverb(ial)) prepositionsfras (efterställt)?? Josefsson, 6.2: om efterställda bestämningar till adjektiv bisats (efterställt) 25 26 Vanliga fraser: adverbfras huvud: adverb bestämningar kallas (även här) adverbial. Vanliga: mer och mest (framförställda, vid perifrastisk komparation) andra adverb (framförställd, ofta gradadverb(ial)) efterställda bestämningar?? bussen körde lika snabbt som bilen Vanliga fraser: prepositionsfras huvud: preposition ( huvud, kan diskuteras) det som prepositionen styr, rektion. Vanliga: nominalfras (objektsform om det är ett personligt pronomen) infinitivfras bisats Prepositionsfraser kan i sin tur bestämma substantiv, pronomen, verb, adjektiv (?), adverb (?) etc. 27 28
Vanliga fraser: verb-baserade Konstruktioner där ett verb är den centrala komponenten behandlas separat: Verbet räknas som predikat. Olika typer av satsdelar ingår. Konstruktioner med subjekt: satser (huvudsatser och bisatser, olika typer). Konstruktioner utan subjekt: infinitivfras, imperativsats. Olika typer av förkortade satsartade konstruktioner. 29