UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2014 Ord och ordklasser Översikt i stolpform. Terminologin följer i stort sett Gunlög Josefsson (2009), Svensk universitetsgrammatik för nybörjare, Lund: Studentlitteratur. 1 Ord allmänt Ord: teoretiskt sett en ganska svår typ av enhet, särskilt om man skall beskriva ett språk som inte har en skriftspråksnorm. Enheten ord är ofta mer självklar när det finns etablerade skriftspråksnormer som kräver ordmellanrum. Men diskutabla fall finns: isn t. t.ex.. Ord är grammatiskt sett hårt sammanbundna enheter. För svenskans del är också böjning och betoning viktiga kriterier. Det är viktigt att skilja mellan konkreta ord i texter (ordförekomster/löpord) och ord som enheter som ingår i ett språk. 1.1 Ordförekomst/löpord (eng. token) Ordförekomst/löpord: Konkreta förekomster i text eller tal. Löpord kan analyseras som instanser av olika sorters ordtyper. Att segmentera en text i löpord kallas tokenisering i språkteknologiska sammanhang. Inte alltid helt lätt, med tanke på allt man kan stöta på i (elektroniska) texter. 1.2 Ordtyper, olika begrepp Ordtypsbegrepp: Abstrakta enheter, kan uppträda som godtyckligt antal löpord. Dessa är instanser/förekomster/tokens av typen. Graford: definieras av teckensekvens. (Bestäms av tokenisering.) (Versal/gemen kan ibland neutraliseras.) Ex. får ett graford, som kan dyka upp i olika kontexter. (1) Vad får man lägga ut på webben? (2) En som har får som jag känner ska klippa dom på torsdag. Lemma: ett uppslagsord med samma ordklass- och böjningsmönster. T.ex. lägger, lade lemmat lägga; skärm, skärmen lemmat skärm. Grundformen används som namn på lemmat. Bestämma vilket lemma ett löpord representerar i språkteknologiska system kallas lemmatisering. I exemplet ovan: får (1) lemma verbet få och får (2) lemma substantivet får. 1
Lexem: en viss betydelse knuten till ett lemma och därmed till löpord. Bestämma vilket lexem ett löpord representerar i språkteknologiska system kallas word sense disambiguation. Exempel: betydelser hos verbet få (enligt Svensk ordbok, www.ne.se): 1 komma i besittning av 2 ha tillåtelse att 3 vara tvungen att 4 uppnå att påverka (ngn) 5 (plötsligt) komma att Böjningsform: Ett lemma (eller lexem) med specificerad böjning. Former av älska: älska (infintiv), älskar (presens), älskande (presens particip), o.s.v. I exemplet ovan: får (1) presens, aktiv av verbet få och får (2) plural, obestämd form, grundkasus av substantivet får. Analysen av löpords lemma, lexem, böjningsform kräver ofta att vi beaktar kontexten. 2 Morfologi Tre huvudsakliga typer av morfologiska processer : Böjning: Inom samma lemma (och ordklass). Följer regelbundna mönster. Semantiskt förutsägbart. hus huset, vara är. Avledning: Ger ett nytt lemma av ett befintligt m.h.a. affix (morfem som inte är ett ord). hus huslig, hus husera, prata pratig. Det avledda lemmat böjs i sin tur (t.ex. huslig, husligare, husligast). Avledning byter ofta ordklass, men inte alltid. Form och semantik mindre förutsägbart. Lexikalisering avledda ord har ofta en speciell etablerad betydelse. Sammansättning: Ger nytt lemma av två givna. Mycket produktivt i svenskan. Semantik inte helt förutsägbar man måste räkna ut aktuell relation mellan de begrepp orden representerar. Tänk t.ex. på datorväska, handväska, damväska och krokodilväska. Lexikalisering sammansatta ord får ofta en speciell etablerad betydelse. T.ex. krokodiltårar. 2
3 Ordklasser kriterier Tre typer av kriterier: Böjning. Avgörande för substantiv, verb, adjektiv och adverb, och i viss mån för vissa andra ordklasser. Flera ordklasser har ingen böjning. Funktion i syntaxen: (Potentiella) syntaktiska relationer till andra ord i texter och yttranden. Betydelse (semantik): Typ av betydelse. Ofta svårtillämpat. Semantiska hänsyn kommer dock in i analysen av böjning och syntax. 3.1 Ordklassuppsättningar Olika grammatiker har lite olika typer av uppsättningar med ordklassbegrepp. Det kan variera för ett språk. Tittar man på olika språk så kommer givetvis variationen att vara större. Substantiv och verb brukar vara de mest stabila begreppen, både för svenska och tvärspråkligt. Vi kommer att utgå från Josefssons grammatik och från SUC s ordklassetiketter, som stämmer väl överens. 3.2 Ordklasser, böjning, översikt Substantiv, verb, adjektiv: relativt regelbundna uppsättningar böjningsformer. Particip: adjektiviska former av verb. Perfekt particip kongruensböjs. Pronomen: varierande grupp lexem, varierande beteende. (Semantik: systematiskt kontextberoende referens.) Artiklar: liten grupp lexem, kongruens. (Syntax: knutna till substantiv.) Adverb: varierande grupp lexem, vissa uppvisar komparationsböjning. (Syntax: bestämmer verb, adjektiv och andra adverb.) Räkneord: grundtal och ordningstal, viss kongruens; oändligt många, men lätta att överblicka (en, två, tre..., och första, andra, tredje... ). Prepositioner, verbpartiklar, konjunktioner, subjunktioner, infinitivmärke, interjektioner böjs inte. 3.3 Böjningskategorier Böjningskategorier de kategorier av information som uttrycks genom böjning. Detta brukar räknas till de viktigaste grammatiska egenskaperna hos ett språk. Vi kan tänka på böjningskategorier som dimensioner som kan anta olika ömsesidigt uteslutande värden. T.ex. numerus har antingen värdet singular eller plural. 3
4 Substantiv 4.1 Substantiv syntax Huvudord i s.k. nominalfraser, som förekommer som subjekt, olika typer av objekt, styrda av prepositioner, etc. Dessa är bland de viktigaste och vanligaste satsdelarna. 4.2 Substantiv semantik Namn och beskrivande ord. Hör ofta ihop med rikhaltiga begrepp. Öppen ordklass de flesta nya ord vi stöter på är substantiv. Nominalfraser används för att referera till olika saker. 4.3 Substantiv tre böjningskategorier Numerus (eng. number): singular eller plural. Bestämdhet/species (eng. definiteness): obestämd eller bestämd. Kasus (eng. case): grundkasus eller genitiv. 4.4 Genus (eng. gender) hos substantiv Substantiv tillhör ett av två genus i svenskan. Egenskap på lexemnivå. Avspeglas i böjningen, men kan inte påverkas av böjningen. Utrum, t.ex. (en) bil och (en) vrede. Neutrum, t.ex. (ett) hus och (ett) smör. Genus avspeglas i kongruensböjning i singular. Även för adjektiv, artiklar, pronomen. Genus syns bara i singular. 4.5 Räknebara substantiv (eng. countable nouns) (8 former) obestämd form bestämd form numerus: singular bil(s) bilen(s) hus huset(s) fot(s) foten(s) numerus: plural bilar(s) bilarna(s) hus husen(s) fötter(s) fötternas(s) Med s så blir det kasus genitiv; annars grundkasus. De två formerna sammanfaller ibland, t.ex. hus. 4.6 Icke-räknebara substantiv i svenskan (4 former) Substantiv som smör och vrede är svåra att kombinera med räkning och plural. 4
obestämd form bestämd form numerus: smör(s) smöret(s) neutral /singular vrede(s) vreden(s) Med s så blir det kasus genitiv; annars grundkasus. 4.7 Egennamn (eng. proper nouns) i svenskan (2 former) Egennamn med s blir det kasus genitiv; annars grundkasus, t.ex. Stockholm och Stockholms; Anders Borg och Anders Borgs; Anders och Anders (formerna sammanfaller). Egennamn är vanligtvis i singular; ett fåtal är i plural, t.ex. Pyrenéerna. 5 Verb I svenskan är verben både vad gäller morfologi och syntax de ord som representerar de rikhaltigaste uppsättningarna möjlighter. Och det är ganska typiskt för språk, eftersom verben står för handlingar och händelser, och avspeglar dynamiken och rollfördelningarna i de begrepp vi använder för att tala om sådant. 5.1 Verb syntax Verben är de centrala komponenterna i satser (och deras funktion då kallas predikat). Andra satsdelsfunktioner, som subjekt, olika typer av objekt och adverbial är syntaktiskt och semantiskt definierade i relation till verbet/predikatet. 5.2 Verb semantik Representerar begrepp för handlingar, processer och tillstånd. Definierar roller i relation till dessa. T.ex. sälja: agens (säljare)/subjekt, tema (vara/tjänst)/direkt objekt, beneficient (köpare)/indirekt objekt. 5.3 Verb böjning Verben är i många språk den kategori ord som har den rikaste och mest komplicerade böjningen. Det gäller även svenskan. (Olika grammatiker har lite olika synsätt på och terminologi för svenskans verbböjning.) Man brukar gör följande första uppdelning av verbformer: Finita: kan utan hjälp av annan verbform stå som predikat i en sats. Infinita: måste (normalt) ha hjälp av annan verbform för att ingå i en fullständig sats. Här hamnar infinitiv och supinum. (Även particip kan räknas hit, men Josefsson har dem som en egen ordklass.) En böjningskategori är tillämplig för både finita och vissa infinita former: 5
Diates (eng. voice): aktiv eller passiv. Påverkar syntaxen: I aktiv diates är det typiska att subjektet står för aktörsrollen (agens). I motsvarande passiv diates hamnar ett aktivt objekts roll i subjektsställning. (Passiv diates finns därför bara för transitiva verb, d.v.s sådana som tar objekt.) T.ex. (1) Aktiv diates: Ägaren [subjekt/agens] ska klippa fåren [objekt/tema] på torsdag. (2) Passiv diates: Fåren [subjekt/tema] ska klippas på torsdag. (klippa/klippas är aktiv infinitiv resp. passiv infinitiv.) Vi kan urskilja ytterligare en eller (eller två med modus) böjningskategorier för finita former: (Enkla) tempus (eng. tense): presens (nutid/framtid) eller preteritum (förfluten tid). (S.k. sammansatta tempus skapas med flera verbformer. T.ex. pluskvamperfekt, som i hade klippt). Modus: indikativ (vanligt påståendemodus), konjunktiv (som vore, finns bara fragmentariskt kvar i modern svenska) och imperativ (uppmaningsformen, se Josefsson). Imperativ måste vara framtidsorienterad och aktiv p.g.a. sin semantik. Och har andra person som underförstått subjekt. Former i presens och preteritum är alltså finita; andra (infinitiv, supinum, participen) är infinita. Infinitiv är en tidsmässigt neutral form. Supinum förekommer ihop med det temporala hjälpverbet ha i sammansatta tempus som perfekt och pluskvamperfekt. perfekt, t.ex. har [presens av ha] jagat [supinum] pluskvamperfekt, t.ex. hade [preteritum av ha] jagat [supinum] Particip är adjektivartade verbformer, där presens particip s.a.s. står för subjektets/agens egenskap och perfekt particip för egenskapen hos objektet/temat. 5.4 Verb max 13 former (om vi bortser från konjunktiv) neutral /aktiv form s-form/passiv form infinitiv jaga jagas tempus: presens jagar jagas tempus: preteritum jagade jagades supinum jagat jagats imperativ jaga presens particip jagande (talspråk: jagandes) perfekt particip jagad, jagat, jagade 6
Talspråkliga presens particip, som jagandes och läsandes, förekommer ibland i skrift. Uppgift: Hitta på två meningar där jagat är supinum respektive perfekt particip. neutral /aktiv form s-form/passiv form infinitiv läsa läsas tempus: presens läser läses tempus: preteritum läste lästes supinum läst lästs imperativ läs presens particip läsande(s) perfekt particip läst, läst, lästa Uppgift: Gör motsvarande tabell för skratta. 5.5 Kopulaverbet vara (viktigt och vanligt) neutral /aktiv form s-form/passiv form infinitiv vara tempus: presens är tempus: preteritum var supinum varit imperativ var presens particip varande perfekt particip Uppgift: Gör motsvarande tabell för vara i betydelsen att ett sår uppvisar infektion. 6 Adjektiv 6.1 Adjektiv syntax Bestämmer substantiv och pronomen genom att ingå i nominalfraser (attributiv ställning) eller genom att kopplas till dem i satser med hjälp av kopulaverb (vara) (predikativ ställning). (Exempel nedan.) 6.2 Adjektiv semantik Uttrycker egenskaper och relationer. 6.3 Adjektiv böjning Hos adjektiven finns två typer av böjning, kan man säga, dels komparationsböjning, dels kongruensböjning. 7
Komparation tre värden. Exempel, som inkluderar de olika kongruensformerna: positiv komparativ superlativ snäll, snällt, snälla, snälle snällare snällast, snällaste stor, stort, stora, store större störst, största, störste dålig, dåligt, dåliga, dålige värre värst, värsta, värste typisk, typiskt, typiska, typiske mer typisk, etc. mest typisk, etc. 6.4 Adjektivens kongruens Kongruensen visar vad adjektivet är kopplat till och avspeglar numerus, genus och bestämdhet, samt beror på om adjektivet står i attributiv (i en nominalfras) eller predikativ ställning (i ett predikativ utanför den fras det syftar på). Kongruens (illustrerande exempel): Obestämda nominalfraser som subjekt attributiv ställning predikativ ställning (Art./attr.) stark form (huvudord) är stark form En stor kastrull/kvinna/man är stor. Ett stort hus är stort. Flera stora hus är stora. * Ett största hus... blir semantiskt felaktig. Stora kastruller/hus är stora. Bestämda nominalfraser som subjekt attributiv ställning predikativ ställning (Art./attr.) svag form (huvudord) är stark form Den stora/största kastrullen/kvinnan är stor/störst. Deras stora/största kastrull/kvinna är stor/störst. Den store/störste mannen är stor/störst. Deras store/störste man är stor/störst. Det stora/största huset är stort/störst. Deras stora/största hus är stort/störst. De stora/största kvinnorna/männen/husen är stora/störst. Deras stora/största kvinnor/män/hus är stora/störst. Svag form: för attributiv ställning i bestämd NP. Stark form: för andra ställningar (i obestämd NP, predikativ ställning). Stark form singular: där avspeglas grammatiskt genus. Obligatoriskt. Svag form singular: där avspeglas naturligt genus (kön). Ej obligatoriskt. 6.5 Adjektiv med begränsad böjning/användning En del helt oböjliga adjektiv finns, t.ex. nuvarande och släkt. En del adjektiv måste kompareras med mer och mest, t.ex. typisk. Ibland är komparation semantiskt konstig. 8
Vissa adjektiv kan bara användas i en ställning: vår nuvarande regering (attributiv ok); vår regering är nuvarande (predikativ konstig). stolen är sönder (predikativ ok); vår sönder stol (attributiv konstig). Talspråkig lösning: vår söndriga stol. 7 Adverb Semantik: svarar på när?, var? hur? (vagt kriterium). Motsvarande frågeord inkluderade. nu, idag, senare, här, där, överallt, därför, när, var, hur, varför, Många är avledda av adjektiv och sammanfaller med -t-formen (ofta hur-ord): Ett snabbt (adj) lejon rör sig snabbt (adv). Flera snabba (adj) lejon rör sig snabbt (adv). Satsadverb, typ: inte, tyvärr, nog, etc. ja, nej. Det finns olika sorters adverb. 7.1 Vissa adverb kompareras; de kongruensböjs aldrig positiv komparativ superlativ fort fortare fortast dåligt värre värst Ett adverb kongruensböjs aldrig, för det hör inte ihop med något nominalt led som det kan kongruera med. Exempel: Lejonet rörde sig snabbt (adverb). (Josefsson, s. 85.) Lejonen rörde sig snabbt (adverb). Ett snabbt lejon Lejonet var snabbt (adjektiv). De snabba lejonen Lejonen var snabba (adjektiv). 9
Definita pronominaladverb i svenskan befintlighet riktning mot riktning ifrån var vart/vartåt varifrån här hit härifrån/hädan där dit därifrån/dädan (där) uppe upp/uppåt uppifrån (där) nere ner/nedåt nerifrån (där) fram(me) framåt framifrån (där) bak bakåt bakifrån (till) vänster åt vänster vänsterifrån (till) höger åt höger högerifrån öster österut österifrån söder söderut söderifrån väster västerut västerifrån norr norrut norrifrån 8 Pronomen Etymologi: i stället för nomen (substantiv). Hjälpord för referens. Relativt komplicerad ordklass vad gäller böjning, syntaktisk användning och semantik. Semantisk huvudindelning: Definita (bestämda) pronomen Indefinita (obestämda) pronomen Syntax: Vissa hör ihop med substantiv och kongruensböjs, andra används obundet. 8.1 Definita (bestämda) pronomen Personliga (anaforiska) pronomen: jag, mig, du, dig, etc. Possessiva pronomen: min, din, etc. Reflexivt pronomen: sig Reflexivt och possessivt pronomen: sin Demonstrativa pronomen: denna, detta, etc. Determinativa pronomen: typ Den som är satt i skuld är icke fri. Relativa pronomen: som, vars, etc. (I relativa bisatser.) 10
8.2 Indefinita pronomen Kvantitativa pronomen: någon, varje, alla, många, etc. Interrogativa (frågande) pronomen: vem, vad, hurdan (som fungerar som ett pro-adjektiv). (Ord som när, var, vart, varifrån, hur, varför är interrogativa adverb.) Relationella pronomen: samma, annan, nästa, sista, egen, enda, etc. Personliga (anaforiska) pronomen Obs! Personliga pronomen kan referera till döda ting. Josefsson föredrar anaforiska pronomen. Inom parentes: talspråkliga former. Person, numerus subjekts- objekts- possessiv/genitiv genus, kön form form 1:a, sing. jag mig min, mitt, mina 1:a, plur. vi oss vår (våran), vårt (vårat), våra 2:a, sing. du dig din, ditt, dina 2:a, plur. ni er er (eran), ert (erat), era 3:e, sing., mask. han honom hans 3:e, sing., fem. hon henne hennes 3:e, sing., utr. den den dens 3:e, sing., neutr. det det dess 3:e, plur. de (dom) dem (dom) deras Reflexiva pronomen (särskilda former i 3:e person) REFLEXIV REFLEXIV Person, numerus subjekts- objekts- possessiv genus, kön form form 3:e, sing., mask. (han) 3:e, sing., fem. (hon) 3:e, sing., utr. (den) sig sin, sitt, sina 3:e, sing., neutr. (det) 3:e, plur. (de (dom)) 9 Prepositioner Prepositioner skapar tillsammans med en nominalfras, en infinitivfras, en bisats eller ett frågeord en s.k. prepositionsfras. Man säger att prepositioner styr detta andra led. Prepositionen kommer först och styrda ledet sist. Semantiskt sett svarar prepositionen plus det styrda ledet på frågor som När?, Var? och Hur? (Detta är ett vagt kriterium.) (Hela frasen beter sig därmed ofta som ett adverb.) Prepositionsfraser kan bestämma nästan vilken typ av fras som helst, och placeras i de flesta fall efter huvudordet. Exempel: 11
överordnat huvudord prepositionsfras (bestämning) preposition styrt led beskattning av inkomst övningar med skarp ammunition källa till samhörighet och glatt kamratskap finnas för beräkning arbetat i rörelsen avviker från det civila utförs i skarpladdad miljö lever på plankton Anledningen till att sillen utgör en så ofantlig biomassa Prepositionsfraser kan också komma före ordet de bestämmer: prepositionsfras (bestämning) överordnat huvudord preposition styrt led Från årsskiftet gäller I avgiften ingår Med halvöppen vård menas Enligt de nya reglerna kan Ledet som prepositioner styr kommer nästan alltid efter prepositionen. I vissa typer av satser kan detta led dock flyttas framåt, t.ex. för att befrågas i frågor eller topikaliseras i huvudsatser: Vem kan man lita på? Henne måste man alltså hålla sig borta ifrån. Sammanfattningsvis binder en preposition alltid ihop två delar: dels har vi en överordnad fras (med ett huvudord), dels har vi ledet som prepositionen styr. 10 Konjunktioner Konjunktioner binder ihop till samordnade konstruktioner: äpplen och päron. Delarna kan vara av olika typer, men är av samma typ i de enskilda fallen. Vanliga ord, få lemman: och, eller, samt, men. 12
10.1 Konjunktioner samordning NP sl NP kn KN sl NP art DT hd NN art DT hd NN en hund och en student Denna typ av symmetrisk struktur med jämbördiga samordnade led (sl) är typisk. Även flerledade samordningar finns, som äpplen, päron och apelsiner. 11 Subjunktioner Syntax: Subjunktioner inleder bisatser. Semantik: anger den relation bisatsen står i till något objekt eller någon händelse. Vanliga ord, relativt få lemman: att, innan, eftersom, om, medan. Några ovanliga subjunktioner finns: ehuru, huruvida. 12 Infinitivmärke, bara ordet att Grafordet att kan vara subjunktion eller infinitivmärke. Olika uttal! att som infinitivmärke hör alltid ihop med en infinitivförekomst. Vi planerar att [inf.m.] bygga ut vår utbildning i etapper i den takt som ekonomin tillåter med de fristående kurserna som bas. att som subjunktion hör alltid ihop med en bisats. Här hoppas vi att [subjunktion] regeringen och utbildningsdepartementet ser behovet och nyttan av utbildningen och stödjer oss med särskilt avsatta medel. 13