Automatisk detektering av partikelverb



Relevanta dokument
Förord KERSTIN BALLARDINI

Grammatik för språkteknologer

Grundläggande syntaktiska funktioner och roller

Datorlingvistisk grammatik

Lexikon: ordbildning och lexikalisering

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden

Satslära introduktion

Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen).

Studiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is.

Fraser, huvuden och bestämningar

Svenskans struktur, 7,5 hp Tentamensexempel 1

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

Grammatik för språkteknologer

Grammatik för språkteknologer

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Syntax Fras, sats, mening

729G09 Språkvetenskaplig databehandling

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp

Har/hade-bortfall i svenskan Hur finit är ett naket supinum?

Datorlingvistisk grammatik

Satsdelar. Carina

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.

Sidan 1. En situation. En modell för satsproduktion. Fri ordföljd. Finska kasus. Bunden ordföljd

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet.

Datum: Date: Provkodr: KTR1 Exam code:

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Lingvistik V Satsdelar, huvud- och bisatser

Världens språk, 7,5hp vt 2012

Sidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ?

Datum: Date: Provkodr: KTR1 Exam code:

Delprov A. Språkform och språknorm (2014) RÄTTNINGSMALL

Svenska språket 1, delkurs 2 Språkets byggstenar 714G47 Svenska språket Svenska språkets byggstenar 714G57

Kungliga Tekniska Högskolan Patrik Dallmann

Mening. Sats. Huvudsats. En mening: Jag gillar kaffe men jag gillar inte te. En mening börjar med stor bokstav och slutar med.! eller?

grammatik Ordklasser, nominalfraser, substantiv

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.

Satsled och satstruktur

Grammatisk teori III Praktisk analys

Vanliga frågor för VoiceXpress

Del A 2005 Språkform och språknorm (Maja Lindfors Viklund)

Svensk minigrammatik

Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.

Innehåll. Förord 5. Övningar 26. Så här arbetar du med. På G Grammatikövningar Minigrammatik 9

Fraser och satsled. Språkets uppbyggnad. Definitioner. Språkets uppbyggnad. De fem frastyperna. Allmänt om fraser

Grammatik för språkteknologer

Lingvistik IV Konstituenter och frasstruktur

Svensk grammatik Ordklasser!

Kommentarer till bedömningsmatris för Tala Kurs D

ANDREAS ISSA SVENSKA SPRÅKET

SVENSKANS STRUKTUR. Inledning. Marke&a Sundman

Förhållandet mellan anföringssats och anförd sats vid direkt anföring *

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Bedömda elevexempel i årskurs 1 3

Datum: Date: Provkodr: KTR1 Exam code:

Kommentarer till bedömningsmatris för Tala Kurs D

Grammatisk teori II Attributvärdesgrammatik

TDDC89 LINGVISTIK måndag 20 oktober 2008

Svenska i fokus 1. Provlektion: Tidsordet/objektet i fundamentet. Sidorna plus facit ur Svenska i fokus 1.

Facit för diagnostiska provet i grammatik

Tekniker för storskalig parsning

Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998

4. Bedömning av delprov C

Att analysera andraspråkstexter

Persiska. Albin Finne. Mark Peldius D1418 Språkteknologi

2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.

Sidan 1. Mångtydighet. Ordföljd och informationsstruktur. En situation. Fri ordföljd. Finska kasus. Bunden ordföljd

Dependensregler - Lathund

Några skillnader mellan svenska och engelska

Förord KERSTIN BALLARDINI

Ordförråd och Ordbildning

14. Sammansatta satser

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

Karp. Övningar Språkbankens höstworkshop oktober 2016

Språkets struktur och funktion, 7,5 hp

Sfi-läromedel ur ett processbarhetsperspektiv

Hur böjs Astrid Lindgrens hjältar i (i) Empirisk språkforskning i ett nötskal

En anställande person - person som jobbar nu med att anställa=chef?

Inlämningsuppgift: Pronomenidentifierare

Huvudordklasser. ursinnig, god, glad äta, dricka, cykla. Övriga ordklasser. fort, borta, ute

En byggmodell över språket fonemet morfemet

LPP, Reflektion och krönika åk 9

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Semantik och pragmatik

Innehållsförteckning till Svenska Online. Adress: Uppdaterat

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

Datum: Date: Provkodr: KTR1 Exam code:

Pilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering

Välkommen till den första delkursen i svenska!

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Grammatik skillnader mellan svenska och engelska

Artighetsmarkörer? Om förstås och andra självklarhetsadverb

6 Svenska som andraspråk

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Utveckling av ett grafiskt användargränssnitt

Transkript:

Uppsala universitet Institutionen för lingvistik Oktober 2000 Examensarbete på språkteknologiprogrammet Automatisk detektering av partikelverb Bodil Mattisson Handledare: Åbylundsvägen 75 Lars Borin, inst. för lingvistik, Uppsala universitet 137 32 Västerhaninge Charlotta Berglund, Telia Promotor AB Hem. 08-500 248 92 Harald Berthelsen, Telia Promotor AB Arb. 08-764 35 04 bodil.m.mattisson@telia.se 1

2

Innehåll 1 INLEDNING... 8 1 INLEDNING... 8 1.1 SYFTE... 8 1.2 BAKGRUND: TALSYNTES OCH PROSODI... 8 TILLÄMPNINGAR... 8 PRODUKTION AV SYNTETISKT TAL... 9 MOTIVERING AV UPPGIFTEN... 9 2 DEFINITION AV PARTIKELVERB... 9 2.1 UPPBYGGNAD OCH BETONING... 10 PARTIKELNS ORDKLASSTILLHÖRIGHET... 10 PARTIKELNS SATSDELSTILLHÖRIGHET... 11 2.2 FUNKTION... 11 2.3 FORM... 11 2.4 BETYDELSE... 12 2.5 PARTIKELVERBENS SYNTAX... 12 ORDFÖLJD... 13 INSKOTTSMATERIAL... 14 PARTIKEL ELLER PREPOSITION?... 15 PARTIKEL ELLER ADVERB?... 16 VALENS... 16 3 AUTOMATISK DETEKTERING AV PARTIKELVERB... 17 3.1 LINDBERGS ARBETE... 17 3.2 MITT EGET ARBETE I KORTHET... 19 4 METOD... 20 4.1 MATERIAL... 20 4.2 KRITERIER... 20 4.3 ARBETETS OLIKA FASER... 20 SÖKNING, SORTERING OCH SÅLLNING... 20 KONTEXTEXTRAKTION... 21 KONTEXTSTUDIER... 22 5 RESULTAT... 24 5.1 PARTIKELVERBSLEXIKON... 24 TERMINOLOGI... 24 STRUKTUR OCH INFORMATION... 25 LEXIKONINGÅNGAR... 26 AV... 26 I... 26 MED... 27 OM... 28 3

PÅ... 28 BORT... 29 FRAM... 29 IHOP... 30 IN... 30 TILL... 32 UPP... 33 UT... 35 5.2 GENERELLA REGLER... 36 HÖGERKONTEXT... 36 GRUPPERING...37 SPECIALFALL... 37 ADVERBIAL... 37 5.3 SYNTAKTISKA REGLER... 38 IMPLEMENTERING AV LEXIKON OCH REGLER... 39 6.1 BESKRIVNING AV PROGRAMMET... 39 6.2 VAD KLARAR PROGRAMMET AV?... 39 7 TESTNING AV PROGRAMMET... 40 7.1 TESTRESULTAT... 40 7.2 TYPER AV FEL OCH FÖRSLAG TILL ÄNDRINGAR... 41 7.3 UTVÄRDERING AV RESULTATET... 43 8 ALLMÄNNA FÖRBÄTTRINGAR AV PROGRAMMET... 43 9 SAMMANFATTNING... 44 LITTERATUR... 45 INNEHÅLL... 47 PARTIKELVERB SOM OMFATTAS AV UNDERSÖKNINGEN:... 48 HÖGERKONTEXTER... 49 PARTIKELVERBSINGÅNGAR... 50 AV... 50 4

I... 50 MED... 51 OM... 53 PÅ... 54 BORT... 56 FRAM... 56 IHOP... 56 IN... 57 TILL... 59 UPP... 60 UT... 62 5

Sammandrag Automatisk detektering av partikelverb Syftet med mitt examensarbete är att genom att skriva ett program som kan detektera partikelverb förbättra kvalitén på talsyntesen i Telia Promotors text-till-talomvandlare, Infovox. Partikelverben skiljer sig enbart genom sitt uttal från vissa andra konstruktioner, t.ex. verb följt av prepositionsfras. Ambiguiteter mellan partiklar och prepositioner eller adverb är således ett problem som gör detekteringen komplicerad. Ett annat bekymmer är att det mellan verbet och partikeln kan förekomma inskottsmaterial i form av subjekt eller adverbial. Jag har försökt att lösa problemen genom att utifrån en korpus ta fram information om i vilka kontexter partikelverb får och inte får förekomma. Informationen har jag samlat i ett partikelverbslexikon vilket utgör underlag för själva detekteringsprogrammet. Programmet opererar på ordklasstaggad text och det är meningen att det ska ingå som en del i preprocessningen i Infovox. 6

7

1 Inledning Denna rapport är en redogörelse för ett examensarbete utfört på Telia Promotor AB i Solna inom ramen för språkteknologiprogrammet vid Uppsala universitet. Arbetet ingår i en magisterexamen i datorlingvistik med inriktning mot talteknologi och omfattar 20 poäng. 1.1 Syfte Det övergripande ändamålet med examensarbetet är att förbättra prosodin i Telia Promotors text-till-talomvandlare, Infovox. Arbetet innefattar att undersöka i vilka kontexter partikelverb förekommer och utifrån detta skapa regler för disambiguering av partikelverb och konstruktioner som liknar partikelverben ortografiskt men har annorlunda prosodi. Vidare ingår det i uppgiften att avgöra vilka av dessa regler som är tillräckligt pålitliga för att användas i Infovox. 1.2 Bakgrund: talsyntes och prosodi Talsyntes innebär i korthet att en dator får en ortografiskt skriven text som sedan läses upp med syntetiskt, d.v.s. konstgjort, tal. Målet är oftast att syntesen ska efterlikna mänskligt tal så mycket som möjligt. Nyckeln till naturlighet i detta fall är bra prosodi, d.v.s. att kunna efterlikna det mänskliga talets melodi. Tillämpningar Det är många människor, framför allt talskadade och synskadade som har nytta av talsyntes. För talskadade finns det program som fungerar som talproteser. Synskadade kan få annars svårtillgängligt skrivet material, såsom tidningsartiklar och brev, uppläst förutsatt att materialet finns i elektronisk form. Både synskadade och dyslektiker kan dra nytta av talsyntes genom att få egenhändigt skriven text uppläst och på så sätt upptäcka eventuella fel. Människor med talsvårigheter har även nytta av texttelefoni; de skriver vad de vill säga och låter syntesen läsa upp meddelandet. Om texttelefonen klarar av taligenkänning, d.v.s. att konverteraa talat språk till skrivet språk, kan även hörselskadade ha glädje av den då de kan få samtalspartnerns yttranden i skriven text. I och med att talsyntesens kvalité ökar blir det allt vanligare att talsyntes används för att producera yttranden i dialogsystem och informationsförmedlingsystem. Förr användes ofta färdiginspelade meningar från en människa i den här sortens applikationer. Det blir dock ohållbart att vara beroende av en person (vars röst dessutom varierar med bl.a. hälsa och ålder) om systemet måste uppdateras ofta. Detta gör att det är särskilt lämpligt att använda talsyntes när variabel information ska vidarebefordras via telefon, t.ex. väderprognoser, nyheter, och e-post. Ytterligare tillämpningar är dataspel och interaktiva läromedel. 8

Produktion av syntetiskt tal För att en dator ska klara av att läsa upp en skriven text med någorlunda naturligt uttal måste texten först konverteras till en underliggande fonetisk beskrivning. Ett grundläggande steg i denna process är att den fonetiska transkription för alla orden i texten slås upp i lexikon. Ett alternativ till detta är att använda grafem-till-fonemregler i kombination med ett undantagslexikon. Ett annat viktigt steg är den lingvistiska analysen. Omfattningen av analysen varierar mycket mellan olika system men den är nödvändig för att åstadkomma en hyfsad prosodi då lingvistisk analys gör det möjligt att sätta ut prosodiska markörer. Syntaktisk, morfologisk och ibland även semantisk analys gör att vi kan sätta markörer för t.ex. stavelsestruktur och frasgränser. Dessa markörer styr sedan talljudens längd, grundtonskurvans mönster och intensiteten och de är avgörande för prosodins kvalitet. Även mänskliga faktorer såsom ålder, kön, ansatsrörets längd, hälsa och sinnesstämning påverkar indirekt prosodin men dessa parametrar går sällan att få fram utifrån den skrivna texten. Den färdiga fonetiska representationen konverteras sedan till tal. Det finns olika tekniker för detta; formantsyntes är parameterstyrd och helt datorgenererad, konkateneringssyntes innebär att förinspelade ljudsegment från en människa, t.ex. difoner, klistras ihop. En difon består av övergången mellan två ljud, t.ex. andra halvan av ett b följt av första halvan av ett a. Vitsen med difoner är att man fångar övergångarna mellan olika fonem (t.ex.. låter b framför ett a lite annorlunda än framför ett i ). För att syntestisera ordet bad hämtas följande difoner från en difondatabas: tystnad+b, b+a, a+d och d+tystnad. Motivering av uppgiften Varför är det då viktigt att kunna detektera partikelverb vid text-tilltalomvandling? För det första skiljer sig partikelverbens betoningsmönster från andra verbfrasers och detta påverkar prosodin. Detta gör att om man inte kan hitta partikelverben kommer dessa alltid att betonas fel vilket leder till att det kan vara svårt att förstå vad som menas och helhetsintrycket av syntesen blir sämre. För att göra syntesen så lättförståelig som möjligt är det därför viktigt att hitta partikelverben men att samtidigt se till att andra, liknande konstruktioner inte får partikelverbsbetoning om de inte ska ha det. För det andra är det behändigt att kunna behandla partikelverben som hela enheter i stället för två ord (verb och partikel) under förarbetet av texten inför syntesen. Detta gäller framför allt när verbet och partikeln står efter varandra. I dessa fall blir materialet enklare att parsa, d.v.s. analysera syntaktiskt, och vi får en bättre grammatisk beskrivning. Detta i sin tur leder till att det är lättare att sätta ut prosodiska markörer. Summan av det hela är att vi får ett naturligare uttal på både fras- och meningsnivå. 2 Definition av partikelverb Att hitta en definition av ordet partikelverb i svenska grammatikböcker är inte lätt då det oftast inte finns med. Dock verkar grammatikboksförfattarna vara ense om att det finns konstruktioner i svenskan som består av ett obetonat verb följt av en betonad partikel eller ett verb med en betonad 9

partikel som förled. Hur sådana konstruktioner ska benämnas, vad partikeln har för ordklasstillhörighet och vilken satsdel den tillhör finns det varierande åsikter om i litteraturen. Den vanligaste beskrivningen av ett partikelverb är dock något i stil med det som följer. De flesta exemplen nedan är tagna från Thorell(1981). 2.1 Uppbyggnad och betoning Ett partikelverb utgörs av ett obetonat verb och en betonad partikel, tillsammans har de sammanfattningsaccent (även kallad idiomatiseringsaccent, gruppordsaccent och konnektiv prosodi), d.v.s. tryckaccent på sista ledet i ordgruppen. Jämför exempelmeningarna nedan. I det första exemplet nedan är på obetonat, i det andra betonat. Han hälsade på henne / d.v.s. sade hej Han hälsade på henne / d.v.s. besökte (verb + prepositionsfras) (partikelverb) Partikelns ordklasstillhörighet Enligt t.ex. Thorell (1973) kan partikeln antingen bestå av ett adverb (t.ex. ut, fram, ihop) eller en preposition (t.ex. på, av, om). Partikelverb kan även konstrueras med en preposition följd eller föregången av ett reflexivt pronomen (t.ex. (sätta)på sig/(ta) sig in). En del räknar också en del (mer idiomatiska) konstruktioner med adjektiv och substantiv som partikelverb, t.ex. göra färdigt och slå dank. I det sista exemplet är det svårt att utröna partikelverbets betydelse utifrån de ingående delarnas betydelse och sådana konstruktioner kallas ofta lexikaliserade partikelverb. Senare grammatikboksförfattare, t.ex. Järner (1993) och Stroh-Wollin (1998), uttrycker sig mycket försiktigare om partklarnas ordklasstillhörighet genom att säga att verbpartiklarna liknar/ser ut som adverb och prepositioner och att de självständigt kan fungera som sådana. Båda nämnda författare anser dock att verbpartiklar och prepositioner skiljer sig åt i en rad avseenden: - Prepositioner är obetonade i kontexten ifråga, verbpartiklar betonande. - Verbpartiklarna är starkare bundna till verben de är knutna till än vad prepositionerna är. - Prepositionerna måste förekomma tillsammans med substantiv, detta gäller ej verbpartiklar. Med detta i åtanke tar det emot att klassificera verbpartiklar som prepositioner. Stroh-Wollin påpekar att verbpartiklarna traditionellt har räknats till adverben. Detta är i linje med den information man finner om man konsulterar en någorlunda utförlig ordbok. I, av, med och på räknas alla till ordklassen adverb i de fall de uppträder som verbpartiklar. 10

Senare kommer vi se att partikelverben uppför sig lite olika beroende på typ av partikel, det är därför praktiskt att tala om prepositionsliknande och adverbliknande partiklar. Partikelns satsdelstillhörighet Verbpartikeln kan räknas som utgörande en del av predikatet eller som ett adverbial. Partikeln bildar en syntaktisk, semantisk och uttalsmässig enhet med verbet och därför är det inte svårt att se den som en del av predikatet. Det är heller inte ologiskt att räkna verbpartikeln som ett adverbial då den liksom ett adverbial modifierar verbet. En som följt denna linje är Erik Andersson (1993). Han kallar verbpartiklar för partikeladverbial. Detta synsätt återfinns också i den nyutkomna Svenska akademiens grammatik (1999) där han är en av medförfattarna. 2.2 Funktion Partikeln har tre funktioner: transitivering, objektsväxling samt förändring av verbets aktionssätt. Transitivering innebär att intransitiva verb görs transitiva. Ett exempel på detta är verbet tänka, som är intransitivt och tar en prepositionsfras, och partikelverbet tänka ut som är transitivt, d.v.s. det konstrueras med objekt. Ett exempel på objektsväxling är konstruktionerna: skriva [sitt namn]obj. [på ett kontrakt]pp. skriva på [ett kontrakt]obj. [med sitt namn]pp. Det enkla verbets objekt (sitt namn) motsvaras av en prepositionsfras (med sitt namn) vid partikelverb. Prepositionsfrasen vid enkelt verb (på ett kontrakt) motsvaras av ett objekt (ett kontrakt) i konstruktionen med partikelverb. I svenskan skiljer vi på t.ex. terminativt och durativt aktionssätt. Ett verb som är terminativt är begränsat i tiden, t.ex. bestiga, och ett durativt verb är obegränsat i relation till tiden, t.ex. klättra. En partikel kan ändra ett verbs aktionssätt, t.ex. från durativt till terminativt. Exempel på detta är blomma blomma upp. 2.3 Form Partikeln kan vara efterställd och lösgjord från verbet, då talar man om lös förbindelse/sammansättning. Ett exempel på detta är ställa in. Partikeln kan även stå som förled till verbet, så är fallet i t.ex. inställa. Här är det istället en fast förbindelse/sammansättning vi har att göra med. Man måste skilja på partikelsammansatta verb, t.ex. inställa, och prefixavledda verb, t.ex. beställa. Partikeln (i detta fall in) består alltid av ett fritt morfem med motsvarigheter i ett självständigt ord medan prefixet utgörs av ett bundet morfem (i detta fall be-). Partiklarna till skillnad mot prefixen kan oftast skiljas från sitt verb men det finns undantag, se nedan. Partiklar och prefix har mycket gemensamt då de båda modifierar verbets betydelse och förmåga att ingå i 11

olika syntaktiska konstruktioner. Märk dock att i inställa är det partikeln som har huvudtrycket och i beställa är det verbet. Vissa partikelverb förekommer enbart som fasta förbindelser, t.ex. tillåta och urarta. Andra finns bara i lös förbindelse, däribland tycka om och rycka till. En tredje grupp bildar de partikelverb som kan förekomma i båda formerna, t.ex. inställa - ställa in. I den sistnämnda gruppen finner vi en stilistisk skillnad mellan de olika formerna; den fasta konstruktionen är mer formell och typisk för skriftspråk, medan den lösa varianten är vanlig i talspråk och informella sammanhang. Vid participbildning är det emellertid alltid fast förbindelse som gäller, t.ex. utvecklande. Många partikelverb finns i reflexiva varianter. En del, som t.ex. ta med och ta med sig är semantiskt knutna till varandra och har liknande syntaktiska egenskaper. Andra par har väldigt lite gemensamt förutom formen. Detta gäller t.ex. ta till (hammaren), ta till sig (ngt) och (vad ska man) ta sig till. 2.4 Betydelse Det är inte alltid det går att förutsäga ett partikelverbs betydelse utifrån de ingående delarna. Det enkla verbets betydelse förändras ofta då det kombineras med en partikel. Detta kan exemplifieras av verbet duka och partikelverbet duka under som inte alls betyder samma sak. Vidare finns det homografer hos partikelverben som kan ha helt olika betydelser. T.ex. gå på har minst tre olika betydelser: gå in i (t.ex. en buss), bli lurad, och forsätta med det man håller på med. Många partikelverb uppvisar både semantisk och en stilistisk skillnad beroende på förbindelseformen. Jämför t.ex. framställa - ställa fram, avbryta - bryta av. De fasta förbindelserna är abstrakta med bildlig betydelse medan deras lösa motsvarigheter är mer konkreta i sin betydelse. I flera fall är det svårt att överhuvudtaget se något semantiskt samband mellan de två formerna. Detta gäller t.ex. avgöra (besluta) - göra av (med pengar). 2.5 Partikelverbens syntax Partikelverben utgör en undergrupp till lexikaliserade fraser som i sin tur utgör en undergrupp till kollokationer, d.v.s. ord som ofta förekommer tillsammans. Några exempel på lexikaliserade fraser är t.ex. fina fisken, Dagens Nyheter, kniv och gaffel, full i sjutton och hålla klaffen. Enligt Anward & Linell (1976) kännetecknas lexikaliserade fraser bl.a. av att de utgör en syntaktisk enhet, t.ex. en konstituent, och att de (ofta) har konnektiv prosodi. Vi har sett ovan att detta även gäller partikelverben. Liksom enkla verb kan man dela in partikelverb i transitiva och intransitiva. Partikelverb kan förekomma i meningar med omvänd ordföljd och vissa partikelverb kan även förekomma i passiverade och topikaliserade meningar. Till skillnad från enkla verb är de löst sammansatta partikelverben tvådelade och inskottsmaterial i form av ett eller flera ord kan förekomma mellan verbet och partikeln. I och med att partikeln till formen kan vara identisk med adverb eller prepositioner uppstår även ambiguiteter. 12

Nedan följer en redogörelse för hur partikelverben uppträder i olika sammanhang, vad inskottsmaterialet kan bestå av och vilka ambiguiteter som är förknippade med partikelverb. Ordföljd I detta avsnitt presenteras olika typer av förändringar av ordföljden, de processer som ligger bakom och vilka mönster de ger upphov till i de fall partikelverb är närvarande. I fasta förbindelser står partikeln alltid före och tillsammans med verbet oavsett typ av sats. Han inställde mötet. Vad gäller lösa förbindelser i huvudsatser med rak ordföljd står partikeln frånskiljt från, men direkt efter, verbet. Förekommer satsadverb placeras detta mellan verbet och partikeln (i påståendesatser och uppmaningar). Exempel: Oskar skrev på kontraktet igår. Oskar skrev inte på kontraktet igår. Skriv inte på kontraktet! Om ett annat satsled än subjektet står först i en huvudsats (d.v.s. i fundamentet) får vi omvänd ordföljd. Detta gäller också vissa typer av frågesatser. Den omvända ordföljden gör att subjektet hamnar mellan verbet och partikeln. Igår skrev Oskar på kontraktet. Om jag inte minns fel, skrev Oskar på kontraktet igår. Skrev Oskar på kontraktet igår? (omvänd) (omvänd) (omvänd) I bisatser är partikeln alltid placerad direkt efter verbet oavsett om satsadverb förekommer eller ej. Han sade att han (inte) ställde in mötet igår. I exemplen ovan påverkas inte högerkontexten (objektet står kvar direkt efter partikeln) men objektet kan mycket väl flyttas fram till fundamentet. T.ex. ger en del transformationer upphov till förändringar av högerkontexten. Detta gäller främst passivering och topikalisering. Definitionerna nedan kommer från Dahl (1982). Passivering innebär att följande förändring sker av en mening i aktiv diates: subjektet placeras efter verbet, prepositionen av läggs till framför subjektet, objektet placeras på subjektets plats och verbet får passiv form. Exempel: Oskar skrev på kontraktet Kontraktet skrevs på av Oskar (aktiv) (passiv) 13

Endast meningar med ett transitivt verbled kan genomgå en sådan transformation. Det är dock inte alltid den passiva konstruktionen uppvisar samma mönster som ovan. Subjektet kan strykas i passiva konstruktioner i tre fall; om det är underförstått som i exempelmeningen nedan, om det är obekant eller om syftet är att dölja subjektet. Kontraktet skrevs på och affären avslutades. Utelämnande av subjekt eller objekt är ett vanligt fenomen i olika sorters satsförkortningar, oberoende av diates. I nästa exempel har objektet uteslutits: Alla var nöjda med kontraktet, till och med Oskar skrev på. Topikalisering innebär att en nominalfras, oftast det direkta objektet, i en mening flyttas fram till fundamentsposition. Topikaliseringen medför också att det finita verbet flyttas fram före subjektet (s.k. finit-framflyttning). Oskar gav bort boken (till Anna). Boken gav Oskar bort (till Anna). (rak ordföljd) (topikaliserad version) Observera även följande passiva variant av meningen: Boken gavs bort till Anna. Här har givaren (Oskar) uteslutits, vilket enligt Thorell (1973) är vanligt när det gäller verb som t.ex. giva, lämna och lova. Det kan också tänkas att det var uppenbart vem som gav boken till Anna och att det var därför subjektet uteslöts. Inskottsmaterial Lindberg (1994) har arbetat med automatisk detektering av lexikaliserade fraser och har även inkluderat partikelverb i sin undersökning. Lindberg har kommit fram till att följande gäller för inskottsmaterial och jag har inte hittat något som emotsäger detta: 1) Om inskottet innehåller ett subjekt kan detta bestå av allt från enkla pronomen till hela nominalfraser med attribut av olika slag samt även proprier och förkortningar. 2) Om inskottet innehåller ett adverbial utgörs detta allt som oftast av ett kort satsadverbial (t.ex. inte eller ju), eller en prepositionsfras, men även tyngre adverbial förekommer (Lindbergs exempel): Han ställer inte upp idag Jag kommer tyvärr inte speciellt bra ihåg henne 3) I följande fall kan det inte förekomma något inskottsmaterial: - i satser som innehåller hjälpverb 14

- i bisatser - när verbet står i infinitiv eller particip Partikel eller preposition? Det kan vara mycket svårt och ibland t.o.m. omöjligt för både datorer och människor att skilja följande konstruktioner från varandra då det enda som skiljer konstruktionerna åt är betoningen och den kan man inte sluta sig till enbart utifrån texten. Exempel: Du måste skruva på korken. (dvs. sätta på korken på flaskan t.ex.) Du måste skruva på korken. (dvs. du ska inte trycka på korken, utan skruva på den). (partikelverb + nominalfras) (verb+advl (prep. + nominalfr.)) Då osäkerhet uppstår finns det en rad olika förflyttningstester att ta till. Teleman(1983) föreslår bl.a. följande tester (mina språkexempel): - Om prepositionskandidaten samt efterföljande nominal kan brytas ut och göras till fundament, inleda en relativ sats eller frågesats, så är det en preposition: Kalle går på tricket *Det är på tricket som Kalle går Kalle går på vägen Det är på vägen som Kalle går - Det prepositionsliknande ordet är en partikel om det efterföljande nominalet lätt kan göras till subjekt i passiv sats: käppen bröts av - Ordet särskilt kan användas för att disambiguera prepositioner och partiklar. Ett nominal i en prepositionsfras kan framhävas på följande sätt: jag har lekt särskilt med Kalle. Det går däremot inte att placera särskilt framför en partikel i avsikten att framhäva det efterföljande objektet: jag har brutit av särskilt käpparna *jag har brutit särskilt av käpparna - Om man kan sätta prepositionskandidaten som förled till verbet utan att ändra ordföljden är det ett partikelverb vi har att göra med: ta (i)från Svensson bilen frånta Svensson bilen ta bilen från Svensson *frånta bilen Svensson 15

Testerna ovan må vara nog så praktiska men de går tyvärr inte att använda i datorsammanhang. Partikel eller adverb? Lindberg har funnit att ett verb tillsammans med en adverbliknande partikel oftast utgör ett partikelverb. Sådana konstruktioner ger därför upphov till få ambiguiteter. Men om verbet betecknar rörelse kan det ibland vara svårt att avgöra om t.ex. upp är en partikel eller om det är ett adverb som bestämmer ett rumsadverbial. Rumsadverbialet börjar ofta med mot/till. Exempel: Han gick upp mot kyrkan. Han gick upp mot kyrkan Det bör nämnas här att prepositioner och adverb kan vara betonade i emfatiska konstruktioner, till exempel i meningen Han gick på mattan (inte bredvid den). Denna betoning går det heller inte att sluta sig till enbart från texten om där inte finns en speciell fördefinierad markör. Valens Vad gäller valens menar Lindberg att om man anger både de enkla verbens och partikelverbens valens i lexikon löser man en del ambiguiteter, men inte alla. Om man vet att ett partikelverb är intransitivt så kan man utesluta konstruktioner där den eventuella partikeln följs av en nominalfras. Lindbergs exempel (här och framåt tills annat anges): * Han gick under stegen. Han gick under stegen. Notera att detta kan vara lite vanskligt då adverbial kan utgöras av nominalfraser (t.ex. han tittade in en torsdagskväll) vilka dessutom gärna följer direkt efter partikeln i meningen (min anmärkning). För de enkla verben är det (enligt Lindberg) också bra att ange huruvida de kan efterföljas av en prepositionsfras eller ej. Genom att i lexikon ange sådan information jämte uppgifter om ordklass och valens kan meningsanalyser som de nedan undvikas: De såg på oss. Hon klippte av några centimeter. Han satte i fönstret. Valensinformation räcker emellertid inte i de fall då det enkla verbet kan bilda både transitiva partikelverb och ta prepositionsfras. Ambiguiteten består t.ex. i följande meningar: Slå i sina böcker Slå i sina vänner att 16

3 Automatisk detektering av partikelverb Vad är det då ett program för automatisk detektering av partikelverb måste klara av? Den övergripande uppgiften är att avgöra huruvida ett verb följt av ett adverb eller en preposition utgör ett partikelverb eller ej. Detta innebär att programmet måste kunna hantera följande: 1) Eventuella inskottsmaterial, d.v.s. hitta inskottsmaterialet och analysera det. 2) Eventuella högerkontexter, d.v.s. identifiera det material som kommer efter partikeln och analysera det. 3) Hantera förändringar i ordföljden. T.ex. ska både meningar med rak och omvänd ordföljd kunna behandlas. Detta innebär att det någonstans måste formuleras vilka inskott och högerkontexter som är tillåtna och att programmet måste klara av en viss grad av syntaktisk analys eller samverka med andra moduler som ger sådan information. Jag kommer i detta kapitel kortfattat presentera Lindbergs förslag till lösning från 1994 och även nämna hur han ser på problemet idag. Mitt eget lösningsförslag, som i mångt och mycket liknar Lindbergs, redovisas därefter i korta ordalag för att sedan presenteras närmare i resultatkapitlet. 3.1 Lindbergs arbete För att detektera lexikaliserade fraser och då även partikelverb automatiskt föreslog Lindberg 1994 en metod som bygger på både regler och lexikon. I korthet såg hans förslag till lösning ut som följer: - Hantera partikelverb innehållande prepositionsliknande partiklar genom att lista dem i lexikonet. - Hantera partikelverb innehållande adverbliknande partiklar med regler. Om disambigueringsreglerna kräver ett verb, ett begränsat inskottsmaterial och sedan den adverbliknande partikeln blir andelen övergenereringar ganska liten. - Tillåt subjekt, adverbial och objektspronomina som inskott. - Uteslut dock verb, subjunktioner och skiljetecken i inskottet. - Begränsa antalet inskottsord till ca fem. - Ange ordklass i lexikonet. - Ange partikelverbens och de enkla valens i lexikonet. - Ange även i lexikonet huruvida enkla verb kan ta prepositionsfraser. Sammanfattningsvis säger Lindberg att reglerna har fördelen att de kan hitta alla konstruktioner som uppfyller vissa kriterier och de kan även hitta nybildningar. Täckningsgraden är dock inte tillräckligt stor även om man begränsar reglerna till att enbart omfatta t.ex. partikelverb som tar adverbliknande partiklar, och dessutom släpps en hel del tvetydigt och felaktigt material igenom. En metod som helt förlitar sig på lexikonet övergenererar inte 17

lika mycket som en regelbaserad men partikelverben är å andra sidan väldigt många. I en senare rapport, Lindberg (1999), har Lindberg ändrat uppfattning på flera punkter vad gäller partikelverben. Till att börja med har han genom att utgå från semantiska kriterier snarare än formella och prosodiska begränsat vilka partikelverb som får vara med i fraslexikonet. Han fokuserar därmed på de mer idiomatiska partikelverben. Därför utesluter han partikelverb vars partikel används i sin ursprungliga rumsliga betydelse, därmed utesluts slänga in men lägga in får vara med i och med att en av dess betydelser ( konservera ) inte är semantiskt kompositionell, d.v.s. det går inte att sluta sig till betydelsen utifrån de ingående delarna. Den andra typen av partikelverb som utesluts är sådana som används i rumsliga metaforer, t.ex. slunga ut och sväva ut. Vad gäller regler och lexikon har Lindberg frångått idén att hantera adverbliknande partiklar med hjälp av regler då där fanns för många ambiguiteter. Han menar att övriga får skötas av parsern. Han ser ej heller längre någon fördel i att i lexikonet ange huruvida enkla verb kan ta prepositioner efter sig i och med att alla verb kan ta adverbiella prepositioner. I övrigt gäller det som listades ovan. LP-Detect är namnet på Lindbergs program och det innehåller tre komponenter: ett lexikon över lexikaliserade fraser, ett detekteringsprogram och en disambigueringsdel (Dis). Lexikonet innehåller totalt drygt 8000 fraser som med hjälp av variabler kan härledas utifrån ca 4800 typer av fraser. Lexikonet innehåller följande uppgifter: - Vilken typ av fras det rör sig om och hur många exempel av den typen det finns i lexikonet - En approximering av hur långt det minst frekventa ordet är anges genom att lista det längsta ordet i frasen. - Ordklassanalys av frasen (med subkategorisering av verben som t.ex. anger om verbet är transitivt, bitransitivt eller intransitivt). - Ett reguljärt uttryck som används för att hitta frasen i texten. Uttrycket kan innehålla ord, ordklasser och variabler. - Prosodisk och morfologisk information m.m. Detekteringsprogrammet använder de reguljära uttrycken. Sökrymden begränsas genom att endast de fraser vars längsta ord finns med i meningen anses som möjliga. Programmet innehåller både disambigueringsregler och uteslutningsregler ( discarding rules ) som tillsammans hittar den rätta lösningen. Input till programmet är textfiler från SUC innehållande ord:ordklass-par. Om ordet är ett verb står dess grundform. Output är samma mening med eventuella lexikaliserade fraser markerade med hakparenteser och taggar. Programmet klarar av att hitta 94 % av de lexikaliserade fraserna i SUC. Jag har ingen uppgift på vilka partikelverb han hanterar och om procentsiffran även gäller för den gruppen. 18

3.2 Mitt eget arbete i korthet I detta avsnitt presenterar jag mitt eget lösningsförslag i stora drag. En mer detaljerad redovisning återfinns i kapitlet Resultat. Jag har fått stor hjälp av Lindbergs arbete och i mycket av det jag har gjort syns det spår efter honom. Hans uppgift var mer övergripande än min då han syftade till att hantera alla sorters lexikaliserade fraser medan jag enbart har koncentrerat mig på partikelverb och till och med bara ett begränsat antal sådana (se kapitlet Metod). Även jag anger ordklass och valens i lexikonet, tillåter subjekt och adverbial som inskott och begränsar inskottet till fem ord. Jag godkänner dock inte objektspronomina rakt av utan anger för varje partikelverb om de kan förekomma i reflexiv form eller ej. Jag listar både partikelverben med adverbliknande partiklar och dem med prepositionsliknande partiklar i lexikonet. Jag anger huruvida partikelverben är intransitiva eller transitiva men den informationen är bara till för att framtida syntaktiska regler (t.ex. regler för att hantera passivering) ska veta vilka partikelverb de kan operera på. Huruvida Lindberg har några syntaktiska regler som hanterar förändringar i ordföljden vet jag inte men dessa torde vara nödvändiga om man vill få en hög täckningsgrad, åtminstone för ickeidiomatiserade partikelverb. För lexfraser av typen hålla sig underrättad eller skämt åsido är det möjligt att ordföljden inte påverkar fraserna i sig utan bara deras omgivningar. Jag anger valens i form av en lista av godkända högerkontexter. En subkategorisering av partikelverben har jag varit inne på, se mer om detta i avsnitt 5.2. När det gäller inskottet sköts detta hos Lindberg genom att det i de reguljära uttrycken även lämnas plats för inskott. Om jag har förstått rätt använder han samma begränsningar av inskottet för alla typer av lexfraser. Vi godkänner i stort sätt samma inskott men jag förhindrar en hel del feltolkningar genom att för vissa partikelverb förbjuda ett eller flera inskott, detta görs i lexikonet. Våra lösningar liknar varandra i det att vi båda valt att lista partikelverben i lexikon och där även ange valens- och kontextinformation. Jag har dock använt listor av kontexter i stället för reguljära uttryck, detta gäller även hanteringen av inskottsmaterialet. På det stora hela har jag varit mer specifik i mina uppgifter och detta är naturligt då hans arbete omfattar ett mycket större och månsidigare material. 19

4 Metod I de tidigare avsnitten har en definition av begreppet partikelverb presenterats och mitt och Lindbergs lösningsförslag har beskrivits. Fokus skiftar nu från de grundläggande bakgrundsstudierna i undersökningen till det faktiska arbetet. Nedan följer en redovisning av det material som används vid sökning efter partikelverb, vilka kriterier sökningen grundar sig på och vilket tillvägagångssätt som använts. 4.1 Material Det textmaterial som använts i undersökningen är Stockholm Umeå Corpus (SUC), utvecklad av institutionen för lingvistik på Stockholms universitet och motsvarande i Umeå. Den version som används här är SUC 2.0. Korpusen innehåller drygt en miljon ord och den är taggad med avseende på ordklass, lemma och böjningsmorfologi. Taggningen är till största delen gjord med manuella metoder och tagguppsättningen finns beskriven i Ejerhed et al (1992). SUC består av 500 texter om 2000 ord vardera. Dessa är hämtade från vitt skilda ämnesområden för att täcka så många olika språkstilar som möjligt. De flesta texterna är tryckta under åren 1990-1993 och någon enstaka 1994. Meningen är att korpusen ska spegla den nutida svenskan i största möjligaste mån. 4.2 Kriterier De partikelverb som skulle studeras valdes ut från SUC enligt vissa kriterier. Dels var det önskvärt att studera de mest frekventa partikelverben. Att enbart kunna hantera dessa skulle i sig vara ett stort lyft för talsyntesen. Det var också önskvärt att titta på de produktivaste verben och partiklarna, d.v.s. de verb som kan kombineras med flest partiklar och vice versa. Jag hoppades på detta sätt underlätta sökningen efter samband och mönster som kan leda till någon form av gruppering av partikelverben. Med andra ord var målet att hitta de vanligaste partikelverben med de produktivaste beståndsdelarna. Med Lindbergs arbete i bakhuvudet anpassades även metoden för att kunna studera partikelverbens eventuella inskottsmaterial och deras högerkontexter. 4.3 Arbetets olika faser Arbetet med att undersöka hur olika partikelverb uppför sig syntaktiskt och vilka ambiguiteter de ger upphov till kan delas upp i ett antal olika delmoment vilka redovisas nedan. Sökning, sortering och sållning Det första steget var att ta fram alla enskilda partikelverb i SUC, d.v.s. konstruktioner där ett verb följs av ett optionellt inskott följt av en preposition eller ett adverb som blivit taggade som PL. Det blev ca 1600 st. Utifrån frekvenslistor sorterade jag ut dem som förekom 10 eller fler gånger i SUC, varefter återstod ca 260 st. Från dessa 260 valdes de partikelverb ut vars verb 20

och partikel i sig själva var produktiva, d.v.s. de kunde kombineras med många partiklar respektive verb. Notera att en del väldigt vanliga partikelverb föll bort i detta moment beroende på improduktiva komponenter. I slutändan hade 173 st. frekventa partikelverb valts ut. Dessa utgör kombinationer av 85 verb och 12 partiklar: betala gå måla stänga bjuda göra nå stöta bli ha passa sudda breda hinna plocka säga bry hjälpa ringa sända bryta hoppa råka sätta bygga hyra räcka ta byta hålla räkna tala bära hälsa rätta titta dela hänga samla träda dra höra se tränga dyka klara skicka tycka falla kliva skjuta vara finnas komma skriva veta flytta känna slå visa fylla köpa släppa välja få köra stanna vända fånga lyfta sticka växa följa låsa stiga äta föra lägga sträcka ge lämna stå glömma lösa ställa Tabell 1: Verb (85 st.) av i med till bort ihop om upp fram in på ut Tabell 2: Partiklar (12 st.) Kontextextraktion Nästa moment bestod i att extrahera alla de utvalda partikelverben i sin kontext ur SUC. För varje partikelverb togs alla meningar fram som innehöll verbet och partikeln i rätt följd med eventuellt inskottsmaterial emellan. För att kunna undersöka vilka inskottsmaterial och högerkontexter partikelverben kunde förekomma tillsammans med sparades resultatfilerna i olika varianter. (a) visar hur en mening i SUC ser ut. (b) visar samma mening men här med fokus på taggarna, bara verbet och partikelns ortografiska (grund)form finns kvar. Stjärnorna är till för att det ska vara lättare att hitta verbet och partikeln vid manuell läsning om det förekommer långt inskottsmaterial. I (c) finns bara verbet och partikeln samt deras eventuella inskott med. För att underlätta vanlig läsning av meningarna skapades även en filvariant där enbart texten syns med partikeln och verbet markerade (d). a) <s id=kk68-144> <w n=1566>fattaru<ana><ps>in<b>fattaru</w> 21

<d n=1567>,<ana><ps>mid<b>,</d> <w n=1568>alla<ana><ps>pn<m>utr/neu PLU IND SUb/ObJ<b>alla</w> <w n=1569>visste<ana><ps>vb<m>prt AKT<b>veta</w> <w n=1570>om<ana><ps>pl<b>om</w> <w n=1571>det<ana><ps>pn<m>neu SIN DEF SUb/ObJ<b>det</w> <w n=1572>utom<ana><ps>kn<b>utom</w> <w n=1573>jag<ana><ps>pn<m>utr SIN DEF SUb<b>jag</w> <d n=1574>...<ana><ps>mad<b>...</d> </s> b) <s id=kk68-144> IN MID PN ***veta Vb PL om*** PN KN PN MAD </S> c) veta Vb PL om veta Vb Ab Ab PL om d) <s id=kk68-144> Fattaru, alla ***visste om*** det utom jag För att kunna identifiera och studera ambiguitetsproblem extraherades även de meningar innehållande snarlika konstruktioner som inte blivit taggade som partikelverb, d.v.s. meningar innehållande ett verb, ett eventuellt inskott och en preposition eller ett adverb. (e) är ett exempel på en sådan konstruktion. e) <s id=ac01b-034> I dag ***vet ingen om*** Volvo lyckas i Uddevalla. </S> Samma sorts resultatfiler som för partikelverben producerades och studerades. I detta moment upptäcktes mängder av feltaggningar i SUC. I de allra flesta fall visade det sig att det var ett riktigt partikelverb vi hade att göra med. Resterande undersökningar omfattar även det feltaggade materialet. Det är jag själv som avgjort vad som är partikelverb eller ej i dessa fall. En del felbedömningar har med all sannolikhet släppts igenom men jag hoppas att detta inte har påverkat det övergripande resultatet. Kontextstudier De taggade resultatfilerna användes för att studera inskottsmaterial på ordklassnivå. För varje partikelverb noterades vilka inskott som kunde förekomma och vilka som var vanligast. Lindberg hade helt rätt i att de vanligaste inskotten var subjekt och adverbial och ofta korta sådana. Inskottsmaterialet i partikelverben jämfördes med motsvarande hos liknande konstruktioner med annat betoningsmönster. För att ta reda på vilka högerkontexter som får och inte får förknippas med varje partikelverb undersöktes de ortografiska filerna för både partikelverb och liknande obetonade konstruktioner. Ambiguiteter noterades på både ord-, ordklass- och frasnivå. För varje enskilt partikelverb funderade jag dessutom länge och väl vilka övriga kontexter som var tillåtna respektive otillåtna, detta var tvunget då SUC inte är så stort. 22

Ett antal uppgifter noterades för varje partikelverb: totala antalet förekomster, antalet förekomster av varje typ av inskottsmaterial och antalet förekomster av varje typ av högerkontext. Genom att jämföra med liknande information om falska konstruktioner gick det att identifiera ambiguitetsproblem, utröna vad som är särskiljande mellan partikelverb och deras falska motsvarigheter och utifrån detta formulera disambigueringsregler. 23

5 Resultat Kontextstudierna resulterade i två lexikon och ett antal generella regler som i samverkan beskriver det syntaktiska uppträdandet hos 173 partikelverb. Partikelverbslexikonet innehåller information om vilka kontexter partikelverben får och inte får uppträda i och verb lexikonet anger för varje verb vilka partiklar som är tillåtna. Det sistnämnda verblexikonet har ingångar av typen: betala:particles:in,ut Verblexikonet skulle eventuellt kunna vara en del av ett större ordklasstaggat lexikon och kommer inte att presenteras närmare här. För närvarande är båda lexikonen fullformslexikon, d.v.s. det finns en ingång för varje verbform. Medan informationen i lexikonen beskriver uppträdandet hos de enskilda verben och partikelverben arbetar reglerna på en mer övergripande nivå. Reglerna förbjuder eller släpper igenom vissa inskott och högerkontexter och det är meningen att de även ska hantera ordföljdsförändringar. 5.1 Partikelverbslexikon I detta avsnitt beskrivs vilka beteckningar som använts i partikelverbslexikonet, lexikonets struktur och vilken information det innehåller. Därefter presenteras själva lexikoningångarna. Vi börjar med ingångarna för partikelverb som tar prepositionsliknande partiklar följt av dem som tar adverbliknande partiklar. Vilka ambiguitetsproblem som är förknippade med varje partikel presenteras kortfattat. I vissa fall diskuteras även enskilda partikelverb, speciellt om deras uppförande begränsas av någon restriktion utöver de vanliga. Den diskussionen sker i så fall i Appendix. Terminologi Följande förkortningar och termer har använts i lexikoningångarna: HK INS PL NP VP Sats intrans trans sig1 sig2 nn pn pm vb pp ab ok partikelverb högerkontext inskottsmaterial partikel nominalfras verbfras här: nominalfras följt av en verbfras intransitiv transitiv vb sig PL (t.ex. ta sig till) vb PL sig (t.ex. ta till sig) nomen pronomen proprium verb preposition adverb inga restriktioner förekommer (generella regler gäller dock). 24

Om ett partikelverb har blivit definierat som både intrans och trans kan detta betyda två saker. Dels kan det vara så att partikelverbet uppträder i båda formerna, dra fram är ett exempel på ett detta: man kan dra fram över prärien och man kan dra fram en pistol. Dels kan det betyda att det är vanligt att man utelämnar objektet. Exempel: Han lade på (luren) och gick ut i köket. Trans i sig betyder att partikelverbet kan passiveras och att den tar något av de tillåtna objekten. Intrans betyder att partikelverbet ej kan passiveras men att det eventuellt kan ta objekt (i så fall är detta angivet). Efter intransitiva partikelverb ska dessutom en rad adverbial tillåtna. Om det bara står sig1 eller sig2 i HK-fältet betyder detta att partikelverbet endast kan förekomma i reflexiv form. ej framför en ordklass eller en konstituent anger förbud. Detta förekommer bara i två fall: ej s som anger att partikelverbet inte kan förekomma i s-form, och ej sats som anger att högerkontexten inte få innehålla en sats. En sats är tillsvidare definierad som en kort NP (ett eller två ord lång) följt av VP. Struktur och information En lexikoningång kan sägas vara indelad i tre fält: anger vilket partikelverb det är fråga om och INS-restr anger vilka restriktioner som gäller för inskottsmaterialet mellan verbet och partikeln. HK specificerar en mängd egenskaper: partikelverbets valens, vilka högerkontexter som är tillåtna, om partikelverbet förekommer i s-form eller ej samt huruvida det kan ingå i reflexiva konstruktioner. INS-restr. HK lägga av ej NP att Sats, NP, med NP,sig2, intrans, trans, s Figur 1: Exempel på en lexikoningång Informationen i lexikoningången för partikelverbet lägga av ovan ska därmed tolkas på följande sätt:! det får inte ta någon nominalfras som inskottsmaterial! det kan ta högerkontexterna att Sats, NP och med NP! det kan ingå i reflexiv konstruktion av typen VB PL sig (lägga av sig),! det kan konstrueras både intransitivt och transitivt! det kan förekomma i s-form Vidare gäller följande: lägga av får inte förekomma med några andra högerkontexter än de som anges i HK-fältet förutom dem som anges av de generella reglerna. Vad gäller inskottet får det inte innehålla en NP. Om reglerna och informationen i lexikonet emotsäger varandra gäller det som står i lexikonet. Reglerna presenteras i avsnitt 5.2 efter lexikoningångarna. 25

Lexikoningångar Nedan redovisas alla lexikoningångar. För varje partikel diskuteras allmänt vilka problem den är förknippad med. Själva ingångarna redovisas i listform. Kommentarer till listorna finns i Appendix. Av Orsaksadverbial av typen av hjärtans lust, av flera skäl etc. kan ställa till det i och med att så gott som alla partikelverb i denna grupp har NP som sin mest frekventa högerkontext. Jämför t.ex. Jag drog av flera skäl (in till stan). Jag drog av flera lager (från barken). Jag har dock inte hittat en enda förekomst av den här typen av adverbial tillsammans med verben nedan. Detta tillsammans med att NP är bland de vanligaste högerkontexterna gör att jag väljer att tillåta den utom i några enstaka fall där jag bedömer att det är stor risk för ambiguiteter. INS-restr. HK känna av ok trans, att Sats, NP, ej s bli av ok intrans, att Sats, NP, med NP, ej s lägga av ej NP intrans, trans, att Sats, NP, med NP, s, sig2 gå av ok intrans, trans, NP, ej s hoppa av ok intrans, trans, NP, från NP, ej s göra av ok intrans, trans, NP, med NP, s, sig1 höra av ok trans, NP, s,sig2 klara av ej NP trans, att Sats, att VP, NP, s, sig2 stänga av ok intrans, trans, NP, s, sig2 dra av ok trans, NP, s ta av ok trans, NP, s, sig2 Tabell 3: Verb + av I Tyvärr så är partikeln i väldigt sparsamt representerad i min undersökning och det är svårt att avgöra hur pass allvarliga ambiguiteter den kan ge upphov till. I och med att många adverbial börjar med i (t.ex. i morse, i skålen, i alla fall ) så är det främst de partikelverb som tar NP och som kan ta sådana adverbial som borde vara problematiska. Det enda som går att göra är att förbjuda NP som högerkontext. Se kommentaren till lägga i i Appendix. INS-restr. HK fylla i ok trans, att Sats, att VP, NP, Sats, s lägga i ej NP trans, NP, s, sig1 ta i ej NP intrans, med NP, s Tabell 4 : Verb + i 26

Med Här nedan kommer vi snudda vid ett vanligt och problematiskt fenomen som vi kommer att se mer av när de adverbliknande partiklarna diskuteras. Problemet är att rörelseverb kan ta emfas. Meningen Han gick med Kalle till dagis kan läsas på två sätt; om vi har partikelverb betyder det följde med annars betyder det att man gick snarare än ta sig dit med t.ex. bil eller cykel. Huruvida NP ska uteslutas som högerkontext måste man avgöra från fall till fall. Min princip har varit följande: om det är så att exemplen utan konnektiv betoning är få eller obefintliga och betydelseskillnaden mycket liten har jag undvikit att utesluta NP främst p.g.a. att så många partikelverb skulle underkännas. Några andra bekymmer är t.ex. att adverbial som börjar med med, t.ex. med stor sannolikhet krånglar till det liksom bestämningar av typen med den röda tröjan. INS-restr. HK få med ok intrans, trans, att Sats, NP, ej s, sig2 vara med ok intrans, att VP, NP, om, på att Sats, på NP, när Sats, som NP, i NP, ej s hinna med ok intrans, trans, att VP, NP, s ha med ok trans, NP, ej s, sig2 hänga med ok intrans, trans, på NP, när Sats, i NP, till NP, ej s gå med ok intrans, trans, NP, på NP, som NP, i NP, till NP, ej s följa med ej NP intrans, trans, NP, på NP, som NP, i NP, till NP, ej s komma med ok intrans, trans, NP, på NP, som NP, i NP, till NP, ej s finnas med ok intrans, på NP, som NP, i NP, vid NP, s hålla med ok intrans, trans, NP, om, s föra med ok trans, NP, s, sig2 ta med ej NP trans, NP, s, sig2 Tabell 5: Verb + med 27

Om Om förekommer ytterst sällan som preposition med verben jag tittat på. Om som subjunktion är dock vanligt förekommande och tar alltid en sats som högerkontext detta gör inte partikelverb. För att känna igen en sats måste reglerna klara av att först identifiera en nominalfras och sedan en verbfras efter denna. Någon form av begränsning är oundviklig och jag har funnit att det är i ytterst få fall som verbfrasen börjar fler än 2-3 ord efter partikeln. Vanligast är alltså nominalfraser bestående av endast ett ord. Den slutliga lösningen blir att om vi inte hittat en nominalfras och ett verb (i den ordningen) bland de närmast följande orden efter partikeln är det inte en sats efteråt och vi kan gå vidare och titta på restriktionerna för inskott och de tillåtna högerkontexterna. INS-restr. HK tycka om ok trans, att Sats, att VP, NP, när Sats, ej s veta om ok trans, att Sats, NP, ej s, ej Sats vända om ok intrans, ej s, ej Sats bygga om ok intrans, trans, så att Sats, NP, till NP, s, ej Sats göra om ej NP, tvärt, helt intrans, trans, så att Sats, NP, till NP, s, sig2, ej Sats bry om - - tala om ej NP trans, att Sats, att VP, NP, för NP, hur Sats, när Sats, s se om ok trans, NP, s, sig2, ej Sats Tabell 6: Verb + om På Problemet med partikelverb som tar på som partikel är att på följt av NP är en mycket vanlig konstruktion i rumsadverbial/tidsadverbial samtidigt som flera av partikelverben har NP som sin vanligaste högerkontext. INS-restr. HK komma på ej NP intrans, att Sats, s, sig2 passa på ok intrans, att VP, ej s hålla på ok intrans, att VP, med att, med NP, s se på ok intrans, hur Sats, när Sats, s stöta på ok trans, NP, ej s lägga på ej NP intrans, trans, NP, s, sig2 ta på ok sig2 dra på ok trans, s, sig2 hälsa på ok trans, trans, NP, hos NP, s sätta på ej NP trans, NP, s, sig2 Tabell 7: Verb + på 28

Bort Inget av partikelverben som innehåller bort har blivit försedda med några restriktioner. Så länge någon av de angivna högerkontexterna förekommer efter verbet (eller någon av de som är godkända för alla partikelverb) så går det bra. Den enda som skulle kunna vara lite problematisk är gå bort (p.g.a. att det är ett rörelseverb). T.ex. meningen han reste sig och gick (barfota/långsamt) bort mot strandkanten kan man diskutera hur den ska uttalas. Det blir dock aldrig riktigt fel att ha konnektiv betoning på gå bort och därför har jag valt att inte sätta upp några restriktioner. Detta synsätt kommer att återspeglas i hanteringen av flera liknande partikelverb. INS-restr. HK gå bort ok intrans, med NP, mot NP, på NP, till NP, från NP, ej s, sig2 glömma bort ok intrans, trans, att Sats, att VP, NP, när Sats, hur Sats, s, sig2 få bort ok trans, NP, s ta bort ok trans, NP, s, sig1 Tabell 8: Verb + bort Fram Endast vid några enstaka verb behövs restriktioner, se tabellen nedan och kommentarer i Appendix. INS-restr. HK komma fram ok intrans, att Sats, med NP, mot NP, hur Sats, som NP, i NP, vid NP, till NP, från NP, ur NP, ej s gå fram ej NP intrans, mot NP, i NP, till NP, ej s nå fram ok intrans, i NP, till NP, ej s växa fram ok intrans, NP, på NP, som NP, i NP, ur NP, ej s få fram ok trans, NP, s träda fram ok intrans, på NP, som NP, i NP, till NP, ej s dra fram ok intrans, trans, NP, mot NP, på NP,som NP, över NP, s föra fram ok trans, att Sats, NP, s lyfta fram ok trans, NP, s lägga fram ok trans, NP, s plocka fram ok trans, NP, s sträcka fram ok trans, NP, s ta fram ej NP trans, NP, s, sig1 Tabell 9: Verb + fram 29