Automatisk detektering av partikelverb

Storlek: px
Starta visningen från sidan:

Download "Automatisk detektering av partikelverb"

Transkript

1 Uppsala universitet Institutionen för lingvistik Oktober 2000 Examensarbete på språkteknologiprogrammet Automatisk detektering av partikelverb Bodil Mattisson Handledare: Åbylundsvägen 75 Lars Borin, inst. för lingvistik, Uppsala universitet Västerhaninge Charlotta Berglund, Telia Promotor AB Hem Harald Berthelsen, Telia Promotor AB Arb

2 2

3 Innehåll 1 INLEDNING INLEDNING SYFTE BAKGRUND: TALSYNTES OCH PROSODI... 8 TILLÄMPNINGAR... 8 PRODUKTION AV SYNTETISKT TAL... 9 MOTIVERING AV UPPGIFTEN DEFINITION AV PARTIKELVERB UPPBYGGNAD OCH BETONING PARTIKELNS ORDKLASSTILLHÖRIGHET PARTIKELNS SATSDELSTILLHÖRIGHET FUNKTION FORM BETYDELSE PARTIKELVERBENS SYNTAX ORDFÖLJD INSKOTTSMATERIAL PARTIKEL ELLER PREPOSITION? PARTIKEL ELLER ADVERB? VALENS AUTOMATISK DETEKTERING AV PARTIKELVERB LINDBERGS ARBETE MITT EGET ARBETE I KORTHET METOD MATERIAL KRITERIER ARBETETS OLIKA FASER SÖKNING, SORTERING OCH SÅLLNING KONTEXTEXTRAKTION KONTEXTSTUDIER RESULTAT PARTIKELVERBSLEXIKON TERMINOLOGI STRUKTUR OCH INFORMATION LEXIKONINGÅNGAR AV I MED OM

4 PÅ BORT FRAM IHOP IN TILL UPP UT GENERELLA REGLER HÖGERKONTEXT GRUPPERING...37 SPECIALFALL ADVERBIAL SYNTAKTISKA REGLER IMPLEMENTERING AV LEXIKON OCH REGLER BESKRIVNING AV PROGRAMMET VAD KLARAR PROGRAMMET AV? TESTNING AV PROGRAMMET TESTRESULTAT TYPER AV FEL OCH FÖRSLAG TILL ÄNDRINGAR UTVÄRDERING AV RESULTATET ALLMÄNNA FÖRBÄTTRINGAR AV PROGRAMMET SAMMANFATTNING LITTERATUR INNEHÅLL PARTIKELVERB SOM OMFATTAS AV UNDERSÖKNINGEN: HÖGERKONTEXTER PARTIKELVERBSINGÅNGAR AV

5 I MED OM PÅ BORT FRAM IHOP IN TILL UPP UT

6 Sammandrag Automatisk detektering av partikelverb Syftet med mitt examensarbete är att genom att skriva ett program som kan detektera partikelverb förbättra kvalitén på talsyntesen i Telia Promotors text-till-talomvandlare, Infovox. Partikelverben skiljer sig enbart genom sitt uttal från vissa andra konstruktioner, t.ex. verb följt av prepositionsfras. Ambiguiteter mellan partiklar och prepositioner eller adverb är således ett problem som gör detekteringen komplicerad. Ett annat bekymmer är att det mellan verbet och partikeln kan förekomma inskottsmaterial i form av subjekt eller adverbial. Jag har försökt att lösa problemen genom att utifrån en korpus ta fram information om i vilka kontexter partikelverb får och inte får förekomma. Informationen har jag samlat i ett partikelverbslexikon vilket utgör underlag för själva detekteringsprogrammet. Programmet opererar på ordklasstaggad text och det är meningen att det ska ingå som en del i preprocessningen i Infovox. 6

7 7

8 1 Inledning Denna rapport är en redogörelse för ett examensarbete utfört på Telia Promotor AB i Solna inom ramen för språkteknologiprogrammet vid Uppsala universitet. Arbetet ingår i en magisterexamen i datorlingvistik med inriktning mot talteknologi och omfattar 20 poäng. 1.1 Syfte Det övergripande ändamålet med examensarbetet är att förbättra prosodin i Telia Promotors text-till-talomvandlare, Infovox. Arbetet innefattar att undersöka i vilka kontexter partikelverb förekommer och utifrån detta skapa regler för disambiguering av partikelverb och konstruktioner som liknar partikelverben ortografiskt men har annorlunda prosodi. Vidare ingår det i uppgiften att avgöra vilka av dessa regler som är tillräckligt pålitliga för att användas i Infovox. 1.2 Bakgrund: talsyntes och prosodi Talsyntes innebär i korthet att en dator får en ortografiskt skriven text som sedan läses upp med syntetiskt, d.v.s. konstgjort, tal. Målet är oftast att syntesen ska efterlikna mänskligt tal så mycket som möjligt. Nyckeln till naturlighet i detta fall är bra prosodi, d.v.s. att kunna efterlikna det mänskliga talets melodi. Tillämpningar Det är många människor, framför allt talskadade och synskadade som har nytta av talsyntes. För talskadade finns det program som fungerar som talproteser. Synskadade kan få annars svårtillgängligt skrivet material, såsom tidningsartiklar och brev, uppläst förutsatt att materialet finns i elektronisk form. Både synskadade och dyslektiker kan dra nytta av talsyntes genom att få egenhändigt skriven text uppläst och på så sätt upptäcka eventuella fel. Människor med talsvårigheter har även nytta av texttelefoni; de skriver vad de vill säga och låter syntesen läsa upp meddelandet. Om texttelefonen klarar av taligenkänning, d.v.s. att konverteraa talat språk till skrivet språk, kan även hörselskadade ha glädje av den då de kan få samtalspartnerns yttranden i skriven text. I och med att talsyntesens kvalité ökar blir det allt vanligare att talsyntes används för att producera yttranden i dialogsystem och informationsförmedlingsystem. Förr användes ofta färdiginspelade meningar från en människa i den här sortens applikationer. Det blir dock ohållbart att vara beroende av en person (vars röst dessutom varierar med bl.a. hälsa och ålder) om systemet måste uppdateras ofta. Detta gör att det är särskilt lämpligt att använda talsyntes när variabel information ska vidarebefordras via telefon, t.ex. väderprognoser, nyheter, och e-post. Ytterligare tillämpningar är dataspel och interaktiva läromedel. 8

9 Produktion av syntetiskt tal För att en dator ska klara av att läsa upp en skriven text med någorlunda naturligt uttal måste texten först konverteras till en underliggande fonetisk beskrivning. Ett grundläggande steg i denna process är att den fonetiska transkription för alla orden i texten slås upp i lexikon. Ett alternativ till detta är att använda grafem-till-fonemregler i kombination med ett undantagslexikon. Ett annat viktigt steg är den lingvistiska analysen. Omfattningen av analysen varierar mycket mellan olika system men den är nödvändig för att åstadkomma en hyfsad prosodi då lingvistisk analys gör det möjligt att sätta ut prosodiska markörer. Syntaktisk, morfologisk och ibland även semantisk analys gör att vi kan sätta markörer för t.ex. stavelsestruktur och frasgränser. Dessa markörer styr sedan talljudens längd, grundtonskurvans mönster och intensiteten och de är avgörande för prosodins kvalitet. Även mänskliga faktorer såsom ålder, kön, ansatsrörets längd, hälsa och sinnesstämning påverkar indirekt prosodin men dessa parametrar går sällan att få fram utifrån den skrivna texten. Den färdiga fonetiska representationen konverteras sedan till tal. Det finns olika tekniker för detta; formantsyntes är parameterstyrd och helt datorgenererad, konkateneringssyntes innebär att förinspelade ljudsegment från en människa, t.ex. difoner, klistras ihop. En difon består av övergången mellan två ljud, t.ex. andra halvan av ett b följt av första halvan av ett a. Vitsen med difoner är att man fångar övergångarna mellan olika fonem (t.ex.. låter b framför ett a lite annorlunda än framför ett i ). För att syntestisera ordet bad hämtas följande difoner från en difondatabas: tystnad+b, b+a, a+d och d+tystnad. Motivering av uppgiften Varför är det då viktigt att kunna detektera partikelverb vid text-tilltalomvandling? För det första skiljer sig partikelverbens betoningsmönster från andra verbfrasers och detta påverkar prosodin. Detta gör att om man inte kan hitta partikelverben kommer dessa alltid att betonas fel vilket leder till att det kan vara svårt att förstå vad som menas och helhetsintrycket av syntesen blir sämre. För att göra syntesen så lättförståelig som möjligt är det därför viktigt att hitta partikelverben men att samtidigt se till att andra, liknande konstruktioner inte får partikelverbsbetoning om de inte ska ha det. För det andra är det behändigt att kunna behandla partikelverben som hela enheter i stället för två ord (verb och partikel) under förarbetet av texten inför syntesen. Detta gäller framför allt när verbet och partikeln står efter varandra. I dessa fall blir materialet enklare att parsa, d.v.s. analysera syntaktiskt, och vi får en bättre grammatisk beskrivning. Detta i sin tur leder till att det är lättare att sätta ut prosodiska markörer. Summan av det hela är att vi får ett naturligare uttal på både fras- och meningsnivå. 2 Definition av partikelverb Att hitta en definition av ordet partikelverb i svenska grammatikböcker är inte lätt då det oftast inte finns med. Dock verkar grammatikboksförfattarna vara ense om att det finns konstruktioner i svenskan som består av ett obetonat verb följt av en betonad partikel eller ett verb med en betonad 9

10 partikel som förled. Hur sådana konstruktioner ska benämnas, vad partikeln har för ordklasstillhörighet och vilken satsdel den tillhör finns det varierande åsikter om i litteraturen. Den vanligaste beskrivningen av ett partikelverb är dock något i stil med det som följer. De flesta exemplen nedan är tagna från Thorell(1981). 2.1 Uppbyggnad och betoning Ett partikelverb utgörs av ett obetonat verb och en betonad partikel, tillsammans har de sammanfattningsaccent (även kallad idiomatiseringsaccent, gruppordsaccent och konnektiv prosodi), d.v.s. tryckaccent på sista ledet i ordgruppen. Jämför exempelmeningarna nedan. I det första exemplet nedan är på obetonat, i det andra betonat. Han hälsade på henne / d.v.s. sade hej Han hälsade på henne / d.v.s. besökte (verb + prepositionsfras) (partikelverb) Partikelns ordklasstillhörighet Enligt t.ex. Thorell (1973) kan partikeln antingen bestå av ett adverb (t.ex. ut, fram, ihop) eller en preposition (t.ex. på, av, om). Partikelverb kan även konstrueras med en preposition följd eller föregången av ett reflexivt pronomen (t.ex. (sätta)på sig/(ta) sig in). En del räknar också en del (mer idiomatiska) konstruktioner med adjektiv och substantiv som partikelverb, t.ex. göra färdigt och slå dank. I det sista exemplet är det svårt att utröna partikelverbets betydelse utifrån de ingående delarnas betydelse och sådana konstruktioner kallas ofta lexikaliserade partikelverb. Senare grammatikboksförfattare, t.ex. Järner (1993) och Stroh-Wollin (1998), uttrycker sig mycket försiktigare om partklarnas ordklasstillhörighet genom att säga att verbpartiklarna liknar/ser ut som adverb och prepositioner och att de självständigt kan fungera som sådana. Båda nämnda författare anser dock att verbpartiklar och prepositioner skiljer sig åt i en rad avseenden: - Prepositioner är obetonade i kontexten ifråga, verbpartiklar betonande. - Verbpartiklarna är starkare bundna till verben de är knutna till än vad prepositionerna är. - Prepositionerna måste förekomma tillsammans med substantiv, detta gäller ej verbpartiklar. Med detta i åtanke tar det emot att klassificera verbpartiklar som prepositioner. Stroh-Wollin påpekar att verbpartiklarna traditionellt har räknats till adverben. Detta är i linje med den information man finner om man konsulterar en någorlunda utförlig ordbok. I, av, med och på räknas alla till ordklassen adverb i de fall de uppträder som verbpartiklar. 10

11 Senare kommer vi se att partikelverben uppför sig lite olika beroende på typ av partikel, det är därför praktiskt att tala om prepositionsliknande och adverbliknande partiklar. Partikelns satsdelstillhörighet Verbpartikeln kan räknas som utgörande en del av predikatet eller som ett adverbial. Partikeln bildar en syntaktisk, semantisk och uttalsmässig enhet med verbet och därför är det inte svårt att se den som en del av predikatet. Det är heller inte ologiskt att räkna verbpartikeln som ett adverbial då den liksom ett adverbial modifierar verbet. En som följt denna linje är Erik Andersson (1993). Han kallar verbpartiklar för partikeladverbial. Detta synsätt återfinns också i den nyutkomna Svenska akademiens grammatik (1999) där han är en av medförfattarna. 2.2 Funktion Partikeln har tre funktioner: transitivering, objektsväxling samt förändring av verbets aktionssätt. Transitivering innebär att intransitiva verb görs transitiva. Ett exempel på detta är verbet tänka, som är intransitivt och tar en prepositionsfras, och partikelverbet tänka ut som är transitivt, d.v.s. det konstrueras med objekt. Ett exempel på objektsväxling är konstruktionerna: skriva [sitt namn]obj. [på ett kontrakt]pp. skriva på [ett kontrakt]obj. [med sitt namn]pp. Det enkla verbets objekt (sitt namn) motsvaras av en prepositionsfras (med sitt namn) vid partikelverb. Prepositionsfrasen vid enkelt verb (på ett kontrakt) motsvaras av ett objekt (ett kontrakt) i konstruktionen med partikelverb. I svenskan skiljer vi på t.ex. terminativt och durativt aktionssätt. Ett verb som är terminativt är begränsat i tiden, t.ex. bestiga, och ett durativt verb är obegränsat i relation till tiden, t.ex. klättra. En partikel kan ändra ett verbs aktionssätt, t.ex. från durativt till terminativt. Exempel på detta är blomma blomma upp. 2.3 Form Partikeln kan vara efterställd och lösgjord från verbet, då talar man om lös förbindelse/sammansättning. Ett exempel på detta är ställa in. Partikeln kan även stå som förled till verbet, så är fallet i t.ex. inställa. Här är det istället en fast förbindelse/sammansättning vi har att göra med. Man måste skilja på partikelsammansatta verb, t.ex. inställa, och prefixavledda verb, t.ex. beställa. Partikeln (i detta fall in) består alltid av ett fritt morfem med motsvarigheter i ett självständigt ord medan prefixet utgörs av ett bundet morfem (i detta fall be-). Partiklarna till skillnad mot prefixen kan oftast skiljas från sitt verb men det finns undantag, se nedan. Partiklar och prefix har mycket gemensamt då de båda modifierar verbets betydelse och förmåga att ingå i 11

12 olika syntaktiska konstruktioner. Märk dock att i inställa är det partikeln som har huvudtrycket och i beställa är det verbet. Vissa partikelverb förekommer enbart som fasta förbindelser, t.ex. tillåta och urarta. Andra finns bara i lös förbindelse, däribland tycka om och rycka till. En tredje grupp bildar de partikelverb som kan förekomma i båda formerna, t.ex. inställa - ställa in. I den sistnämnda gruppen finner vi en stilistisk skillnad mellan de olika formerna; den fasta konstruktionen är mer formell och typisk för skriftspråk, medan den lösa varianten är vanlig i talspråk och informella sammanhang. Vid participbildning är det emellertid alltid fast förbindelse som gäller, t.ex. utvecklande. Många partikelverb finns i reflexiva varianter. En del, som t.ex. ta med och ta med sig är semantiskt knutna till varandra och har liknande syntaktiska egenskaper. Andra par har väldigt lite gemensamt förutom formen. Detta gäller t.ex. ta till (hammaren), ta till sig (ngt) och (vad ska man) ta sig till. 2.4 Betydelse Det är inte alltid det går att förutsäga ett partikelverbs betydelse utifrån de ingående delarna. Det enkla verbets betydelse förändras ofta då det kombineras med en partikel. Detta kan exemplifieras av verbet duka och partikelverbet duka under som inte alls betyder samma sak. Vidare finns det homografer hos partikelverben som kan ha helt olika betydelser. T.ex. gå på har minst tre olika betydelser: gå in i (t.ex. en buss), bli lurad, och forsätta med det man håller på med. Många partikelverb uppvisar både semantisk och en stilistisk skillnad beroende på förbindelseformen. Jämför t.ex. framställa - ställa fram, avbryta - bryta av. De fasta förbindelserna är abstrakta med bildlig betydelse medan deras lösa motsvarigheter är mer konkreta i sin betydelse. I flera fall är det svårt att överhuvudtaget se något semantiskt samband mellan de två formerna. Detta gäller t.ex. avgöra (besluta) - göra av (med pengar). 2.5 Partikelverbens syntax Partikelverben utgör en undergrupp till lexikaliserade fraser som i sin tur utgör en undergrupp till kollokationer, d.v.s. ord som ofta förekommer tillsammans. Några exempel på lexikaliserade fraser är t.ex. fina fisken, Dagens Nyheter, kniv och gaffel, full i sjutton och hålla klaffen. Enligt Anward & Linell (1976) kännetecknas lexikaliserade fraser bl.a. av att de utgör en syntaktisk enhet, t.ex. en konstituent, och att de (ofta) har konnektiv prosodi. Vi har sett ovan att detta även gäller partikelverben. Liksom enkla verb kan man dela in partikelverb i transitiva och intransitiva. Partikelverb kan förekomma i meningar med omvänd ordföljd och vissa partikelverb kan även förekomma i passiverade och topikaliserade meningar. Till skillnad från enkla verb är de löst sammansatta partikelverben tvådelade och inskottsmaterial i form av ett eller flera ord kan förekomma mellan verbet och partikeln. I och med att partikeln till formen kan vara identisk med adverb eller prepositioner uppstår även ambiguiteter. 12

13 Nedan följer en redogörelse för hur partikelverben uppträder i olika sammanhang, vad inskottsmaterialet kan bestå av och vilka ambiguiteter som är förknippade med partikelverb. Ordföljd I detta avsnitt presenteras olika typer av förändringar av ordföljden, de processer som ligger bakom och vilka mönster de ger upphov till i de fall partikelverb är närvarande. I fasta förbindelser står partikeln alltid före och tillsammans med verbet oavsett typ av sats. Han inställde mötet. Vad gäller lösa förbindelser i huvudsatser med rak ordföljd står partikeln frånskiljt från, men direkt efter, verbet. Förekommer satsadverb placeras detta mellan verbet och partikeln (i påståendesatser och uppmaningar). Exempel: Oskar skrev på kontraktet igår. Oskar skrev inte på kontraktet igår. Skriv inte på kontraktet! Om ett annat satsled än subjektet står först i en huvudsats (d.v.s. i fundamentet) får vi omvänd ordföljd. Detta gäller också vissa typer av frågesatser. Den omvända ordföljden gör att subjektet hamnar mellan verbet och partikeln. Igår skrev Oskar på kontraktet. Om jag inte minns fel, skrev Oskar på kontraktet igår. Skrev Oskar på kontraktet igår? (omvänd) (omvänd) (omvänd) I bisatser är partikeln alltid placerad direkt efter verbet oavsett om satsadverb förekommer eller ej. Han sade att han (inte) ställde in mötet igår. I exemplen ovan påverkas inte högerkontexten (objektet står kvar direkt efter partikeln) men objektet kan mycket väl flyttas fram till fundamentet. T.ex. ger en del transformationer upphov till förändringar av högerkontexten. Detta gäller främst passivering och topikalisering. Definitionerna nedan kommer från Dahl (1982). Passivering innebär att följande förändring sker av en mening i aktiv diates: subjektet placeras efter verbet, prepositionen av läggs till framför subjektet, objektet placeras på subjektets plats och verbet får passiv form. Exempel: Oskar skrev på kontraktet Kontraktet skrevs på av Oskar (aktiv) (passiv) 13

14 Endast meningar med ett transitivt verbled kan genomgå en sådan transformation. Det är dock inte alltid den passiva konstruktionen uppvisar samma mönster som ovan. Subjektet kan strykas i passiva konstruktioner i tre fall; om det är underförstått som i exempelmeningen nedan, om det är obekant eller om syftet är att dölja subjektet. Kontraktet skrevs på och affären avslutades. Utelämnande av subjekt eller objekt är ett vanligt fenomen i olika sorters satsförkortningar, oberoende av diates. I nästa exempel har objektet uteslutits: Alla var nöjda med kontraktet, till och med Oskar skrev på. Topikalisering innebär att en nominalfras, oftast det direkta objektet, i en mening flyttas fram till fundamentsposition. Topikaliseringen medför också att det finita verbet flyttas fram före subjektet (s.k. finit-framflyttning). Oskar gav bort boken (till Anna). Boken gav Oskar bort (till Anna). (rak ordföljd) (topikaliserad version) Observera även följande passiva variant av meningen: Boken gavs bort till Anna. Här har givaren (Oskar) uteslutits, vilket enligt Thorell (1973) är vanligt när det gäller verb som t.ex. giva, lämna och lova. Det kan också tänkas att det var uppenbart vem som gav boken till Anna och att det var därför subjektet uteslöts. Inskottsmaterial Lindberg (1994) har arbetat med automatisk detektering av lexikaliserade fraser och har även inkluderat partikelverb i sin undersökning. Lindberg har kommit fram till att följande gäller för inskottsmaterial och jag har inte hittat något som emotsäger detta: 1) Om inskottet innehåller ett subjekt kan detta bestå av allt från enkla pronomen till hela nominalfraser med attribut av olika slag samt även proprier och förkortningar. 2) Om inskottet innehåller ett adverbial utgörs detta allt som oftast av ett kort satsadverbial (t.ex. inte eller ju), eller en prepositionsfras, men även tyngre adverbial förekommer (Lindbergs exempel): Han ställer inte upp idag Jag kommer tyvärr inte speciellt bra ihåg henne 3) I följande fall kan det inte förekomma något inskottsmaterial: - i satser som innehåller hjälpverb 14

15 - i bisatser - när verbet står i infinitiv eller particip Partikel eller preposition? Det kan vara mycket svårt och ibland t.o.m. omöjligt för både datorer och människor att skilja följande konstruktioner från varandra då det enda som skiljer konstruktionerna åt är betoningen och den kan man inte sluta sig till enbart utifrån texten. Exempel: Du måste skruva på korken. (dvs. sätta på korken på flaskan t.ex.) Du måste skruva på korken. (dvs. du ska inte trycka på korken, utan skruva på den). (partikelverb + nominalfras) (verb+advl (prep. + nominalfr.)) Då osäkerhet uppstår finns det en rad olika förflyttningstester att ta till. Teleman(1983) föreslår bl.a. följande tester (mina språkexempel): - Om prepositionskandidaten samt efterföljande nominal kan brytas ut och göras till fundament, inleda en relativ sats eller frågesats, så är det en preposition: Kalle går på tricket *Det är på tricket som Kalle går Kalle går på vägen Det är på vägen som Kalle går - Det prepositionsliknande ordet är en partikel om det efterföljande nominalet lätt kan göras till subjekt i passiv sats: käppen bröts av - Ordet särskilt kan användas för att disambiguera prepositioner och partiklar. Ett nominal i en prepositionsfras kan framhävas på följande sätt: jag har lekt särskilt med Kalle. Det går däremot inte att placera särskilt framför en partikel i avsikten att framhäva det efterföljande objektet: jag har brutit av särskilt käpparna *jag har brutit särskilt av käpparna - Om man kan sätta prepositionskandidaten som förled till verbet utan att ändra ordföljden är det ett partikelverb vi har att göra med: ta (i)från Svensson bilen frånta Svensson bilen ta bilen från Svensson *frånta bilen Svensson 15

16 Testerna ovan må vara nog så praktiska men de går tyvärr inte att använda i datorsammanhang. Partikel eller adverb? Lindberg har funnit att ett verb tillsammans med en adverbliknande partikel oftast utgör ett partikelverb. Sådana konstruktioner ger därför upphov till få ambiguiteter. Men om verbet betecknar rörelse kan det ibland vara svårt att avgöra om t.ex. upp är en partikel eller om det är ett adverb som bestämmer ett rumsadverbial. Rumsadverbialet börjar ofta med mot/till. Exempel: Han gick upp mot kyrkan. Han gick upp mot kyrkan Det bör nämnas här att prepositioner och adverb kan vara betonade i emfatiska konstruktioner, till exempel i meningen Han gick på mattan (inte bredvid den). Denna betoning går det heller inte att sluta sig till enbart från texten om där inte finns en speciell fördefinierad markör. Valens Vad gäller valens menar Lindberg att om man anger både de enkla verbens och partikelverbens valens i lexikon löser man en del ambiguiteter, men inte alla. Om man vet att ett partikelverb är intransitivt så kan man utesluta konstruktioner där den eventuella partikeln följs av en nominalfras. Lindbergs exempel (här och framåt tills annat anges): * Han gick under stegen. Han gick under stegen. Notera att detta kan vara lite vanskligt då adverbial kan utgöras av nominalfraser (t.ex. han tittade in en torsdagskväll) vilka dessutom gärna följer direkt efter partikeln i meningen (min anmärkning). För de enkla verben är det (enligt Lindberg) också bra att ange huruvida de kan efterföljas av en prepositionsfras eller ej. Genom att i lexikon ange sådan information jämte uppgifter om ordklass och valens kan meningsanalyser som de nedan undvikas: De såg på oss. Hon klippte av några centimeter. Han satte i fönstret. Valensinformation räcker emellertid inte i de fall då det enkla verbet kan bilda både transitiva partikelverb och ta prepositionsfras. Ambiguiteten består t.ex. i följande meningar: Slå i sina böcker Slå i sina vänner att 16

17 3 Automatisk detektering av partikelverb Vad är det då ett program för automatisk detektering av partikelverb måste klara av? Den övergripande uppgiften är att avgöra huruvida ett verb följt av ett adverb eller en preposition utgör ett partikelverb eller ej. Detta innebär att programmet måste kunna hantera följande: 1) Eventuella inskottsmaterial, d.v.s. hitta inskottsmaterialet och analysera det. 2) Eventuella högerkontexter, d.v.s. identifiera det material som kommer efter partikeln och analysera det. 3) Hantera förändringar i ordföljden. T.ex. ska både meningar med rak och omvänd ordföljd kunna behandlas. Detta innebär att det någonstans måste formuleras vilka inskott och högerkontexter som är tillåtna och att programmet måste klara av en viss grad av syntaktisk analys eller samverka med andra moduler som ger sådan information. Jag kommer i detta kapitel kortfattat presentera Lindbergs förslag till lösning från 1994 och även nämna hur han ser på problemet idag. Mitt eget lösningsförslag, som i mångt och mycket liknar Lindbergs, redovisas därefter i korta ordalag för att sedan presenteras närmare i resultatkapitlet. 3.1 Lindbergs arbete För att detektera lexikaliserade fraser och då även partikelverb automatiskt föreslog Lindberg 1994 en metod som bygger på både regler och lexikon. I korthet såg hans förslag till lösning ut som följer: - Hantera partikelverb innehållande prepositionsliknande partiklar genom att lista dem i lexikonet. - Hantera partikelverb innehållande adverbliknande partiklar med regler. Om disambigueringsreglerna kräver ett verb, ett begränsat inskottsmaterial och sedan den adverbliknande partikeln blir andelen övergenereringar ganska liten. - Tillåt subjekt, adverbial och objektspronomina som inskott. - Uteslut dock verb, subjunktioner och skiljetecken i inskottet. - Begränsa antalet inskottsord till ca fem. - Ange ordklass i lexikonet. - Ange partikelverbens och de enkla valens i lexikonet. - Ange även i lexikonet huruvida enkla verb kan ta prepositionsfraser. Sammanfattningsvis säger Lindberg att reglerna har fördelen att de kan hitta alla konstruktioner som uppfyller vissa kriterier och de kan även hitta nybildningar. Täckningsgraden är dock inte tillräckligt stor även om man begränsar reglerna till att enbart omfatta t.ex. partikelverb som tar adverbliknande partiklar, och dessutom släpps en hel del tvetydigt och felaktigt material igenom. En metod som helt förlitar sig på lexikonet övergenererar inte 17

18 lika mycket som en regelbaserad men partikelverben är å andra sidan väldigt många. I en senare rapport, Lindberg (1999), har Lindberg ändrat uppfattning på flera punkter vad gäller partikelverben. Till att börja med har han genom att utgå från semantiska kriterier snarare än formella och prosodiska begränsat vilka partikelverb som får vara med i fraslexikonet. Han fokuserar därmed på de mer idiomatiska partikelverben. Därför utesluter han partikelverb vars partikel används i sin ursprungliga rumsliga betydelse, därmed utesluts slänga in men lägga in får vara med i och med att en av dess betydelser ( konservera ) inte är semantiskt kompositionell, d.v.s. det går inte att sluta sig till betydelsen utifrån de ingående delarna. Den andra typen av partikelverb som utesluts är sådana som används i rumsliga metaforer, t.ex. slunga ut och sväva ut. Vad gäller regler och lexikon har Lindberg frångått idén att hantera adverbliknande partiklar med hjälp av regler då där fanns för många ambiguiteter. Han menar att övriga får skötas av parsern. Han ser ej heller längre någon fördel i att i lexikonet ange huruvida enkla verb kan ta prepositioner efter sig i och med att alla verb kan ta adverbiella prepositioner. I övrigt gäller det som listades ovan. LP-Detect är namnet på Lindbergs program och det innehåller tre komponenter: ett lexikon över lexikaliserade fraser, ett detekteringsprogram och en disambigueringsdel (Dis). Lexikonet innehåller totalt drygt 8000 fraser som med hjälp av variabler kan härledas utifrån ca 4800 typer av fraser. Lexikonet innehåller följande uppgifter: - Vilken typ av fras det rör sig om och hur många exempel av den typen det finns i lexikonet - En approximering av hur långt det minst frekventa ordet är anges genom att lista det längsta ordet i frasen. - Ordklassanalys av frasen (med subkategorisering av verben som t.ex. anger om verbet är transitivt, bitransitivt eller intransitivt). - Ett reguljärt uttryck som används för att hitta frasen i texten. Uttrycket kan innehålla ord, ordklasser och variabler. - Prosodisk och morfologisk information m.m. Detekteringsprogrammet använder de reguljära uttrycken. Sökrymden begränsas genom att endast de fraser vars längsta ord finns med i meningen anses som möjliga. Programmet innehåller både disambigueringsregler och uteslutningsregler ( discarding rules ) som tillsammans hittar den rätta lösningen. Input till programmet är textfiler från SUC innehållande ord:ordklass-par. Om ordet är ett verb står dess grundform. Output är samma mening med eventuella lexikaliserade fraser markerade med hakparenteser och taggar. Programmet klarar av att hitta 94 % av de lexikaliserade fraserna i SUC. Jag har ingen uppgift på vilka partikelverb han hanterar och om procentsiffran även gäller för den gruppen. 18

19 3.2 Mitt eget arbete i korthet I detta avsnitt presenterar jag mitt eget lösningsförslag i stora drag. En mer detaljerad redovisning återfinns i kapitlet Resultat. Jag har fått stor hjälp av Lindbergs arbete och i mycket av det jag har gjort syns det spår efter honom. Hans uppgift var mer övergripande än min då han syftade till att hantera alla sorters lexikaliserade fraser medan jag enbart har koncentrerat mig på partikelverb och till och med bara ett begränsat antal sådana (se kapitlet Metod). Även jag anger ordklass och valens i lexikonet, tillåter subjekt och adverbial som inskott och begränsar inskottet till fem ord. Jag godkänner dock inte objektspronomina rakt av utan anger för varje partikelverb om de kan förekomma i reflexiv form eller ej. Jag listar både partikelverben med adverbliknande partiklar och dem med prepositionsliknande partiklar i lexikonet. Jag anger huruvida partikelverben är intransitiva eller transitiva men den informationen är bara till för att framtida syntaktiska regler (t.ex. regler för att hantera passivering) ska veta vilka partikelverb de kan operera på. Huruvida Lindberg har några syntaktiska regler som hanterar förändringar i ordföljden vet jag inte men dessa torde vara nödvändiga om man vill få en hög täckningsgrad, åtminstone för ickeidiomatiserade partikelverb. För lexfraser av typen hålla sig underrättad eller skämt åsido är det möjligt att ordföljden inte påverkar fraserna i sig utan bara deras omgivningar. Jag anger valens i form av en lista av godkända högerkontexter. En subkategorisering av partikelverben har jag varit inne på, se mer om detta i avsnitt 5.2. När det gäller inskottet sköts detta hos Lindberg genom att det i de reguljära uttrycken även lämnas plats för inskott. Om jag har förstått rätt använder han samma begränsningar av inskottet för alla typer av lexfraser. Vi godkänner i stort sätt samma inskott men jag förhindrar en hel del feltolkningar genom att för vissa partikelverb förbjuda ett eller flera inskott, detta görs i lexikonet. Våra lösningar liknar varandra i det att vi båda valt att lista partikelverben i lexikon och där även ange valens- och kontextinformation. Jag har dock använt listor av kontexter i stället för reguljära uttryck, detta gäller även hanteringen av inskottsmaterialet. På det stora hela har jag varit mer specifik i mina uppgifter och detta är naturligt då hans arbete omfattar ett mycket större och månsidigare material. 19

20 4 Metod I de tidigare avsnitten har en definition av begreppet partikelverb presenterats och mitt och Lindbergs lösningsförslag har beskrivits. Fokus skiftar nu från de grundläggande bakgrundsstudierna i undersökningen till det faktiska arbetet. Nedan följer en redovisning av det material som används vid sökning efter partikelverb, vilka kriterier sökningen grundar sig på och vilket tillvägagångssätt som använts. 4.1 Material Det textmaterial som använts i undersökningen är Stockholm Umeå Corpus (SUC), utvecklad av institutionen för lingvistik på Stockholms universitet och motsvarande i Umeå. Den version som används här är SUC 2.0. Korpusen innehåller drygt en miljon ord och den är taggad med avseende på ordklass, lemma och böjningsmorfologi. Taggningen är till största delen gjord med manuella metoder och tagguppsättningen finns beskriven i Ejerhed et al (1992). SUC består av 500 texter om 2000 ord vardera. Dessa är hämtade från vitt skilda ämnesområden för att täcka så många olika språkstilar som möjligt. De flesta texterna är tryckta under åren och någon enstaka Meningen är att korpusen ska spegla den nutida svenskan i största möjligaste mån. 4.2 Kriterier De partikelverb som skulle studeras valdes ut från SUC enligt vissa kriterier. Dels var det önskvärt att studera de mest frekventa partikelverben. Att enbart kunna hantera dessa skulle i sig vara ett stort lyft för talsyntesen. Det var också önskvärt att titta på de produktivaste verben och partiklarna, d.v.s. de verb som kan kombineras med flest partiklar och vice versa. Jag hoppades på detta sätt underlätta sökningen efter samband och mönster som kan leda till någon form av gruppering av partikelverben. Med andra ord var målet att hitta de vanligaste partikelverben med de produktivaste beståndsdelarna. Med Lindbergs arbete i bakhuvudet anpassades även metoden för att kunna studera partikelverbens eventuella inskottsmaterial och deras högerkontexter. 4.3 Arbetets olika faser Arbetet med att undersöka hur olika partikelverb uppför sig syntaktiskt och vilka ambiguiteter de ger upphov till kan delas upp i ett antal olika delmoment vilka redovisas nedan. Sökning, sortering och sållning Det första steget var att ta fram alla enskilda partikelverb i SUC, d.v.s. konstruktioner där ett verb följs av ett optionellt inskott följt av en preposition eller ett adverb som blivit taggade som PL. Det blev ca 1600 st. Utifrån frekvenslistor sorterade jag ut dem som förekom 10 eller fler gånger i SUC, varefter återstod ca 260 st. Från dessa 260 valdes de partikelverb ut vars verb 20

21 och partikel i sig själva var produktiva, d.v.s. de kunde kombineras med många partiklar respektive verb. Notera att en del väldigt vanliga partikelverb föll bort i detta moment beroende på improduktiva komponenter. I slutändan hade 173 st. frekventa partikelverb valts ut. Dessa utgör kombinationer av 85 verb och 12 partiklar: betala gå måla stänga bjuda göra nå stöta bli ha passa sudda breda hinna plocka säga bry hjälpa ringa sända bryta hoppa råka sätta bygga hyra räcka ta byta hålla räkna tala bära hälsa rätta titta dela hänga samla träda dra höra se tränga dyka klara skicka tycka falla kliva skjuta vara finnas komma skriva veta flytta känna slå visa fylla köpa släppa välja få köra stanna vända fånga lyfta sticka växa följa låsa stiga äta föra lägga sträcka ge lämna stå glömma lösa ställa Tabell 1: Verb (85 st.) av i med till bort ihop om upp fram in på ut Tabell 2: Partiklar (12 st.) Kontextextraktion Nästa moment bestod i att extrahera alla de utvalda partikelverben i sin kontext ur SUC. För varje partikelverb togs alla meningar fram som innehöll verbet och partikeln i rätt följd med eventuellt inskottsmaterial emellan. För att kunna undersöka vilka inskottsmaterial och högerkontexter partikelverben kunde förekomma tillsammans med sparades resultatfilerna i olika varianter. (a) visar hur en mening i SUC ser ut. (b) visar samma mening men här med fokus på taggarna, bara verbet och partikelns ortografiska (grund)form finns kvar. Stjärnorna är till för att det ska vara lättare att hitta verbet och partikeln vid manuell läsning om det förekommer långt inskottsmaterial. I (c) finns bara verbet och partikeln samt deras eventuella inskott med. För att underlätta vanlig läsning av meningarna skapades även en filvariant där enbart texten syns med partikeln och verbet markerade (d). a) <s id=kk68-144> <w n=1566>fattaru<ana><ps>in<b>fattaru</w> 21

22 <d n=1567>,<ana><ps>mid<b>,</d> <w n=1568>alla<ana><ps>pn<m>utr/neu PLU IND SUb/ObJ<b>alla</w> <w n=1569>visste<ana><ps>vb<m>prt AKT<b>veta</w> <w n=1570>om<ana><ps>pl<b>om</w> <w n=1571>det<ana><ps>pn<m>neu SIN DEF SUb/ObJ<b>det</w> <w n=1572>utom<ana><ps>kn<b>utom</w> <w n=1573>jag<ana><ps>pn<m>utr SIN DEF SUb<b>jag</w> <d n=1574>...<ana><ps>mad<b>...</d> </s> b) <s id=kk68-144> IN MID PN ***veta Vb PL om*** PN KN PN MAD </S> c) veta Vb PL om veta Vb Ab Ab PL om d) <s id=kk68-144> Fattaru, alla ***visste om*** det utom jag För att kunna identifiera och studera ambiguitetsproblem extraherades även de meningar innehållande snarlika konstruktioner som inte blivit taggade som partikelverb, d.v.s. meningar innehållande ett verb, ett eventuellt inskott och en preposition eller ett adverb. (e) är ett exempel på en sådan konstruktion. e) <s id=ac01b-034> I dag ***vet ingen om*** Volvo lyckas i Uddevalla. </S> Samma sorts resultatfiler som för partikelverben producerades och studerades. I detta moment upptäcktes mängder av feltaggningar i SUC. I de allra flesta fall visade det sig att det var ett riktigt partikelverb vi hade att göra med. Resterande undersökningar omfattar även det feltaggade materialet. Det är jag själv som avgjort vad som är partikelverb eller ej i dessa fall. En del felbedömningar har med all sannolikhet släppts igenom men jag hoppas att detta inte har påverkat det övergripande resultatet. Kontextstudier De taggade resultatfilerna användes för att studera inskottsmaterial på ordklassnivå. För varje partikelverb noterades vilka inskott som kunde förekomma och vilka som var vanligast. Lindberg hade helt rätt i att de vanligaste inskotten var subjekt och adverbial och ofta korta sådana. Inskottsmaterialet i partikelverben jämfördes med motsvarande hos liknande konstruktioner med annat betoningsmönster. För att ta reda på vilka högerkontexter som får och inte får förknippas med varje partikelverb undersöktes de ortografiska filerna för både partikelverb och liknande obetonade konstruktioner. Ambiguiteter noterades på både ord-, ordklass- och frasnivå. För varje enskilt partikelverb funderade jag dessutom länge och väl vilka övriga kontexter som var tillåtna respektive otillåtna, detta var tvunget då SUC inte är så stort. 22

23 Ett antal uppgifter noterades för varje partikelverb: totala antalet förekomster, antalet förekomster av varje typ av inskottsmaterial och antalet förekomster av varje typ av högerkontext. Genom att jämföra med liknande information om falska konstruktioner gick det att identifiera ambiguitetsproblem, utröna vad som är särskiljande mellan partikelverb och deras falska motsvarigheter och utifrån detta formulera disambigueringsregler. 23

24 5 Resultat Kontextstudierna resulterade i två lexikon och ett antal generella regler som i samverkan beskriver det syntaktiska uppträdandet hos 173 partikelverb. Partikelverbslexikonet innehåller information om vilka kontexter partikelverben får och inte får uppträda i och verb lexikonet anger för varje verb vilka partiklar som är tillåtna. Det sistnämnda verblexikonet har ingångar av typen: betala:particles:in,ut Verblexikonet skulle eventuellt kunna vara en del av ett större ordklasstaggat lexikon och kommer inte att presenteras närmare här. För närvarande är båda lexikonen fullformslexikon, d.v.s. det finns en ingång för varje verbform. Medan informationen i lexikonen beskriver uppträdandet hos de enskilda verben och partikelverben arbetar reglerna på en mer övergripande nivå. Reglerna förbjuder eller släpper igenom vissa inskott och högerkontexter och det är meningen att de även ska hantera ordföljdsförändringar. 5.1 Partikelverbslexikon I detta avsnitt beskrivs vilka beteckningar som använts i partikelverbslexikonet, lexikonets struktur och vilken information det innehåller. Därefter presenteras själva lexikoningångarna. Vi börjar med ingångarna för partikelverb som tar prepositionsliknande partiklar följt av dem som tar adverbliknande partiklar. Vilka ambiguitetsproblem som är förknippade med varje partikel presenteras kortfattat. I vissa fall diskuteras även enskilda partikelverb, speciellt om deras uppförande begränsas av någon restriktion utöver de vanliga. Den diskussionen sker i så fall i Appendix. Terminologi Följande förkortningar och termer har använts i lexikoningångarna: HK INS PL NP VP Sats intrans trans sig1 sig2 nn pn pm vb pp ab ok partikelverb högerkontext inskottsmaterial partikel nominalfras verbfras här: nominalfras följt av en verbfras intransitiv transitiv vb sig PL (t.ex. ta sig till) vb PL sig (t.ex. ta till sig) nomen pronomen proprium verb preposition adverb inga restriktioner förekommer (generella regler gäller dock). 24

25 Om ett partikelverb har blivit definierat som både intrans och trans kan detta betyda två saker. Dels kan det vara så att partikelverbet uppträder i båda formerna, dra fram är ett exempel på ett detta: man kan dra fram över prärien och man kan dra fram en pistol. Dels kan det betyda att det är vanligt att man utelämnar objektet. Exempel: Han lade på (luren) och gick ut i köket. Trans i sig betyder att partikelverbet kan passiveras och att den tar något av de tillåtna objekten. Intrans betyder att partikelverbet ej kan passiveras men att det eventuellt kan ta objekt (i så fall är detta angivet). Efter intransitiva partikelverb ska dessutom en rad adverbial tillåtna. Om det bara står sig1 eller sig2 i HK-fältet betyder detta att partikelverbet endast kan förekomma i reflexiv form. ej framför en ordklass eller en konstituent anger förbud. Detta förekommer bara i två fall: ej s som anger att partikelverbet inte kan förekomma i s-form, och ej sats som anger att högerkontexten inte få innehålla en sats. En sats är tillsvidare definierad som en kort NP (ett eller två ord lång) följt av VP. Struktur och information En lexikoningång kan sägas vara indelad i tre fält: anger vilket partikelverb det är fråga om och INS-restr anger vilka restriktioner som gäller för inskottsmaterialet mellan verbet och partikeln. HK specificerar en mängd egenskaper: partikelverbets valens, vilka högerkontexter som är tillåtna, om partikelverbet förekommer i s-form eller ej samt huruvida det kan ingå i reflexiva konstruktioner. INS-restr. HK lägga av ej NP att Sats, NP, med NP,sig2, intrans, trans, s Figur 1: Exempel på en lexikoningång Informationen i lexikoningången för partikelverbet lägga av ovan ska därmed tolkas på följande sätt:! det får inte ta någon nominalfras som inskottsmaterial! det kan ta högerkontexterna att Sats, NP och med NP! det kan ingå i reflexiv konstruktion av typen VB PL sig (lägga av sig),! det kan konstrueras både intransitivt och transitivt! det kan förekomma i s-form Vidare gäller följande: lägga av får inte förekomma med några andra högerkontexter än de som anges i HK-fältet förutom dem som anges av de generella reglerna. Vad gäller inskottet får det inte innehålla en NP. Om reglerna och informationen i lexikonet emotsäger varandra gäller det som står i lexikonet. Reglerna presenteras i avsnitt 5.2 efter lexikoningångarna. 25

26 Lexikoningångar Nedan redovisas alla lexikoningångar. För varje partikel diskuteras allmänt vilka problem den är förknippad med. Själva ingångarna redovisas i listform. Kommentarer till listorna finns i Appendix. Av Orsaksadverbial av typen av hjärtans lust, av flera skäl etc. kan ställa till det i och med att så gott som alla partikelverb i denna grupp har NP som sin mest frekventa högerkontext. Jämför t.ex. Jag drog av flera skäl (in till stan). Jag drog av flera lager (från barken). Jag har dock inte hittat en enda förekomst av den här typen av adverbial tillsammans med verben nedan. Detta tillsammans med att NP är bland de vanligaste högerkontexterna gör att jag väljer att tillåta den utom i några enstaka fall där jag bedömer att det är stor risk för ambiguiteter. INS-restr. HK känna av ok trans, att Sats, NP, ej s bli av ok intrans, att Sats, NP, med NP, ej s lägga av ej NP intrans, trans, att Sats, NP, med NP, s, sig2 gå av ok intrans, trans, NP, ej s hoppa av ok intrans, trans, NP, från NP, ej s göra av ok intrans, trans, NP, med NP, s, sig1 höra av ok trans, NP, s,sig2 klara av ej NP trans, att Sats, att VP, NP, s, sig2 stänga av ok intrans, trans, NP, s, sig2 dra av ok trans, NP, s ta av ok trans, NP, s, sig2 Tabell 3: Verb + av I Tyvärr så är partikeln i väldigt sparsamt representerad i min undersökning och det är svårt att avgöra hur pass allvarliga ambiguiteter den kan ge upphov till. I och med att många adverbial börjar med i (t.ex. i morse, i skålen, i alla fall ) så är det främst de partikelverb som tar NP och som kan ta sådana adverbial som borde vara problematiska. Det enda som går att göra är att förbjuda NP som högerkontext. Se kommentaren till lägga i i Appendix. INS-restr. HK fylla i ok trans, att Sats, att VP, NP, Sats, s lägga i ej NP trans, NP, s, sig1 ta i ej NP intrans, med NP, s Tabell 4 : Verb + i 26

27 Med Här nedan kommer vi snudda vid ett vanligt och problematiskt fenomen som vi kommer att se mer av när de adverbliknande partiklarna diskuteras. Problemet är att rörelseverb kan ta emfas. Meningen Han gick med Kalle till dagis kan läsas på två sätt; om vi har partikelverb betyder det följde med annars betyder det att man gick snarare än ta sig dit med t.ex. bil eller cykel. Huruvida NP ska uteslutas som högerkontext måste man avgöra från fall till fall. Min princip har varit följande: om det är så att exemplen utan konnektiv betoning är få eller obefintliga och betydelseskillnaden mycket liten har jag undvikit att utesluta NP främst p.g.a. att så många partikelverb skulle underkännas. Några andra bekymmer är t.ex. att adverbial som börjar med med, t.ex. med stor sannolikhet krånglar till det liksom bestämningar av typen med den röda tröjan. INS-restr. HK få med ok intrans, trans, att Sats, NP, ej s, sig2 vara med ok intrans, att VP, NP, om, på att Sats, på NP, när Sats, som NP, i NP, ej s hinna med ok intrans, trans, att VP, NP, s ha med ok trans, NP, ej s, sig2 hänga med ok intrans, trans, på NP, när Sats, i NP, till NP, ej s gå med ok intrans, trans, NP, på NP, som NP, i NP, till NP, ej s följa med ej NP intrans, trans, NP, på NP, som NP, i NP, till NP, ej s komma med ok intrans, trans, NP, på NP, som NP, i NP, till NP, ej s finnas med ok intrans, på NP, som NP, i NP, vid NP, s hålla med ok intrans, trans, NP, om, s föra med ok trans, NP, s, sig2 ta med ej NP trans, NP, s, sig2 Tabell 5: Verb + med 27

28 Om Om förekommer ytterst sällan som preposition med verben jag tittat på. Om som subjunktion är dock vanligt förekommande och tar alltid en sats som högerkontext detta gör inte partikelverb. För att känna igen en sats måste reglerna klara av att först identifiera en nominalfras och sedan en verbfras efter denna. Någon form av begränsning är oundviklig och jag har funnit att det är i ytterst få fall som verbfrasen börjar fler än 2-3 ord efter partikeln. Vanligast är alltså nominalfraser bestående av endast ett ord. Den slutliga lösningen blir att om vi inte hittat en nominalfras och ett verb (i den ordningen) bland de närmast följande orden efter partikeln är det inte en sats efteråt och vi kan gå vidare och titta på restriktionerna för inskott och de tillåtna högerkontexterna. INS-restr. HK tycka om ok trans, att Sats, att VP, NP, när Sats, ej s veta om ok trans, att Sats, NP, ej s, ej Sats vända om ok intrans, ej s, ej Sats bygga om ok intrans, trans, så att Sats, NP, till NP, s, ej Sats göra om ej NP, tvärt, helt intrans, trans, så att Sats, NP, till NP, s, sig2, ej Sats bry om - - tala om ej NP trans, att Sats, att VP, NP, för NP, hur Sats, när Sats, s se om ok trans, NP, s, sig2, ej Sats Tabell 6: Verb + om På Problemet med partikelverb som tar på som partikel är att på följt av NP är en mycket vanlig konstruktion i rumsadverbial/tidsadverbial samtidigt som flera av partikelverben har NP som sin vanligaste högerkontext. INS-restr. HK komma på ej NP intrans, att Sats, s, sig2 passa på ok intrans, att VP, ej s hålla på ok intrans, att VP, med att, med NP, s se på ok intrans, hur Sats, när Sats, s stöta på ok trans, NP, ej s lägga på ej NP intrans, trans, NP, s, sig2 ta på ok sig2 dra på ok trans, s, sig2 hälsa på ok trans, trans, NP, hos NP, s sätta på ej NP trans, NP, s, sig2 Tabell 7: Verb + på 28

29 Bort Inget av partikelverben som innehåller bort har blivit försedda med några restriktioner. Så länge någon av de angivna högerkontexterna förekommer efter verbet (eller någon av de som är godkända för alla partikelverb) så går det bra. Den enda som skulle kunna vara lite problematisk är gå bort (p.g.a. att det är ett rörelseverb). T.ex. meningen han reste sig och gick (barfota/långsamt) bort mot strandkanten kan man diskutera hur den ska uttalas. Det blir dock aldrig riktigt fel att ha konnektiv betoning på gå bort och därför har jag valt att inte sätta upp några restriktioner. Detta synsätt kommer att återspeglas i hanteringen av flera liknande partikelverb. INS-restr. HK gå bort ok intrans, med NP, mot NP, på NP, till NP, från NP, ej s, sig2 glömma bort ok intrans, trans, att Sats, att VP, NP, när Sats, hur Sats, s, sig2 få bort ok trans, NP, s ta bort ok trans, NP, s, sig1 Tabell 8: Verb + bort Fram Endast vid några enstaka verb behövs restriktioner, se tabellen nedan och kommentarer i Appendix. INS-restr. HK komma fram ok intrans, att Sats, med NP, mot NP, hur Sats, som NP, i NP, vid NP, till NP, från NP, ur NP, ej s gå fram ej NP intrans, mot NP, i NP, till NP, ej s nå fram ok intrans, i NP, till NP, ej s växa fram ok intrans, NP, på NP, som NP, i NP, ur NP, ej s få fram ok trans, NP, s träda fram ok intrans, på NP, som NP, i NP, till NP, ej s dra fram ok intrans, trans, NP, mot NP, på NP,som NP, över NP, s föra fram ok trans, att Sats, NP, s lyfta fram ok trans, NP, s lägga fram ok trans, NP, s plocka fram ok trans, NP, s sträcka fram ok trans, NP, s ta fram ej NP trans, NP, s, sig1 Tabell 9: Verb + fram 29

Förord KERSTIN BALLARDINI

Förord KERSTIN BALLARDINI Förord Det här häftet är avsett för dig som redan har ett visst ordförråd i svenska, men som behöver få en klar bild av vilka typer av satser som finns i språket, vilka former de har och vilken funktion

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

Grundläggande syntaktiska funktioner och roller

Grundläggande syntaktiska funktioner och roller UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER/SATSDELAR Grundläggande syntaktiska funktioner och roller o Exemplen nedan kan få illustrera två grundläggande

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade

Läs mer

Lexikon: ordbildning och lexikalisering

Lexikon: ordbildning och lexikalisering Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke

Läs mer

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat Ryska pronomen Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat 1 1.Självständiga pronomina Pronomina som kan bilda Nominal Fras (NP) på

Läs mer

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin Hemtentamen HT13 Inlämning senast 131108 Lärare: Tora Hedin Arbetet skall vara skrivet på dator och skickas in i elektronisk form till mig senast torsdagen den 8 november 2013. Dokumentets format ska vara

Läs mer

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Satser och satsdelar Översikt i stolpform. Terminologin följer

Läs mer

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. ADJEKTIV Semantiska kriterier. o betecknar egenskaper eller tillstånd hos saker, personer eller företeelser., t.ex. (en) röd näsa,

Läs mer

Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden

Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden Kopieringsförbud! Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden Den som bryter mot lagen om upphovsrätt kan åtalas och dömas till böter

Läs mer

Satslära introduktion

Satslära introduktion Satslära introduktion Dolores Meden Dolores Meden 2010-08-27 1 Skillnaden mellan ordklass och ett ords funktion (syntax): * ett ords tillhörighet i en ordklass är konstant och påverkas inte av användningen

Läs mer

Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen).

Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen). Satsschema Huvudsats Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen). Naturliga fundament är: kända pronomen, pronominella adverb (då, där, här), bekanta substantiv, tidsadverb

Läs mer

Studiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is.

Studiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is. Háskóli Íslands Svenska lektoratet Höstterminen Grammatik I 05.70.03 (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is Studiebrev 13 Uppgift 1 I det här sista Studiebrevet vill jag att du kommer med lite

Läs mer

Fraser, huvuden och bestämningar

Fraser, huvuden och bestämningar UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin

Läs mer

Svenskans struktur, 7,5 hp Tentamensexempel 1

Svenskans struktur, 7,5 hp Tentamensexempel 1 Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ är konstruktioner (fraser) som innehåller ett predikat och ett subjekt (Josefssons, s. 151, definition, som är en vanlig definition).

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Syntax Fras, sats, mening

Syntax Fras, sats, mening Allmän grammatik 6 Fraser Syntax Fras, sats, mening Lösryckta satsdelar utan kontext; benämns utifrån huvudordet. nominalfras (nomen, dvs. substantiviskt ord + bestämningar) min lilla bortskämda katt,

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik

Läs mer

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala

Läs mer

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp astställda av institutionsstyrelsen 2012-05-09. Gäller fr.o.m. ht 12. elkurs 1: et talade språket, 7,5 hp örväntade studieresultat

Läs mer

Har/hade-bortfall i svenskan Hur finit är ett naket supinum?

Har/hade-bortfall i svenskan Hur finit är ett naket supinum? Har/hade-bortfall i svenskan Hur finit är ett naket supinum? Maia Andréasson, Susanna Karlsson, Erik Magnusson och Sofia Tingsell Att de finita formerna av verbet ha, dvs. har och hade, kan utelämnas när

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv10/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2010 Satser Satserna utgör den mest mångfacetterade

Läs mer

Satsdelar. Carina

Satsdelar. Carina Satsdelar 1 Huvudsats och bisats HUVUDSATS: Ger den viktiga informationen: verbhandlingen och vem som utför den. Kännetecken: Kan stå för sig själv. (Pojken kom inte till skolan idag). BISATS: Ger övrig

Läs mer

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. UPPSALA UNIVERSITET Inst. för lingvistik Niklas Edenmyr Grammatik, 5p. SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till. o Ofta fogas

Läs mer

Sidan 1. En situation. En modell för satsproduktion. Fri ordföljd. Finska kasus. Bunden ordföljd

Sidan 1. En situation. En modell för satsproduktion. Fri ordföljd. Finska kasus. Bunden ordföljd En situation Syntax 4: Satsledens ordning ( ordföljd ) Föreläsning 11 Ordföljdens funktioner generellt Centrala drag i svenskans ordföljd Huvudsatsschemat Ordföljdsvariationer Litteratur: Nusvensk Grammatik

Läs mer

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap

ORDKLASSTAGGNING. Marco Kuhlmann Institutionen för datavetenskap ORDKLASSTAGGNING Marco Kuhlmann Institutionen för datavetenskap Ordpredicering n-gram-modeller (definition, skattning) den brusiga kanalen: P(R F) = P(F R) P(R) redigeringsavstånd, Levenshtein-avstånd

Läs mer

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet.

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet. MITTUNIVERSITETET Institutionen för humaniora Elzbieta Strzelecka 0611 86 175 070-5771449 Svenska språket GR (A), Läs- och skrivutveckling för grundlärare åk 4 6, Att beskriva språket 7,5 hp Den 16 augusti

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. Då jag föddes i juli 1918 hade mor (1) spanska sjukan, jag var i dåligt skick och (2) nöddöptes på sjukhuset. En dag fick familjen

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Lingvistik V Satsdelar, huvud- och bisatser

Lingvistik V Satsdelar, huvud- och bisatser Lingvistik V Satsdelar, huvud- och bisatser 1. Form och funktion I språklig analys gör man en skillnad mellan en konstituents form, dvs hur den är morfologiskt och syntaktiskt uppbyggd, och dess funktion,

Läs mer

Världens språk, 7,5hp vt 2012

Världens språk, 7,5hp vt 2012 Niklas Edenmyr niklas.edenmyr@lingfil.uu.se Världens språk, 7,5hp vt 2012 2. Språkets arkitektur I: Texter, meningar och satser; Huvud- och bisatser; Samordning och underordning; Grammatiska relationer;

Läs mer

Sidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ?

Sidan 1. Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs. Vad är objekt och predikativ? Repetition: satsledsanalys (delvis från övningsboken) Satser och struktur Föreläsning 8, Lingvistik grundkurs Magnus Merkel 2006-02-13 Greta Jansson är 96 år. Han växte upp på landsbygden när man hade

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. En dag upptäcker min treåriga dotter (1) att det finns kärnor i äpplen. En snabb (2) genomgång av hur och varför visar (3) sig bli

Läs mer

Delprov A. Språkform och språknorm (2014) RÄTTNINGSMALL

Delprov A. Språkform och språknorm (2014) RÄTTNINGSMALL 1 MÅLSPRÅK SVENSKA Delprov A. Språkform och språknorm (2014) RÄTTNINGSMALL Anvisningar I var och en av de följande tjugo meningarna finns det ett brott mot olika slags skriftspråksnormer som gäller för

Läs mer

Svenska språket 1, delkurs 2 Språkets byggstenar 714G47 Svenska språket Svenska språkets byggstenar 714G57

Svenska språket 1, delkurs 2 Språkets byggstenar 714G47 Svenska språket Svenska språkets byggstenar 714G57 Studiehandledning vt 2018 Svenska språket 1, Delkurs Språkets byggstenar, grammatikdelen 5 hp Svenska språket Svenska språkets byggstenar, grammatikdelen 5 hp Välkommen till grammatikdelen i Svenska språket

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Mening. Sats. Huvudsats. En mening: Jag gillar kaffe men jag gillar inte te. En mening börjar med stor bokstav och slutar med.! eller?

Mening. Sats. Huvudsats. En mening: Jag gillar kaffe men jag gillar inte te. En mening börjar med stor bokstav och slutar med.! eller? Mening En mening: Jag gillar kaffe men jag gillar inte te. En mening börjar med stor bokstav och slutar med.! eller? Sats Jag gillar kaffe men jag gillar inte te. är en mening men 2satser. En sats har

Läs mer

grammatik Ordklasser, nominalfraser, substantiv

grammatik Ordklasser, nominalfraser, substantiv Svenska språkets struktur: grammatik Ordklasser, nominalfraser, substantiv Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Varför grammatik? Språkets struktur med meningsbyggnad,

Läs mer

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2. Förord Grammatikövningar för Sfi består av två delar, del 1 2, för kurserna B C resp C D och liknande utbildningar. Det är ett övningsmaterial som tränar svensk basgrammatik. Utgångspunkten för uppläggningen

Läs mer

Satsled och satstruktur

Satsled och satstruktur Innehåll Satsled och satstruktur Språkvetenskaplig databehandling Maria Holmqvist 2011-03-14 Repetition: Ordklasser och fraser Satsled Satsledsanalys Syntaktiska kategorier vs. Syntaktiska relationer Satser

Läs mer

Grammatisk teori III Praktisk analys

Grammatisk teori III Praktisk analys Grammatisk teori III Praktisk analys 1. Satser Till skillnad från fraser har satser inga givna strukturella huvuden. Olika teorier gör olika antaganden om vad som utgör satsens huvud. Den lösning som förespråkas

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

Del A 2005 Språkform och språknorm (Maja Lindfors Viklund)

Del A 2005 Språkform och språknorm (Maja Lindfors Viklund) Del A 2005 Språkform och språknorm (Maja Lindfors Viklund) 1. Personer som är födda före andra världskriget, har säkert ett speciellt förhållande till radion.

Läs mer

Svensk minigrammatik

Svensk minigrammatik Svensk minigrammatik För dig som vill repetera dina kunskaper i svensk grammatik Materialet är producerat av Mats Nyström.Det kan laddas hem på www.rlconsulting.se Materialet får ej saluföras. INNEHÅLLSFÖRTECKNING

Läs mer

Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.

Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen. Uppgifter i svenska till Harry Potter och De Vises Sten Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.

Läs mer

Innehåll. Förord 5. Övningar 26. Så här arbetar du med. På G Grammatikövningar 1-25 3. Minigrammatik 9

Innehåll. Förord 5. Övningar 26. Så här arbetar du med. På G Grammatikövningar 1-25 3. Minigrammatik 9 Innehåll Förord 5 Så här arbetar du med På G Grammatikövningar 7 Minigrammatik 9 1 Ordföljd i huvudsatser 9 2 Ordföljd i bisatser 10 3 Satsadverb 11 4 Indirekt tal 11 5 Substantivets former 12 6 Obestämd

Läs mer

Fraser och satsled. Språkets uppbyggnad. Definitioner. Språkets uppbyggnad. De fem frastyperna. Allmänt om fraser

Fraser och satsled. Språkets uppbyggnad. Definitioner. Språkets uppbyggnad. De fem frastyperna. Allmänt om fraser Språkets uppbyggnad Fraser och satsled Språkvetenskaplig databehandling Maria Holmqvist 2011-03-11 Ord som bildar Fraser som bildar Satser som bildar Meningar/yttranden som bildar Texter/dialoger/monologer

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Språkteknologi och grammatiska begrepp http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi November 2011 Lite mer om språkteknologisk

Läs mer

Lingvistik IV Konstituenter och frasstruktur

Lingvistik IV Konstituenter och frasstruktur Lingvistik IV Konstituenter och frasstruktur Dagens föreläsning kommer att ta upp: Konstituenter (Fraser och satser) Fraser Frasstrukturer 1. Konstituenter När vi tittar på hur en mening är uppbyggd kan

Läs mer

Svensk grammatik Ordklasser!

Svensk grammatik Ordklasser! Svensk grammatik Ordklasser! Grammatik är läran om ett språk, hur detta språk är uppbyggt och hur det fungerar i tal/skrift. Alla ord betyder något och kan delas in i olika ordklasser. Det finns 9 olika

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs D

Kommentarer till bedömningsmatris för Tala Kurs D Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

ANDREAS ISSA SVENSKA SPRÅKET

ANDREAS ISSA SVENSKA SPRÅKET ANDREAS ISSA SVENSKA SPRÅKET Kopieringsförbud! Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden. Den som bryter mot lagen om upphovsrätt kan

Läs mer

SVENSKANS STRUKTUR. Inledning. Marke&a Sundman

SVENSKANS STRUKTUR. Inledning. Marke&a Sundman Marke&a Sundman SVENSKANS STRUKTUR Inledning Denna text är avsedd som en översikt över svenskans grammatiska struktur, i första hand svenskans syntax, dvs. dess sats- och fraslära. Här beskrivs hur svenska

Läs mer

Förhållandet mellan anföringssats och anförd sats vid direkt anföring *

Förhållandet mellan anföringssats och anförd sats vid direkt anföring * David Petersson Förhållandet mellan anföringssats och anförd sats vid direkt anföring * Sammandrag. Vid direkt anföring uppvisar såväl anföringssats som anförd sats huvudsatsegenskaper och det är inte

Läs mer

Grim. Några förslag på hur du kan använda Grim. Version 0.8

Grim. Några förslag på hur du kan använda Grim. Version 0.8 Grim Några förslag på hur du kan använda Grim Ingrid Skeppstedt Nationellt centrum för sfi och svenska som andraspråk Lärarhögskolan Stockholm Ola Knutsson IPlab Skolan för datavetenskap och kommunikation,

Läs mer

Bedömda elevexempel i årskurs 1 3

Bedömda elevexempel i årskurs 1 3 SKRIVA STEG 1 5 Bedömda elevexempel i årskurs 1 3 EN DEL AV BYGGA SVENSKA ETT BEDÖMNINGSSTÖD FÖR NYANLÄNDA ELEVERS SPRÅKUTVECKLING 1 1:1 1 Eleven som går i första klass har samtalat med sin lärare om en

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. (1) Tidigt i gryningen påbörjade han sin (2) förvandling. Han hade (3) noga planerat allting för att (4) ingenting (5) skulle kunna

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs D

Kommentarer till bedömningsmatris för Tala Kurs D Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

TDDC89 LINGVISTIK måndag 20 oktober 2008

TDDC89 LINGVISTIK måndag 20 oktober 2008 Magnus Merkel Lars Ahrenberg Institutionen för datavetenskap Linköpings universitet RÄTTNINGSMALL TDDC89 LINGVISTIK måndag 20 oktober 2008 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 p ger säkert

Läs mer

Svenska i fokus 1. Provlektion: Tidsordet/objektet i fundamentet. Sidorna 94 96 plus facit ur Svenska i fokus 1.

Svenska i fokus 1. Provlektion: Tidsordet/objektet i fundamentet. Sidorna 94 96 plus facit ur Svenska i fokus 1. Svenska i fokus 1 Svenska i fokus 1 är ett nybörjarläromedel med snabb och tydlig progression. Boken är framtagen för vuxna och tonåringar med studievana. Provlektion: Tidsordet/objektet i fundamentet

Läs mer

Facit för diagnostiska provet i grammatik

Facit för diagnostiska provet i grammatik Facit för diagnostiska provet i grammatik Textutdrag: De tio vanligaste namnen på honhundar i Sverige är också vanliga kvinnonamn. Mest sällsynt är Bella med 1065 bärare, men åtskilliga av landets 11 954

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998

Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998 Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998 1-5. Formlära och syntax, lexikon, homonymer, morfem, ord och ordklass.

Läs mer

4. Bedömning av delprov C

4. Bedömning av delprov C 4. Bedömning av delprov C Bedömningen av delprov C genomförs utifrån bedömningsmatriser, kommentarer till bedömningsmatriserna samt med hjälp av exempel på elevlösningar med analys. På grund av skillnader

Läs mer

Att analysera andraspråkstexter

Att analysera andraspråkstexter Handledare: Britta Herder Examinator: Sofia Ask G3 GO1183 15 hp 2011-01-30 G2 G3 Avancerad nivå Att analysera andraspråkstexter En undersökning av två analysmetoder: processbarhetsteorin och performansanalysen

Läs mer

Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi

Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi Persiska Albin Finne 2002-10-10 Sammanfattning Den här uppsatsen beskriver det persiska språket. Språkets historia, morfologi, syntax och ordförråd behandlas. Tonvikten läggs på morfologi och syntax. Avslutningsvis

Läs mer

2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.

2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför. Ordklasser SUBSTANTIV 1. Substantiv kan delas in i följande grupper: egennamn (Nilsson, Kalle, Märsta, SAAB) växter (gräs, träd, buske) personer (häxa, flicka, svensk) djur (lejon, hund, spindel) föremål,

Läs mer

Sidan 1. Mångtydighet. Ordföljd och informationsstruktur. En situation. Fri ordföljd. Finska kasus. Bunden ordföljd

Sidan 1. Mångtydighet. Ordföljd och informationsstruktur. En situation. Fri ordföljd. Finska kasus. Bunden ordföljd Mångtydighet Ordföljd och informationsstruktur Föreläsning 9 Lingvistik grundkurs Magnus Merkel 2006-02-16 Igår sköt jag en e med gevär på 100 meter. Hade du ett så långt gevär? Nej, jag menar att jag

Läs mer

Dependensregler - Lathund

Dependensregler - Lathund Dependensregler - Lathund INTRODUKTION I textprogrammet TeCST är det möjligt för en skribent att skriva, redigera och klistra in text för att få ut läsbarhetsmått och få förslag på hur texten kan skrivas

Läs mer

Några skillnader mellan svenska och engelska

Några skillnader mellan svenska och engelska UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2011 Några skillnader mellan svenska och engelska 1 Inledning

Läs mer

Förord KERSTIN BALLARDINI

Förord KERSTIN BALLARDINI Förord Det här häftet är avsett för elever som redan har ett visst ordförråd i svenska, men som behöver få en klar bild av språkets tempussystem, lära sig vilka former de regelbundna och oregelbundna verben

Läs mer

Ordförråd och Ordbildning

Ordförråd och Ordbildning Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande

Läs mer

14. Sammansatta satser

14. Sammansatta satser 14.1 Samordning och underordning Förutom att de används självständigt för att uttrycka påståenden, frågor, uppmaningar etc. kan satser ingå som delar i större, sammansatta satser. Jämför följande exempel:

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Karp. https://spraakbanken.gu.se/karp Övningar Språkbankens höstworkshop oktober 2016

Karp. https://spraakbanken.gu.se/karp Övningar Språkbankens höstworkshop oktober 2016 Karp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/karp sb-karp@svenska.gu.se 17 oktober 2016 ÖVERSIKT När du går in på https://spraakbanken.gu.se/karp kan du välja att söka i ett

Läs mer

Språkets struktur och funktion, 7,5 hp

Språkets struktur och funktion, 7,5 hp Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag

Läs mer

Sfi-läromedel ur ett processbarhetsperspektiv

Sfi-läromedel ur ett processbarhetsperspektiv Lunds universitet Kandidatuppsats Institutionen för nordiska språk Svenska som andraspråk Jonna Pleijel Vt 2013 Sfi-läromedel ur ett processbarhetsperspektiv Handledare: Gunlög Josefsson Innehållsförteckning

Läs mer

Hur böjs Astrid Lindgrens hjältar i (i) Empirisk språkforskning i ett nötskal

Hur böjs Astrid Lindgrens hjältar i (i) Empirisk språkforskning i ett nötskal Artikel Hur böjs Astrid Lindgrens hjältar? Empirisk språkforskning i ett nötskal Muriel Norde 1. Inledning Då Huginn ok Muninns huvudredaktion bad mig att skriva ett bidrag inom ämnet barn- och ungdomslitteratur,

Läs mer

En anställande person - person som jobbar nu med att anställa=chef?

En anställande person - person som jobbar nu med att anställa=chef? 26 juli B2- extraintensiv Idag: Runda- Hur mår ni? Frågor på läxan Gårdagens ord Personliga brev och CV:n PAUS Presens perfekt eller preteritum perfekt utan har eller hade Relativa som LUNCH Repetition

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Huvudordklasser. ursinnig, god, glad äta, dricka, cykla. Övriga ordklasser. fort, borta, ute

Huvudordklasser. ursinnig, god, glad äta, dricka, cykla. Övriga ordklasser. fort, borta, ute Ordklasser Huvudordklasser NAMN substantiv adjektiv verb EXEMPEL misse, hus, mjölk ursinnig, god, glad äta, dricka, cykla Övriga ordklasser NAMN adverb pronomen räkneord prepositioner konjunktioner subjunktioner

Läs mer

En byggmodell över språket fonemet morfemet

En byggmodell över språket fonemet morfemet En byggmodell över språket Tänk dig att språket är en byggnad, en jättestor byggnad naturligtvis. Byggnaden är av lego. Tänk dig att de enklaste legobitarna är orden. Kombinationerna är oändliga men inte

Läs mer

LPP, Reflektion och krönika åk 9

LPP, Reflektion och krönika åk 9 LPP, Reflektion och krönika åk 9 Namn: Datum: Svenska Mål att sträva mot att eleven får möjlighet att förstå kulturell mångfald genom att möta skönlitteratur och författarskap från olika tider och i skilda

Läs mer

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser

Särdrag, lexikon och syntax. Ordklasser. Ordklasskriterier II. Ordklasskriterier. Öppna klasser. Slutna klasser Särdrag, lexikon och syntax Ordklasser Slutna klasser: prepositioner, konjunktioner, subjunktioner m.fl. (funktionsord) Inga nya ord bildas. Ola Knutsson knutsson@nada.kth.se Öppna klasser: substantiv,

Läs mer

Semantik och pragmatik

Semantik och pragmatik Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext

Läs mer

Innehållsförteckning till Svenska Online. Adress: www.sweol.se Uppdaterat 2011 01 18

Innehållsförteckning till Svenska Online. Adress: www.sweol.se Uppdaterat 2011 01 18 Innehållsförteckning till Svenska Online Adress: www.sweol.se Uppdaterat 2011 01 18 ABC kapitel 1, Alfabetisering 1 Skriv bokstaven a/a Se och lyssna Mus 2 Skriv bokstaven b/b Se och lyssna Mus 3 Skriv

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

Datum: Date: Provkodr: KTR1 Exam code:

Datum: Date: Provkodr: KTR1 Exam code: Del 1. Ordklasser (5p) Ange ordklass för de understrukna orden i texten. Kylan förstärkte alla ljud och lade sig som en osynlig men ogenomtränglig kupa över den (1)domnande staden. Den grep tag i kvällen

Läs mer

Pilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering

Pilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering Pilotstudie om maskinöversättning inom ramen för Projekt Kursdatabas - Utveckling av språkliga resurser för ett vetenskapsområde samt utvärdering Eva Pettersson evapet@stp.ling.uu.se Uppsala universitet

Läs mer

Välkommen till den första delkursen i svenska!

Välkommen till den första delkursen i svenska! Välkommen till den första delkursen i svenska! Som lärare i svenska är språket ditt främsta arbetsredskap, oavsett om du arbetar med läsning, skrivande eller muntliga aktiviteter. Denna delkurs syftar

Läs mer

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål: Grammatikprov svenska Nu är det dags att kolla av vad eleverna lärt sig under vårens grammatik arbete. Efter påsklovet tar vi paus från veckans-ord och pluggar grammatik. För att det inte ska bli för mycket

Läs mer

Grammatik skillnader mellan svenska och engelska

Grammatik skillnader mellan svenska och engelska UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf December 2012 Grammatik skillnader mellan svenska och engelska 1 Inledning

Läs mer

Artighetsmarkörer? Om förstås och andra självklarhetsadverb

Artighetsmarkörer? Om förstås och andra självklarhetsadverb Artighetsmarkörer? Om förstås och andra självklarhetsadverb Peter Andersson, D-student i svenska Att behandla utvecklingen av några speciella ord i svenskan kan tyckas trivialt och möjligen uppfattas det

Läs mer

6 Svenska som andraspråk

6 Svenska som andraspråk 6 Svenska som andraspråk Syftet med utbildningen i ämnet svenska som andraspråk är att eleverna skall uppnå en funktionell behärskning av det svenska språket som är i nivå med den som elever med svenska

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer