Flerordsenheter: Så många frågor, så få svar

Relevanta dokument
En byggmodell över språket fonemet morfemet

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

Fragment, ellipser och informationsberikade konstituenter

Faktorer av betydelse för en flerspråkig utveckling

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten

Lexikon: ordbildning och lexikalisering

Formell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet

Föreläsningens upplägg. Språket, individen och samhället HT Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)

Språkteknologi och Open Source

Anteckningar för kursen "Analys i en Variabel"

Inledande exempel. Levinson och informationsstruktur. Vad är informationsstruktur? Informationsstruktur och pragmatik

Utdrag ur protokoll vid sammanträde Förslaget föranleder följande yttrande av Lagrådet:

Kursplaneöversättaren. Lina Stadell

Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering?

Grundläggande textanalys. Joakim Nivre

Språket, individen och samhället VT08

Delprov B. Textbearbetning

Språkpsykologi/psykolingvistik

Kursplan för kurs på grundnivå

Datorlingvistisk grammatik

specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet

Kapitel 6. Att ge respons. Therése Granwald

Kapitel 5. Scanlon bemöter delvis invändningen genom att hävda att kontraktualistiskt resonerande är holistiskt.

INSTITUTIONEN FÖR SVENSKA SPRÅKET

MÖSG ht 2005 Maskinöversättningssystemet MATS

US116G - Svenska för grundlärare i grundskolan årskurs 4-6, I, 15 hp

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

FTEA21:3 Spr akfilosofi F orel asning I Martin J onsson

Excel-guide. Introduktion

Fastställande. Allmänna uppgifter. Kursens mål

Omtenta Svenska - ett andraspråk S S2GA01/04. ht 2014/vt 2015 fredag den 13 mars Inga hjälpmedel! VG G U 0-84

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon

Teoretisk lingvistik och datalingvistik. Robin Cooper

Betygskriterier. US610F - Språkdidaktik I, 30 hp

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Grammatik för språkteknologer

Att skriva en språkvetenskaplig uppsats. Ingmar Söhrman

Semantik och pragmatik (Serie 3)

ÄSAD11, Svenska som andraspråk 1, 30 högskolepoäng Swedish as a Second Language 1, 30 credits Grundnivå / First Cycle

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?

Lässvårigheter, språklig förmåga och skolresultat i tidiga skolår. Maria Levlin, lektor i språkvetenskap/leg logoped Institutionen för språkstudier

2-4: Bråktal addition-subtraktion. Namn:.

Neurolingvistik - Grammatik

Har sammansättningar en grammatik?

Kapitel 5. En annan väldigt viktig punkt om skäl att förkasta principer är att de måste vara personliga.

Kort presentation av Korp, Sveriges nationalkorpus

FRUKT OCH GRÖNSAKSVECKA

Språktypologi och språksläktskap

Lingvistik III Morfem och morfologi. 729G49 10 April

Kapitel 5. En annan väldigt viktig punkt om skäl att förkasta principer är att de måste vara personliga.

Formell logik Kapitel 9. Robin Stenwall Lunds universitet

Tekniker för storskalig parsning

Sofie Johansson Kokkinakis

Utvärdering med fokusgrupper

V I G Å R I G E N O M...

Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap

Fråga mellan raderna (Du måste tänka efter när du har läst texten. Genom ledtrådar i texten hittar du svaret.)

Tankar om språkundervisning

Kärlekens språk En analys

Lässvårigheter och språklig förmåga en studie om lässvårigheter i tidiga skolår

Business research methods, Bryman & Bell 2007

Annonsen Arbetsmaterial för läsaren Författare: Gull Åkerblom

LSI110, Svenska som andraspråk för blivande lärare I, 30 högskolepoäng

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Finska som främmande språk II, GN, 30 hp

Syfte Syftet med den här laborationen är att du ska lära dig använda några grundfunktioner i Microsoft Excel.

CHARTER. Upphovsrätt 2017 The SOS. Alla rättigheter förbehålls.

Språk och kunskapsutvecklande arbete i förskolan

Tillsammans. Tillsammans. ser och förstår vi mer och blir mer ödmjuka. Och kan lättare förstå hur förvirrande det vi säger kan vara för föräldrar

Fraser, huvuden och bestämningar

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Föreläsningar. Gruppövning, grupp A: Måndag 26/ sal 318 Gruppövning, grupp B: Måndag 26/ sal 318

TDDI02. Programmeringsprojekt, Föreläsning 2. Filip Strömbäck. Med utgångspunkt i tidigare slides av Jonas Lindgren

Grundläggande begrepp inom lexikal semantik. Hanna Seppälä Uppsala universitet 1

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II

Grafisk visualisering av en spårbarhetslösning

DONALD DAVIDSON: MENINGSTEORI

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI

Att skriva uppsats Vetenskapligt skrivande: att förstå och lära. Föreläsningens upplägg. Lärostrategi. Nödvändig studiekompetens

TYS B11: Tyska nybörjarkurs, 30 högskolepoäng Studiebeskrivning

Hur gör vi då för att segmentera och kategorisera ljud i talspråk?

Progressionen i teknikämnets centrala innehåll

Utdrag ur protokoll vid sammanträde

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Generellt kan vi säga att för att vi ska värdera ett argument som bra bör det uppfylla åtminstone följande kriterier:

Betygskriterier. CT120U, Svenska som andraspråk för gymnasielärare, 90 hp. Ingår i Lärarlyftet II.

Föreläsning 8: Intro till Komplexitetsteori

Utdrag ur protokoll vid sammanträde

Målet är att ge maskiner förmågan att plocka ut information ur

Kommunikation. En aptitretare från VisVires AB

Markus 3:29 Men den som hädar den helige Ande får aldrig någonsin förlåtelse utan är skyldig till evig synd.

Delprov A. Språkform och språknorm (2014) RÄTTNINGSMALL

Lingvistik III - Morfem och morfologi

Lingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson

Fastställande. Allmänna uppgifter. Kursens mål

Psykolingvistik. Kognitionspsykologi, Klas Karlgren Kapitel 11 och 12 i Anderson

Maskinöversättning 2008

Transkript:

Flerordsenheter: Så många frågor, så få svar Lars Borin Flerordsworkshop 19/3 2013

några centrala frågor Vilken sorts ord är det flera av? Ska de beskrivas som en sorts lexikonenheter eller en sorts syntaktiska enheter (eller båda eller något annat)? Vilka sorters flerordsenheter finns det? Hurdan är deras typologi: Finns de i alla språk i samma omfattning? Hur tar man reda på det? Hur ska man avgränsa dem så att man kan känna igen dem, räkna dem, etc.?

ord?? ortografi fonologi grammatik betydelse frekvens? kassaflöde cash flow? vidpass vid pass;? smälla av åka tåg;? wil inte köpat, om jag icke fåret för gott köp (Samuel Columbus)? finska rakennuttamallakin också genom att låta bygga? fijianska taa-niu-se-bu a hugga-kopra-eller-ved (jfr. Anderson 1985; Aikhenvald 2007)

behöver man ens bry sig om dem? Flerordsenheter (= sekvenser av ortografiska ord) som andel av tillagda ingångar i SALDO (exklusive tillägg av Lennart Lönngren): år totalt flerordingar % 2011 3458 1171 34 % 2012 1088 488 43 % 2013 150 76 50 % (Jfr. Jackendoff 1997)

avgränsningar kategorier Sag et al. (2001) ställer upp följande kategorier: institutionaliserade fraser (kompositionella, men statistiskt avvikande) lexikaliserade fraser (i varierande grad idiosynkratiska): 1. fasta uttryck 2. halvfasta uttryck 3. syntaktiskt flexibla uttryck Deras ordkriterium är ortografiskt och de bryr sig bara om engelska, vilket betyder att Compound nominals such as car park, attorney general and part of speech för dem är flerordsenheter (trots att compound annars är en term som hör hemma inom morfologin)

typologi? WALS (Dryer/Haspelmath 2011; <http://wals.info>) har inget kapitel om flerordingar (även om det kanske gömmer sig relevant information under rubriker som Periphrastic causative constructions ) men flerordingar är underbeskrivna för enskilda språk, så det finns inget bränsle för typologiska generaliseringar (undantaget är enskilda konstruktionstyper, som komplexa predikat/stödverbskonstruktioner) Har t.ex. ett språk som grönländska överhuvudtaget flerordingar och vilka i så fall? Hur hör flerordsenheter och grammatikaliseringsprocesser ihop?

vilka ontologiska åtaganden gör vi?

och hur verifierar vi dem?

cargokulten lurar alltid runt hörnet

lexikon syntax? få fenomen som inte någonstans i något språk också är morfologiska: diskontinuerliga komponenter multipel exponens inre böjning infigering inkorporering (även av fraser) (jfr. Nida 1949; Jensen 1990; Anderson 1985; Aikhenvald 2007) men bara i ytterst begränsad omfattning omkastbarhet Detta innebär en stor frihet: Om man vill kan man beskriva många svenska flerordstyper som ord med hål utan att gå utanför vad som är möjligt inom ordet (i ett tvärspråkligt perspektiv)

flerordsenheter: gungor eller karuseller? Det är viktigt att komma ihåg att språkbeskrivning kan ses som ett slags nollsummespel, så länge som vi inte har språkoberoende sätt att studera vår språkförmåga Det finns ett ömsesidigt beroendekomplex i beskrivningen som involverar bl.a. lexikalisk betydelse syntagmatisk betydelse kontextuell och situationell tolkning de lexikaliska betydelsernas finhetsgrad begreppet ord flerordingar enordingar lexikonenheternas ordklassfördelning kompositionalitet

identifikation och användning språkteknologiskt finns (åtminstone) tre typer av problem med flerordingar: 1. identifiering av flerordingskandidater 2. formell beskrivning av flerordingarna 3. användning av beskrivningen vid språkanalys (och -generering) med identifieringen har man kommit en god bit på väg (t.ex. Pecina 2010; Green et al. 2013) i beskrivningen har man som sagt många frihetsgrader och det finns följaktligen flera bud om hur den bäst bör göras användningen är (av naturliga skäl) eftersatt