Introduktion till språkteknologi språk och kognition

Relevanta dokument

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Writing with context. Att skriva med sammanhang

English. Things to remember

Kognitiv psykologi. Kognition och hjärnan. Hjärnans struktur Neurokognition Kap 2

Discovering!!!!! Swedish ÅÄÖ. EPISODE 6 Norrlänningar and numbers Misi.se

Lektion 3. Anteckningar

Psykolingvistik. Kognitionspsykologi, Klas Karlgren Kapitel 11 och 12 i Anderson

Vad kan biologiskt plausibla modeller säga oss?

Ordinarie tenta i Psykiska funktioner och deras biologiska bas: Del 3 (kognition), Psykologprogrammet, Tl, den 13 maj 2016 (PS3100:0372)

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

Språkmöte främjar hjärnan. Emanuel Bylund Centrum för tvåspråkighetsforskning Stockholm universitet

Wittgenstein for dummies Eller hur vi gör det obegripliga begripligt. Västerås 15 februari 2017

Användning av Erasmus+ deltagarrapporter för uppföljning

The Arctic boundary layer

Workplan Food. Spring term 2016 Year 7. Name:

Språkpsykologi/psykolingvistik

Unit course plan English class 8C

Neurovetenskap 30/08/2013. Kognitiv neurovetenskap. Lober. Olika färg, olika vävnadsstruktur. Hjärnbarken

Hur vet vi att något är begripligt?

Dålig hörsel kan leda till demens

Tekniker för storskalig parsning

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

729G09 Språkvetenskaplig databehandling

Britta Larsson Lindberg, specialpedagog Lärare i svenska, engelska och franska Specialpedagog, Ängkärrskolan

Isolda Purchase - EDI

Språket, individen och samhället VT08

Omtenta i Psykiska funktioner och deras biologiska bas: Del 3 (kognition), 7,5 bp Psykologprogrammet, T1, den 6 februari 2016 (PS3I00:0372)

Chapter 1 : Who do you think you are?

Kristina Säfsten. Kristina Säfsten JTH

Att skriva en matematisk uppsats

Kognition. Kognition, interaktion och användare. Överblick - kognition. Data-information-kunskap. Nivåer av kognition. Dä ä bar å åk.

Kvällens litteratur. Tvåspråkighet VT07. Lite inledande saker. Kvällens upplägg. 1. Ettspråksmodellen

samhälle Susanna Öhman

Minnesfunktioner hos barn med språk- och lässvårigheter

Mot hållbar elbilsanvändning

Blueprint Den här planeringen skapades med Blueprints gratisversion - vänligen uppgradera nu. Engelska, La06 - Kursöversikt, 2015/2016.

Teknikprogrammet Klass TE14A, Norrköping. Jacob Almrot. Självstyrda bilar. Datum:

Pluggande och musiklyssning hur ljudmiljöer påverkar. läsprocessen och läsförståelsen

Disposition. En definition av språk. Att bygga ett språk en stor uppgift för en liten människa. Disposition DEFINITION. Språkets olika delar

Neurosensomotorik och kognition. Ögon- och hållningstränings påverkan på perception och koncentration

Språkliga uttrycks mening

Grundläggande textanalys. Joakim Nivre

Lokal arbetsplan i engelska. Lokal planering i engelska år 2

Kognitiv Psykologi HT11 Språk, föreläsning 1

b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)

Cristina Eriksson oktober 2001

Libers språklåda i engelska: Spel och lekar (7 9)

TDDB96 Projekt: Object priming med visuell stimuli

Preschool Kindergarten

Linköpings universitet

FTEA21:3 Spr akfilosofi F orel asning III Martin J onsson

Grammar exercises in workbook (grammatikövningar i workbook): WB p 121 ex 1-3 WB p 122 ex 1 WB p 123 ex 2

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

Capabilities for Education, Work and Voice from the Perspective of the Less Employable University Graduates.

Anhållan om ändrad ersättning för vissa HST

Att definiera och mäta samhällseffekter. Sara Modig och Åsa Minoz 22 januari 2015

Anders Jönsson Teknisk Audiolog Lunds universitet

Grammatiska metaforer i engelskan och hur de översätts till svenska. Lene Nordrum Engelska institutionen Göteborgs universitet

Mödradödlighet bland invandrarkvinnor

Livskvalitet hos äldre: Att jämföra äpplen och päron?

FK Electrodynamics I

Minnet - begrepp och principer

Maskinöversättning möjligheter och gränser

Att utveckla en skriftspråklig förmåga och orsaker till lässvårigheter

Engelska, år Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa

FTEA21:3 Spr akfilosofi F orel asning II Martin J onsson

BOENDEFORMENS BETYDELSE FÖR ASYLSÖKANDES INTEGRATION Lina Sandström

Mentalträning GUSK PA, säsongen 2012

HUME HANDOUT 1. Han erbjuder två argument för denna tes. Vi kan kalla dem "motivationsargumentet" respektive "representationsargumentet.

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk

Betygskriterier. US610F - Språkdidaktik I, 30 hp

FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång

Webbtillgänglighet. Tillgänglighet på webben. Hörselskadades behov. Synskadades behov. Kognitivt funktionshindrades behov. Rörelsehindrades behov

Hur leder vi transformationer?

Grafisk visualisering

Att stödja starka elever genom kreativ matte.

Skolutveckling pågår! Kollegialt lärande på Blackebergs gymnasium läsåret 2015/16

Aktuellt om läs- och skrivsvårigheter/dyslexi

CARRY YOU HOME. I've been knocked down, I've been lost With the ground shaking under my feet I gave it all to someone, who'd said fire, run

Kognition, interaktion och användare. Översikt. Kognition. Henrik Artman. Introduktion till kognitionsvetenskap

FTEA21:3 Spr akfilosofi F orel asning VIII Martin J onsson

Vilka typer av matematiska resonemang (ut)värderas i skolmatematiken?

FORSKNINGSKOMMUNIKATION OCH PUBLICERINGS- MÖNSTER INOM UTBILDNINGSVETENSKAP

Pragmatisk och narrativ utveckling

Styrteknik: Binära tal, talsystem och koder D3:1

Neurokognitiv arkitektur

Grammatisk teori III Praktisk analys

Visuell perception. Sidan 1. Översikt. Sammanfattning av förra föreläsningen. Kognitiv arkitektur. Visuella systemet: översikt.

Det åldrande minnet. Lars Bäckman Aging Research Center, KI

Läs- och skrivsvårigheter och dyslexi

PÅSKEN I LJUSET AV BIBELNS STORY

Begrepp i handledningsteori

Teoretisk lingvistik och datalingvistik. Robin Cooper

VARIOBARRIER S/M MIMSAFE BY CHOICE

Fortbildningsavdelningen för skolans internationalisering. Dossier 3. European Language Portfolio 16+ Europeisk språkportfolio 16+ English version

Tillgänglighet. Checklistan baseras på utvalda delar av Arbetsmiljöverkets föreskrifter (AFS):

Handling för hållbarhet!

Autism en introduktion

Interaktionsteknik. Föreläsning 6, Kognition perception. Översikt. Vad händer i medvetandet?

Transkript:

Introduktion till språkteknologi språk och kognition We have made little headway in computational psycholinguistics, which to me has always been the nub, the center, the thing that computational linguistics stood the greatest chance of providing to humanity. To build models of language that reflect in some interesting way on the ways in which people use language. There has been some wonderfully interesting work on such matters, but not nearly enough. I am sorry that it has not been pursued as earnestly as I think it could but it is a difficult field and perhaps that is enough reason in itself. Martin Kay, Lifetime achievement award acceptance speech, Association for Computational Linguistics 2005 Mattias Nilsson mattias.nilsson@lingfil.uu.se

Psykolingvistik Centrala frågeställningar: Hur förstår människor språk? Hur producerar människor språk? Hur lär människor sig språk? Vilka kognitiva processer möjliggör språkförståelse, språkproduktion och språkinlärning?

Experimentell psykolingvistik Kontrollerade experiment; observation av stimuliresponsbeteende Reaktionstid (RT) är en central variabel: uppmätning av tiden mellan det att ett lingvistiskt stimuli presenteras och personens reaktion på detta stimuli. RT mäts i millisekunder Reaktionstid antas reflektera kognitiv processtid, dvs. tid för ordigenkänning, syntaktisk parsning etc. Hypoteser om språkprocesser ställs utifrån förhållandet mellan stimuli och reaktionstiden

Kognitiv modellering Syfte: formulera matematiska modeller av de kognitiva processer som antas ligga till grund för språkanvändning. Experimentell evidens kringskär modellernas utformning. En modell kan implementeras i form av datorprogram som simulerar någon form av mänsklig språkprocessning Modellen utvärderas med avseende på hur väl den simulerar eller förutsäger experimentell data

Experimentella tekniker Event-related potentials (ERP) Elektrofysiologiska korrelat till neurala processer i hjärnan Med hjälp av elektroder som fästs i hårbotten mäts den elektrofysiologiska aktiviteten i hjärnan under tiden stimuli presenteras. Ger en detaljerad bild av lokaliserade aktivitetsmönster i hjärnan från det att ett ljud eller ord når innerörat tills dess att försökspersonen uppfattat innebörden i ljudet/ordet.

Experimentella tekniker Event-related potentials (ERP) (forts.) P400-effekt: En stark semantisk avvikelse ger lokaliserat utslag ca. 400 msek. efter avvikelsen, i förhållande till en neutral kontrollmening N600-effekt: En stark syntaktisk avvikelse (grammatiskt fel) ger lokaliserat utslag ca. 600 msek. efter avvikelsen, i förhållande till en neutral kontrollmening

Experimentella tekniker Event-related potentials (ERP) (forts.) (a) Person wearing electrodes for recording of event-related potential. (b) The N400 wave of the ERP is affected by semantics. It becomes larger (dark line) when the meaning of a word does not fit the rest of the sentence. (c) The P600 wave of the ERP is affected by syntax. It becomes larger (dark line) when syntax is incorrect. (From Osterhout et al, 1997.)

Experimentella tekniker Eye tracking Inspelning av ögonrörelser under tiden stimuli presenteras, t.ex. vid läsning av en text Två typer av information registreras i detalj: 1. Vilka ord som fixeras med blicken 2. Hur länge varje ord fixeras Den tid som ett ord fixeras antas delvis motsvara den tid det tar att kognitivt processa ordet Strong eye-mind assumption [Just & Carpenter 1980]: There is no appreciable lag between what is fixated and what is processed

Experimentella tekniker Eye tracking An example of fixations and saccades over text. This is the typical pattern of eye movements during reading. The eyes never move smoothly over still text.

Språkförståelse Central frågeställning: Hur kan den mänskliga hjärnan avkoda språkliga meddelanden så effektivt som den gör? Delproblem: Hur avkodas den syntaktiska strukturen (parsning)? Hur avkodas det semantiska innehållet?

Om mänsklig parsning En vanlig metod för att studera hur den mänskliga parsningsmekanismen fungerar är att studera extremfall där parsningen faktiskt misslyckas Det är möjligt att framkalla sådana extremfall med vissa typer av språkkonstruktioner och sedan studera eller mäta de empiriska effekterna med t.ex. ERP eller eye-tracking

Garden path sentences Vad är en garden path sentence? En mening som innehåller en lokal grammatisk flertydighet där människor oftast väljer fel grammatiska analys. Som konsekvens därav blir meningen svårbegriplig. Detta manifesteras empiriskt i exempelvis eye-tracking med bakåtgående ögonrörelser till tidigare ord i meningen samt allmänt längre fixationstider

Exempel The

girl

told

the

story

cried

The

old

man

the

boats

John

said

Bill

will

die

yesterday

Fler exempel: # Since John always jogs a mile seems short. # After the student moved the chair broke. # While she was knitting the sock fell. # The horse raced past the garden fell. Några svenska exempel: # Poliserna lurade på bytet åkte hem. # Jag vet vem du menar säger så. # Han gav en bok till samma titel. # Ordföranden för Kommunal bakom ljuset. # Pojken bet hunden inte.

Garden-pathing och mänsklig parsning Vad säger garden-path-meningar om mänsklig parsning? Avkodningen sker omedelbart, ord för ord: vi väntar inte tills slutet av en mening innan vi börjar tolka den Det tycks finnas vissa strukturella principer för hur parsningen bygger syntaktisk struktur: Minimal attachment Late closure

Minimal attachment Bygg den enklast möjliga strukturen Vi väljer att göra den grammatiska analys som innehåller minst antal noder (i ett frasstrukturträd), allt annat lika. # The girl told the story cried Den felaktiga avkodningen där verbet told analyseras som huvudverb innehåller färre noder än den korrekta analysen (där told the story cried är en reducerad relativsats).

Late closure Bygg inte nya noder i onödan Vi avkodar en ny frasnod som del av den aktuella konstituenten (den som är under uppbyggnad), allt annat lika: 1. John said Bill died yesterday 2. # John said Bill will die yesterday

Kognitivt arbetsminne och språkprocessning Med det kognitiva arbetsminnet avses den minneskomponent där det omedelbart nära lagras i medvetandet Vi använder arbetsminnet till exempel i en situation där vi hör en rad siffror och sedan genast ombeds upprepa dem Man tror att ordbetydelser lagras i ett långtidsminne där de hämtas under parsning, och sedan sätts samman i arbetssminnet under den syntaktiska processen

Minne och mänsklig parsning En del meningar som inte är flertydiga är ändå svåra att förstå: Råttan pep. Råttan som katten fångade pep. # Råttan som katten som hunden jagade fångade pep. # Råttan som katten som hunden som pojken visslade på jagade fångade pep. Vad gör mening 3 och 4 obegripliga?

Minne och mänsklig parsning Man menar att svårigheten med dessa satser beror på människans begränsade arbetsminne Man antar att inbäddade strukturer av detta slag kräver större minnesutrymme än vad som finns tillgängligt Tre (resp. fyra) på varandra följande substantiv utan verb måsta hållas aktuella innan vi kan föra verben till dess substantiv. I de fall vi inte behöver hålla en mängd substantiv i minnet så blir det heller inga problem med begripligheten: Hunden jagade katten som fångade råttan som pep. Pojken visslade på hunden som jagade katten som fångade råttan som pep.

Minne och mänsklig parsning Flera studier visar att det tar längre tid att läsa mening 1 jämfört med 2: 1. The reporter who the senator attacked admitted the error 2. The reporter who attacked the senator admitted the error Möjlig förklaring: I mening 2 behöver vi aldrig hålla mer än ett substantiv (en nominalfras) i minnet åt gången.

Minne och mänsklig parsning Vi tycks använda vårt kognitiva arbetsminne då vi avkodar grammatisk struktur. Detta minne rymmer endast lite information åt gången. Svårbegriplighet uppstår när vi måste hålla flera konstituenter i arbetsminnet över längre tid. Detta manifesteras empiriskt bl.a. i längre lästid och större hjärnaktivitet

Kritik mot rådande modeller av mänsklig parsning Modellerna utgår från extremfall då parsningsprocessen misslyckas. Sådana typer av extremfall är dock mycket sällsynta i verkligt språkbruk. Modellerna kan inte förklara det faktum att språkprocessning är korrekt, robust och effektivt under normala omständigheter. En modell av språkprocessning bör inte utgå från patologiska särfall utan istället från det faktum att språkmekanismen är extremt effektiv i normalfallet.

Statistiska modeller av mänsklig parsning Målsättning: Bygg modeller som är effektiva och robusta i normalfallet men som avkodar fel på precis samma ställen som människor gör Metod: Korpusdata; statistisk parsning; mest sannolika avkodningen givet vår lingvistiska erfarenhet (korpusevidens)

Statistisk information influerar mänsklig språkprocessning En erfarenhetsbaserad (sannolikhetsbaserad) modell kan förutsäga många empiriska effekter: Lågfrekventa ord i en mening fixeras längre tid än högfrekventa ord Ord som är relativt förutsägbara i en viss kontext fixeras kortare tid än mer oförutsägbara ord Korta, högfrekventa och förutsägbara ord i en mening fixeras ofta inte alls Lågfrekventa syntaktiska strukturer genererar ibland regressiva ögonrörelser till tidigare ord i meningen

Matematiska modeller av ögats rörelse vid läsning Bakgrund: Ögonrörelser uppfattas som en detaljerad reflektion av pågående kognitiva språkprocesser Om vi kan simulera eller förutsäga människans ögonrörelsemönster vid textläsning fångar vi troligtvis också mycket av den språkliga process som ger upphov till dessa rörelser Mål: Givet en text som input till modellen, låt modellen förutsäga vilka ord som fixeras och under hur lång tid (i millisekunder), i nära approximation till mänskligt läsbeteende. Utvärdera modellens läsögonrörelser mot riktig eye-tracking data

Matematiska modeller av ögats rörelse vid läsning Två typer av modeller: 1. Perceptuella kontrollmodeller: ögonrörelser styrs främst av textens visuella egenskaper; ordens längd avgör lässtiden 2. Kognitiva kontrollmodeller: ögonrörelser styrs främst av språkliga processer; ordens relativa frekvens och förutsägbarhet avgör lästiden Experimentell evidens: ögonrörelser styrs av en kombination av perceptuella och kognitiva faktorer

Kognitiva modeller och språkteknologi På vilket sätt kan kognitiva modeller förbättra språkteknologiska tillämpningar? Läsbarhet och begriplighet; uppskattning av texters svårighetsgrad, anpassning av texters innehåll och struktur till människans kognitiva förmåga och begränsningar Effektiva parsningsmodeller; omedelbar avkodning av input Tekniska stöd för människor med olika typer av språklig funktionsnedsättning, t.ex. läs-, skriv- och talsvårigheter, dyslexi, afasi, syn- och hörselnedsättningar