Fragment, ellipser och informationsberikade konstituenter Pragmatik VT06 Påminnelse från förra gången 1. (a) Vad läser du? GR(OUND) F(OKUS) 2. (a) Vem läser Wittgenstein? F GR 3. (a) Vad gör du med Wittgenstein? GR F GR Fokus, ground och bas (1) 1. (a) Vad läser du? Ground Fokus Bas: den del av kontexten som ground reflekterar Fokus, ground och bas (2) 2. (a) Vem läser Wittgenstein? 3. (a) Vad gör du med Wittgenstein? Informationsstruktur och dialog (1) När vi pratar, ser det verkligen ut såhär? A: Vad läser du? B: Jag läser Wittgenstein Informationsstruktur och dialog (2) Ser det inte snarare ut såhär: A: Vad läser du? B: Wittgenstein 1
Informationsstruktur och dialog (3) B s yttranden nedan innehåller bara fokus, ingen ground: (1) A: Vad läser du? B: Wittgenstein (2) A: Vem läser Wittgenstein? B: Jag Basen ger här det kontextuella ankaret ingen ground behövs Kärt barn har många namn (1) Yttranden som Wittgenstein ovan studeras under olika namn Ellips Gammal term, användes redan av romarna Används idag ganska generellt, förmodligen den mest kända termen Signallerar att något fattas, och framförallt att något har tagits bort Används speciellt i syntaktiska sammanhang: Ex. Edith läser Wittgenstein, Judith Levinson. Kärt barn har många namn (2) Inom dialogforskning har man vänt sig mot att ellips pekar på att något fattas I dialog är det snarare så att fullständiga meningar inte behövs Några alternativa termer inom dialogforsking: Fragment Korta yttranden Informationsberikade konstituenter Kärt barn har många namn (3) Informationsberikade konstituenter Ericsson (2005) Pekar på att dessa dialogfenomen inte saknar något, utan snarare använder kontexten på ett smart sätt Fragment och korta yttranden verkar fortfarande implicera att något fattas, nästan som ellips Kärt barn har många namn (4) Korta yttranden Används här på institutionen, av Allwood m.fl Används även för en rad andra fenomen än de som vi tittar på idag, exempelvis återkoppling som mhm Fragment En ganska vanligt förekommande term inom dialogforskning Den term vi kommer använda idag Fragment och non-sententials Ibland används termen nonsententials för fragment Fragment kan dock vara hela meningar A: Varför läser du aldrig något annat än Wittgenstein? B: Han är så fantastiskt bra 2
Två typer av fragment Ett fragment kan bestå av enbart fokus: A: Vem läser Wittgenstein? B: Jag Det kan också bestå av fokus och en partiell ground: A: Hur många böcker är det där? B: Tre böcker innehåll (1) A: Vem läser Wittgenstein? B: Jag Kompositionellt innehåll för B s yttrande: jag Kontextuellt innehåll för B s yttrande: jag läser wittgenstein innehåll (2) A: Hur många böcker är det där? B: Tre innehåll (3) A: Hur många böcker är det där? B: Tre böcker Kompositionellt innehåll för B s yttrande: tre Kontextuellt innehåll för B s yttrande: det där är tre böcker Kompositionellt innehåll för B s yttrande: tre böcker Kontextuellt innehåll för B s yttrande: det där är tre böcker innehåll (4) A: Hur många böcker är det där? B: Det där är tre böcker Kompositionellt innehåll för B s yttrande: det där är tre böcker Kontextuellt innehåll för B s yttrande: det där är tre böcker innehåll (5) Kompositionellt innehåll av ett yttrande: Innehållet av det som sägs För ett fragment består detta av enbart fokus eller fokus + partiell ground Kontextuellt innehåll av ett yttrande Innehållet av hela ground-fokus 3
innehåll (6) Med andra ord: Ett fragment har ett kompositionellt innehåll som är mindre än det kontextuella innehållet Ett fragments kompositionella innehåll består antingen av enbart fokus eller fokus och en partiell ground Ett fragments kontextuella innehåll består alltid av fokus och hel ground innehåll (7) Ett icke-fragment har ett kontextuellt innehåll som är lika med dess kompositionella innehåll Ex. fokus-ground: A: Vad läser du? B: Jag läser Wittgenstein Ex. all-fokus (se äv. förra föreläsn.) : (ingen fråga, eller frågan Vad händer? ) B: Jag läser Wittgenstein Ett långt exempel (1) B1: Wittgenstein B1 : Edith läser Wittgenstein A2: Och Judith? A2 : Och vad läser Judith? B2: Levinson B2 : Judith läser Levinson Ett långt exempel (2) Början av dialogen, ett all-focusyttrande Ett långt exempel (3) B1: Wittgenstein B1 : Edith läser Wittgenstein B1 ett fragment, består av enbart fokus B1 inte ett fragment, består av fokus och full ground Ett långt exempel (4) B1: Wittgenstein B1 : Edith läser Wittgenstein A2: Och Judith? A2 : Och vad läser Judith? A2 ett fragment A2 inte ett fragment Judith i A2 och A2 är ett kontrastivt fokus, kontrasterar med Edith 4
Ett långt exempel (5) av fragment och informationsstruktur B1: Wittgenstein B1 : Edith läser Wittgenstein A2: Och Judith? A2 : Och vad läser Judith? B2: Levinson B2 : Judith läser Levinson B2 är ett fragment B2 är inte ett fragment Fragment och informationsstruktur i korpusar Korpusar: GSLC (svenska, blandade aktiviteter) Stockholm Corpus of Spoken Swedish (svenska, kartuppgiftsdialoger) SRI s Amex Travel Agent Data (amerikansk engelska, resebyrå) HCRC Map Task Corpus (skotsk engelska, kartuppgiftsdialoger) Office du tourisme de Grenoble (franska, turistbyrå) Corpus itinéraire (franska, vägbeskrivning) Metod: manuell genomläsning Icke-kontrastivt fokus [ Amex tape 6 call 1 ] C: At what time does it get to Toronto? TA: Three thirty five p.m. [ GSLC A5006011 ] D: Vem är det som har varit sjuk då? P: En nära släkting till min man Kontrastivt fokus [ GSLC A8207051 ] TA1: Hur mår din lilla Josefin? C1: Hon mår hyfsat TA2: Och Gabriella? Ground Tre typer kan identifieras i korpusmaterialet för icke-fragment: Identisk bas och ground Anaforisk ground Omformulerad ground Dessutom finns partiell ground för fragment 5
Identisk bas och ground [ OTG 1PF0052 ] C: Il est sorti quand? Sv. Den kom ut när? - När kom den ut? H: Il est sorti hier Sv. Den kom ut igår Anaforisk ground [ Amex tape 16 call 9 ] TA: What s the confirmation number? C: It s five three two nine Omformulerad ground [ Amex tape 3 call 2 ] TA: What day would he like to travel? C: He needs to go on Tuesday May 9th [ Amex tape 16 call 1 ] TA: What was it you needed to have changed? C: He wants to change United to US Air Partiell ground [ GSLC A3212011 ] A: Man kan ta, när man bakar mjuk pepparkaka man tar i bikarbonat B: Vanliga pepparkakor då? Komplex kontext Fragment i dialogsystem [ HCRC q2nc3 ] G1: Where are you in relation to the top of the page just now? F1: About four inches G2: Four inches? F2: Yeah G3: Where are you from the left-hand side? F3: About two 6
Introduktion Dialogsystem: ett datorprogram som låter människa ( användare ) och maskin ( system ) kommunicera med naturligt språk (som svenska, engelska) Fragment i dialogsystem Tolkning (av människans fragment) Generering (av fragment av systemet) Tolking och generering av fragment: utmaningar Tolkning av fragment Hur koppla ihop användaren fragment med rätt del av kontexten? Dvs, hur hitta det kontextuella innehållet, eller hur hitta rätt ground? Kontexten kan vara komplex Generering av fragment Hur bestämma informationsstrukturen för det som systemet ska säga? När ska man använda ett fragment och när inte? Tolkning av fragment XCALIBUR, Carbonell (1983) Naturligt-språk-gränssnitt till expertsystem Textbaserat Kommunikationen rör komponenten till VAX-datorer Tolkning av fragment XCALIBUR, Carbonell (1983) U1: What is the price of the three largest single port fixed media disks? S1:... U2: Speed? U2 : Two smallest? U2 : Also the smallest with dual ports U2 : Speed with two ports Tolkning av fragment XCALIBUR, Carbonell (1983) Innehållet av U1, i LISP: [ QUERY (OBJECT (SELECT (disk (ports (VALUE (1))) (disk-pack-type (VALUE (fixed))) (OPERATION (SORT (TYPE (*descending)) (ATTR (size)) (NUMBER (3))) (PROJECT (price)) ) (INFO-SOURCE (*default)) ] Tolkning av fragment ADAPT, Boye et al. (2004) Diskuterar egenskaper hos lägenheter till salu i Stockholm Multimodalt gränssnitt Användaren kan prata eller peka på en skärm Systemet pratar och visar på skärmen 7
Tolkning av fragment ADAPT, Boye et al. (2004) U1: Are there any two-room apartments on the South Side that cost less than 2 million? S1: Do you have any other requirements? U2: A balcony would be nice. S2: [Displays coloured icons on the map] There are seven such apartments. They are shown on the map. U3: I see... The green apartment... how much does it cost? S3: The green apartment costs 1.5 million. U4: What about the red one? S4: The red apartment costs 1.9 million. Generering av fragment: några aspekter Fragment är effektiva, naturliga, vänliga Icke-fragment mer formella/artiga/tydliga än fragment Ground-fokus kan användas vid kommunikationsproblem Ground-omformulering eller introduktion av betydelseskillnader Lätt ground kan användas för variation 8