LITE OM SEMANTIK I DATORLINGVISTIKEN (FORMELL SEMANTIK) Vad är semantik? Form (abstrakt struktur): grammatik Innehåll (betydelse): semantik Användning: pragmatik/diskurs Mats Dahllöf Språkteknologisk motivation Frågeställningar Grundläggande idéer 1 2 Språkteknologi semantik översättning innehållsklassifikation dokumentsökning kunskapsformalisering data mining frågebesvarande system dialogsystem Frågesbesvarande Efter Linnés död bodde hans änka Sara Lisa permanent på Hammarby till sin död 1806. Gården fanns i familjens ägo tills 1879 då staten köpte Hammarby med Uppsala universitet som förvaltare. [Bakgrund: L dog 1778. Förutsatt: Inga ägarskiften efter 1879.] Var Linné gift? Vem bodde på Hammarby 1804? Vem ägde Hammarby 1850? Vem äger Hammarby idag? resonerande - förståelse 3 4
Logik & semantik Logisk slutledning (inferens): premisser - slutsats Om premisserna alla är sanna, så måste slutsatsen vara sann. Exempel: Alla botaniker beundrar Linné. Pelle är inte en botaniker. INTE EN LOGISK SLUTLEDNING: Alla botaniker beundrar Linné. Pelle är inte en botaniker. Logik & semantik II Logisk slutledning. Exempel: Ingen beundrar Linné. Pelle beundrar inte Celsius. Någon beundrar varken Linné eller Celsius. Pelle är inte botaniker. INTE EN LOGISK SLUTLEDNING: Pelle beundrar inte Celsius. Pelle beundrar inte någon. (övergeneralisering) 5 6 Pragmatisk slutledning NYHETSNOTIS (påhittad) Två bilar krockade igår på E4. Den ene föraren blev lindrigt skadad. De materiella skadorna var betydande. SLUTSATS : Ingen dog i olyckan. Följer ej logiskt, utan pragmatiskt, utifrån principer om kommunikation. Normalt i samtal/text: Säg det viktiga före det mindre viktiga! Pragmatisk slutledning II Den utpekade terroristledaren Usama bin Ladin tros befinna sig inom ett 70 kvadratkilometer stort område 13 mil öster om Kandahar i södra Afghanistan. Brittiska och amerikanska soldater har landsatts i området, uppger brittiska medier. (SvD 011118) Slutsatser : Osäkerhet i flera fall. Underförstått motiv: Soldaterna söker UbL. Underförstådd exklusion: Uteslutande brittiska och amerikanska soldater. 7 8
Naturligt språk Rika uttrycksmöjligheter Bland dem som Pelle beundrar finns inte Linné. Linné är inte en av dem Pelle beundrar. Pelle är inte någon Linnébeundrare. Linné är inte föremål för Pelles beundran. Naturligt språk Flertydighet strukturell flertydighet gröna äpplen och päron apelsiner och citroner från Italien Han slog mannen med hammaren. Alla lingvister kan två språk. lexikal flertydighet kurs ben svin förlägga häftig 9 10 Aristoteles logik 4 typer av utsagor Alla A är B. (A) Någon A är B. (I) Syllogism Mönster för korrekt slutledning från två premisser Exempel: Ingen A är B. (E) Någon A är inte B. (O) Alla människor är dödliga. (A-typ) Alla botaniker är människor. (A-typ) Alla botaniker är dödliga. (A-typ) ( Barbara A-A-A kallas denna.) A, E, I, O systematiken m n X Y Alla X är Y. (A) Ingen X är Y. (E) m är tom n är tom Någon X är Y. (I) Någon X är inte Y. (O) n är inte tom m är inte tom 11 12
Modern logik & semantik Frege (1879) idag predikatlogik Alla A är B. alla-x [om A(x) så B(x)] x A x B x Någon A är B. inte alla-x [om A(x) så inte B(x)] x A x B x Ingen A är B. alla-x [om A(x) så inte B(x)] x A x B x Någon A är inte B. inte alla-x [om A(x) så B(x)] x A x B x Slutledning/predikatlogik Alla botaniker beundrar Linné. Pelle är inte botaniker. x B 1 x B 2 x l B 2 p l B 1 p l: Linné (individ) p: Pelle (individ) B 1 : botaniker (egenskap 1-ställig) B 2 : beundrar (relation 2-ställig beundrare/beundrad) 13 14 Principer Satser har ett sanningsvärde, sann eller falsk. (materiell) implikation P Q P Q sann sann sann sann falsk falsk falsk sann sann falsk falsk sann negation P P sann falsk falsk sann Mekanisk slutledning x B 1 x B 2 x l (1, premiss) B 2 p l (2, premiss) Instantiering av (1) [x blir p, bort]: (det som gäller alla gäller även Pelle): B 1 p B 2 p l (3) Generell princip ( modus tollens ): Ur P Q och Q följer P Modus tollens på (3) och (2) ger: B 1 p Bevis som kan produceras/kollas av en maskin! 15 16
Semantik sanning Att veta vad en sats betyder är att veta hur världen måste vara beskaffad för att satsen skall vara sann. Betydelse är sanningsvillkor. Andra uttrycks betydelse analyseras i termer av deras bidrag till satsbetydelser. Semantisk analys Översättning av naturligt språk till logisk formalism underlättar/möjliggör resonerande. Sats > Naturligt språk semantisk analys > formel Logisk formalism Kompositionalitet (Freges princip) I naturligt språk: varje sammansatt uttrycks betydelse skall kunna gå att räkna ut utifrån delarnas betydelser (och kombinationssätt). 17 18 Lexikal semantik Struktur inom lexikala begrepp. Definition av änka: X är/var en änka vid tidpunkten t om och endast om X är en kvinna och det existerade en person Y, sådan att Y var gift med X vid tidpunkten u och Y dog vid tidpunkten u och u t (u kommer före t). Lexikala relationer Synonymi pojke, gosse, kille, grabb flicka, tös, tjej sak, pryl, grej pengar, kosing, stålar, medel Hyponymi människa överordnat man, kvinna, kille, tjej hund överordnat tax, boxer, schäfer musik överordnat jazz, hip-hop, schlager fordon överordnat bil, cykel, moped 19 20
Lexikala relationer Typer av motsatser Artmotsats inomhus - utomhus levande - död djur - växt Gradmotsats stor - liten fattig - rik vacker - ful snäll - elak 21 Lexikala relationer Polysemi Flera betydelser hos samma ord ben extremitet leg möbel- leg skelett- bone tak inner- ceiling ytter- roof färg egenskap colour materiell paint politisk colour 22 Lexikala relationer Flera ord en form: homonymi får ur lock (löser sig med grammatik) bok (löser sig ibland med grammatik) ask lapp (liknar polysemi mer) 23