Verbmobil och dess dialoghantering

Storlek: px
Starta visningen från sidan:

Download "Verbmobil och dess dialoghantering"

Transkript

1 Linköpings Universitet Institutionen för Datavetenskap HKGBB0, Artificiell Intelligens Verbmobil och dess dialoghantering

2 Sammanfattning Verbmobil var ett tvärvetenskapligt projekt under inom språkteknologi och ett samarbete mellan universitet, forskningscentrum och företag inom informationsteknologi. Chef över projektet var professor Wolfgang Wahlster vid det tyska forskningscentret för artificiell intelligens (DFKI) där också den mesta forskningen bedrevs. Samarbetet var dock internationellt med forskningsinstitut, universitet och företag även i Storbritannien, USA och Japan. Systemet översätter spontant tal till tal mellan tyska, engelska och japanska inom domänen för att boka möten, planera resor och göra hotellreservationer. Vad som är skiljer detta tal-till-talöversättningssystem från andra är att det tar hänsyn till kontexten och det semantiska innehållet samt prosodisk information. Det kan också producera en sammanfattning av dialogens viktigaste slutsatser.

3 Innehållsförteckning 1 INLEDNING BAKGRUND FAS FAS ÖVERSÄTTNING I ALLMÄNHET ANDRA PROJEKT JANUS MASTOR HUR FUNKAR VERBMOBIL DATAINSAMLING HUVUDDELARNA TRÄNING OCH UTVÄRDERING DIALOGHANTERING DIALOGAKTER OCH INNEHÅLLSFÖRSLAG DIALOGPROCESSEN SAMMANFATTNING REFERENSER...12

4

5 1 Inledning Det finns många områden inom artificiell intelligens (AI) såsom neurala nät (ANN), genetiska algoritmer eller case-based resoning vilket visar på bredden inom ämnet. AI berör inte bara matematik och datavetenskap utan även biologi, psykologi, lingvistik och filosofi. En generell definition av artificiell intelligens tänker jag inte försöka mig på då det skiljer sig lite mellan vilken forskning man inriktar sig mot eller om man är en anhängare av stark eller svag AI. Denna rapport berör området där datavetenskapen möter språkteknologi och hur man får datorer att översätta talat språk till ett annat talat språk. Jag kommer beskriva systemet Verbmobil vilket kan översätta spontant tal mellan tyska, japanska och engelska inom domänerna förhandla om möten, reseplanering och boka hotell. Jag kommer även fördjupa mig i en del av projektet som har med dialoghantering att göra och försöka förklara dess delar och hur det fungerar. Syftet med Verbmobil var att ta fram ett portabelt system som automatiskt kunde översätta spontant tal till ett annat språk. Man ville inte bara ta hänsyn till syntax och semantik utan även alla andra egenskaper hos spontant tal såsom tvetydigheter, självrättelser, tvekan och prosodi för att öka översättningens exakthet. Som namnet Verbmobil antyder, systemet stöder verbal kommunikation i mobila situationer. Jag börjar med en bakgrundbeskrivning till projektet och de två faserna. Sedan följer en sammanfattning över svårigheterna och frågeställningar kring översättning från tal till tal i allmänhet, följt av en kort beskrivning av två andra tal till tal system. Därefter kommer en redogörelse över Verbmobils huvudkomponenter och hur det egentligen fungerar, som avslutas med en fördjupning i dialoghanteringen. Slutligen sammanfattar jag det hela och diskuterar kring området. Jag har försökt använda svenska begrepp så långt det går, men ibland kan jag ha missat en del av betydelsen eller översatt fel pga bristande kunskaper inom området. I vissa fall står det engelska begreppet inom parantes. 2 Bakgrund 1 Verbmobil pågick under 1993 till 2000 och finansierades av det tyska förbundet för utbildning, vetenskap, forskning och teknologi (BMBF) samt andra intresseorganisationer och företag. Sammanlagt har det finansierats av 115 miljoner DM från BMBF och 51 miljoner DM från andra partners vilket motsvarar ungefär 740 miljoner SEK. Vad som är speciellt för det här projektet är det tvärvetenskapliga angreppssättet och att olika institut och universitet samarbetar med olika moduler av projektet. Vid ett tillfälle var det 33 forskningsgrupper som samarbetade och 135 enheter fördelade på dessa. Den vetenskapliga kontrollen sköttes av det tyska forskningscentrat för artificiell intelligens (DFKI) i Saarbrücken, där också den mesta forskningen bedrevs. Två gånger om året granskades milstolpar och vart annat år uppdaterades målen. En internationell opartisk vetenskaplig styrelse kontrollerade arbetet. Anledningen till bredden på projektet var att få med alla discipliner som behövs för att systemet ska bli så bra och fungerande som möjligt. Det handlar om datavetenskap, språkteknologi, översättningsvetenskap, signalbehandling, kommunikationsvetenskap och 1 Hela detta stycke refereras från Verbmobils hemsida om inget annat anges 1

6 artificiell intelligens. Med bredden följer också stora krav på att organisera projektet och även tekniska krav. Eftersom olika programmeringsspråk är bra på olika delar och det är uppemot 150 forskare och ingenjörer som samarbetar har man valt att använda språken C, C++, Lisp, Prolog, tcl/tk och Fortran som interagerar inom en objektorienterad mjukvaruarkitektur. 2.1 Fas 1 Projektet delades upp i två faser, den första och den andra från 1997 till och med september Den första fasen omfattade domänen att förhandla om möten kom det första fungerade systemet, Verbmobil Demonstrator, som presenterades under CeBIT. Systemet kunde känna igen tyskt talat input och hade en vokabulär på 1292 ord. Det kunde analysera tal och sedan översätta till engelska. Slutprototypen för fas 1 presenterades vid CeBIT 1997 och hade en vokabulär på 2500 ord. Det kunde även känna igen japanska och översätta till engelska med en vokabulär på 400 ord. I mindre omfattning kunde även den första fasens prototyp generera japanska. Samma parser används för input av tyska och japanska, men kunskapskällorna var olika, dvs syntax, semantik och lexikon. Systemet kunde också initiera kommunikation såsom Please raise your voice (var snäll och höj rösten) och känna igen felaktiga datum och tidsbegrepp såsom den 30 februari eller 4 p.m. in the morning (kl 16 på förmiddagen). Den första fasens prototyp klarade dock inte av spontant tal utan använde kommando för input, alltså sk push-to-talk knapp. Man använde en mikrofon vid input och processen tog mindre än 6 gånger längden av inputen. Prototypen testades med över översättningar och visade på en ungefärlig korrekthet (dvs intentionen upprätthölls) på 74,2 % av de föreslagna översättningarna. Ett exempel på hur dialogen kunde se ut: A: I guess we should meet in September. How about Deiday the first of Septemper? B: (Mouse click) Montag waere mir lieber (Mouse click). Vm: I would prefer Monday. A: Ok, so Moday the third. That s fine with me. What about 11 o clock? B: (Mouse click) Gut, wir treffen uns dann in meinem Buero (Mouse click) Vm: OK, so then we meet in my office. 2.2 Fas 2 I denna fas kan Verbmobil översätta spontana dialoger fram och tillbaka mellan tyska/engelska och tyska/japanska. Vokabulären är på ungefär ord mellan tyska och engelska. Det är fortfarande domänberoende inom ovan nämnda områden, men det är kontextkänsligt och känner automatiskt igen när samtalets innehåll ändras. Det är också känsligt för paralingvistiska fenomen såsom känslor och attityder som används vid översättningen. Slutprodukten styrs från en central server vilket innebär att det inte längre är beroende av input från en mikrofon utan man kan använda en vanlig telefon, GSM-telefon eller Internet istället. Man behöver alltså inte längre använda en push-to-talk knapp eftersom Verbmobil känner igen början och sluten på dialogturerna. Detta innebär att man kan använda Verbmobil för telefonkonferenser eller när man ringer någon från sin mobil till dennes mobil. Användarna kan dessutom be om ett utdrag av dialogen som skickas till en fax eller en . Verbmobil översätter ungefärligt korrekt i över 80 % av fallen och över 90 % för dialoguppgifter (Wahlster, 2000). Det tar Verbmobil ungefär dubbelt så lång tid att översätta som längden på inputet.

7 3 Översättning i allmänhet 2 Varför är det så svårt att översätta talat språk till ett annat språk och framförallt spontant talat språk? Nedan listas egenskaper för spontant tal som Verbmobil tar hänsyn till och klarar av i stora drag. - Överlappande tal mellan talarna. Verbmobil känner igen början och slut på dialogturer. - Talspråk istället för skriftspråk vilket innebär att man hoppar över vissa ord, dialektala skillnader, självrättelser (i Verbmobils korpus ca 20% av alla dialoger), småord som eh, uhm. - Talspråk har ingen kommatering. Satser byggs upp av betoningar och uppehåll istället. - Svårigheter att anpassa till nya talare. Verbmobil har en mängd metoder för att känna igen olika talare. Det kan gå snabbt vid fåordsyttringar, eller bli mer komplicerat vid långa turer. Man tar hänsyn till talarens akustiska egenskaper, hastigheten och uttalsskillnader såsom dialekter. Bilden nedan visar en konceptuell bild över svårigheterna med att bearbeta språk och översätta mellan språk. Verbmobil tillhör den nedersta delen eftersom det tar hänsyn till kontexten och har domänkunskap. Det förstår tal, om nu maskiner kan göra det, eftersom det listar ut talarens intentioner med vad hon säger, oavsett vilket sätt hon säger det på. Verbmobil kan också tolka tvetydiga ord till dess rätta innebörd i de flesta fallen. Figur 1. Nivåer av språkbearbetning där det blir mer och mer avancerat längre ner. 2 W. Wahlster (2000) om inget annat anges 3

8 4 Andra projekt Det är inte bara Verbmobil som forskar på tal-till-tal översättning. Användningsområdet är så pass stort och behovet av att förstå varandra utan att tala varandras språk har funnits länge. Verbmobil utgår från att de som ska prata med varandra förstår engelska bättre än vad de själva kan producera och därför använder man sig av engelska som något mellanspråk. Jag har stött på två liknande system, Janus som utvecklades före och under Verbmobil på universitet i USA och Tyskland, samt Mastor som IBM satsade på efter Verbmobil. 4.1 Janus 3 Ett av de största satsningarna av att översätta tal på ett språk till ett annat gjordes vid Carnegie Mellon University i USA i samarbete med Universität Karlsruhe i Tyskland där man har utvecklat ett system som kallas Janus II. Det kan översätta talat språk mellan engelska, tyska spanska, japanska och koreanska och är specialiserat på samtal som handlar om två personer som ska avtala ett möte. För detta krävs en vokabulär på mellan 3000 och 5000 ord beroende på vilken språk som används. Janus II tar ungefär dubbelt så lång tid på sig att översätta som normalt tal och tar hänsyn till det semantiska innehållet. Efter Janus II kom Janus III som är mer generell än föregångaren. 4.2 Mastor 4 IBM initierade 2001 något de kallar Mastor Multilingual Automatic Speech-to-Speech Technology. Då tekniken för text till tal redan finns utnyttjar IBM detta genom att de två som ska tala med varandra talar i var sin mikrofon som är anslutna till datorer. Mastor konverterar talet till text och översätter till det andra språket i text. Denna text visas på den andres bildskärm och datorn läser upp vad som står. Detta är utvecklat mellan engelska och mandarin och vokabulären innehåller över ord för båda språken inom domänerna resor, akuta medicinska diagnoser och försvarsinriktat skydd och säkerhet. Mastor används via en bärbar dator eller handdator och presenterades vid konferenser under Hur funkar Verbmobil 5 Systemet Verbmobil översätter alltså tal i realtid och vad som är speciellt med det är att det inte översätter mening för mening, utan är kontextberoende och utnyttjar betoningar i talet för att få bättre översättning tillsammans med ett minne för tidigare dialoger och domänkunskap. Det innefattar både djup och grund analys av tal med ett brett spektrum av korpusbaserade och regelbaserade metoder. Verbmobil använder resultat från maskininlärning av stora korpusar och lingvisters specialkunskap för att uppnå en tillfredsställande nivå av översättning. Jag ska här ge en översiktsbild över huvudkomponenterna i systemet och vad som händer mellan input och output, men först en beskrivning över datainsamlingen. 5.1 Datainsamling En signifikant del i Verbmobilarbetet var att samla in statistisk data att utgå ifrån och liksom de flesta delar var detta ett omfattande arbete. Man spelade in 182 timmar dialog med Gärdenfors (1997) från hemsida 4 Atrikel om Mastor från hemsidan idg.se. 5 Wahlster (2000) om inget annat anges

9 olika talare. För att få så representativt kvalitet på ljudet som möjligt spelades allt in parallellt genom olika kanaler: varsin mikrofon för talarna, en mikrofon i rummet och olika telefoner (mobil, stationär, sladdlös). Detta för att systemet skulle tränas till att få olika kvalitet på ljudet. De nästan dialogturerna skrevs ner på sk partiturer vilka innehöll 15 raduppdelningar av dialogen i två olika typer av transkription, lexikal ortografi, uttal, fonologi, ord, prosodi, dialogakter, oljud, överlappande tal, syntax, ordkategorier, syntaktisk funktion och prosodisk tillhörighet. Utöver denna monolingvistiska insamling la man till bilingvistiska dialoger och transkriberingar mellan de tre språken. Detta ledde till tre träd, ett för varje språk i Verbmobils korpus med vardera tre delar: morfosyntax, frasstruktur och predikatargumentstruktur. 5.2 Huvuddelarna Slutversionen av Verbmobil innehåller 69 mycket interaktiva moduler. Översättning mellan talat input på ett språk till talat output på ett annat kräver oerhörda mängder kommunikation mellan dessa delar. Parallellprocesser utnyttjas så långt som möjligt för att korta processningstiden, vilket medför att det inte bara är input och output som skickas mellan komponenterna utan även signaler bakåt i systemet, alternativa hypoteser och en hel del värden för sannolikheter och tillit. Figur 2. Schematisk bild över Verbmobils huvudkomponenter. 5

10 Bilden ovan visar en schematisk bild över systemets moduler. Längst ner visas de olika inputvarianterna, att prata i varsin mikrofon i samma rum, att prata i telefon t.ex. flera parter vid konferenser, via mobiltelefoner eller över Internet. Först skickas inputen till de tre taligenkänningsmodulerna för tyska, engelska eller japanska. Beroende på vilket språk som talas skickas det vidare för prosodianalys. Systemet använder systematiskt prosodisk information i alla delar, men det bearbetas främst i denna modul. Prosodiska ledtrådar såsom varaktighet, tonläge, eftertryck och pauser, hjälper till att upptäcka självrättelser och en sannolikhetsmodell används för att hitta felsägelser och byta ut mot det rätta ordet. Outputen av detta innehåller ord som talaren inte velat yttra såsom uhm, ah och filtreras bort genom en ordhypotestabell (word hypothesis chart (WHG)). WHG går genom tre olika parser baserade på olika syntaktiska kunskapskällor. Alla parser i systemet använder samma format (VIT) på output som är en tabell med flera rader som gör det möjligt för flera tolkningar eller att pussla ihop fragment av olika parsers output. I dessa parser elimineras talljud och stakningar och den prosodiska informationen får olika probabilistiska värden. Resultatet från prosodianalysen används för parsning, dialogförståelse, i översättningsprocessen och talsyntesen. Prosodisk information på ett språk kan t.ex. motsvaras av en lexikal eller en syntaktisk skillnad på ett annat språk. Verbmobil gör korrekta fraser i 93 % av fallen. Ytterligare självrättelser upptäcks senare under den semantiska bearbetningen. Där upptäcks möjliga semantiska tolkningar av innehållet genom olika regler och delar som motsvaras av misstag hos talaren repareras i VIT:en. Efter den prosodiska analysen kombineras en tabellparser och en statistisk parser till ett paket i den integrerade bearbetningen. Dessa ytliga parser producerar trädstrukturer som transformeras till VIT formatet av nästa modul som kallas semantisk konstruktion. Modulen under, djupanalys, baseras på en HPSG (head-driven phrase structure grammar 6 ) parser för en djup lingvistisk bearbetning. Den n bästa vägen från den integrerade bearbetningsmodulen bearbetas av djupanalysen genom en tvåvägs bottom-up parser. Nu går vi tillbaka till den prosodiska analysen och till den andra grenen, mot statistisk översättning. Denna modul börjar bearbeta den bästa hypotetiska meningen från taligenkänningen. Prosodisk information om frastillhörigheter och meningens stil utnyttjas av denna modul. Output blir en sekvens av ord på målspråket tillsammans med ett tillitsmått som används av en selektionsmodul (syns ej i schemat) för att slutligen välja en översättning. Parallellt med den statistiska översättningen gör man en fallbaserad (case-based) översättning. Denna modul består av två komponenter: substring-baserad och A*sökning. Den förstnämnda översättningsmetoden tolkar stegvis asynkroniskt. Delar av meningar av input som finns i korpusen är de grundläggande enheterna i denna del. Den andra översättningsmetoden, A*sökning, söker igenom en mall med översättningar där datum, tid och namngivna uttryck är markerade. A*sökningen utreder korsprodukten av dessa uttryck och sedan översätts de till målspråket. Tillbaka till den första grenen och parallellt med den semantiska konstruktionen och djupanalysen hittar man dialogaktsbaserad översättning. Denna del innehåller statistisk klassifikaiton av 19 dialogakter och fler än 300 omvandlare som hittar de huvudsakliga föreslagna innehållet av ett yttrande. Här används dialogminnet som extra material till statistiken. Dialogakten, ämnet och innehållsförslaget representeras av en notation som 6 Russel & Norvig (1995) Denna typ av grammatik är en sk unifier-baserad vilket betyder att det inte spelar någon roll viken i viken ordning reglerna appliceras, man får samma svar ändå.

11 innehåller 49 nästlade objekt med 95 möjliga attribut som täcker domänerna att förhandla om möte och planera resor. Sedan omvandlas dessa termer till målspråket. Den ytliga lingvistiska presentationen av yttrandet tillsammans med ämnet, den viktigaste informationen och en djup semantisk representation kodas i ett VIT i dialogminnet och utnyttjas av nästa modul, dialog och kontextutvärdering. Upp igen till dialogkomponenten ( dialog semantics i bilden). Denna modul innehåller en processor för kartläggning av pågående dialoghierarkier i olika dialogfaser. Dialogakter är den sista noden i trädet som representerar dialogstrukturer. Information om faser i dialogen används t.ex. under den semantiskbaserade överföringen för tvetydiga begrepp. Slutledningar av dessa tvetydigheter tillhandahålls av dialog och kontextkomponenten vid t.ex. temporala uttryck. Omvandlingsmodulen (transfer i bilden) skriver om vissa semantiska representationer i VIT formatet från källspråket till målspråket. Detta sker på en abstrakt nivå utan morfologiska och syntaktiska resultat. Slutprodukten av Verbmobil innehåller över omvandlingsregler och processen är väldigt snabb. Den näst sista modulen är en flerspråkig generator som innehåller två komponenter. En mikroplanerare och en syntaktisk realiseringsmodul. Mikroplaneraren får input av omvandlingsmodulen i form av VIT:er och gör en plan för hur meningarna ska se ut. Ordvalen är här nästan klara så den syntaktiska realiseringkomponenten använder LTAG (Lexicalized Tree Adjunct Grammars) 7 grammatiker för att lägga till hjälpverb 8. Sista delen i Verbmobil är de olika talsynteserna för tyska, engelska och japanska. Här finns en stor korpus av talad data som väljs genom grafbaserad enhet. När så är möjligt utnyttjas syntaktisk, prosodisk och diskursinformation som tidigare har processats för att välja bästa talöversättningen. 5.3 Träning och utvärdering Olika maskininlärningsmetoder har använts för att träna korpusen: hidden Markov models, neurala nät, probabilistiska robotar, parser, regelsystem översättningsmodeller och taligenkänningar. De end-to-end utvärderingar man gjort av Verbmobils olika prototyper visar tydligt på vikten av kvalitet och kvantitet av träningskorpusar när man ska göra ett tal-till-tal översättningssystem av spontant tal och som är robust, korrekt och övergripande. 6 Dialoghantering För att översättning av spontant tal ska bli bra och begripligt krävs det en relativt stor mängd kunskap om kontexten. Den här kontexten innehåller kunskap om dialogen och dess semantiska och pragmatiska innehåll. Information är bl.a. nödvändig om parterna vill ha en summering av det viktigaste från dialogen eller en utskrift av argumentationen, förutom själva översättningen. Följande områden går alltså djupare ner i strukturen än den schematiska bilden som beskrivits ovan över modulerna i Verbmobil. 7 Denna typ av grammatik är ett lexikon där varje lexikalt element kopplas ihop med en uppsättning träd som beskriver dess underkategoriseringar och morfosyntaktiska egenskaper (Inrias hemsida ) 8 Becker et al. I Wahlster (2000) 7

12 6.1 Dialogakter och innehållsförslag När intentionen av ett yttrande ska beskrivas använder sig Verbmobil av dialogakter i en hierarkisk struktur. Denna grund används för dialog- och kontextbearbetning genom att det bildar ett ramverk för symbolisk igenkänning av dialogakter, t.ex. greet, feedback, reject dvs typer av händelse i samtalet. Förutom dialogakter karakteriseras ett yttrande av dess innehållsförslag (propositional content) som det skapas olika representationer av på olika nivåer. Dialogakter (dialog act) beskriver kommunikation i form av grundelement snarare än ord och meningar. De används för att markera viktiga drag i yttranden såsom vilken roll ett yttrande har i förhållande till den övriga dialogen. Då det i princip är omöjligt att översätta allt måste man fånga det mest centrala i dialogen, vilket är att bevara talarens intention med yttrandet. Den här informationen utnyttjas då man har att göra med tvetydigheter inom den semantiska tolkningsmodulen. För att underlätta bearbetningen och förståelse innehåller Verbmobil ett dialogaktschema i form av ett beslutsträd, se tabell nedan. De 32 akter som representerar noder används vid notation och bearbetning. Till trädet hörde en detaljerad manual med regler för vilken nod man ska välja i strukturen. För att träna dialogaktschemat använde man 1505 dialoger på tyska, engelska och japanska som resulterade i dialogaktsetiketter i partiturformat. Man använde dialogaktschemat när man satte etikett på akterna genom att svara på frågor vid de olika förgreningarna och noder. Studenter för respektive modersmål skrev in etiketterna i ett system som utvecklades för ändamålet, Annotag. De fick tränada och diskuterade svåra dialoger för att försäkra kvaliteten. Man gjorde också reliabilitetsstudier för att uppfylla kvalitetskraven. Tabell 1. Hierarkisk struktur över dialogakterna GREET BYE INTRODUCE CONTROL-DIALOGUE POLITENESS_ FOURMULA THANK DELIBERATE BACKCHANNEL REQUEST_SUGGEST INPUT REQUEST_CLARIFY DERIVATE_ MANAGE_TASK DEFER REQUEST_COMMENT SCENARIO CLOSE REQUEST_COMMIT REFER_TO_ REQUEST DIGRESS SETTING SUGGEST EXCLUDE EXPLAINED_ PROMOTE_TASK INFORM CLARIFY REJECT FEEDBACK GIVE_REASON REJECT COMMIT FEEDBACK_NEGATIVE ACCEPT OFFER FEEDBACK_POSITIVE CONFIRM

13 Utöver dialogakterna representeras dialogen av innehållsförslag. Det finns två viktiga grundantaganden för denna notation; för det första är Verbmobil uppgiftsorienterat vilket innebär att den information som presenteras är relevant för domänerna. I detta fall innebär det beskrivningar om tid och platser samt vad som är nödvändigt vid resor t.ex. transporter, husrum och nöjen; för det andra är målet att kunna bevara talarens intention, dvs det spelar ingen roll hur man säger något utan vad som sägs. Ett exempel på detta och som Verbmobil inte gör någon skillnad på är de fyra yttranden nedan, med undantag för d) då information om destination följer med. Representationen innehåller alltså att resa någonstans med flyg. a. and I would think, we get there by plane b. le tus take plane c. I would rather take the plane d. I would like to fly to Hannover Ontologin för innehållsförslagen består av två huvudkategorier: objekt och situation, medan kvalitet beskriver egenskaper hos dessa kategorier. Ontologin kan presenteras av en trädstruktur med de tre delarna i toppen. Exempel på objekt är en plats, eller mer abstrakt en tid. En situation kan vara en händelse eller att man reser någonstans. Kvalitet är som sagt en egenskap hos någon av dessa, t.ex. pris för ett rum eller att resa i 1 eller 2 klass. Verbmobil har också koll på fyra områden vilka används vid tvetydiga ord och meningar för att sätta ihop en kontext. Dessa är schemaläggning, resor, ackommodation och nöjen. Verbmobils domäner handlar ofta om temporala uttryck och får således en stor roll i översättningen. Det är dock inte helt problemfritt och man måste ta hänsyn till tre saker; naturligt språk innebär att man pratar om tid och datum på olika sätt och man måste därmed reducera dessa till en gemensam vedertagen representation; spontant tal innebär otydligheter och ofullständig information som måste tolkas; kontexten utvärderas från olika språk men att resonera kring den sker på samma sätt, oberoende av språk så ett tvärlingvistiskt sätt att representera syftet behövs. För att lösa dessa problem inför man ett språk för temporala uttryck (Temporal Expression Language). Det byggs upp från VIT:en och liknar vanligt språk till viss del, t.ex. the third Monday after Easter presenteras som [after (3, dow:mon, holiday:easter)]. Ett yttrande kan alltså beskrivas genom dialogakter och innehållsförslag. För varje dialogakt ges förslag på innehållets innebörd och i tvetydliga fall används information om det övergripande området som nämns ovan. Dialogens område används för att lösa tvetydigheter och producera en adekvat översättning för en specifik situation. Är det t.ex. en temporal eller spatial kontext översätts det tyska ordet nächste till nästa eller närmaste. utt has_action suggest travelling person has_agent Figur 3. Sammanfattande representation av exemplet ovan om att resa med flyg. 9 a1 dialogue_ move_by_ topic act plane d1 d2 person

14 6.2 Dialogprocessen Den andra delen av dialoghanteringen, dialogmodulen, har med översättning av kontexter att göra samt genereringen av sammanfattningar. Dialogmodulen (ligger i dialog och kontextutvärderingen) innehåller tre komponenter: dialogminne och två processorer. Dialogminnet fungerar som en kommunikationslänk (communication black-board) för processorerna och andra moduler i systemet som har med dialogen och kontexten att göra. Processorerna bearbetar data och för in mer och mer information i dialogminnet för framtida bruk. All dialoghantering och kontextuell information använder alltså samma grund av representationer. Dialogminnet är en centralt lagringsplats för alla dialogturer och får data från olika moduler. Dessa data tillhör olika översättningstyper såsom djup eller ytlig, statistisk eller exempelbaserad och olika uppdelningar av data i dialogakter, ämne, uttryck av innehåll, VIT:en och frasinformation. Dialogminnet måste alltså hålla koll på allt detta och lagrar varje segment med turnummer, början och sluttider samt översättningstyp. En av processorerna (plan processor) används för att känna igen dialogfaser, drag och tillstånd. Faser (t.ex. öppning, förhandling, avslut) används för att klara ut tvetydigheter av vissa ord vid översättning. Det tyska ordet Guten Tag översätts till Hello eller Goodbye, beroende om det är i början eller slutet av dialogen. Drag och tillstånd används längre ner i strukturen och är en grund för hur dialogakten delas upp. Bilden nedan visar hur dialogen delas upp till dialogakter. I toppen är hela dialogen som delas i dialogfaser, följt av tillståndet, drag och slutnoderna representerar dialogakten. De två nedersta nivåerna fås automatiskt från dialogakterna som processas tidigare. Dragen erhålls från en algoritm för grammatikinlärning. Resten är kodat för hand. Figur 4. Planeringsträdet med fyra avsnitt. När man delar upp turerna används både en kunskapsbaserad och en statistisk metod. Först bestämmer man riktningen på stycket som kan vara bakåt, framåt eller neutralt. Med detta menas att en dialogakt som är (FEEDBACK) alltid tittar bakåt och en (SUGGEST) alltid tittar framåt i tiden. När riktningen ändras delas turen upp. Parallellt med denna kunskapsmetod

15 görs en statistisk beräkning som grundas på en språkmodell som har fått träna på dialogakter istället för ord. En tur (turn) delas upp när båda dessa metoder producerar ett positivt svar. Språkmodellen förutsätter också vilket tillstånd uppdelningen tillhör. Den andra processorn (dialog processor) har inte med kartläggning av dialogen att göra utan mer med dialogminnet. Den hämtar dialogakter och innehållsrepresentationer från dialogminnet och formulerar kontextuella strukturer som blir grundstenarna i summeringen. Enligt författarna handlar summeringen inte om en hel utskrift av vad som sagts utan endast det som alla parter är överens om. Detta innebär just att Verbmobil måste hålla reda på vilka förslag som får en positiv respons, vilka som diskuteras och avböjs, vilka som bara nämns en gång eller de som nämns för att sedan komma på tal senare. Detta hanteras genom att hålla koll på enstaka data som nästlas ihop och skapar förslag medan det har koll på direkta eller indirekta erkännanden och avböjanden. 7 Sammanfattning Verbmobil har över förväntan uppnått sina mål med att skapa ett tal-till-tal översättningssystem. Inte bara klarar det av när parterna träffas, utan man kan använda telefoner och Internet för att tala med varandra på olika språk. En ytterligare egenskap systemet har är att det kan skicka en summering av dialogen via fax eller till sin . Detta kan vara användbart inom affärsrelationer eller förhandlingar om mötesplatser då man vill ha en utskrift på vad man kommit fram till, summera argumenten och utelämna irrelevanta detaljer. Summering skapas av den semantiska överföringsmodulen och genereringen av naturligt språk där den bästa översättningen väljs från dialogminnet. Stommen i detta är just dialogakterna och dialoghanteringen som ordnar upp dialogens turer. Jag anser att applicering av tal till tal översättning kan bli oändlig då man vill prata med människor i andra länder eller som talar andra språk. Verbmobil är ett god bit på väg, men det krävs ytterligare forskning och utveckling då detta är ett gigantiskt jobb att få ett sånt här system att bli tillräckligt bra för att användas inom vardagsdomäner eller inom fler tillämpningar. Jag förstod det innan också, men nu har jag verkligen insett det enorma arbete som ligger bakom ett översättningssystem. Med tanke på hur dåliga de översättningsprogram av skriven svenska till engelska jag sett, kommer det nog ta ytterligare decennier innan en kommersiellt fungerande tal till tal översättning finns. Många kan säkert tycka att AI-forskning ibland inte är helt relevant för människor idag eller användbar, men här är ett bra exempel på hur man i vardagssituationer kan ha stor nytta av forskningsresultat. 11

16 8 Referenser Internetreferenser Dokument från Verbmobils hemsida, hämtat LTAG grammatik på Inrias hemsida läst den Mastor, hämtat : DG.se300.dbp.asp Gärdenfors, Peter (1997) Att tala med maskinerna Human IT 3/1997 Hämtad från hemsida Följande fyra artiklar är hämstade ur Wahlster, Wolfgang (2000) Verbmobil: Foundations of Speech-to-Speech Translation. Springer, Berlin Alexandersson, Jan m.fl. Modeling Negotiation Dialogs. Becker, Tilman m.fl. The Verbmobil Generation Component VM-GECO Kipp, Michael m.fl. Dialog Processing. Wahlster, Wolfgang Mobile Speech-toSpeech Translation of Spontaneous Dialogues: An Overview of the Final Verbmobil System. Russel, Stuart & Norvig, Peter (1995) Artificial Intelligence A Modern Approach. Prentice Hall, New Jersey

Stina Nyman 2012-09-16

Stina Nyman 2012-09-16 LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

Ontologier. Cassandra Svensson 2014-01-09

Ontologier. Cassandra Svensson 2014-01-09 Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt

Läs mer

Språkteknologi. Språkteknologi

Språkteknologi. Språkteknologi Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp astställda av institutionsstyrelsen 2012-05-09. Gäller fr.o.m. ht 12. elkurs 1: et talade språket, 7,5 hp örväntade studieresultat

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK De första grunderna i språket, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta återkommande och rutinmässiga kommunikationssituationer.

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING,

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, , Det andra inhemska språket och främmande språk, Grunderna för läroplanen för den grundläggande utbildningen 2014 Kunskapsnivå A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

MÖSG ht 2005 Maskinöversättningssystemet MATS

MÖSG ht 2005 Maskinöversättningssystemet MATS MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?

Läs mer

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och

Läs mer

TDDD92 Artificiell intelligens -- projekt

TDDD92 Artificiell intelligens -- projekt jonas.kvarnstrom@liu.se 2018 TDDD92 Artificiell intelligens -- projekt Individuella uppgifter UPG2: Individuell skriftlig rapport 2 Vad? Läsa och förstå vetenskaplig litteratur Varför? Framtiden: Inte

Läs mer

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet

Läs mer

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...

Läs mer

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0 Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens

Läs mer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer

Lite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders

Läs mer

The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide

The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide This Swedish version is based on the English version available on the NICHD Protocol website (www.nichdprotocol.com).

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs B

Kommentarer till bedömningsmatris för Tala Kurs B Kommentarer till bedömningsmatris för Tala Kurs B Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

Om ämnet Engelska. Bakgrund och motiv

Om ämnet Engelska. Bakgrund och motiv Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,

Läs mer

Språk. Språkets natur. Kreativt

Språk. Språkets natur. Kreativt Språk Iordanis Kavathatzopoulos Uppsala universitet Inst. för IT/MDI Språkets natur Språk bygger inte på associationer Språk är organiserat i strukturer Språk är inte så olika: Ord och satser för att uttrycka

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Exjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson

Exjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson Datalingvistisk metod och fördjupning HT05 1 Exjobbskritik Muntlig opponering på ett exjobb Stina Ericsson Datalingvistisk metod och fördjupning HT05 2 Översikt 1. Att läsa ett exjobb kritiskt 2. Opponeringen

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Linköpings universitet

Linköpings universitet 2016-08-24 Vad är kognition? tt ta in, lagra och bearbeta information: Kognitionsvetenskaplig introduktionskurs Perception Information tas in och flödar genom begränsade informationskanaler Föreläsning

Läs mer

Utbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå

Utbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå 1. Identifikation Programmets namn Omfattning Nivå Programkod Ev. koder på inriktningar Beslutsuppgifter Ändringsuppgifter Masterprogram i kognitionsvetenskap 120 hp Avancerad nivå HAKOG Fastställd av

Läs mer

Bedömda elevexempel i årskurs 4 6

Bedömda elevexempel i årskurs 4 6 LÄSA 1 5 Bedömda elevexempel i årskurs 4 6 EN DEL AV BYGGA SVENSKA ETT BEDÖMNINGSSTÖD FÖR NYANLÄNDA ELEVERS SPRÅKUTVECKLING 1 SAMTAL OM EN FABEL 1 UPPGIFT I ett ämnesöverskridande temaarbete om däggdjur

Läs mer

Kvalitativ Analys. Utvärderingsmetoder inom MDI DH2408

Kvalitativ Analys. Utvärderingsmetoder inom MDI DH2408 Kvalitativ Analys Utvärderingsmetoder inom MDI DH2408 Inlämningsuppgift 2 Era gruppinlämningar ligger här framme, leta reda på er egen!!! Jag har godtyckligt gett er ett gruppnummer, referera till det

Läs mer

Anvisningar till rapporter i psykologi på B-nivå

Anvisningar till rapporter i psykologi på B-nivå Anvisningar till rapporter i psykologi på B-nivå En rapport i psykologi är det enklaste formatet för att rapportera en vetenskaplig undersökning inom psykologins forskningsfält. Något som kännetecknar

Läs mer

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen)

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen) Humaniora och teologi Utbildningsplan för Masterprogram i översättning (Översättarutbildningen) 1. Identifikation Programmets namn Masterprogram i översättning (Översättarutbildningen) Programmets namn

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,

Läs mer

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk behandlar olika former av kommunikation mellan människor. Kärnan i ämnet är språket och litteraturen. I ämnet ingår kunskaper om språket, skönlitteratur

Läs mer

HAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits

HAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits Humanistiska och teologiska fakulteterna HAÖVR, Masterprogram i översättning, 120 Master's Programme in Translation, 120 Program med akademiska förkunskapskrav och med slutlig examen på avancerad nivå

Läs mer

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning? Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins

Läs mer

KRITERIER FÖR REELL KOMPETENS I HUVUDOMRÅDE ARABISKA, JAPANSKA, KINESISKA OCH RYSKA

KRITERIER FÖR REELL KOMPETENS I HUVUDOMRÅDE ARABISKA, JAPANSKA, KINESISKA OCH RYSKA INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER KRITERIER FÖR REELL KOMPETENS I HUVUDOMRÅDE ARABISKA, JAPANSKA, KINESISKA OCH RYSKA Nedanstående påståenden är hämtade ur mallen för Gemensam europeisk referensram

Läs mer

Linköpings universitet

Linköpings universitet Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga

Läs mer

Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01

Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har

Läs mer

Kandidatprogram i kognitionsvetenskap, 180 högskolepoäng

Kandidatprogram i kognitionsvetenskap, 180 högskolepoäng IT- fakultetsstyrelsen Ä8 ITFS 2013-09-26/bil 1 Kandidatprogram i kognitionsvetenskap, 180 högskolepoäng (Bachelor in Cognitive Science, 180 higher education credits) Grundnivå 1. Fastställande Utbildningsplan

Läs mer

Kommunikation för dataloger

Kommunikation för dataloger Kommunikation för dataloger - Muntligt moment 1,5hp Stockholms universitet Hösten 2017 Linda Söderlindh, KTH, ECE/Språk Universitetsadjunkt Teknikvetenskaplig kommunikation Momentets upplägg Föreläsning

Läs mer

Pragmatik. Olika nivåer. Tumregler. Grice s samarbetsprinciper. Pragmatik och diskurs

Pragmatik. Olika nivåer. Tumregler. Grice s samarbetsprinciper. Pragmatik och diskurs Pragmatik och diskurs Hercules Dalianis NADA-KTH Email: hercules@nada.kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Pragmatik Studerar vilken mening yttranden har i situationer (Leech, 1983)

Läs mer

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk

Läs mer

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett

Läs mer

Programmet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska,

Programmet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska, Programmet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska, italienska, kinesiska, ryska, spanska och tyska, dels på att

Läs mer

Sub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén,

Sub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, Sub-symbolisk kognition & Konnektionism Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, mats.andren@liu.se 1 Konnektionism Neutrala nät baseras på en (förenklad) modell av hur hjärnan fungerar.

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs C

Kommentarer till bedömningsmatris för Tala Kurs C Kommentarer till bedömningsmatris för Tala Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

Beslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden 2014-09-24.

Beslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden 2014-09-24. Utbildningsplan för Masterprogram i språkvetenskap Master's Programme in Language Science Programkod: HSPPO Gäller från: HT 2015 Fastställd: 2014-09-24 Värdinstitution: Institutionen för lingvistik 120

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs D

Kommentarer till bedömningsmatris för Tala Kurs D Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Maskinöversättning 2008

Maskinöversättning 2008 Maskinöversättning 2008 F7 Maskinöversättningens mål och möjligheter Systematiska språkskillnader sv-en sv-ty sv-fr sv-sp sv-ry Hur kan de beskrivas? Ge konkreta exempel. Hur kan de tas om hand i maskinöversättningen?

Läs mer

Registerforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen

Registerforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen Registerforskning 2018 17 Oktober 2018, Stockholm City Conference Centre Möjligheter med Artificiell Intelligens inom registerforskningen Peter Funk Mälardalens Högskola Vem är Peter Funk? Artificiell

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1 Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut

Läs mer

Kursplaneöversättaren. Lina Stadell

Kursplaneöversättaren. Lina Stadell Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA)

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA) Ramkursplan 2013-06-24 ALL 2013/742 Fastställd av generaldirektör Greger Bååth den 24 juni 2013 Framtagen av Carin Lindgren, Malin Johansson och Helena Foss Ahldén Ramkursplan i teckenspråk som modersmål

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng Humanistiska fakultetsnämnden ÖU2100, Översättarutbildning 1 Magisterutbildning, 60 högskolepoäng Professional Translation 1, 60 higher education credits Avancerad nivå Second Cycle 1. Fastställande Kursplanen

Läs mer

Maskinöversättning 2008

Maskinöversättning 2008 Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Case-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011

Case-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011 Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka

Läs mer

SPRÅKTEKNOLOGIPROGRAMMET (STP)

SPRÅKTEKNOLOGIPROGRAMMET (STP) SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

ENGELSKA. Ämnets syfte. Kurser i ämnet

ENGELSKA. Ämnets syfte. Kurser i ämnet ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder 1 Leibniz, tidigt 1600 tal Descartes, tidigt 1600 tal Petr Smirnov

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Ämne - Engelska. Ämnets syfte

Ämne - Engelska. Ämnets syfte Ämne - Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna. HUMANISTISKA FAKULTETEN Dnr: U 2016/417 Allmän studieplan för licentiatexamen i Datalingvistik Studieplanen är fastställd av Humanistiska fakultetsstyrelsen vid Göteborgs universitet den 30 mars 2017.

Läs mer

Lyssningsstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig

Lyssningsstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig 1 Lyssningsstrategier En framgångsrik språkinlärare: Tror på sin förmåga att lära sig Är motiverad Är medveten om varför hon/han vill lära sig Är inte rädd för att göra misstag Tar risker Är bra på att

Läs mer

Kommentarer till bedömningsmatris för Tala Kurs D

Kommentarer till bedömningsmatris för Tala Kurs D Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande

Läs mer

ENGELSKA FÖR DÖVA. Ämnets syfte

ENGELSKA FÖR DÖVA. Ämnets syfte ENGELSKA FÖR DÖVA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika

Läs mer

Styrdokumentkompendium

Styrdokumentkompendium Styrdokumentkompendium Information och kommunikation 2 Sammanställt av Joni Stam Inledning Jag brukar säga till mina elever, halvt på skämt och halvt på allvar, att jag förhåller mig till kursens centrala

Läs mer

Skrivning i översättningsvetenskap (OP5)

Skrivning i översättningsvetenskap (OP5) UPPSALA UNIVERSITET Institutionen för lingvistik och filologi Skrivning i översättningsvetenskap (OP5) Lördagen den 28 oktober 2006, kl. 10.00-14.00 Engelska parken, Geijersalen Namn:. Personnummer: Adress:

Läs mer

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II

Kritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II Kritiskt tänkande HTXF04:3 FTEB05 Grundläggande semantik II Deskriptiv vs. värderande/känslomässig mening Ords betydelser kan ha både deskriptiva och värderande/känslomässiga komponenter. Det blir tydligt

Läs mer

Kognitionsvetenskap Kandidatprogrammet

Kognitionsvetenskap Kandidatprogrammet Kognitionsvetenskap Kandidatprogrammet Mattias Arvola Programansvarig 1 2 3 4 5 6 HUR TÄNKER FOLK EGENTLIGEN? 7 HUR TÄNKER FOLK EGENTLIGEN? VAD ÄR EN TANKE? HUR ÄR SPRÅK UPPBYGGT? VAD BETYDER BILDER? VAD

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny

Läs mer

Förslag den 25 september Engelska

Förslag den 25 september Engelska Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala

Läs mer

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg Betygskriterier Examensuppsats 30 hp. Betygskriterier Tregradig betygsskala används med betygen icke godkänd (IG), godkänd (G) och väl godkänd (VG). VG - Lärandemål har uppfyllts i mycket hög utsträckning

Läs mer

Riktlinjer för bedömning av examensarbeten

Riktlinjer för bedömning av examensarbeten Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar

Läs mer

Aristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet

Aristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet Kursens mål Efter avslutad kurs skall studenten kunna planera, genomföra, sammanställa och försvara ett eget projekt samt kunna granska och opponera på annan students projekt. Studenten ska även kunna

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

729G74 IT och programmering, grundkurs. Tema 1, Föreläsning 2 Jody Foo,

729G74 IT och programmering, grundkurs. Tema 1, Föreläsning 2 Jody Foo, 729G74 IT och programmering, grundkurs Tema 1, Föreläsning 2 Jody Foo, jody.foo@liu.se Föreläsningsöversikt Kurslogistik Begreppspresentationer Uppgifter i diskret matematik Uppgifter i Python Tema 1:

Läs mer

Undervisningen ska erbjuda möjlighet till anpassning av stoff efter elevernas intresse och utbildning.

Undervisningen ska erbjuda möjlighet till anpassning av stoff efter elevernas intresse och utbildning. SVENSKT TECKENSPRÅK Ett välutvecklat teckenspråk är av betydelse för dövas och hörselskadades lärande i och utanför skolan. När språket utvecklas ökar förmågan att reflektera över, förstå, värdera och

Läs mer

Svenska som andraspråk

Svenska som andraspråk Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny kunskap, klara vidare

Läs mer

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI Mats Lundälv Senior IKT-pedagog f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM Det fria ordet och AKK / ASK Kommunikativ och språklig tillgänglighet för alla...byggt på en infrastruktur av fria

Läs mer

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera

Läs mer

Exempel på gymnasiearbete inom humanistiska programmet språk

Exempel på gymnasiearbete inom humanistiska programmet språk Exempel på gymnasiearbete september 2012 Exempel på gymnasiearbete inom humanistiska programmet språk Ungdomsspråk i spanska bloggar Elevens idé Calle är genuint språkintresserad. Han har studerat spanska,

Läs mer

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007) Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Innehåll. 2015-10-12 Andreas Rosengren

Innehåll. 2015-10-12 Andreas Rosengren Innehåll Vad är Industri 4.0? Varför just nu? Utmaningar för industrin Vad innebär industri 4.0 för svensk industri? Industriell forskning relaterad till Industri 4.0 FFI LISA Vem är jag? Andreas Rosengren

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Fastställande. Allmänna uppgifter. Kursens mål

Fastställande. Allmänna uppgifter. Kursens mål Humanistiska och teologiska fakulteterna LLYU70, Svenska som andraspråk för lärare i svenska för invandrare, 30 högskolepoäng Swedish as a Second Language for Teachers of Newly Arrived Immigrants, 30 credits

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

"Siri och ishavspiraterna"

Siri och ishavspiraterna "Siri och ishavspiraterna" A Eleverna tränar förmågan att samtala, uttrycka åsikter och budskap om berättelser de lyssnat på, hörförståelse, föra samtalet framåt och att hålla sig till ämnet. Skapad 2014-12-08

Läs mer

Engelska, år 7-9 2009-09-01 Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa

Engelska, år 7-9 2009-09-01 Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa Skriva Tala Lyssna Realia Reflektera Kunna läsa enklare skönlitterära och andra berättande texter, t.ex. Of

Läs mer

Representationer. Henrik Artman KTH

Representationer. Henrik Artman KTH Representationer Henrik Artman KTH 1 Vad jag vill ha sagt Formella modeller riskerar att överrationalisera arbete Risken att fastna i fixeringar av systemen Metaforer kan vara stödjande Projekt behöver

Läs mer

Tala, skriva och samtala

Tala, skriva och samtala Tal och skrift Presentationer, instruktioner, meddelanden, berättelser och beskrivningar Engelska åk 4-6 - Centralt innehåll Språkliga strategier Förstå och göra sig förstådd, delta och bidra till samtal

Läs mer