Verbmobil och dess dialoghantering
|
|
- Elsa Åström
- för 8 år sedan
- Visningar:
Transkript
1 Linköpings Universitet Institutionen för Datavetenskap HKGBB0, Artificiell Intelligens Verbmobil och dess dialoghantering
2 Sammanfattning Verbmobil var ett tvärvetenskapligt projekt under inom språkteknologi och ett samarbete mellan universitet, forskningscentrum och företag inom informationsteknologi. Chef över projektet var professor Wolfgang Wahlster vid det tyska forskningscentret för artificiell intelligens (DFKI) där också den mesta forskningen bedrevs. Samarbetet var dock internationellt med forskningsinstitut, universitet och företag även i Storbritannien, USA och Japan. Systemet översätter spontant tal till tal mellan tyska, engelska och japanska inom domänen för att boka möten, planera resor och göra hotellreservationer. Vad som är skiljer detta tal-till-talöversättningssystem från andra är att det tar hänsyn till kontexten och det semantiska innehållet samt prosodisk information. Det kan också producera en sammanfattning av dialogens viktigaste slutsatser.
3 Innehållsförteckning 1 INLEDNING BAKGRUND FAS FAS ÖVERSÄTTNING I ALLMÄNHET ANDRA PROJEKT JANUS MASTOR HUR FUNKAR VERBMOBIL DATAINSAMLING HUVUDDELARNA TRÄNING OCH UTVÄRDERING DIALOGHANTERING DIALOGAKTER OCH INNEHÅLLSFÖRSLAG DIALOGPROCESSEN SAMMANFATTNING REFERENSER...12
4
5 1 Inledning Det finns många områden inom artificiell intelligens (AI) såsom neurala nät (ANN), genetiska algoritmer eller case-based resoning vilket visar på bredden inom ämnet. AI berör inte bara matematik och datavetenskap utan även biologi, psykologi, lingvistik och filosofi. En generell definition av artificiell intelligens tänker jag inte försöka mig på då det skiljer sig lite mellan vilken forskning man inriktar sig mot eller om man är en anhängare av stark eller svag AI. Denna rapport berör området där datavetenskapen möter språkteknologi och hur man får datorer att översätta talat språk till ett annat talat språk. Jag kommer beskriva systemet Verbmobil vilket kan översätta spontant tal mellan tyska, japanska och engelska inom domänerna förhandla om möten, reseplanering och boka hotell. Jag kommer även fördjupa mig i en del av projektet som har med dialoghantering att göra och försöka förklara dess delar och hur det fungerar. Syftet med Verbmobil var att ta fram ett portabelt system som automatiskt kunde översätta spontant tal till ett annat språk. Man ville inte bara ta hänsyn till syntax och semantik utan även alla andra egenskaper hos spontant tal såsom tvetydigheter, självrättelser, tvekan och prosodi för att öka översättningens exakthet. Som namnet Verbmobil antyder, systemet stöder verbal kommunikation i mobila situationer. Jag börjar med en bakgrundbeskrivning till projektet och de två faserna. Sedan följer en sammanfattning över svårigheterna och frågeställningar kring översättning från tal till tal i allmänhet, följt av en kort beskrivning av två andra tal till tal system. Därefter kommer en redogörelse över Verbmobils huvudkomponenter och hur det egentligen fungerar, som avslutas med en fördjupning i dialoghanteringen. Slutligen sammanfattar jag det hela och diskuterar kring området. Jag har försökt använda svenska begrepp så långt det går, men ibland kan jag ha missat en del av betydelsen eller översatt fel pga bristande kunskaper inom området. I vissa fall står det engelska begreppet inom parantes. 2 Bakgrund 1 Verbmobil pågick under 1993 till 2000 och finansierades av det tyska förbundet för utbildning, vetenskap, forskning och teknologi (BMBF) samt andra intresseorganisationer och företag. Sammanlagt har det finansierats av 115 miljoner DM från BMBF och 51 miljoner DM från andra partners vilket motsvarar ungefär 740 miljoner SEK. Vad som är speciellt för det här projektet är det tvärvetenskapliga angreppssättet och att olika institut och universitet samarbetar med olika moduler av projektet. Vid ett tillfälle var det 33 forskningsgrupper som samarbetade och 135 enheter fördelade på dessa. Den vetenskapliga kontrollen sköttes av det tyska forskningscentrat för artificiell intelligens (DFKI) i Saarbrücken, där också den mesta forskningen bedrevs. Två gånger om året granskades milstolpar och vart annat år uppdaterades målen. En internationell opartisk vetenskaplig styrelse kontrollerade arbetet. Anledningen till bredden på projektet var att få med alla discipliner som behövs för att systemet ska bli så bra och fungerande som möjligt. Det handlar om datavetenskap, språkteknologi, översättningsvetenskap, signalbehandling, kommunikationsvetenskap och 1 Hela detta stycke refereras från Verbmobils hemsida om inget annat anges 1
6 artificiell intelligens. Med bredden följer också stora krav på att organisera projektet och även tekniska krav. Eftersom olika programmeringsspråk är bra på olika delar och det är uppemot 150 forskare och ingenjörer som samarbetar har man valt att använda språken C, C++, Lisp, Prolog, tcl/tk och Fortran som interagerar inom en objektorienterad mjukvaruarkitektur. 2.1 Fas 1 Projektet delades upp i två faser, den första och den andra från 1997 till och med september Den första fasen omfattade domänen att förhandla om möten kom det första fungerade systemet, Verbmobil Demonstrator, som presenterades under CeBIT. Systemet kunde känna igen tyskt talat input och hade en vokabulär på 1292 ord. Det kunde analysera tal och sedan översätta till engelska. Slutprototypen för fas 1 presenterades vid CeBIT 1997 och hade en vokabulär på 2500 ord. Det kunde även känna igen japanska och översätta till engelska med en vokabulär på 400 ord. I mindre omfattning kunde även den första fasens prototyp generera japanska. Samma parser används för input av tyska och japanska, men kunskapskällorna var olika, dvs syntax, semantik och lexikon. Systemet kunde också initiera kommunikation såsom Please raise your voice (var snäll och höj rösten) och känna igen felaktiga datum och tidsbegrepp såsom den 30 februari eller 4 p.m. in the morning (kl 16 på förmiddagen). Den första fasens prototyp klarade dock inte av spontant tal utan använde kommando för input, alltså sk push-to-talk knapp. Man använde en mikrofon vid input och processen tog mindre än 6 gånger längden av inputen. Prototypen testades med över översättningar och visade på en ungefärlig korrekthet (dvs intentionen upprätthölls) på 74,2 % av de föreslagna översättningarna. Ett exempel på hur dialogen kunde se ut: A: I guess we should meet in September. How about Deiday the first of Septemper? B: (Mouse click) Montag waere mir lieber (Mouse click). Vm: I would prefer Monday. A: Ok, so Moday the third. That s fine with me. What about 11 o clock? B: (Mouse click) Gut, wir treffen uns dann in meinem Buero (Mouse click) Vm: OK, so then we meet in my office. 2.2 Fas 2 I denna fas kan Verbmobil översätta spontana dialoger fram och tillbaka mellan tyska/engelska och tyska/japanska. Vokabulären är på ungefär ord mellan tyska och engelska. Det är fortfarande domänberoende inom ovan nämnda områden, men det är kontextkänsligt och känner automatiskt igen när samtalets innehåll ändras. Det är också känsligt för paralingvistiska fenomen såsom känslor och attityder som används vid översättningen. Slutprodukten styrs från en central server vilket innebär att det inte längre är beroende av input från en mikrofon utan man kan använda en vanlig telefon, GSM-telefon eller Internet istället. Man behöver alltså inte längre använda en push-to-talk knapp eftersom Verbmobil känner igen början och sluten på dialogturerna. Detta innebär att man kan använda Verbmobil för telefonkonferenser eller när man ringer någon från sin mobil till dennes mobil. Användarna kan dessutom be om ett utdrag av dialogen som skickas till en fax eller en . Verbmobil översätter ungefärligt korrekt i över 80 % av fallen och över 90 % för dialoguppgifter (Wahlster, 2000). Det tar Verbmobil ungefär dubbelt så lång tid att översätta som längden på inputet.
7 3 Översättning i allmänhet 2 Varför är det så svårt att översätta talat språk till ett annat språk och framförallt spontant talat språk? Nedan listas egenskaper för spontant tal som Verbmobil tar hänsyn till och klarar av i stora drag. - Överlappande tal mellan talarna. Verbmobil känner igen början och slut på dialogturer. - Talspråk istället för skriftspråk vilket innebär att man hoppar över vissa ord, dialektala skillnader, självrättelser (i Verbmobils korpus ca 20% av alla dialoger), småord som eh, uhm. - Talspråk har ingen kommatering. Satser byggs upp av betoningar och uppehåll istället. - Svårigheter att anpassa till nya talare. Verbmobil har en mängd metoder för att känna igen olika talare. Det kan gå snabbt vid fåordsyttringar, eller bli mer komplicerat vid långa turer. Man tar hänsyn till talarens akustiska egenskaper, hastigheten och uttalsskillnader såsom dialekter. Bilden nedan visar en konceptuell bild över svårigheterna med att bearbeta språk och översätta mellan språk. Verbmobil tillhör den nedersta delen eftersom det tar hänsyn till kontexten och har domänkunskap. Det förstår tal, om nu maskiner kan göra det, eftersom det listar ut talarens intentioner med vad hon säger, oavsett vilket sätt hon säger det på. Verbmobil kan också tolka tvetydiga ord till dess rätta innebörd i de flesta fallen. Figur 1. Nivåer av språkbearbetning där det blir mer och mer avancerat längre ner. 2 W. Wahlster (2000) om inget annat anges 3
8 4 Andra projekt Det är inte bara Verbmobil som forskar på tal-till-tal översättning. Användningsområdet är så pass stort och behovet av att förstå varandra utan att tala varandras språk har funnits länge. Verbmobil utgår från att de som ska prata med varandra förstår engelska bättre än vad de själva kan producera och därför använder man sig av engelska som något mellanspråk. Jag har stött på två liknande system, Janus som utvecklades före och under Verbmobil på universitet i USA och Tyskland, samt Mastor som IBM satsade på efter Verbmobil. 4.1 Janus 3 Ett av de största satsningarna av att översätta tal på ett språk till ett annat gjordes vid Carnegie Mellon University i USA i samarbete med Universität Karlsruhe i Tyskland där man har utvecklat ett system som kallas Janus II. Det kan översätta talat språk mellan engelska, tyska spanska, japanska och koreanska och är specialiserat på samtal som handlar om två personer som ska avtala ett möte. För detta krävs en vokabulär på mellan 3000 och 5000 ord beroende på vilken språk som används. Janus II tar ungefär dubbelt så lång tid på sig att översätta som normalt tal och tar hänsyn till det semantiska innehållet. Efter Janus II kom Janus III som är mer generell än föregångaren. 4.2 Mastor 4 IBM initierade 2001 något de kallar Mastor Multilingual Automatic Speech-to-Speech Technology. Då tekniken för text till tal redan finns utnyttjar IBM detta genom att de två som ska tala med varandra talar i var sin mikrofon som är anslutna till datorer. Mastor konverterar talet till text och översätter till det andra språket i text. Denna text visas på den andres bildskärm och datorn läser upp vad som står. Detta är utvecklat mellan engelska och mandarin och vokabulären innehåller över ord för båda språken inom domänerna resor, akuta medicinska diagnoser och försvarsinriktat skydd och säkerhet. Mastor används via en bärbar dator eller handdator och presenterades vid konferenser under Hur funkar Verbmobil 5 Systemet Verbmobil översätter alltså tal i realtid och vad som är speciellt med det är att det inte översätter mening för mening, utan är kontextberoende och utnyttjar betoningar i talet för att få bättre översättning tillsammans med ett minne för tidigare dialoger och domänkunskap. Det innefattar både djup och grund analys av tal med ett brett spektrum av korpusbaserade och regelbaserade metoder. Verbmobil använder resultat från maskininlärning av stora korpusar och lingvisters specialkunskap för att uppnå en tillfredsställande nivå av översättning. Jag ska här ge en översiktsbild över huvudkomponenterna i systemet och vad som händer mellan input och output, men först en beskrivning över datainsamlingen. 5.1 Datainsamling En signifikant del i Verbmobilarbetet var att samla in statistisk data att utgå ifrån och liksom de flesta delar var detta ett omfattande arbete. Man spelade in 182 timmar dialog med Gärdenfors (1997) från hemsida 4 Atrikel om Mastor från hemsidan idg.se. 5 Wahlster (2000) om inget annat anges
9 olika talare. För att få så representativt kvalitet på ljudet som möjligt spelades allt in parallellt genom olika kanaler: varsin mikrofon för talarna, en mikrofon i rummet och olika telefoner (mobil, stationär, sladdlös). Detta för att systemet skulle tränas till att få olika kvalitet på ljudet. De nästan dialogturerna skrevs ner på sk partiturer vilka innehöll 15 raduppdelningar av dialogen i två olika typer av transkription, lexikal ortografi, uttal, fonologi, ord, prosodi, dialogakter, oljud, överlappande tal, syntax, ordkategorier, syntaktisk funktion och prosodisk tillhörighet. Utöver denna monolingvistiska insamling la man till bilingvistiska dialoger och transkriberingar mellan de tre språken. Detta ledde till tre träd, ett för varje språk i Verbmobils korpus med vardera tre delar: morfosyntax, frasstruktur och predikatargumentstruktur. 5.2 Huvuddelarna Slutversionen av Verbmobil innehåller 69 mycket interaktiva moduler. Översättning mellan talat input på ett språk till talat output på ett annat kräver oerhörda mängder kommunikation mellan dessa delar. Parallellprocesser utnyttjas så långt som möjligt för att korta processningstiden, vilket medför att det inte bara är input och output som skickas mellan komponenterna utan även signaler bakåt i systemet, alternativa hypoteser och en hel del värden för sannolikheter och tillit. Figur 2. Schematisk bild över Verbmobils huvudkomponenter. 5
10 Bilden ovan visar en schematisk bild över systemets moduler. Längst ner visas de olika inputvarianterna, att prata i varsin mikrofon i samma rum, att prata i telefon t.ex. flera parter vid konferenser, via mobiltelefoner eller över Internet. Först skickas inputen till de tre taligenkänningsmodulerna för tyska, engelska eller japanska. Beroende på vilket språk som talas skickas det vidare för prosodianalys. Systemet använder systematiskt prosodisk information i alla delar, men det bearbetas främst i denna modul. Prosodiska ledtrådar såsom varaktighet, tonläge, eftertryck och pauser, hjälper till att upptäcka självrättelser och en sannolikhetsmodell används för att hitta felsägelser och byta ut mot det rätta ordet. Outputen av detta innehåller ord som talaren inte velat yttra såsom uhm, ah och filtreras bort genom en ordhypotestabell (word hypothesis chart (WHG)). WHG går genom tre olika parser baserade på olika syntaktiska kunskapskällor. Alla parser i systemet använder samma format (VIT) på output som är en tabell med flera rader som gör det möjligt för flera tolkningar eller att pussla ihop fragment av olika parsers output. I dessa parser elimineras talljud och stakningar och den prosodiska informationen får olika probabilistiska värden. Resultatet från prosodianalysen används för parsning, dialogförståelse, i översättningsprocessen och talsyntesen. Prosodisk information på ett språk kan t.ex. motsvaras av en lexikal eller en syntaktisk skillnad på ett annat språk. Verbmobil gör korrekta fraser i 93 % av fallen. Ytterligare självrättelser upptäcks senare under den semantiska bearbetningen. Där upptäcks möjliga semantiska tolkningar av innehållet genom olika regler och delar som motsvaras av misstag hos talaren repareras i VIT:en. Efter den prosodiska analysen kombineras en tabellparser och en statistisk parser till ett paket i den integrerade bearbetningen. Dessa ytliga parser producerar trädstrukturer som transformeras till VIT formatet av nästa modul som kallas semantisk konstruktion. Modulen under, djupanalys, baseras på en HPSG (head-driven phrase structure grammar 6 ) parser för en djup lingvistisk bearbetning. Den n bästa vägen från den integrerade bearbetningsmodulen bearbetas av djupanalysen genom en tvåvägs bottom-up parser. Nu går vi tillbaka till den prosodiska analysen och till den andra grenen, mot statistisk översättning. Denna modul börjar bearbeta den bästa hypotetiska meningen från taligenkänningen. Prosodisk information om frastillhörigheter och meningens stil utnyttjas av denna modul. Output blir en sekvens av ord på målspråket tillsammans med ett tillitsmått som används av en selektionsmodul (syns ej i schemat) för att slutligen välja en översättning. Parallellt med den statistiska översättningen gör man en fallbaserad (case-based) översättning. Denna modul består av två komponenter: substring-baserad och A*sökning. Den förstnämnda översättningsmetoden tolkar stegvis asynkroniskt. Delar av meningar av input som finns i korpusen är de grundläggande enheterna i denna del. Den andra översättningsmetoden, A*sökning, söker igenom en mall med översättningar där datum, tid och namngivna uttryck är markerade. A*sökningen utreder korsprodukten av dessa uttryck och sedan översätts de till målspråket. Tillbaka till den första grenen och parallellt med den semantiska konstruktionen och djupanalysen hittar man dialogaktsbaserad översättning. Denna del innehåller statistisk klassifikaiton av 19 dialogakter och fler än 300 omvandlare som hittar de huvudsakliga föreslagna innehållet av ett yttrande. Här används dialogminnet som extra material till statistiken. Dialogakten, ämnet och innehållsförslaget representeras av en notation som 6 Russel & Norvig (1995) Denna typ av grammatik är en sk unifier-baserad vilket betyder att det inte spelar någon roll viken i viken ordning reglerna appliceras, man får samma svar ändå.
11 innehåller 49 nästlade objekt med 95 möjliga attribut som täcker domänerna att förhandla om möte och planera resor. Sedan omvandlas dessa termer till målspråket. Den ytliga lingvistiska presentationen av yttrandet tillsammans med ämnet, den viktigaste informationen och en djup semantisk representation kodas i ett VIT i dialogminnet och utnyttjas av nästa modul, dialog och kontextutvärdering. Upp igen till dialogkomponenten ( dialog semantics i bilden). Denna modul innehåller en processor för kartläggning av pågående dialoghierarkier i olika dialogfaser. Dialogakter är den sista noden i trädet som representerar dialogstrukturer. Information om faser i dialogen används t.ex. under den semantiskbaserade överföringen för tvetydiga begrepp. Slutledningar av dessa tvetydigheter tillhandahålls av dialog och kontextkomponenten vid t.ex. temporala uttryck. Omvandlingsmodulen (transfer i bilden) skriver om vissa semantiska representationer i VIT formatet från källspråket till målspråket. Detta sker på en abstrakt nivå utan morfologiska och syntaktiska resultat. Slutprodukten av Verbmobil innehåller över omvandlingsregler och processen är väldigt snabb. Den näst sista modulen är en flerspråkig generator som innehåller två komponenter. En mikroplanerare och en syntaktisk realiseringsmodul. Mikroplaneraren får input av omvandlingsmodulen i form av VIT:er och gör en plan för hur meningarna ska se ut. Ordvalen är här nästan klara så den syntaktiska realiseringkomponenten använder LTAG (Lexicalized Tree Adjunct Grammars) 7 grammatiker för att lägga till hjälpverb 8. Sista delen i Verbmobil är de olika talsynteserna för tyska, engelska och japanska. Här finns en stor korpus av talad data som väljs genom grafbaserad enhet. När så är möjligt utnyttjas syntaktisk, prosodisk och diskursinformation som tidigare har processats för att välja bästa talöversättningen. 5.3 Träning och utvärdering Olika maskininlärningsmetoder har använts för att träna korpusen: hidden Markov models, neurala nät, probabilistiska robotar, parser, regelsystem översättningsmodeller och taligenkänningar. De end-to-end utvärderingar man gjort av Verbmobils olika prototyper visar tydligt på vikten av kvalitet och kvantitet av träningskorpusar när man ska göra ett tal-till-tal översättningssystem av spontant tal och som är robust, korrekt och övergripande. 6 Dialoghantering För att översättning av spontant tal ska bli bra och begripligt krävs det en relativt stor mängd kunskap om kontexten. Den här kontexten innehåller kunskap om dialogen och dess semantiska och pragmatiska innehåll. Information är bl.a. nödvändig om parterna vill ha en summering av det viktigaste från dialogen eller en utskrift av argumentationen, förutom själva översättningen. Följande områden går alltså djupare ner i strukturen än den schematiska bilden som beskrivits ovan över modulerna i Verbmobil. 7 Denna typ av grammatik är ett lexikon där varje lexikalt element kopplas ihop med en uppsättning träd som beskriver dess underkategoriseringar och morfosyntaktiska egenskaper (Inrias hemsida ) 8 Becker et al. I Wahlster (2000) 7
12 6.1 Dialogakter och innehållsförslag När intentionen av ett yttrande ska beskrivas använder sig Verbmobil av dialogakter i en hierarkisk struktur. Denna grund används för dialog- och kontextbearbetning genom att det bildar ett ramverk för symbolisk igenkänning av dialogakter, t.ex. greet, feedback, reject dvs typer av händelse i samtalet. Förutom dialogakter karakteriseras ett yttrande av dess innehållsförslag (propositional content) som det skapas olika representationer av på olika nivåer. Dialogakter (dialog act) beskriver kommunikation i form av grundelement snarare än ord och meningar. De används för att markera viktiga drag i yttranden såsom vilken roll ett yttrande har i förhållande till den övriga dialogen. Då det i princip är omöjligt att översätta allt måste man fånga det mest centrala i dialogen, vilket är att bevara talarens intention med yttrandet. Den här informationen utnyttjas då man har att göra med tvetydigheter inom den semantiska tolkningsmodulen. För att underlätta bearbetningen och förståelse innehåller Verbmobil ett dialogaktschema i form av ett beslutsträd, se tabell nedan. De 32 akter som representerar noder används vid notation och bearbetning. Till trädet hörde en detaljerad manual med regler för vilken nod man ska välja i strukturen. För att träna dialogaktschemat använde man 1505 dialoger på tyska, engelska och japanska som resulterade i dialogaktsetiketter i partiturformat. Man använde dialogaktschemat när man satte etikett på akterna genom att svara på frågor vid de olika förgreningarna och noder. Studenter för respektive modersmål skrev in etiketterna i ett system som utvecklades för ändamålet, Annotag. De fick tränada och diskuterade svåra dialoger för att försäkra kvaliteten. Man gjorde också reliabilitetsstudier för att uppfylla kvalitetskraven. Tabell 1. Hierarkisk struktur över dialogakterna GREET BYE INTRODUCE CONTROL-DIALOGUE POLITENESS_ FOURMULA THANK DELIBERATE BACKCHANNEL REQUEST_SUGGEST INPUT REQUEST_CLARIFY DERIVATE_ MANAGE_TASK DEFER REQUEST_COMMENT SCENARIO CLOSE REQUEST_COMMIT REFER_TO_ REQUEST DIGRESS SETTING SUGGEST EXCLUDE EXPLAINED_ PROMOTE_TASK INFORM CLARIFY REJECT FEEDBACK GIVE_REASON REJECT COMMIT FEEDBACK_NEGATIVE ACCEPT OFFER FEEDBACK_POSITIVE CONFIRM
13 Utöver dialogakterna representeras dialogen av innehållsförslag. Det finns två viktiga grundantaganden för denna notation; för det första är Verbmobil uppgiftsorienterat vilket innebär att den information som presenteras är relevant för domänerna. I detta fall innebär det beskrivningar om tid och platser samt vad som är nödvändigt vid resor t.ex. transporter, husrum och nöjen; för det andra är målet att kunna bevara talarens intention, dvs det spelar ingen roll hur man säger något utan vad som sägs. Ett exempel på detta och som Verbmobil inte gör någon skillnad på är de fyra yttranden nedan, med undantag för d) då information om destination följer med. Representationen innehåller alltså att resa någonstans med flyg. a. and I would think, we get there by plane b. le tus take plane c. I would rather take the plane d. I would like to fly to Hannover Ontologin för innehållsförslagen består av två huvudkategorier: objekt och situation, medan kvalitet beskriver egenskaper hos dessa kategorier. Ontologin kan presenteras av en trädstruktur med de tre delarna i toppen. Exempel på objekt är en plats, eller mer abstrakt en tid. En situation kan vara en händelse eller att man reser någonstans. Kvalitet är som sagt en egenskap hos någon av dessa, t.ex. pris för ett rum eller att resa i 1 eller 2 klass. Verbmobil har också koll på fyra områden vilka används vid tvetydiga ord och meningar för att sätta ihop en kontext. Dessa är schemaläggning, resor, ackommodation och nöjen. Verbmobils domäner handlar ofta om temporala uttryck och får således en stor roll i översättningen. Det är dock inte helt problemfritt och man måste ta hänsyn till tre saker; naturligt språk innebär att man pratar om tid och datum på olika sätt och man måste därmed reducera dessa till en gemensam vedertagen representation; spontant tal innebär otydligheter och ofullständig information som måste tolkas; kontexten utvärderas från olika språk men att resonera kring den sker på samma sätt, oberoende av språk så ett tvärlingvistiskt sätt att representera syftet behövs. För att lösa dessa problem inför man ett språk för temporala uttryck (Temporal Expression Language). Det byggs upp från VIT:en och liknar vanligt språk till viss del, t.ex. the third Monday after Easter presenteras som [after (3, dow:mon, holiday:easter)]. Ett yttrande kan alltså beskrivas genom dialogakter och innehållsförslag. För varje dialogakt ges förslag på innehållets innebörd och i tvetydliga fall används information om det övergripande området som nämns ovan. Dialogens område används för att lösa tvetydigheter och producera en adekvat översättning för en specifik situation. Är det t.ex. en temporal eller spatial kontext översätts det tyska ordet nächste till nästa eller närmaste. utt has_action suggest travelling person has_agent Figur 3. Sammanfattande representation av exemplet ovan om att resa med flyg. 9 a1 dialogue_ move_by_ topic act plane d1 d2 person
14 6.2 Dialogprocessen Den andra delen av dialoghanteringen, dialogmodulen, har med översättning av kontexter att göra samt genereringen av sammanfattningar. Dialogmodulen (ligger i dialog och kontextutvärderingen) innehåller tre komponenter: dialogminne och två processorer. Dialogminnet fungerar som en kommunikationslänk (communication black-board) för processorerna och andra moduler i systemet som har med dialogen och kontexten att göra. Processorerna bearbetar data och för in mer och mer information i dialogminnet för framtida bruk. All dialoghantering och kontextuell information använder alltså samma grund av representationer. Dialogminnet är en centralt lagringsplats för alla dialogturer och får data från olika moduler. Dessa data tillhör olika översättningstyper såsom djup eller ytlig, statistisk eller exempelbaserad och olika uppdelningar av data i dialogakter, ämne, uttryck av innehåll, VIT:en och frasinformation. Dialogminnet måste alltså hålla koll på allt detta och lagrar varje segment med turnummer, början och sluttider samt översättningstyp. En av processorerna (plan processor) används för att känna igen dialogfaser, drag och tillstånd. Faser (t.ex. öppning, förhandling, avslut) används för att klara ut tvetydigheter av vissa ord vid översättning. Det tyska ordet Guten Tag översätts till Hello eller Goodbye, beroende om det är i början eller slutet av dialogen. Drag och tillstånd används längre ner i strukturen och är en grund för hur dialogakten delas upp. Bilden nedan visar hur dialogen delas upp till dialogakter. I toppen är hela dialogen som delas i dialogfaser, följt av tillståndet, drag och slutnoderna representerar dialogakten. De två nedersta nivåerna fås automatiskt från dialogakterna som processas tidigare. Dragen erhålls från en algoritm för grammatikinlärning. Resten är kodat för hand. Figur 4. Planeringsträdet med fyra avsnitt. När man delar upp turerna används både en kunskapsbaserad och en statistisk metod. Först bestämmer man riktningen på stycket som kan vara bakåt, framåt eller neutralt. Med detta menas att en dialogakt som är (FEEDBACK) alltid tittar bakåt och en (SUGGEST) alltid tittar framåt i tiden. När riktningen ändras delas turen upp. Parallellt med denna kunskapsmetod
15 görs en statistisk beräkning som grundas på en språkmodell som har fått träna på dialogakter istället för ord. En tur (turn) delas upp när båda dessa metoder producerar ett positivt svar. Språkmodellen förutsätter också vilket tillstånd uppdelningen tillhör. Den andra processorn (dialog processor) har inte med kartläggning av dialogen att göra utan mer med dialogminnet. Den hämtar dialogakter och innehållsrepresentationer från dialogminnet och formulerar kontextuella strukturer som blir grundstenarna i summeringen. Enligt författarna handlar summeringen inte om en hel utskrift av vad som sagts utan endast det som alla parter är överens om. Detta innebär just att Verbmobil måste hålla reda på vilka förslag som får en positiv respons, vilka som diskuteras och avböjs, vilka som bara nämns en gång eller de som nämns för att sedan komma på tal senare. Detta hanteras genom att hålla koll på enstaka data som nästlas ihop och skapar förslag medan det har koll på direkta eller indirekta erkännanden och avböjanden. 7 Sammanfattning Verbmobil har över förväntan uppnått sina mål med att skapa ett tal-till-tal översättningssystem. Inte bara klarar det av när parterna träffas, utan man kan använda telefoner och Internet för att tala med varandra på olika språk. En ytterligare egenskap systemet har är att det kan skicka en summering av dialogen via fax eller till sin . Detta kan vara användbart inom affärsrelationer eller förhandlingar om mötesplatser då man vill ha en utskrift på vad man kommit fram till, summera argumenten och utelämna irrelevanta detaljer. Summering skapas av den semantiska överföringsmodulen och genereringen av naturligt språk där den bästa översättningen väljs från dialogminnet. Stommen i detta är just dialogakterna och dialoghanteringen som ordnar upp dialogens turer. Jag anser att applicering av tal till tal översättning kan bli oändlig då man vill prata med människor i andra länder eller som talar andra språk. Verbmobil är ett god bit på väg, men det krävs ytterligare forskning och utveckling då detta är ett gigantiskt jobb att få ett sånt här system att bli tillräckligt bra för att användas inom vardagsdomäner eller inom fler tillämpningar. Jag förstod det innan också, men nu har jag verkligen insett det enorma arbete som ligger bakom ett översättningssystem. Med tanke på hur dåliga de översättningsprogram av skriven svenska till engelska jag sett, kommer det nog ta ytterligare decennier innan en kommersiellt fungerande tal till tal översättning finns. Många kan säkert tycka att AI-forskning ibland inte är helt relevant för människor idag eller användbar, men här är ett bra exempel på hur man i vardagssituationer kan ha stor nytta av forskningsresultat. 11
16 8 Referenser Internetreferenser Dokument från Verbmobils hemsida, hämtat LTAG grammatik på Inrias hemsida läst den Mastor, hämtat : DG.se300.dbp.asp Gärdenfors, Peter (1997) Att tala med maskinerna Human IT 3/1997 Hämtad från hemsida Följande fyra artiklar är hämstade ur Wahlster, Wolfgang (2000) Verbmobil: Foundations of Speech-to-Speech Translation. Springer, Berlin Alexandersson, Jan m.fl. Modeling Negotiation Dialogs. Becker, Tilman m.fl. The Verbmobil Generation Component VM-GECO Kipp, Michael m.fl. Dialog Processing. Wahlster, Wolfgang Mobile Speech-toSpeech Translation of Spontaneous Dialogues: An Overview of the Final Verbmobil System. Russel, Stuart & Norvig, Peter (1995) Artificial Intelligence A Modern Approach. Prentice Hall, New Jersey
Stina Nyman 2012-09-16
LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem
Läs merBeräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Läs merOntologier. Cassandra Svensson 2014-01-09
Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merBetygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp
Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp astställda av institutionsstyrelsen 2012-05-09. Gäller fr.o.m. ht 12. elkurs 1: et talade språket, 7,5 hp örväntade studieresultat
Läs merNIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK
De första grunderna i språket, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta återkommande och rutinmässiga kommunikationssituationer.
Läs merNIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING,
, Det andra inhemska språket och främmande språk, Grunderna för läroplanen för den grundläggande utbildningen 2014 Kunskapsnivå A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merMÖSG ht 2005 Maskinöversättningssystemet MATS
MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?
Läs merKristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
Läs merTDDD92 Artificiell intelligens -- projekt
jonas.kvarnstrom@liu.se 2018 TDDD92 Artificiell intelligens -- projekt Individuella uppgifter UPG2: Individuell skriftlig rapport 2 Vad? Läsa och förstå vetenskaplig litteratur Varför? Framtiden: Inte
Läs merHUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng
Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är
Läs merUtveckling av ett grafiskt användargränssnitt
Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat
Läs merAnna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel
Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet
Läs merLinköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson
Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...
Läs merTaligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0
Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens
Läs merLite mer psykologi. L2: Automater, Sökstrategier. Top-down. Kimballs sju principer
Lite mer psykologi Perception: yntaktiskt bearbetning: emantisk bearbetning PERON() & LIKE(, y) L2: Automater, ökstrategier Korttidsminnet D4510 Parsningsalgoritmer Höstterminen 200 Långtidsminne Anders
Läs merThe National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide
The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide This Swedish version is based on the English version available on the NICHD Protocol website (www.nichdprotocol.com).
Läs merKommentarer till bedömningsmatris för Tala Kurs B
Kommentarer till bedömningsmatris för Tala Kurs B Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merOm ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Läs merSpråk. Språkets natur. Kreativt
Språk Iordanis Kavathatzopoulos Uppsala universitet Inst. för IT/MDI Språkets natur Språk bygger inte på associationer Språk är organiserat i strukturer Språk är inte så olika: Ord och satser för att uttrycka
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merExjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson
Datalingvistisk metod och fördjupning HT05 1 Exjobbskritik Muntlig opponering på ett exjobb Stina Ericsson Datalingvistisk metod och fördjupning HT05 2 Översikt 1. Att läsa ett exjobb kritiskt 2. Opponeringen
Läs merCristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Läs merLinköpings universitet
2016-08-24 Vad är kognition? tt ta in, lagra och bearbeta information: Kognitionsvetenskaplig introduktionskurs Perception Information tas in och flödar genom begränsade informationskanaler Föreläsning
Läs merUtbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå
1. Identifikation Programmets namn Omfattning Nivå Programkod Ev. koder på inriktningar Beslutsuppgifter Ändringsuppgifter Masterprogram i kognitionsvetenskap 120 hp Avancerad nivå HAKOG Fastställd av
Läs merBedömda elevexempel i årskurs 4 6
LÄSA 1 5 Bedömda elevexempel i årskurs 4 6 EN DEL AV BYGGA SVENSKA ETT BEDÖMNINGSSTÖD FÖR NYANLÄNDA ELEVERS SPRÅKUTVECKLING 1 SAMTAL OM EN FABEL 1 UPPGIFT I ett ämnesöverskridande temaarbete om däggdjur
Läs merKvalitativ Analys. Utvärderingsmetoder inom MDI DH2408
Kvalitativ Analys Utvärderingsmetoder inom MDI DH2408 Inlämningsuppgift 2 Era gruppinlämningar ligger här framme, leta reda på er egen!!! Jag har godtyckligt gett er ett gruppnummer, referera till det
Läs merAnvisningar till rapporter i psykologi på B-nivå
Anvisningar till rapporter i psykologi på B-nivå En rapport i psykologi är det enklaste formatet för att rapportera en vetenskaplig undersökning inom psykologins forskningsfält. Något som kännetecknar
Läs merUtbildningsplan för Masterprogram i översättning (Översättarutbildningen)
Humaniora och teologi Utbildningsplan för Masterprogram i översättning (Översättarutbildningen) 1. Identifikation Programmets namn Masterprogram i översättning (Översättarutbildningen) Programmets namn
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merVad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Läs merJohan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON
Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell
Läs merSVENSKA SOM ANDRASPRÅK
SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk behandlar olika former av kommunikation mellan människor. Kärnan i ämnet är språket och litteraturen. I ämnet ingår kunskaper om språket, skönlitteratur
Läs merHAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits
Humanistiska och teologiska fakulteterna HAÖVR, Masterprogram i översättning, 120 Master's Programme in Translation, 120 Program med akademiska förkunskapskrav och med slutlig examen på avancerad nivå
Läs merInnehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Läs merKRITERIER FÖR REELL KOMPETENS I HUVUDOMRÅDE ARABISKA, JAPANSKA, KINESISKA OCH RYSKA
INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER KRITERIER FÖR REELL KOMPETENS I HUVUDOMRÅDE ARABISKA, JAPANSKA, KINESISKA OCH RYSKA Nedanstående påståenden är hämtade ur mallen för Gemensam europeisk referensram
Läs merLinköpings universitet
Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga
Läs merRapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har
Läs merKandidatprogram i kognitionsvetenskap, 180 högskolepoäng
IT- fakultetsstyrelsen Ä8 ITFS 2013-09-26/bil 1 Kandidatprogram i kognitionsvetenskap, 180 högskolepoäng (Bachelor in Cognitive Science, 180 higher education credits) Grundnivå 1. Fastställande Utbildningsplan
Läs merKommunikation för dataloger
Kommunikation för dataloger - Muntligt moment 1,5hp Stockholms universitet Hösten 2017 Linda Söderlindh, KTH, ECE/Språk Universitetsadjunkt Teknikvetenskaplig kommunikation Momentets upplägg Föreläsning
Läs merPragmatik. Olika nivåer. Tumregler. Grice s samarbetsprinciper. Pragmatik och diskurs
Pragmatik och diskurs Hercules Dalianis NADA-KTH Email: hercules@nada.kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Pragmatik Studerar vilken mening yttranden har i situationer (Leech, 1983)
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merFuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping
Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett
Läs merProgrammet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska,
Programmet är inriktat dels på att utbilda studenter till yrkesskickliga översättare till svenska från ett av källspråken engelska, franska, italienska, kinesiska, ryska, spanska och tyska, dels på att
Läs merSub-symbolisk kognition & Konnektionism. Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén,
Sub-symbolisk kognition & Konnektionism Kognitionsvetenskaplig Introduktionskurs (729G01) Mats Andrén, mats.andren@liu.se 1 Konnektionism Neutrala nät baseras på en (förenklad) modell av hur hjärnan fungerar.
Läs merKommentarer till bedömningsmatris för Tala Kurs C
Kommentarer till bedömningsmatris för Tala Kurs C Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merBeslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden 2014-09-24.
Utbildningsplan för Masterprogram i språkvetenskap Master's Programme in Language Science Programkod: HSPPO Gäller från: HT 2015 Fastställd: 2014-09-24 Värdinstitution: Institutionen för lingvistik 120
Läs merKommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merIntroduktion till programmering och Python Grundkurs i programmering med Python
Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?
Läs merMaskinöversättning 2008
Maskinöversättning 2008 F7 Maskinöversättningens mål och möjligheter Systematiska språkskillnader sv-en sv-ty sv-fr sv-sp sv-ry Hur kan de beskrivas? Ge konkreta exempel. Hur kan de tas om hand i maskinöversättningen?
Läs merRegisterforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen
Registerforskning 2018 17 Oktober 2018, Stockholm City Conference Centre Möjligheter med Artificiell Intelligens inom registerforskningen Peter Funk Mälardalens Högskola Vem är Peter Funk? Artificiell
Läs merStatistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Läs merBakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1
Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut
Läs merKursplaneöversättaren. Lina Stadell
Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad
Läs merMaskinöversättning möjligheter och gränser
Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?
Läs merRamkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA)
Ramkursplan 2013-06-24 ALL 2013/742 Fastställd av generaldirektör Greger Bååth den 24 juni 2013 Framtagen av Carin Lindgren, Malin Johansson och Helena Foss Ahldén Ramkursplan i teckenspråk som modersmål
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng
Humanistiska fakultetsnämnden ÖU2100, Översättarutbildning 1 Magisterutbildning, 60 högskolepoäng Professional Translation 1, 60 higher education credits Avancerad nivå Second Cycle 1. Fastställande Kursplanen
Läs merMaskinöversättning 2008
Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE
Läs merSpråkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Läs merCase-based resoning. och dess användning inom sjukvården. Linköpings universitet Artificiell intelligens II 729G11 HT 2011
Linköpings universitet Artificiell intelligens II HT 2011 Case-based resoning och dess användning inom sjukvården Sammanfattning Det här arbetet handlar om vad case-based resoning är, hur den funkar, vilka
Läs merSPRÅKTEKNOLOGIPROGRAMMET (STP)
SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merENGELSKA. Ämnets syfte. Kurser i ämnet
ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala
Läs mer2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder
Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder 1 Leibniz, tidigt 1600 tal Descartes, tidigt 1600 tal Petr Smirnov
Läs merTDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000
Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.
Läs merÄmne - Engelska. Ämnets syfte
Ämne - Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika
Läs merFör universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.
HUMANISTISKA FAKULTETEN Dnr: U 2016/417 Allmän studieplan för licentiatexamen i Datalingvistik Studieplanen är fastställd av Humanistiska fakultetsstyrelsen vid Göteborgs universitet den 30 mars 2017.
Läs merLyssningsstrategier. En framgångsrik språkinlärare: Tror på sin förmåga att lära sig. Är motiverad. Är medveten om varför hon/han vill lära sig
1 Lyssningsstrategier En framgångsrik språkinlärare: Tror på sin förmåga att lära sig Är motiverad Är medveten om varför hon/han vill lära sig Är inte rädd för att göra misstag Tar risker Är bra på att
Läs merKommentarer till bedömningsmatris för Tala Kurs D
Kommentarer till bedömningsmatris för Tala Kurs D Stockholms universitet Institutionen för språkdidaktik Global bedömning Den globala bedömningen representerar bedömarens första intryck och är en övergripande
Läs merENGELSKA FÖR DÖVA. Ämnets syfte
ENGELSKA FÖR DÖVA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika
Läs merStyrdokumentkompendium
Styrdokumentkompendium Information och kommunikation 2 Sammanställt av Joni Stam Inledning Jag brukar säga till mina elever, halvt på skämt och halvt på allvar, att jag förhåller mig till kursens centrala
Läs merSkrivning i översättningsvetenskap (OP5)
UPPSALA UNIVERSITET Institutionen för lingvistik och filologi Skrivning i översättningsvetenskap (OP5) Lördagen den 28 oktober 2006, kl. 10.00-14.00 Engelska parken, Geijersalen Namn:. Personnummer: Adress:
Läs merKritiskt tänkande HTXF04:3 FTEB05. Grundläggande semantik II
Kritiskt tänkande HTXF04:3 FTEB05 Grundläggande semantik II Deskriptiv vs. värderande/känslomässig mening Ords betydelser kan ha både deskriptiva och värderande/känslomässiga komponenter. Det blir tydligt
Läs merKognitionsvetenskap Kandidatprogrammet
Kognitionsvetenskap Kandidatprogrammet Mattias Arvola Programansvarig 1 2 3 4 5 6 HUR TÄNKER FOLK EGENTLIGEN? 7 HUR TÄNKER FOLK EGENTLIGEN? VAD ÄR EN TANKE? HUR ÄR SPRÅK UPPBYGGT? VAD BETYDER BILDER? VAD
Läs merSVENSKA SOM ANDRASPRÅK
SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny
Läs merFörslag den 25 september Engelska
Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala
Läs merVäl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg
Betygskriterier Examensuppsats 30 hp. Betygskriterier Tregradig betygsskala används med betygen icke godkänd (IG), godkänd (G) och väl godkänd (VG). VG - Lärandemål har uppfyllts i mycket hög utsträckning
Läs merRiktlinjer för bedömning av examensarbeten
Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar
Läs merAristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet
Kursens mål Efter avslutad kurs skall studenten kunna planera, genomföra, sammanställa och försvara ett eget projekt samt kunna granska och opponera på annan students projekt. Studenten ska även kunna
Läs merhttp://www.sm.luth.se/~andreas/info/howtosearch/index.html
& ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom
Läs mer729G74 IT och programmering, grundkurs. Tema 1, Föreläsning 2 Jody Foo,
729G74 IT och programmering, grundkurs Tema 1, Föreläsning 2 Jody Foo, jody.foo@liu.se Föreläsningsöversikt Kurslogistik Begreppspresentationer Uppgifter i diskret matematik Uppgifter i Python Tema 1:
Läs merUndervisningen ska erbjuda möjlighet till anpassning av stoff efter elevernas intresse och utbildning.
SVENSKT TECKENSPRÅK Ett välutvecklat teckenspråk är av betydelse för dövas och hörselskadades lärande i och utanför skolan. När språket utvecklas ökar förmågan att reflektera över, förstå, värdera och
Läs merSvenska som andraspråk
Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny kunskap, klara vidare
Läs merBCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI
Mats Lundälv Senior IKT-pedagog f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM Det fria ordet och AKK / ASK Kommunikativ och språklig tillgänglighet för alla...byggt på en infrastruktur av fria
Läs merMODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet
MODERSMÅL Goda kunskaper i modersmålet gagnar lärandet av svenska, andra språk och andra ämnen i och utanför skolan. Ett rikt och varierat modersmål är betydelsefullt för att reflektera över, förstå, värdera
Läs merExempel på gymnasiearbete inom humanistiska programmet språk
Exempel på gymnasiearbete september 2012 Exempel på gymnasiearbete inom humanistiska programmet språk Ungdomsspråk i spanska bloggar Elevens idé Calle är genuint språkintresserad. Han har studerat spanska,
Läs merFöreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)
Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merInnehåll. 2015-10-12 Andreas Rosengren
Innehåll Vad är Industri 4.0? Varför just nu? Utmaningar för industrin Vad innebär industri 4.0 för svensk industri? Industriell forskning relaterad till Industri 4.0 FFI LISA Vem är jag? Andreas Rosengren
Läs merLingvistik I Delmoment: Datorlingvistik
Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:
Läs merFastställande. Allmänna uppgifter. Kursens mål
Humanistiska och teologiska fakulteterna LLYU70, Svenska som andraspråk för lärare i svenska för invandrare, 30 högskolepoäng Swedish as a Second Language for Teachers of Newly Arrived Immigrants, 30 credits
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs mer"Siri och ishavspiraterna"
"Siri och ishavspiraterna" A Eleverna tränar förmågan att samtala, uttrycka åsikter och budskap om berättelser de lyssnat på, hörförståelse, föra samtalet framåt och att hålla sig till ämnet. Skapad 2014-12-08
Läs merEngelska, år 7-9 2009-09-01 Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa
Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa Skriva Tala Lyssna Realia Reflektera Kunna läsa enklare skönlitterära och andra berättande texter, t.ex. Of
Läs merRepresentationer. Henrik Artman KTH
Representationer Henrik Artman KTH 1 Vad jag vill ha sagt Formella modeller riskerar att överrationalisera arbete Risken att fastna i fixeringar av systemen Metaforer kan vara stödjande Projekt behöver
Läs merTala, skriva och samtala
Tal och skrift Presentationer, instruktioner, meddelanden, berättelser och beskrivningar Engelska åk 4-6 - Centralt innehåll Språkliga strategier Förstå och göra sig förstådd, delta och bidra till samtal
Läs mer