Maskinöversättning. F Anna Sågvall Hein

Relevanta dokument
Machine Translation MÖSG F Anna Sågvall Hein

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/ Automatisk översättning och översättningshjälpmedel

Maskinöversättning möjligheter och gränser

Kursplaneöversättaren. Lina Stadell

Maskinöversättning 2008

Maskinöversättning 2008

Språkgranskningsverktyg, vt 2009

Pre-editering och maskinöversättning. Convertus AB

729G G20 ht 2016 Kursintroduktion, översättningsteori 1. Lars Ahrenberg

Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Lokalisering, terminologi och översättning

Lokalisering, terminologi och översättning. Magnus Merkel

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng

Lingvistik I Delmoment: Datorlingvistik

Convertus - kursplaneöversättning

Innehåll. Definition av språkgranskningsverktyg. Datorn som skrivverktyg. Ola Knutsson KTH CSC, SPRÅKGRANSKNINGSVERKTYG

Lingvistik I Delmoment: Datorlingvistik

Språkgranskningsverktyg. F1: Introduktion

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

Lingvistik I Delmoment: Datorlingvistik

Begriplig EU-svenska?

Elevers användning av maskinöversättning vid skrivande på främmande språk.

Kursplan. FR1050 Franska: Skriftlig språkfärdighet I. 7,5 högskolepoäng, Grundnivå 1. French Written Proficiency I

Introduktion till språkteknologi. Datorstöd för språkgranskning

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

Performance culture in policing. Författare: Tevfik Refik Altonchi (Ph.d)

Maskinöversättning idag

Översättning med Kursplaneöversättaren sker i tre huvudsakliga steg:

Teoretisk lingvistik och datalingvistik. Robin Cooper

Textstil/tonalitet med Acrolinx

Korpusbaserad Maskinöversättning

SpellRight. för Google Docs. Manual för SpellRight för Google Docs

Utmaningar och möjligheter vid planering, genomförande och utvärdering av förändringsarbete i organisationer

Översättningsminnen laboration

729G G20 ht 2016 Översättningsteori 2. Lars Ahrenberg

Introduktion till språkteknologi

Grammatisk kompetens och kommunikativ språkundervisning

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Språkteknologi för ökad tillgänglighet vilka möjligheter finns?

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

Automatisk översättning

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Användarhandledning Kursplaneöversättaren

Quick Start Guide Snabbguide

Introduction to the Semantic Web. Eva Blomqvist

Auktorisation som tolk

Att köpa in översättningstjänster

Transit NXT. Kontextkänslig översättning och lokalisering Ergonomisk design Nya funktioner Processoptimerat användargränssnitt

Använda Convertus Kursplaneöversättaren

Name: Beginners Swedish for Exchange Students, 1-20 points

Språkteknologi och Open Source

PEC: European Science Teacher: Scientific Knowledge, Linguistic Skills and Digital Media

Tekniken bakom språket

Datorlingvistik och språkteknologi

Vägar till bättre översättningsprogram

Cristina Eriksson oktober 2001

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

Wikipedia och Wikipedianer i folkbildningens tjänst. Olof Sundin Högskolan i Borås & Lunds universitet

SÖ 2005:10. Agreement in the Form of an Exchange of Letters on the Taxation of Savings Income

Standarder för översättningskvalitet

Lathund för SpellRight

Stava Rex. för Google Docs. Manual för Stava Rex för Google Docs

Terminsplanering i Moderna språk, franska, årskurs 7 Ärentunaskolan

HAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits

Second handbook of research on mathematics teaching and learning (NCTM)

Statistisk maskinöversättning

MÖSG ht 2005 Maskinöversättningssystemet MATS

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

6 th Grade English October 6-10, 2014

EU-översättning i ett nötskal. Tina Young Generaldirektoratet för översättning, EUkommissionen

Linköpings Universitet 2008 Institutionen för Datavetenskap HKGBB0, Artificiell Intelligens

Handbok i konsten att köpa översättningar

FILOSOFISKA FAKULTETEN INSTITUTIONEN FÖR SKANDINAVISKA SPRÅK OCH LITTERATUR. Felanalys av maskinöversättningar av svenska texter till kroatiska

Social innovation - en potentiell möjliggörare

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

Prövning i grundläggande engelska: GRNENG 2

ÄEND02, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle

Obesvarade frågor från F4

FR1201, Franska: Fortsättningskurs på distans, 30 högskolepoäng. (French: Intermediate course, 30 higher education credits)

Utveckling av ett svensk-engelskt lexikon inom tåg- och transportdomänen

Skrivning i översättningsvetenskap (OP5)

Institutionen för individ och samhälle Kurskod ENG221. Engelska online III (31-60): Språkvetenskap och amerikansk litteratur, 15 högskolepoäng

Grundläggande textanalys. Joakim Nivre

Centralt innehåll. Läsa och skriva. Tala, lyssna och samtala. Berättande texter och sakprosatexter. Språkbruk. Kultur och samhälle.

Fodina Language Technology White Paper Ordnad språkhantering

Lektion 3. Anteckningar

Kursbeskrivning. Facköversättning I, 7,5 hp (TTA604) Masterprogram i översättning, 120 hp. Tolk- och översättarinstitutet (TÖI)

Nätverksträff för lärare inom vuxenutbildningens grundläggande nivå

Kursplan. KI2006 Kinesisk traditionell filosofi. 7,5 högskolepoäng, Grundnivå 2. Chinese Traditional Philosophy

Språkteknologi (SV2122) Föreläsning 9: Översättning

Handbok i konsten att köpa översättningar

3.6 Moderna språk. Centralt innehåll

Syfte med undervisningen Genom undervisningen i ämnet engelska ska eleverna sammanfattningsvis ges förutsättningar att utveckla sin förmåga att:

Värmeväxlare - Terminologi. Heat exchangers -Terminology

This is England. 1. Describe your first impression of Shaun! What kind of person is he? Why is he lonely and bullied?

Översättningsteori för praktiker - varför det?

Översättningsuniversalier i svenska översatta texter

Anställningsprofil för universitetslektor i matematikämnets didaktik

Transkript:

Maskinöversättning F1 2008 Anna Sågvall Hein

Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och kvaliteten på den maskinöversatta texten varierat kraftigt mellan olika system.

Ex på en bra översättning En inbyggd oljepump levererar olja under tryck både till hydraulsystemet och växellådans oljesystem. An integrated oil pump delivers pressurised fluid both to the hydraulic system and to the lubrication system of the gearbox.

Ex på en dålig översättning(?) Stackars Kalle var rädd. Wretched cold each cautious.

Två översättningsparadigm Språkvetenskapligt inspirerad översättning Översättning som bygger på återanvändning av tidigare översättningar

Kort historik - några hållpunkter Georgetown-systemet 1954 Regelbaserade system 1960 -> ALPAC-rapporten 1964 Statistiska system 1991 - > Hybridsystem ~ 1995 -> Google släpper en testversion av sin SMT 2008

Var står vi idag? I dag översätts mer text maskinellt än manuellt. C:a 50 miljoner översättningsuppdrag körs varje dag på Internet (Van der Meer 2008) Googles fria översättningstjänst visar att maskinöversättning är möjlig - i stor skala och mellan mer än 30 språk Är då alla problem lösta?

Vad menas med översättning? substitute the text material of one language (SL) by the equivalent text material of another language (TL) (Catford 1965: 20) Translation consists in producing in the target language the closest natural equivalent of the text material of the source language, in the first hand concerning meaning, in the second hand concerning style (Nida 1975: 32) Translation is in theory impossible, but in practice fairly possible Mounin (1967)

Referenser Catford, J. C. (1965), A Linguistic Theory of Translation, Oxford Press, England. Mounin, G. (1967) Les problèmes théotitiques de la traduction. Paris Nida, E. (1975), A Framework for the Analysis and Evaluation of Theories of Translation, in Brislin, R. W. (ed) (1975), Translation Application and Research, Gardner Press, New York.

Formell och dynamisk ekvivalens Formal equivalence focuses attention on the message itself, in both form and content. It aims to allow the reader to understand as much of the SL context as possible. Dynamic equivalence is based on the principle of equivalent effect, i.e. that the relationship between receiver and message should aim at being the same as that between the original receivers and the SL message. (Nida 75)

Klassiska problem med MT Orealistiska förväntningar Dåliga översättningar Svårigheter med att integrera MT i arbetsflödet

Problem vid maskinell översättning Flertydiga ord i källspråket Variation i målspråket Lexikala språkskillnader Grammatiska språkskillnader

Framgångsfaktorer Kvalitet i relation till syfte Kontroll över källspråket Samspel människa dator Återanvändning av översättning Utvärderingsmetoder

Uppgifter för maskinöversättningen Traditionell översättning Råöversättning Flerspråkig informationssökning

Kvalitet på källtexten Ordkontroll Grammatikkontroll Stilkontroll

Stavningskontroll och grammatikkontroll Om det finns skrivfel el. stavfel i källtexten misslyckas lexikonsökningen och också översättningen Om det finns grammatikfel i källspråket så misslyckas den grammatiska analysen I vilket skede ska stavnings- och grammatikkontroll ske? Före el. under översättningsprocessen?

Begränsningar på källtexten Ämnesområde Texttyp

Kontrollerat språk Full täckning på vokabulär, terminologi, grammatik Reducering av flertydighet Kräver ett språkgranskningsverktyg

Ex. på kontrollerade språk Simplified English flygplansindustrin KANT controlled English Caterpillar Scania Swedish Scania

Traditionella kvalitetsaspekter Adekvans Acceptans

Kvalitetsnivåer Publiceringskvalitet Redigeringskvalitet Begriplighetskvalitet

Utvärdering av MT Manuell Automatisk med facit (gold standard) Mått: BLEU, METEOR etc. Hur lik är den maskinöversatta texten det manuella facit?

Manuell utvärdering av MT Har allt innehåll i källtexten kommit med? Har något innehåll tappats bort? Har innehållet förvanskats vid översättningen? Felaktiga ordöversättningar? Är det flyt i måltexten? Innehåller måltexten skönhetsfel som inte stör förståelsen? Är måltexten begriplig i sitt sammanhang?

Ex. på fel som kan dyka upp Ord utan översättning Utelämnade ord Innehållsord el. funktionsord Felaktig ordöversättning Felaktig interpunktion Ordföljd Felaktig böjningsform

Samspel människa dator Före översättningen språkgranskning Under översättningen t.ex. upplösning av flertydigheter Efter översättningen efterredigering

Återanvändning av översättning Översättningsminnen Vid uppbyggnad av översättningslexikon och terminologier För statistisk maskinöversättning

Exempel på MT-produkter på marknaden Systran (http://babelfish.altavista.com/) ProMT (http://www.translate.ru/eng) Language Weaver Convertus Googles översättare, betaversion See further: http://www.hutchinsweb.me.uk/

Varför maskinöversättning? Billigare än manuell Snabbare kortare ledtider Mer konsistent än manuell översättning Mindre varierad än manuell översättning Bra el. dåligt?

Varför inte maskinöversättning? Inget alternativ för skönlitterär översättning