Maskinöversättning F1 2008 Anna Sågvall Hein
Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och kvaliteten på den maskinöversatta texten varierat kraftigt mellan olika system.
Ex på en bra översättning En inbyggd oljepump levererar olja under tryck både till hydraulsystemet och växellådans oljesystem. An integrated oil pump delivers pressurised fluid both to the hydraulic system and to the lubrication system of the gearbox.
Ex på en dålig översättning(?) Stackars Kalle var rädd. Wretched cold each cautious.
Två översättningsparadigm Språkvetenskapligt inspirerad översättning Översättning som bygger på återanvändning av tidigare översättningar
Kort historik - några hållpunkter Georgetown-systemet 1954 Regelbaserade system 1960 -> ALPAC-rapporten 1964 Statistiska system 1991 - > Hybridsystem ~ 1995 -> Google släpper en testversion av sin SMT 2008
Var står vi idag? I dag översätts mer text maskinellt än manuellt. C:a 50 miljoner översättningsuppdrag körs varje dag på Internet (Van der Meer 2008) Googles fria översättningstjänst visar att maskinöversättning är möjlig - i stor skala och mellan mer än 30 språk Är då alla problem lösta?
Vad menas med översättning? substitute the text material of one language (SL) by the equivalent text material of another language (TL) (Catford 1965: 20) Translation consists in producing in the target language the closest natural equivalent of the text material of the source language, in the first hand concerning meaning, in the second hand concerning style (Nida 1975: 32) Translation is in theory impossible, but in practice fairly possible Mounin (1967)
Referenser Catford, J. C. (1965), A Linguistic Theory of Translation, Oxford Press, England. Mounin, G. (1967) Les problèmes théotitiques de la traduction. Paris Nida, E. (1975), A Framework for the Analysis and Evaluation of Theories of Translation, in Brislin, R. W. (ed) (1975), Translation Application and Research, Gardner Press, New York.
Formell och dynamisk ekvivalens Formal equivalence focuses attention on the message itself, in both form and content. It aims to allow the reader to understand as much of the SL context as possible. Dynamic equivalence is based on the principle of equivalent effect, i.e. that the relationship between receiver and message should aim at being the same as that between the original receivers and the SL message. (Nida 75)
Klassiska problem med MT Orealistiska förväntningar Dåliga översättningar Svårigheter med att integrera MT i arbetsflödet
Problem vid maskinell översättning Flertydiga ord i källspråket Variation i målspråket Lexikala språkskillnader Grammatiska språkskillnader
Framgångsfaktorer Kvalitet i relation till syfte Kontroll över källspråket Samspel människa dator Återanvändning av översättning Utvärderingsmetoder
Uppgifter för maskinöversättningen Traditionell översättning Råöversättning Flerspråkig informationssökning
Kvalitet på källtexten Ordkontroll Grammatikkontroll Stilkontroll
Stavningskontroll och grammatikkontroll Om det finns skrivfel el. stavfel i källtexten misslyckas lexikonsökningen och också översättningen Om det finns grammatikfel i källspråket så misslyckas den grammatiska analysen I vilket skede ska stavnings- och grammatikkontroll ske? Före el. under översättningsprocessen?
Begränsningar på källtexten Ämnesområde Texttyp
Kontrollerat språk Full täckning på vokabulär, terminologi, grammatik Reducering av flertydighet Kräver ett språkgranskningsverktyg
Ex. på kontrollerade språk Simplified English flygplansindustrin KANT controlled English Caterpillar Scania Swedish Scania
Traditionella kvalitetsaspekter Adekvans Acceptans
Kvalitetsnivåer Publiceringskvalitet Redigeringskvalitet Begriplighetskvalitet
Utvärdering av MT Manuell Automatisk med facit (gold standard) Mått: BLEU, METEOR etc. Hur lik är den maskinöversatta texten det manuella facit?
Manuell utvärdering av MT Har allt innehåll i källtexten kommit med? Har något innehåll tappats bort? Har innehållet förvanskats vid översättningen? Felaktiga ordöversättningar? Är det flyt i måltexten? Innehåller måltexten skönhetsfel som inte stör förståelsen? Är måltexten begriplig i sitt sammanhang?
Ex. på fel som kan dyka upp Ord utan översättning Utelämnade ord Innehållsord el. funktionsord Felaktig ordöversättning Felaktig interpunktion Ordföljd Felaktig böjningsform
Samspel människa dator Före översättningen språkgranskning Under översättningen t.ex. upplösning av flertydigheter Efter översättningen efterredigering
Återanvändning av översättning Översättningsminnen Vid uppbyggnad av översättningslexikon och terminologier För statistisk maskinöversättning
Exempel på MT-produkter på marknaden Systran (http://babelfish.altavista.com/) ProMT (http://www.translate.ru/eng) Language Weaver Convertus Googles översättare, betaversion See further: http://www.hutchinsweb.me.uk/
Varför maskinöversättning? Billigare än manuell Snabbare kortare ledtider Mer konsistent än manuell översättning Mindre varierad än manuell översättning Bra el. dåligt?
Varför inte maskinöversättning? Inget alternativ för skönlitterär översättning