Maskinöversättning 2008 F7 Maskinöversättningens mål och möjligheter
Systematiska språkskillnader sv-en sv-ty sv-fr sv-sp sv-ry Hur kan de beskrivas? Ge konkreta exempel. Hur kan de tas om hand i maskinöversättningen?
Problem och strategier vid mänsklig översättning Inlåning Citatord, t.ex., layout, ombudsman Översättningslån, t.ex. software - mjukvara Innehållsförskjutning morgon, förmiddag - matin Adaptation en broderlig kyss a hearty handshake Lars Lauri Wikholm, Eva, 1989, Kontrastivitet på lexikal nivå.
Problem och strategier vid mänsklig översättning, forts Utvidgning Kampen mot våldet.. Dem Kampf gegen Gewaltanwendung.. Äldre ältere Menschen Förtydligande Armén das Schwedische Heer Synonymi Rymningar Fluch und Ausbrüche Hyponymi Tidvattnet der Flut Wikholm, Eva, 1989, Kontrastivitet på lexikal nivå.
Mänskliga översättningsstrategier Hur kan problemen hanteras vid maskinell översättning?
Utmaningar för MT Textberoenden över meningsgränserna Maskinell översättning av talat språk
Textberoenden över meningsgränserna Pronomenresolution Resolution av lexikal flertydighet Bättre flyt i texten
Pronomenresolution En. She dropped the vase on the floor and broke it. Vilket är problemet vid översättning till svenska? Hur kan det åtgärdas av datorn vid rbmt? Vid smt?
Lexikal flertydighet, ett ex. motorn -> the engine/ the motor
Torkarmotorn Torkarmotorn M2 är sammankopplad med omkopplare S24 och intervallrelä R22. För att inte motorn skall överbelastas, t.ex. om torkarbladen fastnat, finns en inbyggd termovakt som bryter strömmen till motorn när Wiper motor M2 is connected to switch S24 and intermittent relay R22. To prevent motor overload, e.g. if the wiper blade gets stuck, there is an integral thermal sensor which breaks the current to the motor when
Maskinöversättning av talat språk En stor utmaning Kombinerar de problem man har vid taligenkänning med dem man har vid maskinöversättning Stora likheter mellan de statistiska metoder man använder vid taligenkänning och de som används vid statistisk maskinöversättning Hypoteser provas mot en språkmodell och de mest sannolika väljs Inga kända kommersiella system av betydelse
Verbmobil Verbmobil var ett långsiktigt tvärvetenskapligt forskningsprojekt med syfte att utveckla ett system som kunde känna igen, översätta och producera yttranden på naturligt språk och sålunda "translate spontaneous speech robustly and bidirectionally for German/English and German/Japanese". Projektet genomfördes mellan1993 and 2000 och finansierades av Tysklands federala ministerium för forskning och teknik med totalt 60 milj euro och av tyska industriparter med ytterligare 26 milj euro. (Efter Wikipedia)
Verbmobil - forts Speeker independent recognition Knowledge based language processing Semantic and statistic translation Context sensitive dialogue processing Multilingual generation and speech synthesis I projektet medverkade 900 forskare och utvecklare under 8 år. Det resulterade i en forskningsprototyp. Se vidare http://www.dfki.de/pas/f2w.cgi?iuic/verbmobil-e.
Attityder till maskinöversättning Enligt en nyligen genomförd internationell marknadsundersökning svarade 57 % av de tillfrågade att de nu funderade på att använda sig av maskinöversättning. Undersökningen omfattade 385 individer från globala affärsföretag.
Summering Kort historik Smt & RBMT Drivkrafter för MT MT i dag MT i morgon
En titt bakåt 1954, en anspråkslös början med demonstration av direktöversättning från engelska till ryska 1964, back-lash, ALPAC-rapporten -->1990-talet regelbaserad översättning direktöversättning transferöversättning Interlinguaöversättning begränsad användning 1990--> tekniker för storskalig återanvändning av tidigare översättningar ökande användning av mt
För och nackdelar med smt Enkelt att bygga systemen Ofta idiomatiska översättningar Oförutsedda fel, som är svåra att upptäcka Felen kan inte åtgärdas specifikt, bara genom mer träning på kompletterande data Svårt att hitta tillräckligt stora träningskorpusar Försöker man kompensera för genom lingvistisk märkning av träningsdata
För och nackdelar med regelbaserad översättning, rbmt Fel kan spåras tillbaka till de språkliga resurserna, språkbeskrivningen, och åtgärdas Svårt att få språkbeskrivningen komplett Mycket återstår att göra när det gäller att automatisera dessa uppgifter Kan kompletteras med olika statistiska upphämtningsstrategier - hybridsystem Mindre idiomatiska översättningar än smt Enda alternativet när det saknas erforderliga träningsdata för smt, t.ex. mt för sv-tu.
Drivkrafter för MT Ökande användning av Internet Statistikbaserade översättningstekniker Tillgång till fria översättningstjänster - sedan våren 2008 Google Nya översättningsuppgifter med varierande kvalitetskrav
MT i dag MT är här för att stanna Mer MT än manuell översättning Mer än 50 milj översättningsuppdrag över nätet per dag (Van der Meer 2008) Dagens resultat inom olika nischer är tillräckligt bra för att användare och kunder ska vilja satsa på tekniken De bästa resultaten uppnås vid översättning mellan likartade språk inom avgränsade domäner Översättningsvinster på mellan 40 och 80 % vid MT följd av efterredigering (Hardt 2008)
MT i morgon Kraftig ökning av översättningsvolymerna Inga radikalt nya metoder utan finslipning och kreativ kombination av dem som nu finns Bättre utvärderingsmetoder Mer uppmärksamhet på efterbehandlingsfasen Framsteg inom MT av talat språk Tillämpning av MT på flera språk, däribland minoritetsspråk Mer intresse för textberoenden över meningsgränserna