Maskinöversättning 2008

Relevanta dokument
Maskinöversättning möjligheter och gränser

Maskinöversättning. F Anna Sågvall Hein

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/ Automatisk översättning och översättningshjälpmedel

Maskinöversättning 2008

Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

Språkteknologi. Språkteknologi

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Kan man lita på språköversättning med maskin?

Cristina Eriksson oktober 2001

Pre-editering och maskinöversättning. Convertus AB

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

MÖSG ht 2005 Maskinöversättningssystemet MATS

Statistisk Maskinöversättning eller:

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Teoretisk lingvistik och datalingvistik. Robin Cooper

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Kursplaneöversättaren. Lina Stadell

Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter

Språkteknologi för ökad tillgänglighet vilka möjligheter finns?

En god service eller en björntjänst?

EU-översättning i ett nötskal. Tina Young Generaldirektoratet för översättning, EUkommissionen

Språkteknologi inom amerikanska försvaret

Vetenskap och forskare

Framtida datoranvändning i skolan Sammanställning KommITS deltagarenkät

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng

Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954

Assistans med språklig kvalitet Stöd eller irritationsmoment?

Språkteknologi och Open Source

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Tekniken bakom språket

Olika lärverktyg. Appar och lärverktyg. Olika syften med olika lärverktyg. Frågan är:

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

KÄRT BARN HAR MÅNGA NAMN Synonymer en välsignelse eller ett otyg? Hantering av synonymer i finansiella texter

Vad kan en facköversättare vänta sig av maskinöversättning?

Medlem av tyska tolk- och översättarförbundet Bundesverband der Dolmetscher und Übersetzer (BDÜ)

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

Tekniker för storskalig parsning

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

Översättningssprint Umeå

elevuppgifter Likt Unikt FRÅGESTÄLLNINGAR FÖR SKOLAN

Kan myndigheternas webbplatser bli tillgängliga för alla? Ett svenskt språkpolitiskt perspektiv. Rickard Domeij Språkrådet i Sverige

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Introduction to the Semantic Web. Eva Blomqvist

Samhället och skolan förändras och matematikundervisningen som den

Word- sense disambiguation

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens Erik Claesson

Machine Translation MÖSG F Anna Sågvall Hein

Grundläggande textanalys. Joakim Nivre

Lingvistik I Delmoment: Datorlingvistik

Kan en robot skriva teknisk information? Exempel från Wikipedia. Sverker Johansson Högskolan Dalarna

DGH Föreningsstämma 13 april. regiongavleborg.se

CS - Computer science. Datateknik Informationsbehandling Datalogi Datavetenskap (ÅA 2008)

Vad är internet egentligen?

Utveckling av aktiviteter för språkmedvetenhet i Norden och Baltikum

Studieteknik för studievägledare

Svårt att läsa och skriva

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

HAÖVR, Masterprogram i översättning, 120 högskolepoäng Master's Programme in Translation, 120 credits

Korpusbaserad Maskinöversättning

Föreläsning 1: Intro till kursen och programmering

Stina Nyman

Inte bara översättning

Vägledning för detaljerad utformning av Denison webbenkät angående företagskultur och lönsamhet.

Tre metoder för effektiva avslagsanalyser

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen)

Auktorisationsprovet för översättare

Kursplan och kunskapskrav för skolämnet Teknik

Program & programmering

Underlag för en bra kampanj eller en bra idé för markandsföring och trycksaksproduktion ges vid en briefing och kallas en

2. Bedömningsanvisningar

Nordiska arkivdagar. Forskarnas röst och digitalt material

Statistisk maskinöversättning

Automatisk översättning

Internet of Everything (IoE) De 10 bästa lärdomarna från Ciscos IoE analys av Value at Risk (VaR) för den offentliga sektorn

Lexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Örebro den 28 november 2012

Lokalisering, terminologi och översättning. Magnus Merkel

Om ämnet Engelska. Bakgrund och motiv

Internets historia Tillämpningar

Vägar till bättre översättningsprogram

COM HEM-KOLLEN TEMA INTEGRITET. Februari 2018

VALUTBUD 2015/2016. BLOCK AT:2015/2016 TEASCE01 - TEASCE03 Scenisk gestaltning 1-3 (Musikalen) 100

Plugga smart! Björn Liljeqvist

Logik och kontrollstrukturer

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

Statistisk Maskinöversättning. Anna Prytz Lillkull 729G

Processledar manual. Landsbygd 2.0

Föreläsning 1: Intro till kursen och programmering

Kursguide till. Fördjupningskurs del I i ryska, 30 hp INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

Öppna data för robotar ger tillgängliga data för människor. Sverker Johansson Högskolan Dalarna

Medier Fakta i korthet

Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet teknik

Scania och gasmotorer. Rutger Hörndahl, Bussmarknad Scania-Bilar Sverige AB

Packa kappsäcken till translatorprovet

Den 21. life for the individual. i världen och för individen. Elevernas

NEURAL MASKINÖVERSÄTTNING

Peter Hellström. PH-Digital Marketing

...vår förening i morgon!

Transkript:

Maskinöversättning 2008 F7 Maskinöversättningens mål och möjligheter

Systematiska språkskillnader sv-en sv-ty sv-fr sv-sp sv-ry Hur kan de beskrivas? Ge konkreta exempel. Hur kan de tas om hand i maskinöversättningen?

Problem och strategier vid mänsklig översättning Inlåning Citatord, t.ex., layout, ombudsman Översättningslån, t.ex. software - mjukvara Innehållsförskjutning morgon, förmiddag - matin Adaptation en broderlig kyss a hearty handshake Lars Lauri Wikholm, Eva, 1989, Kontrastivitet på lexikal nivå.

Problem och strategier vid mänsklig översättning, forts Utvidgning Kampen mot våldet.. Dem Kampf gegen Gewaltanwendung.. Äldre ältere Menschen Förtydligande Armén das Schwedische Heer Synonymi Rymningar Fluch und Ausbrüche Hyponymi Tidvattnet der Flut Wikholm, Eva, 1989, Kontrastivitet på lexikal nivå.

Mänskliga översättningsstrategier Hur kan problemen hanteras vid maskinell översättning?

Utmaningar för MT Textberoenden över meningsgränserna Maskinell översättning av talat språk

Textberoenden över meningsgränserna Pronomenresolution Resolution av lexikal flertydighet Bättre flyt i texten

Pronomenresolution En. She dropped the vase on the floor and broke it. Vilket är problemet vid översättning till svenska? Hur kan det åtgärdas av datorn vid rbmt? Vid smt?

Lexikal flertydighet, ett ex. motorn -> the engine/ the motor

Torkarmotorn Torkarmotorn M2 är sammankopplad med omkopplare S24 och intervallrelä R22. För att inte motorn skall överbelastas, t.ex. om torkarbladen fastnat, finns en inbyggd termovakt som bryter strömmen till motorn när Wiper motor M2 is connected to switch S24 and intermittent relay R22. To prevent motor overload, e.g. if the wiper blade gets stuck, there is an integral thermal sensor which breaks the current to the motor when

Maskinöversättning av talat språk En stor utmaning Kombinerar de problem man har vid taligenkänning med dem man har vid maskinöversättning Stora likheter mellan de statistiska metoder man använder vid taligenkänning och de som används vid statistisk maskinöversättning Hypoteser provas mot en språkmodell och de mest sannolika väljs Inga kända kommersiella system av betydelse

Verbmobil Verbmobil var ett långsiktigt tvärvetenskapligt forskningsprojekt med syfte att utveckla ett system som kunde känna igen, översätta och producera yttranden på naturligt språk och sålunda "translate spontaneous speech robustly and bidirectionally for German/English and German/Japanese". Projektet genomfördes mellan1993 and 2000 och finansierades av Tysklands federala ministerium för forskning och teknik med totalt 60 milj euro och av tyska industriparter med ytterligare 26 milj euro. (Efter Wikipedia)

Verbmobil - forts Speeker independent recognition Knowledge based language processing Semantic and statistic translation Context sensitive dialogue processing Multilingual generation and speech synthesis I projektet medverkade 900 forskare och utvecklare under 8 år. Det resulterade i en forskningsprototyp. Se vidare http://www.dfki.de/pas/f2w.cgi?iuic/verbmobil-e.

Attityder till maskinöversättning Enligt en nyligen genomförd internationell marknadsundersökning svarade 57 % av de tillfrågade att de nu funderade på att använda sig av maskinöversättning. Undersökningen omfattade 385 individer från globala affärsföretag.

Summering Kort historik Smt & RBMT Drivkrafter för MT MT i dag MT i morgon

En titt bakåt 1954, en anspråkslös början med demonstration av direktöversättning från engelska till ryska 1964, back-lash, ALPAC-rapporten -->1990-talet regelbaserad översättning direktöversättning transferöversättning Interlinguaöversättning begränsad användning 1990--> tekniker för storskalig återanvändning av tidigare översättningar ökande användning av mt

För och nackdelar med smt Enkelt att bygga systemen Ofta idiomatiska översättningar Oförutsedda fel, som är svåra att upptäcka Felen kan inte åtgärdas specifikt, bara genom mer träning på kompletterande data Svårt att hitta tillräckligt stora träningskorpusar Försöker man kompensera för genom lingvistisk märkning av träningsdata

För och nackdelar med regelbaserad översättning, rbmt Fel kan spåras tillbaka till de språkliga resurserna, språkbeskrivningen, och åtgärdas Svårt att få språkbeskrivningen komplett Mycket återstår att göra när det gäller att automatisera dessa uppgifter Kan kompletteras med olika statistiska upphämtningsstrategier - hybridsystem Mindre idiomatiska översättningar än smt Enda alternativet när det saknas erforderliga träningsdata för smt, t.ex. mt för sv-tu.

Drivkrafter för MT Ökande användning av Internet Statistikbaserade översättningstekniker Tillgång till fria översättningstjänster - sedan våren 2008 Google Nya översättningsuppgifter med varierande kvalitetskrav

MT i dag MT är här för att stanna Mer MT än manuell översättning Mer än 50 milj översättningsuppdrag över nätet per dag (Van der Meer 2008) Dagens resultat inom olika nischer är tillräckligt bra för att användare och kunder ska vilja satsa på tekniken De bästa resultaten uppnås vid översättning mellan likartade språk inom avgränsade domäner Översättningsvinster på mellan 40 och 80 % vid MT följd av efterredigering (Hardt 2008)

MT i morgon Kraftig ökning av översättningsvolymerna Inga radikalt nya metoder utan finslipning och kreativ kombination av dem som nu finns Bättre utvärderingsmetoder Mer uppmärksamhet på efterbehandlingsfasen Framsteg inom MT av talat språk Tillämpning av MT på flera språk, däribland minoritetsspråk Mer intresse för textberoenden över meningsgränserna