Maskinöversättning möjligheter och gränser

Relevanta dokument
Maskinöversättning 2008

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/ Automatisk översättning och översättningshjälpmedel

Maskinöversättning. F Anna Sågvall Hein

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Maskinöversättning 2008

Kursplaneöversättaren. Lina Stadell

Maskinöversättning idag

Pre-editering och maskinöversättning. Convertus AB

Lingvistik I Delmoment: Datorlingvistik

Korpusbaserad Maskinöversättning

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Lingvistik I Delmoment: Datorlingvistik

Cristina Eriksson oktober 2001

Lingvistik I Delmoment: Datorlingvistik

Språkteknologi för ökad tillgänglighet vilka möjligheter finns?

Vägar till bättre översättningsprogram

Machine Translation MÖSG F Anna Sågvall Hein

Korpusannotering. Beáta Megyesi. Uppsala universitet Institutionen för lingvistik och filologi Korpusannotering 1(31)

När kan man lita på maskinöversättning?

Tekniken bakom språket

Automatisk översättning

MÖSG ht 2005 Maskinöversättningssystemet MATS

Engelska, år Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa

Teoretisk lingvistik och datalingvistik. Robin Cooper

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

ENGK01: Engelska kandidatkurs, 30 högskolepoäng Studiebeskrivning

Språkteknologi och Open Source

Tekniker för storskalig parsning

Språkteknologiprogrammet

Convertus - kursplaneöversättning

Statistisk maskinöversättning

Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954

Kan man lita på språköversättning med maskin?

onsdag den 21 november 2012 PRONOMEN

On the role of corpora in cross-linguistic research, Stig Johansson (3-24)

Utveckling av ett svensk-engelskt lexikon inom tåg- och transportdomänen

Studieplan och bedömningsgrunder i Engelska för åk 7

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng

Kursbeskrivning med litteraturlista HT-13

Målet är att ge maskiner förmågan att plocka ut information ur

Mobil tolkningsapp för ambulanspersonalen

TYSK02, Tyska: Kandidatkurs, 30 högskolepoäng German: BA Course, 30 credits Grundnivå / First Cycle

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

ENGA21: Engelska fortsättningskurs, 30 högskolepoäng Studiebeskrivning

Språkteknologi. Språkteknologi

Kursplan för kurs på grundnivå

SMT = ickefixerad maskinöversättning?

Lexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

Mål och betygskriterier i Engelska

Statistisk grammatikgranskning

Statistisk Maskinöversättning. Anna Prytz Lillkull 729G

BETYGSKRITERIER OCH BETYGSÄTTNING

Datorlingvistik och språkteknologi

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

GOOGLE TRANSLATE:S ÖVERSÄTTNINGSTEKNIK FRÅN SVENSKA TILL RYSKA: EN ANALYS AV FYRA ÖVERSATTA TEXTER MED OLIKA BAKGRUNDER

Introduktion till språkteknologi. Datorstöd för språkgranskning

Grundläggande textanalys. Joakim Nivre

Statistisk Maskinöversättning eller:

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

Engelska. Inför provet v. 48. Grammatik. Substantiv uncountables s.124. När man översätter meningar där orden ingår ska man använda följande ord:

Kursplan. FR1050 Franska: Skriftlig språkfärdighet I. 7,5 högskolepoäng, Grundnivå 1. French Written Proficiency I

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

US154U - Svenska som andraspråk för lärare i svenska för invandrare (sfi), (1-30 hp) - ingår i Lärarlyftet II, 30 hp

US116G, Svenska för grundlärare i grundskolan, årskurs 4-6, I, 15 hp

Utvärdering SFI, ht -13

Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)

Kursplan SP1046. Spanska I med didaktisk inriktning 30 högskolepoäng, Grundnivå 1

Lexikon. versättning. Maskinövers. Flerspråklig nyhetsbevakning, maskinöversättning Termexpansion, Frågeexpansion, Fuzzy Matching, Lexikon

UTLYSNING AV UTBYTESPLATSER VT12 inom universitetsövergripande avtal

Parallellspråkighet vid Lunds universitet. Lennart nyberg, sektionen kommunikation, lunds universitet

Föreläsningsserie: Introduktion till språk- och litteraturvetenskap

Vad är maskinöversättning?

Libers språklåda i engelska 7 9: Listening

SVEK11, Svenska: Språklig inriktning - kandidatkurs, 30 högskolepoäng Swedish Language: Level 3 - B. A. Course, 30 credits Grundnivå / First Cycle

Kursbeskrivning för kurs inom LLII HT16

729G09 Språkvetenskaplig databehandling

Kursguide till. RY1200 Fortsättningskurs i ryska, 30 hp INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER VT16

Språkteknologi (SV2122) Föreläsning 9: Översättning

Sparbankerna PDF. ==>Download: Sparbankerna PDF ebook By 0

Google Translate och dess påverkan på webbplatser

FRAK01, franska, kandidatkurs

ÄFRD02, Franska 2 med utbildningsvetenskaplig inriktning, 30 högskolepoäng French for Secondary Education, Level 2, 30 credits Grundnivå / First Cycle

Lokalisering, terminologi och översättning. Magnus Merkel

Grammatiken är språkets grund & byggstenar!

Kursinformation och schema för Lingvistik 6 hp 729G08

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Delprov A. Språkform och språknorm

Unit course plan English class 8C

Delkurs 1. Nordiska språk och svensk språkhistoria, 7,5 hp

Fastställande. Allmänna uppgifter. Kursens mål

Transkript:

Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt? Språkvetenskaplig regelbaserad maskinöversättning Statistisk maskinöversättning Google Translate Maskinöversättning i praktiken Forskning i fokus Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Kort tillbakablick De första försöken gjordes redan på 50-talet i USA och Sovjet med en primitiv teknologi De gällde översättning mellan ryska och engelska för politiska och militära ändamål och aktörerna var tekniker Förhoppningarna grusades och efter några års stiltje inleddes en ny period med språkvetare/datorlingvister och datavetare i spetsen. De språkvetenskapligt baserade metoder som började utvecklas på 60-talet har i modifierad form överlevt till i dag, då de fått stark konkurrens av statistiska metoder.

Varför är det så svårt? Flertydighet Ett ord kan representera olika ordklasser, former och betydelser Variation Olika ord för samma företeelse synonymi Språkskillnader morfologi, ordföljd Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Exempel 1. Boken ligger under bordet. The book is under the table. 2. Studenten somnade under föreläsningen. The student fell asleep during the lecture. 3. Bara ett under kan rädda tidningen. Only a miracle/wonder can save the newspaper. 4. Under tiden stannade bilen. Meanwhile, the car stopped. 5. Var snäll och skriv under här. Please, sign here. Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Transferbaserad översättning ANALYS känner igen alternativ och skiljer ut former, ordklasser TRANSFER utför övergången mellan språken på strukturell nivå GENERERING bygger upp översättningen med korrekt ordföljd och korrekta former Alla komponenterna använder sig av omfattande lexikon och grammatiker. Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Analysstruktur något förenklad Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Transferstruktur Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Genereringsstruktur Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Transferöversättning på olika nivåer Vauquois triangel Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Transferbaserad MT Källspråkstrogna översättningar Kräver stora lexikon och grammatiker Tar tid att bygga Den hittills mest använda MT-typen för kvalitetsöversättning SYSTRAN mest känt

Ingen språkkunskap Statistisk maskinöversättning SMT En probabilistisk översättningsmodell byggs automatiskt på tidigare översättningar Vid översättning jämför systemet ord och ordsekvenser i källtexten med dem i översättningsmodellen och bygger en översättning av de delar som totalt sett stämmer bäst Vidare jämförs de prefererade översättningarna mot en modell av målspråket och den bästa väljs Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Översättningsmodellen Modellen består av sannolikhetsbaserade översättningar av ord och ordsekvenser Den skapas utifrån tidigare översättningar som parallellställs, länkas, på olika nivåer Kvaliteten på översättningarna beror helt på kvaliteten på dessa träningsdata samt hur väl länkningen lyckats

Ex. på träningsdata för SMT Regeringsförklaringen 1988 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Ordlänkning - samförekomst Sveriges neutralitetspolitik är av avgörande betydelse för vårt lands fred och oberoende. Sweden s policy of neutrality is of decisive importance for our peace and independence. Neutralitetspolitiken stöds av ett starkt försvar till värn för vårt oberoende. Our policy of neutrality is underpinned by a strong defence. That safeguards our independence.

Fraslänkning Kring denna politik finns en bred politisk uppslutning. There is wide popular support for this policy.

Ord- och fraslänkning Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Google Translate Statistisk maskinöversättning 90 språk, 24 nya på gång För ett nytt språkpar behövs en översättningskorpus på minst 1 miljon ord och enspråkiga korpusar på över 1 miljard ord vardera (F. Och) De mogna språken ger bättre resultat än de nya Svenska kom in 2008 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Google sv-en Under tiden stannade bilen. Meanwhile, the car stopped. Under tiden somnade studenten. Meanwhile fell asleep student. Var snäll och skriv under här. Please write in here. Bara ett under kan rädda tidningen Only a miracle can save the newspaper Det var ett Herrans under It was a Lord over Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Mer träningsdata Kan Google förbättras? börjar bli bristvara, kräver ej maskinöversatt text Bygga in grammatik syntax och semantik Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Maskinöversättning i praktiken Maskinöversättning + postredigering för publicering Maskinöversättning som stöd för mänskliga översättare Snabb råöversättning - gisting Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Ex. på post-redigering Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Forskning i fokus Utvärdering manuell och automatisk Hybridsystem kombination av regelbaserade och statistiska system Maskininlärning av grammatisk struktur från annoterade korpusar Beroenden över meningsgränserna t.ex. syftningsproblem Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Ett syftningsproblem She dropped the vase on the floor. It broke. Hon tappade vasen i golvet. Den/Det? gick sönder. Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein

Bortom gränsen Litterär översättning Översättning som bygger på kunskap som inte kan formuleras lingvistiskt eller som inte finns tillgänglig i översatt form på nätet Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein