Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

Storlek: px
Starta visningen från sidan:

Download "2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder"

Transkript

1 Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder 1

2 Leibniz, tidigt 1600 tal Descartes, tidigt 1600 tal Petr Smirnov Troyanskii, sent 1930 tal Becker 1661 Artsrouni ca

3 3

4 Entusiastiskt 1950 tal Samarbete IBM University of Georgetown Översättningssystem ryska engelska, med 250 ord och 6 grammatiska regler Demonstrerades 1954 Transferteknik Noam Chomsky född 1928 Stödde till en början transferteknik. Motsätter sig synen att språket har en stark logik Hävdade från tidigt 1960 tal att oregelbundenheter och undantag gör det inte bara praktiskt, utan även principiellt omöjligt, att åstadkomma god maskinöversättning. Warren Weaver ( ) Ryska språket, ett chiffer som döljer budskapet Chiffreringen är logisk Med rätt nyckel kan budskapet dechiffreras 4

5 ALPACrapporten 1966 We are not impressed ALPAC (Automatic Language Processing Advisory Committee) konstaterade 1966 att de dittillsvarande resultaten av MT var otillfredsställande och att det inte fanns anledning att tro på förbättring. Rapporten ströp USA:s statliga finansiering av MT forskning. 5

6 Fortsatt utveckling av MT i det tysta under 1900 talets senare del, med svag finansiering Otillräcklig datorkapacitet fortfarande den trånga sektorn Från 1980 talet koncentrerades näringslivets intresse på CAT, snarare än på MT Fungerande system utvecklades Kanadensiska MÉTÉO har översatt väderrapporter mellan engelska och franska sedan sent 1970 tal. Det var i drift i drygt 20 år, fram till 2001, MÉTÉO översatte ca ord/dag. Systemet har sedan ersatts av modernare produkter. SYSTRAN MT system av transfertyp föddes i IBM Georgetownjktt1954 levererar idag MT till Yh Yahoo, BblFi Babel Fish, US Dept of Defense och projektet EU 6

7 Tidigt 2000 tal en ny aktör träder in på marknaden Statistisk maskinöversättning 7

8 Statistisk MT Imiterar ett barns språkinlärning Lär sig känna igen mönster och imiterar dem Lär sig glosor Behöver inte lära sig grammatik eller syntax Statistisk MT gör inte anspråk på att förstå källtexten på någon nivå Analyserar y inte källspråket, men ger intryck av att göra det All översättning från statistisk MT är tidigare mänsklig översättning Statistisk MT kan bli suveränt bra på rutinöversättning, men kan inte i sig bli nyskapande Utnyttjar modern datorteknik till max Ofantliga datamängder kan lagras, struktureras och hanteras 8

9 Datorkapaciteten har hunnit ikapp MT utvecklarna Statistisk MT finlirar inte Går det inte med dynamit så går det kanske med mera dynamit 9

10 Men jag då Hur mycket kommer att maskinöversättas? Hur mycket behöver översättas? Hur mycket mänsklig översättning köper näringslivet? Hur bra är Good enough? 10

11 Hur mycket kommer att maskinöversättas? Beror på vad som är Good enough Hur mycket behöver översättas? Ungefär obegränsat mycket Hur mycket mänsklig över sättning köper näringslivet? Begränsat mycket 11

12 Hur ser världens största översättningsföretag på MT? Europeiska kommissionens generaldirektorat för översättning Sysselsatte 1750 översättare och producerade 2,1 miljoner sidor år Omsätter årligen ca 1 miljard euro. GDT:s trånga sektor är i första hand volymen text som ska översättas kapacitet saknas. Kommentar från European Court of auditors (Europeiska revisionsrätten): There ees is a lot of overquality delivered e ed in the EU. Sometimes good enough is enough. 12

13 Eeee jag har en text här som redan är översatt. Den bh behöver bara kollas för säkerhets skull och kanske fixastilllite lite. Intemycket jobb alls. Kan du åta dig det? Betyder: Texten är körd genom Google Translate och ser rätt hemsk ut, men jag vill att du efterredigerar den till 20 % av priset för en vanlig översättning 13

14 Vår klassiska priskonstruktion har gjort sitt Ofta översätter vi 80 % av texten på 20 % av tiden och ägnar resterande 80 % av tiden åt resterande 20 % av texten Så länge vi fortsätter ta betalt per ord uppstår kontroverser Men tar du lika mycket betalt för små prepositioner som för de långa och svåra orden??? Kunder kan se en möjlighet att få mycket jobb för lite pengar Vi måste lära våra kunder vad efterredigering kostar. Ordpriset har gjort god tjänst men vad ersätts den med? Paketpris? ev. med specifik debitering för efterredigering? 14

15 Var finns våra jobb i framtiden? MT är högaktuellt för oss i branschen men är lite känt i näringslivet. (Näringslivet vet inte ens vad CAT verktyg är) Efterredigering (post editing) kan bli en stor bransch Förredigering (pre editing) är en växande sektor med klassiska rötter Varför låta MT vara ett hot det kan bli ett verktyg som CATverktygen blev Om mycket text översätts maskinelltkan kan näringslivets resurser frigöras för översättning med mänsklig kvalitet Det kommer under överskådlig tid att finnas behov av översättning Det kommer under överskådlig tid att finnas behov av översättning med mänsklig kvalitet. 15

16 Framtida utveckling MT kommer att bli allt bättre Statistisk MT kommer att kombineras med transferteknik Datorer blir allt snabbare och erbjuder allt mera minne MT kommer att bli allt mer integrerat med CAT verktyg Artificiell intelligens utvecklas 16