Korpusbaserad Maskinöversättning

Storlek: px
Starta visningen från sidan:

Download "Korpusbaserad Maskinöversättning"

Transkript

1 Linköpings Universitet Institutionen för Datavetenskap Artificiell Intelligens, HKGBB0, HT 2002 Korpusbaserad Maskinöversättning Anna Hillertz KogVet 3, fack14 1

2 Innehållsförteckning 1. Inledning och syfte.s Bakgrund till maskinöversättning s Korpusbaserad maskinöversättning.s Textkorpus..s Parallellkorpus s The Linköping Translation Corpus..s Jämförelse av texter i en översättningskorpus.s Word Alignment Systems s The Linköping Word Aligner..s Alignmentprocessen.s Diskussion..s Referenser..s. 14 2

3 1. Inledning och syfte Jag har alltid varit fascinerad av språk och det faktum att människor med vitt skilda bakgrund och modersmål kan förstå varandra på ett eller annat sätt. Att kunna översätta ett språk till ett annat är otroligt viktigt, särskilt som vi lever i en värld som tycks krympa genom att vi lätt kan förflytta oss mellan världsdelar och eftersom det som händer på andra sidan jorden är viktigt även för oss. Det är inte bara i ett så stort perspektiv som konsten att kunna översätta ett språk är viktig, den konsten är viktig i alla sammanhang. Sverige är numera, liksom många andra länder, ett land i ständig förändring och med en multikulturell befolkning och det är viktigt för alla människor att få information om vad som händer i samhället. Även om man behärskar språket i det land man för tillfället befinner sig i, kan det vara en trygghet att ha möjlighet att få informationen presenterad även på sitt modersmål. Det är viktigt för alla som lever och verkar i ett samhälle oavsett var att man skall kunna få ta del av det samhällets har att säga, det är viktigt att varje människa har chansen att få veta vad som händer runt omkring henne. Med tanke på hur viktigt det är att kunna kommunicera med andra människor för att få veta hur saker och ting är, och för att skapa mer förståelse mellan människor, anser jag att forskningen om maskinell översättning mellan språk är viktig. Det är viktigt att översättning kan ske snabbt, då vi lever i en värld där saker och ting förändras förunderligt snabbt och det som sagt är viktigt för människor att få veta vad som händer omkring dem. Genom att göra den här fördjupningsuppgiften om korpusbaserad maskinöversättning vill jag ta reda på hur denna typ av översättning fungerar, och vad som gör den bättre än den traditionella maskinöversättningsforskningen. Den här typen av översättning, då man använder redan existerande översättningar är spännande, inte minst för att man här på Linköpings universitet håller på med just denna typ av forskningsprojekt. Jag kommer i den här rapporten att presentera två olika projekt från Linköpings Universitet. Dessa är The Linköping Translation Corpus och The Linköping Word Aligner. För att få en inblick i forskningen om maskinöversättning kommer jag till en början att kort beskriva maskinöversättningens historia för att sedan gå in på de olika projekten och vad de handlar om. 1

4 2. Bakgrund till maskinöversättning I Arons Machine Translation an introductory guide 1 återfinns följande beskrivning av maskinöversättning (MT) så här the attempt to automate all, or part of the process of translating from one human language to another. 2 Aron skriver vidare att MT är ett viktigt forskningsområde eftersom översättning av mänskliga språk spelar stor roll för hur vi ska kunna förstå varandra i ett mångkulturellt samhälle. Enligt Aron är det viktigt att kunna översätta från ett språk till ett annat ur politiska, sociala, kommersiella, vetenskapliga och filosofiska synvinklar. Översättning är viktigt för att vi ska kunna samarbeta över gränser och för att alla ska kunna ta del av vad som händer ute i världen, för hur det än är så behärskar vi alltid vårt modersmål bäst. Vad gäller den sociala och politiska aspekten av vikten av översättning, så är det särskilt viktigt i länder/samhällen där det finns mer än ett språk och detta gäller, tror jag, numera i de flesta länder. För alla dessa tillfällen då översättning är önskvärt i dagens samhälle, finns det alltför få mänskliga översättare. Detta gör att MT blir viktigt att utveckla så att vi får ett väl fungerande komplement till de mänskliga översättare som finns. Det är inte bara bristen på översättare som är ett problem för översättningsbranschen. Ett annat problem är att mänsklig översättning tar lång tid och kostar mycket pengar. En översättare i sig är dyr att anlita och jobbet går oftast inte att lösa alldeles snabbt. Om det till exempel har utvecklats en ny produkt av något slag som ska lanseras i ett land där man behöver översätta en instruktionsbok kan det bli förödande dyrt för företaget i fråga, ifall översättningen blir försenad. Förseningar inträffar lätt om man måste förlita sig på en enda mänsklig översättare. 3 Till alla de som inte tror på MT, och som tänker att i fall man kan utveckla och förbättra MT så kommer den automatiserade översättningen ta över och göra alla översättare arbetslösa, säger Aron att detta aldrig kommer att hända. Anledningen är att materialet som behöver översättas verkar komma från en aldrig sinande källa och det bara vore bra om översättarna kunde få hjälp med de mest tidsödande uppgifterna, som till exempel att slå upp ord i en ordbok. När översättaren får hjälp med detta kommer han istället ha tid till att förbättra och 1 Aron Machine Translation- an introductory guide. (web-upplaga) 2 Aron, s.1 3 Aron, s. 5 2

5 klargöra det han vill förmedla med sin översatta text och dessutom kunna översätta fler och viktigare texter. Från maskinöversättningens födelse, runt andra världskrigets slut 4 hade man förhoppningen att man med hjälp av det man vet i ett standardlexikon över två språk kunna översätta texter från det ena språket till det andra. Det man trodde vid den här tidpunkten var att en översättning skulle vara bra nog vid översättning ord för ord. Det har visat sig att det inte var så lätt att lyckas med denna uppgift. Enligt Aron är det av stor vikt att ha goda kunskaper om såväl källspråkets som målspråkets vokabulär för att lyckas göra en bra översättning lika viktigt är det att ha kunskap om språkets grammatik. 5 Efter flera bakslag för MT, då man hade insett svårigheterna och förstått att den första förhoppningen gällande MT var för naiv, var det stiltje i forskningen ett tag, fram till 70-talet då maskinöversättningen kom in i sin renässans. Utvecklingen från den första MT har resulterat i flera olika system och försök till en perfekt översättning. Maskinöversättningsforskningen har delat upp sig och det är i USA och Japan som man håller på med den traditionella MT: n, medan man i Europa arbetar mer med Translator Workstations. Translator Workstations är översättningsmiljöer som innehåller komponenter som kan höja produktiviteten på översättare, till exempel översättningsminne Korpusbaserad maskinöversättning 3.1 Textkorpus Enligt Bonniers Svenska Ordbok förklaras ordet korpus med en textmängd som man går igenom som grundval för en ordbok. 7 En korpus kan enligt Merkel delas in i olika typer, beroende på vad för sorts texter de innehåller. 8 Korpusar kan bestå av texter från ett speciellt område, eller vara texter i allmänhet. Vidare kan det vara både talad och skriven text och texterna kan vara enspråkiga, tvåspråkiga eller flerspråkiga. I en artikel av Ahrenberg et. al står det att läsa att det är generellt sant för en korpus, att ju mer information den blir matad 4 Aron, s.13 5 Ibid, s.10 6 Merkel, Magnus Understanding and enhancing translation by parallel text processing, s.27 7 Malmström, Györki, Sjögren Bonniers svenska ordbok. s Merkel, s. 8 3

6 med, desto mer kunskap finns att få ut från den. Författarna menar att detta måste vara sant även för parallella korpusar. 9 Ända sedan 1960-talet har man inom lingvistiken arbetat med korpusar. Från början använde man benämningen för skapandet av en kropp med autentiskt språkdata. 10 Numera är korpuslingvistik mer förknippat med språkmaterial i elektroniskt format och alla de olika sätt på vilka man kan analysera och använda sådana data. 3.2 Parallellkorpus Både enspråkiga och flerspråkiga korpus kan delas upp i parallella och ickeparallella korpus. Den vanligaste korpusen är den som innehåller en eller flera texter, från ett och samma språk. Merkel skriver om att det finns parallella korpusar även inom ett språk, och att dessa används till att jämföra till exempel dialektala skillnader eller skillnader mellan talat och skrivet språk. 11 Även flerspråkiga korpusar kan vara av både parallellt och ickeparallellt slag. Ickeparallella flerspråkiga korpusar kan användas i jämförelsestudier, men i stället för att jämföra en text med sin översättning till ett annat språk kan studien handla om att jämföra en och samma text på två olika språk eller så kan man studera två olika översättningar av en och samma text. Om korpusen är parallell består den av en källtext och dess motsvarande måltext (alltså dess översättning), som faktiskt skulle kunna vara fler än en text. Vad gäller arbete med parallella korpusar, handlar detta främst om tvåspråkiga texter, men det verkar, menar Merkel, som att det i framtiden kommer att behövas även flerspråkiga parallella korpusar. 12 Men han anser att så länge uppgiften med korpusarna är att studera översättning, måste man betrakta flerspråkiga parallella texter som en serie tvåspråkiga parallella korpusar som delar på samma originaltext. Merkel menar att det idag är vanligast med enspråkiga korpusar men att utvecklingen går mot fler och fler tvåspråkiga och flerspråkiga korpusar. De flesta texter i en parallellkorpus är länkade till varandra på meningsnivå. 9 Ahrenberg, Andersson, Merkel., A system for Incremental and Interactive Word Linking, s.1 10 Merkel, s.7 11 Ibid, s.8 12 Ibid, s.9 4

7 Tex t k orpus Enspråk ig Flerspråk ig Parallel l Ic k eparallell Parallell Ic k eparallell Fig1 Olika typer av korpusar 4. The Linköping Translation Corpus (LTC) LTC består av engelska källtexter översatta till svenska. Texterna som översätts kommer i huvudsak från två olika typer av texter, användarguider till datorprogram och skönlitteratur. Det finns även en dialogtext i korpusen som är maskinöversatt, och som finns där för att man ska kunna jämföra de olika översättningssätten. Det finns sammanlagt åtta texter i korpusen, varav fyra är översatta av människor, tre med hjälp av översättningsverktyg, i första hand översättningsminne och en, som sagt tidigare, med fullkomligt automatiserad översättning. Tabell1. En översikt över LTC Texttyp Originalspråk Målspråk Titel Översättningsmetod Användarguide engelska svenska Microsoft Access Mänsklig trad. Användarguide engelska svenska Microsoft Exel Mänsklig trad. Användarguide engelska svenska IBM OS2 Översättningsminne Användarguide engelska svenska IBM InfoWin Översättningsminne Användarguide engelska svenska IBM Client Access Översättningsminne Roman engelska svenska Gordimer: A guest.. Mänsklig trad. Roman engelska svenska Bellow: To Jerusa Mänsklig trad. Dialog text engelska svenska ATIS dialouges Automatisk (MT) Texterna som är länkade till varandra innehåller också information om hur meningarna mappar varandra. Med mapping menar man, hur antalet meningar av en text överensstämmer med antalet meningar i den översatta texten. Mapping återkommer vi till senare i rapporten. 5

8 Meningen med en översättningskorpus är antingen att man ska kunna ta fram det som är karaktäristiskt för översättningen i sin helhet, eller om man kan avgöra ifall översättningen är orienterad mot sitt källspråk eller mot målspråket. Översättningskorpusen kan användas för att träna statistiska modeller för maskinöversättning, eller för att hitta ordassociationer. De befintliga översättningar som finns i översättningskorpusen används för att hitta mönster och konstruktioner som kan utgöra en bas vid skapandet av grammatik och komponenter i maskinöversättningsapplikationer Jämförelse av texter i en översättningskorpus Med enkla verktyg och genom att analysera generella data från korpusen, det vill säga originaltexten och dess översättning, kan man göra observationer om korpusen. Men för att kunna göra mer exakta och detaljerade observationer måste texterna vara parallella och ha blivit alignade. 14 Detta kommer rapporten att ta upp senare, till en början tittar vi på vad man kan göra med de data man direkt får ut ur korpusen. Det visade sig att de romaner som finns med i korpusen, var de texter som innehöll längst meningar och flest olika ord. Romanerna hade inte ofta samma meningar förekommande mer än en gång, vilket var vanligt i flera av de andra texterna. Man kan utan att ändra något inuti korpusen sätta upp kriterier för att kunna jämföra varje text med sin översättning. Den maskinöversatta texten i korpusen skiljer sig från de andra då den är mycket kortare och inte är uppbyggd på samma sätt som de andra, och därför inte är riktigt jämförbar med resten av texterna. Det går alltså till så att korpusens texter först analyseras oberoende av varandra och därefter kan man jämföra dem för att se hur väl en översättning överensstämmer med sin källa. Arbetet med dessa analyser är av vikt för maskinöversättningssystem, och framtagning av översättningsstöd liksom översättningsminnen och flerspråkiga lexikon Merkel, s.8 14 Ibid, s VINNOVA hemsida Korpusbaserad maskinöversättning, s.1 6

9 Vid jämförelsen mellan en text och dess översättning kunde man se samma mönster i hur texterna var uppbyggda. Korpusen visade att den översatta texten i det stora hela följde sin källtext i fråga om meningslängd, ordmängd med mera. Tabell2. Generell data över originaltexter 16 Access Exel OS2 InfoWin Client Gord Bellow ATIS ORD MENINGAR UPPREPNINGAR UPPREPNINGAR I % 14,70% 13,62% 13,93% 31,10% 17,55% 0,18% 0,01% 0,00% Tabell3. Generell data över översättningarna 17 Access Exel OS2 InfoWin Client Gord Bellow ATIS ORD MENINGAR UPPREPNINGAR UPPREPNINGAR I % 11,37% 13,06% 9,84% 39,26% 18,70% 0,31% 0,02% 0,00% Även om siffrorna i tabell 2 och 3 skiljer sig åt, kan man ändå urskilja ett mönster och se att textsammansättningen i originalform och i översatt form liknar varandra. De två romanerna, (Gord och Bellow) har både i original och i översättningen det högsta antalet ord och likaså de meningar med flest antal ord i. Romanerna har dock inte någon hög frekvens av återkommande meningar, vilket stämmer väl överens med hur en roman brukar vara uppbyggd. Jag anser att det inte är något som en romanförfattare borde eftersträva i sitt skrivande och det är inte heller så vanligt att man läser en roman full med upprepningar. Annat man ser i tabellen är att de olika tekniska användarmanualerna är lika i hänseende till antal ord och meningslängd Om man ser till tabellen nedan, finns det bara en enda text som har fler ord på svenska jämfört mot engelska, som är texternas originalspråk, och det är romanen av Gord. Merkel skriver att det kan antas att de svenska översättningarna skall ha färre ord, med tanke på att svenskan har fler sammansatta ord än engelskan, och likaså att den bestämda artikeln the och det engelska verbet do ofta inte har någon motsvarighet i svenskan. 18 Kanske skulle det kunna vara så att just texter av fiktionstyp kan innehålla fler ord i en översättning, men eftersom den andra romanen liksom resten av texterna innehåller färre ord kan man inte dra en slutsats om detta, 16 Merkel, Comparing source and target texts in a translation corpus, s.2 17 Ibid, s.2 18 Ibid, s.2 7

10 skriver Merkel vidare. En orsak till varför det blir fler ord i en översättning av en roman när det vid andra översättningar blir färre ord, skulle enligt Merkel kunna vara att mer information kan antas bevaras (alternativt läggas till) i fiktionsöversättningar gentemot till exempel manualöversättningar. 19 Tabell4. Förhållande mellan originaltextens och den översatta textens antal meningar, ord och upprepningar Access Exel OS2 InfoWin Client Gord Bellow ATIS MENINGAR 0,98 0,97 1,02 1,01 0,99 0,92 0,98 1 ORD 1,14 1,11 1,28 1,29 1,27 0,94 1,02 1,06 UPPREPNINGAR 1,29 1,04 1,09 0,79 0,94 0,58 0,5 N/A Gällande återkommande meningar i en text hade man två hypoteser innan man började jämföra data ur LTC. Hypoteserna var (a) texter översatta med translation memories kommer att ha minst lika många upprepande meningar i översättningen som i originaltexten och (b) översättare som inte använder sig av translation memories eller andra datorverktyg kommer att svårare för att känna igen upprepningar i originaltexten. Om värdet på upprepningar i Tabell 3 är exakt 1 innebär det att originaltexten och dess översättning innehåller precis lika många upprepade meningar. Är värdet högre än 1 har originaltexten ett högre antal upprepade meningar och är värdet mindre än 1 gäller alltså det motsatta. 20 I tabellen ovan ser vi att InfoWin och Client har värden under 1, vilket alltså innebär att översättningen av dessa texter innehåller fler upprepade meningar än originaltexten. Detta stämmer överens med den första hypotesen, eftersom InfoWin och Client dessutom är texter som är översatta med hjälp av translation memories. De två Microsofttexternas (Access och Exel) resultat stämmer överens med den andra hypotesen och har alltså färre upprepningar i de översatta texterna jämfört med originaltexterna. Det finns en text i korpusen (OS 2) som inte passar in i mönstret, då den har ett högre antal upprepningsmeningar i originaltexten trots att den är översatt med hjälp av translation memories. 21 Som sagt tidigare, finns det en slags verktygslåda för översättningsanalys. De verktyg som finns är implementerade i en grafisk och användarvänlig miljö med namnet DAVE 19 Merkel,Understanding and enhancing translation by parallel text processing, s Merkel, Comparing source and target texts in a translation corpus, s.2 21 Merkel, Comparing source and target texts in a translation corpus, s.2 8

11 (Diagnosis, Alignment and Verification for the Editor). 22 De olika verktygen används till ett flertal olika saker, till exempel kan de skapa parallella texter, de kan diagnosticera originaltexter och dessa texters översättningar och de kan utvärdera översättningar. Det finns två syften med verktygen, varav det ena är att de kan hjälpa översättare att göra översättningarna mer effektiva och det andra att de kan hjälpa till med att skapa parallella texter. Dessa verktyg var med om att skapa och analysera Linköping Translation Corpus. 5. Word alignment system De automatiska word alignment systems som finns idag är än så länge inte så pass bra att de kan ge fullkomliga alignments. Men eftersom processen att göra samma sak manuellt tar lång tid och därmed också är kostsam, så vore det bra om man kunde samköra människans och datorns färdigheter i detta ämne. Med människans kunskaper skulle man få den exakthet som önskas och med datorns hjälp skulle processen gå snabbare. Ahrenberg et. al anser att ett samarbete mellan människa och datorer i den här uppgiften talar för att man borde ha ett interaktivt system, som direkt kan lära sig av användaren och att den automatiska alignern därmed skulle kunna utvecklas under arbetets gång. 23 Ett word alignment system strävar efter att beskriva hur ord och sammansättningar av ord i originaltexten är relaterade till ord och sammansättningar av ord i den översatta texten. Systemet söker hitta så många motsvarigheter som möjligt till de olika textenheter den har att jobba med. När enheterna har länkats till varandra kan ett lexikon, som är tvåspråkigt, genereras. Det lexikon man får blir specifikt för översättningen och kan senare användas som grund för ett liknande översättningsproblem. Enligt Ahrenberg et. al är de flesta word alignment systems som för närvarande finns automatiska, och de arbetar med parallella korpusar för att generera likheter mellan ordtyper. Word alignment som görs manuellt, har mest använts för att skapa gold standards (referensdata) i utvärderingssyfte Merkel, s Ahrenberg, Andersson, Merkel, A System for Incremental and Interactive Word Linking, s.1 24 Ibid, s. 1 9

12 En fullständigt länkad översättningskorpus skulle vara önskvärd vid maskinöversättning eftersom en sådan skulle utgöra en väldigt bra grund för generering både av statistisk och av lingvistisk data. Överhuvudtaget skulle fullständig word alignment vara bra, eftersom det i flera av översättningsforskningens områden skulle bringa fram bättre resultat. 25 Ahrenberg et. al skriver att det är önskvärt med fullkomlig word alignment, men att det inte är lätt att uppnå. Det är så att även en människa som är expert inom området har svårt att avgöra vad som står i relation till vad i två motsvarande texter. Av denna anledning är det viktigt att systemet får detaljerade riktlinjer. Enligt Merkel kan man se word alignment systems som ett slags verktyg som plockar ut data ur en bitext (det vill säga en text och dess länkade översättning). 26 Ett sådant här system kan tjäna två syften. Det ena, som är det än så länge dominerande, är att ta fram lexikala data för ett tvåspråkigt lexikon. Det andra syftet är att det kan hålla med data i form av fullständiga länkade texter till maskinöversättning och översättningsstudier. 6. The Linköping Word Aligner (LWA) LWA är en automatisk word aligner som har funnits sedan Systemet är knowledgelite, vilket innebär att det inte måste få kunskap från källor som lexikon och grammatik, utan kan lära sig från olika håll. Skillnaden mot ett knowledge-intensive inriktning på ett system är att varje ny input i ett sådant fall måste föregås av en stor mängd lingvistisk information. Merkel menar att i språk där de lingvistiska källorna kommer till korta kan ett knowledge-lite tillvägagångssätt vara den enda möjliga lösningen. 28 Systemet får indata i form av en bitext (originaltexten och dess översättning länkade på meningsnivå) och denna text är uppdelad i mindre delar. Uppgiften för LWA är att kunna länka ihop orden i de båda texterna och utifrån länkarna skapa ett översättningslexikon. Systemet kan ge output i två olika former, antingen som ett översättningslexikon eller som en alignment av en hel text. Exempel på hur utdata kan se ut följer nedan i två figurer. 25 Ahrenberg et. al s.2 26 Merkel, s Ahrenberg et. al s Merkel, s

13 Fig2. Output från LWA, alignment av hel text 29 SOURCE: this CHAPTER TELLS YOU HOW TO SET UP MICROSOFT ACCESS ON A STAND- ALONE COMPUTER OR ON A NETWORK WORKSTATION TARGET: I detta KAPITEL BESKRIVS HUR DU INSTALLERAR MICROSOFT ACCESS PÅ EN FRISTÅENDE DATOR ELLER PÅ EN DATOR i ett NÄTVERK chapter=> kapitel (2=>3) tells=> beskrivs (3=>4) you=> du (4=>6) how=> hur (5=>5) to=> i (6=>1) set up=> installerar (8=>7) Microsoft access=> Microsoft access (10=>8) on=> på (11=>10) a=> en (12=>11) stand-alone=> fristående (13=>12) computer=> dator (14=>13) or=> eller (15=>14) on=> på (16=>15) a=> en (17=>16) network=> nätverk (18=>20) workstation=> dator (19=>17) De länkade orden i Fig2 är de som är skrivna med versaler. Siffrorna inom parentes visar förhållandet mellan ordens placering i den engelska respektive den svenska texten. Det engelska ordet chapter, som är det andra ordet i den engelska meningen motsvaras av ordet kapitel som är placerat som ord nummer tre i den svenska översättningen av texten. Fig3. Output från LWA tvåspråkigt lexikon Fig2 hämtad från Merkel, s Fig3 hämtad från Merkel, s

14 Source item / / foreign minister foreign policy foreigners foreman foremost forestall forget form / / Target item(s) utrikesministern, utrikesminister, utrikespolitik, utlänningar, ordförande, främsta, främst, fransmännens, glömma, glömmer, form, formen, utgör, gestalt I Fig3 visas hur utdata i form av ett tvåspråkigt lexikon kan se ut. Det händer i vissa fall att ord i källtexten länkas till fler än ett ord i måltexten, som i fallet foreign minister. Algoritmen bakom LWA är iterativ, den upprepar samma process till dess att det inte längre finns något översättningspar kvar att generera eller när den har gått igenom ett i förväg givet antal iterationer. Processen består av att generera översättningspar från texten och reducera texten genom att plocka bort de par som hittats innan nästa körning. Förutom den lingvistiska information som finns i de kommenterade käll- och måltexterna, använder sig systemet av två olika uppsättningar källor för sin process. Dessa källor består av statiska och dynamiska data. Den statiska källan innefattar till exempel fördefinierade lexikon, medan det dynamiska datakällan byggs upp under länkningsprocessens gång. 6.1 Alignmentprocessen I det fall då det finns en användare som kan ändra i systemet, så att det senare kan lära sig saker under processens gång fungerar på följande sätt. (1) Den parallella korpusen blir automatiskt alignad på ord- och frasnivå. (2) Användaren väljer ett antal meningspar av de som redan har blivit automatiskt alignade. (3) Användaren ändrar och rättar det som han anser vara fel och lägger till länkar om han anser att sådana saknas någonstans. När användaren anser att allt är rätt, sparar han den nya versionen. (4) Den dynamiska källan av data ses över och uppdateringar kan göras. (5) Den automatiska länkningsprocessen återupptas och körs på de återstående meningarna. LWA har tillgång till den dynamiska datakällan som har blivit uppdaterad och förbättrad. 12

15 (6) En ny mängd av meningspar väljs ut och processen körs åter från steg Tack vare att den dynamiska källan växer förbättras systemet i sin automatiska fas, och den person som interagerar med systemet behöver utföra mindre och mindre arbete. 7. Sammanfattning och reflektioner Den här rapporten syftade till att presentera korpusbaserad översättning genom att beskriva två olika projekt, The Linköping Translation Corpus och The Linköping Word Aligner. En korpus består av en eller flera texter, vilka kan vara parallella eller ickeparallella. The Linköping Translation Corpus är en parallell korpus som består av engelska källtexter översatta till svenska. Parallella översättningskorpusar verkar bidra till att utvecklingen för maskinöversättning går framåt. Den största skillnaden mot traditionell maskinöversättning är att korpusen ser till så mycket mer än bara översättning ord för ord. Med hjälp av en översättningskorpus kan man komma fram till mönster för en specifik översättning som sedan kan användas för liknande uppgifter. Man kan med enkla medel göra observationer gällande texterna i korpusen, men för att kunna göra mer detaljerade analyser måste de båda parallella texterna ha blivit länkade till varandra, alignade. För att kunna göra en sådan analys lät man texterna bli länkade av The Linköping Word Aligner. Ur LWA kan man få två olika typer av utdata, antingen som ett tvåspråkigt lexikon eller som en länkning av en hel text. LWA bidrar till en mer exakt analys av korpusen som därmed kan bli bättre för kommande översättningar. LWA är ett system som själv lär sig under tiden som den arbetar och kombinationen mellan människa och dator som jobbar tillsammans tror jag bäddar för den bästa möjliga lösningen för maskinöversättning. 8. Referenser INTERNET 31 Ahrenberg et. al s. 3 13

16 Ahrenberg, L, Andersson, M, Merkel, M, A System for Incremental and Interactive Word Linking. (021003) Arnold D. J., L. Balkan, R. Lee Humphreys, S. Meijer & L. Sadler. Machine Translation: an Introductory Guide. (020926) EAMT, The European Association for Machine Translation. What is Machine Translation?. (020926) Merkel, M, Comparing source and target texts in a translation corpus (021004) VINNOVA hemsida (021003) LITTERATUR Györki, Sjögren Bonniers svenska ordbok, 6: e upplagan, (Stockholm, 1994) Merkel, M, Understanding and enhancing translation by parallel text processing, (Linköping 1999) 14

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet

Läs mer

Maskinöversättning 2008

Maskinöversättning 2008 Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954

Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954 Projekt i språkteknologi Projektförslag Johanna Karlsson 870411-7129 joka1954 1. Inledning Opus är en växande parallell korpus med data från många olika språk (Tiedemann, 2009). Data som finns i OPUS i

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Statistisk Maskinöversättning eller:

Statistisk Maskinöversättning eller: 729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...

Läs mer

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder 1 Leibniz, tidigt 1600 tal Descartes, tidigt 1600 tal Petr Smirnov

Läs mer

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...

Läs mer

Skrivning i översättningsvetenskap (OP5)

Skrivning i översättningsvetenskap (OP5) UPPSALA UNIVERSITET Institutionen för lingvistik och filologi Skrivning i översättningsvetenskap (OP5) Lördagen den 28 oktober 2006, kl. 10.00-14.00 Engelska parken, Geijersalen Namn:. Personnummer: Adress:

Läs mer

Word-guide Introduktion

Word-guide Introduktion Word-guide Introduktion På det kognitionsvetenskapliga programmet kommer du läsa kurser inom flera olika vetenskapsområden och för varje vetenskapsområde finns ett speciellt sätt att utforma rapporter.

Läs mer

Kursplaneöversättaren. Lina Stadell

Kursplaneöversättaren. Lina Stadell Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad

Läs mer

Framsida På framsidan finns:

Framsida På framsidan finns: Framsida På framsidan finns: Rubriken på hela arbetet Namnet på den eller de som gjort arbetet Klass Någon form av datering, t.ex. datum för inlämning eller vilken termin och vilket år det är: HT 2010

Läs mer

Skriv! Hur du enkelt skriver din uppsats

Skriv! Hur du enkelt skriver din uppsats Skriv! Hur du enkelt skriver din uppsats Josefine Möller och Meta Bergman 2014 Nu på gymnasiet ställs högra krav på dig när du ska skriva en rapport eller uppsats. För att du bättre ska vara förberedd

Läs mer

Grafisk visualisering av en spårbarhetslösning

Grafisk visualisering av en spårbarhetslösning Datavetenskap Opponenter Johan Kärnell och Linnea Hjalmarsson Respondenter Agni Rizk och Tobias Eriksson Grafisk visualisering av en spårbarhetslösning Oppositionsrapport, C-nivå Report 2011:06 1. Generell

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits Humanistiska fakultetsnämnden Utbildningsplan för översättarprogrammet, 120 högskolepoäng Professional Translation Programme, 120 higher education credits Avancerad nivå/second Cycle 1. Beslut om fastställande

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN MASKINÖVERSÄTTNING Datorn behöver statistik och grammatik ANNA SÅGVALL HEIN Det är lätt att skoja med en del resultat av maskinöversättning: Vad kan vi lära av det blir What can we faith of it. Då gör

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, SMT En fördjupning i statistiska maskinöversättningssystem johka299@student.liu.se 2010-10-01 Innehållsförteckning 1. Introduktion till översättning...

Läs mer

Maskinöversättning. F Anna Sågvall Hein

Maskinöversättning. F Anna Sågvall Hein Maskinöversättning F1 2008 Anna Sågvall Hein Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och

Läs mer

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell

Läs mer

HUMANISTISKA FAKULTETEN G 2016/492

HUMANISTISKA FAKULTETEN G 2016/492 HUMANISTISKA FAKULTETEN G 2016/492 H2ÖPR Översättarprogrammet, 120 högskolepoäng Avancerad nivå/second cycle Fastställande Utbildningsplanen är fastställd av Humanistiska fakultetsstyrelsen 2016-12-xx

Läs mer

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng

ÖU2100, Översättarutbildning 1. Magisterutbildning, 60 högskolepoäng Humanistiska fakultetsnämnden ÖU2100, Översättarutbildning 1 Magisterutbildning, 60 högskolepoäng Professional Translation 1, 60 higher education credits Avancerad nivå Second Cycle 1. Fastställande Kursplanen

Läs mer

Visa vägen genom bedömning

Visa vägen genom bedömning Visa vägen genom bedömning För att du alltid ska veta var du befinner dig i din utveckling, har vi tagit fram Sveaskolans mål i olika ämnen och olika skolår. Dessa mål när du och läraren samtalar om vad

Läs mer

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter ASLA-information 24:1. 1998. 33 40. Lars Borin Uppsala universitet Institutionen för lingvistik Box 527 751 20 Uppsala Lars.Borin@ling.uu.se ETAP: Etablering och annotering av parallellkorpus för igenkänning

Läs mer

ATT ANVÄNDA SPRÅK FÖR ATT LÄRA SIG OCH ATT LÄRA SIG ANVÄNDA SPRÅK

ATT ANVÄNDA SPRÅK FÖR ATT LÄRA SIG OCH ATT LÄRA SIG ANVÄNDA SPRÅK ATT ANVÄNDA SPRÅK FÖR ATT LÄRA SIG OCH ATT LÄRA SIG ANVÄNDA SPRÅK Liisa Suopanki Carin Söderberg Margaretha Biddle Framtiden är inte något som bara händer till en del danas och formges den genom våra handlingar

Läs mer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens

Läs mer

Pre-editering och maskinöversättning. Convertus AB

Pre-editering och maskinöversättning. Convertus AB Pre-editering och maskinöversättning Bakgrund Convertus roll i DigInclude är att utveckla och tillhandahålla översättningstjänster för översättning av användarorienterad myndighetsinformation Översättning

Läs mer

FOR BETTER UNDERSTANDING. Snabbguide. www.wordfinder.se

FOR BETTER UNDERSTANDING. Snabbguide. www.wordfinder.se FOR BETTER UNDERSTANDING Snabbguide www.wordfinder.se Tekniska förutsättningar WordFinder 10 Professional för Mac kräver följande: Processor: Intel Mac OS X 10.5 eller senare. Installation Installation

Läs mer

En dansk version av detta dokument kan laddas ned här: http://itu.dk/ people/hagerman/retningslinjer.pdf (pdf, 500 kb)

En dansk version av detta dokument kan laddas ned här: http://itu.dk/ people/hagerman/retningslinjer.pdf (pdf, 500 kb) Denna guide är till för folk som gör hemsidor med Öresundsregionen som målgrupp. Vilket språk är bäst att använda sig av - danska, svenska eller eventuellt bägge? - eller kanske engelska? Hur riktar man

Läs mer

CS - Computer science. Datateknik Informationsbehandling Datalogi Datavetenskap (ÅA 2008)

CS - Computer science. Datateknik Informationsbehandling Datalogi Datavetenskap (ÅA 2008) CS - Computer science Datateknik Informationsbehandling Datalogi Datavetenskap (ÅA 2008) Vad datateknik INTE är: Att studera datorer Att studera hur man skriver datorprogram Att studera hur man använder

Läs mer

Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en

Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en o m e r f a r e n h e t o c h s p r å k Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en skapelseakt där

Läs mer

Översättningsminnen laboration

Översättningsminnen laboration Översättningsminnen laboration LÖT-kursen ht-07 Syfte Målet med laborationen är att få insikt i hur ett system för översättningsminnen fungerar och hur enkla termlistor används i översättningsprojekt.

Läs mer

KOMMUNIKATIVT LEDARSKAP

KOMMUNIKATIVT LEDARSKAP KOMMUNIKATIVT LEDARSKAP EN ANALYS AV INTERVJUER MED CHEFER OCH MEDARBETARE I FEM FÖRETAG NORRMEJERIER SAAB SANDVIK SPENDRUPS VOLVO Mittuniversitetet Avdelningen för medieoch kommunikationsvetenskap Catrin

Läs mer

Statistisk maskinöversättning

Statistisk maskinöversättning Statistisk maskinöversättning Åsa Holmqvist Asaho232 Artificiell Intelligens 729G43 Innehållsförteckning Introduktion... 1 Maskinöversättningens historia.... 1 Statistisk metod... 3 Brusiga kanalen....

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

729G G20 ht 2016 Kursintroduktion, översättningsteori 1. Lars Ahrenberg

729G G20 ht 2016 Kursintroduktion, översättningsteori 1. Lars Ahrenberg 729G20 729G20 ht 2016 Kursintroduktion, översättningsteori 1 Lars Ahrenberg 161003 Vad kursen handlar om Lokalisering, översättning och terminologi är praktiska verksamheter, dvs. arbeten som utförs av

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Travel Phrase Guide. Instruktionshäfte

Travel Phrase Guide. Instruktionshäfte Travel Phrase Guide Instruktionshäfte Sw Rätten till ändring av innehållet i detta dokument förbehålles utan föregående meddelande. CASIO COMPUTER CO., LTD. åtar sig inget ansvar för skador eller förluster

Läs mer

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum: Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer

Läs mer

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen)

Utbildningsplan för Masterprogram i översättning (Översättarutbildningen) Humaniora och teologi Utbildningsplan för Masterprogram i översättning (Översättarutbildningen) 1. Identifikation Programmets namn Masterprogram i översättning (Översättarutbildningen) Programmets namn

Läs mer

Publikationstyp Kapitel i bok, del av antologi

Publikationstyp Kapitel i bok, del av antologi Publikationstyp Kapitel i bok, del av antologi 1. Författare Fyll i lokalt användarid. ORCID-id är ett internationellt, unikt forskar-id. Ett ORCID-id innehåller 16 siffror: 0000-0002-1825-0097. Organisationstillhörighet

Läs mer

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE Språteknologi på SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE digital kompetens kring ordböcker, språkkontroller, korpusar och söktjänster! Följer teknikens påverkan på språk och språkanvändning! Bevakar språkteknisk

Läs mer

UTBILDNING & ARBETE Uppsatsskrivandets ABC

UTBILDNING & ARBETE Uppsatsskrivandets ABC UTBILDNING & ARBETE Uppsatsskrivandets ABC Borgarskolan Polhemsskolan Vasaskolan 1 Innehåll Abstract... 1 Analys... 1 Argument... 1 Bilagor... 1 Citat... 1 Enkät... 1 Fotnot... 1 Frågeställning... 1 Innehållsförteckning...

Läs mer

Översättningsuniversalier i svenska översatta texter

Översättningsuniversalier i svenska översatta texter EXAMENSARBETE VT 2014 MASTER I ÖVERSÄTTNING Specialisering i engelska Språk- och litteraturcentrum Översättarutbildningen Översättningsuniversalier i svenska översatta texter En undersökning av tecken

Läs mer

Vad är ett dokument? Gör så här

Vad är ett dokument? Gör så här Orsaken till att man överhuvudtaget använder en dator är ju för att genomföra ett arbete, producera ett resultat eller skapa något. Man skriver ett brev, ritar en bild eller kanske gör en kalkyl av något

Läs mer

Lokalisering, terminologi och översättning. Magnus Merkel

Lokalisering, terminologi och översättning. Magnus Merkel Lokalisering, terminologi och översättning Magnus Merkel Idag Kursformalia Innehåll Litteratur Schema & labbgrupper Artikelseminarier vad, vem, när och hur? Examination Lokalisering & översättning finns

Läs mer

Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg

Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg Datavetenskap Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg Oppositionsrapport, C-nivå 2006:12 1 Sammanfattat omdöme av examensarbetet Examensarbetet är intressant eftersom

Läs mer

Viktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med:

Viktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med: Viktoriaskolans kursplan i Engelska I år 2 arbetar eleverna med: UPPNÅENDEMÅL ENGELSKA, ÅR 5 TIPS År 2 Eleven skall Tala - kunna delta i enkla samtal om vardagliga och välbekanta ämnen, - kunna i enkel

Läs mer

1. (3p) Inom MDI-området framhåller man att människor lär sig via metaforer. Hur menar man att detta går till?

1. (3p) Inom MDI-området framhåller man att människor lär sig via metaforer. Hur menar man att detta går till? 1. (3p) Inom MDI-området framhåller man att människor lär sig via metaforer. Hur menar man att detta går till? Att lära sig via metaforer innebär att man drar nytta av kunskap som användaren redan har,

Läs mer

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1 Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut

Läs mer

Mälardalens högskola

Mälardalens högskola Teknisk rapportskrivning - en kortfattad handledning (Version 1.2) Mälardalens högskola Institutionen för datateknik (IDt) Thomas Larsson 10 september 1998 Västerås Sammanfattning En mycket viktig del

Läs mer

SEMESTERTIDER. Olof Röhlander i samarbete med Johny Alm

SEMESTERTIDER. Olof Röhlander i samarbete med Johny Alm SEMESTERTIDER Olof Röhlander i samarbete med Johny Alm Den blomstertid nu kommer.. underbara rader som sjungs över hela landet inom kort, rekreation och semester står för dörren! Hur är det i dessa tider

Läs mer

Sharpdesk V3.3. Installationsguide Version 3.3.03

Sharpdesk V3.3. Installationsguide Version 3.3.03 Sharpdesk V3.3 Installationsguide Version 3.3.03 Upphovsrätt 2000-2009 av SHARP CORPORATION. Eftertryck förbjudet. Reproduktion, adaptation eller översättning utan föregående skriftligt tillstånd är förbjudet,

Läs mer

Ting och tanke annars ingen teknik

Ting och tanke annars ingen teknik Ting och tanke annars ingen teknik Med teknik menar man att föremål används för ett bestämt syfte. Det är det som kapitlets namn syftar på. Ting och tanke betyder ungefär samma sak som föremål och syfte.

Läs mer

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen:

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen: Modul: Algebra Del 8: Avslutande reflektion och utvärdering Distributiva lagen Cecilia Kilhamn, Göteborgs Universitet Distributiva lagen a (b + c) = a b + a c Den distributiva lagen kallas den räknelag

Läs mer

Utbildningen i engelska har dessutom som syfte att vidga perspektiven på en växande engelsktalande omvärld med dess mångskiftande kulturer.

Utbildningen i engelska har dessutom som syfte att vidga perspektiven på en växande engelsktalande omvärld med dess mångskiftande kulturer. Kursplan i engelska Ämnets syfte och roll i utbildningen Engelska är modersmål eller officiellt språk i ett stort antal länder, förmedlar många vitt skilda kulturer och är dominerande kommunikationsspråk

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer

Stina Nyman 2012-09-16

Stina Nyman 2012-09-16 LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem

Läs mer

PMM (Process Maturity Metrics) Allmänt. Mätetal för framgångsfaktorer. 1. CM konfigurationsstyrning

PMM (Process Maturity Metrics) Allmänt. Mätetal för framgångsfaktorer. 1. CM konfigurationsstyrning PMM (Process Maturity Metrics) PMM är en metod för att mäta processmognad i utvecklingsprojekt. I korthet går metoden ut på att man utvärderar sin utvecklingsprocess med avseende på ett antal framgångsfaktorer

Läs mer

Lokalisering, terminologi och översättning

Lokalisering, terminologi och översättning Lokalisering, terminologi och översättning Magnus Merkel Idag Kursformalia Innehåll Litteratur Schema & labbgrupper Artikelseminarier vad, vem, när och hur? Examination Lokalisering & översättning finns

Läs mer

EasyConverter, version 4 Kom igång guide

EasyConverter, version 4 Kom igång guide EasyConverter, version 4 Kom igång guide EasyConverter omvandlar olika slags källdokument till mer tillgängliga, alternativa format. Med EasyConverter kan du Skanna tryckt text direkt in i EasyConverter.

Läs mer

Gymnasiearbete Datum. Uppsatsens rubrik. Ev. underrubrik. Ditt namn, klass Handledarens namn

Gymnasiearbete Datum. Uppsatsens rubrik. Ev. underrubrik. Ditt namn, klass Handledarens namn Gymnasiearbete Datum Uppsatsens rubrik Ev. underrubrik Ditt namn, klass Handledarens namn Sammanfattning En uppsats har en kort, inledande sammanfattning av hela arbetet. Den kommer inledningsvis men skrivs

Läs mer

Kursbeskrivning. Översättning inom näringsliv och förvaltning, 7,5 hp. Översättning kandidatkurs, GN, 30 hp (TTA450)

Kursbeskrivning. Översättning inom näringsliv och förvaltning, 7,5 hp. Översättning kandidatkurs, GN, 30 hp (TTA450) Tolk- och översättarinstitutet (TÖI) Kursbeskrivning Översättning inom näringsliv och förvaltning, 7,5 hp Översättning kandidatkurs, GN, 30 hp (TTA450) Översättning till svenska III, GN, 30 hp (TTA405)

Läs mer

GENREPEDAGOGIK ARBETA MED SPRÅKET PARALLELLT MED DIN VANLIGA UNDERVISNING

GENREPEDAGOGIK ARBETA MED SPRÅKET PARALLELLT MED DIN VANLIGA UNDERVISNING GENREPEDAGOGIK ARBETA MED SPRÅKET PARALLELLT MED DIN VANLIGA UNDERVISNING Kontaktpersoner: Åsa Sebelius asa.sebelius@stockholm.se Målgrupp: Alla undervisande lärare i år 1 9 oavsett ämne. Alla lärare måste

Läs mer

tidskrift för politisk filosofi nr 2 2013 årgång 17

tidskrift för politisk filosofi nr 2 2013 årgång 17 tidskrift för politisk filosofi nr 2 2013 årgång 17 Bokförlaget thales πdiskussion Sven Ove Hansson svarar Robert Callergård Jag vill börja med att tacka Robert Callergård för en tänkvärd och konstruktiv

Läs mer

Språkteknologi (SV2122) Föreläsning 9: Översättning

Språkteknologi (SV2122) Föreläsning 9: Översättning Språkteknologi (SV2122) Föreläsning 9: Översättning Richard Johansson richard.johansson@svenska.gu.se 26 februari 2014 översikt inledning: vad är översättning? djupa metoder: datorn läser och förstår texten

Läs mer

Riktlinjer för sociala medier för Fagersta kommun

Riktlinjer för sociala medier för Fagersta kommun 1 (6) 20111010 Riktlinjer för sociala medier för Fagersta kommun Riktlinjerna beskriver hur Fagersta kommun och dess verksamheter kan använda sociala medier på ett sätt som stämmer överens med kommunens

Läs mer

On the role of corpora in cross-linguistic research, Stig Johansson (3-24)

On the role of corpora in cross-linguistic research, Stig Johansson (3-24) Klas Prytz: Johansson, Stig och Signe Oksefjell. 1998. Corpora and Cross-linguistic Research. Stig Johansson, och Signe Oksefjell (red.). Rodopi: Amsterdam, Atlanta. Trots det myckna användandet av ordet

Läs mer

Lathund för SpellRight

Lathund för SpellRight Lathund för SpellRight för PC SpellRight är ett avancerat rättstavningsprogram för personer med svenska som modersmål, som skriver på engelska som sitt andraspråk. Programmet rättar grava stavfel, lättförväxlade

Läs mer

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits

Utbildningsplan för översättarprogrammet, 120 högskolepoäng. Professional Translation Programme, 120 higher education credits Humanistiska fakultetsnämnden Utbildningsplan för översättarprogrammet, 120 högskolepoäng Professional Translation Programme, 120 higher education credits Avancerad nivå/second Cycle 1. Beslut om fastställande

Läs mer

Föreläsning 3: Formalia: Hur skall uppsatsen se ut

Föreläsning 3: Formalia: Hur skall uppsatsen se ut Självst lvständigt statistiskt arbete, ht2011 (Jan Wretman/Gösta Hägglund/Gebrenegus H Ghilagaber) Föreläsning 3: Formalia: Hur skall uppsatsen se ut 1 Uppsatsens olika delar Uppsatsen skall innehålla

Läs mer

Convertus - kursplaneöversättning

Convertus - kursplaneöversättning Utbildningsavdelningen 2017-10-25 Convertus - kursplaneöversättning Innehåll Om Convertus kursplaneöversättning... 2 Så fungerar det... 2 Tre olika användarroller... 2 Arbetsgång... 3 Filnamn... 3 1. Beställa

Läs mer

Dialogue Technologies April 2005

Dialogue Technologies April 2005 Dialogue Technologies April 2005 En typisk självbetjäningstjänst för web ser ut enligt följande En inledande text för att användaren skall förstå tjänsten En aktuell lista med de 10 vanligast frågorna

Läs mer

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.

Läs mer

Evaluation Summary - CDT104 Grundläggande Webbdesign HT07 Dan Levin

Evaluation Summary - CDT104 Grundläggande Webbdesign HT07 Dan Levin Evaluation Summary CDT Grundläggande Webbdesign HT7 Dan Levin Antal kursutvärderingar: Q. Anser du dig ha tillräckligt med förkunskaper för att klara kursen? (=JA =NEJ) 9 Skriv kommentarer här... Q. a

Läs mer

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,

Läs mer

Riktlinjer för bedömning av examensarbeten

Riktlinjer för bedömning av examensarbeten Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar

Läs mer

MÖTESPLATS INFÖR FRAMTIDEN. Borås 8-9 oktober 2003. Helena Söderlund, Länsbiblioteket i Örebro län

MÖTESPLATS INFÖR FRAMTIDEN. Borås 8-9 oktober 2003. Helena Söderlund, Länsbiblioteket i Örebro län MÖTESPLATS INFÖR FRAMTIDEN Borås 8-9 oktober 2003 Helena Söderlund, Länsbiblioteket i Örebro län Resursbibliotek för döva I Örebro pågår sedan oktober 2001 projektet Resursbibliotek för döva. Initiativtagare

Läs mer

PROGRAMMERING ÅK 9 INTRODUKTION

PROGRAMMERING ÅK 9 INTRODUKTION PROGRAMMERING ÅK 9 INTRODUKTION VARFÖR PROGRAMMERING? Med programmering kan man: Skapa nästan vad som helst som är digitalt. Allt som är digitalt är uppbyggt av kod som människor har skrivit, finns i både

Läs mer

SVENSKA SOM ANDRASPRÅK

SVENSKA SOM ANDRASPRÅK SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk ger elever med annat modersmål än svenska möjlighet att utveckla sin kommunikativa språkförmåga. Ett rikt språk är en förutsättning för att inhämta ny

Läs mer

Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek

Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek Referera rätt Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek Det hör till god vetenskaplig praxis att redovisa de källor som använts. Det måste alltid framgå av texten vem som

Läs mer

En bioinformatisk genjakt

En bioinformatisk genjakt En bioinformatisk genjakt Efter en ide från: CUSMOBIO, Milano, Italien. Hur man kan söka i databaser efter information om en gen som kan ge ökad risk för bröstcacer. Bakgrund Människor utan symptom men

Läs mer

Using SharePoint Workflow

Using SharePoint Workflow Datavetenskap Opponent(er): Anders Olsson Marcus Karlsson Respondent(er): Harald Quist Creating a Help Desk Using SharePoint Workflow Oppositionsrapport, C-nivå 2009:xx 1 Sammanfattat omdöme av examensarbetet

Läs mer

Om ämnet Engelska. Bakgrund och motiv

Om ämnet Engelska. Bakgrund och motiv Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,

Läs mer

Handbok i konsten att köpa översättningar

Handbok i konsten att köpa översättningar Handbok i konsten att köpa översättningar Innehåll Varför översätta? 4 Vad är en bra översättning? 5 Att välja språkföretag 6 Tänk flerspråkigt från början 8 Inför din förfrågan 10 När du kontaktar språkföretaget

Läs mer

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA)

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA) Ramkursplan 2013-06-24 ALL 2013/742 Fastställd av generaldirektör Greger Bååth den 24 juni 2013 Framtagen av Carin Lindgren, Malin Johansson och Helena Foss Ahldén Ramkursplan i teckenspråk som modersmål

Läs mer

Uppgift 1 Denna uppgift består av två steg där du i första steget ska skapa formatmallar som sedan används i steg två för att skapa ett dokument.

Uppgift 1 Denna uppgift består av två steg där du i första steget ska skapa formatmallar som sedan används i steg två för att skapa ett dokument. Laboration Word Syfte Syftet med denna laboration är att skapa en dokumentmall som sedan kan användas till framtida arbeten på det Kognitionsvetenskapliga programmet. Uppgift 1 Denna uppgift består av

Läs mer

729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581

729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581 Fuzzy logic 880328-2535 Innehåll Fuzzy logic... 1 1. Inledning... 4 2. Jämförelse mellan fuzzy logic och tvåvärdeslogik.... 4 3. Fuzzy sets.... 4 4. Linvistiska variabler... 5 5. Operatorer... 5 6. If-

Läs mer

AKADEMISK HEDERLIGHET HANDLAR OM ATT INTE FUSKA ELLER PLAGIERA INFORMATION OM PLAGIAT & UPPHOVSRÄTT

AKADEMISK HEDERLIGHET HANDLAR OM ATT INTE FUSKA ELLER PLAGIERA INFORMATION OM PLAGIAT & UPPHOVSRÄTT AKADEMISK HEDERLIGHET HANDLAR OM ATT INTE FUSKA ELLER PLAGIERA INFORMATION OM PLAGIAT & UPPHOVSRÄTT PLAGIAT OCH UPPHOVSRÄTT Akademisk hederlighet handlar om att inte fuska eller plagiera. När du redovisar

Läs mer

Win95/98 Nätverks Kompendium. av DRIFTGRUPPEN

Win95/98 Nätverks Kompendium. av DRIFTGRUPPEN Win95/98 Nätverks Kompendium av DRIFTGRUPPEN Sammanfattning Vad håller jag i handen? Detta är en lättförståelig guide till hur man lägger in och ställer in nätverket i Windows 95 och 98 Efter 6 (sex) enkla

Läs mer

Filmen Ny i Sverige. Om filmen. Om Arbetsförmedlingen

Filmen Ny i Sverige. Om filmen. Om Arbetsförmedlingen Sida: 1 av 5 Svenska Ny i Sverige (textversion av filmen nyanland.arbetsformedlingen.se) Filmen Ny i Sverige Om filmen Hej och välkommen till vår guide för dig som fått uppehållstillstånd i Sverige och

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

MATEMATIKENS SPRÅK. Avsnitt 1

MATEMATIKENS SPRÅK. Avsnitt 1 Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en

Läs mer

EasyProducer Kom igång guide

EasyProducer Kom igång guide EasyProducer Kom igång guide EasyProducer gör det möjligt för dig att på ett enkelt sätt förvandla ett Word dokument till en fullt synkroniserad digital talbok i DAISY-format (DTB). DTB skapade med EasyProducer

Läs mer

MÖSG ht 2005 Maskinöversättningssystemet MATS

MÖSG ht 2005 Maskinöversättningssystemet MATS MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?

Läs mer

Sidpanelen och gadgetar De är nya. De är smarta. Lär dig hur du använder dem.

Sidpanelen och gadgetar De är nya. De är smarta. Lär dig hur du använder dem. Kap 03.indd 444 KAPITEL TRE Sidpanelen och gadgetar De är nya. De är smarta. Lär dig hur du använder dem. Gadgetar och den nya Sidpanelen är nog mina favoriter bland de nya funktionerna i Windows Vista.

Läs mer

Tvåspråkighetssatsning Manillaskolan ~^

Tvåspråkighetssatsning Manillaskolan ~^ VCc ^j^\ Tvåspråkighetssatsning Manillaskolan ~^ Specialpedagogiska skolmyndigheten Definition Tvåspråkighet: Funktionell tvåspråkighet innebär att kunna använda båda språken för att kommunicera med omvärlden,

Läs mer