MÖSG ht 2005 Maskinöversättningssystemet MATS

Storlek: px
Starta visningen från sidan:

Download "MÖSG ht 2005 Maskinöversättningssystemet MATS"

Transkript

1 MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz

2 Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system? 2

3 Föreläsningens upplägg bakgrund och grundläggande egenskaper systemets infrastruktur och moduler lexikala resurser värdig försämring vidareutveckling föreläsning 7 laboration 5: en första bekantskap med MATS-systemet demonstration

4 Bakgrund MATS: Methodology and Application of a Translation System samarbetsprojekt mellan Institutionen för lingvistik och Scania CV AB uppskalning av MULTRA med fokus på design och implementation av nya systemet MATS nytt lexikon i form av en lexikal databas uppskalning av grammatik och lexikon 4

5 Grundläggande egenskaper regelbaserat prologkärna uttömmande analys hög översättningskvalitet inom begränsad domän 5

6 Systemets infrastruktur designprinciper genomskinlighet och spårbarhet modularitet varje delsteg sköts av en separat modul en pipe utgör transportlager och kopplar ihop modulerna enkelriktad dataström multiplex signal textmeddelanden 6

7 Exempel på liten tokeniseringsmodul:! "! # $ " " Exempel på dataström: ' ' *, , -. 2,

8 0. Textextraktion indata i XML-format text att översätta separeras från taggar etc initial uppdelning av text: segment varje segment har ett id-nummer,,, 0 2,,, 8

9 . Teckenomkodning koda om segmenten så de blir kompatibla med lexikonet latin- Unicode? 9

10 2. Tokenisering varje segment delas upp i tokens grunduppdelning sker på whitespace Segment 0 2 Tokens 0 2 hantering av flerordsenheter MWU: till och med 0

11 . Lexikonuppslagning uppslag av flerordsenheter enordsenheter 0 2 mönstermatchning okända ord -

12 . Lexikonuppslagning uppslagna ord får förvald översättning morfosyntaktisk information lingvistisk resurs: 0 2 * förvald översättning: kasus: genus:... 0, * - -, 2

13 4. Parser UCP strävan efter komplett syntaktisk analys hantering av meningar utan komplett analys preferensmetod: rankning av likvärdiga analyser lingvistisk resurs:,

14 5. Transfer input: en analys av segmentet representerad av en särdragsstruktur källspråksspecifika attribut förvalda översättningar output: en analys av segmentet representerad av en särdragsstruktur målspråksspecifika attribut översättningar justerade efter sin kontext,, eller,, 4

15 5. Transfer källsida och målsida transfern traverserar indata-strukturen i varje nod kan enskilda särdrag kopieras över till målsidan läggas till strykas t ex genus i svenska engelska byta värde t ex förvalda översättningar lingvistisk resurs:, 5

16 6. Generering grammatik baserad på PATR-II unifiering och konkatenering finna korrekt representation av strukturen i målspråket lingvistisk resurs:, 6

17 6. Generering, forts typning ett sätt att kontrollera genereringen en struktur med typade särdrag måste behandlas av regler som tar hand om dessa. lingvistisk resurs:, 7

18 8. Kodkomposition fullformsdatabasen accepterar inte särdragsstrukturer särdragsstrukturer mappas mot motsvarande kodrepresentation lingvistisk resurs: * 8

19 , 9. Lexikonuppslagning primär nyckel: kod lemma returnerar färdigböjt ord 9

20 0. Fonotaktisk bearbetning det översatta segmentets ytform och underliggande struktur granskas 20

21 . Finish finputsning av översatta segment första ordets bokstav versal ta bort överflödiga mellanslag sammanfoga ursprunglig XML-data med den översatta texten 2

22 7. Fallback - värdig försämring regelbaserade system känsliga hantering av problem okända ord: externa lexikon, ordklassgissare... ofullständig analys: gå vidare med bra delanalyser ofullständig transfergram.: kopiera okända strukturer ofullständig genereringsgram.: alternativ strategi boundary friction : välj ut kombination med högst P ofullständigt målspråkslexikon: försök generera form 22

23 7. Översättning med partiella analyser Vissa meningar mindre känsliga för segmentering: [avlägsna skruven][,][kåpan och skyddsplasten] Problem när beroenden bryts boundary friction: [boken som är borta][är värdefull] 2

24 7. Fallbackgenerering - enklaste varianten grammatiken täcker inte alltid hela strukturen som sista utväg används källspråkets ordföljd ofta bristfälligt för satser fungerar för vissa sorters fraser den stora gröna boken är borta -> the big green book is gone färgkodning indikerar när det skett 24

25 7. Fallbackgenerering med språkmodell ordföljd jag tänker, därför finns jag 57k: therefore I exist 528: I exist therefore 94: therefore exist I 57: I therefore exist... 25

26 7. Fallbackgenerering med språkmodell ordval jag är törstig 72k: I am thirsty 27: I are thirsty 02: I is thirsty 26

27 Ordval och ordföljd med språkmodell Basen för statistisk maskinöversättning Översättning av mening S till M: för varje ordfras i S, samla in alla dess översättningsalternativ sök efter den kombination av översättningsalternativ som både maximerar översättningssannolikheten för varje ordfras, och ordföljdssannolikheten för för sekvensen som bildas. 27

28 Systemets lexikala resurser specificeras på gränssnittets startsida transfer, laddas i den specificerade och generering engra.ptr: - mer om dessa på måndag 70 lexikala databasen: Evas föreläsning efter lunch idag, 28

29 Kodfilerna * svenska och * engelska en kod representerar en lista med attribut och värden: 29

30 Vidareutveckling analys och översättning av sammansättningar förbättrad genereringsmodul fler fallbackmekanismer regressionstester och automatisk utvärdering tidsoptimering och buggfixning nyutveckling sker i efterföljaren Convertus 0

31 Föreläsning 8 70 genomgång av transfern och dess regler genereringen och dess regler genereringens typning

32 Laboration 5: en första bekantskap med MATS-systemet mål genomgång av grammatikformaten nästa vecka starta MATS i terminalfönster lokalt på arbetsstationen starta inte MATS som en bakgrundsprocess med. Tryck inte heller Ctrl-z. 2

33 Demonstration

Maskinöversättning och språkgranskning

Maskinöversättning och språkgranskning Maskinöversättning och språkgranskning Föreläsning 7 Regelbaserad maskinöversättning Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet e-post: evapet@stp.lingfil.uu.se Föreläsningsöversikt

Läs mer

Kursplaneöversättaren. Lina Stadell

Kursplaneöversättaren. Lina Stadell Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad

Läs mer

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Machine Translation MÖSG F Anna Sågvall Hein

Machine Translation MÖSG F Anna Sågvall Hein Machine Translation MÖSG F1 2007 Anna Sågvall Hein Vad är maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Maskinöversättning 2008

Maskinöversättning 2008 Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE

Läs mer

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN MASKINÖVERSÄTTNING Datorn behöver statistik och grammatik ANNA SÅGVALL HEIN Det är lätt att skoja med en del resultat av maskinöversättning: Vad kan vi lära av det blir What can we faith of it. Då gör

Läs mer

Statistisk Maskinöversättning eller:

Statistisk Maskinöversättning eller: 729G43 Statistisk Maskinöversättning eller: Hur jag slutade ängslas (över fördjupningsuppgiften) och lärde mig hata stoppord. Jonas Hilmersson 2019-04-15 Innehåll 1. Introduktion... 1 2. Datamängden...

Läs mer

Djupstruktur och ytstruktur

Djupstruktur och ytstruktur Djupstruktur och ytstruktur En gammal man bodde på vinden. På vinden bodde en gammal man. Chomsky 1965 baskomponent transformationskomponent Föregångare till UCP Augmented Transition Network (Woods 1970)

Läs mer

Bilaga 5: Nytt språk svenska. Wikispeech. en användargenererad talsyntes på Wikipedia

Bilaga 5: Nytt språk svenska. Wikispeech. en användargenererad talsyntes på Wikipedia Bilaga 5: Nytt språk svenska Wikispeech en användargenererad talsyntes på Wikipedia Innehållsförteckning Innehållsförteckning Introduktion Nyckel: 1 Intresse 2 Identifiera existerande resurser 3 API anpassningar

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

Grammatisk teori II Attributvärdesgrammatik

Grammatisk teori II Attributvärdesgrammatik Grammatisk teori II Attributvärdesgrammatik 1. Lexikon and syntaktiska regler Inom lingvistisk teori delas den mentala representationen av språket upp i två centrala komponenter: lexikon och syntaktiska

Läs mer

Språkgranskningsverktyg, vt 2009

Språkgranskningsverktyg, vt 2009 , vt 2009 Föreläsning 8 Scania Checker evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Kontrollerat språk Scania-svenska Scania Checker Demo 2 Kontrollerat språk Delmängd av naturligt språk Restriktioner

Läs mer

Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering?

Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering? Kap 2: Typologi Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering? Orden skulle bli mycket långa för att varje morfem skulle ha sin egen vokalisering, eftersom det behövs så

Läs mer

Statistisk maskinöversättning

Statistisk maskinöversättning Statistisk maskinöversättning Åsa Holmqvist Asaho232 Artificiell Intelligens 729G43 Innehållsförteckning Introduktion... 1 Maskinöversättningens historia.... 1 Statistisk metod... 3 Brusiga kanalen....

Läs mer

Föreläsning 7: Syntaxanalys

Föreläsning 7: Syntaxanalys DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2007-10-30 Skribent(er): Erik Hammar, Jesper Särnesjö Föreläsare: Mikael Goldmann Denna föreläsning behandlade syntaxanalys.

Läs mer

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 9 februari 2006 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

Convertus - kursplaneöversättning

Convertus - kursplaneöversättning Utbildningsavdelningen 2017-10-25 Convertus - kursplaneöversättning Innehåll Om Convertus kursplaneöversättning... 2 Så fungerar det... 2 Tre olika användarroller... 2 Arbetsgång... 3 Filnamn... 3 1. Beställa

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden: Korpuslingvistik Talteknologi

Läs mer

ALEPH ver. 16 Introduktion

ALEPH ver. 16 Introduktion Fujitsu, Westmansgatan 47, 582 16 Linköping INNEHÅLLSFÖRTECKNING 1. SKRIVBORDET... 1 2. FLYTTA RUNT M.M.... 2 3. LOGGA IN... 3 4. VAL AV DATABAS... 4 5. STORLEK PÅ RUTORNA... 5 6. NAVIGATIONSRUTA NAVIGATIONSTRÄD...

Läs mer

Användarhandledning Kursplaneöversättaren

Användarhandledning Kursplaneöversättaren Användarhandledning Kursplaneöversättaren Bakgrund På uppdrag av Rektor vid Uppsala universitet har en forskargrupp vid Institutionen för lingvistik och filologi vid Uppsala universitet utvecklat en maskinell

Läs mer

Språkets struktur och funktion, 7,5 hp

Språkets struktur och funktion, 7,5 hp Språkets struktur och funktion, 7,5 hp Ellen Breitholtz, ellen@ling.gu.se, Cajsa Ottesjö, cajsao@ling.gu.se ht 2010 Schema, planering Torsdag 4/11: Introduktion, historisk översikt Att läsa: Handout Tisdag

Läs mer

Föreläsning 7: Syntaxanalys

Föreläsning 7: Syntaxanalys DD2458, Problemlösning och programmering under press Föreläsning 7: Syntaxanalys Datum: 2009-10-27 Skribent(er): Carl-Fredrik Sundlöf, Henrik Sandström, Jonas Lindmark Föreläsare: Fredrik Niemelä 1 Syntaxanalys

Läs mer

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance

Läs mer

STRÄNGAR DATATYPEN. Om du vill baka in variabler eller escape-tecken måste du använda dubbla citattecken. strängar

STRÄNGAR DATATYPEN. Om du vill baka in variabler eller escape-tecken måste du använda dubbla citattecken. strängar STRÄNGAR En av de mest avancerade av de normala datatyperna är. Här skall vi grundläggande gå igenom hur den datatypen fungerar och vidare flertalet funktioner som hör till datatypen. Låt oss kasta oss

Läs mer

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON

Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell

Läs mer

Språkliga basresurser i

Språkliga basresurser i Institutionen för lingvistik och filologi Språkteknologiprogrammet Examensarbete i datorlingvistik 3 juni 2005 Språkliga basresurser i maskinöversättningssystemet MATS Jens Moberg Handledare: Anna Sågvall

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion

Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som

Läs mer

Maskinöversättning och språkgranskning. F6: Grammatikkontroll

Maskinöversättning och språkgranskning. F6: Grammatikkontroll Maskinöversättning och språkgranskning F6: Grammatikkontroll Grammatikkontroll av svenska För svenska finns huvudsakligen tre olika modeller Word Scarrie Granska Scarrie och Granska är forskningsprototyper.

Läs mer

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter

ETAP: Etablering och annotering av parallellkorpus för igenkänning av översättningsekvivalenter ASLA-information 24:1. 1998. 33 40. Lars Borin Uppsala universitet Institutionen för lingvistik Box 527 751 20 Uppsala Lars.Borin@ling.uu.se ETAP: Etablering och annotering av parallellkorpus för igenkänning

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Språkgranskningsverktyg, vt 2008

Språkgranskningsverktyg, vt 2008 , vt 2008 Föreläsning 7 Chartparsning i allmänhet och UCP i synnerhet evapet@stp.lingfil.uu.se 1 Djupstruktur och ytstruktur Jag läste en bok igår Igår läste jag en bok 2 Chartparsning - bakgrund Utvecklades

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion till projektet Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(17)

Läs mer

TDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg

TDDD02 Föreläsning 2 HT-2013. Reguljära uttryck och reguljära språk Lars Ahrenberg TDDD02 Föreläsning 2 HT-2013 Reguljära uttryck och reguljära språk Lars Ahrenberg Översikt Reguljära uttryck sökproblem i texter definitioner och exempel UNIX-funktionen grep Reguljära transformationer

Läs mer

Min sida = startsida där du ser eventuelle vänner, meddelanden med mera. Här kan du även redigera din egen profil.

Min sida = startsida där du ser eventuelle vänner, meddelanden med mera. Här kan du även redigera din egen profil. Basetool version 3 Genom att lägga in information om ditt företag/verksamhet i Basetool syns du automatiskt på vastgotalandet.se, skaraborg.nu, vastergotland.se och vastsverige.com Webbadress: www.basetool.se

Läs mer

Maskinöversättning idag

Maskinöversättning idag Maskinöversättning idag Efter en tid av ifrågasättande har nu återigen maskinöversättningen kommit att stå i centrum för språkteknologin och börjat användas av företag och myndigheter för översättning

Läs mer

Utveckling av ett svensk-engelskt lexikon inom tåg- och transportdomänen

Utveckling av ett svensk-engelskt lexikon inom tåg- och transportdomänen Institutionen för lingvistik och filologi Språkteknologiprogrammet Examensarbete i datorlingvistik 27 juni 2006 Utveckling av ett svensk-engelskt lexikon inom tåg- och transportdomänen Hans Axelsson, Oskar

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

729G04 Programmering och diskret matematik. Föreläsning 7

729G04 Programmering och diskret matematik. Föreläsning 7 729G04 Programmering och diskret matematik Föreläsning 7 Föreläsningsöversikt Information Interaktion via text Läsa från fil Skriva till fil Spara och läsa abstrakta datatyper från fil Information Felaktigt

Läs mer

Använda Convertus Kursplaneöversättaren

Använda Convertus Kursplaneöversättaren Utbildningsavdelningen INSTRUKTION 2015-10-09 Använda Convertus Kursplaneöversättaren Programmet Kursplaneöversättaren är ett hjälpmedel för att översätta kursplaner från svenska till engelska. Du måste

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

stinaka@stp.ling.uu.se

stinaka@stp.ling.uu.se !"# $ %& ' % )(* +-,/.1032 5#687:9'; 4 stinaka@stp.ling.uu.se = 2@? 7 0AB2 9'687, 7.)C 2D,FE 9'G.10 ;IH.1A',J.LK +NM 9 2@K-, 4 7 KN0E G E ;.1M 9 E ;O9 2I?P? 7, Q MMAB2 G 2SR0. HT7:9 A!.U, 7,VWX0A',J.U,JRY,J.LEZ0

Läs mer

Maskinöversättning. F Anna Sågvall Hein

Maskinöversättning. F Anna Sågvall Hein Maskinöversättning F1 2008 Anna Sågvall Hein Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och

Läs mer

Pre-editering och maskinöversättning. Convertus AB

Pre-editering och maskinöversättning. Convertus AB Pre-editering och maskinöversättning Bakgrund Convertus roll i DigInclude är att utveckla och tillhandahålla översättningstjänster för översättning av användarorienterad myndighetsinformation Översättning

Läs mer

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier Arv Fundamental objekt-orienterad teknik arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier Programmeringsmetodik -Java 165 Grafisk respresentation: Arv

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Utfärdat av Revideringsdatum Dokument ID Håkan Tropp Systembeskrivning_Kursinfo.doc

Utfärdat av Revideringsdatum Dokument ID Håkan Tropp Systembeskrivning_Kursinfo.doc SYSTEMBESKRIVNING 2005-12-22 1.0 1 (7) Kursinfo Översiktlig beskrivning Kursinfo är ett egenutvecklat system, för att hantera utbildningsrelaterad information. I Kursinfo hanteras all administration av

Läs mer

Gränssnitt för FakeGranska. Lars Mattsson

Gränssnitt för FakeGranska. Lars Mattsson Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken

Läs mer

Statistisk Maskinöversättning. Anna Prytz Lillkull 729G

Statistisk Maskinöversättning. Anna Prytz Lillkull 729G Statistisk Maskinöversättning Anna Prytz Lillkull 729G11 annpr075@student.liu.se 2010-10-03 Innehållförteckning Inledning...3 Bakgund...3 Uppkomsten av maskinöversättning... 3 Ökat intresse för statistisk

Läs mer

Vad är en databas? Exempel på databaser: Databas = Organiserad samling och lagring av information.

Vad är en databas? Exempel på databaser: Databas = Organiserad samling och lagring av information. Vad är en databas? Exempel på databaser: Kortregister på kontor Sjukvårdsjournal Bokregister på bibliotek Medlemsregister i en förening Kundregister på företag Telefonkatalogen Databas = Organiserad samling

Läs mer

Grundläggande textanalys, VT2013

Grundläggande textanalys, VT2013 Grundläggande textanalys, VT2013 evelina.andersson@lingfil.uu.se Rum 9-2035 http://stp.ling.uu.se/~evelina/uv/uv13/gta/ (Tack till Sofia Gustafson-Capkovâ för material.) Idag - Preprocessing - Tokeniserings-

Läs mer

FOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide

FOR BETTER UNDERSTANDING. Kom igång med. WordFinder Snabbguide FOR BETTER UNDERSTANDING Kom igång med WordFinder Snabbguide Installationsanvisning 1 Sätt i programskivan i datorn. Installationsprogrammet startar automatiskt. En gemensam startbild för WordFinder Professional,

Läs mer

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2009

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2009 Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2009 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka

Läs mer

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, SMT En fördjupning i statistiska maskinöversättningssystem johka299@student.liu.se 2010-10-01 Innehållsförteckning 1. Introduktion till översättning...

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Behörighetssystem. Ska kontrollera att ingen läser, skriver, ändrar och/eller på annat sätt använder data utan rätt att göra det

Behörighetssystem. Ska kontrollera att ingen läser, skriver, ändrar och/eller på annat sätt använder data utan rätt att göra det Behörighetssystem Ska kontrollera att ingen läser, skriver, ändrar och/eller på annat sätt använder data utan rätt att göra det Systemet måste kunna registrera vilka resurser, d v s data och databärande

Läs mer

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden

NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance

Läs mer

Föreläsning 5: Grafer Del 1

Föreläsning 5: Grafer Del 1 2D1458, Problemlösning och programmering under press Föreläsning 5: Grafer Del 1 Datum: 2006-10-02 Skribent(er): Henrik Sjögren, Patrik Glas Föreläsare: Gunnar Kreitz Den här föreläsningen var den första

Läs mer

Installationsbeskrivning

Installationsbeskrivning Installationsbeskrivning UND-07-T-06 DB03 Funktionalitet för att upptäcka fel i databasen 2011-12-22 Version: Beteckning: Status: 1.0 UND-07-T-06 Ändringshistorik Revision Datum Av Kommentar Granskare

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Informationsmodellering och e-infrastrukturer

Informationsmodellering och e-infrastrukturer Informationsmodellering och e-infrastrukturer Semiotik Sign = Tecken Semiotik = Teckenlära Tecken är representationer Tecken är intentionella Tecken förmedlar information Figure 3.1: Levels of semiotics

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Linköpings universitet

Linköpings universitet 2014-09-08 Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 5 Integrationsutmaningen Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga

Läs mer

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap Uppmärkningsspråk TDP007 Konstruktion av datorspråk Föreläsning 3 Peter Dalenius Institutionen för datavetenskap 2015-01-29 Vad handlar det andra seminaret om? Strukturerad text Uppgifter Hämta information

Läs mer

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap Uppmärkningsspråk TDP007 Konstruktion av datorspråk Föreläsning 3 Peter Dalenius Institutionen för datavetenskap 2017-01-26 2 Vad handlar det andra seminariet om? Strukturerad text Uppgifter Hämta information

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Datorteknik TSIU02 Lab 2 Morsesändare v0.7

Datorteknik TSIU02 Lab 2 Morsesändare v0.7 Inledning För att skriva program i något programspråk förenklar det att ha ett strukturerat angreppssätt. I assembler får man strukturen genom omsorgsfull användning av subrutiner. Som exempel på en mer

Läs mer

Korpusbaserad Maskinöversättning

Korpusbaserad Maskinöversättning Linköpings Universitet Institutionen för Datavetenskap Artificiell Intelligens, HKGBB0, HT 2002 Korpusbaserad Maskinöversättning Anna Hillertz KogVet 3, fack14 annhi662@student.liu.se 1 Innehållsförteckning

Läs mer

Kompilatorer och interpretatorer

Kompilatorer och interpretatorer 1 of 6 Örebro universitet Institutionen för teknik Thomas Padron-McCarthy (Thomas.Padron-McCarthy@oru.se) Tentamen i Kompilatorer och interpretatorer för Dataingenjörsprogrammet m fl lördag 7 november

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Föreläsning 3 Dagens föreläsning går igenom

Föreläsning 3 Dagens föreläsning går igenom Databasbaserad publicering Föreläsning 3 1 Föreläsning 3 Dagens föreläsning går igenom E/R-modellen & Läs om E/R-diagram i kapitel 2-3 i boken "Databasteknik" eller motsvarande avsnitt på http://www.databasteknik.se/webbkursen/er/index.html

Läs mer

Travel Phrase Guide. Instruktionshäfte

Travel Phrase Guide. Instruktionshäfte Travel Phrase Guide Instruktionshäfte Sw Rätten till ändring av innehållet i detta dokument förbehålles utan föregående meddelande. CASIO COMPUTER CO., LTD. åtar sig inget ansvar för skador eller förluster

Läs mer

Neurolingvistik - Grammatik

Neurolingvistik - Grammatik Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -

Läs mer

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning

Läs mer

Importera från PubMed till DiVA

Importera från PubMed till DiVA Importera från PubMed till DiVA Sök i DiVA http://oru.diva-portal.org/ för att kontrollera om publikationen redan är registrerad. Ja: Ändra i den befintliga registreringen om du vill redigera eller komplettera

Läs mer

Delprov B. Textbearbetning

Delprov B. Textbearbetning 1 MÅLSPRÅK SVENSKA Delprov B. Textbearbetning Anvisningar Den korta texten nedan är en monteringsanvisning för ett displayskydd till en mobiltelefon. Texten har rubriken Appliceringsinstruktioner och indelningen

Läs mer

Att skriva uppsats Vetenskapligt skrivande: att förstå och lära. Föreläsningens upplägg. Lärostrategi. Nödvändig studiekompetens

Att skriva uppsats Vetenskapligt skrivande: att förstå och lära. Föreläsningens upplägg. Lärostrategi. Nödvändig studiekompetens Att skriva uppsats Skrivprocessen: problemformulering och bearbetning Föreläsningens upplägg Vetenskapligt skrivande Skribenter är olika Skrivprocessen: texttriangeln, problemformulering och bearbetning

Läs mer

Översättning med Kursplaneöversättaren sker i tre huvudsakliga steg:

Översättning med Kursplaneöversättaren sker i tre huvudsakliga steg: Användarhandledning Kursplaneöversättaren Bakgrund Convertus Kursplaneöversättare är en maskinell översättningstjänst för översättning av kursplaner från svenska till engelska. Översättningen görs med

Läs mer

Partiell parsning Parsning som sökning

Partiell parsning Parsning som sökning Språkteknologi: Parsning Parsning - definition Parsningsbegrepp Chartparsning Motivering Charten Earleys algoritm (top-down chartparsning) Partiell parsning (eng. chunking) med reguljära uttryck / automater

Läs mer

Användarhandledning Kursplaneöversättaren för Uppsala universitet

Användarhandledning Kursplaneöversättaren för Uppsala universitet 1 Användarhandledning Kursplaneöversättaren för Uppsala universitet Innehållsförteckning Bakgrund... 2 Översättning med Kursplaneöversättaren... 2 1. Beställning av översättning... 2 Från Selma... 2 Av

Läs mer

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Skrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier

Skrivstöd. Varför bry sig om stavning? Hur används stavningskontroll? Christian Hardmeier Skrivstöd Christian Hardmeier (efter Joakim Nivre) 205-- Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Stavning fungerar som bildningsmarkör Standardiserad stavning

Läs mer

Lexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet

Lexikal semantik & Kognitiv semantik. Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet Lexikal semantik & Kognitiv semantik Semantik: Föreläsning 2 Lingvistik: 729G08 HT 2012 IKK, Linköpings universitet 1 Dagens föreläsning Saeed 2009, kap.3, 11 Lexikal semantik Lexikala relationer Kognitiv

Läs mer

IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA

IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA Universitetsbiblioteket Senast ändrad: 2016-12-12 2 Innehållsförteckning Linköpings universitetsbibliotek

Läs mer

Flerordsenheter: Så många frågor, så få svar

Flerordsenheter: Så många frågor, så få svar Flerordsenheter: Så många frågor, så få svar Lars Borin Flerordsworkshop 19/3 2013 några centrala frågor Vilken sorts ord är det flera av? Ska de beskrivas som en sorts lexikonenheter eller en sorts syntaktiska

Läs mer

ALEPH ver. 18 ALEPH Digital Asset Module (ADAM)

ALEPH ver. 18 ALEPH Digital Asset Module (ADAM) ALEPH ver. 18 ALEPH Digital Asset Module (ADAM) Fujitsu, Westmansgatan 47, 582 16 Linköping Innehållsförteckning 1. INLEDNING...1 2. SKAPA NYA OBJEKT...1 3. OBJEKTLISTA...2 4. FORMULÄR...3 4.1 Objektinformation...3

Läs mer

Laboration 2 RESTful webb-api

Laboration 2 RESTful webb-api Webbteknik II, 1DV449 Laboration 2 RESTful webb-api Author: John Häggerud & Johan Leitet Semester: HT 2011 Course code: 1DV449 Inledning I denna laboration är det tänkt att Du ska skriva ett eget webb-api

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer