Statistisk Maskinöversättning. Anna Prytz Lillkull 729G

Save this PDF as:
 WORD  PNG  TXT  JPG

Storlek: px
Starta visningen från sidan:

Download "Statistisk Maskinöversättning. Anna Prytz Lillkull 729G"

Transkript

1 Statistisk Maskinöversättning Anna Prytz Lillkull 729G

2 Innehållförteckning Inledning...3 Bakgund...3 Uppkomsten av maskinöversättning... 3 Ökat intresse för statistisk maskinöversättning... 4 Ord och dess relationer... 4 Språkkomplexitet... 4 Tillämpningsområden maskinöversättning... 4 Svårigheter med översättning... 5 Strukturskillnader... 5 Maskinöversättning...6 Ordbaserad översättning... 6 Transformationsmodell... 6 Interlingua... 6 Frasbaserade modeller... 6 Introduktion statistisk maskinöversättning... 7 Statistisk maskinöversättning: bakgrund... 7 Att bygga ett statistiskt maskinöversättningssystem... 8 Modellering del 1 -översättningsekvivalensmodell... 8 Modellering del 2 parameterisation... 8 Del 3 parameteruppskattning Del 4 avkodning Diskussion Referenser... 10

3 Inledning De flesta av oss talar och förstår endast ett eller några få språk. Det innebär att det finns tusentals språk vi inte behärskar. Språket blir en barriär vid kommunikation mellan människor då man varken kan förmedla något eller ta till sig något på ett främmande språk. Många människor är tvåspråkiga och kan översätta mellan två språk, men manuell översättning tar mycket lång tid. För att spara tid får maskiner översätta. För att kunna översätta från ett naturligt språk till ett annat, så att översättningen behåller samma betydelse, krävs idag en djup och rik förståelse av källspråket och en poetisk och kreativ behärskning av målspråket. Detta görs idag av människor vid hög kvalités litterära översättningar, men även de får ibland kompromissa för att översättningen ska vara tolerabel mot de båda språken. Om vi skulle kunna få en maskin att automatiskt översätta en mening på ett språk till ett annat perfekt krävs det förståelse av innehållet. Om maskiner kommer kunna översätta perfekt mellan två språk: då har vi skapat förstående maskiner, menar Jurafsky och Martin (2008). Maskinöversättning innebär att, med hjälp av datorer, översätta från ett språk till ett annat utan mänsklig involvering. Vad statistiska maskinöversättningsmodeller gör är att de behandlar översättning av naturligt språk som ett maskininlärningsproblem. Systemet utgår från mänskligt översätta texter och genom det lär sig systemets algoritmer att översätta automatiskt. Området är på framväxt och nya idéer presenteras hela tiden (Lopez, 2008). Bakgund Uppkomsten av maskinöversättning Det naturliga språkförståelse-fältet växte fram under 70-talet. Det drog igång med SHRDLU-systemet som var ett system som kunde acceptera kommandon i naturligt språk för att styra en robot. Roboten agerade i en begränsad leksaksvärld med olika block i. Den kunde till exempel förstå meningar som Flytta det röda blocket upp på toppen av det lilla gröna och utföra handlingen. Detta system var även det första som gjorde ett försök att bygga en omfattande grammatik för engelska språket. Under andra hälften av 90-talet genomgick språkbearbetnings-fältet stora förändringar. Förbättringar av snabbhet och minne för datorer tillät kommersiell exploatering av ett antal sidoområden inom bland annat språkbearbetning som stavnings- och grammatikkontroller. När internet senare började komma fanns det ett behov av språkbaserad informationsframskaffande. Automatisk språköversättning sågs i dess tidiga stadier som ett problem som skulle vara relativt enkelt att lösa. Det visade sig att problemet inte alls var så lätt som man hade trott och än idag kämpar utvecklare med diverse översättningsproblem (Jurafsky och Martin, 2008).

4 Ökat intresse för statistisk maskinöversättning Det ökade användandet av internet har starkt påverkat två valkretsar av översättningsanvändare. Den första är den krets som är intresserad av att sprida ut information på multipla språk. Det kan vara till exempel flerspråkiga regeringar eller företag som verkar på den globala marknaden. Det är denna utspridning av olika mänskligt översatta texter som har bidragit till att det finns mycket data att tillgå för den statistiska maskinöversättningsutvecklingen. Utspridningen av olika mänskligt översatta dokument på internet växer hela tiden. Den andra kretsen översättningsanvändare är de som är intresserade av att uppta information som inte är på deras eget språk. Det kan vara till exempel forskare eller vanliga internetanvändare. Det ökade behovet av bra översättningssystem leder till ett populärt intresse för maskinöversättning (Lopez, 2008). Ord och dess relationer Morfologi innebär att ord delas in i sina meningsfulla komponenter, som kallas för morfem. För att kunna skilja ett ord i singular från ett i plural kan man titta på morfologin där det sista morfemet antagligen kommer se olika ut för de båda orden. Syntax syftar till de strukturella relationerna som finns mellan orden i en mening, relaterat är grammatik. Med semantik menas den kunskap som finns kring vad orden och meningarna har för betydelse, vad de syftar till i verkligheten. Dessa komponenter är viktiga att ha kunskap om vid översättning. För att översätta ord kan det ibland krävas en kunskap kring ordets betydelse. Ibland kan det finnas flera alternativ till ett ords översättning. Synonymer är flera ord som har exakt samma betydelse. I de flesta fall kommer meningen att ha samma betydelse oavsett vilket ord man väljer av två synonymer, men vissa gånger krävs det att man väljer rätt för en korrekt betydelse av meningen. Synonymerna large och big kan inte slumpas vid översättning till big sister. Homonymer måste också tas i akt vid översättningar då en homonym är ett ord som kan ha flera olika betydelser beroende på sammanhang (Jurafsky och Martin, 2008). Språkkomplexitet Något som är viktigt att förstå och ha i beräkning vid studier inom språkbearbetning är de olika komplexitetsnivåerna som kan förekomma i naturligt språk. Ibland återkommer samma meningskonstruktioner men meningar kan ibland ha olika konstruktioner beroende på individens preferenser. Vissa meningar kan ibland vara svåra även för människor att förstå (Jurafsky och Martin, 2008). Tillämpningsområden maskinöversättning Maskinella översättningssystem översätter sällan perfekt. Bara för att maskinella översättningar inte alltid fångar den korrekta betydelsen av källmeningen behöver det inte betyda att översättningarna är oanvändbara. Förirring kan uppstå vid maskinöversättningar men vara begripliga trots allt. De kan vara användbara vid översättningar av till exempel recept då man trots viss förvirring ofta kan få en bra uppfattning om receptet, eftersom människan ofta kan lista ut betydelsen av en halvdålig översättning.

5 Automatisk översättning går betydligt fortare än manuell översättning. Därför används den ofta för att översätta långa texter som sedan efterredigeras av människor. Ett område där maskinöversättning fungerar bra, och inte kräver efterredigering, är domäner med begränsade vokabulär och bara några få grundfrastyper. I dessa domäner finns det sällan tvetydigheter i ordbetydelsen. Väderleksrapporter, flygbokningar, restaurangrekommendationer och hotellreservationer kan översättas maskinellt med bra resultat (Jurafsky och Martin, 2008). Svårigheter med översättning Det finns vissa universella likheter mellan alla språk. Likheter kommer av att språk har den funktionella rollen att vara ett kommunikationssystem mellan människor. Alla språk har till exempel ord som refererar till personer, för att prata om kvinnor, män, barn, ord för att äta och dricka, vara trevlig eller otrevlig. Alla språk innehåller också substantiv och verb. Men känt är att de flesta språk ändå skiljer sig åt i vissa avseenden. Vissa språk innehåller olika många ord. Ett språk kan ha många fler ord än ett annat och då skiljer sig samma mening på till exempel engelska och kinesiska där den kinesiska har färre. Många språk har stilistiska och kulturella skillnader. Men främst handlar det om att språk skiljer sig åt i dess systematiska struktur. Skillnaderna och likheterna i systematisk struktur är något vi kan studera och detta kallas för typologi. Nedan följer några typologiska fakta. Strukturskillnader Morfologiskt sätt kan språk kategoriseras i två variationisdimensioner. Den första dimensionen handlar om antal morfem per ord. I isolerande språk som vietnamesiska har varje ord ofta bara ett morfem. I polysyntetiska språk har orden ofta väldigt många morfem. Ett polysyntetiskt språk är till exempel eskimåspråket. Varje ord från dessa språk måste ofta översättas med en fras eller hel mening på ett ickepolysyntetiskt språk. Den andra morfologiska dimensionen handlar om den grad som morfem är segmenterade, från språk som turkiska där morfemen har klara gränser, till språk som ryska där ett enda affix kan ha flera morfem. Syntaktiskt sett är språk framträdande olika med avseende på ordningsföljd av verb, substantiv och objekt. Vid översättningar mellan språk som har olika ordföljd krävs omplaceringar av ord. De språk som har samma ordningsföljd brukar även ha andra gemensamma likheter i språkuppbyggnad. Något som kan skilja sig mellan språk är hur predikat i en mening kopplas till dess argument. I ungerskan markeras relationen mellan huvudordet och dess tillhörare på huvudordet. I svenskan däremot markeras relationen på icke-huvudordet. Exempel på svenska: mannens hus Exempel på hur det skulle sett ut med ungersk grammatik: mannen hus-hans Typologiska skillnader mellan språk gör att översättning försvåras (Jurafsky och Martin, 2008).

6 Maskinöversättning Ordbaserad översättning Statistiska maskinöversättningsmodeller influeras av de banbrytande IBM-modellerna. IBMmodellerna är ordbaserade modeller och tillhör den första generationen maskinöversättningsmodeller. En IBM-modell som har likheter med statistiska maskinöversättningsmodeller är IBM-modell 4. Denna modell är en mål-till-käll-modell det vill säga den producerar en källmening från en målmening (Lopez, 2008). I många modeller av ordöversättning, eller direktöversättning, översätter man genom att stegvis förvandla källmeningen till målmeningen. Man översätter ord för ord. För detta krävs ett antal lexikon och några enkla regler för att till exempel placera orden i en annan ordning. Vanligtvis motsvarar varje ord i källmeningen ett ord i målmeningen. Det stora problemet med dessa modeller är omplaceringsfenomenet. Denna metod används inte längre idag men är som sagt en föregångare till dagens system. Transformationsmodell Att se översättning som att det handlar om att övervinna de strukturella skillnaderna mellan språken har fått transformationsmodeller att växa fram. Dessa modeller försöker använda kunskapen kring de strukturella skillnaderna där de tittar hur två språk skiljer sig åt. Regler skapas för att kunna översätta mellan två språk. Ett problem med transformationsmodeller och alla dess regler är att reglerna måste skapas för alla par av språk vi vill översätta. Detta är inte optimalt om man vill översätta från flera språk till flera andra som till exempel inom EU, utan nya ansatser krävs. Interlingua En ansats som kallas interlingua har som grundidé att försöka utvinna innebörden av meningar för att sedan översätta just denna innebörd. Detta synsätt förutsätter att det finns en innebörd som går att representera. Tanken är att kunna representera alla meningar som betyder samma sak på samma sätt oavsett vilket språk det är på. Genom att använda en semantisk analyserare på källmeningen kan vi skapa sådana representationer, som beskriver relationer mellan orden, pronomen, prepositioner med mera (Jurafsky och Martin, 2008). Frasbaserade modeller Det är i naturligt språk vanligt att angränsande sekvenser av ord kan översättas som en enhet. Till skillnad från ordbaserad översättning där varje ord först måste översättas och sedan ordnas, om så ger frasbaserade modeller samma svar med färre steg. Det har visat sig vara större risk för att något går snett ju fler steg som är inblandade. I frasbaserade modeller är översättningsenheten en kortare eller längre fras. En fras från ett språk översätts till motsvarande fras i ett annat språk. Det spelar ingen roll om frasen är längre på ett

7 språk. Även ensamma ord, som inte tillhör någon speciell fras, kallas ettordsfraser och kan översättas. Översättningsprocessen sker i tre steg: 1. Meningen delas upp i fraser 2. Varje fras översätts till motsvarande 3. De översätta fraserna placeras i dess slutgiltiga ordning. Frasbaserade modeller producerar bättre översättningar än ordbaserade modeller (Jurafsky och Martin, 2008). Introduktion statistisk maskinöversättning När det finns en sekvens av J källord och en sekvens av I målord så är målet för översättningssystemet att med inputsekvensen f(j1) hitta en sekvens e(i1) som är översättningsekvivalent. Genom att visa de ord som motsvarar varandra i de två sekvenserna kan ett streck dras mellan orden, vilket kallas för att de är alignerade. Eftersom översättning av ord ofta är tvetydigt och valet då beror på kontext så måste översättningssystemet ha en mekanism som hjälper till att välja mellan flera olika alternativ. Ett annat problem är när språk skiljer sig åt i systematisk struktur. Systemet måste kunna ordna om orden så att de hamnat rätt. Alltså handlar översättning om att: göra ett antal ordöversättnings- och omplaceringsbeslut (Lopez, 2008). De klassiska metoderna, som direktöversättning och interlingua fokuserar främst på processen. En metod som väljer att fokusera på resultatet är statistiska maskinöversättningsmetoder. Målet med en översättning är att få en outputmening som maximerar någon värdefunktion som representerar vikten av överrensstämmelse och flyt. Statistisk maskinöversättning gör detta genom att bygga probabilistiska modeller av överrensstämmelse och flyt och sen kombinerar modellerna att välja den troligaste översättningen. Att modellera översättningen från en källspråksmening F till en målspråksmening E där målet är att maximera överrensstämmelse och flyt kan se ut så h ä r: bästa översättningen Ê = argmax av E överrensstämmelse(e,f) flyt(e) Denna modell kallas för bruskanalen (Jurafsky och Martin, 2008). Statistisk maskinöversättning: bakgrund Ansatsen till statistisk maskinöversättning är att se källmeningen, det vill säga indata som en korrupt version av målmeningen. Till exempel skulle en utländsk mening F, som vi vill översätta, vara en förvriden version av någon engelsk mening E, som vi vill ta reda på. Systemets uppgift är att upptäcka den dolda meningen E på engelska som genererade observationsmeningen F (Jurafsky och Martin, 2008).

8 Statistisk maskinöversättning handlar om att hantera översättning som ett maskininlärningsproblem. Det innebär att en inlärningsalgoritm appliceras till en stor samling tidigare översatt text, känt som en parallellkorpus (Lopez, 2008). N-gram är en probabilistisk modell för att förutsäga det troligaste ordet eller ordföljden. N-gram modellen är ett av de viktigaste verktygen inom språkbearbetning. Genom att ha data om vilka ord och ordföljder som är mest förekommande kan man räkna ut till exempel ordföljder. Modellen får träna på en parallellkorpus och är sedan kapabel att översätta tidigare osedd text på något av de två språken som fanns i parallellkorpusen (Jurafsky och Martin, 2008). Med en tillräckligt stor parallellkorpus och ett statistiskt maskinöversättningsverktyg kan ett maskinöversättningssystem för ett nytt språkpar byggas väldigt snabbt. Korrektheten för systemet beror på kvantitet, kvalitet och domän av träningskorpusarna (Lopez, 2008). Att bygga ett statistiskt maskinöversättningssystem För att bygga ett statistiskt maskinöversättningssystem finns det fyra problem som måste lösas. Dessa är: 1. För att förvandla en källmening till en målmening måste den serie av steg som krävs beskrivas. Detta kallas en översättningsekvivalensmodell. 2. Modellen måste kunna välja bra beslut när den står inför en tvetydighet. Det behövs en parameter, ett poängsystem för varje möjlig käll- och målmening som modellen väljer bland. Detta kallas parameterisation. 3. Parametern måste kunna definiera poängen för meningarna och detta kallas för parameteruppskattning. 4. Slutligen måste modellen kunna leta upp den målmening som har högst poäng, givet en källmening. Detta kallas för avkodning (Lopez, 2008). Modellering del 1 -översättningsekvivalensmodell En modell kan förklaras som en uppsättning regler som används av maskinöversättningssystemet för att kunna översätta meningar. I princip så kan reglerna komma från vart som helst, men ofta är de automatiskt uttagna från en parallellkorpus. Det finns många olika typer av modeller. Modellering del 2 parameterisation Då många möjliga alternativa översättningar finns i naturligt språk krävs det en mekanism som kan välja mellan dem. Funktionen för klassificering kommer vara förenklad P(e, d f). f är inputmeningen som ska översättas till e. Funktionen går över skilda mängder, men mängderna är väldigt stora eller oändliga.

9 Målet med matematisk modellering är att parameterisera funktionen för att effektivt och pålitligt lära den. För att göra detta kan man bland annat använda generativa modeller. En metod för att manipulera probabilistiska modeller är genom kedjeregeln: P(x,y) = P(x y) P(y) Generativa modeller löser upp P(x y) med Bayers regel till: P(X,Y) P(y x) P(x) P(x y) = = P(y) P(y) Genom att applicera Bayers regel till det strukturerade klassifikationsproblemet blir ekvationen: P(f,d e) P(e) P(e,d f) = P(f) Vid avkodning är denominatorn P(f) konstant oavsett input så den kan ignoreras och därmed fokuseras sannolikheterna för P(f,d e) och P(e). I statistisk maskinöversättning kallas funktionen P(e) språkmodellen och P(f,d e) för översättningsmodellen. För att upptäcka meningen e(i1) givet f(j1) modelleras det motsatta, precis som i IBM modell 4 som översatte från e(i1) till f(j1). Fördelen med denna, över att modellera P(e,d f) direkt, är att vi kan använd två oberoende modeller för analys av flertydigheter. Detta är fördelaktigt eftersom de båda modellernas uppskattningar är något felaktiga. Genom att använda dem tillsammans kan felaktigheterna uppvägas något. Inom språkmodellering är vårt mål att hitta en lätthanterlig representation för funktionen P((e(I1)). Generativa modeller använder probabilistiska verktyg där ett är kedjeregeln som får formeln att förvandlas till: I P((e(I1)) = P(ei ei-1, 1) j=1 Ekvationen berättar att den villkorliga sannolikheten för meningen e(i1) är produkten av många små sannolikheter, som var och en korresponderar med ett ensamt ord. För att ytterligare förenkla modellen införs något som kallas villkorligt oberoende. När variabeln x är villkorligt oberoende av y menas att P(x y) = P(x) det vill säga att när värdet på y är känt så påverkar det inte sannolikhetsfördelningen av x. Det är inte bra att göra för många eller fel antaganden om oberoende för att det kan leda till att sannolikhetsfördelningarna blir inkorrekta. Översättningsmodeller förenklas på samma vis som språkmodeller. Varje fördelning på höger sida i ekvationen innehåller ett tillräckligt litet antal termer för att systemet kan lära sig dem. När systemet kör kan värdet på termerna tittas upp och användas för att räkna ut funktionen. Alla dessa värden är parametrar av modellen (Lopez, 2008).

10 Del 3 parameteruppskattning Parameteruppskattning är när parametrarna för P(e,d f) får värden. I statistisk maskinöversättning får maskininlärningsalgoritmen en parallellkorpus som input för att kunna räkna ut parametervärden. De största parametervärdena är de som, troligen, ger bästa översättningen så därför vill systemet hitta den funktionen som ger maximalt värde. Del 4 avkodning Av modellen och uppskattningen av alla parametrar kan nu nya inputmeningar översättas. Detta steg kallas avkodning. Finite-state-avkodning är en algoritm där sökning sker genom en direkt acyklisk graf av tillstånd som representerar delar eller fullständiga översättningshypoteser. Dessa är konstruerade från vänster till höger i målspråkets ordföljd. Den hypotesmening som har högst poäng väljs som översättning (Lopez, 2008). Diskussion Jag tror att språköversättning alltid kommer att handla om språkförståelse i slutändan, oavsett hur många och hur avancerade modeller man skapar. Språköversättning och språkförståelse hänger ihop och jag tror inte att man med algoritmer kan skapa ett system som automatiskt kommer kunna översätta mellan språk på ett sådant sätt att människan tycker att det är felfritt. Eftersom alla individer har sina egna sätt att uttrycka sig på och är kreativa i det språk de behärskar, så skapas nya kombinationer av ord hela tiden. Nya uttryck kommer och går och ibland kan det vara svårt även för de människor som pratar ett språk att uppfatta betydelser av meningar. Men jag tror att översättningssystemen kommer att bli bättre i framtiden och att det kommer att underlätta för översättningsanvändarna. Även om översättningarna inte kommer vara helt perfekta så kommer människor fortfarande att ofta kunna lista ut innebörden av en översättning. Svårigheterna med de regelbaserade översättningssystemen är att reglerna är olika mellan alla språk och det blir fort svårt att hantera alla dessa regler. Även känns det som att denna ansats är den som mest tar hänsyn till just förståelsen av ett språk vid översättning. De statistiska modellerna har gått längre ifrån förståelsen tycker jag och satsar istället på att matcha inputmeningen med tidigare sedda meningar från parallellkorpusar. Det är en helt annan ansats än den som grundar sig på förståelsen av språk och dess säregenheter, men visat sig vara den överlägset bästa. I framtiden kanske det kommer bättre modeller som använder sig av det bästa från de båda ansatserna. Referenser Jurafsky, D. and Martin, J. (2008). Speech and language processing. 2 nd ed. Prentice- Hall Lopez, A. (2008). Statistical Machine Translation

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson

Linköpings universitet Artificiell Intelligens II 729G11 HT Maskinöversättning. med hjälp av statistik. Erik Karlsson Maskinöversättning med hjälp av statistik Erik Karlsson erika669@student.liu.se Innehåll Inledning... 1 Bakgrund och historia... 2 Historia... 2 Klassiska designer... 2 Direkt översättning... 2 Interlingua...

Läs mer

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem

LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, HT10 SMT. En fördjupning i statistiska maskinöversättningssystem LINKÖPINGS UNIVERSITET 729G11, Artificiell Intelligens II, SMT En fördjupning i statistiska maskinöversättningssystem johka299@student.liu.se 2010-10-01 Innehållsförteckning 1. Introduktion till översättning...

Läs mer

Kursplaneöversättaren. Lina Stadell

Kursplaneöversättaren. Lina Stadell Kursplaneöversättaren Lina Stadell lina.stadell@convertus.se 2017-11-13 Innehåll Allmänt Språkliga resurser Översättningsprocessen Översättningsproblem Stavningskontroll Allmänt Bygger på egenutvecklad

Läs mer

Statistisk maskinöversättning

Statistisk maskinöversättning Statistisk maskinöversättning Åsa Holmqvist Asaho232 Artificiell Intelligens 729G43 Innehållsförteckning Introduktion... 1 Maskinöversättningens historia.... 1 Statistisk metod... 3 Brusiga kanalen....

Läs mer

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel

Anna Sågvall Hein, Institutionen för lingvistik, Uppsala universitet Rosenbad/2001-08-24. Automatisk översättning och översättningshjälpmedel Automatisk översättning och översättningshjälpmedel 1 / 4 Klassiska problem med maskinöversättning orealistiska förväntningar dåliga översättningar svårigheter att integrera maskinöversättning i arbetsflödet

Läs mer

Språkteknologi. Språkteknologi

Språkteknologi. Språkteknologi Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi

Läs mer

Inledande programmering med C# (1DV402) Introduktion till programmering

Inledande programmering med C# (1DV402) Introduktion till programmering Introduktion till programmering Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt

Läs mer

Språktypologi och språksläktskap

Språktypologi och språksläktskap Språktypologi och språksläktskap Andersson 2e december 2010 Andersson () Språktypologi och språksläktskap 2e december 2010 1 / 11 Språkklassifikation Genetisk klassifikation Hur är språk släkt med varandra?

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Introduktion till programmering

Introduktion till programmering Introduktion till programmering Vad är programmering? Vad gör en dator? Vad är ett datorprogram? 1 (9) Vad är programmering? För att bestämma en cirkels area måste du: 1. Dividera diametern 5 med 2. 2.

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder

2012-05-10. Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder Mekaniskt lexikon, patenterat av George Artsrouni på tidigt 1930 tal Perforerade pappersband och avläsningsnockar 1 ord per 3 sekunder 1 Leibniz, tidigt 1600 tal Descartes, tidigt 1600 tal Petr Smirnov

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Probabilistisk logik 2

Probabilistisk logik 2 729G43 Artificiell intelligens / 2016 Probabilistisk logik 2 Marco Kuhlmann Institutionen för datavetenskap Översikt Probabilistiska modeller Probabilistisk inferens 1: Betingad sannolikhet Probabilistisk

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

729G09 Språkvetenskaplig databehandling

729G09 Språkvetenskaplig databehandling 729G09 Språkvetenskaplig databehandling Modellering av frasstruktur Lars Ahrenberg 2015-05-04 Plan Formell grammatik språkets oändlighet regler Frasstrukturgrammatik Kontextfri grammatik 2 Generativ grammatik

Läs mer

Neurolingvistik - Grammatik

Neurolingvistik - Grammatik Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Lingvistik I Delmoment: Datorlingvistik

Lingvistik I Delmoment: Datorlingvistik Lingvistik I Delmoment: Datorlingvistik evapet@stp.lingfil.uu.se 1 Lingvistik I, 12 februari 2007 Föreläsningsöversikt Datorlingvistik/språkteknologi vad är det? Några språkteknologiska tillämpningsområden:

Läs mer

Maskinöversättning. F Anna Sågvall Hein

Maskinöversättning. F Anna Sågvall Hein Maskinöversättning F1 2008 Anna Sågvall Hein Vad menas med maskinöversättning? Maskinöversättning handlar om att få datorer att översätta från ett språk till ett annat. Det finns många olika metoder och

Läs mer

Vardagssituationer och algebraiska formler

Vardagssituationer och algebraiska formler Modul: Algebra Del 7: Kommunikation i algebraklassrummet Vardagssituationer och algebraiska formler Cecilia Kilhamn, Göteborgs Universitet och Jörgen Fors, Linnéuniversitetet En viktig del av algebran

Läs mer

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01

Två-nivåmodellen, TWOL. 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Två-nivåmodellen, TWOL 2D1418 Språkteknologi, Nada KTH Höstterminen 2004 Lisa Lagerkvist, Me-01 Inledning Morfologisk parsning är nödvändig i de flesta språkteknologiska tillämpningar eftersom man nästan

Läs mer

Vägar till bättre översättningsprogram

Vägar till bättre översättningsprogram Vägar till bättre översättningsprogram Aarne Ranta, Thomas Hallgren, Krasimir Angelov Data- och informationsteknik Göteborgs universitet & Chalmers tekniska högskola Vetenskapsfestivalen 8 maj 2014, Göteborg

Läs mer

- ett statistiskt fråga-svarsystem

- ett statistiskt fråga-svarsystem - ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...

Läs mer

Maskinöversättning idag

Maskinöversättning idag Maskinöversättning idag Efter en tid av ifrågasättande har nu återigen maskinöversättningen kommit att stå i centrum för språkteknologin och börjat användas av företag och myndigheter för översättning

Läs mer

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord

Skrivstöd. Joakim Nivre. Introduktion till språkteknologi. Skrivstöd. Inledning. Orsaker till stavfel. Detektering av icke-ord Joakim Nivre / 30 Varför bry sig om stavning? Stavfel kan skapa missförstånd Stavfel kan dölja innehåll Standardiserad stavning underlättar många uppgifter Slå upp ord i ordbok Identifiera svårlästa ord

Läs mer

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA)

Ramkursplan i teckenspråk som modersmål för hörande barn till döva och hörselskadade föräldrar (CODA) Ramkursplan 2013-06-24 ALL 2013/742 Fastställd av generaldirektör Greger Bååth den 24 juni 2013 Framtagen av Carin Lindgren, Malin Johansson och Helena Foss Ahldén Ramkursplan i teckenspråk som modersmål

Läs mer

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen

Läs mer

Öjersjö Storegård, Partille Kommun, vt-07

Öjersjö Storegård, Partille Kommun, vt-07 Öjersjö Storegård, Partille Kommun, vt-07 Lärandeobjekt: Förmågan att urskilja och tillämpa pronomen i direkt objektsform. Eleverna skulle klara av att översätta från svenska till spanska och tvärtom.

Läs mer

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)

Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007) Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket

Läs mer

När kan man lita på maskinöversättning?

När kan man lita på maskinöversättning? När kan man lita på maskinöversättning? Aarne Ranta Institutionen för data- och informationsteknik Chalmers tekniska högskola och Göteborgs universitet aarne@chalmers.se Sammanfattning Artikeln ger en

Läs mer

de var svåra att implementera och var väldigt ineffektiva.

de var svåra att implementera och var väldigt ineffektiva. OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Föreläsning 1: Intro till kursen och programmering

Föreläsning 1: Intro till kursen och programmering Föreläsning 1: Intro till kursen och programmering Kursens hemsida http:www.it.uu.se/edu/course/homepage/prog1/vt11 Studentportalen http://www.studentportalen.uu.se Lärare: Tom Smedsaas, Tom.Smedsaas@it.uu.se

Läs mer

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN

Maskinöversättning handlar om att. Datorn behöver statistik och grammatik MASKINÖVERSÄTTNING ANNA SÅGVALL HEIN MASKINÖVERSÄTTNING Datorn behöver statistik och grammatik ANNA SÅGVALL HEIN Det är lätt att skoja med en del resultat av maskinöversättning: Vad kan vi lära av det blir What can we faith of it. Då gör

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer

Kursbeskrivning med litteraturlista HT-13

Kursbeskrivning med litteraturlista HT-13 Kursbeskrivning med litteraturlista HT-13 Skriftlig språkfärdighet, 7,5 hp Delkurs inom Italienska I, 30 hp. Består av: I. Italiensk grammatik med inlämningsuppgifter, 6 hp, och II. Skriftlig produktion,

Läs mer

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier Arv Fundamental objekt-orienterad teknik arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier Programmeringsmetodik -Java 165 Grafisk respresentation: Arv

Läs mer

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter

Omvärldsbevakning. Sammanfattning av Business Intelligence-kursen. Nyhetsarkiv och källork. Hämta webbnyheter. Modeller över texter Sammanfattning av Business Intelligence-kursen Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se Omvärldsbevakning Påverkan från omvärlden Påverka omvärlden Tidigare långsam spridning papperstidningar,

Läs mer

Centralt innehåll. Läsa och skriva. Tala, lyssna och samtala. Berättande texter och sakprosatexter. Språkbruk. Kultur och samhälle.

Centralt innehåll. Läsa och skriva. Tala, lyssna och samtala. Berättande texter och sakprosatexter. Språkbruk. Kultur och samhälle. MODERSMÅL Språk är människans främsta redskap för att tänka, kommunicera och lära. Genom språket utvecklar människor sin identitet, uttrycker känslor och tankar och förstår hur andra känner och tänker.

Läs mer

Formell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet

Formell logik Kapitel 1 och 2. Robin Stenwall Lunds universitet Formell logik Kapitel 1 och 2 Robin Stenwall Lunds universitet Kapitel 1: Atomära satser Drömmen om ett perfekt språk fritt från vardagsspråkets mångtydighet och vaghet (jmf Leibniz, Russell, Wittgenstein,

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Tal i bråkform. Kapitlet behandlar. Att förstå tal

Tal i bråkform. Kapitlet behandlar. Att förstå tal Tal i bråkform Kapitlet behandlar Test Användning av hälften och fjärdedel 2 Representation i bråkform av del av antal och av del av helhet 3, Bråkform i vardagssituationer Stambråk, bråkuttryck med 1

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

ANDREAS ISSA SVENSKA SPRÅKET

ANDREAS ISSA SVENSKA SPRÅKET ANDREAS ISSA SVENSKA SPRÅKET Kopieringsförbud! Denna bok är skyddad av upphovsrättslagen. Kopiering, utöver rätt att kopiera enligt BONUS-avtal, är förbjuden. Den som bryter mot lagen om upphovsrätt kan

Läs mer

Föreläsning 1: Intro till kursen och programmering

Föreläsning 1: Intro till kursen och programmering Föreläsning 1: Intro till kursen och programmering λ Kursens hemsida http:www.it.uu.se/edu/course/homepage/prog1/mafykht11/ λ Studentportalen http://www.studentportalen.uu.se UNIX-konton (systemansvariga

Läs mer

ClaroDictionary med tal. ClaroDictionary utan tal

ClaroDictionary med tal. ClaroDictionary utan tal ClaroDictionary med tal ClaroDictionary utan tal Manual Artikelnummer 10400 och 10401 1 Innehåll Välkommen till ClaroDictionary...3 ClaroDictionary Översikt...4 ClaroDictionarys verktygsknappar...4 Knappen

Läs mer

Ramkursplan i teckenspråk för syskon till döva och hörselskadade barn

Ramkursplan i teckenspråk för syskon till döva och hörselskadade barn Ramkursplan 2013-06-19 ALL 2013/743 Fastställd av generaldirektör Greger Bååth den 24 juni 2013 Framtagen av Carin Lindgren, Malin Johansson och Helena Foss Ahldén Ramkursplan i teckenspråk för syskon

Läs mer

Lexikon: ordbildning och lexikalisering

Lexikon: ordbildning och lexikalisering Svenskan i tvärspråkligt perspektiv Lexikon: ordbildning och lexikalisering Solveig Malmsten Vår inre språkförmåga Lexikon Ordförråd : Uttryck i grundform + deras betydelse Enkla ord, t.ex. blå, märke

Läs mer

Svenskans struktur, 7,5 hp Tentamensexempel 1

Svenskans struktur, 7,5 hp Tentamensexempel 1 Svenskans struktur, 7,5 hp Tentamensexempel 1 På de följande sidorna återges ett exempel på en tentamen i Svenskans struktur. Tentan är uppdelad i tre delar. För att få godkänt på kursen måste man ha godkänt

Läs mer

Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse

Semantik VT Introduktion. Dagens föreläsning. Morfem-taxonomi forts. Morfem-taxonomi. Lexikal semantik: studerar ords betydelse Dagens föreläsning Semantik VT07 Ordbetydelse (Lexikal semantik) Stina Ericsson 1. Introduktion 2. Extensioner 3. Begrepp 4. Extensioner och begrepp - några ytterligare saker Lexikal semantik: studerar

Läs mer

Introduktion till programmering D0009E. Föreläsning 1: Programmets väg

Introduktion till programmering D0009E. Föreläsning 1: Programmets väg Introduktion till programmering D0009E Föreläsning 1: Programmets väg 1 Vad är en dator? En maskin vars beteende styrs av de innehållet (bitmönster) som finns lagrade i datorns minne (inte helt olikt förra

Läs mer

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen:

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen: Modul: Algebra Del 8: Avslutande reflektion och utvärdering Distributiva lagen Cecilia Kilhamn, Göteborgs Universitet Distributiva lagen a (b + c) = a b + a c Den distributiva lagen kallas den räknelag

Läs mer

Föreläsning 5: Grafer Del 1

Föreläsning 5: Grafer Del 1 2D1458, Problemlösning och programmering under press Föreläsning 5: Grafer Del 1 Datum: 2006-10-02 Skribent(er): Henrik Sjögren, Patrik Glas Föreläsare: Gunnar Kreitz Den här föreläsningen var den första

Läs mer

Mål och betygskriterier i Engelska

Mål och betygskriterier i Engelska Mål och betygskriterier i Engelska Mål för år 7 För att uppnå nivån godkänd i engelska krävs förutom att eleven behärskar nedanstående moment att han/hon deltar aktivt i lektionsarbetet muntligt såväl

Läs mer

Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium. v. 2.0, den 29/ III. Metalogik 17-19

Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium. v. 2.0, den 29/ III. Metalogik 17-19 Filosofisk Logik (FTEA21:4) föreläsningsanteckningar/kompendium IV v. 2.0, den 29/4 2013 III. Metalogik 17-19 Modeller för satslogiken 18.1 Vi har tidigare sagt att en modell är en tolkning av en teori

Läs mer

Programmering i C++ En manual för kursen Datavetenskaplig introduktionskurs 5p

Programmering i C++ En manual för kursen Datavetenskaplig introduktionskurs 5p Programmering i C++ En manual för kursen Datavetenskaplig introduktionskurs 5p Skriven av Michael Andersson Introduktion Programmering I högnivåspråk fokuserar på själv problemet (algoritmen) istället

Läs mer

Kompositionell semantik och λ-kalkyl

Kompositionell semantik och λ-kalkyl UPPALA UIVERITET http://stp.ling.uu.se/~matsd/uv/uv05/ads1/ Institutionen för lingvistik och filologi Mats Dahllöf mats.dahllof@lingfil.uu.se Algoritmer för datorlingvistisk semantik I, Föreläsningsanteckningar,

Läs mer

Begrepp Uttryck, värdet av ett uttryck, samband, formel, graf, linje, diagram, spridningsdiagram.

Begrepp Uttryck, värdet av ett uttryck, samband, formel, graf, linje, diagram, spridningsdiagram. Aktivitetsbeskrivning Denna aktivitet samlar ett antal olika sätt att göra procentuella beräkningar på grafräknare. Dessa metoder finns som uppgifter eller som en samling tips i en lathund. Matematiskt

Läs mer

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder.

Asymptotisk analys innebär att... man försöker uppskatta vad som händer för stora indatamängder. OBS! För flervalsfrågorna gäller att ett, flera eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad för att man skall

Läs mer

Ordförråd och Ordbildning

Ordförråd och Ordbildning Ordförråd och Ordbildning Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Språkstruktur! Fonologi - fonemens kombinationer till morfem! fonem - minsta betydelseskiljande

Läs mer

Handbok i konsten att köpa översättningar

Handbok i konsten att köpa översättningar Handbok i konsten att köpa översättningar Innehåll Varför översätta? 4 Vad är en bra översättning? 5 Att välja språkföretag 6 Tänk flerspråkigt från början 8 Inför din förfrågan 10 När du kontaktar språkföretaget

Läs mer

Om ämnet Engelska. Bakgrund och motiv

Om ämnet Engelska. Bakgrund och motiv Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,

Läs mer

En byggmodell över språket fonemet morfemet

En byggmodell över språket fonemet morfemet En byggmodell över språket Tänk dig att språket är en byggnad, en jättestor byggnad naturligtvis. Byggnaden är av lego. Tänk dig att de enklaste legobitarna är orden. Kombinationerna är oändliga men inte

Läs mer

Introduktion till programmering SMD180. Föreläsning 9: Tupler

Introduktion till programmering SMD180. Föreläsning 9: Tupler Introduktion till programmering Föreläsning 9: Tupler 1 1 Sammansatta datatyper Strängar Sekvenser av tecken Icke muterbara Syntax: "abcde" Listor Sekvenser av vad som helst Muterbara Syntax: [1, 2, 3]

Läs mer

SVANTE JANSON OCH SVANTE LINUSSON

SVANTE JANSON OCH SVANTE LINUSSON NORMLPPROXIMTION FÖR SNNOLIKHETEN FÖR TT FELKTIGT HNTERDE RÖSTER PÅVERKR MNDTFÖRDELNINGEN SVNTE JNSON OCH SVNTE LINUSSON. Inledning ntag att det är nästan jämnt mellan två partier och B vid fördelningen

Läs mer

SVENSKA FÖR INVANDRARE

SVENSKA FÖR INVANDRARE KURSPLAN SVENSKA FÖR INVANDRARE KURS A ljusdal.se KURSPLAN I SVENSKA FÖR INVANDRARE KURS A DU KAN PRESENTERA DIG (BERÄTTA OM DIG SJÄLV). DU KAN BERÄTTA OM: Din familj Ditt land Din lägenhet Dina kläder

Läs mer

Fraser, huvuden och bestämningar

Fraser, huvuden och bestämningar UPPSALA UNIVERSITET Grammatik för språkteknologer Institutionen för lingvistik och filologi Föreläsningsanteckningar Mats Dahllöf November 2015 Fraser, huvuden och bestämningar Översikt i stolpform. Terminologin

Läs mer

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten Svenskan i tvärspråkligt perspektiv Språktypologi Solveig Malmsten Klassifikation av språk Olika sätt att dela in världens språk i grupper typologiskt: strukturella likheter ekologist: storlek och status

Läs mer

Aspekt Nivå 1 Nivå 2 Nivå 3

Aspekt Nivå 1 Nivå 2 Nivå 3 Bedömningsmatris i engelska Elev: Årskurs: Termin: Aspekt Nivå 1 Nivå 2 Nivå 3 Hörförståelse: Uppfattar det Förstår det huvudsakliga Förstår både helhet och förstå, återge huvudsakliga innehållet och några

Läs mer

TDDI16 Datastrukturer och algoritmer. Algoritmanalys

TDDI16 Datastrukturer och algoritmer. Algoritmanalys TDDI16 Datastrukturer och algoritmer Algoritmanalys 2017-08-28 2 Översikt Skäl för att analysera algoritmer Olika fall att tänka på Medelfall Bästa Värsta Metoder för analys 2017-08-28 3 Skäl till att

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK De första grunderna i språket, DET ANDRA INHEMSKA SPRÅKET OCH FRÄMMANDE SPRÅK A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta återkommande och rutinmässiga kommunikationssituationer.

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

Handbok i konsten att köpa översättningar

Handbok i konsten att köpa översättningar Handbok i konsten att köpa översättningar Innehåll Varför översätta? 4 Vad är en bra översättning? 5 Att välja språkföretag 6 Tänk flerspråkigt från början 8 Inför din förfrågan 10 När du kontaktar språkföretaget

Läs mer

Automatisk översättning

Automatisk översättning Automatisk översättning En analys av Google Translate HÅKAN ANDERSSON och ELIN JOHANSSON Examensarbete Stockholm, Sverige 2010 Automatisk översättning En analys av Google Translate HÅKAN ANDERSSON och

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Svenskans satser m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Januari 2011 Satser Satserna utgör den mest mångfacetterade

Läs mer

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0 Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens

Läs mer

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING,

NIVÅSKALA FÖR SPRÅKKUNSKAP OCH SPRÅKUTVECKLING, , Det andra inhemska språket och främmande språk, Grunderna för läroplanen för den grundläggande utbildningen 2014 Kunskapsnivå A1.1 Eleven klarar sporadiskt av, med stöd av sin samtalspartner, några ofta

Läs mer

FTEA12:2 Filosofisk metod. Att värdera argumentation I

FTEA12:2 Filosofisk metod. Att värdera argumentation I FTEA12:2 Filosofisk metod Att värdera argumentation I Dagens upplägg 1. Några generella saker att tänka på vid utvärdering av argument. 2. Grundläggande språkfilosofi. 3. Specifika problem vid utvärdering:

Läs mer

Välkomna till DIT012 IPGO

Välkomna till DIT012 IPGO Välkomna till DIT012 IPGO 1 Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare Joachim von Hacht, hajo@chalmers.se, 772 1003 Handledare (se även kurssida) Alexander Sjösten, sjosten@chalmers.se

Läs mer

Stora talens lag eller det jämnar ut sig

Stora talens lag eller det jämnar ut sig Stora talens lag eller det jämnar ut sig kvensen för krona förändras när vi kastar allt fler gånger. Valda inställningar på räknaren Genom att trycka på så kan man göra ett antal inställningar på sin räknare.

Läs mer

Programmering eller Datalogiskt tänkande

Programmering eller Datalogiskt tänkande Programmering eller Datalogiskt tänkande I förskolan handlar programmering om att få en begynnande förståelse vad det kan innebära. Barnen ges ett kreativt utrymme och har möjlighet att forma sin egen

Läs mer

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2. Förord Grammatikövningar för Sfi består av två delar, del 1 2, för kurserna B C resp C D och liknande utbildningar. Det är ett övningsmaterial som tränar svensk basgrammatik. Utgångspunkten för uppläggningen

Läs mer

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp

Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp Betygskriterier NS1066 Svenska för studenter med utländsk förutbildning, 30 hp astställda av institutionsstyrelsen 2012-05-09. Gäller fr.o.m. ht 12. elkurs 1: et talade språket, 7,5 hp örväntade studieresultat

Läs mer

Pragmatisk och narrativ utveckling

Pragmatisk och narrativ utveckling Pragmatisk och narrativ utveckling Barns tidiga språkutveckling Institutionen för lingvistik, Göteborgs universitet Pragmatik! Pragma! handling! hur vi använder språket! hur vi handlar genom språket! Pragmatik!

Läs mer

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Språkteknologi för ökad tillgänglighet vilka möjligheter finns?

Språkteknologi för ökad tillgänglighet vilka möjligheter finns? Språkteknologi för ökad tillgänglighet vilka möjligheter finns? Rickard Domeij Språkrådet vid Institutet för språk och folkminnen Rickard.Domeij@sprakradet.se Sammanfattning Kraven på myndigheterna att

Läs mer

Digitalt lärande och programmering i klassrummet

Digitalt lärande och programmering i klassrummet Digitalt lärande och programmering i klassrummet Innehåll Vad är programmering och varför behövs det? Argument för (och emot) programmering Programmering i styrdokumenten Kort introduktion till programmering

Läs mer

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator version 2014-09-10 Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator Studentens namn Handledares namn Examinerande

Läs mer

DAB760: Språk och logik

DAB760: Språk och logik DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg

Läs mer

Semantik och pragmatik

Semantik och pragmatik Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext

Läs mer

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet.

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet. MITTUNIVERSITETET Institutionen för humaniora Elzbieta Strzelecka 0611 86 175 070-5771449 Svenska språket GR (A), Läs- och skrivutveckling för grundlärare åk 4 6, Att beskriva språket 7,5 hp Den 16 augusti

Läs mer

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER

INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER INSTITUTIONEN FÖR SPRÅK OCH LITTERATURER LAT110 Latin, grundkurs, 30 högskolepoäng Latin, Introductory Course, 30 higher education credits Fastställande Kursplanen är fastställd av Humanistiska fakultetsnämnden

Läs mer

Neurolingvistik och flerspråkighet

Neurolingvistik och flerspråkighet Neurolingvistik och flerspråkighet Innehåll Flerspråkighet och neurolingvistiska frågor Återhämtningsmönster vid tvåspråkig afasi Neurolingvistiska frågor och hypoteser Frågor? Om man kan mer än ett språk,

Läs mer