Taligenkänning med fördjupning på Hidden Markov Models
|
|
- Rut Karlsson
- för 6 år sedan
- Visningar:
Transkript
1 IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models
2 Sammanfattning Taligenkänning är en teknik som gör det möjligt att givet en akustisk signal identifiera en sekvens av ord som yttras av en talare och på så sätt tolka det mänskliga språket. System som behärskar detta kan komma till stor nytta för personer med olika fysiska handikapp och kommunikationssvårigheter och som kanske annars inte kan interagera på vanligt sätt med t.ex. en dator eller telefon. Det finns flera olika typer av taligenkänningssystem men normalt sett börjar en taligenkännare med att bearbeta den av talaren givna akustiska signalen som sedan jämförs med ord som finns lagrade i ett schablonminne. Orden matchas sedan mot den schablon som passar bäst och ger i form av utdata en tolkning av den talade sekvensen. En modell som är vanlig att använda sig av vid taligenkänning är Hidden Markov model (HMM) med vilken man genom en sannolikhetsprocess kan se på vilka sätt ett ord eller fonem kan uttalas på och genom detta beräkna sannolikheten för att ett ord följs av ett annat. 2
3 Innehållsförteckning 1. Taligenkänning Språkmodellen och den akustiska modellen Taligenkänningssystemets uppbyggnad Olika typer av taligenkännare Användning av taligenkänningssystem Prestation och begränsningar Hidden Markov Model (HMM) HMM s uppbyggnad Problem med HMM s Diskussion Referenser
4 1. Taligenkänning Att tekniken idag är något vi människor minst sagt är beroende av är för många ingen underdrift. Tekniska hjälpmedel för att förbättra vår interaktion med andra människor samt maskiner är därför något många idag ser som en självklarhet. Att personer med olika fysiska handikapp och kommunikationssvårigheter även de skall kunna använda sig av dessa är kanske för alla inte lika självklart, men på många sätt minst lika viktigt. Taligenkänningssystem bygger på en teknik som givet akustiska signaler kan identifiera olika sekvenser av ord och på så sätt tolka det mänskliga språket. För människor som inte kan interagera med t.ex. datorer på ett normalt sätt kan sådana system därför vara till stor nytta. Talet har nämligen en möjlighet att vara ett bättre hjälpmedel än exempelvis ett tangentbord i situationer där fullt naturlig språkkommunikation är användbar. Andra viktiga användningsområden för taligenkänning är telefoni, där taligenkänningssystem kan användas för diverse olika ändamål och diktering som är en transkription av en enskild talares monolog och som bl.a. kan användas inom områden som juridik. Taligenkänningssystem behandlar den akustiska indatan som en oren (engelskans noisy ) version av den ursprungligen talade meningen. För att omvandla den orena versionen så tar systemet hänsyn till alla möjliga meningar som kan passa in på denna och kan därigenom spåra ursprungsmeningen som den som med mest sannolikhet har skapat den orena versionen. Genom att talet är så pass varierande och innehållsrikt så behövs en effektiv algoritm som istället för att söka igenom alla möjliga meningar endast söker igenom de som är mest sannolika att matcha indatan. Detta kan göras med Vitebrialgoritmen eller A*. (Jurafsky & Martin, 2000) 1.1 Språkmodellen och den akustiska modellen Vårt tal kan, som nämnt tidigare, på ett bra sätt beskrivas som orent om man ser till allt ifrån olika bakgrundsljud till hur olika vi uttalar vissa ord samt att vissa olika ord ibland kan låta lika. Genom detta har taligenkänning kommit att betraktas som ett probabilistiskt slutledningsproblem. Problemet kan lättast beskrivas genom Bayes teorem där ord är en slumpmässig variabel som sträcker sig över alla möjliga sekvenser av ord som kan yttras och signal är den observerade akustiska signalsekvensen: P(ord signal) = α P(signal ord) P(ord) P(signal ord) kallas här för den akustiska modellen. Den beskriver hur orden låter. T.ex. att engelskans ceiling (tak) börjar med ett mjukt c och låter lika som sealing (försegling). P(ord) däremot kallas för språkmodellen och beskriver varje yttrandes sannolikhet att förekomma som t.ex. att engelskans uttryck high ceiling är mer sannolikt att förekomma än uttrycket high sealing. (Russel & Norvig, 2003) För att räkna ut sannolikheten att ett ord följs av ett annat i språkmodellen använder man sig att bigramsmodeller, trigramsmodeller eller n-gramsmodeller. Ovanstående exempel med high ceiling är ett exempel på bigramsmodell och beräknar sannolikheten att ett ord ska 4
5 följa givet det föregående ordet. En trigramsmodell ser till de två föregående orden och en n- gramsmodell ser till de N-1 föregående orden. Modeller likt dessa, där orden som följer endast beror på de föregående, kallas för Markovmodeller och förutsätter att man kan förutsäga sannolikheten för ett ord utan att se allt för långt tillbaka på de föregående. (Jurafsky & Martin, 2000) Språkmodeller som används i taligenkänningssystem är ofta ganska simpla medan den akustiska modellen anses vara mycket mer komplex. Den bygger på att det mänskliga språket innefattar endast 40 eller 50 olika ljud kallade fonem som är den minsta betydelseskiljande enheten. Exempelvis så är [iy] ett fonem till ordet beat och [ih] ett fonem till ordet bit. Genom dessa fonem kan man dela in den akustiska modellen i två delar. Den första delen handlar om uttal och ger för varje ord en tilldelning av sannolika fonemsekvenser. Exempelvis så kan engelskans ceiling uttalas på olika sätt genom fonem: [s iy l ih ng], [s iy l ix ng] eller [s iy l en]. Dessa fonem går i vanliga fall inte att observera och man kan säga att variabeln X t specificerar vilket fonem som yttras vid tiden t. Den andra delen handlar om på vilket sätt ett fonem inses vara en akustisk signal. Variabeln E t ger en akustisk signals observerade särdrag vid tiden t och den akustiska modellen specificerar P(E t X t ), där X t är nuvarande fonem. (Russel & Norvig, 2003) 1.2 Taligenkänningssystemets uppbyggnad Enligt Schmandt ingår det i varje taligenkännare tre grundläggande komponenter. Dessa tre är en språklig representation, ett set av schabloner och en mönstermatchningsalgoritm. I representationen omvandlas talsignalen innan den analyseras för att identifiera ord. Schablonerna beskriver varje ord som ska kännas igen genom igenkännarens vokabulär, dvs. de ord som finns lagrade för igenkännaren att identifiera. Schablonerna är som referenser mot vilka man jämför talsekvenserna för att utgöra vad det är som sägs. Mönstermatchningsalgoritmen har sedan i uppgift att avgöra ordgränser, hitta den mest matchande schablonen och avgöra om skillnaderna mellan schablonen och talsekvensen är små nog för att kunna acceptera ett visst ord. För att lyckas identifiera ett ord måste alltså en taligenkännare fånga den inkommande talsekvensen och omvandla den till den valda representationen, genom mönstermatcharen välja den schablon som är mest lik talsekvensen eller ignorera yttrandet om ingen av schablonerna är en tillräckligt nära matchning. (Schmandt, 1994) 5
6 Figur 1. Beskriver elementen i en taligenkännare. Användarens tal omvandlas till igenkännarens interna representation och jämförs sedan med igenkännarens vokabulär, orden som finns lagrade i schablonminnet. Genom mönstermatchning avgörs sedan vilken schablon som passar bäst in och som utdata ges sedan en tolkning av yttrandet. (Schmandt, 1994) 1.3 Olika typer av taligenkännare Det finns många olika typer av taligenkännare som varierar i både funktionalitet och prestanda. Några av dessa kan vara oberoende, beroende eller anpassningsbara igenkännare. En oberoende igenkännare är anpassad till att känna igen vilken talare som helst medan en beroende igenkännare bara kan känna igen en specifik talare. En anpassningsbar taligenkännare är en kombination av dessa två och har förmågan att kunna anpassa sig efter sin användare. Med tanke på att vi människor ofta uttalar samma ord på flera olika sätt är den oberoende taligenkännaren en aning mer komplicerad än den beroende. En variation i talarens uttal och röstläge ställer då till problem gällande mönstermatchningen. Detta gör att en oberoende taligenkännare kräver mer genomtänkt teknik för att lyckas känna igen olika sätt som ett visst ord kan uttalas på. På grund av detta har oberoende igenkännare ofta ett begränsat vokabulär på ca 10 till 20 ord och känner endast igen enstaka ord som uttalas separat. Anledningen till att beroende igenkänning anses vara lättare är att en enskild talare har ett mer konsist sätt att uttala orden på och dessa är därför lättare att känna igen. En anpassningsbar taligenkännare lär sig att anpassa sig till en specifik talare genom att antingen kalibrera sig själv till något den känner igen från den specifika personens tal eller genom att införliva användarfeedback när den känner igen ett ord som rätt eller fel. En sådan taligenkännare har en akustisk modell för varje ord den renar för att passa en viss talare. För att igenkännaren lättare ska lyckas avgöra hur en viss person talar kan personen först läsa ett stycke träningsdata varigenom igenkännaren då kan utläsa sättet denne talar på. Gällande huruvida taligenkännare kan känna igen flera ord med eller utan pauser emellan finns det diskreta taligenkännare som kräver pauser mellan varje ord för att identifiera ordgränser eller sammansatta taligenkännare som är designade till att känna igen kortare stycken av ord som talas i en fras. En kontinuerlig taligenkännare känner igen längre 6
7 sekvenser med vanligt tal utan att talaren tar några pauser mellan orden och taligenkännare som känner igen vissa nyckelord kan lokalisera ett fåtal ord i en obestämd mängd tal. Ännu en skillnad mellan olika taligenkänningssystem kan vara storleken på dess vokabulär. Dessa skulle kunna delas in i tre olika storlekar små, medium och stora. En igenkännare med en vokabulär på färre än 200 ord anses ha en liten sådan. En vokabulär på mellan ord anses vara en mediumstor igenkännare och igenkännare med ord i sin vokabulär benämns som stora. (Schmandt, 1994) 1.4 Användning av taligenkänningssystem Det finns flera olika användbarhetsområden där man drar nytta av att använda sig av taligenkänningssystem. Ett av dessa är telefoni som oftast kräver en oberoende igenkännare med en relativt liten vokabulär eftersom talaren då ofta är okänd. Inom telefoni kan man dra nytta av taligenkänning vid exempelvis banktjänster, beställningstjänster eller olika mottagaren-betalar-tjänser. Människans interaktion med datorer är även det ett viktigt användningsområde för taligenkänning och då främst för personer med olika handikapp och kommunikationssvårigheter. Att då kunna använda sig t.ex. av en röststyrd dator för att kunna kommunicera är något som för dessa personer kan göras möjligt genom taligenkänning. Man måste däremot ta hänsyn till det faktum att taligenkänning kanske inte kommer att kunna ersätta vanliga datorer och tangentbord och se till problem som att det kan ta mycket längre tid för sådana system samt att det krävs mycket för att göra taligenkänningen så pass omfattande som det kan krävas. (Schmandt, 1994) 1.5 Prestation och begränsningar För att lyckas skapa bra taligenkänningssystem krävs kunskap och expertis som vilar på en mycket bred bas och är hämtad ur flera olika discipliner såsom lingvistik, datavetenskap, psykologi med flera. Detta kräver att forskare som arbetar med taligenkänningssystem har en god förståelse för just detta för att lyckas lösa problem av bredare karaktär, utan att för den skull behöva vara experter på alla dessa olika discipliner. För att mäta ett taligenkänningssystems prestationsförmåga ser man främst till dess precision och snabbhet, och många användare av dessa system är överens om att de kan uppvisa en mycket hög prestation i kontrollerade förhållanden. Många kommersiella företag som marknadsför igenkänningssystem menar att de kan uppnå mellan 98-99% i precision under optimala förhållanden. Till optimala förhållanden räknas då att talets karaktär matchar med intränad data, att systemet kan anpassa sig väl till talaren och att det kan agera i en omgivning utan störande moment såsom olika bakgrundsljud eller andra ljud som talaren ger ifrån sig. Talare som t.ex. pratar med en kraftig brytning kan därför uppnå sämre igenkänningsresultat än personer som talar tydligt och koncist. ( 7
8 Enligt Schmandt kan fel som uppstår vid taligenkänning delas in i tre klasser: 1. Avslag, där talaren säger ett ord som finns med i igenkännarens vokabulär men ändå inte känns igen. 2. Ersättning, där talaren säger ett ord som finns med i igenkännarens vokabulär men som känns igen som ett annat. 3. Införande, där irrelevanta ord känns igen genom att talaren andas eller smackar eller andra störningar som bakgrundsljud. Alla dessa fel uppkommer lättast vid sammansatt igenkänning, stora vokabulär samt vid användning av oberoende taligenkännare. Det kan vara svårt att veta hur stor sannolikheten för att olika fel ska inträffa är för olika typer av taligenkänningsprodukter men man tar oftast hänsyn till bakgrundljud, vokabulär, samarbetet med talaren och talarens attityd samt erfarenhet. Även det faktum att många olika ord kan låta lika är något som kan vara frustrerande för såväl människan som för taligenkännare. Detta kan vara svårt utan en fördjupad förståelse för den akustiska representationen men i stort kan man säga att ord som innehåller liknande fonemsekvenser ofta kan leda till olika fel vid igenkänningen. Genom ett antal olika tekniker kan man dock försöka att minimera de fel som man uppkomma vid taligenkänning genom att vara noga med att välja ut igenkännarens vokabulär, kontrollera omgivningens akustik samt vilken mikrofon som används och att träna talaren i att tala tydligt och konsekvent. (Schmandt, 1994) 8
9 2. Hidden Markov Model (HMM) Det finns flera olika tekniker att tillämpa på taligenkänningssystem för att känna igen olika talmönster och Hidden Markov Models är en av dessa. Andra exempel på tekniker är Dynamic Time Warping, Vector Quantization samt neurala nätverk. (Schmandt, 1994) I mer än de två senaste årtiondena har HMM ansetts vara en av de främsta stokastiska modellerna att använda sig av vid automatisk taligenkänning och imponerande HMMbaserade igenkännare har skapats för många varierade och svåra taligenkänningsuppgifter. (Glass, 2002) Grundteorin för HMM s publicerades i slutet på 1960-talet av Baum och hans kollegor och på 70-talet användes olika tillämpningar med talprocesser av Baker vid CMU och av Jelinek med kollegor vid IBM. (Rabiner & Juang, 1993) En Hidden Markov Model är en sannolikhetsprocess som kan användas som en kraftfull representation av tal genom att beräkna sannolikheten att ett ord följs av ett annat. Den består av ett antal interna tillstånd som går från initialtillstånd till sluttillstånd genom att steg för steg generera observerad utdata vid varje steg, kallat tillståndsövergångar. Exempelvis kan tillstånden svara mot fonem i ett ord med observerad utdata som svarar mot existerande eller icke existerande akustiska särdrag. För varje steg kan modellen antingen ta sig till nästa tillstånd eller stanna i det nuvarande beroende på observerad utdata. Modellen är gömd, dvs. tillstånden kan inte observeras direkt utan det vi ser är endast utdata. Genom en serie av observerad utdata kan man sedan gissa när modellen befann sig vid de olika tillstånden. (Schmandt, 1994) Figur 2. Ett exempel på en Hidden Markov Model där x är olika tillstånd, y är möjliga observationer, a är tillståndens sannolika övergångar och b är sannolik utdata. ( 2.1 HMM s uppbyggnad En HMM s uppbyggnad kan enligt Rabiner beskrivas genom ett visst antal särdag: 1. N, där N är antal tillstånd i modellen. Dessa tillstånd är ofta sammankopplade på så sätt att ett tillstånd kan nås från något av de andra tillstånden. Tillstånden betecknas S = {S 1, S 2 S N } och tillståndet vid tiden t betecknas q t. 9
10 2. M, där M är antalet observerade olika symboler per tillstånd. De observerade symbolerna svarar mot modellens fysiska utdata. Symbolerna betecknas V = {V 1, V 2 V M }. 3. Tillståndens övergångssannolikheters spridning A = {A ij } där i och j är olika tillstånd och a ij = P[q t+1 = S j q t = S i ] som är sannolikheten att gå mellan dessa tillstånd. 4. B, där B är observerade symbolers sannolika fördelning i tillstånd j. 5. π = {π i } som är själva starttillståndet. Givet lämpliga värden på N, M, A, B och π kan HMM användas som en generator för en observerad sekvens O = O 1 O 2 O T där varje observation är en symbol från V och T är antalet observationer där man: 1. Väljer ett initialtillstånd q 1 = S i beroende på initialtillståndets fördelning π. 2. Sätter t = 1 3. Väljer O t = v k enligt vilken sannolik fördelning en symbol har i ett tillstånd S i. 4. Övergår till ett nytt tillstånd q t+1 = S i enligt den sannolika fördelningen av tillstånd S i. 5. Sätter t = t+1 och går tillbaka till steg 3 om t < T och annars upphöra proceduren. Ovanstående procedur användas både som en generator av observationer och som en modell för hur en given observationssekvens generas av en lämplig HMM. Genom detta kan man se att en specifikation av en HMM kräver en specifikation av två modellparametrar (N och M), en specifikation av observerade symboler samt en specifikation av de tre sannolikhetsmåtten A, B och π. Detta kan sammanfattas genom beteckningen λ = (A, B, π). (Rabiner, 1989, 1993) Schmandt beskriver hur en HMM kan vara uppbyggd genom ett exempel med en låda och en skål som båda är fyllda med svarta och vita kulor. Lådan har fler svarta kulor än skålen som i sin tur har fler vita. Man börjar sedan med att välja en slumpmässig kula från lådan och ger den till en observatör i ett annat rum, som är ovetandes om vad som utförs. Sedan kastas en tärning och visar den på ett tal lägre än fyra så byter man och gör man samma sak med en kula ur skålen. Om talet är större än tre tar man istället en kula från lådan och fortsätter att upprepa proceduren. När vi tar kulor ifrån lådan och tärningen visar på lägre än fyra så fortsätter vi att plocka kulor från skålen. När vi väl börjat plocka kulor ur skålen så fortsätter vi tills vi är klara. Detta kommer leda till att vi spenderar mest tid med att plocka kulor från skålen då en tillståndsövergång från lådan till skålen har en sannolikhet på 1/2 att inträffa medan skålen har en sannolikhet på 1/6 att sluta och 5/6 att fortsätta. Resultatet av detta borde då bli att observatören i början får fler svarta kulor, när vi plockar kulor från lådan, och sedan få fler vita kulor när vi plockar från skålen. Anledningen till att exemplet med kulorna kan liknas vid en HMM är ett visst antal tillstånd med associerade sannolikheter för varje övergång från något av tillstånden, där lådan och skålen är tillstånd och varje gång man kastar tärningen representeras av de olika övergångarna. Genom observatören befinner sig i ett annat rum och inte ser själva handlingarna utan endast resultatet av dem så visar exemplet på att modellen är gömd. (Schmandt, 1994) 10
11 Figur 3. Ett exempel på en HMM där det i varje tillstånd S(n) finns en sannlikhet P(n, n) att stanna i det tillståndet och en sannolikhet P(n, n + 1) för övergång till nästa tillstånd. (Schmandt, 1994) 2.3 Problem med HMM s Enligt Schmandt finns det två problem relaterade till HMM som båda kan lösas matematiskt. Ett av problemen är att HMM givet ett visst antal observerade sekvenser måste kunna representera ett specifikt ord som finns lagrat i schablonminnet. Det andra problemet är att för observerad utdata fastställa vilka interna tillstånd som var mest sannolika vid varje steg. (Schmandt, 1994) Rabiner menar att det finns tre vanliga problem som måste lösas för att man ska kunna tillämpa HMM i verkligheten: Problem 1: Givet den observerade sekvensen O = O 1 O 2 O T och modellen λ = (A, B, π), hur får vi på ett effektivt sätt fram P(O λ), sannolikheten att sekvensen är producerad av modellen? Problem 2: Givet sekvensen O = O 1 O 2 O T och modellen λ, hur väljer vi en motsvarande tillståndssekvens Q = q 1 q 2 q T som är optimal och bäst förklarar observationerna? Problem 3: Hur anpassar vi modellparametrarna λ = (A, B, π) så att de maximerar P(O λ)? Det första problemet är utvärderingsproblemet som handlar om hur man givet en modell och en sekvens av observationer räknar ut sannolikheten för att sekvensen är producerad av modellen. Det andra problemet är att försöka visa den gömda delen av modellen, att hitta den rätta tillståndssekvensen. Det tredje problemet handlar om att optimera modellens parametrar så att de på bästa sätt beskriver hur en given observerad sekvens kommer till. Den observerade sekvensen som används för att anpassas till parametrarna kallas för en träningssekvens då den används för att träna HMM s. Träningsproblemet är avgörande i många fall vid användning av HMM s då det tillåter oss att skapa bra modeller för verkliga fenomen. (Rabiner, 1989) 11
12 3. Diskussion Jag anser personligen att taligenkänning är en välbehövd och fascinerande teknik då den på många sätt kan förbättra vardagen, främst för personer med olika sorters handikapp, när det gäller att kommunicera med omvärlden. Då jag själv anser att olika hjälpmedel för handikappade är ett intressant område som på många sätt måste utvecklas så är taligenkänning en teknik jag ser som en viktig del i detta. Viktigt att tänka på när man utformar dessa system tror jag är att ta hänsyn till vem användaren av systemet är. Beroende på vilket syfte taligenkänningen har, om det så är för en stressad pappa som gör sina bankärenden eller för en handikappad person med ett som vill kunna kommunicera med nära och kära så måste systemen, enligt mig, vara utformade på ett sätt som ger en tillfredsställelse av användarens behov. För att lyckas med detta tror jag att det är betydelsefullt att lägga stor vikt vid igenkänningssystemets vokabulär. Att anpassa detta efter ändamål kan vara viktigt beroende på vad användaren vill få ut av samtalet med systemet. Eftersom vårt tal är så pass varierat och att så många ord låter lika så tror jag att en utveckling av system som har lättare att känna igen ord oavsett t.ex. brytning eller dialekt är något som är viktigt att satsa på. Också hastigheten på systemen verkar kunna vara av det långsammare slaget och eftersom man talar fortare än man skriver så kan säkerligen detta av användare upplevas som en frustrerande del av proceduren. Hur pass möjlig en sådan förbättring i dagsläget är har jag ingen vidare vetskap om men jag kan bara se till mina egna önskemål gällande användning av ett taligenkänningssystem och självklart hade jag velat att systemet skulle kunna användas utan vidare ansträngning. Även områden där taligenkänningen kanske inte är av lika betydande karaktär men ändå på många sätt förenklar olika uppgifter är intressanta att ta hänsyn till. Olika system som förenklar och automatiserar olika sorters tjänster via telefon tror jag, så länge de fungerar på ett tillfredställande sätt, är något som kan vara mycket uppskattat hos användare och vara något vi kommer att använda oss av allt mer. Kanske kommer taligenkänningssystem mer och mer att bli en del av vår vardag på samma sätt som mycket annat inom tekniken som ständigt förbättras och utvidgas, även om jag tror att det finns mycket kvar att utveckla gällande prestandan av systemen. Sammanfattningsvis så tror jag att taligenkänningssystem kommer att få en allt mer betydande roll för människan även om vi alla gånger inte kommer att reflektera så mycket över det. Själv kommer jag dock att fortsätta fascineras och förundras över tekniken som ligger bakom dessa system och bära med mig vetskapen om att tekniken kanske inte alltid är så självklar som vi många gånger tycks tro. 12
13 4. Referenser Glass, J. R. (2002) A probabilistic framework for segment-based speech recognition. Cambridge: MIT Laboratory for Computer Science, 200 Technology Square. Hidden Markov Model Hämtad från: ( ) Jurafsky, D. Martin, J. (2000) Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. New Jersey: Prentice-Hall, Inc. Rabiner, L. (1989) A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Hämtad från: ( ) Rabiner, L. Juang, B-H. (1993) Fundamentals of Speech Recognition. New Jersey: PTR Prentice-Hall, Inc. Russel, S. Norvig, P. (2003) Artificial Intelligence: A Modern Approach, second edition. New Jersey: Pearson Education, Inc. Schmandt, C. (1994) Voice Communication with Computers: Conversational Systems. New York: Van Nostrand Reinhold. Speech recognition Hämtad från: ( ) 13
Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0
Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens
Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez
Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,
Artificial)Intelligence) Taligenkänning)
LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...
AI-rapport Speech recognition
AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228
Niklas Lindvall Artificiell intelligens II Ht
Taligenkänning Hidden Markov Model Niklas Lindvall nikli368@student.liu.se Artificiell intelligens II Ht 2011 2011-09-19 0 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende...
Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09
Taligenkänning Hur datorer känner igen talat språk 729G43 Artificiell Intelligens Charlie Forsgren, chafo246 2014-01-09 Charlie Forsgren Innehållsförteckning Inledning..3 Språk och Ljud 4 Elektronisk Inspelning
Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! !
Taligenkänning HMMochViterbi EllinorAndersson,92091393801 LinköpingsUniversitet ArtificiellIntelligensII,729G11 Ht2012 2012909912 Sammanfattning Dennaprojektuppsatsbehandlartaligenkänningochdeolikadelmomentsomkrävsför
4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
Statistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University
Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens
de var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Kognitionsvetenskap C, HT-04 Mental Rotation
Umeå Universitet 041025 Kognitionsvetenskap C, HT-04 Mental Rotation Grupp 3: Christina Grahn, dit01cgn@cs.umu.se Dan Kindeborg, di01dkg@cs.umu.se David Linder, c01dlr@cs.umu.se Frida Bergman, dit01fbn@cs.umu.se
Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA
729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion
Regression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
TAMS79: Föreläsning 10 Markovkedjor
TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom
Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping
Fuzzy Logic När oskarpa definitioner blir kristallklara Linköpings Universitet Linköping Sammanfattning I denna fördjupningsuppgift har jag fokuserat på Fuzzy Logic och försökt att beskriva det på ett
729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007
729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007 $,I UGMXSQLQJ 7DOLJHQNlQQLQJ 850329-2107 6DPPDQIDWWQLQJ Ett taligenkänningssystem kan vara konstruerat för
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning
Word- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Problemdel 1: Uppgift 1
STOCKHOLMS UNIVERSITET MT 00 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, CH 8 februari 0 LÖSNINGAR 8 februari 0 Problemdel : Uppgift Rätt svar är: a) X och X är oberoende och Y och Y
Analys av korstabeller
Analys av korstabeller Analys av korstabeller hänvisar generellt till den situation, där vi betraktar era kategoriska variabler samtidigt och vill dra slutsatser m.a.p. beroendestrukturen dem emellan.
Om ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Stina Nyman 2012-09-16
LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 21.01.2015 Jan Grandell & Timo Koski () Matematisk statistik 21.01.2015 1 / 1 Repetition:
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 3 4 november 2016 1 / 28 Idag Förra gången Stokastiska variabler (Kap. 3.2) Diskret stokastisk variabel (Kap. 3.3 3.4) Kontinuerlig stokastisk
Vanliga frågor för VoiceXpress
Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur
Ontologier. Cassandra Svensson 2014-01-09
Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt
DAB760: Språk och logik
DAB76: Språk och logik /4: Finita automater och -7 reguljära uttryck Leif Grönqvist (leif.gronqvist@msi.vxu.se) Växjö Universitet (MSI) GSLT (Sveriges nationella forskarskola i språkteknologi) Göteborg
Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står
Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 7 15 november 2017 1 / 28 Lite om kontrollskrivning och laborationer Kontrollskrivningen omfattar Kap. 1 5 i boken, alltså Föreläsning
MATEMATIKENS SPRÅK. Avsnitt 1
Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en
Hur måttsätta osäkerheter?
Geotekniska osäkerheter och deras hantering Hur måttsätta osäkerheter? Lars Olsson Geostatistik AB 11-04-07 Hur måttsätta osäkerheter _LO 1 Sannolikheter Vi måste kunna sätta mått på osäkerheterna för
Markovkedjor. Patrik Zetterberg. 8 januari 2013
Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)
Utbildningsplaner för kandidat-, magister och masterprogram. 1. Identifikation. Avancerad nivå
1. Identifikation Programmets namn Omfattning Nivå Programkod Ev. koder på inriktningar Beslutsuppgifter Ändringsuppgifter Masterprogram i kognitionsvetenskap 120 hp Avancerad nivå HAKOG Fastställd av
Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står skrivna: Oändligt
Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?
Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet
Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar
Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi
SF1901: Sannolikhetslära och statistik
SF1901: Sannolikhetslära och statistik Föreläsning 1. Jan Grandell & Timo Koski 01.09.2008 Jan Grandell & Timo Koski () Matematisk statistik 01.09.2008 1 / 48 Inledning Vi ska först ge några exempel på
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 14.01.2013 Jan Grandell & Timo Koski () Matematisk statistik 14.01.2013 1 / 25 Repetition:
GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON
2018 GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON Innehåll Inledning & Bakgrund... 2 Förstärkt inlärning... 2 MDP... 2 Gridworld... 3 Nytta och policy... 4 Värdefunktion och Bellmanekvationer...
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende
SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 21.01.2016 Jan Grandell & Timo Koski Matematisk statistik 21.01.2016 1 / 39 Lärandemål Betingad
4.1 Grundläggande sannolikhetslära
4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på
Modellering av felkíallor i digitala kanaler Magnus Berglund Magnus Danielsson Henry Jatko Henrik Wallin 8 maj 199 LULEçA TEKNISKA UNIVERSITET Avdelningen fíor signalbehandling. Sammanfattning Vid simuleringar
el o;; Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachefor Programmein Cognitive Science 180 Högskolepoäng
el o;; Utbildningsplan för Kognitionsvetenskapligt kandidatprogram Bachefor Programmein Cognitive Science 180 Högskolepoäng Kognitionsvetenskap är ett tvärvetenskapligt kunskaps- och forskningsområde som
SF1901: Sannolikhetslära och statistik
SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska
Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information
ARTIFICIELL INTELLIGENS II INSTITUTUINEN FÖR DATAVETENSKAP LINKÖPINGS UNIVERSITET Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information Anna
1 LP-problem på standardform och Simplexmetoden
Krister Svanberg, mars 202 LP-problem på standardform och Simplexmetoden I detta avsnitt utgår vi från LP-formuleringen (2.2) från föreläsning. Denna form är den bäst lämpade för en strömlinjeformad implementering
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
1 Mätdata och statistik
Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt
Sammanfattning av modulen modeller och representationer Hur går jag vidare?
Naturvetenskap - gymnasieskolan Modul: Modeller och representationer Del 8: Representationskompetens Sammanfattning av modulen modeller och representationer Hur Konrad Schönborn, Linköpings universitet
Matematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.
Att förstå variabler Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata. Vad är en variabel? En variabel är en plats att lagra information. Precis
ENGELSKA. Ämnets syfte. Kurser i ämnet
ENGELSKA Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika sociala
Graärgning och kromatiska formler
Graärgning och kromatiska formler Henrik Bäärnhielm, d98-hba 2 mars 2000 Sammanfattning I denna uppsats beskrivs, för en ickematematiker, färgning av grafer samt kromatiska formler för grafer. Det hela
Matematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 9 Johan Lindström 16 oktober 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 1/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03
Artificiell Intelligens den nya superkraften
Artificiell Intelligens den nya superkraften Socialchefsdagarna, 4 oktober 2018 #CGINext Artificiell Intelligens Förmågan hos mjukvara att agera självständigt på ett intelligent sätt tidigare bara associerat
Ämne - Engelska. Ämnets syfte
Ämne - Engelska Det engelska språket omger oss i vardagen och används inom skilda områden som kultur, politik, utbildning och ekonomi. Kunskaper i engelska ökar individens möjligheter att ingå i olika
Np MaB vt 2002 NATIONELLT KURSPROV I MATEMATIK KURS B VÅREN 2002
Skolverket hänvisar generellt beträffande provmaterial till bestämmelsen om sekretess i 4 kap. 3 sekretesslagen. För detta material gäller sekretessen fram till utgången av juni 00. Anvisningar Provtid
Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel
Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,
Poisson Drivna Processer, Hagelbrus
Kapitel 6 Poisson Drivna Processer, Hagelbrus Poissonprocessen (igen) Vi har använt Poissonprocessen en hel del som exempel. I den här föreläsningen kommer vi att titta närmare på den, och även andra processer
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
SVENSKA SOM ANDRASPRÅK
SVENSKA SOM ANDRASPRÅK Ämnet svenska som andraspråk behandlar olika former av kommunikation mellan människor. Kärnan i ämnet är språket och litteraturen. I ämnet ingår kunskaper om språket, skönlitteratur
Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.
KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE
KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE Kursplanens syfte Kommunal vuxenutbildning i svenska för invandrare är en kvalificerad språkutbildning som syftar till att ge vuxna invandrare
Tillämpad prosodi inom Artificiell Intelligens
Tillämpad prosodi inom Artificiell Intelligens Linköpings universitet Linköping 2010-01-03 Sammanfattning Detta är en fördjupningsuppgift skriven för kursen Artificiell intelligens 2 på Linköpings Universitet
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för moderna språk 1 7.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för moderna språk 1 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Statistikens grunder HT, dagtid Statistiska institutionen
Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet
Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON
Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell
Stokastiska processer och simulering I 24 maj
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd. Matematisk statistik 24 maj 2016 Lösningar Stokastiska processer och simulering I 24 maj 2016 9 14
Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet teckenspråk för hörande
Betyg i årskurs 6 Betyg i årskurs 6, respektive årskurs 7 för specialskolan, träder i kraft hösten 2012. Under läsåret 2011/2012 ska kunskapskraven för betyget E i slutet av årskurs 6 respektive årskurs
Kursplan för Matematik
Sida 1 av 5 Kursplan för Matematik Inrättad 2000-07 SKOLFS: 2000:135 Ämnets syfte och roll i utbildningen Grundskolan har till uppgift att hos eleven utveckla sådana kunskaper i matematik som behövs för
KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE
KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE Kursplanens syfte Kommunal vuxenutbildning i svenska för invandrare är en kvalificerad språkutbildning som syftar till att ge vuxna invandrare
Talsystem Teori. Vad är talsystem? Av Johan Johansson
Talsystem Teori Av Johan Johansson Vad är talsystem? Talsystem är det sätt som vi använder oss av när vi läser, räknar och skriver ner tal. Exempelvis hade romarna ett talsystem som var baserat på de romerska
Fuzzy Logic: Den oskarpa skarpheten
Fuzzy Logic: Den oskarpa skarpheten Av: 1 Innehåll Inledning... 3 Vad är Fuzzy Logic?... 4 Fuzzy sets... 4 Medlemsskapsfunktion... 5 Operatorer... 7 Union... 7 Snitt... 8 Komplement... 8 Exempel med de
Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden.
MATEMATISK LOGIK Matematisk logik formaliserar korrekta resonemang och definierar formellt bindeord (konnektiv) mellan påståenden (utsagor, satser) I matematisk logik betraktar vi påståenden som antingen
Introduktion till logik
Introduktion till logik Av Johan Johansson Johan.johansson@guldstadsgymnasiet.se Logik sägs som många andra saker komma från de grekiska filosoferna, och ordet kommer också därifrån. Grekerna kallade det
** a) Vilka värden ska vara istället för * och **? (1 p) b) Ange för de tre tillstånden vilket som svarar mot 0,1,2 i figuren.
Avd. Matematisk statistik TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 19 AUGUSTI 2016 KL 08.00 13.00. Examinator: Jimmy Olsson tel. 790 72 01. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
Matematisk statistik - Slumpens matematik
Matematisk Statistik Matematisk statistik är slumpens matematik. Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och Pascal 1654. Modern matematisk statistik
Kognition. Kognition, interaktion och användare. Överblick - kognition. Data-information-kunskap. Nivåer av kognition. Dä ä bar å åk.
Kognition Kognition, interaktion och användare Henrik Artman Tänkande Mentala funktioner för att tolka information genom sinnena Kognitiva funktioner Perception Minne och uppmärksamhet Problemlösning och
Läs och skrivsvårigheter är inte synonymt med dyslexi. Ur boken Barn utvecklar sitt språk 2010) redaktörer Louise Bjar och Caroline Liberg
Läs och skrivsvårigheter är inte synonymt med dyslexi Ur boken Barn utvecklar sitt språk 2010) redaktörer Louise Bjar och Caroline Liberg Dyslexi vad är det? Dyslexi innebär bl.a. svårigheter att urskilja
Word2Vec. Högkvalitativa vektorrepresentationer av ord tränat på stora mängder data. Innehåll LINKÖPINGS UNIVERSITET. 1. Inledning...
LINKÖPINGS UNIVERSITET Innehåll 1. Inledning... 2 2. Terminologi... 3 3. Allmänt om Word2Vec... 3 4. Continous Skip-gram model... 4 Word2Vec Högkvalitativa vektorrepresentationer av ord tränat på stora
Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade
HT 2011 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas in senast 29/9 kl 16.30.
Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)
Simulering av Poissonprocesser Olle Nerman, 2015-09-28 Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp) Frågeställning: Hur åstadkommer man en realisering av en Poissonprocess på ett tidsintervall
Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens
Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning
TAMS79: Föreläsning 1 Grundläggande begrepp
TMS79: Föreläsning 1 Grundläggande begrepp Johan Thim 31 oktober 2018 1.1 Begrepp Ett slumpförsök är ett försök där resultatet ej kan förutsägas deterministiskt. Slumpförsöket har olika möjliga utfall.
1.1 Diskret (Sannolikhets-)fördelning
Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas
Introduktion till statistik för statsvetare
"Det finns inget så praktiskt som en bra teori" November 2011 Repetition Vad vi gjort hitills Vi har börjat med att studera olika typer av mätningar och sedan successivt tagit fram olika beskrivande mått
Förmågor i naturvetenskap, åk 1-3
Förmågor i naturvetenskap, åk 1-3 I Lgr11 betonas att eleverna ska använda sina naturvetenskapliga kunskaper på olika sätt. Det formuleras som syften med undervisningen och sammanfattas i tre förmågor.