Niklas Lindvall Artificiell intelligens II Ht

Storlek: px
Starta visningen från sidan:

Download "Niklas Lindvall Artificiell intelligens II Ht"

Transkript

1 Taligenkänning Hidden Markov Model Niklas Lindvall Artificiell intelligens II Ht

2 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende... 5 Representation... 5 Frame... 5 Mönstermatchning... 5 Vektor kvantifiering (VQ)... 6 Systemets uppbyggnad... 6 Fonem... 6 Språkmodeller... 7 Akustiskmodell... 7 Noisy channel modell... 7 Segmentering... 8 Invariansproblemet... 9 Taligenkänning Hidden Markov Models... 9 Exempel Hidden Markov Model Begränsningar och problem vid tillämpning av HMM Viterbi algoritmen Algoritmerna gör tre olika antaganden Referenser

3 Inledning En av de mest fascinerande egenskaperna hos människor är deras förmåga att kommunicera idéer med hjälp av tal. Denna funktion är utan tvekan ett av det faktum som har möjliggjort utvecklingen av vårt samhälle. Människan har alltid varit lockad av möjligheten att skapa maskiner som kan producera och känna igen tal. En automatisk taligenkänning (ASR)-system kan definieras som en mekanism som kan avkoda den mänskliga tal signaler som produceras genom att använda vokala ljud eller nasala ljud. Att kunna känna igen och förstå tal är förmodligen någonting de flesta människor tar för givet. Detta är troligtvis för att den mänsklig samspelet till stor del består av att prata med andra individer. De mest grund läggande för Taligenkänning är att den börjar med att göra om den analoga signalen till ett digitalt urval av tal. Sedan går den vidare med en akustisk signalbearbetning. När detta är klart ska fonem och ord hittas i en identifieringsprocess och då använder man sig av Hidden Markov Model, Dynamic Time Warping och Verbetin algoritmen Schroeder framhåller att alla sorters av taligenkännings system innehåller dessa tre primära grundkomponenter: 1. När en talare artikulerar ord så görs dessa signaler om till en sorts av representation som senare utnyttjas för att kunna känna igen vilka ord som har yttrats. 2. För att frambringa en representation så utnyttjar igenkänningssystemet en uppsättning mallar med beskrivningar för varje ord. Mallarna beskriver ord som igenkännaren ska kunna känna igen och på så sätt även kunna återge till vad som sagts. 3. En vis sorts av mönstermatchnings algoritm bestämmer vilken av mallarna som är mest lik det tal som kommit in som indata(schroeder 1994). 2

4 Taligenkänning språk För att kunna förstå hur komplicerat de är att använda sig av automatisk taligenkänning. Så måste man först förstå hur avancerat vårt talorgan är. Även vilka olika problem datorn har för att kunna översätta våra ljudsignaler till ord, handling och innebörd. När man producerar ett språkljud passerar luftströmmen från lungorna till stämbanden, sedan halsen och munnen. Beroende på vilket talljud du formulera och hur talsignalen kan uttryckas så kan detta göras på tre olika sätt: Voiced excitation Då stämbanden är stängda och lufttrycket tvingar stämbanden att öppna och stänga med jämna mellanrum. Vilket genererar en periodisk puls av ljud. Denna "grundfrekvens" ligger oftast i intervallet från 80Hz till 350Hz. Unvoiced excitation Stämbanden är öppen och luften passerar ett smalt passage i halsen eller munnen. Detta resulterar i en turbulens som genererar en ljud signal. Den stora räckvidden av bullrets form bestäms av placeringen av stämbanden. Transient excitation En sammandragning i halsen eller munnen som kommer att höja luft trycket. Genom att plötsligt öppna eller stänga luftstrupen så sjunker lufttrycket ner omedelbart ( Plosive burst ). När vi formar språkljud så använder vi oss ibland av alla dessa tre typerna i kombination. Den spektrala formen på talsignalen bestäms av vilken vokal man uttala. Detta gör att du ändra den spektrala formen på talsignalen och därmed hur du artikulera på olika sätt (B. Plannerer 2005). 3

5 Taligenkänning De tre viktigaste grund komponenter i alla taligenkännings är representation, mallar och mönstermatchning. För att representation av talsignalen ska kunna fungera så måste igenkännare göra om talsignalen före den på börja själva analysen. Den här strukturen kallas för en inre representation. De här bidra till en mer förfining av orden som bryts ner till mindre beståndsdelar som kallas för fonem. Utifrån detta kan uttalet av ord och fonem ha olika inverka på variationen i språket. En statisk modell som tar hänsyn till detta är Hidden Markov Models(HMM). En mall innehåller information för varje ord. Dessa mallar hittar ord variationer genom att igenkännare har en uppsättning ord som den kan jämföras med. Dessa schabloner är de ord som våra igenkännare kan känn igen. Den process som avgör vilket ord som är mest likt våra indata är en mönsterpassnings algoritm. Algoritmen jämför mallarna mot de ord som är mest likt våra indata. I det här tillståndet bestäms ordgränser och om en särskillnad finns i förhållande till indata. Så beslutar mallen även här om indata är accepterbar. Är ingen mall lik våra indata så tillåts inte denna matchning. När de blir mera avancerat vokabulär så tar mönsterpassningen hänsyn till orden betydelse och syntax. Detta leder till att de blir en större begränsning hur ord kan sammanställas till olika meningar. Här kommer en enkel beskrivning vad taligenkänning är. De första som händer är att man måste konverteras om talsignalen till en akustisk signal så att ett taligenkänningssystem ska kunna klara av att hantera den digitala signalen. Signalen tolkas genom att den samplas och sedan görs en spektralanalys på den. Efter detta så lagra signalen i form av olika parametra för den ska ta så lite plats så möjligt. De lagrade materialet delas upp av vektorer som delar upp parametrarna i små delar. Den digitala signalen går igenom en process som beslutar vilka ord som har uttalats. De här går att göra på olika sätt bland annat med kunskapsbaserade metoder, med mönster igen känning, ANN och HMM(Schroeder, 1994) Bild 1.1 Generellt schema över taligenkänning (Segura, 2006). 4

6 Oberoende/Beroende För taligenkänning finns de två olika system dessa är oberoende system och beroende system. Ett oberoende system kan känna igen vilken talare som helst och använder sig av en databas som innehåller akustiska beskrivningar, vokabulär och språkmodeller(möjliga ord följd). För att det här systemet ska fungera bra krävs de att de finns en väldigt stor databas. Detta beror på att talarens röst variera så mycket som t.ex. talhastighet, dialekt och om man är man eller kvinna. Det enklaste systemet för taligenkännig är ett beroende system. Denna teknik använder sig av en specifik talare. Detta med för att systemet har ett litet vokabulär lagrat och att orden som används är isolerade. När talaren har läst in en eller flera texter till ljudfiler så sparas dessa undan och sedan jämföra de mot den inkommande ljud signalerna (Segura, 2006). Representation När taligenkänning används så spela man oftast in ljudsignalen detta kräver mycket lagringskapacitet. Ett annat problem är också att de gör de opraktiskt att göra en frekvensanalys på det inspelade materialet. För att kunna komma runt detta problem så konverteras den analoga signalen till en digitalsignal. sedan separera man signalen genom att använda sig av en algoritm som kallas LPC(Linear Prediction Coding). Denna algoritm filtera bort allt oönskat icketal. På detta sätt minska man filstorleken och underlätta vid senare mönstermatchning. Den relevanta signalen plocka ut genom att man har kommit fram till att värden upp till 200 gånger per sekund täcker in människans tal och med detta anser man att människans tal inte innehåller några betydelsefulla övergångar som är kortare 5 ms (Jurafsky, 2000). Frame Även i denna form är uppgifterna inte användbar för taligenkänning eftersom det är för svårt att identifiera eventuella mönster som korrelerar till vad som faktiskt sägs. För att göra en mönsterigenkänning lättare så omvandlas digitalt ljud till olika "frames". Genom detta kan man mäta tiden mellan de olika frames och för att mättningen ska bli så korrekt så möjlig så införs ett energivärden som känner av varje stop och tystnad. När data överskrider gränsvärdet för bakgrundsljud så sparas denna information undan tills detta värde är lägre än gränsvärdet igen. På detta sätt hittar man olika särdrag som ger till räckligt med information om vår artikulation, personen resonans och röst(segura, 2006). Mönstermatchning Vid en mönstermatchning så jämför indata mot mallarna som har skapat tidigare. Ordens mönstermatchning börjar först när de har blivit omgjord till en inre representation och de har nått tröskelvärdet bakgrundljud samt gått under värdet igen. Nästa skede är att igenkännaren tar frames som ordet har gått igenom och jämför dessa mot liknande frames mallar. Skillnaden i förhållande till varje LPC parameter bruka vara ungefär ett dussin och detta bruka kallas för frame by frame felet. Enkel sagt så jämför mallen mot våra indata. Frames som har minst ordfel representera den bästa matchningen mot våra indata. Om felet är för stort så avslås systemet matchning. 5

7 Ett system som uppfattar speciella egenskaper hos ord och utnyttjar detta till en representation av indata behöver ha avancerad mönstermatchning. De flesta system som hantera mönstermatchning tar för givet att all indata kommer att ha samma längd som själva grundmallen. Detta är inte sant efter som alla människor prata olika snabbt. För att lösa detta problem använder man sig av en teknik som heter Dynamic time warping och denna teknik används för att kompensera tidsskillnader i tal. En annan teknik som är användbar för mönstermatchning är att kunna göra dessa beräkningar mindre. Denna teknik heter Vector Quantization(VQ) och teknikens egenskap är att den tar upp olika variationer utan att få för mycket indata(segura, 2006). Vektor kvantifiering (VQ) När man använder sig av metoden Vektor kvantifiering så vill man minska signalens datamängde när en ram har skapats. Ramen är uppbyggd av en rad vektorer och detta är till för att kunna reducera datamängde, genom att jämförs dessa vektorer gentemot referens vektorer som erhålls i en kodbok. För att kunna hitta den mest sannolika referens vektorn så jämför denna mot den inkommande vektorn och på detta sätt blir rätt referensvektor vald. De olika referenser vektorerna har ett individuellt tal som ersätter den inkommande vektorn. Så den ursprungliga vektorn övergår till att vara i outputen till en serie av nummer. Dessa serier kommer att vara indata till HMM(Jurafsky, 2000). Systemets uppbyggnad En taligenkännings system kunskap är uppbyggt på information från fonem, ordmodeller(akustiska beskrivningar), språkmodeller(möjliga ord följder) och lexikon. Vid användning av oberoende eller beroende systems så kombineras dessa sätt ihop. De som bestämmer vilka kombinationer man använder sig av är hur man vill representera problemet och beroende på detta väljer man vilken algoritms som är bäst anpassade för rätt analys. Fonem Om man tittar på hur de svenska språk är uppbyggt på så innehåller de språkljud som kallas för foner och de är minsta grundstenarna i vårt språk. Foner är betydelseskiljande kallas för fonem och när de uttalas kan de låta som en vokal, väsande eller ett klickljud. I svenska språket så har vi ca fyrtio fonem. Men varje fonem kan låta olika beroende dialekt, talhastighet, ålder och vilket sammanhang de uttalas i (B. Plannerer 2005). 6

8 Språkmodeller För att systemet ska ha lättare att kunna identifiera vilka ord man säger så använder man sig av språkmodeller. I språk modellerna utnyttjar man för det mesta av olika N-grams som är en statiskspråkmodell. Modellerna speciella egenskaper är att den jämför ord som står innan ordet(n-1)t. Utifrån detta beräknar den sannolikheten och på detta sätt få den en hög träffsäkerhet. De finns två olika språkmodellen som man bruka använda sig av, dessa är bigram och trigram. En bigrams modell är uppbyggd så att den räkna ut sannolikheten för ett vist ord som förekommer innan. Trigram modellen räknar ut sannolikheten för två ord som kommer innan ordet. Den allmänna ekvationen för att beräkna det nästkommande ordet i en sekvens, enlighet N-gram modellen ser ut så här: Bild 1.2 Formel för att beräkna nästkommande ord(segura, 2006) Akustiskmodell När man behöver visa ett sannolikheten problem med ett visst ord som har uttalats givet en signal. Den mest troliga tydningen av signalen är värdet av ord när det maximerar P (Ord Signal). Att räkna ut sannolikheten på ett bakvänt sätt kan var till hjälp ibland och denna process kallas för Bayes teorem. Att beräkna ut just ett ord givet en viss signal kan vara tämligen knepigt. Om man som alternativ tänker på att man har en sannolikhet för ordet givet en bestämd signal och gångar den med sannolikheten för ordet, får man enklare fram en lösning. Den modell P(Signal Ord) har för vana att kallas för den akustiska modellen. För att räkna ut detta utnyttjar man sig av en Hidden makarov model(hmm). Den akustiska modellen kan indelas i två bitar. Den första biten hanterar artikulationer som genereras för varje ord, en sannolikhet över tänkbara fonemsekvenser. Fonem är små och inte direkt observerbara och för att representera tal utnyttjar man sig av HMM. Den andra biten av modellen arbetar med hur fonem blir till akustiska signaler och modellen acceptera skillnader i fart och ljudstyrka(schroeder 1994). Noisy channel modell För att kunna använda taligenkänning i olika miljöer måste man använda sig av Noisy channel modell. Detta används för att det oftast finns bakgrunds ljud som stör själva talsignalens upptagnings förmåga. Med anledning av detta behandlar Noisy Channel modellen den akustiska inputen som en brusig version av ursprungs signal. För att kunna filtera bort allt brus så söks alla meningar som finns i ordlistan igenom. Sedan räknas sannolikheten ut 7

9 för att meningen i vokabulären skulle kunna ge just den brusiga signalen. Den meningen som har bäst sannolikhet väljs sedan ut. För att bättre förstå hur Noisy channel modell fungera så kommer de ett exempel. Överföring av ett budskap kan modelleras med hjälp av en Noisy channel modell ett meddelande W som är avkodat, vilket resulterar i en sträng X. X överförs genom en kanal med sannolikheten av distributionen f (y x); den resulterande strängen Y avkodas, vilket ger en uppskattning av meddelandet W w x y kodare Kanal avkodare w meddelande f (y x) uppskattning av meddelandet Bild 1.3 Generellt schema över hur Noisy channel modell fungera (Segura, 2006). Segmentering En allmän svårighet för att träna upp ett system som ska hantera talproduktion eller taligenkänning är hur man ska kunna lagra kunskap om ord och yttrande som inte finns i systemet. I båda fallen kan problemet reduceras genom att man utnyttjar en stor kvantitet inspelat material. Men för det mesta är de ogenomförbart att få med allt som ett system ska kunna begripa eller uttala. En metod skulle kunna vara att segmentera, de vill säga att man delade upp det inspelade ljudet i mindre bitar. När man har gjort detta kan man utnyttja fonem eller fonemsekvenser (difoner/polyfoner). En difon är konstruerad av två halva foner som angränsar till varandra. Klippet finns mitt i mellan fonerna. Där inverkan från angränsande foner är som minst. Exp. så ger tut fyra difoner: tystnad - t t -u u -t t -tystnad. (-anger skiljelinje emellan foner; anger klipp på mitten av fonen). Den här tekniken har visats sig att ge ett mycket bättre resultat och system som använder den teknik har en möjlighet att uppnå 98 % täckning av språkets existerande difoner (ki/ka/ku/ko o.s.v.) och ungerför 80 % täckning av polyfoner (spri-/-orv/-olmskt o.s.v.). Med den här tekniken kan taligenkännings system känna igen ord som inte har övats in tidigare(jurafsky, 2000). 8

10 Invariansproblemet oberoende om dessa segment ska utnyttjas för att identifiera eller framställa tal, uppkommer en rad liknande problem. Kanske det essentiellaste av dessa är det faktumet att samma akustiska signal kan förstås som helt och hållet olika fonem beroende på vilken kontext den finns i, enkelt sak bruka detta problem kallas för invariansproblemet. En väsentlig svårighet är det stora antalet faktorer som påverkar hur vi artikulerar ett visst uttal. En del uttal kan vi själva ha inverkan på som till exp. avslappnat uttal, tonfall och sinnes tillstånd. Men från en individ till en annan individ kan det vara olika beroende på kön, ålder och dialekt. Detta bidra till att förväntade fonem kanske uttalas på ett annat sätt eller till och med blir ute lämnade helt. Denna anpassbarhet ställer högre krav vid talproduktion och är svårare att imitera med en modell som arbetar med att spara undan inspelningar, som ska representera en korrekt artikulation av ett visst ord. Därför behöver man utnyttja tekniken inom HMM system som kan hantera och representera dessa problem på ett bättre sätt(jurafsky, 2000). Taligenkänning Hidden Markov Models Bland de mest säkra metoden för att avkoda språk är Hidden Markov Models (HMM). Modellen är uppbyggt så att den match orden som kommer in mot lagrade ord som finns i ett system. Beroende på hur ord låter så match dessa mot fonems uttal. Den modell är en statisk sannolikhets process som fungera genom att ha sju olika intern tillstånd. De vill säga att modellen ha ett start tillstånd och ett måltillstånd. Mellan varje steg så skapa HMM utdata som är använd bara för processen. Utdata matchas mot antal fonem som finns i ett ord och sedan jämför man de olika akustiska egenskaperna hos varje ord. Under varje åtgärd i processen kan HMM stanna i de tillstånd den är i eller så kan den förflytta sig till ett nytt tillstånd. De finns gömda( Hidden ) processer i modellen och detta menas att varje till stånd är gömt och man kan bara se den information som produceras som utdata(schroeder, 2004). Följande exempel kan hjälpa oss att förstå dynamiken i Markov processen(kedjor). Exempel Markov kedjor Låt oss anta att vi har en modell för en väderprognos med bara tre möjliga observationer: regn (S1), molnigt (S2) och soligt (S3). Denna modell (se figur 1.4) tillåter oss att beräkna sannolikheten för att observera en sekvens av väder i ett tillstånd. För exempelvis kan vi beräkna sannolikheten för de "soliga/soliga/regniga/dimmiga" sekvenserna. (O = (s3, s3, s1, s2)) P(O model) = P(s3s3s1s2 model) = P (s3) P(s3 s3) P(s1 s3) P(s2 s1) = P(s3)a33a31a12 9

11 Bild 1.4 En diskret Markov kedja(segura, 2006). Hidden Markov processer uppstår ur en generalisering av Markov processer som vi har studerat ovan. Exempel Hidden Markov Model Ett klassiskt exempel (Rabiner och Juang, 1993) för att illustrera detta kastar man ett mynt. Experiment: en viss person, som vi kallar kastare, kommer att utföra experiment genom att kasta ett mynt, som en följd av detta blir krona (kr) eller klave (kl) som erhålls. Värden är dolda till alla andra (observatörer) och detta är det enda vi vet om resultatet av experimentet. Kastaren har tre mynt och två av dem används för att få den sekvens av krona eller klave. Dessa två mynt är riggade så att det första myntet har en 75 % sannolikhet att få krona och den andra har en 75 % sannolikhet att få klave. Det tredje myntet är inte riggat och används för att bestämma vid varje gång vilket av de andra mynten som kommer att kastas. Det är möjligt att bygga en modell av experimentet (figur 1.5) med två tillstånd (var och en representerar en av de mynt som skall kastas). I varje tillstånd är det möjligt att generera "kr" eller "kl" (observationer) enligt sannolikheter som visas i figuren. Vi har just nu byggt en Hidden Markov Model. Skillnaden med en vanligt Markov modell är att vi nu har två processer placerade ovanpå varandra. En av dem är observerbara (sekvensen av observationer, krona och klave), men den andra är "dolda" (sekvens av tillstånd, kastade mynt). På samma sätt som för vanlig Markovprocesser, är det möjligt att beräkna sannolikheten för en sekvens av observationer O = O1,..., OT av längd T genereras av en HMM, även om vi formellt kommer att definiera dem innan begreppet HMM. P(kr) = 0.75 P(kr) = 0.25 P(kl) = 0.75 P(kl) = 0.25 Bild 1.5 Mynt experiment för att förklara HMM(Segura, 2006). 10

12 Begränsningar och problem vid tillämpning av HMM Det finns tre ansenliga svårigheter med Hidden Markov Model som är tvunget att lösas om man vill att modellen man arbetar med ska vara användbar. Det första dilemmat är hur man ska estimera sannolikheten för en serie av observationer att den kommer från den modellen som man arbetar med. För att komma ifrån detta problem får man bestämma sig för den modell som bäst passar med observationerna. Nästa problem är hur man ska få fram den osynliga delen av modellen för att finna den rätta ordningsföljden av tillstånd. För att upptäcka den rätta ordningsföljden av tillstånden måste man lära sig uppbyggnaden av modellen och på detta sätt försöka läsa av det dolda i modellen. Det slutliga dilemmat är hur man optimerar parametrarna för modellen och för att bäst kunna redogöra för hur en given sekvens uppstår. Att korrigera parametrarna för modellen kallas för en träningssekvens och detta är det som övar Hidden Markov Model för att frambringa bäst modeller av ord (Segura, 2006). Viterbi algoritmen Algoritmen kan utnyttjas för att upptäck den bästa förbindelsen igenom ett nätverk som är konstruerat för enstaka ord. Vägen som utses av algoritmen skall vara de ord som är i högsta grad sannolik givet den serie av ord som observerats. Denna algoritm kan emellertid även vara användbar när man ska undersök kontinuerligt tal och inte enbart enstaka ord. Vid kontinuerligt tal så består indata av serier av ord och det är nästa omöjligt att veta var ordgränserna finns. Detta beror på att orden flyter ihop med varandra. Att upptäck dessa ordgränser i hopsatt tal kallas för segmentation. Syftet med Viterbi algoritmen är att upptäcka den bästa tillståndssekvensen Q = (q, q2.. qt) givet ett antal observerade foner O = (o1, o2.. ot). En Viterbi algoritm är en dynamisk programmerings algoritm för att hitta den mest sannolika sekvensen av dolda tillstånd och detta bruka kallas Viterbi vägen. Det här resulterar i en sekvens av observerade händelser som används i samband med Markov informationskällor och HMM. En nära besläktad algoritm är forward algorithm denna används för att beräkna sannolikheten för en sekvens av observerade händelser. Termerna "Viterbi algoritm" tillämpas även på relaterade dynamisk programmering algoritmer som upptäcker den enskilt mest sannolika förklaringen till en observation. Till exempel i statistik parsning användas den för att upptäcka den enskilt mest sannolika kontextfria härledning (parse) en sträng, som ibland kallas "Viterbi parse". 11

13 Algoritmerna gör tre olika antaganden. Först måste både den observerade händelser och dolda händelserna finnas med i en sekvens. Denna sekvens motsvarar ofta tiden. För det andra, dessa två sekvenser måste anpassas och en instans av en observerad händelse måste motsvara exakt en instans av en dold händelse. För de tredje måste man beräkna den mest sannolika dolda sekvens upp till en viss punkt t beror bara på den observerade händelsen i punkt t, och det mest sannolika sekvensen vid punkt t - 1. Alla dessa antaganden används i en första ordningens Hidden Markov modell. Detta är ett grundläggande antagande av algoritmen eftersom algoritmen kommer att undersöka alla möjliga vägar som leder till ett tillstånd och bara behålla det som mest sannolikt. På detta sätt behöver inte algoritmen hålla reda på alla möjliga vägar, bara en väg per tillstånd. En annan viktig förutsättning är att en övergång från ett tidigare tillstånd till ett nytt tillstånd präglas av en stegvis mått som bruka representeras av ett nummer. Denna övergång beräknas från händelsen. Den sista centralt antagande är att händelserna är kumulativa över en väg i någon mening (Schroeder, 2004). 12

14 Referenser Jurafsky, D & Martin, J H (2000). Speech and language processing Prentice Hall, New Jersey Schroeder, M R (2004). Computer Speech, second edition Springer-Verlag, Berlin Antonio, M. Peinado och José, C Segura (2006), speech recognition over digital channels. Robustness and standards. Rabiner, L. Juang, B-H. (1993) Fundamentals of speech recognition. New Jersey: PTR Prentice-Hall, Inc B. Plannerer (March 28, 2005), an Introduction to Speech Recognition 13

Artificial)Intelligence) Taligenkänning)

Artificial)Intelligence) Taligenkänning) LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...

Läs mer

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,

Läs mer

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0 Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens

Läs mer

Taligenkänning med fördjupning på Hidden Markov Models

Taligenkänning med fördjupning på Hidden Markov Models IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models 870524-0045 jearu017@student.liu.se Sammanfattning Taligenkänning är en teknik

Läs mer

AI-rapport Speech recognition

AI-rapport Speech recognition AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228

Läs mer

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09 Taligenkänning Hur datorer känner igen talat språk 729G43 Artificiell Intelligens Charlie Forsgren, chafo246 2014-01-09 Charlie Forsgren Innehållsförteckning Inledning..3 Språk och Ljud 4 Elektronisk Inspelning

Läs mer

Analys/syntes-kodning

Analys/syntes-kodning Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk

Läs mer

Signaler och system, IT3

Signaler och system, IT3 Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Vinjetter TDDC91 Datastrukturer och algoritmer

Vinjetter TDDC91 Datastrukturer och algoritmer Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.

Läs mer

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet

Läs mer

Att fånga den akustiska energin

Att fånga den akustiska energin Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007

729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007 729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007 $,I UGMXSQLQJ 7DOLJHQNlQQLQJ 850329-2107 6DPPDQIDWWQLQJ Ett taligenkänningssystem kan vara konstruerat för

Läs mer

Inledande programmering med C# (1DV402) Introduktion till programmering

Inledande programmering med C# (1DV402) Introduktion till programmering Introduktion till programmering Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt

Läs mer

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen

Läs mer

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i

Läs mer

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4 Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa

Läs mer

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering...

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering... Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering... 4 Bussen (projektförslag)... 5 Bakgrund... 5 Klassen Buss

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och

Läs mer

Introduktion till programmering

Introduktion till programmering Introduktion till programmering Vad är programmering? Vad gör en dator? Vad är ett datorprogram? 1 (9) Vad är programmering? För att bestämma en cirkels area måste du: 1. Dividera diametern 5 med 2. 2.

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Sampling. Analog - digital. Kvantifiering. Samplingsprocess. Analog vs digital teknik. Kvantifiering. Analog oändlig digital diskret (1or 0or)

Sampling. Analog - digital. Kvantifiering. Samplingsprocess. Analog vs digital teknik. Kvantifiering. Analog oändlig digital diskret (1or 0or) Analog - digital Analog oändlig digital diskret (1or 0or) Digitalt intakt trots kopiering analogt slits och kvaliteten degraderar Sampling Sinuston vågdiagram (AT) antal mätpunkter/samplingspunkter Samplingsfrekvens

Läs mer

de var svåra att implementera och var väldigt ineffektiva.

de var svåra att implementera och var väldigt ineffektiva. OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan

Läs mer

Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter Laura Enflo & Giampiero Salvi

Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter Laura Enflo & Giampiero Salvi Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter & Giampiero Salvi Komplex analys Om man endast använder den reella tallinjen är det inte

Läs mer

- ett statistiskt fråga-svarsystem

- ett statistiskt fråga-svarsystem - ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...

Läs mer

TAMS79: Föreläsning 10 Markovkedjor

TAMS79: Föreläsning 10 Markovkedjor TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.

Läs mer

Arkitektur och Regelverk Definition av kodverk och klassifikation. Version 1.0

Arkitektur och Regelverk Definition av kodverk och klassifikation. Version 1.0 Arkitektur och Regelverk Definition av kodverk och klassifikation Version 1.0 Innehållsförteckning 1. Inledning... 3 2. Definitioner... 3 Referenser och underlag... 5 Revisionshistorik Version, datum Författare

Läs mer

Språkljudens akustik. Akustik, akustiska elementa och talanalys

Språkljudens akustik. Akustik, akustiska elementa och talanalys Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns

Läs mer

Diskussionsproblem för Statistik för ingenjörer

Diskussionsproblem för Statistik för ingenjörer Diskussionsproblem för Statistik för ingenjörer Måns Thulin Rolf Larsson rolf.larsson@math.uu.se Jesper Rydén jesper.ryden@math.uu.se Senast uppdaterad 27 januari 2016 Diskussionsproblem till Lektion 3

Läs mer

DATORER OCH PROGRAM. Datorn är en symbolmaskin

DATORER OCH PROGRAM. Datorn är en symbolmaskin DATORER OCH PROGRAM Datorn är en symbolmaskin men kan ha såväl symboliska som fysiska gränssnitt till omvärlden Program beteendeplan och beteendegenerator Programmerade maskiner Generalitet och portabilitet

Läs mer

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap

ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Flexi Kontrollmodul. Bruksanvisning. Innehållsförteckning. 1. Introduktion och tekniska specifikationer 1

Flexi Kontrollmodul. Bruksanvisning. Innehållsförteckning. 1. Introduktion och tekniska specifikationer 1 Flexi Kontrollmodul Bruksanvisning Innehållsförteckning 1. Introduktion och tekniska specifikationer 1 2. Allmän beskrivning av display och manöverknappar 2 3. Inställning av Flexidrift 3 4.Inställning

Läs mer

Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! !

Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! ! Taligenkänning HMMochViterbi EllinorAndersson,92091393801 LinköpingsUniversitet ArtificiellIntelligensII,729G11 Ht2012 2012909912 Sammanfattning Dennaprojektuppsatsbehandlartaligenkänningochdeolikadelmomentsomkrävsför

Läs mer

Programmering, dans och loopar

Programmering, dans och loopar Lektionen är en introduktion till programmering; träna loopar med analog dansprogrammering. Lektionsförfattare: Karin Nygårds Till läraren 1. En loop 2. Varför behövs loopar? En digital lektion från https://digitalalektioner.iis.se

Läs mer

Faltningsreverb i realtidsimplementering

Faltningsreverb i realtidsimplementering Faltningsreverb i realtidsimplementering SMS45 Lp1 26 DSP-system i praktiken Jörgen Anderton - jorand-3@student.ltu.se Henrik Wikner - henwik-1@student.ltu.se Introduktion Digitala reverb kan delas upp

Läs mer

Klassrumsprojekt programmering - Digitalt lärande

Klassrumsprojekt programmering - Digitalt lärande Klassrumsprojekt programmering - Digitalt lärande Projektet passar för lågstadiet eller nybörjare i äldre årskurser Utgå från boken Hej Ruby- Äventyr i datorernas magiska värld av Linda Liukas, Volante

Läs mer

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University

Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning

Läs mer

Stora talens lag eller det jämnar ut sig

Stora talens lag eller det jämnar ut sig Stora talens lag eller det jämnar ut sig kvensen för krona förändras när vi kastar allt fler gånger. Valda inställningar på räknaren Genom att trycka på så kan man göra ett antal inställningar på sin räknare.

Läs mer

Lgr 11 - Centralt innehåll och förmågor som tränas:

Lgr 11 - Centralt innehåll och förmågor som tränas: Lärarmaterial SIDAN 1 Författare: Martina Ericson Boken handlar om: Robin och hans bror Ante är olika. Ante tycker om att skjuta och jaga tillsammans med pappa i skogen. Robin tycker inte alls om att skjuta,

Läs mer

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska

Läs mer

Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?

Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning? Talteknologi 25-2-3 [ ] Översikt - taligenkänning Automatisk igenkänning av tal Del Mats Blomberg Tal, musik och hörsel KTH Inledning Problem Akustiska analysmetoder Igenkänningstekniker mönstermatchning

Läs mer

Uppgift 1 ( Betyg 3 uppgift )

Uppgift 1 ( Betyg 3 uppgift ) 2006-12-08.kl.08-13 Uppgift 1 ( Betyg 3 uppgift ) Implementera följande funktion: fun(1) = 1 fun(n) = fun(n / 2), för jämna n fun(n) = n / (fun(n - 1) + fun(n + 1)), för udda n Exempel på korrekta resultat:

Läs mer

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA 729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion

Läs mer

Tentamen i Teknisk-Vetenskapliga Beräkningar

Tentamen i Teknisk-Vetenskapliga Beräkningar Umeå Universitet Institutionen för Datavetenskap Gunilla Wikström Tentamen i Teknisk-Vetenskapliga Beräkningar Tentamensdatum: 005-03- Skrivtid: 9-5 Hjälpmedel: inga Om problembeskrivningen i något fall

Läs mer

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens

SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal

Läs mer

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret 2014-2015. Lektion 1

Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret 2014-2015. Lektion 1 Kattis Lektion 1 I kursen används onlinedomaren Kattis (från http://kattis.com) för att automatiskt rätta programmeringsproblem. För att få ett konto på Kattis anmäler du dig på Programmeringsolympiadens

Läs mer

ACOUSTIC FINGERPRINTING SYSTEMS

ACOUSTIC FINGERPRINTING SYSTEMS LINKÖPINGS UNIVERSITET - IDA ACOUSTIC FINGERPRINTING SYSTEMS Louise Walletun Artificiell Intelligens II 729G11 HT2012 Innehållsförteckning Inledning... 3 Attribut hos akustiska fingeravtryck... 4 Evalueringssystemet...

Läs mer

Bakgrund. Problemidentifiering. Fleet Management. Utveckling av verktyg för estimering av underhållskostnader

Bakgrund. Problemidentifiering. Fleet Management. Utveckling av verktyg för estimering av underhållskostnader Fleet Management Utveckling av verktyg för estimering av underhållskostnader Isac Alenius Marcus Pettersson Produktionsekonomi, Lunds Universitet, Lunds Tekniska Högskola Den danska trafikoperatören Arriva

Läs mer

Modellering av felkíallor i digitala kanaler Magnus Berglund Magnus Danielsson Henry Jatko Henrik Wallin 8 maj 199 LULEçA TEKNISKA UNIVERSITET Avdelningen fíor signalbehandling. Sammanfattning Vid simuleringar

Läs mer

Samtidig visning av alla storheter på 3-fas elnät

Samtidig visning av alla storheter på 3-fas elnät Samtidig visning av alla storheter på 3-fas elnät Med nätanalysatorerna från Qualistar+ serien visas samtliga parametrar på tre-fas elnätet på en färgskärm. idsbaserad visning Qualistar+ visar insignalerna

Läs mer

Tentamen: Programutveckling ht 2015

Tentamen: Programutveckling ht 2015 Tentamen: Programutveckling ht 2015 Datum: 2015-11-04 Tid: 09:00-13:00 Sal: Ansvarig: Resultat: Hjälpmedel: Maxpoäng: Betygsgränser: Anslås inom 3 veckor. Inga 40 p 20 p för G, 32 p för VG. Iakttag följande:

Läs mer

Fakta om robotar VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR. Lärarmaterial EVA MOSEGAARD AMDISEN

Fakta om robotar VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR. Lärarmaterial EVA MOSEGAARD AMDISEN SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? I boken får vi en presentation av robotar. Det finns många olika sorters robotar med olika funktioner och utseende. Det som alla robotar har gemensamt är att

Läs mer

729G75: Programmering och algoritmiskt tänkande. Tema 1, föreläsning 1 Jody Foo

729G75: Programmering och algoritmiskt tänkande. Tema 1, föreläsning 1 Jody Foo 729G75: Programmering och algoritmiskt tänkande Tema 1, föreläsning 1 Jody Foo Föreläsningsöversikt Kursinfo / Om kursen Algoritmer Objektorienterad programmering i praktiken terminologi använda objekt

Läs mer

Digitalt lärande och programmering i klassrummet

Digitalt lärande och programmering i klassrummet Digitalt lärande och programmering i klassrummet Innehåll Vad är programmering och varför behövs det? Argument för (och emot) programmering Programmering i styrdokumenten Kort introduktion till programmering

Läs mer

MATEMATIKENS SPRÅK. Avsnitt 1

MATEMATIKENS SPRÅK. Avsnitt 1 Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en

Läs mer

Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en

Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en o m e r f a r e n h e t o c h s p r å k Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en skapelseakt där

Läs mer

TMS136. Föreläsning 1

TMS136. Föreläsning 1 TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill vi modellera och kvantifiera de risker som finns

Läs mer

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen

Läs mer

IT-körkort för språklärare. Modul 5: Ljud, del 2

IT-körkort för språklärare. Modul 5: Ljud, del 2 IT-körkort för språklärare Modul 5: Ljud, del 2 Innehåll Spela in och klipp en ljudfil (metod 1)... 3 Importera och klipp en ljudfil (metod 2)... 6 Ta bort störande bakgrundsljud... 8 Förstärk ljudet...

Läs mer

Lgr 11 matriser i Favorit matematik 4 6

Lgr 11 matriser i Favorit matematik 4 6 Lgr 11 matriser i Favorit matematik 4 6 FÖRMÅGOR FÖRMÅGOR Lgr 11: Genom undervisningen i ämnet matematik ska eleverna sammanfattningsvis ges förutsättningar att utveckla förmågan att De matematiska förmågor

Läs mer

Stina Nyman 2012-09-16

Stina Nyman 2012-09-16 LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem

Läs mer

Talets akustik repetition

Talets akustik repetition Pétur Helgason VT 29 Talets akustik repetition 29-3-3 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 8 % kväve och 2 % syre.

Läs mer

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 00-1-03 Lars Engebretsen 00-1-03 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner

Läs mer

Föreläsning 9: NP-fullständighet

Föreläsning 9: NP-fullständighet Föreläsning 9: NP-fullständighet Olika typer av problem: 1. Beslutsproblem: A(x) =Ja. 2. Optimeringsproblem: A(x) =m Vanligen max/min. 3. Konstruktionsproblem: A(x) =En struktur. Vanligen lösningen till

Läs mer

Datastrukturer och algoritmer

Datastrukturer och algoritmer Datastrukturer och algoritmer Föreläsning 5 Algoritmer & Analys av Algoritmer Algoritmer Vad är det? Innehåll Mer formellt om algoritmer beräkningsbarhet Att beskriva algoritmer Analysera algoritmer Exekveringstid,

Läs mer

Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer

Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer Talperceptionsteorier Passiva stimulusstyrda processer Passiva stimulusstyrda processer Aktiva hypotesstyrda processer Perceptionsteorier Testmetoder Specifik, akustisk information för att identifiera

Läs mer

Objektorienterad programmering Föreläsning 8. Copyright Mahmud Al Hakim Agenda (halvdag)

Objektorienterad programmering Föreläsning 8. Copyright Mahmud Al Hakim  Agenda (halvdag) Objektorienterad programmering Föreläsning 8 Copyright Mahmud Al Hakim mahmud@webacademy.se www.webacademy.se Agenda (halvdag) Objektorienterad programutveckling Algoritmer Algoritmkonstruktionerna Relationer

Läs mer

(Grundkurs i medier och kommunikation vid Tammerfors Universitet, Finland) 1.1 Kommunikation

(Grundkurs i medier och kommunikation vid Tammerfors Universitet, Finland) 1.1 Kommunikation (Grundkurs i medier och kommunikation vid Tammerfors Universitet, Finland) 1.1 Kommunikation Definitioner Ordböckerna ger flera olika betydelser för ordet kommunikation. Kommunikation betyda flera saker:

Läs mer

Dela, koda och korrigera! Undervisningsmaterial inom digital kompetens

Dela, koda och korrigera! Undervisningsmaterial inom digital kompetens Dela, koda och korrigera! Undervisningsmaterial inom digital kompetens Utvidgat regionalt lärarnätverk Stiftelsen Norrbottens Läns Arbetsstugor Lärarnätverket i samtliga Norrbottens kommuner Likvärdighet

Läs mer

Multipel tilldelning. Introduktion till programmering D0009E. Föreläsning 6: Iteration. while-satsen. Kom ihåg. Snurror kontra rekursion

Multipel tilldelning. Introduktion till programmering D0009E. Föreläsning 6: Iteration. while-satsen. Kom ihåg. Snurror kontra rekursion Introduktion till programmering D0009E Föreläsning 6: Iteration Multipel tilldelning Helt ok att tilldela en variabel flera gånger: bruce = bruce, bruce = 7 bruce Output: 7 Som tillståndsdiagram: bruce

Läs mer

Sammanfattning av modulen modeller och representationer Hur går jag vidare?

Sammanfattning av modulen modeller och representationer Hur går jag vidare? Naturvetenskap - gymnasieskolan Modul: Modeller och representationer Del 8: Representationskompetens Sammanfattning av modulen modeller och representationer Hur Konrad Schönborn, Linköpings universitet

Läs mer

Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, Del A

Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, Del A Uppsala universitet Institutionen för informationsteknologi Teknisk databehandling Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, 010-06-07 Skrivtid: 14 00 17 00 (OBS! Tre timmars skrivtid!)

Läs mer

TDDB96 Projekt: Object priming med visuell stimuli

TDDB96 Projekt: Object priming med visuell stimuli TDDB96 Projekt: Object priming med visuell stimuli Daniel Johansson danjo133@student.liu.se Rickard Jonsson ricjo400@student.liu.se 1. Sammanfattning Vad vi ville komma fram till i denna studie var huruvida

Läs mer

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 003-11-18 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner i polynomisk tid. Kanske

Läs mer

Föreläsning 11. Giriga algoritmer

Föreläsning 11. Giriga algoritmer Föreläsning 11 Giriga algoritmer Föreläsning 11 Giriga algoritmer Användning Växelproblemet Kappsäcksproblemet Schemaläggning Färgläggning Handelsresandeproblemet Giriga algoritmer (Greedy algorithms)

Läs mer

DATORER OCH PROGRAM. Programmerade maskiner Program beteendeplan och beteendegenerator Generalitet och portabilitet Datorn är en symbolmaskin

DATORER OCH PROGRAM. Programmerade maskiner Program beteendeplan och beteendegenerator Generalitet och portabilitet Datorn är en symbolmaskin DATORER OCH PROGRAM Programmerade maskiner Program beteendeplan och beteendegenerator Generalitet och portabilitet Datorn är en symbolmaskin men kan ha såväl symboliska som fysiska gränssnitt till omvärlden

Läs mer

Cristina Eriksson oktober 2001

Cristina Eriksson oktober 2001 Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner

Läs mer

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016 Problemlösning Anastasia Kruchinina Uppsala Universitet Januari 2016 Anastasia Kruchinina Problemlösning 1 / 16 Exempel ode45 parametrar Miniprojekt 1 Rapport Anastasia Kruchinina Problemlösning 2 / 16

Läs mer

Mätningar med avancerade metoder

Mätningar med avancerade metoder Svante Granqvist 2008-11-12 13:41 Laboration i DT2420/DT242V Högtalarkonstruktion Mätningar på högtalare med avancerade metoder Med datorerna och signalprocessningens intåg har det utvecklats nya effektivare

Läs mer

Slumpförsök för åk 1-3

Slumpförsök för åk 1-3 Modul: Sannolikhet och statistik Del 3: Att utmana elevers resonemang om slump Slumpförsök för åk 1-3 Cecilia Kilhamn, Göteborgs Universitet Andreas Eckert, Linnéuniversitetet I följande text beskrivs

Läs mer

Pappa, jag är hungrig!

Pappa, jag är hungrig! SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? Boken handlar om Magda och hennes pappa som är vampyrer. De ger sig ut för att äta. Det är mörkt ute och de har svårt att hitta mat. Till sist hittar de en tjej

Läs mer

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.

Läs mer

Tentamen Bildanalys (TDBC30) 5p

Tentamen Bildanalys (TDBC30) 5p Tentamen Bildanalys (TDBC30) 5p Skrivtid: 9-15 Hjälpmedel: kursboken Digital Image Processing Svara på alla frågor på nytt blad. Märk alla blad med namn och frågenummer. Disponera tiden mellan frågorna

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 Matematisk Statistik SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 1 Introduktion Denna laboration är inte poänggivande utan är till för den som vill bekanta sig med MATLAB. Fokusera

Läs mer

Matris i engelska, åk 7-9

Matris i engelska, åk 7-9 E C A HÖRFÖRSTÅELSE Förstå och tolka engelska tydliga detaljer i talad engelska och i måttligt tempo. väsentliga detaljer i talad engelska och i måttligt tempo. Kan förstå såväl helhet som detaljer i talad

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter

Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning

Läs mer

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp) Simulering av Poissonprocesser Olle Nerman, 2015-09-28 Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp) Frågeställning: Hur åstadkommer man en realisering av en Poissonprocess på ett tidsintervall

Läs mer

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.

Läs mer

Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7.

Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

AVR 3 - datorteknik. Avbrott. Digitala system 15 hp. Förberedelser

AVR 3 - datorteknik. Avbrott. Digitala system 15 hp. Förberedelser Namn: Laborationen godkänd: Digitala system 15 hp AVR 3 - datorteknik LTH Ingenjörshögskolan vid Campus Helsingborg Avbrott. Syften med den här laborationen är att introducera avbrott. Avbrott som uppkommer

Läs mer

Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.

Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står

Läs mer

Kursplan och kunskapskrav för skolämnet Teknik

Kursplan och kunskapskrav för skolämnet Teknik Kursplan och kunskapskrav för skolämnet Teknik Gäller fr.o.m. 170701 Läroplan för grundskolan, förskoleklassen och fritidshemmet 2011 Reviderad 2017, s 283-289 Det här styrdokumentet är reviderat med skrivningar

Läs mer