Niklas Lindvall Artificiell intelligens II Ht
|
|
- Niklas Lundström
- för 6 år sedan
- Visningar:
Transkript
1 Taligenkänning Hidden Markov Model Niklas Lindvall Artificiell intelligens II Ht
2 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende... 5 Representation... 5 Frame... 5 Mönstermatchning... 5 Vektor kvantifiering (VQ)... 6 Systemets uppbyggnad... 6 Fonem... 6 Språkmodeller... 7 Akustiskmodell... 7 Noisy channel modell... 7 Segmentering... 8 Invariansproblemet... 9 Taligenkänning Hidden Markov Models... 9 Exempel Hidden Markov Model Begränsningar och problem vid tillämpning av HMM Viterbi algoritmen Algoritmerna gör tre olika antaganden Referenser
3 Inledning En av de mest fascinerande egenskaperna hos människor är deras förmåga att kommunicera idéer med hjälp av tal. Denna funktion är utan tvekan ett av det faktum som har möjliggjort utvecklingen av vårt samhälle. Människan har alltid varit lockad av möjligheten att skapa maskiner som kan producera och känna igen tal. En automatisk taligenkänning (ASR)-system kan definieras som en mekanism som kan avkoda den mänskliga tal signaler som produceras genom att använda vokala ljud eller nasala ljud. Att kunna känna igen och förstå tal är förmodligen någonting de flesta människor tar för givet. Detta är troligtvis för att den mänsklig samspelet till stor del består av att prata med andra individer. De mest grund läggande för Taligenkänning är att den börjar med att göra om den analoga signalen till ett digitalt urval av tal. Sedan går den vidare med en akustisk signalbearbetning. När detta är klart ska fonem och ord hittas i en identifieringsprocess och då använder man sig av Hidden Markov Model, Dynamic Time Warping och Verbetin algoritmen Schroeder framhåller att alla sorters av taligenkännings system innehåller dessa tre primära grundkomponenter: 1. När en talare artikulerar ord så görs dessa signaler om till en sorts av representation som senare utnyttjas för att kunna känna igen vilka ord som har yttrats. 2. För att frambringa en representation så utnyttjar igenkänningssystemet en uppsättning mallar med beskrivningar för varje ord. Mallarna beskriver ord som igenkännaren ska kunna känna igen och på så sätt även kunna återge till vad som sagts. 3. En vis sorts av mönstermatchnings algoritm bestämmer vilken av mallarna som är mest lik det tal som kommit in som indata(schroeder 1994). 2
4 Taligenkänning språk För att kunna förstå hur komplicerat de är att använda sig av automatisk taligenkänning. Så måste man först förstå hur avancerat vårt talorgan är. Även vilka olika problem datorn har för att kunna översätta våra ljudsignaler till ord, handling och innebörd. När man producerar ett språkljud passerar luftströmmen från lungorna till stämbanden, sedan halsen och munnen. Beroende på vilket talljud du formulera och hur talsignalen kan uttryckas så kan detta göras på tre olika sätt: Voiced excitation Då stämbanden är stängda och lufttrycket tvingar stämbanden att öppna och stänga med jämna mellanrum. Vilket genererar en periodisk puls av ljud. Denna "grundfrekvens" ligger oftast i intervallet från 80Hz till 350Hz. Unvoiced excitation Stämbanden är öppen och luften passerar ett smalt passage i halsen eller munnen. Detta resulterar i en turbulens som genererar en ljud signal. Den stora räckvidden av bullrets form bestäms av placeringen av stämbanden. Transient excitation En sammandragning i halsen eller munnen som kommer att höja luft trycket. Genom att plötsligt öppna eller stänga luftstrupen så sjunker lufttrycket ner omedelbart ( Plosive burst ). När vi formar språkljud så använder vi oss ibland av alla dessa tre typerna i kombination. Den spektrala formen på talsignalen bestäms av vilken vokal man uttala. Detta gör att du ändra den spektrala formen på talsignalen och därmed hur du artikulera på olika sätt (B. Plannerer 2005). 3
5 Taligenkänning De tre viktigaste grund komponenter i alla taligenkännings är representation, mallar och mönstermatchning. För att representation av talsignalen ska kunna fungera så måste igenkännare göra om talsignalen före den på börja själva analysen. Den här strukturen kallas för en inre representation. De här bidra till en mer förfining av orden som bryts ner till mindre beståndsdelar som kallas för fonem. Utifrån detta kan uttalet av ord och fonem ha olika inverka på variationen i språket. En statisk modell som tar hänsyn till detta är Hidden Markov Models(HMM). En mall innehåller information för varje ord. Dessa mallar hittar ord variationer genom att igenkännare har en uppsättning ord som den kan jämföras med. Dessa schabloner är de ord som våra igenkännare kan känn igen. Den process som avgör vilket ord som är mest likt våra indata är en mönsterpassnings algoritm. Algoritmen jämför mallarna mot de ord som är mest likt våra indata. I det här tillståndet bestäms ordgränser och om en särskillnad finns i förhållande till indata. Så beslutar mallen även här om indata är accepterbar. Är ingen mall lik våra indata så tillåts inte denna matchning. När de blir mera avancerat vokabulär så tar mönsterpassningen hänsyn till orden betydelse och syntax. Detta leder till att de blir en större begränsning hur ord kan sammanställas till olika meningar. Här kommer en enkel beskrivning vad taligenkänning är. De första som händer är att man måste konverteras om talsignalen till en akustisk signal så att ett taligenkänningssystem ska kunna klara av att hantera den digitala signalen. Signalen tolkas genom att den samplas och sedan görs en spektralanalys på den. Efter detta så lagra signalen i form av olika parametra för den ska ta så lite plats så möjligt. De lagrade materialet delas upp av vektorer som delar upp parametrarna i små delar. Den digitala signalen går igenom en process som beslutar vilka ord som har uttalats. De här går att göra på olika sätt bland annat med kunskapsbaserade metoder, med mönster igen känning, ANN och HMM(Schroeder, 1994) Bild 1.1 Generellt schema över taligenkänning (Segura, 2006). 4
6 Oberoende/Beroende För taligenkänning finns de två olika system dessa är oberoende system och beroende system. Ett oberoende system kan känna igen vilken talare som helst och använder sig av en databas som innehåller akustiska beskrivningar, vokabulär och språkmodeller(möjliga ord följd). För att det här systemet ska fungera bra krävs de att de finns en väldigt stor databas. Detta beror på att talarens röst variera så mycket som t.ex. talhastighet, dialekt och om man är man eller kvinna. Det enklaste systemet för taligenkännig är ett beroende system. Denna teknik använder sig av en specifik talare. Detta med för att systemet har ett litet vokabulär lagrat och att orden som används är isolerade. När talaren har läst in en eller flera texter till ljudfiler så sparas dessa undan och sedan jämföra de mot den inkommande ljud signalerna (Segura, 2006). Representation När taligenkänning används så spela man oftast in ljudsignalen detta kräver mycket lagringskapacitet. Ett annat problem är också att de gör de opraktiskt att göra en frekvensanalys på det inspelade materialet. För att kunna komma runt detta problem så konverteras den analoga signalen till en digitalsignal. sedan separera man signalen genom att använda sig av en algoritm som kallas LPC(Linear Prediction Coding). Denna algoritm filtera bort allt oönskat icketal. På detta sätt minska man filstorleken och underlätta vid senare mönstermatchning. Den relevanta signalen plocka ut genom att man har kommit fram till att värden upp till 200 gånger per sekund täcker in människans tal och med detta anser man att människans tal inte innehåller några betydelsefulla övergångar som är kortare 5 ms (Jurafsky, 2000). Frame Även i denna form är uppgifterna inte användbar för taligenkänning eftersom det är för svårt att identifiera eventuella mönster som korrelerar till vad som faktiskt sägs. För att göra en mönsterigenkänning lättare så omvandlas digitalt ljud till olika "frames". Genom detta kan man mäta tiden mellan de olika frames och för att mättningen ska bli så korrekt så möjlig så införs ett energivärden som känner av varje stop och tystnad. När data överskrider gränsvärdet för bakgrundsljud så sparas denna information undan tills detta värde är lägre än gränsvärdet igen. På detta sätt hittar man olika särdrag som ger till räckligt med information om vår artikulation, personen resonans och röst(segura, 2006). Mönstermatchning Vid en mönstermatchning så jämför indata mot mallarna som har skapat tidigare. Ordens mönstermatchning börjar först när de har blivit omgjord till en inre representation och de har nått tröskelvärdet bakgrundljud samt gått under värdet igen. Nästa skede är att igenkännaren tar frames som ordet har gått igenom och jämför dessa mot liknande frames mallar. Skillnaden i förhållande till varje LPC parameter bruka vara ungefär ett dussin och detta bruka kallas för frame by frame felet. Enkel sagt så jämför mallen mot våra indata. Frames som har minst ordfel representera den bästa matchningen mot våra indata. Om felet är för stort så avslås systemet matchning. 5
7 Ett system som uppfattar speciella egenskaper hos ord och utnyttjar detta till en representation av indata behöver ha avancerad mönstermatchning. De flesta system som hantera mönstermatchning tar för givet att all indata kommer att ha samma längd som själva grundmallen. Detta är inte sant efter som alla människor prata olika snabbt. För att lösa detta problem använder man sig av en teknik som heter Dynamic time warping och denna teknik används för att kompensera tidsskillnader i tal. En annan teknik som är användbar för mönstermatchning är att kunna göra dessa beräkningar mindre. Denna teknik heter Vector Quantization(VQ) och teknikens egenskap är att den tar upp olika variationer utan att få för mycket indata(segura, 2006). Vektor kvantifiering (VQ) När man använder sig av metoden Vektor kvantifiering så vill man minska signalens datamängde när en ram har skapats. Ramen är uppbyggd av en rad vektorer och detta är till för att kunna reducera datamängde, genom att jämförs dessa vektorer gentemot referens vektorer som erhålls i en kodbok. För att kunna hitta den mest sannolika referens vektorn så jämför denna mot den inkommande vektorn och på detta sätt blir rätt referensvektor vald. De olika referenser vektorerna har ett individuellt tal som ersätter den inkommande vektorn. Så den ursprungliga vektorn övergår till att vara i outputen till en serie av nummer. Dessa serier kommer att vara indata till HMM(Jurafsky, 2000). Systemets uppbyggnad En taligenkännings system kunskap är uppbyggt på information från fonem, ordmodeller(akustiska beskrivningar), språkmodeller(möjliga ord följder) och lexikon. Vid användning av oberoende eller beroende systems så kombineras dessa sätt ihop. De som bestämmer vilka kombinationer man använder sig av är hur man vill representera problemet och beroende på detta väljer man vilken algoritms som är bäst anpassade för rätt analys. Fonem Om man tittar på hur de svenska språk är uppbyggt på så innehåller de språkljud som kallas för foner och de är minsta grundstenarna i vårt språk. Foner är betydelseskiljande kallas för fonem och när de uttalas kan de låta som en vokal, väsande eller ett klickljud. I svenska språket så har vi ca fyrtio fonem. Men varje fonem kan låta olika beroende dialekt, talhastighet, ålder och vilket sammanhang de uttalas i (B. Plannerer 2005). 6
8 Språkmodeller För att systemet ska ha lättare att kunna identifiera vilka ord man säger så använder man sig av språkmodeller. I språk modellerna utnyttjar man för det mesta av olika N-grams som är en statiskspråkmodell. Modellerna speciella egenskaper är att den jämför ord som står innan ordet(n-1)t. Utifrån detta beräknar den sannolikheten och på detta sätt få den en hög träffsäkerhet. De finns två olika språkmodellen som man bruka använda sig av, dessa är bigram och trigram. En bigrams modell är uppbyggd så att den räkna ut sannolikheten för ett vist ord som förekommer innan. Trigram modellen räknar ut sannolikheten för två ord som kommer innan ordet. Den allmänna ekvationen för att beräkna det nästkommande ordet i en sekvens, enlighet N-gram modellen ser ut så här: Bild 1.2 Formel för att beräkna nästkommande ord(segura, 2006) Akustiskmodell När man behöver visa ett sannolikheten problem med ett visst ord som har uttalats givet en signal. Den mest troliga tydningen av signalen är värdet av ord när det maximerar P (Ord Signal). Att räkna ut sannolikheten på ett bakvänt sätt kan var till hjälp ibland och denna process kallas för Bayes teorem. Att beräkna ut just ett ord givet en viss signal kan vara tämligen knepigt. Om man som alternativ tänker på att man har en sannolikhet för ordet givet en bestämd signal och gångar den med sannolikheten för ordet, får man enklare fram en lösning. Den modell P(Signal Ord) har för vana att kallas för den akustiska modellen. För att räkna ut detta utnyttjar man sig av en Hidden makarov model(hmm). Den akustiska modellen kan indelas i två bitar. Den första biten hanterar artikulationer som genereras för varje ord, en sannolikhet över tänkbara fonemsekvenser. Fonem är små och inte direkt observerbara och för att representera tal utnyttjar man sig av HMM. Den andra biten av modellen arbetar med hur fonem blir till akustiska signaler och modellen acceptera skillnader i fart och ljudstyrka(schroeder 1994). Noisy channel modell För att kunna använda taligenkänning i olika miljöer måste man använda sig av Noisy channel modell. Detta används för att det oftast finns bakgrunds ljud som stör själva talsignalens upptagnings förmåga. Med anledning av detta behandlar Noisy Channel modellen den akustiska inputen som en brusig version av ursprungs signal. För att kunna filtera bort allt brus så söks alla meningar som finns i ordlistan igenom. Sedan räknas sannolikheten ut 7
9 för att meningen i vokabulären skulle kunna ge just den brusiga signalen. Den meningen som har bäst sannolikhet väljs sedan ut. För att bättre förstå hur Noisy channel modell fungera så kommer de ett exempel. Överföring av ett budskap kan modelleras med hjälp av en Noisy channel modell ett meddelande W som är avkodat, vilket resulterar i en sträng X. X överförs genom en kanal med sannolikheten av distributionen f (y x); den resulterande strängen Y avkodas, vilket ger en uppskattning av meddelandet W w x y kodare Kanal avkodare w meddelande f (y x) uppskattning av meddelandet Bild 1.3 Generellt schema över hur Noisy channel modell fungera (Segura, 2006). Segmentering En allmän svårighet för att träna upp ett system som ska hantera talproduktion eller taligenkänning är hur man ska kunna lagra kunskap om ord och yttrande som inte finns i systemet. I båda fallen kan problemet reduceras genom att man utnyttjar en stor kvantitet inspelat material. Men för det mesta är de ogenomförbart att få med allt som ett system ska kunna begripa eller uttala. En metod skulle kunna vara att segmentera, de vill säga att man delade upp det inspelade ljudet i mindre bitar. När man har gjort detta kan man utnyttja fonem eller fonemsekvenser (difoner/polyfoner). En difon är konstruerad av två halva foner som angränsar till varandra. Klippet finns mitt i mellan fonerna. Där inverkan från angränsande foner är som minst. Exp. så ger tut fyra difoner: tystnad - t t -u u -t t -tystnad. (-anger skiljelinje emellan foner; anger klipp på mitten av fonen). Den här tekniken har visats sig att ge ett mycket bättre resultat och system som använder den teknik har en möjlighet att uppnå 98 % täckning av språkets existerande difoner (ki/ka/ku/ko o.s.v.) och ungerför 80 % täckning av polyfoner (spri-/-orv/-olmskt o.s.v.). Med den här tekniken kan taligenkännings system känna igen ord som inte har övats in tidigare(jurafsky, 2000). 8
10 Invariansproblemet oberoende om dessa segment ska utnyttjas för att identifiera eller framställa tal, uppkommer en rad liknande problem. Kanske det essentiellaste av dessa är det faktumet att samma akustiska signal kan förstås som helt och hållet olika fonem beroende på vilken kontext den finns i, enkelt sak bruka detta problem kallas för invariansproblemet. En väsentlig svårighet är det stora antalet faktorer som påverkar hur vi artikulerar ett visst uttal. En del uttal kan vi själva ha inverkan på som till exp. avslappnat uttal, tonfall och sinnes tillstånd. Men från en individ till en annan individ kan det vara olika beroende på kön, ålder och dialekt. Detta bidra till att förväntade fonem kanske uttalas på ett annat sätt eller till och med blir ute lämnade helt. Denna anpassbarhet ställer högre krav vid talproduktion och är svårare att imitera med en modell som arbetar med att spara undan inspelningar, som ska representera en korrekt artikulation av ett visst ord. Därför behöver man utnyttja tekniken inom HMM system som kan hantera och representera dessa problem på ett bättre sätt(jurafsky, 2000). Taligenkänning Hidden Markov Models Bland de mest säkra metoden för att avkoda språk är Hidden Markov Models (HMM). Modellen är uppbyggt så att den match orden som kommer in mot lagrade ord som finns i ett system. Beroende på hur ord låter så match dessa mot fonems uttal. Den modell är en statisk sannolikhets process som fungera genom att ha sju olika intern tillstånd. De vill säga att modellen ha ett start tillstånd och ett måltillstånd. Mellan varje steg så skapa HMM utdata som är använd bara för processen. Utdata matchas mot antal fonem som finns i ett ord och sedan jämför man de olika akustiska egenskaperna hos varje ord. Under varje åtgärd i processen kan HMM stanna i de tillstånd den är i eller så kan den förflytta sig till ett nytt tillstånd. De finns gömda( Hidden ) processer i modellen och detta menas att varje till stånd är gömt och man kan bara se den information som produceras som utdata(schroeder, 2004). Följande exempel kan hjälpa oss att förstå dynamiken i Markov processen(kedjor). Exempel Markov kedjor Låt oss anta att vi har en modell för en väderprognos med bara tre möjliga observationer: regn (S1), molnigt (S2) och soligt (S3). Denna modell (se figur 1.4) tillåter oss att beräkna sannolikheten för att observera en sekvens av väder i ett tillstånd. För exempelvis kan vi beräkna sannolikheten för de "soliga/soliga/regniga/dimmiga" sekvenserna. (O = (s3, s3, s1, s2)) P(O model) = P(s3s3s1s2 model) = P (s3) P(s3 s3) P(s1 s3) P(s2 s1) = P(s3)a33a31a12 9
11 Bild 1.4 En diskret Markov kedja(segura, 2006). Hidden Markov processer uppstår ur en generalisering av Markov processer som vi har studerat ovan. Exempel Hidden Markov Model Ett klassiskt exempel (Rabiner och Juang, 1993) för att illustrera detta kastar man ett mynt. Experiment: en viss person, som vi kallar kastare, kommer att utföra experiment genom att kasta ett mynt, som en följd av detta blir krona (kr) eller klave (kl) som erhålls. Värden är dolda till alla andra (observatörer) och detta är det enda vi vet om resultatet av experimentet. Kastaren har tre mynt och två av dem används för att få den sekvens av krona eller klave. Dessa två mynt är riggade så att det första myntet har en 75 % sannolikhet att få krona och den andra har en 75 % sannolikhet att få klave. Det tredje myntet är inte riggat och används för att bestämma vid varje gång vilket av de andra mynten som kommer att kastas. Det är möjligt att bygga en modell av experimentet (figur 1.5) med två tillstånd (var och en representerar en av de mynt som skall kastas). I varje tillstånd är det möjligt att generera "kr" eller "kl" (observationer) enligt sannolikheter som visas i figuren. Vi har just nu byggt en Hidden Markov Model. Skillnaden med en vanligt Markov modell är att vi nu har två processer placerade ovanpå varandra. En av dem är observerbara (sekvensen av observationer, krona och klave), men den andra är "dolda" (sekvens av tillstånd, kastade mynt). På samma sätt som för vanlig Markovprocesser, är det möjligt att beräkna sannolikheten för en sekvens av observationer O = O1,..., OT av längd T genereras av en HMM, även om vi formellt kommer att definiera dem innan begreppet HMM. P(kr) = 0.75 P(kr) = 0.25 P(kl) = 0.75 P(kl) = 0.25 Bild 1.5 Mynt experiment för att förklara HMM(Segura, 2006). 10
12 Begränsningar och problem vid tillämpning av HMM Det finns tre ansenliga svårigheter med Hidden Markov Model som är tvunget att lösas om man vill att modellen man arbetar med ska vara användbar. Det första dilemmat är hur man ska estimera sannolikheten för en serie av observationer att den kommer från den modellen som man arbetar med. För att komma ifrån detta problem får man bestämma sig för den modell som bäst passar med observationerna. Nästa problem är hur man ska få fram den osynliga delen av modellen för att finna den rätta ordningsföljden av tillstånd. För att upptäcka den rätta ordningsföljden av tillstånden måste man lära sig uppbyggnaden av modellen och på detta sätt försöka läsa av det dolda i modellen. Det slutliga dilemmat är hur man optimerar parametrarna för modellen och för att bäst kunna redogöra för hur en given sekvens uppstår. Att korrigera parametrarna för modellen kallas för en träningssekvens och detta är det som övar Hidden Markov Model för att frambringa bäst modeller av ord (Segura, 2006). Viterbi algoritmen Algoritmen kan utnyttjas för att upptäck den bästa förbindelsen igenom ett nätverk som är konstruerat för enstaka ord. Vägen som utses av algoritmen skall vara de ord som är i högsta grad sannolik givet den serie av ord som observerats. Denna algoritm kan emellertid även vara användbar när man ska undersök kontinuerligt tal och inte enbart enstaka ord. Vid kontinuerligt tal så består indata av serier av ord och det är nästa omöjligt att veta var ordgränserna finns. Detta beror på att orden flyter ihop med varandra. Att upptäck dessa ordgränser i hopsatt tal kallas för segmentation. Syftet med Viterbi algoritmen är att upptäcka den bästa tillståndssekvensen Q = (q, q2.. qt) givet ett antal observerade foner O = (o1, o2.. ot). En Viterbi algoritm är en dynamisk programmerings algoritm för att hitta den mest sannolika sekvensen av dolda tillstånd och detta bruka kallas Viterbi vägen. Det här resulterar i en sekvens av observerade händelser som används i samband med Markov informationskällor och HMM. En nära besläktad algoritm är forward algorithm denna används för att beräkna sannolikheten för en sekvens av observerade händelser. Termerna "Viterbi algoritm" tillämpas även på relaterade dynamisk programmering algoritmer som upptäcker den enskilt mest sannolika förklaringen till en observation. Till exempel i statistik parsning användas den för att upptäcka den enskilt mest sannolika kontextfria härledning (parse) en sträng, som ibland kallas "Viterbi parse". 11
13 Algoritmerna gör tre olika antaganden. Först måste både den observerade händelser och dolda händelserna finnas med i en sekvens. Denna sekvens motsvarar ofta tiden. För det andra, dessa två sekvenser måste anpassas och en instans av en observerad händelse måste motsvara exakt en instans av en dold händelse. För de tredje måste man beräkna den mest sannolika dolda sekvens upp till en viss punkt t beror bara på den observerade händelsen i punkt t, och det mest sannolika sekvensen vid punkt t - 1. Alla dessa antaganden används i en första ordningens Hidden Markov modell. Detta är ett grundläggande antagande av algoritmen eftersom algoritmen kommer att undersöka alla möjliga vägar som leder till ett tillstånd och bara behålla det som mest sannolikt. På detta sätt behöver inte algoritmen hålla reda på alla möjliga vägar, bara en väg per tillstånd. En annan viktig förutsättning är att en övergång från ett tidigare tillstånd till ett nytt tillstånd präglas av en stegvis mått som bruka representeras av ett nummer. Denna övergång beräknas från händelsen. Den sista centralt antagande är att händelserna är kumulativa över en väg i någon mening (Schroeder, 2004). 12
14 Referenser Jurafsky, D & Martin, J H (2000). Speech and language processing Prentice Hall, New Jersey Schroeder, M R (2004). Computer Speech, second edition Springer-Verlag, Berlin Antonio, M. Peinado och José, C Segura (2006), speech recognition over digital channels. Robustness and standards. Rabiner, L. Juang, B-H. (1993) Fundamentals of speech recognition. New Jersey: PTR Prentice-Hall, Inc B. Plannerer (March 28, 2005), an Introduction to Speech Recognition 13
Artificial)Intelligence) Taligenkänning)
LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...
Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez
Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,
Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0
Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens
Taligenkänning med fördjupning på Hidden Markov Models
IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models 870524-0045 jearu017@student.liu.se Sammanfattning Taligenkänning är en teknik
AI-rapport Speech recognition
AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228
Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09
Taligenkänning Hur datorer känner igen talat språk 729G43 Artificiell Intelligens Charlie Forsgren, chafo246 2014-01-09 Charlie Forsgren Innehållsförteckning Inledning..3 Språk och Ljud 4 Elektronisk Inspelning
Analys/syntes-kodning
Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk
Signaler och system, IT3
Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad
Statistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Vinjetter TDDC91 Datastrukturer och algoritmer
Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.
Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?
Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet
Att fånga den akustiska energin
Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007
729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007 $,I UGMXSQLQJ 7DOLJHQNlQQLQJ 850329-2107 6DPPDQIDWWQLQJ Ett taligenkänningssystem kan vara konstruerat för
Inledande programmering med C# (1DV402) Introduktion till programmering
Introduktion till programmering Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt
729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann
729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen
Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?
Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i
Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4
Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa
Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering...
Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering... 4 Bussen (projektförslag)... 5 Bakgrund... 5 Klassen Buss
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
Introduktion till programmering
Introduktion till programmering Vad är programmering? Vad gör en dator? Vad är ett datorprogram? 1 (9) Vad är programmering? För att bestämma en cirkels area måste du: 1. Dividera diametern 5 med 2. 2.
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Sampling. Analog - digital. Kvantifiering. Samplingsprocess. Analog vs digital teknik. Kvantifiering. Analog oändlig digital diskret (1or 0or)
Analog - digital Analog oändlig digital diskret (1or 0or) Digitalt intakt trots kopiering analogt slits och kvaliteten degraderar Sampling Sinuston vågdiagram (AT) antal mätpunkter/samplingspunkter Samplingsfrekvens
de var svåra att implementera och var väldigt ineffektiva.
OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan
Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter Laura Enflo & Giampiero Salvi
Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter & Giampiero Salvi Komplex analys Om man endast använder den reella tallinjen är det inte
- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
TAMS79: Föreläsning 10 Markovkedjor
TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.
Arkitektur och Regelverk Definition av kodverk och klassifikation. Version 1.0
Arkitektur och Regelverk Definition av kodverk och klassifikation Version 1.0 Innehållsförteckning 1. Inledning... 3 2. Definitioner... 3 Referenser och underlag... 5 Revisionshistorik Version, datum Författare
Språkljudens akustik. Akustik, akustiska elementa och talanalys
Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns
Diskussionsproblem för Statistik för ingenjörer
Diskussionsproblem för Statistik för ingenjörer Måns Thulin Rolf Larsson rolf.larsson@math.uu.se Jesper Rydén jesper.ryden@math.uu.se Senast uppdaterad 27 januari 2016 Diskussionsproblem till Lektion 3
DATORER OCH PROGRAM. Datorn är en symbolmaskin
DATORER OCH PROGRAM Datorn är en symbolmaskin men kan ha såväl symboliska som fysiska gränssnitt till omvärlden Program beteendeplan och beteendegenerator Programmerade maskiner Generalitet och portabilitet
ARTIFICIELLA NEURALA NÄT. MARCO KUHLMANN Institutionen för datavetenskap
ARTIFICIELLA NEURALA NÄT MARCO KUHLMANN Institutionen för datavetenskap Example Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait 1 Yes No No Yes Some $$$ No Yes French 0 10 Yes 2 Yes No No Yes Full
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Flexi Kontrollmodul. Bruksanvisning. Innehållsförteckning. 1. Introduktion och tekniska specifikationer 1
Flexi Kontrollmodul Bruksanvisning Innehållsförteckning 1. Introduktion och tekniska specifikationer 1 2. Allmän beskrivning av display och manöverknappar 2 3. Inställning av Flexidrift 3 4.Inställning
Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! !
Taligenkänning HMMochViterbi EllinorAndersson,92091393801 LinköpingsUniversitet ArtificiellIntelligensII,729G11 Ht2012 2012909912 Sammanfattning Dennaprojektuppsatsbehandlartaligenkänningochdeolikadelmomentsomkrävsför
Programmering, dans och loopar
Lektionen är en introduktion till programmering; träna loopar med analog dansprogrammering. Lektionsförfattare: Karin Nygårds Till läraren 1. En loop 2. Varför behövs loopar? En digital lektion från https://digitalalektioner.iis.se
Faltningsreverb i realtidsimplementering
Faltningsreverb i realtidsimplementering SMS45 Lp1 26 DSP-system i praktiken Jörgen Anderton - jorand-3@student.ltu.se Henrik Wikner - henwik-1@student.ltu.se Introduktion Digitala reverb kan delas upp
Klassrumsprojekt programmering - Digitalt lärande
Klassrumsprojekt programmering - Digitalt lärande Projektet passar för lågstadiet eller nybörjare i äldre årskurser Utgå från boken Hej Ruby- Äventyr i datorernas magiska värld av Linda Liukas, Volante
Neurala nätverk och språkigenkänning. Henrik Linnarsson. Linköping University
Neurala nätverk och språk Henli807!1 Neurala nätverk och språkigenkänning Henrik Linnarsson Linköping University Neurala nätverk och språk Henli807!2 RNN, LSTM och språkigenkänning Inledning Idag är språkigenkänning
Stora talens lag eller det jämnar ut sig
Stora talens lag eller det jämnar ut sig kvensen för krona förändras när vi kastar allt fler gånger. Valda inställningar på räknaren Genom att trycka på så kan man göra ett antal inställningar på sin räknare.
Lgr 11 - Centralt innehåll och förmågor som tränas:
Lärarmaterial SIDAN 1 Författare: Martina Ericson Boken handlar om: Robin och hans bror Ante är olika. Ante tycker om att skjuta och jaga tillsammans med pappa i skogen. Robin tycker inte alls om att skjuta,
Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag
Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska
Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?
Talteknologi 25-2-3 [ ] Översikt - taligenkänning Automatisk igenkänning av tal Del Mats Blomberg Tal, musik och hörsel KTH Inledning Problem Akustiska analysmetoder Igenkänningstekniker mönstermatchning
Uppgift 1 ( Betyg 3 uppgift )
2006-12-08.kl.08-13 Uppgift 1 ( Betyg 3 uppgift ) Implementera följande funktion: fun(1) = 1 fun(n) = fun(n / 2), för jämna n fun(n) = n / (fun(n - 1) + fun(n + 1)), för udda n Exempel på korrekta resultat:
729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA
729G43 Artificiell intelligens Probabilistisk logik Arne Jönsson HCS/IDA Probabilistiska resonemang Osäkerhet Grundläggande sannolikhetslära Stokastiska variabler Bayes teorem Bayesianska nätverk Konstruktion
Tentamen i Teknisk-Vetenskapliga Beräkningar
Umeå Universitet Institutionen för Datavetenskap Gunilla Wikström Tentamen i Teknisk-Vetenskapliga Beräkningar Tentamensdatum: 005-03- Skrivtid: 9-5 Hjälpmedel: inga Om problembeskrivningen i något fall
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. Linköpings Universitet 729G43 Artificiell Intelligens
SPEECH RECOGNITION USING ARTIFICIAL NEURAL NETWORKS Oscar Lundblad Osclu399@student.liu.se 2017-01-05 Linköpings Universitet 729G43 Artificiell Intelligens Innehållsförteckning Introduktion 3 Rapportens
Vanliga frågor för VoiceXpress
Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur
EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG
FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal
Introduktion till algoritmer - Lektion 1 Matematikgymnasiet, Läsåret 2014-2015. Lektion 1
Kattis Lektion 1 I kursen används onlinedomaren Kattis (från http://kattis.com) för att automatiskt rätta programmeringsproblem. För att få ett konto på Kattis anmäler du dig på Programmeringsolympiadens
ACOUSTIC FINGERPRINTING SYSTEMS
LINKÖPINGS UNIVERSITET - IDA ACOUSTIC FINGERPRINTING SYSTEMS Louise Walletun Artificiell Intelligens II 729G11 HT2012 Innehållsförteckning Inledning... 3 Attribut hos akustiska fingeravtryck... 4 Evalueringssystemet...
Bakgrund. Problemidentifiering. Fleet Management. Utveckling av verktyg för estimering av underhållskostnader
Fleet Management Utveckling av verktyg för estimering av underhållskostnader Isac Alenius Marcus Pettersson Produktionsekonomi, Lunds Universitet, Lunds Tekniska Högskola Den danska trafikoperatören Arriva
Modellering av felkíallor i digitala kanaler Magnus Berglund Magnus Danielsson Henry Jatko Henrik Wallin 8 maj 199 LULEçA TEKNISKA UNIVERSITET Avdelningen fíor signalbehandling. Sammanfattning Vid simuleringar
Samtidig visning av alla storheter på 3-fas elnät
Samtidig visning av alla storheter på 3-fas elnät Med nätanalysatorerna från Qualistar+ serien visas samtliga parametrar på tre-fas elnätet på en färgskärm. idsbaserad visning Qualistar+ visar insignalerna
Tentamen: Programutveckling ht 2015
Tentamen: Programutveckling ht 2015 Datum: 2015-11-04 Tid: 09:00-13:00 Sal: Ansvarig: Resultat: Hjälpmedel: Maxpoäng: Betygsgränser: Anslås inom 3 veckor. Inga 40 p 20 p för G, 32 p för VG. Iakttag följande:
Fakta om robotar VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR. Lärarmaterial EVA MOSEGAARD AMDISEN
SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? I boken får vi en presentation av robotar. Det finns många olika sorters robotar med olika funktioner och utseende. Det som alla robotar har gemensamt är att
729G75: Programmering och algoritmiskt tänkande. Tema 1, föreläsning 1 Jody Foo
729G75: Programmering och algoritmiskt tänkande Tema 1, föreläsning 1 Jody Foo Föreläsningsöversikt Kursinfo / Om kursen Algoritmer Objektorienterad programmering i praktiken terminologi använda objekt
Digitalt lärande och programmering i klassrummet
Digitalt lärande och programmering i klassrummet Innehåll Vad är programmering och varför behövs det? Argument för (och emot) programmering Programmering i styrdokumenten Kort introduktion till programmering
MATEMATIKENS SPRÅK. Avsnitt 1
Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en
Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en
o m e r f a r e n h e t o c h s p r å k Vi erövr ar verkligheten bit för bit genom att vi får ett språk för våra erfarenheter. Ett barns språkutveckling är ett fascinerande skådespel, en skapelseakt där
TMS136. Föreläsning 1
TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill vi modellera och kvantifiera de risker som finns
Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription
Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen
IT-körkort för språklärare. Modul 5: Ljud, del 2
IT-körkort för språklärare Modul 5: Ljud, del 2 Innehåll Spela in och klipp en ljudfil (metod 1)... 3 Importera och klipp en ljudfil (metod 2)... 6 Ta bort störande bakgrundsljud... 8 Förstärk ljudet...
Lgr 11 matriser i Favorit matematik 4 6
Lgr 11 matriser i Favorit matematik 4 6 FÖRMÅGOR FÖRMÅGOR Lgr 11: Genom undervisningen i ämnet matematik ska eleverna sammanfattningsvis ges förutsättningar att utveckla förmågan att De matematiska förmågor
Stina Nyman 2012-09-16
LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem
Talets akustik repetition
Pétur Helgason VT 29 Talets akustik repetition 29-3-3 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 8 % kväve och 2 % syre.
Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 00-1-03 Lars Engebretsen 00-1-03 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner
Föreläsning 9: NP-fullständighet
Föreläsning 9: NP-fullständighet Olika typer av problem: 1. Beslutsproblem: A(x) =Ja. 2. Optimeringsproblem: A(x) =m Vanligen max/min. 3. Konstruktionsproblem: A(x) =En struktur. Vanligen lösningen till
Datastrukturer och algoritmer
Datastrukturer och algoritmer Föreläsning 5 Algoritmer & Analys av Algoritmer Algoritmer Vad är det? Innehåll Mer formellt om algoritmer beräkningsbarhet Att beskriva algoritmer Analysera algoritmer Exekveringstid,
Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer
Talperceptionsteorier Passiva stimulusstyrda processer Passiva stimulusstyrda processer Aktiva hypotesstyrda processer Perceptionsteorier Testmetoder Specifik, akustisk information för att identifiera
Objektorienterad programmering Föreläsning 8. Copyright Mahmud Al Hakim Agenda (halvdag)
Objektorienterad programmering Föreläsning 8 Copyright Mahmud Al Hakim mahmud@webacademy.se www.webacademy.se Agenda (halvdag) Objektorienterad programutveckling Algoritmer Algoritmkonstruktionerna Relationer
(Grundkurs i medier och kommunikation vid Tammerfors Universitet, Finland) 1.1 Kommunikation
(Grundkurs i medier och kommunikation vid Tammerfors Universitet, Finland) 1.1 Kommunikation Definitioner Ordböckerna ger flera olika betydelser för ordet kommunikation. Kommunikation betyda flera saker:
Dela, koda och korrigera! Undervisningsmaterial inom digital kompetens
Dela, koda och korrigera! Undervisningsmaterial inom digital kompetens Utvidgat regionalt lärarnätverk Stiftelsen Norrbottens Läns Arbetsstugor Lärarnätverket i samtliga Norrbottens kommuner Likvärdighet
Multipel tilldelning. Introduktion till programmering D0009E. Föreläsning 6: Iteration. while-satsen. Kom ihåg. Snurror kontra rekursion
Introduktion till programmering D0009E Föreläsning 6: Iteration Multipel tilldelning Helt ok att tilldela en variabel flera gånger: bruce = bruce, bruce = 7 bruce Output: 7 Som tillståndsdiagram: bruce
Sammanfattning av modulen modeller och representationer Hur går jag vidare?
Naturvetenskap - gymnasieskolan Modul: Modeller och representationer Del 8: Representationskompetens Sammanfattning av modulen modeller och representationer Hur Konrad Schönborn, Linköpings universitet
Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, Del A
Uppsala universitet Institutionen för informationsteknologi Teknisk databehandling Tentamen i Beräkningsvetenskap I (nya versionen), 5.0 hp, 010-06-07 Skrivtid: 14 00 17 00 (OBS! Tre timmars skrivtid!)
TDDB96 Projekt: Object priming med visuell stimuli
TDDB96 Projekt: Object priming med visuell stimuli Daniel Johansson danjo133@student.liu.se Rickard Jonsson ricjo400@student.liu.se 1. Sammanfattning Vad vi ville komma fram till i denna studie var huruvida
Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen
Faktorisering med hjälp av kvantberäkningar Lars Engebretsen 003-11-18 Bakgrund Vanliga datorer styrs av klassiska fysikens lagar. Vanliga datorer kan simuleras av turingmaskiner i polynomisk tid. Kanske
Föreläsning 11. Giriga algoritmer
Föreläsning 11 Giriga algoritmer Föreläsning 11 Giriga algoritmer Användning Växelproblemet Kappsäcksproblemet Schemaläggning Färgläggning Handelsresandeproblemet Giriga algoritmer (Greedy algorithms)
DATORER OCH PROGRAM. Programmerade maskiner Program beteendeplan och beteendegenerator Generalitet och portabilitet Datorn är en symbolmaskin
DATORER OCH PROGRAM Programmerade maskiner Program beteendeplan och beteendegenerator Generalitet och portabilitet Datorn är en symbolmaskin men kan ha såväl symboliska som fysiska gränssnitt till omvärlden
Cristina Eriksson oktober 2001
Maskinöversättning Cristina Eriksson 660719-4005 d98-cer@nada.kth.se 15 oktober 2001 1 Sammanfattning Att låta en maskin översätta från ett språk till ett annat är ett forskningsområde som man lägger ner
Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016
Problemlösning Anastasia Kruchinina Uppsala Universitet Januari 2016 Anastasia Kruchinina Problemlösning 1 / 16 Exempel ode45 parametrar Miniprojekt 1 Rapport Anastasia Kruchinina Problemlösning 2 / 16
Mätningar med avancerade metoder
Svante Granqvist 2008-11-12 13:41 Laboration i DT2420/DT242V Högtalarkonstruktion Mätningar på högtalare med avancerade metoder Med datorerna och signalprocessningens intåg har det utvecklats nya effektivare
Slumpförsök för åk 1-3
Modul: Sannolikhet och statistik Del 3: Att utmana elevers resonemang om slump Slumpförsök för åk 1-3 Cecilia Kilhamn, Göteborgs Universitet Andreas Eckert, Linnéuniversitetet I följande text beskrivs
Pappa, jag är hungrig!
SIDAN 1 Lärarmaterial VAD HANDLAR BOKEN OM? Boken handlar om Magda och hennes pappa som är vampyrer. De ger sig ut för att äta. Det är mörkt ute och de har svårt att hitta mat. Till sist hittar de en tjej
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Tentamen Bildanalys (TDBC30) 5p
Tentamen Bildanalys (TDBC30) 5p Skrivtid: 9-15 Hjälpmedel: kursboken Digital Image Processing Svara på alla frågor på nytt blad. Märk alla blad med namn och frågenummer. Disponera tiden mellan frågorna
Syntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2
Matematisk Statistik SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 1 Introduktion Denna laboration är inte poänggivande utan är till för den som vill bekanta sig med MATLAB. Fokusera
Matris i engelska, åk 7-9
E C A HÖRFÖRSTÅELSE Förstå och tolka engelska tydliga detaljer i talad engelska och i måttligt tempo. väsentliga detaljer i talad engelska och i måttligt tempo. Kan förstå såväl helhet som detaljer i talad
Språkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning
Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)
Simulering av Poissonprocesser Olle Nerman, 2015-09-28 Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp) Frågeställning: Hur åstadkommer man en realisering av en Poissonprocess på ett tidsintervall
Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock
Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7.
Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
AVR 3 - datorteknik. Avbrott. Digitala system 15 hp. Förberedelser
Namn: Laborationen godkänd: Digitala system 15 hp AVR 3 - datorteknik LTH Ingenjörshögskolan vid Campus Helsingborg Avbrott. Syften med den här laborationen är att introducera avbrott. Avbrott som uppkommer
Föreläsning 9: Turingmaskiner och oavgörbarhet. Turingmaskinen. Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen.
Föreläsning 9: Turingmaskiner och oavgörbarhet Turingmaskinen Den maximalt förenklade modell för beräkning vi kommer använda är turingmaskinen. Data är ett oändligt långt band där nollor och ettor står
Kursplan och kunskapskrav för skolämnet Teknik
Kursplan och kunskapskrav för skolämnet Teknik Gäller fr.o.m. 170701 Läroplan för grundskolan, förskoleklassen och fritidshemmet 2011 Reviderad 2017, s 283-289 Det här styrdokumentet är reviderat med skrivningar