Taligenkänning* !!!!!!!! !HMM!och!Viterbi! Ellinor!Andersson,! !

Relevanta dokument
Artificial)Intelligence) Taligenkänning)

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning med fördjupning på Hidden Markov Models

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez

729G50 - Artificiell Intelligens Institutionen för Datavetenskap Linköpings Universitet HT 2007

Fuzzy%Logic% Linköpings&Universitet&

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING XII. Föreläsning XII. Mikael P. Sundqvist

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo

--x T Kx. Ka = f. K( a a i. = f f i. r i. = a a i. Ke i. a i 1. p i. Ka i. p i Kai α i

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

DT1130 Spektrala transformer Tentamen

Faktorisering med hjälp av kvantberäkningar. Lars Engebretsen

GRIDWORLD OCH MDP PROJEKTRAPPORT 729G43 MICHAEL JONASSON

TEKNISKA HÖGSKOLAN I LULEÅ Ämneskod SMS016 Systemteknik Tentamensdatum Avd för Signalbehandling Skrivtid

Niklas Lindvall Artificiell intelligens II Ht

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Lektion 8: Konstruktion av semantiska tablåer för PTL-formler

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Sekvensnät Som Du kommer ihåg

729G43 Artificiell intelligens Probabilistisk logik. Arne Jönsson HCS/IDA

Stokastiska processer

Stokastiska processer och simulering I 24 maj

TDDD02 Språkteknologi för informationssökning / Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap

Lösningsförslag till tentamen i SF1861 Optimeringslära för T. Torsdag 28 maj 2010 kl

Tentamen i IE1204/5 Digital Design onsdagen den 5/

Anmälningskod: Lägg uppgifterna i ordning. Skriv uppgiftsnummer (gäller B-delen) och din kod överst i högra hörnet på alla papper

Euklides algoritm för polynom

1.1 Diskret (Sannolikhets-)fördelning

Diskussionsproblem för Statistik för ingenjörer

Tentamen i IE1204/5 Digital Design onsdagen den 5/

!"# $ $ $ % & ' $ $ ( ) *( + $', - &! # %. ( % / & ) 0

Hur det går att minska effektutvecklingen i en processor genom att ändra pipeline

Simulering av Poissonprocesser Olle Nerman, Grupprojekt i MSG110,GU HT 2015 (max 5 personer/grupp)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Aritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12

Tentamen i IE1204/5 Digital Design måndagen den 15/

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

TAMS79: Föreläsning 10 Markovkedjor

Shakey s värld med HTNplanering

Föreläsningsanteckningar till kapitel 8, del 2

Tortoise ) Tortoise ) Hållbar)design)för)Kinas)möbelmarknad! Sustainable)design)for)the)Chinese)furniture)market)! Maja$Björnsdotter$ $

Matematisk statistik LKT325 Tentamen med lösningar

Kort introduktion till bibliometri samt huvuddragen i den norska modellen. Per Ahlgren

DT1120/DT1130 Spektrala transformer Tentamen

4 Diskret stokastisk variabel

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

729G43' ' Jacob'Gavin' Artificiell'Intelligens' ' jacga987' IDA' 'Institutionen'för'datavetenskap' ' 2014D01D10'

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Asymptotisk komplexitetsanalys

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

Diskussionsproblem för Statistik för ingenjörer

IE1205 Digital Design: F10: Synkrona tillståndsautomater del 2

ANN fk. Örjan Ekeberg. Framåtkopplade Nät. återkopplade nät. Olika arkitekturer. BackPropagation through Time. Kalman-Filter tekniker

SF1901: Sannolikhetslära och statistik

Digital- och datorteknik

Jonas Sandström Linköpings universitet

Rapport från refraktions- och reflektionsseismiska mätningar i. området Färgaren 3, Kristianstad

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

AI-rapport Speech recognition

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

Tentamen i Dataanalys och statistik för I den 28 okt 2015

ARITMETIK 3. Stockholms universitet Matematiska institutionen Avd matematik Torbjörn Tambour

Föreläsning 4, Matematisk statistik för M

Föreläsningsanteckningar till kapitel 9, del 2

+5V. start. Styrsystem. stopp. Tillståndsmaskiner


Webbtjä nsten Schäkt. Instruktion Ansökande

Optimal Signalbehandling Datorövning 1 och 2

Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Lösningar till tentamen i Industriell reglerteknik TSRT07 Tentamensdatum: Martin Enqvist

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Burrows-Wheelers transform

Logik för datavetare DVK:Log Tisdagen 28 oktober Institutionen för dataoch systemvetenskap David Sundgren

Introduktion till Komplexa tal

bli bekant med summor av stokastiska variabler.

Poisson Drivna Processer, Hagelbrus

PRISLISTA Datum: Sid. 2:31

+5V. start. Styrsystem. stopp. Tillståndsmaskiner

Taligenkänningssystem

Markovkedjor. Patrik Zetterberg. 8 januari 2013

TDDD92 Artificiell intelligens -- projekt

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Resultat från Stock-Flödesmodellen för sjukpenning

Linjär regression - kalibrering av en våg

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Monte Carlo-metoder. Bild från Monte Carlo

Fjädrar Cylindriska skruvfjädrar av rund fjäderståltråd Dragfjädrar - Beräkningar

SF1901: Sannolikhetslära och statistik

Lathund fo r rapportskrivning: LATEX-mall. F orfattare Institutionen f or teknikvetenskap och matematik

Anteckningar för kursen "Analys i en Variabel"

Shannon-Fano-Elias-kodning

Digitalteknik 7.5 hp distans: 5.1 Generella sekvenskretsar 5.1.1

Grafer. 1 Grafer. Grunder i matematik och logik (2015) 1.1 Oriktade grafer. Marco Kuhlmann

Tentamen på grundkursen, NE1400 Moment: Makroteori 5 p.

Transkript:

Taligenkänning HMMochViterbi EllinorAndersson,92091393801 LinköpingsUniversitet ArtificiellIntelligensII,729G11 Ht2012 2012909912

Sammanfattning Dennaprojektuppsatsbehandlartaligenkänningochdeolikadelmomentsomkrävsför attkunnabyggaetttaligenkänningssystem.olikaaspekterpåtaligenkänning presenterassamtbakgrundsfaktakringspråkochspråkmodeller.denalgoritmsom presenterasförberäkningavsannolikhetenfördenmottagnaakustiskasignalens representationärhiddenmarkovmodeltillsammansmedviterbialgoritmen. 2

Innehållsförteckning 1. Inledning.4 2. Syfte 4 3. Grundläggandefaktaomspråkochtaligenkänning 5 3.1 Vadärtaligenkänning?...5 3.2 Språketsuppbyggnad 5 3.3 Beroende,oberoendetalare.6 3.4 Problemvidtaligenkänning.6 4. Probabilistiskamodeller.7 4.1 Språkmodeller 7 4.2 HiddenMarkovModel..8 4.3 Viterbialgoritmen 11 5. Diskussion..12 6. Referenser.13

1.Inledning Enavdemestfundamentalabyggstenarnaimänniskansexisterandeärkommunikation. Vikommunicerargenomkroppsspråk,tal,gesterochkemiskareaktioner.Dettaären viktigdelavvårtsamliv,menförallaärutförandetintelikaenkelt.detfinnsmänniskor somintekankommuniceramedandragenomtalellergesterochfördemär taligenkänningssystemmycketunderlättandeivardagenochimötetmedolikatekniska system. Etttaligenkänningssystem,ellerettautomatiskttaligenkänningssystem(ASR)kantain enakustisksignaliformavtalochbearbetadennaförattidentifierasekvenseravord ochöversättadettatilldigitalform.processenkräverentalaresomsändersignaler. Signalernahanterasutefterskapademallarförtalsomgenomen mönstermatchningsalgoritmberäknarsannolikhetenförattettvisstorduttalatsoch väljerdenmallsomärmesttroligisammanhanget.påsåsättharviskapat representationidigitalformutifrånentaladanalogsignal.processenkangörasävenåt andrahållet,fråndigitalttillanalogt.(russel&norvig,2010) Taligenkänningärenvälanvändteknikidagenssamhällevidt.ex.kundtjänst, telefonupplysning,hjälpmedelförhandikappadeochröststyrningavmejl,hemma9 systemellersmartphones. Etttaligenkänningssystemärenkompliceradprocedursommåstekunnahanteraolika uttalavordochfonem,vokabulär,syntaxochsemantikocholikatonlägenhosolika personer.förattklaraavdenkompliceradehanteringenavakustiskaljudanvändsolika teknikert.ex.hiddenmarkovmodelochviterbialgoritmen. 2.Syfte Syftetmeddennaprojektrapportärattfåendjupareförståelseförhurenartificiellt intelligentagentäruppbyggdförattklaraavspeciellauppgiftermedfokuspå taligenkänning.jagharvaltattinriktamigpåtaligenkänningförattdetärendelavden artificiellaintelligensensomförbryllarmigmycket.jagharettantalgångerbehövt skrikapåsj:sröststyrdabiljettbokningförattkunnabokaenbiljetttilllund.intetill Ludvika.Likaargsomjagblirnärsystemetinteförstårvadjagsäger,likaförvånadoch 4

imponeradblirjagnärdetfaktisktgördet.attdetmänskligataletmedalladess variationer,dialekterochförändringaravtonlägenkanöversättastillmatematiska formlerochförståsavettsystembyggtpåalgoritmerärförmigheltfantastiskt. 3.Grundläggandefaktaomspråkochtaligenkänning 3.1Vadärtaligenkänning? Syftetmedtaligenkänningärattkunnahanteraakustiskasignalerfrånentalaretill digitalformförattkunnarepresenteratalgenomenintelligentagent.dessasystemkan användastillattkommunicerameddatorerellersmartphones,förattköpaenbiljett genomenröststyrdkundtjänstelleriettmindrekommersielltochmervälgörandesyfte förhandikappadesomharsvårtförattkommuniceramedsinomvärldochföratt underlättaderasarbetemeddatorer. Taligenkänningärsystemdärmänskligtellernaturligttaltolkasavintelligentaagenter ellerdatorersomanvändsvidröststyrdatelefonsvarare,vidhjälpmedelför handikappadeelleravandraelektroniskaverktygdärtalärlämpligareänskrift. Taligenkänningssystemäruppbyggdautavtregrundläggandebyggstenar.Fördetförsta behövervikunnarepresenteraentalaresskickadetalsignalerförattkunnaidentifiera dessatillspecifikaord.förattkunnarepresenteradentaladesignalernakrävsdet mallarsomberättarförsystemethurdenskalltolkasignalerna.tillsistkrävsen mönstermatchningsalgoritmsomkanväljadenmallsomärmestsannoliktidentifierbar meddentaladesignalen.(schmandt,1994) 3.2Språketsuppbyggnad Förattförståkomplexitetenhosetttaligenkänningssystemsåmåsteviförstförståhur språketochtalspråketäruppbyggtochfungerar. Vimänniskorskaparljudellervibrationermedvårastämbandförattbildaolika akustiskasignalersomrepresenterarordmedolikainnebörder.likamångasomdet finnsmänniskorfinnsdetolikasättattuttalaordochfraserpå.viharallaenegen melodiochettegetsättpratapåvilketgördetväldigtsvårtattsammanställaenmallför hurettvisstordellerenfras skall låta.devibrationerellerljudviåstadkommermed 5

stämbandenvarieraristyrkaochtonartmenävenimelodiochbetoningberoendepå vilkendialekt,vilketkön,omviärhesa,vilkethumörellersinnesstämningviäri. Deminstabyggstenarnaispråketkallasfonem.Ettfonemärdespeciellaljudensom bildarettordt.ex.somsje9ljudetisketnaellerchef.deolikafonemvianvänderföratt bildaordärdeklossarsomvihanterarmedhjälpavtaligenkänningssystemenochkan identifierahelaordmedhjälpav.(russel&norvig,2010) 3.3Beroendeochoberoendetalare Ettsystemsomärdesignatförenberoendetalarekräverinteettlikafärgstarkt mönstermatchningssystemochmallregisterdådetendastärutformatförattkunna tolkaenochsammapersonhelatiden. Ettoberoendesystemskallkunnahanteraolikapersonerochmåstedärmedvara duktigarepåattidentifierarättmallfördenintaladesekvensen.denmåstehaenbank avolikasättettordkanuttalaspåberoendepådialekt,könellerröstläge.destomer allmäntanvändningsområdedestostörrevokabulärbankkrävs. 3.4Problemvidtaligenkänning Dåetttaligenkänningssystemskallbearbetadeakustiskatalsignalersomdenhar mottagitkandetuppståendelproblemirepresentationavdessasignaler.ettexempel påettproblemärsåkalladehomofoner.homofonerärordsomlåterlikadantmensom betydertvåolikasakersåsomendaochända.ettannatexempelärsegmentationsom uppstårinaturligttal.närviprataruttalarviingapausermellanorden,intesåsomdet görsiskriftspråk.dettagördetsvårtföretttaligenkänningsprogramattvetavarettord slutarochnästabörjar.detsistaexempletärkoartikulation.koartikulationsproblemet uppstårnärljudetviuttalarislutetavettordochbörjanpåenannanlåterlikadantsom ettannatfonem.övergångenmellanordenkanalltsåskapasammaljudochskapa problemförsystemet.(russel&norvig,2010) 6

4.Probabilistiskamodeller 4.1Språkmodeller Iställetförattrepresenteraochmatchadenmottagnaakustiskasignalenmoten mallordlistasåkanvianvändaossavmodellersommedhjälpavsannolikhetertarfram demestsannolikaalternativenfördetnyssuttaladeordet. Viförindetvåsannolikheternaförattettvisstordskallvarauttalatgivenensignaloch beräknardettamedhjälpavbeyersteorem. P(ord signal)=αp(signal ord)p(ord) αär1/p(signal)vilketärnormaliseringskonstantenförformeln. P(ord signal)gerdenakustiskmodellenvilketärdenintränadedatabassystemethar föratthanteraakustiskasignaler.idenakustiskamodellenkrävsdetattflertaletolika människorhartränatprogrammetförattkunnahanteraolikasortersuttalochdialekter såattsystemetsåsäkertsommöjligtkanhanterasignalerna.denakustiskamodellen kandelasinitvådelardärdenenehanteraruttalochtarframsannolikhetenförvilka sekvenseravfonemsomrepresenterarettordochdenandrehanterarfonemmed avseendepåsignalensrepresentationavtonhöjd,volymochhastighetavuttalet.(russel &Norvig,2010) P(ord)ärSpråkmodellensomuppskattasmedenfrekvensförsannolikhetenattettord skalluppkommaientextbaseratpåsammanhanget.tvåordkangeupphovtillsamma signalochvibehöverdärförräknautensannolikhetförattdetenaäruttalatochinte detandra,vilketproblemärdetspråkmodellenlöser.förattberäknasannolikhetenför efterföljandeordenligtspråkmodellensåanvändermansigavettbigram/trigrameller n9grammodellen. Enbigramutförberäkningenmedhjälpavdetföregåendeordet.Trigramtarhjälpav bådedetföregåendeochdetefterföljandeordetochngramanvänderengenerell uträkningsmetodförden91föregåendeorden.dessaharensynligprocessochären enklaresortsmarkovmodelländendoldahiddenmarkovmodellen.(russel&norvig, 2010) 7

4.2HiddenMarkovModel(HMM) DengömdaMarkovmodellenärenstokastisksignalmodellsomhanterarföränderliga tillståndavdenakustiskasignaldentarinförbearbetning.modellenberäknar sannolikhetenförvilketordellervilkenljudsekvenssomharuttalatsochsannolikheten förvilkennästkommandeljudsekvenskankommaattvara.(russel&norvig,2010) HiddenMarkovModelärenstokastisksignalmodellvilketinnebärattdenhanterar tillståndsomärföränderliga.denkopplarsammanolikafonemmedvarandraoch beräknarsannolikhetenförattettfonemellerenljudsekvensskallövergåiettannat fonemellerinästaljudsekvens.deärlämpligaattanvändadåviharettordellerenhel sekvenssomskallavläsasochtolkasdådenkanberäknasannolikhetenförenhel fras.(zubeck,2006) DetredelarnasomskaparHMM9modellenär Förvarjetillståndharviensannolikhetförattobserveravarjesynlighandlingi dettillståndet. Sannolikhetenförattvarjestadieskallövergåinästastadievaresigdetärett annatstadieellerattdetuppreparsig. Endistributionöverdesamtligastarttillstånden. HMMhanterartaligenkänningidetleddärfonemochkortaljudsekvenserskall representerasochberäknasförattförstådenakustiskasignalensomuttalats. Beräkningenutförspåsannolikhetenförattettvisstordäruttalatgivenensignal. Nedanservialgoritmenfördenestimeradesannolikheten.(Zubeck,2006) b(st)=q(at st) p(st st 1)b(st 1)η st 1 S EnförstaordersHMMärentupelM=<S,A,p,q>där: Särenuppsättningavtillståndiprocessen Aärdenuppsättningavhandlingarsomkanbliobserverade 8

pärsannolikhetsfunktionenförövergången där p(st st 1 ) signifierar sannolikheten för en övergång mellan tillstånd st 1 och st. q är sannolikhetsfunktionen för den observerade signalen där q(at st) avkodar sannolikheten för en observerad handling at vid tidpunkten t givet tillståndet st. b är det tillstånd vi befinner oss i. ModellenHMMgårigenomengömdprocessförattfattaettbeslutkringdeninkomna akustiskasignalen.robertzubeckliknardennaprocessmedhurenpersonmårkontra derasansiktsuttryck.vikanmedhjälpavansiktsuttryckentolkahurpersonenviser mårochharförsinnesstämningmendetäromöjligtförossattsedenexaktakänslan personenbärinombordsutanattupplevadetgenomdesshjärna. JagskamedhjälpavdettaresonemangförklaraalgoritmensomHMManvänderföratt tolkasignalerna.genomattstoppaindenyavariablernaialgoritmenfårvidenna algoritm. b(sad)=q(frowns sad)[p(sad happy)b(happy)+p(sad angry)b(angry)]α Översättervidettatillberäkningavdeverkligasannolikheternaförvarderavariabeloch denövergångsågerdetossdennaberäkning =0.3[0.30.1+0.70.7] α 9

Figur 1. Karta över HMM algoritmen(zubeck,2006) Denpresenteradealgoritmenräknarutsannolikhetenförattpersonenärledsenbaserat påattviharsettenhandlingiformavattpersonenharrynkatpåpannan. Delsannolikhetenq(frowns sad)ärsannolikhetenförattmanskallrynkapannanvid sammatidpunktgivetattmanärledsen.alltså,vadärsannolikhetenförattviskall rynkapannanförattviärledsna?dennasannolikhetskallvigångramedsannolikheten förövergångenfrånattpersonenärgladellerargtillatthenskallbliledsna.vadär sannolikhetenförattviärledsnagivetdetförratillståndetsomantingenkanvaraglad ellerargdåledsenintekanföljasavsigsjälvt.αärdennormaliseringskonstantsom neutraliseraralgoritmensåattdetgivnasvaretskallgesannolikhetermellan0och1. Vivillalltsåfåredapåsannolikhetenförattpersonenärledsengivetattviharmottagit ensignalattpersonenharrynkatpåpannanberäknatpåsannolikhetenfördetidigare sinnesstämningarpersonenbefunnitsigi. Vadsägerdettaexempelossomtaligenkänning?JagskallförklarahurHMMalgoritmen behandlartaligenkänningmedhjälpavsammaprocedur.algoritmenvidtaligenkänning serdåutsomföljer: b(ord)= q(signal ord)[p(ord föregående)b(föregående)+p(ord efterföljande)b(efterföljande)]α 10

Vivilltaredapåsannolikhetenförattettvisstordharuttalatsgivendensignalsom mottagits.denförstadeleniberäkningenhanterarsannolikhetenförattsignalenskall representeraettvisstord.nästadelärdensannolikhetförattsignalenskall representerasammaordberäknatpåhurväldetpassarintemedföregåendehanterade signalellerfonemidettafallsamtdetefterföljandefonemet.ordetsomberäknasberor alltsåpåsannolikhetenförattsignalenkorrelerarmedettvisstordochattdettaäven passarmedföregåendeochefterföljandefonem.signalenärsynligmendeolikafonem vitestardenmotärgömdunderprocessen.viserbaraproduktenavberäkningeninte självautförandet. 4.3ViterbiAlgoritmen (aibokens578) Förattberäknasannolikhetenförattettvisstorduttalatsmåstevidelainproblemeti sannolikhetenförattettvisstfonemuttalats.dennasannolikhetsberäkninghjälper Viterbialgoritmenossmed. Viterbialgoritmenberäknarsannolikhetenförattettfonemharuttalatsoch sannolikhetenförvadnästföljandefonemkommerattvara.viterbialgoritmenfårin olikaljudsekvenservidolikatidstillfällenochkopplarsammandessaochutfören uträkningavsannolikheten.kalasellerkapasger0.35x0.40och0.35x0.25. Denärendynamiskalgoritmvilketbetyderattdenharentotaluppsättningberäkningar förenmiljömedföränderligdataochinput.viterbialgoritmenanvändesförstföratt sållautbakgrundsljudochväljerdenbästavägenmotdetsannolikttaladeordetvalt ifrånettnätverkvilketäruppbyggtavnodermedenstakaord.algoritmenhittarden lämpligastevägengenomnodnätetochdenlösningsnoddenväljerbörvaradetmest sannoliktuttaladeordetgivetdenakustiskasignalsekvenssomobserverats.att undersökakontinuerligttalärbetydligtmerkompliceratänenstakauttaladeorddå ordgränsernaärväldigtotydligaitalademeningar.detärsvårtatturskiljavartettord slutarochnästabörjar.dettaproblemkanviterbialgoritmenhantera.viterbi algoritmengörklassificeringavsannolikhetenförvarjeordsomhmmsedananvänder förattvidareutvecklaberäkningenisammanhanget.(russel&norvig) 11

5.Diskussion Taligenkänningärenimponerandeprocessdärmanmedtankepåproblemets komplexitetharsmåochkompaktalösningar.algoritmernasombehandlardeakustiska signalernaklararuppgiftenmedrelativtbraresultatochhanterardemångaolika variationerispråketsomuppstårvidoberoendesystem.hmmärenalgoritmsommed modifikationkananpassaspåfleraolikaområdenochdessvariationochtillämpbarhet ärfascinerande.taligenkänningärettnödvändigtstegiutvecklingenirelationendator ochmänniskaochettintressantområdeattbådefördjupasigiochutveckla användningsområdetför. 12

6.Referenser Russel,S.Norvig,P.(2010)Artificial)Intelligence:)A)Modern)Approach,thirdedition.New Jersey:PearsonEducation,Inc. Schmandt,C.(1994)Voice)Communication)with)Computers:)Conversational)Systems.New York:VanNostrandReinhold. Doostdar,M.Schiffer,S.Lakemeyer,G.A)Robust)Speech)Recognition)System)for)Service? Robotics)Applications.)Germany,RWTHAachenUniversity. http://www.springerlink.com/content/d6756652647t568h/ 9Hämtad2012909906 G.DavidForney,JR.(1972)The)Viterbi)Algorithm. http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=1450960&url=http%3a%2f% 2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D1450960 9 Hämtad2012909906 Rabiner,L.(1989)A)Tutorial)on)Hidden)Markov)Models)and)Selected)Applications)in) Speech)Recognition.)))))) http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=18626&url=http%3a%2f%2fi eeexplore.ieee.org%2fxpls%2fabs_all.jsp%3farnumber%3d18626 9Hämtad2012909906 Zubek,R.(2006)Introduction)to)Hidden)Markov)Models.InRabin,S.(ed.),AI)Game) Programming)Wisdom)3.)CharlesRiverMedia,Hingham,MA. http://robert.zubek.net/publications/intro9to9hmms9draft.pdf 9Hämtad2012909909 13