Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?

Storlek: px
Starta visningen från sidan:

Download "Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?"

Transkript

1 Talteknologi [ ] Översikt - taligenkänning Automatisk igenkänning av tal Del Mats Blomberg Tal, musik och hörsel KTH Inledning Problem Akustiska analysmetoder Igenkänningstekniker mönstermatchning olinjär tidstöjning (dynamisk programmering) dolda Markovmodeller kunskapsbaserade metoder neurala nät Databaser Resultat Aktuell forskning Tillämpningar Talteknologi [ 2 ] Varför taligenkänning? Tillämpningar Naturligt sätt att kommunicera Snabbare inlärning Effektivare kommunikation Komplexa samband kan uttryckas enkelt i ett språk vi redan kan Ersätter tangentbord eller knappsats handdator, telefon, mobiltelefon Fungerar i besvärliga miljöer mörker, kyla etc. (dock sämre i buller) Händer och syn blir fria för andra uppgifter Talteknologi [ 3 ] Handikapphjälpmedel Personer med rörelsehinder och hörselskada Telefontjänster intelligenta telefonsvarare informationssökning, biljettbokning Fria händer diktering styra mobiltelefon Studiehjälp tålmodig lärare språkinlärning, uttalsundervisning Indexering och sökning radio- och TV-program Talteknologi [ 4 ] Svårighet: tal kontra skrift I fonetisk transkription eller vanlig ortografi beskrivs talet med avgränsade, diskreta enheter Talet har ett kontinuerligt förlopp pga artikulatorernas mekaniska tröghet Koartikulation: Rörelser från/till intilliggande fonem Fonem uttalas olika i olika kontext ( jfr /s/ i visir och ozon ) Reduktion: I snabbt tal och i obetonade stavelser uppnås inte det avsedda uttalet Fonem och stavelser kan falla bort ( bafatt, Sötälje, dnasba ) Svårigheter - stor variabilitet Talare Kanal Lyssnare Mellan talare Ålder Kön Anatomi Dialekt Inom en talare Stress Sinnesstämning Hälsotillstånd Formellt / Spontant Minsta ansträngning Omgivning Additivt brus Rumsakustik Lombardeffekt Mikrofon, Telefon Bandbredd Störningar brus frekvensgång transienter klickar Lyssnare Ålder Modersmål Hörsel Bekant / Okänd Människa / Maskin Talteknologi [ 5 ] Talteknologi [ 6 ]

2 Talteknologi [ 7 ] Överlappning mellan vokaler för olika talare Spontant och hyper-artikulerat tal Spridning för de två lägsta resonans-frekvenserna (F och F2) hos isolerade svenska vokaler uttalade av manliga och kvinnliga talare (G Fant) Va jobbaru me Främre vokaler har väsentlig överlappning. Vad jobbar du med Talteknologi [ 8 ] Spontant vs uppläst tal Talspråk: extra svårigheter Spontant tal ur ett samtal Text: Det är naturligtvis bara roligt Senare samma yttrande uppläst från text /dnasparolit/ /natulitvispara/ Talteknologi [ 9 ] Uttalsreduktioner ofullständigt uttalade ord Icke-grammatiska meningar Stakningar omstarter, instopp, strykningar Extralingvistiska ljud läppsmack, andning, tvekljud Störningar omgivningsljud, teknisk distortion Talteknologi [ ] En normalt besvärlig talare reduktion knarr Tal i brus Inspelat i bil, hastighet 9 km/t. Riktad mikrofon i instrumentpanelen ja det är väl fredag idag... lång konsonant knarr, tvekan så det blir väl ehh... fredag kväll Yttrande: Inga Talteknologi [ ] Talteknologi [ 2 ]

3 Talteknologi [ 4 ] Inverkan av mikrofonavstånd Samma yttrande inspelat med 2 mikrofoner i tyst kontorsrum Det generella problemet är olöst Åtgärder i praktiska system Headsetmikrofon 2 m avstånd Begränsa uppgiften Vad känner man igen? enstaka ord, kommandon, diktering, dialog, spontant tal Vem känner man igen? en talare: talarberoende, -adaptivt alla talare talaroberoende Hur känner man igen? kunskapsbaserade metoder inlärande metoder (statistiskt baserade) Distortion från brus och rumsakustik Talteknologi [ 6 ] Analys Delar i ett taligenkänningssystem 6 khz Hz FFT Parametrisering Spektralanalys Fonem/ord-modeller akustisk beskr. Lexikon vokabulär + fonemtranskription Språkmodell möjliga ordföljder Kunskap Kontinuerlig Klassificering Diskret Sökning Jämförelse N-best N-best N-best N-bästa Ev. Ev. mer mer sökning (ex. (ex. förståelse, prosodi) Igenkänningsresultat Talteknologi [ 7 ] Kunskapsbaserade system Explicit utnyttjande av fonetisk kunskap Begränsad framgång eftersom det är svårt att kvantifiera expertkunskapen svårt att integrera mänsklig kunskap om fonetik, fonotax, lexikal access, syntax, semantik, pragmatik... Kombinera expertkunskap och självlärande system Algoritmer statistiskt baserade metoder Kunskap mel-skala, trifoner, modellera funktionsord i HMM-system Algoritmer gör det möjligt att lösa problem. Kunskap gör algoritmerna bättre. (Victor Zue vid MIT (Massachusetts Inst of Technology) ) Talteknologi [ 8 ] Datadrivna metoder För att ett system ska känna igen tal oberoende av talare och miljö behövs kvantitativa mått på denna variabilitet. Ett stort träningsmaterial (tal och text) krävs för att uppskatta dessa Automatiska träningsmetoder nödvändiga Talteknologi [ 9 ] Den akustiska databasen EU-projekt Inspelat tal över telefonnätet för att träna och testa taligenkänningssystem alla officiella EU-språk samt samt varianter som finlandssvenska, schweizertyska, walesiska totalt över 6 talare inspelade balansera talare enligt dialekt, ålder och kön ca 5 yttranden per talare siffror, datum, tider, penningbelopp, enkla kommandon, fonetiskt rika meningar och ord SpeechDat i Sverige 5 talare inspelade över vanlig telefon talare inspelade över mobiltelefon Talteknologi [ 2 ]

4 Talteknologi [ 23 ] TMH:s textdatabas Totalt ca 5 miljoner ord Texter Pressens Bild ca 9 miljoner ord Samhall ca 37 miljoner ord Datalingvistik Göteborg ca 2 miljoner ord Göteborgs-Posten ca 5 miljoner ord,9 miljoner olika ord ca miljon ord förekommer bara en gång ca 5 miljoner ord totalt,88 miljoner olika ord miljon ord förekommer bara en gång TMH:s textdatabas - de 5 vanligaste orden Totalt gemena gemen form Totalt gemena gemen form Totalt gemena gemen form och eller vill i efter fick att ska dem det ut blev en mot något som vid måste på här sina är också utan av du går för år detta med under allt den då kunde till säger kom inte över många han bara någon de upp mer har alla sa jag vad bli om mig sitt var vara första ett mycket några men in varit sig än fram hon hans hela så andra henne vi får ta från ha genom man sedan mellan hade kommer dag kan få ingen när honom kronor nu två nya skulle hur göra där finns även sin blir sverige Talteknologi [ 24 ] Akustisk analys - önskemål Hög fonetisk diskrimination Litet antal parametrar Låg korrelation mellan parametrar Hög tidsupplösning men okänslighet för grundton - konflikt Teoretiskt bäst: grundtonssynkron mätning I praktiken konstant analysfönster (ca 25 ms) konstant tidsavstånd mellan mätningar (ca ms) Analys Analys av signalen till en följd av korttidsspektra (ramar) Samplingsfrekvens: 8 2 khz; analysbandbredd: 4 khz Analysfönster 5 ms, (här 2 ms) Ram nr n n+ n+2 n+3 n+4 Ramintervall: 5 25 ms (här ms) Talteknologi [ 25 ] Talteknologi [ 26 ] Parameter-representation Filterbanksamplituder (från FFT, Fast Fourier Transform) Hörselbaserad filterbank Mel-skala - baserad på örats frekvensupplösning Tids- och frekvensmaskering, ger förbättring främst vid buller och brus LPC Linjär prediktion - Linear Predictive Coding Cepstrum Invers Fouriertransform av logaritmiskt spektrum ortogonala koefficienter Cepstrum på Mel-spektrum: MFCC - standardmetoden Formanter Främst i kunskapsbaserade system Svåra att bestämma enkel approximation: mät tyngdpunkter i frekvensband Artikulatoriska parametrar Nära kopplad till talproduktionen Mycket svåra att beräkna Talteknologi [ 27 ] Cepstrumanalys Den dominerande analysmetoden inom taligenkänning Invers Fouriertransform av logaritmerat frekvensspektrum Spektralanalys av spektrum Grovstrukturen i spektrum beskrivs med ett litet antal parametrar Hög fonemdiskrimination (har det visat sig) Ortogonala (okorrelerade) koefficienter Ordlek: Spectrum-cepstrum, filtering-liftering, frequencyquefrency, phase-saphe Bogert,, Healy & Tukey (963) The Quefrency Alanysis of Time Series for Echoes: Cepstrum,, Pseudo-autocovariance autocovariance,, Cross-Cepstrum Cepstrum and Saphe Cracking Proc. Symp.. Time Series Analysis, J. Wiley & Sons, 963 Talteknologi [ 28 ]

5 Talteknologi [ 29 ] Cepstral Processing Cepstral processing From Oppenheim & Schafer, 975 Holmes & Holmes, 2 Talteknologi [ 3 ] Cepstrum från filterbankspektra Spektrum av /a:/ Spektrum av /s/ I Cn = Ai cos( nπ( i. 5) / I) i=,5 -,5 - * =,5 -,5 -,5 -,5 - * =,5 -,5 - Viktfunktioner W W2 W3 W Cepstrum av /a:/ C C2 C3 C4 Cepstrum av /s/ C C2 C3 C4 Talteknologi [ 3 ] Vanligast: MFCC-analys Mel Frequency Cepstral Coefficients FFT Spektralanalys med Fast Fourier Transform db Mel-filterbank - 4 filter Hörselanpassad delning Linjär < Hz Log > Hz Amplitud-frekvensspektrum av /a:/ ~6 Hz Bark/mel - -2 Cepstrumtransform C C2 C3 C4 Cepstrum av /a:/ Talteknologi [ 32 ] 8-6 cepstrumkoefficienter var :e ms + energi + deras :a och 2:a tidsderivator Vanlig parameteruppsättning Cepstrum 2 cepstrumkoefficienter 2 -cepstrumkoefficienter (:a tidsderivata - lutning) 2 -cepstrumkoefficienter (2:a tidsderivata - krökning) Energi energi (ofta normaliserad mot medel/max energi i yttrandet) -energi -energi Sammanlagt = 39 inparametrar för varje spektral mätning var :e ms Talteknologi [ 33 ] Vektorkvantisering (VQ) Transformering från kontinuerliga till diskreta parametrar Automatisk indelning av parameterrymden i ett litet antal (~256) områden. Minimera distorsion i träningsdata Klassa varje tidpunkt av ett yttrande till ett av dessa områden. Hela yttrandet beskrivs som en följd av indextal. Kraftig datareduktion på bekostnad av kvantiseringsdistorsion. 6 khz FFT FFT Spektralanalys Hz Parametrisering Parametrisering Kontinuerlig VQ Klassificering Klassificering Talteknologi [ 34 ] Diskret Ex. enl trajektorien ovan: 2,,,5,5,6,6,6,7

6 Talteknologi [ 35 ] Olika igenkänningsmetoder Artificiella NeuronNät - ANN Mönsterigenkänning (Pattern Recognition) (Äldst) Ingen fonetisk representation Enkel jämförelse av två spektrala tidsserier Kompensation för varierande talhastighet (Dynamisk programmering, DP) Expertsystem (Övergiven i sin direkta form) Fonetikerns kunskap uttryckt i regler för fonetisk klassning Svårt och inflexibelt Artificiella Neurala Nät (ANN) (Bra för fonemklassificering) Huvudsakligen för fonetisk klassning Används i hybridsystem tillsammans med HMM Hidden Markov Models (HMM) (Mest använd) Representerar talets segmentella struktur Sökning med dynamisk programmering (Viterbi-avkodning) Θ N = y f w i x i θ Modell av nervcell i= Talteknologi [ 36 ] Utlager Aktiveringsgrad för varje kategori Dolt lager Inlager Filteramplituder Artificiella neuronnät - exempel Klassificering av fonemkategorier Hybridsystem - ANN/HMM ANN används för att klassificera talsignalen i fonem återkopplade noder ger bättre resultat HMM-system för övrigt Ungefär samma prestanda som enbart HMM, men med en storleksordning färre antal parametrar Talteknologi [ 37 ] Talteknologi [ 38 ] Enkel mönsterigenkänning () Ingen kompensering för olika talhastighet Förenklat exempel: Yttrande analyserat i 32 tidsintervall och 2 parametrar Enkel mönsterigenkänning (2) Distansen mellan yttrandet och ett referensmönster är summan av distanserna för resp. parameter vid varje tidpunkt. 5 5 Referensmönster nr k Okänt yttrande Par 2 Par Par 2 Par Igenkänning: Mät distans för alla referensmönster. < k < K Välj det mönster (k) som ger minst distans mot yttrandet Enkelt lokalt distansmått: d(t) = Ref(Par,t) - Ytt(Par,t) + Ref(Par2,t) - Ytt(Par2,t) Talteknologi [ 39 ] Talteknologi [ 4 ]

7 Talteknologi [ 4 ] Enkel mönsterigenkänning (3) Ackumulerad (global) distans: Par Par D( t) = d( t) + D( t ) = Total distans D(T) Problem: Distansen beror till stor del på tidsavvikelser mellan kurvorna. t i= d( t) Olinjär normalisering av talhastighet Varierande känslighet för olika taltempo Vokaler förlängs mer än konsonanter vid långsamt tal Obetonade stavelser kan försvinna i snabbt och reducerat tal Tidsvarierande töjning behövs Dynamic Time Warping, DTW Problem: mycket stort antal möjliga töjningskurvor Matchning längs varje enskild kurva orimlig För mönsterlängd=32: 5.5 * 22 olika kurvor, varje kurva ca 32 spektrala jämförelser Lösning Utnyttja att många kurvor har delar gemensamma Utför varje spektrumjämförelse bara en gång Metod: Dynamisk Programmering (DP) Antal spektrala jämförelser: 32 2 = 24 Talteknologi [ 42 ] Normalisera för talhastighet Ingen kompensering DP - Dynamisk programmering snabb, optimal kombinering av delbeslut Va jobbaru me Linjär töjning (mappning av ändpunkter) Olinjär töjning, Dynamic Time Warp (DTW) Utförs med dynamisk programmering (DP) Analogi Sök bästa väg mellan två adresser i en stad. Ett mycket stort antal möjliga vägar, men: Vid varje korsning är den bästa fortsättningen oberoende av hur man kom till denna punkt. Endast den bästa vägen hit kan alltså ingå i den totalt bästa vägen. Övriga vägar hit innebär en sämre totalväg och strykes. Antalet sökningar minskas dramatiskt. Vad jobbar du med Talteknologi [ 43 ] Talteknologi [ 44 ] DP-matchning mellan ett okänt yttrande och ett referensmönster Tid (j) Förenklad algoritm: for(i=; i<=i,++i) for(j=; j<=j,++j) D[i,j] = d[i,j] + min(d[i-,j], D[i-,j-], D[i,j-]); return( D[I,J]); Rekursiv formulering av DP Den ackumulerade distansen i en punkt är summan av den lokala distansen och den minsta ackumulerade distansen av de anslutna vägarna. D(I,J) = d(i,j) + min[ D(I,J-), D(I-,J-), D(I-,J)] D(,) = d(,) Tid ( j ) Referensmönster Yttrande Tid (i) I Tid (i) Talteknologi [ 45 ] Talteknologi [ 46 ]

8 Talteknologi [ 47 ] Exempel på DP - textjämförelse Jämförelse mellan textsträngar Sträng A: ALDRIG (korrekt, referens) Sträng B: ALLDRIG (okänt) Frågeställning: Vad är den minimala distansen mellan strängarna efter bästa synkronisering? (Avsåg författaren troligen detta ord? Är det felstavat? I så fall hur?) Lokal distans: d[i,j] = om A[i] = B[j]; annars =. Global distans: D[i,j] = d[i,j] + Min(D[i-,j], D[i-,j-], D[i,j-]) D[,] = d[,] För- och nackdelar med ordmönsterigenkänning + Kräver ej fonetisk beskrivning Lätt för användare att lägga till nya ord + Koartikulation inom ord tas om hand - Koartikulation i ordgräns tas ej om hand - Kräver inläsning av alla ord vid träning - Separat test av varje ord i vokabulären Långsam vid stor vokabulär - Spektralt distansmått olämpligt - Små skillnader kan vara mer betydelsefulla än stora En fonetisk, sannolikhetsbaserad inriktning behövs Talteknologi [ 5 ] Sannolikhetsbaserad igenkänning Bayes regel för betingade sannolikheter P( Ord / Akustik ) = P( Akustik / Ord ) P( Ord ) P( Akustik ) P(Ord/Akustik) är a posteriori sannolikheten för en ordföljd givet den akustiska informationen. P(Akustik/Ord) är sannolikheten att ordföljden genererar den akustiska informationen och beräknas i ett träningsmaterial. P(Ord) ges av språkmodellen och är a priori sannolikheten för ordföljden. P(Akustik) kan ses som en konstant eftersom den är oberoende av ordföljden och kan ignoreras Kombinerar akustisk och språklig kunskap! Talteknologi [ 5 ] Dolda Markovmodeller HMM, Hidden Markov Models From Bourlard & Morgan Connectionist Speech Recognition - A Hybrid Approach 994 Talteknologi [ 52 ] En enkel Markovprocess En Markovprocess är en produktionsprocess processen består av en följd av tillstånd (states) som t ex producerar en följd symboler sannolikheten att gå från ett tillstånd till ett annat benämns övergångssannolikhet. förloppet beror enbart på det aktuella tillståndet, inte på historien Nederbörd Synlig Markovprocess Exempel: Vädret Molnigt a b c Några möjliga sekvenser abc P =.35 abbcccc P =.7 aaabbccccc P =.6 Talteknologi [ 54 ] Soligt Processens tillstånd är direkt observerbart Talteknologi [ 55 ]

9 Talteknologi [ 56 ] Dold (Hidden) Markovprocess Exempel: Vädret betraktat genom en gardin Nederbörd Molnigt Soligt Processens tillstånd är inte direkt observerbar Man kan göra indirekta, relaterade observationer som ljusstyrka, skarpa skuggor, ljud av regndroppar, lyssna på radio, osv. Tre frågor vid HMM-igenkänning Med vilken sannolikhet har modellen genererat observationerna? Igenkänning; välj den modell som ger högst sannolikhet Vilken är den troligaste tillståndssekvensen? Hur bestämmer man modellparametrarna? Inlärning på känt talmaterial Talteknologi [ 57 ] HMM för taligenkänning Talsignalen betraktas som producerad av en HMM som beskrivs av tillstånd representerar ofta fonem eller delar därav övergångssannolikheter mellan tillstånd Alternativa uttal och en enkel modell av segmentdurationer (exponentialfördelning) observationssannolikheter i tillstånd VQ[]:.3 statistiska modeller av talljudens akustik VQ[2]:.6 µ: 27.3 diskreta eller kontinuerliga observationer: VQ[3]:. resp. σ: 4.6 kontinuerlig modell: sammansatt normalfördelning (Gaussian mixture) Snabbare än mönsterigenkänning på grund av sin segmentella struktur Lämplig för användande av statistiska metoder för akustik och språklig information Två algoritmer: Sannolikhetsberäkning att en HMM genererat yttrandet Viterbi: Sannolikheten är produkten av observationssannolikheter och transitionssannolikheter för den bästa tillståndssekvensen ( T ) = p( st st ) p( Ot st ) P O M t= Maximum likelihood (Baum-Welch): Sannolikheten är summan för alla tillåtna tillståndssekvenser Fonemmodeller (ej ord-) Snabbare, vokabuläroberoende Lämplig för stora vokabulärer och kontinuerligt tal Talteknologi [ 58 ] α t N ( t+ s j ) t ( i P( s j si ) + ( j) = P O α ) i= N ( O M ) = P i= α i T ( ) Talteknologi [ 6 ] Representation av allofoner - fonem med varianter (drygt 4 i svenskan) Kontextberoende allofoner trifoner, difoner, monofoner beroende på om båda, ena eller inget av de omgivande allofonerna är bestämd Varje allofon är ofta uppdelad i flera tillstånd beskriver t. ex. initiala, mediala och finala delar. Varje tillstånd bestäms med fördelningar för observationssannolikheter övergångssannolikheter HMM Viterbi-matchning HMM-modell mot ett yttrande Förenklad algoritm för modellen nedan: for(t=; t<=t,++t) for(s=; s<=s,++s) P(t,s) = P(O t S s ) * Max[P(t-,s)*P tr (s s), P(t-,s-)*P tr (s s-), P(t-,s-2)*P tr (s s-2) ]; return( P(T,S)); Talteknologi [ 6 ] Beg Yttrande End Tid Talteknologi [ 62 ]

10 Talteknologi [ 63 ] P(W4 W2) P(W3 W) Igenkänning av ordsekvens med Viterbisökning Bygg en meningsmodell (här:: bigram) av ordmodellerna Samma sökmetod som vid enkla ord (Viterbi) W2 P(W2 W) W P(W W) P(W W2) Tid

Automatisk igenkänning av tal och talare. Automatisk igenkänning av tal. Översikt - taligenkänning. Varför taligenkänning?

Automatisk igenkänning av tal och talare. Automatisk igenkänning av tal. Översikt - taligenkänning. Varför taligenkänning? GSLT Tal- och talarigenkänning M Blomberg 22-9-9 [ ] Automatisk igenkänning av tal och talare DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ Automatisk igenkänning av tal DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ GSLT Tal- och

Läs mer

DP - Dynamisk programmering. Exempel på DP - textjämförelse. För- och nackdelar med ordmönsterigenkänning. Dolda Markovmodeller

DP - Dynamisk programmering. Exempel på DP - textjämförelse. För- och nackdelar med ordmönsterigenkänning. Dolda Markovmodeller GSLT Tal- och talarigenkänning M Blomberg 2002-9-9 [ 31 ] DP - Dynamisk programmering snabb, optimal kombinering av delbeslut $QDORJL Sök bästa väg mellan två adresser i en stad. Ett mycket stort antal

Läs mer

Niklas Lindvall Artificiell intelligens II Ht

Niklas Lindvall Artificiell intelligens II Ht Taligenkänning Hidden Markov Model Niklas Lindvall nikli368@student.liu.se Artificiell intelligens II Ht 2011 2011-09-19 0 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende...

Läs mer

AUTOMATISK IGENKÄNNING AV TAL

AUTOMATISK IGENKÄNNING AV TAL AUTOMATISK IGENKÄNNING AV TAL 1 INLEDNING Mats Blomberg och Kjell Elenius Institutionen för tal, musik och hörsel, KTH 2005 Automatisk igenkänning av tal är ett relativt nytt forskningsfält. De första

Läs mer

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0

Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0 Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens

Läs mer

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez

Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,

Läs mer

AUTOMATISK IGENKÄNNING AV TAL

AUTOMATISK IGENKÄNNING AV TAL AUTOMATISK IGENKÄNNING AV TAL 1 INLEDNING Mats Blomberg och Kjell Elenius Institutionen för tal, musik och hörsel, KTH 2000 Automatisk igenkänning av tal är ett relativt nytt forskningsfält. De första

Läs mer

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska

Läs mer

AI-rapport Speech recognition

AI-rapport Speech recognition AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228

Läs mer

Taligenkänning med fördjupning på Hidden Markov Models

Taligenkänning med fördjupning på Hidden Markov Models IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models 870524-0045 jearu017@student.liu.se Sammanfattning Taligenkänning är en teknik

Läs mer

Litteratur ASR. Taligenkänning Introduktion till taligenkänning. Upplägg taligenkänningsdelen. Dagens litteratur. Varför taligenkänning?

Litteratur ASR. Taligenkänning Introduktion till taligenkänning. Upplägg taligenkänningsdelen. Dagens litteratur. Varför taligenkänning? Litteratur ASR Taligenkänning Introduktion till taligenkänning Talteknologi, VT 2006 Rebecca Jonson Jurafsky & Martin. Kap 5,6,7 + delar fr. andra kapitel (t ex kap 19) Blomberg, M & Elenius, K. Automatisk

Läs mer

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har?

Hur bestämmer man vilka fonem ett språk har? Fonologi. Kommutationstest. Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonem = minsta betydelseskiljande ljudenhet i

Läs mer

HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish

HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish Anders Lundgren Handledare: Jonas Beskow Godkänd:... Examinator:... Rolf Carlson Examensarbete vid institutionen för Tal, Musik

Läs mer

Sampling. Analog - digital. Kvantifiering. Samplingsprocess. Analog vs digital teknik. Kvantifiering. Analog oändlig digital diskret (1or 0or)

Sampling. Analog - digital. Kvantifiering. Samplingsprocess. Analog vs digital teknik. Kvantifiering. Analog oändlig digital diskret (1or 0or) Analog - digital Analog oändlig digital diskret (1or 0or) Digitalt intakt trots kopiering analogt slits och kvaliteten degraderar Sampling Sinuston vågdiagram (AT) antal mätpunkter/samplingspunkter Samplingsfrekvens

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09

Taligenkänning. Hur datorer känner igen talat språk. 729G43 Artificiell Intelligens. Charlie Forsgren, Linköpings Universitet. chafo246 2014-01-09 Taligenkänning Hur datorer känner igen talat språk 729G43 Artificiell Intelligens Charlie Forsgren, chafo246 2014-01-09 Charlie Forsgren Innehållsförteckning Inledning..3 Språk och Ljud 4 Elektronisk Inspelning

Läs mer

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har?

Fonologi. Kommutationstest. Minimala par. Hur bestämmer man vilka fonem ett språk har? Hur bestämmer man vilka fonem ett språk har? Fonologi Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se (Morfem = minsta betydelsebärande enhet i ett språk) Fonem = minsta betydelseskiljande ljudenhet

Läs mer

Artificial)Intelligence) Taligenkänning)

Artificial)Intelligence) Taligenkänning) LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...

Läs mer

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal

Läs mer

Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer

Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer Talperceptionsteorier Passiva stimulusstyrda processer Passiva stimulusstyrda processer Aktiva hypotesstyrda processer Perceptionsteorier Testmetoder Specifik, akustisk information för att identifiera

Läs mer

HörStöd. Taligenkänningsteknik som hjälpmedel för hörselskadade vid telefonsamtal. Mikael Salin. Handledare: Mats Blomberg och Kjell Elenius

HörStöd. Taligenkänningsteknik som hjälpmedel för hörselskadade vid telefonsamtal. Mikael Salin. Handledare: Mats Blomberg och Kjell Elenius HörStöd Taligenkänningsteknik som hjälpmedel för hörselskadade vid telefonsamtal Mikael Salin Handledare: Mats Blomberg och Kjell Elenius Godkänt den... Examinator:... Mats Blomberg Examensarbete i Talteknologi

Läs mer

Språkljudens akustik. Akustik, akustiska elementa och talanalys

Språkljudens akustik. Akustik, akustiska elementa och talanalys Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns

Läs mer

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen

Läs mer

3. Metoder för mätning av hörförmåga

3. Metoder för mätning av hörförmåga 3. Metoder för mätning av hörförmåga Sammanfattning Förekomst och grad av hörselnedsättning kan mätas med flera olika metoder. I kliniskt arbete används oftast tonaudiogram. Andra metoder är taluppfattningstest

Läs mer

Analys/syntes-kodning

Analys/syntes-kodning Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 5 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann

729G43 Artificiell intelligens / Maskininlärning 3. Marco Kuhlmann 729G43 Artificiell intelligens / 2015 Maskininlärning 3 Marco Kuhlmann Förra gången: Perceptroninlärning Beslutsregel predicerat y-värde Exempel: AND Välj parametrar θ 0, θ 1, θ 2 sådana att perceptronen

Läs mer

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 3. Ljudkodning

Läs mer

de var svåra att implementera och var väldigt ineffektiva.

de var svåra att implementera och var väldigt ineffektiva. OBS! För flervalsfrågorna gäller att flera alternativ eller inget alternativ kan vara korrekt. På flervalsfrågorna kan man bara ha rätt eller fel, dvs frågan måste vara helt korrekt besvarad. Totalt kan

Läs mer

Talteknologi introduktion. Hur realistisk var HAL? Dagens situation? Kursupplägg Talteknologikursen. Kurskrav

Talteknologi introduktion. Hur realistisk var HAL? Dagens situation? Kursupplägg Talteknologikursen. Kurskrav Talteknologi introduktion Rebecca Jonson Doktorand i Språkteknologi (GSLT, Lingvistik Gbg) AAST-kursen VT 2007 Computers are getting smarter all the time; scientists tell us that soon they will be able

Läs mer

Örat. Johnson, Kap 3. Basic audition

Örat. Johnson, Kap 3. Basic audition Det här kapitlet handlar om det man brukar kalla det perifera hörselsystemet och lite om hur processningen på den nivån ser ut och vilka skalor som bäst kan beskriva detta. Så låt oss då först bara påminna

Läs mer

Föreläsning 10: Ljudkodning ( Audio Coding )

Föreläsning 10: Ljudkodning ( Audio Coding ) Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 1. Ljudkodning

Läs mer

Har (förändringar i) klimat eller markanvändning störst betydelse för ändringen i höga flöden?

Har (förändringar i) klimat eller markanvändning störst betydelse för ändringen i höga flöden? Har (förändringar i) klimat eller markanvändning störst betydelse för ändringen i höga flöden? Anna Åkesson, KTH med bidrag från Anders Wörman, Joakim Riml och Jan Seibert Bakgrund, mitt doktorandprojekt

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik

Läs mer

Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden-

Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden- Analogt och Digital Bertil Larsson Viktor Öwall Analoga och Digitala Signaler Analogt Digitalt 001100101010100000111110000100101010001011100010001000100 t Analogt kontra Digitalt Analogt få komponenter

Läs mer

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten KÄLLA-FILTER Repetition - Repetition av resonans och filter Komplexa ljudvågor: deltoner Amplitudspektrum - Talapparaten som resonator - Talapparaten som källa-filtersystem - Spektrum, Spektrogram, spektrograf

Läs mer

Nya analys(- och insamlings)metoder i talforskning och talteknologisk forskning. Jens Edlund KTH Tal, Musik och Hörsel

Nya analys(- och insamlings)metoder i talforskning och talteknologisk forskning. Jens Edlund KTH Tal, Musik och Hörsel Nya analys(- och insamlings)metoder i talforskning och talteknologisk forskning Jens Edlund KTH Tal, Musik och Hörsel Om mig Arbetar som forskare på KTH Tal, Musik och Hörsel Lingvistik, fonetik, datorlingvistik

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn UMU-14401 Spanish A1 Datum Material Sammanfattning Kursexaminator Betygsgränser Tentamenspoäng Övrig kommentar Innehåller frågor/ begrepp med svar

Läs mer

Digital signalbehandling Digitalt Ljud

Digital signalbehandling Digitalt Ljud Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1

Läs mer

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Den laborationen har syften: dels att visa lite hur den snabba Fouriertransformen fungerar, och lite om vad man den an dels att

Läs mer

Dagens lektion. Dagens Litteratur. WER: Human vs machines. Taligenkänning mskiner/mskor. Mänsklig igenkänning Talteknologi och DialogSystem

Dagens lektion. Dagens Litteratur. WER: Human vs machines. Taligenkänning mskiner/mskor. Mänsklig igenkänning Talteknologi och DialogSystem Dagens lektion Mänsklig igenkänning Talteknologi och DialogSystem Talteknologi, VT 2006 Rebecca Jonson Mänsklig taligenkännning Talteknologi och Dialogsystem Demos! Kurssammandrag Labgenomgång Frågestund

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk

Läs mer

Signalanalys med snabb Fouriertransform

Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, MVE030 Signalanalys med snabb Fouriertransform Den här laborationen har två syften: dels att visa lite på hur den snabba Fouriertransformen fungerar, och lite om vad man bör

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Artificiell Intelligens Lektion 7

Artificiell Intelligens Lektion 7 Laboration 6 Artificiell Intelligens Lektion 7 Neurala nätverk (Lab 6) Probabilistiska resonemang Vad? Mönsterigenkänning Lära ett neuralt nätverk att känna igen siffror Varför? Få ökad förståelse för

Läs mer

Ulrik Söderström 20 Jan Signaler & Signalanalys

Ulrik Söderström 20 Jan Signaler & Signalanalys Ulrik Söderström ulrik.soderstrom@tfe.umu.se 20 Jan 2009 Signaler & Signalanalys Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt

Läs mer

Ulrik Söderström 19 Jan Signalanalys

Ulrik Söderström 19 Jan Signalanalys Ulrik Söderström ulrik.soderstrom@tfe.umu.se 9 Jan 200 Signaler & Signalanalys l Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt

Läs mer

Akustiska Elementa och Digital Signalbehandling

Akustiska Elementa och Digital Signalbehandling Akustiska Elementa och Digital Signalbehandling Rebecca Jonson Talteknologikursen VT2005 Akustisk behandling av tal Inom talteknologi vill vi producera och analysera tal vilket kräver kunskap om talproduktion

Läs mer

CARLOS GALDO TEDDY CHAVEZ KTH SKOLAN FÖR KEMI, BIOTEKNOLOGI OCH HÄLSA

CARLOS GALDO TEDDY CHAVEZ KTH SKOLAN FÖR KEMI, BIOTEKNOLOGI OCH HÄLSA EXAMENSARBETE INOM DATATEKNIK, GRUNDNIVÅ, 15 HP STOCKHOLM, SVERIGE 2018 Prototyputveckling för skalbar motor med förståelse för naturligt språk Prototype development for a scalable engine with natural

Läs mer

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik

Läs mer

Grundläggande ljud- och musikteori

Grundläggande ljud- och musikteori Grundläggande ljud- och musikteori Jan Thim Magnus Eriksson Lektionens syfte Syftet med denna lektion är är att att ge ge förståelse för för decibelbegreppet, spektrum, digitalisering och och olika olika

Läs mer

Enlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät

Enlagersnät Flerlagersnät Generalisering. Artificiella Neuronnät Artificiella Neuronnät 1 Karaktäristiska egenskaper Användningsområden Klassiska exempel Biologisk bakgrund 2 Begränsningar Träning av enlagersnät 3 Möjliga avbildningar Backprop algoritmen Praktiska problem

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

FOURIERANALYS En kort introduktion

FOURIERANALYS En kort introduktion FOURIERAALYS En kort introduktion Kurt Hansson 2009 Innehåll 1 Signalanalys 2 2 Periodiska signaler 2 3 En komplex) skalärprodukt 4 4 Fourierkoefficienter 4 5 Sampling 5 5.1 Shannon s teorem.................................

Läs mer

foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8

foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8 Facit till övning 1 foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8 Några problem: 1) lång resp. kort variant av en vokal, är de

Läs mer

Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter

Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning

Läs mer

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016

Exempel ode45 parametrar Miniprojekt 1 Rapport. Problemlösning. Anastasia Kruchinina. Uppsala Universitet. Januari 2016 Problemlösning Anastasia Kruchinina Uppsala Universitet Januari 2016 Anastasia Kruchinina Problemlösning 1 / 16 Exempel ode45 parametrar Miniprojekt 1 Rapport Anastasia Kruchinina Problemlösning 2 / 16

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Flerdimensionell signalbehandling SMS022

Flerdimensionell signalbehandling SMS022 Luleå tekniska universitet Avd för signalbehandling Frank Sjöberg Flerdimensionell signalbehandling SMS022 Laboration 4 Array Processing Syfte: Syftet med den här laborationen är att få grundläggande förståelese

Läs mer

Hur kan man mäta hörsel? Ann-Christin Johnson Karolinska Institutet, Stockholm, Sverige

Hur kan man mäta hörsel? Ann-Christin Johnson Karolinska Institutet, Stockholm, Sverige Hur kan man mäta hörsel? Ann-Christin Johnson Karolinska Institutet, Stockholm, Sverige Ljudstyrka mäts i decibel (db) Några exempel Stor risk för hörselskada Risk för hörselskada Svårt att uppfatta tal

Läs mer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning? När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns

Läs mer

Prosodi. Talets rytm och melodi I. Prosodi. Stavelser. Prosodi. Stavelser. Stavelser

Prosodi. Talets rytm och melodi I. Prosodi. Stavelser. Prosodi. Stavelser. Stavelser Prosodi Prosodi Talets rytm och melodi I Inom såväl fonologin som fonetiken brukar man göra en uppdelning mellan det segmentella och det som man ibland kallar det suprasegmentella. Med suprasegmentell

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Föreläsning 8: Konfidensintervall

Föreläsning 8: Konfidensintervall Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga

Läs mer

SIGNALANALYS I FREKVENSRUMMET

SIGNALANALYS I FREKVENSRUMMET SIGNALANALYS I FREKVENSRUMMET Fourierserie och Fouriertransform Föreläsning 4 Mätsystem och Mätmetoder, HT-2016 Florian Schmidt Department of Applied Physics and Electronics Umeå University LECTURE OUTLINE

Läs mer

Lärmål Sannolikhet, statistik och risk 2015

Lärmål Sannolikhet, statistik och risk 2015 Lärmål Sannolikhet, statistik och risk 2015 Johan Jonasson Februari 2016 Följande begrepp och metoder ska behärskas väl, kunna förklaras och tillämpas. Direkta bevis av satser från kursen kommer inte på

Läs mer

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Kodning av tal Kodning av musik MPEG-4 Audio toolbox Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder

Läs mer

Kodning av tal Kodning av musik MPEG-4 Audio toolbox

Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Anmälan till EY1B13 Kontrastiv engelska för lärare (Contrastive English for Teachers) 7,5 hp vårterminen 2011.

Anmälan till EY1B13 Kontrastiv engelska för lärare (Contrastive English for Teachers) 7,5 hp vårterminen 2011. Institutionen för Språk och litteraturer Anmälan till EY1B13 Kontrastiv engelska för lärare (Contrastive English for Teachers) 7,5 hp vårterminen 2011. Personnummer Efternamn Förnamn Adress Postnummer

Läs mer

Frekvensplanet och Bode-diagram. Frekvensanalys

Frekvensplanet och Bode-diagram. Frekvensanalys Frekvensplanet och Bode-diagram Frekvensanalys Signaler Allt inom elektronik går ut på att manipulera signaler genom signalbehandling (Signal Processing). Analog signalbehandling Kretsteori: Nod-analys,

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Digital behandling av tal. Litteratur till dagens lektion. Talproduktion. Akustisk Fonetik. Akustiska Elementa och Digital Signalbehandling

Digital behandling av tal. Litteratur till dagens lektion. Talproduktion. Akustisk Fonetik. Akustiska Elementa och Digital Signalbehandling Digital behandling av tal Akustiska Elementa och Digital Signalbehandling Rebecca Jonson Talteknologikursen VT2007 Inom talteknologi vill vi producera och analysera tal vilket kräver kunskap om talproduktion

Läs mer

Artificiella Neuronnät

Artificiella Neuronnät Artificiella Neuronnät 2 3 4 2 (ANN) Inspirerade av hur nervsystemet fungerar Parallell bearbetning Vi begränsar oss här till en typ av ANN: Framåtkopplade nät med lagerstruktur 3 4 Fungerar i princip

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Bilaga A, Akustiska begrepp

Bilaga A, Akustiska begrepp (5), Akustiska begrepp Beskrivning av ljud Ljud som vi hör med örat är tryckvariationer i luften. Ljudet beskrivs av dess styrka (ljudtrycksnivå), dess frekvenssammansättning och dess varaktighet. Ljudtrycksnivå

Läs mer

! Susanne Schötz! ! akustisk-fonetisk analys! ! grupparbete!! om vi hinner: introduktion till Praat (kort demo)!

! Susanne Schötz! ! akustisk-fonetisk analys! ! grupparbete!! om vi hinner: introduktion till Praat (kort demo)! Introduktion till akustisk analys (av tal)!! akustiska elementa!! akustisk analys!! grupparbete: akustisk analys!! om hinner: introduktion till Praat!! mina bilder finns att ladda ner här: http://person2.sol.lu.se/susanneschotz/teaching_files/intro_ak.pdf!

Läs mer

Elektronik. Dataomvandlare

Elektronik. Dataomvandlare Elektronik Dataomvandlare Johan Wernehag Institutionen för elektro- och informationsteknik Lunds universitet 2 Översikt Analoga och digitala signaler Nyquistteorem Kvantiseringsfel i analog-till-digital

Läs mer

Kurslitteratur Taltranskription: Introduktion

Kurslitteratur Taltranskription: Introduktion Kurslitteratur Taltranskription: Introduktion Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Köp: Lindblad, P. (2005). Taltranskription. Kompendium. Lingvistik, Lunds universitet. Låna: IPA,

Läs mer

Vad är spektralanalys? Spektralanalys. Frekvensinnehåll. Enkelt exempel

Vad är spektralanalys? Spektralanalys. Frekvensinnehåll. Enkelt exempel Vad är spektralanalys? Analys av frekvensinnehållet i en tidsserie/signal. Spektralanalys Erik Gudmundson Vad innebär Analys av frekvensinnehållet? Vad är en tidsserie/signal? Tidsserie: mätning av någon

Läs mer

DT1120 Spektrala transformer för Media Tentamen

DT1120 Spektrala transformer för Media Tentamen DT Spektrala transformer för Media Tentamen 77 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: 3:9 p, 4: 3 p, 5: 7 p Tillåtna hjälpmedel: räknare,

Läs mer

Grundläggande signalbehandling

Grundläggande signalbehandling Beskrivning av en enkel signal Sinussignal (Alla andra typer av signaler och ljud kan skapas genom att sätta samman sinussignaler med olika frekvens, Amplitud och fasvridning) Periodtid T y t U Amplitud

Läs mer

Markovkedjor. Patrik Zetterberg. 8 januari 2013

Markovkedjor. Patrik Zetterberg. 8 januari 2013 Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)

Läs mer

Statistisk mönsterigenkänning

Statistisk mönsterigenkänning Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning

Läs mer

Prestanda och skalbarhet

Prestanda och skalbarhet Prestanda och skalbarhet Grama et al. Introduction to Parallel Computing Kapitel 5 Erik Elmroth Översikt 2 Exekveringstid Uppsnabbning Effektivitet Kostnad Kostnadsoptimal algoritm Ahmdals lag Gustafson-Barsis

Läs mer

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Tillåtna hjälpmedel: Valfri miniräknare (utan möjlighet till trådlös kommunkation). Valfri litteratur, inkl. kursböcker, formelsamlingar.

Läs mer

Neurolingvistik - Grammatik

Neurolingvistik - Grammatik Neurolingvistik - Grammatik Innehåll Grammatik-störningar vid afasi: syndrom, agrammatism och paragrammatism Verbets roll Morfologi - forskning och resultat från olika språk 3 teorier om agrammatism -

Läs mer

Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet?

Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet? Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet? 1 Om svaret på frågan är ja så öppnar sig möjligheten att skapa en generell verktygslåda som fungerar för analys och manipulering

Läs mer

Dagens föreläsning (F15)

Dagens föreläsning (F15) Dagens föreläsning (F15) Problemlösning med datorer Carl-Mikael Zetterling bellman@kth.se KP2+EKM http://www.ict.kth.se/courses/2b1116/ 1 Innehåll Programmering i Matlab kap 5 EKM Mer om labben bla Deluppgift

Läs mer

Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering?

Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering? Kap 2: Typologi Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering? Orden skulle bli mycket långa för att varje morfem skulle ha sin egen vokalisering, eftersom det behövs så

Läs mer

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,

Läs mer

Svängningar och frekvenser

Svängningar och frekvenser Svängningar och frekvenser Vågekvationen för böjvågor Vågekvationen för böjvågor i balkar såväl som plattor härleds med hjälp av elastiska linjens ekvation. Den skiljer sig från de ovanstående genom att

Läs mer

TEKNISKA HÖGSKOLAN I LULEÅ Ämneskod SMS016 Systemteknik Tentamensdatum Avd för Signalbehandling Skrivtid

TEKNISKA HÖGSKOLAN I LULEÅ Ämneskod SMS016 Systemteknik Tentamensdatum Avd för Signalbehandling Skrivtid TEKNISKA HÖGSKOLAN I LULEÅ Ämneskod SMS016 Systemteknik Tentamensdatum 1996-04-11 Avd för Signalbehandling Skrivtid 9.00-13.00 Tentamen i Kommunikationsteori Antal uppgifter: 5 (5 poäng per uppgift) Lärare:

Läs mer

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den. Psykoakustik Ljudtrycksnivå Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det

Läs mer

TSRT62 Modellbygge & Simulering

TSRT62 Modellbygge & Simulering TSRT62 Modellbygge & Simulering Föreläsning 4 Christian Lyzell Avdelningen för Reglerteknik Institutionen för Systemteknik Linköpings Universitet C. Lyzell (LiTH) TSRT62 Modellbygge & Simulering 2013 1

Läs mer

Text-till-Talsyntes (TTS2)

Text-till-Talsyntes (TTS2) Text-till-Talsyntes (TTS2) Rebecca Jonson TalTeknologikursen VT 2005 Dagens lektion Lite mer om prosodisk frasering Svar på frågan om svenska sammansättningar Några exempel på system Talsyntes Formant

Läs mer

2 Laborationsutrustning

2 Laborationsutrustning Institutionen för data- och elektroteknik 2002-02-11 1 Inledning Denna laboration syftar till att illustrera ett antal grundbegrepp inom digital signalbehandling samt att närmare studera frekvensanalys

Läs mer

Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen.

Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen. Elektronik - digital signalbehandling Föreläsning: Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2010-10-01 1 2008-10-06 Elektronik - digital

Läs mer