Text-till-Talsyntes (TTS2)
|
|
- David Blomqvist
- för 7 år sedan
- Visningar:
Transkript
1 Text-till-Talsyntes (TTS2) Rebecca Jonson TalTeknologikursen VT 2005 Dagens lektion Lite mer om prosodisk frasering Svar på frågan om svenska sammansättningar Några exempel på system Talsyntes Formant syntes Användningsområden Ev. Talande huvuden Litteratur Festival Kapitel 7 Dutoit, T. A Short Introduction to Text-to- Speech Synthesis 2.2 Donovan RE. Trainable Speech Synthesis. PhD thesis, Cambridge University kap 1.5, 1.6, 1.7 Jurafsky Kap 7.8 Kommersiella och forskningstalsyntessystem APPLE (testa till på fredag!) L&H Scansoft (Realspeak) Bell labs (Lucent?) Acapela (Elan + Babil) Infovox IBM AT&T Festival (toolkit) FreeTTS Rhetorical Microsoft TTS Whistler Se kurshemsidan TTS på olika språk Arabiska Acapela (Babil), Mbrola, SakhrSoftware m.m Polska Scansoft, Acapela Kinesiska (Mandarin) Scansoft, Bell Labs, Loquendo, CHATR Hebreiska Milango (dock ej type and talk), Mbrola Ryska Scansoft, Bell Labs, Proverbe m.m (mängder!) Thailändska Ingen demo på nätet. NecTec har byggt ett system som heter Vaja. Fler språk? Delar i ett TTS-system Textbehandling Lingvistisk behandling Talsyntes NLP DSP
2 Talsyntes När texten analyserats och behandlats och delats upp i segment + tilldelats prosodiska parametrar ska en vågform genereras utifrån dessa, tal ska syntetiseras. Input: hierarkisk struktur av texten, med en sträng av fonem annoterade med betoning, duration, tonhöjd och intonation. Output: syntetiserat tal De finns flera olika talsyntesmetoder nts.html En tur bland historiens talsynteser Typer av talsynteser Regelbaserad syntes (parametrisk syntes) Tal produceras med matematiska regler som beskriver fonem och hur de påverkar varandra Modellering av människans talproduktion Formantsyntes/Parametrisk syntes Modellering av resulterande talsignal Signal till digitalt filter som är baserat på resonanser liknande formanter i talapparaten. Datadriven syntes Sätter ihop bitar av inspelat mänskligt tal till nya talproduktioner Ingen kunskap om mänsklig talproduktion Indelning talsyntesmetoder Systemmodellering (modellerar talorganet och dess processer) Signalmodellering(modellerar talsignalen) Parametrisk syntes, formantsyntes Artikulatorisk syntes Produktion av tal genom att modellera den mänskliga talproduktionen. Fysiska modeller av talorganens rörelser Skapar virtuella talorgan: lungor, stämband, munhåla, tunga, tandvall, läppar och luftström mm Beräknar artikulatoriska parametrar med hjälp av tubmodeller, 2D eller 3D modeller för att kontrollera dessa Regelskrivning för fonem och motsvarande artikulationsposition Forts. Art Syntes Exempel på Artikulatoriska parametrar Läpprundning Käköppning Tungplacering Tungkropp Tungspets Velum Olika för olika modeller Forskning: Haskins lab, KTH Univ Köln m,m Exempel Artikulatorisk syntes Haskins lab Casy DAVO
3 Formantsyntes Försök till imitation av talsignalen med källa-filter metod P(f) = S(f) * T(f)* R(f) Källa Filter Radiation Generar ljudkälla (ton el. brus) F0 (grundton),aspiration,frikation, amplitud Talapparatens filter motsvaras av ett flertal (>3) resonanser (liknande formanterna i naturligt tal) Formantfrekvenser (F1-F5), bandvidder,nasalitet,amplituder Input är foner och prosodiparametrar som ska matchas med regler ur en databas En mängd regler används för att bestämma vilka parametrar som behövs för syntetisera ett yttrande med formantsyntesen. Forts. formantsyntes De fördefinierade reglerna används för att bestämma en fonemsträngs motsvarande parametervärden för grundton, formantfrekvenser, bandvidd etc. Ex: regel för att bestämma vilken allofon som passar bäst i kontexten. Reglerna skrivs för hand utifrån taldata eller extraheras ur träningsdata automatiskt. Förutom det digitala filtret med resonanser så måste man ta hänsyn till den glottala vågformen och radiation med extra filter. OVE var en formantsyntes formant.exe Exempel DecTalk (Klatt, 1983) Konkateneringssyntes Dixon and Maxey tidig konkatenering Uppdelning av inspelat mänskligt tal i ljudsegment som lagras och sedan vid syntes väljs ut och konkateneras (sammanfogas). Klipp å klistra Segmenten kan delas upp i: Fraser, Ord, stavelser, difoner, polyfoner, foner Segmenten lagras i taldatabas (speech-base) Återanvändning av talsegmenten: Signalbehandling för att ändra F0 och durationer samt jämna ut sammanfogningarna (smoothing) s å att bitarna passar bättre ihop Exempel (Bell labs) Wavesurfer Val av typ av segment Vi behöver ett segment som är stabilt i sina gränser så att segmenten kan sättas ihop utan större diskontinuiteter Segmenten bör inte vara för många Minnesutrymme/lagring Sökyta Segmenten ska fånga så mycket koartikulation som möjligt så att svåra transitioner ligger inne i segmenten Längre vs. kortare segment Längre behåller mer naturlighet (mer koartikulation bevaras bättre kvalitet), mindre skarvar Längre kan leda till orimligt många segment (t ex ord) System kan antingen bara använda en typ av segment eller blanda olika storlekar (non-uniform)
4 Ord & Fraser Fungerar i tillämpningar med liten vokabulär Bärfras med luckor som fylls i med förinspelade bitar (eller syntes av den delen) Telefonnumret är Låter naturligt (i stort sett uppspelat inspelat tal) Behåller koartikulation inom ord men sammanfogning mellan lucka och bärfras kan ge hack. Fungerar inte för större tillämpningar (databas och inspelningsbegränsningar) och inte i som text-till-talsyntes (godtycklig text, nya ord) Ord påverkas av sin kontext och vart i meningen de står (skulle få spela in flera varianter av ord) Stavelser Naturlighet p g a koartikulationen inom enheten bibehålls men koartikulationen mellan enheterna också viktig och måste lösas 10,000 stavelser i engelska (krävande inspelning och lagring) Halv-stavelser (Demi-syllables) 1000 i Eng (möjlig inspelning och lagring) Behåller hög koartikulation och konsonantkluster Koartikulation mellan delar fortfarande problem Vanligt för talsyntes av asiatiska språk Fonem Fonem segmenterar fonemens s k steady states, dvs del med minst variation Få delar att spela in och lagra Bad idea! Fonem påverkas av sin kontext /k/ i kille ej som /k/ i Kalle Koartikulationen (övergångarna) mellan talljud viktigare and steadystates Konkateneringen sker på de minst stabila delarna (övergångarna) Difoner T A L _T TA AL L_ Difon = Talsegment som sträcker sig ung. från sista halvan av ett fonem ( steady state ) till första halvan av följande Segmenten sätts ihop i sina steadystates vilket leder till mindre hack och naturligare övergångar i ett språk (rimligt att spela in och lagra) Segmentering av difoner(manuellt eller med segmenteringsalgoritmer (eftercheckning krävs!)) Kan kombineras med vanliga konsonantkluster och trifoner Segmentdatabas Vanligast används difoner (trade-off mellan naturlighet och antal), men även trifoner (t ex konsonantkluster) Inspelning Ofta flera timmars lång inspelning! Hitta en bra röst! Tålmodig person ;) Bra inspelningstudio (mikrofonläge, tystnad etc) Läser upp nonsensord/riktiga ord som fångar alla difonerna. Om nonsensord = 1500 ord!! Segmentering av inspelningen i difoner/n-foner. Manuellt (tar lång tid, mänsklig felfaktor) Automatiskt (snabbare, tillförlitligt?) Lagring (som de är eller bara parametrar) Välja segment ur databasen Första steget i konkateneringssyntesen är att välja ut segmenten (t ex difonerna) som ska bygga upp yttrandet som matchar input till talsyntesen (fonetisk transkription + prosodiska parametrar) För att välja segment behövs olika sökmetoder för att hitta dem i databasen och välja rätt segment (de kan t ex finnas flera varianter av samma difon som skiljer sig prosodiskt). Nästa steg är att återsyntetisera segmenten och anpassa dem till varann (samma styrka, pitch etc.). Mer om detta på fredag
5 Användningsområden för TTS Handikapphjälpmedel Telefontjänster Uppläsning av information från databaser , fax, sms Multimedia Talande böcker och leksaker Interaktiva spel Språkinlärning Där talande meddelanden är mer effektiva än text olika kontrollsystem, PDA, i bil Människa-datorinteraktion (Dialogsystem) Talande lexikon/parlör Talande översättningssystem Forskning (lingvister och fonetiker) Upprepade experiment Studera tal i termer av akustiska regler Handikapphjälpmedel Speech/Sight impairment OCR (optical character recognition)+tts Läser av en text med scanner Läser sedan upp för blinda Talproteser Ett smart keyboard låter användaren skriva/trycka/välja det han vill få sagt Bliss TTS Egen röst för personlighet Teleface/Synface (KTH) Talande huvud som synkroniserar med röst för hörselskadade per telefon Talande huvuden Animerade agenter som artikulerar synkront med talsyntes/msk röst. Bättre förståelse av talsyntes Ickeverbal kommunikation Indikerar betoning, fokus, turtagning, ickeverbal feedback KTH August Strindberg Rutger Univ: RUTH Ananova: Virtuellt nyhetsankare
Text-till-Talsyntes (TTS1)
Text-till-Talsyntes (TTS1) Jonas Lindh TalTeknologi HT 2007 Dagens lektion: Vad är TTS? Delarna i ett TTS-system Lingvistisk behandling Talsyntesmetoder Litteratur TTS1 Donovan RE. Trainable Speech Synthesis.
Läs merText-till-Talsyntes (TTS3)
Dagens lektion: Text-till-Talsyntes (TTS3) Rebecca Jonson TalTeknologikursen VT 2005 Talsyntes Forts. Konkateneringssyntes Återsyntes LPC, PSOLA, MBROLA Jämförelse syntesmetoder Artik, Formant, Konkat
Läs merTalteknologi introduktion. Hur realistisk var HAL? Dagens situation? Kursupplägg Talteknologikursen. Kurskrav
Talteknologi introduktion Rebecca Jonson Doktorand i Språkteknologi (GSLT, Lingvistik Gbg) AAST-kursen VT 2007 Computers are getting smarter all the time; scientists tell us that soon they will be able
Läs merHMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish
HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish Anders Lundgren Handledare: Jonas Beskow Godkänd:... Examinator:... Rolf Carlson Examensarbete vid institutionen för Tal, Musik
Läs merOfelia en ny syntesröst
Ofelia en ny syntesröst En studie om talsyntes i allmänhet och konkateneringssyntes i synnerhet Adina Svensson D-uppsats i datalingvistik Handledare: Johan Frid Institutionen för Lingvistik Lunds universitet
Läs merText-till-Talsyntes (TTS1)
Text-till-Talsyntes (TTS1) Rebecca Jonson TalTeknologikursen VT 2006 Dagens lektion: Vad är TTS? Delarna i ett TTS-system Textbehandling Lingvistisk behandling Litteratur TTS1 Donovan RE. Trainable Speech
Läs merPerception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag
Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska
Läs merIdag. Tillägg i schemat. Segmenteringsproblemet. Transkription
Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen
Läs merSpråkljudens akustik. Akustik, akustiska elementa och talanalys
Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns
Läs merWebbföreläsning på kurser i Göteborg, Lund och Uppsala
Webbföreläsning på kurser i Göteborg, Lund och Uppsala Introduktion till talteknologi Johan Frid (johan.frid@ling.lu.se) 1 Talteknologi Handlar om talet som gränssnitt för datoranvändning Tillämpningar
Läs merDatadriven formantsyntes
TT Centrum för talteknologi Centrum för talteknologi Datadriven formantsyntes Arvid Sjölander 2001 Examensarbete vid Instutionen för tal, musik och hörsel Handledare: Rolf Carlson 2 Abstract This report
Läs merAnalys/syntes-kodning
Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk
Läs merTalsyntes historia och metoder
Introduktion till språkteknologi oktober 2008 Talsyntes historia och metoder Mats Dahllöf (presentation efter Pétur Helgason) 1 Text-till-talsystem grundstenarna Alla text-till-talsystem är datorbaserade
Läs merDagens lektion. Dagens Litteratur. WER: Human vs machines. Taligenkänning mskiner/mskor. Mänsklig igenkänning Talteknologi och DialogSystem
Dagens lektion Mänsklig igenkänning Talteknologi och DialogSystem Talteknologi, VT 2006 Rebecca Jonson Mänsklig taligenkännning Talteknologi och Dialogsystem Demos! Kurssammandrag Labgenomgång Frågestund
Läs merUtvärdering av några text-till-talomvandlare
Utvärdering av några text-till-talomvandlare som läshjälpmedel Malin Persson malinp@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Uppsala universitet Institutionen för Lingvistik
Läs merBilaga 4: Tidsuppskattning. Wikispeech. en användargenererad talsyntes på Wikipedia
Bilaga 4: Tidsuppskattning Wikispeech en användargenererad talsyntes på Wikipedia Process Steg Egenskap Typ [1] Estimated (h) Vem? Summa Sum Walk Skel 545 Sum walking skeleton to 1224 Uppläsning 1 Navigering
Läs merKÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten
KÄLLA-FILTER Repetition - Repetition av resonans och filter Komplexa ljudvågor: deltoner Amplitudspektrum - Talapparaten som resonator - Talapparaten som källa-filtersystem - Spektrum, Spektrogram, spektrograf
Läs merTor Sigvardson. Handledare: Rolf Carlson. Godkänt den 11 december 2002
Datadrivna metoder för parametersyntes beskrivning av ett system och experiment med CART-analys Tor Sigvardson Handledare: Rolf Carlson Godkänt den 11 december 2002 Examinator: Rolf Carlson... (underskrift)
Läs merDenna presentation. 1. Introduktion. Olika områden. Introduktion (1) Introduktion (2) Vad är språk? Vad är språkteknologi?
Språkteknologi En Introduktion Denna presentation Vad är språk? Robert Eklund robert@roberteklund.info http://roberteklund.info Vad är språkteknologi? Vad är språkteknologins delområden Universitetslektor
Läs merProsodi. Talets rytm och melodi I. Prosodi. Stavelser. Prosodi. Stavelser. Stavelser
Prosodi Prosodi Talets rytm och melodi I Inom såväl fonologin som fonetiken brukar man göra en uppdelning mellan det segmentella och det som man ibland kallar det suprasegmentella. Med suprasegmentell
Läs merBilaga 5: Nytt språk svenska. Wikispeech. en användargenererad talsyntes på Wikipedia
Bilaga 5: Nytt språk svenska Wikispeech en användargenererad talsyntes på Wikipedia Innehållsförteckning Innehållsförteckning Introduktion Nyckel: 1 Intresse 2 Identifiera existerande resurser 3 API anpassningar
Läs merLjud och interaktion. Kirsten Rassmus-Gröhn, Avd. för Rehabiliteringsteknik, Inst. för Designvetenskaper
Ljud och interaktion Innehåll och mål Om ljud och hörsel Om ljudinteraktion Lite om virtuellt 3D-ljud Tips och trix Mål: att ni ska få verktyg att resonera om ljudinteraktion, samt få lite exempel Ljudet
Läs merFormantextraktion för datadriven formantsyntes
Formantextraktion för datadriven formantsyntes David Öhlin Handledare: Rolf Carlson Godkänt: 2004-01-19 Examinator: Rolf Carlson Centrum för talteknologi......................... (signatur) Examensarbete
Läs merAutomatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning
Läs merArtificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez
Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,
Läs merLjudinteraktion. Kirsten Rassmus-Gröhn, Avd. för Rehabiliteringsteknik, Inst. för Designvetenskaper
Ljudinteraktion Innehåll och mål Om ljudinteraktion Lite om virtuellt 3D-ljud Tips och trix Mål: att ni ska få verktyg att resonera om ljudinteraktion, samt få lite exempel Vad är ljud? Ljud är kombinationen
Läs merNaturligt Språk-Generering (NLG), Text-till-Talsyntes (TTS) och prosodi, i dialogsystem. Stina Ericsson, Talteknologi VT06.
Talteknologi (AAST) 1 mars 2006 1 Talteknologi (AAST) 1 mars 2006 2 Naturligt Språk-Generering (NLG), Text-till-Talsyntes (TTS) och prosodi, i dialogsystem Problemet Föreställ dig ett dialogsystem som
Läs merDigital signalbehandling Digitalt Ljud
Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1
Läs merI. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler
Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Kodning av tal Kodning av musik MPEG-4 Audio toolbox Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder
Läs merKodning av tal Kodning av musik MPEG-4 Audio toolbox
Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder
Läs merVocoding och frekvensskiftningsexperiment inom det audiologiska forskningsfältet Av Morgan Karlsson
Vocoding och frekvensskiftningsexperiment inom det audiologiska forskningsfältet Av Morgan Karlsson Vocoding Några av de första försöken att återskapa tal elektroniskt gjordes på 30-talet av fysikern Homer
Läs merLitteratur ASR. Taligenkänning Introduktion till taligenkänning. Upplägg taligenkänningsdelen. Dagens litteratur. Varför taligenkänning?
Litteratur ASR Taligenkänning Introduktion till taligenkänning Talteknologi, VT 2006 Rebecca Jonson Jurafsky & Martin. Kap 5,6,7 + delar fr. andra kapitel (t ex kap 19) Blomberg, M & Elenius, K. Automatisk
Läs merDigital behandling av tal. Litteratur till dagens lektion. Talproduktion. Akustisk Fonetik. Akustiska Elementa och Digital Signalbehandling
Digital behandling av tal Akustiska Elementa och Digital Signalbehandling Rebecca Jonson Talteknologikursen VT2007 Inom talteknologi vill vi producera och analysera tal vilket kräver kunskap om talproduktion
Läs merFonembegreppet 2011-02-22
Fonembegreppet 2011-02-22 Hur tillägnar sig ett barn språkets ljudsystem? Är språket medfött? Ett specifikt språk (som svenska, t.ex.) är förstås inte medfött. Även om man tror att språkinlärningsförmågan
Läs merRysk fonetik 5 hp föreläsning II. Institutionen för moderna språk Karine Åkerman Sarkisian Ryska A
Rysk fonetik 5 hp föreläsning II Institutionen för moderna språk Karine Åkerman Sarkisian Ryska A Talproduktion Alla språkljud kan ses som produkten av en ljudkälla och ett filter. Tal sker i regel på
Läs merKurslitteratur Taltranskription: Introduktion
Kurslitteratur Taltranskription: Introduktion Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Köp: Lindblad, P. (2005). Taltranskription. Kompendium. Lingvistik, Lunds universitet. Låna: IPA,
Läs merPassiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer
Talperceptionsteorier Passiva stimulusstyrda processer Passiva stimulusstyrda processer Aktiva hypotesstyrda processer Perceptionsteorier Testmetoder Specifik, akustisk information för att identifiera
Läs merRapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har
Läs merNiklas Lindvall Artificiell intelligens II Ht
Taligenkänning Hidden Markov Model Niklas Lindvall nikli368@student.liu.se Artificiell intelligens II Ht 2011 2011-09-19 0 Innehåll Inledning... 2 Taligenkänning språk... 3 Taligenkänning... 4 Oberoende/Beroende...
Läs merFöreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen.
Elektronik - digital signalbehandling Föreläsning: Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2010-10-01 1 2008-10-06 Elektronik - digital
Läs mer! Susanne Schötz! ! akustisk-fonetisk analys! ! grupparbete!! om vi hinner: introduktion till Praat (kort demo)!
Introduktion till akustisk analys (av tal)!! akustiska elementa!! akustisk analys!! grupparbete: akustisk analys!! om hinner: introduktion till Praat!! mina bilder finns att ladda ner här: http://person2.sol.lu.se/susanneschotz/teaching_files/intro_ak.pdf!
Läs merTPPA-B(2): Akustisk fonetik I. Praktisk info. Kurslitteratur
TPPA-B(2): Akustisk fonetik I Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Praktisk info Schema, läsanvisningar, handouts, länkar och dylikt finns på: http://www.ling.gu.se/~mattias/tppa_b/
Läs merFormulering av algoritm för prosodimodellen FK-systemet
Formulering av algoritm för prosodimodellen FK-systemet Theresa Andersson theresa@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Uppsala universitet Institutionen för lingvistik
Läs merTalbaserade multimodala dialogsystem för medicinsk rådgivning
Talbaserade multimodala dialogsystem för medicinsk rådgivning Daniel Höglind (hoeglind@kth.se) & Paulina Modlitba (paulina@kth.se) Den här artikeln beskriver ett talbaserat multimodalt dialogsystem som
Läs merPraktisk info. T-PPA 2 Lektion 1: Akustiska elementa
T-PPA 2 Lektion 1: Akustiska elementa Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Praktisk info Schema, läsanvisningar, handouts, länkar och dylikt finns på: http://www.ling.gu.se/~mattias/t-ppa_2/
Läs merMÖSG ht 2005 Maskinöversättningssystemet MATS
MÖSG ht 2005 Maskinöversättningssystemet MATS Per Weijnitz perweij@stp.ling.uu.se Om detta kursmoment främja förståelse av översättningsproblem MÖ-arbete regelbaserade MÖ-system godtyckligt valt system?
Läs merAkustisk fonetik. Akustiska elementa. Ljudvågor. Ljudvågor. Talkommunikationskedjan. Talkommunikationskedjan
Talkommunikationskedjan Akustisk fonetik I den första förläsningen talade vi om talkommunikationskedjan, alltså den serie av händelser som börjar med en tanke i en talares huvud och slutar med en tolkning
Läs merBARNS SPRÅKUTVECKLING
BARNS SPRÅKUTVECKLING BARNS SPRÅKUTVECKLING Hur lär sig barn sitt språk? Vad skiljer barns språkutveckling från vuxnas språkinlärning? Hur kan vi forska om barns språkutveckling? Vad säger språkutvecklingen
Läs merSignaler och system, IT3
Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad
Läs merLärverktyg Carina Forslund Slussen
Lärverktyg 2019-08-08 Carina Forslund Slussen 2 Innehåll Innehåll... 3 ILT Inläsningstjänst... 4... 4 Legimus... 4 Google Lärverktyg... 5 ClaroRead Chrome Talsyntes... 5 Stava Rex för Google docs... 5
Läs merFonetik. Dolores Meden
Fonetik Dolores Meden Innehållsförteckning 1. Inledning...3 2. Allmänt...4 2.1 Vad är fonetik?...4 2.2 Talproduktion...4 2.2.1 Konsonanter...5 Stämbandston...5 Artikulationsställe...5 Artikulationssätt...5
Läs merTalets fysiologi, akustisk fonetik. Lungorna och struphuvudet. Röst 2016.01.28. David House: Talets fysiologi, akustisk fonetik VT16.
Talets fysiologi, akustisk fonetik David House Lungorna och struphuvudet utandningsluft - alstra ljud luftstrupen: trachea struphuvudet: larynx brosk, muskler och ligament röstspringan: glottis stämläpparna:
Läs merEXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG
FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal
Läs merIntroduktion. Koartikulation (1)
Det dynamiska talet - - Assimilation - - Ljudförändringar Introduktion Talproduktion består inte av diskreta, sekventiella enheter utan av ett kontinuerligt flöde av sammanflätade artikulatoriska gester
Läs merfoner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8
Facit till övning 1 foner fonem stol 4 4 mamma 4 2 sjukskötare 9 8 gata 4 3 stat 4 3 Haparanda 9 6 heter 5 4 el. 5 kärvänlig 8 el. 9 7 el 8 Några problem: 1) lång resp. kort variant av en vokal, är de
Läs merRysk fonetik 7,5 hp föreläsning III. Institutionen för moderna språk Karine Åkerman Sarkisian Ryska A
Rysk fonetik 7,5 hp föreläsning III Institutionen för moderna språk Karine Åkerman Sarkisian Ryska A Konsonanter - Var? Artikulationsställe - Hur? Artikulationssätt - Fonation (tonande eller tonlös?) Konsonanter
Läs merLab skapades Ove (Orator Verbis Electris) av Gunnar Fant, KTH.
Lab 2 1953 skapades Ove (Orator Verbis Electris) av Gunnar Fant, KTH. Ove var en talsyntesmaskin som kunde göra vokalljud. Ganska bra sådana dessutom, i alla fall med tanke på dåtidens teknik. Här finns
Läs merJollerkoll - typisk jollerutveckling
Jollerkoll - typisk jollerutveckling Anette Lohmander Leg logoped, professor, enheten för logopedi CLINTEC, Karolinska Institutet Erik G Svensson 1 Förutsättningar Barn lär språk och tal snabbt och lätt
Läs merUttalsutveckling. Språkstruktur. Språkstruktur. Språkstruktur. Det mänskliga talet. Barns tidiga språkutveckling
Uttalsutveckling Språkstruktur! Principen bakom alla mänskliga språks struktur är att små delar bygger upp större delar som bygger upp ännu större delar Barns tidiga språkutveckling Institutionen för lingvistik,
Läs merVad är fonetik? Vad är fonetik? Fonetikens tre huvudområden Produktion Akustik Perception. Men dessa kan appliceras på en mängd området som t.ex...
et Kommunikation med ljud Vad är fonetik? Vad är fonetik? Fonetikens tre huvudområden Produktion Akustik Perception Men dessa kan appliceras på en mängd området som t.ex.... Fonetik i ett språkligt perspektiv
Läs merAnmälan till EY1B13 Kontrastiv engelska för lärare (Contrastive English for Teachers) 7,5 hp vårterminen 2011.
Institutionen för Språk och litteraturer Anmälan till EY1B13 Kontrastiv engelska för lärare (Contrastive English for Teachers) 7,5 hp vårterminen 2011. Personnummer Efternamn Förnamn Adress Postnummer
Läs merAkustiska Elementa och Digital Signalbehandling
Akustiska Elementa och Digital Signalbehandling Rebecca Jonson Talteknologikursen VT2005 Akustisk behandling av tal Inom talteknologi vill vi producera och analysera tal vilket kräver kunskap om talproduktion
Läs merB2C för Svensk Elitfotboll Urval
B2C för Svensk Elitfotboll Urval INNEHÅLL 1. Generellt om Urval... 2 1.1. Skapa nytt Urval... 2 1.2. Dela ut urval till dina kollegor... 6 2. Objektstruktur för B2C... 7 2.1. Privatpersonkortet... 7 2.2.
Läs merAlternativa Verktyg. 2015-08-13 Carina Forslund Stödenheten
Alternativa Verktyg 2015-08-13 Carina Forslund Stödenheten Inlästa läromedel Inläsningstjänst Ladda ner och lyssna på inlästa läromedel direkt i mobilen eller surfplattan. (Du kan även lyssna via din dator.)
Läs merKursplan för Moderna språk
Kursplan för Moderna språk Inrättad 2000-07 SKOLFS: 2000:135 Ämnets syfte och roll i utbildningen Utbildningen i moderna språk syftar till att utveckla en allsidig kommunikativ förmåga. Att kunna använda
Läs merNUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden
NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance
Läs merSpektrala transformer Laboration: Vokalsyntes
Spektrala transformer Laboration: Vokalsyntes 1 Introduktion I denna laboration är målsättningen att du ska få handgripliga erfartenterer av digital filtrering. Du ska implementera en enkel men användbar
Läs merEtt enkelt OCR-system
P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor
Läs merVITAL ANVÄNDARHANDBOK
VITAL ANVÄNDARHANDBOK Inledning ViTal är ett program som är utformat för att ta itu med läskunnighetsfrågor, både när det gäller läsundervisning och läsning av elektroniska dokument, inklusive webbplatser.
Läs merWindbag. Textbaserat kommunikationsprogram. Bruksanvisning
Windbag Textbaserat kommunikationsprogram Bruksanvisning BRUX\...\Windbag\Windbag2 144 SV Gewa AB BOX 92, MALMVÄGEN 55, 191 22 SOLLENTUNA TEL: 08-594 694 00 TEXTTEL: 08-594 694 18 FAX: 08-594 694 19 E-MAIL:
Läs merTips på AKK-appar. Jag tycker om dig! Appar med symboler, text och ljud för personer som behöver AKK-stöd för uttryck och förståelse
Tips på AKK-appar Jag tycker om dig! Appar med symboler, text och ljud för personer som behöver AKK-stöd för uttryck och förståelse Oktober 2019 Innehåll Innehåll... 2 Vad är AKK och vad är AKK-appar?...
Läs merVad är fonetik? Talet Kommunikation med ljud. Fonetikens tre huvudområden. Fonetik i ett språkligt perspektiv. Fonetik i ett språkligt perspektiv
Vad är fonetik? et Kommunikation med ljud Fonetikens tre huvudområden Produktion Akustik Perception Men dessa kan appliceras på en mängd området som t.ex.... Fonetik i ett språkligt perspektiv Ljudsystem
Läs merMöjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering?
Kap 2: Typologi Möjligt med språk utan fonologisk struktur, bara morfem med viss vokalisering? Orden skulle bli mycket långa för att varje morfem skulle ha sin egen vokalisering, eftersom det behövs så
Läs merViTal. Talsyntes. Användarhandledning
ViTal Talsyntes Användarhandledning Introduktion ViTal är ett program som utvecklats för att med hjälp av artificiellt tal vara ett stöd vid läsning och skrivning. ViTal kan användas både i undervisning
Läs merFolke vs Henry. En jämförelse av förståelse mellan syntetisk och mänsklig uppläsning av sammanhängande texter
Institutionen för lingvistik & nygrekiska Stockholms universitet Folke vs Henry En jämförelse av förståelse mellan syntetisk och mänsklig uppläsning av sammanhängande texter Mikael Ståhl Abstract: I en
Läs merFonetiklabb för FFG VT05
Namn: Fonetiklabb för FFG VT05 1. Dubbelklicka på ikonen för Praat. 2. Spela in ordet äng genom att trycka menyn New Record mono Sound (obs kolla om utslaget är bra innan ni spelar in till gult gärna)
Läs mertentaplugg.nu av studenter för studenter
tentaplugg.nu av studenter för studenter Kurskod Kursnamn UMU-14401 Spanish A1 Datum Material Sammanfattning Kursexaminator Betygsgränser Tentamenspoäng Övrig kommentar Innehåller frågor/ begrepp med svar
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merBruksanvisning. BLISSKARTA för Rolltalk Designer Artikelnr: 105 815
Bruksanvisning BLISSKARTA för Rolltalk Designer Artikelnr: 105 815 Innehåll Installation av Blisskarta... 3 Blisskartan - startsida... 3 Testa programmet... 4 Skapa en genväg till programmet från skrivbordet...
Läs merEn orientering i gränsområdet mellan lingvistik, antropologi och psykologi.
INTRODUKTION SPRÅK, KULTUR OCH TANKE En orientering i gränsområdet mellan lingvistik, antropologi och psykologi. Språklig relativism och språklig determinism styr tanken språket eller språket tanken? Betydelse
Läs merTillämpad prosodi inom Artificiell Intelligens
Tillämpad prosodi inom Artificiell Intelligens Linköpings universitet Linköping 2010-01-03 Sammanfattning Detta är en fördjupningsuppgift skriven för kursen Artificiell intelligens 2 på Linköpings Universitet
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merAtt fånga den akustiska energin
Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte
Läs merAcapela TTS. Inställningar och korrigering av uttal. Emma och Erik
Acapela TTS Inställningar och korrigering av uttal Emma och Erik Innehåll Inledning... 3 Inställning av talsyntesens parametrar... 4 Förklaring av Flikar... 5 Info... 5 General... 5 Pauses... 5 Reading...
Läs merMedicinsk Informatik VT 2003
Informatik VT 2003 Introduktion till Informatik Definition informatik omfattar utveckling och tillämpning av IT-baserade metoder för insamling, representation, bearbetning, presentation, kommunikation
Läs merAlternativa Verktyg. 2016-05-19 Carina Forslund Stödenheten
Alternativa Verktyg 2016-05-19 Carina Forslund Stödenheten Innehåll Inläsningstjänst... 3 Legimus... 4 Rättstavning/talsyntes... 4 Talsyntes... 4 Taligenkänning... 5 Alternativa SMS... 5 Skanner/OCR...
Läs merTraditionell undervisning med ny teknologi
Traditionell undervisning med ny teknologi Traditionell undervisning med ny teknologi Till skillnad från andra datorbaserade utbildningar erbjuder Berlitz Virtual Classroom undervisning live. Genom headsets
Läs merHuvudrörelser och deras relation till grundtonskonturen vid fokal accent
Huvudrörelser och deras relation till grundtonskonturen vid fokal accent Emelie Gardelin emelie@stp.ling.uu.se Examensarbete i datorlingvistik Språkteknologiprogrammet Uppsala universitet Institutionen
Läs merNeurolingvistik - Fonologi
Neurolingvistik - Fonologi Fonologi Strukturalism - system Fonem Särdrag (art-ställe, artsätt, ton, rundning) + Prosodi (intensitet, frekvens, duration) Icke-linjär fonologi Fenomen i afasi att beskriva
Läs merINSTALLATIONSHANDBOK
, Talsyntes INSTALLATIONSHANDBOK Innehåll Systemkrav 2 Installation med programskivan 3 Installation efter nedladdning från internet 4 Installation tillval/tillägg 7 Installation av MSI-filer (skolor och
Läs mer/r/ i några svenska dialekter
/r/ i några svenska dialekter Damra Muminovic och Olle Engstrand 1. Inledning R-ljuden uppvisar stor artikulatorisk variation mellan och inom språk och dialekter (Lindau 1985). I den svenska dialektlitteraturen
Läs merHur gör vi då för att segmentera och kategorisera ljud i talspråk?
UPPSALA UNIVERSITET Institutionen för lingvistik och filologi SPRIND, HT 2006, Tillfälle 7 SPRÅKPSYKOLOGI LYSSNA OCH TALA/ PERCEPTION OCH PRODUKTION LYSSNA (kap 5) Segmentering på fonemnivå - Koartikulation:
Läs merMind Express 3.0. Kort beskrivning. Systemkrav. Styrsätt
Mind Express 3.0 Kort beskrivning Mind Express är ett kommunikationsprogram för att tala och skriva med symboler. Det har inbyggda grammatiska funktioner och möjlighet att använda olika inställningar/nivåer
Läs merAppar med symboler, text och talsyntes och/eller ljud som kan användas som stöd för personer som inte kan uttrycka sig via tal.
TIPS PÅ AKK-APPAR för ipad, iphone och ipod Touch Appar med symboler, text och talsyntes och/eller ljud som kan användas som stöd för personer som inte kan uttrycka sig via tal. Dec 2014 Sammanställt av
Läs merDigital dokumenthantering för ABM II:1
ABM DDH II Digital dokumenthantering för ABM II:1 Introduktion Vårens kurs Digital dokumenthantering för ABM II Undervisningen kommer att ske med föreläsningar seminarier praktiska övningar (i samarbete
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merLathund för Gustavas ordböcker
Lathund för Gustavas ordböcker Gustavas ordböcker har länge funnits som bok men finns även i digitalt format vilket underlättar för elever med läs- och skrivsvårigheter. Starta Gustavas ordböcker genom
Läs merVokaler. Vokaler och Konsonanter. Vokaler och Konsonanter. Vokaler och Konsonanter. Skillnad: bildningssätt. Vokaler och Konsonanter
Vokaler Vokaler och Konsonanter Indelning av språkljud Vokaler och Konsonanter IPA, bakgrund & principer Vokalernas beskrivning i IPA Vokalfyrsidingen Tidigare benämningar Vokaler: självljud Konsonanter:
Läs merDatoranimerade talande ansikten
Datoranimerade talande ansikten Olov Engwall, Centrum för talteknologi, Kungliga Tekniska Högskolan, Stockholm Videoillustrationer (markerade med VI i texten) till detta kapitel finns på http://www.speech.kth.se/~olov/ansiktemotansikte.html.
Läs merBortom skärmen II. Haptik, ljud och projektstart
Bortom skärmen II Haptik, ljud och projektstart Innehåll Haptik Ljud Gruppindelning Projektstart Typisk mobil användare! Svårt att se skärmen (rörelseoskärpa, sol ) Svårt att koncentrera sig 100% Bullrig
Läs mer