Dagens lektion. Dagens Litteratur. WER: Human vs machines. Taligenkänning mskiner/mskor. Mänsklig igenkänning Talteknologi och DialogSystem
|
|
- Maj-Britt Göransson
- för 8 år sedan
- Visningar:
Transkript
1 Dagens lektion Mänsklig igenkänning Talteknologi och DialogSystem Talteknologi, VT 2006 Rebecca Jonson Mänsklig taligenkännning Talteknologi och Dialogsystem Demos! Kurssammandrag Labgenomgång Frågestund Dagens Litteratur WER: Human vs machines Jurafsky & Martin 5.10, 7.9, 15.5 (s ) kap R.P. Lippman (1997) Speech recognition by machines and humans Taligenkänning mskiner/mskor Till skillnad mot ASR så kompenserar människor för många av de störande faktorerna i tal Förståelsen påverkas inte så mycket av brus/oljud/bakgrundsljud men för ASR är skillnaden enorm Skiljer lätt talljud från andra ljud Skiljer lingvistiska produktionen fr ån extralingvistiska Känner igen helt okända ord Mycket bättre på nonsensmeningar och siffror/bokstäver Anpassar lyssnandet till talarens röst/dialekt/frasuppbyggnad Anpassar lyssnandet snabbt till kanalen, omgivningen olika mikrofoner, bandvidd etc. Extrem skillnad när det gäller igenkänning av spontant tal: ASR= 43% WER Människor= 4% WER (på Switchboard Talkorpusen) Mänsklig igenkänning Flera processer i mänsklig igenkänning hj älper till att kompensera: Akustisk-fonetisk Syntax/Grammatik Semantik Pragmatik Prediktion Information om talaren Kunskap om ämnet/situationen Kontext på flera niv åer Omv ärldskunskap Dagens taligenkänning har en hel del att lära
2 ASR-försök att härma hur vi gör ASR delar upp talsignalen i flera frekvensband (dussintal) = Vårt hörselsystem gör samma sak, varje nerv i innerörat svarar mot olika frekvenser. Örat är dock extremt känsligt till olika frekvenser (skiljer flera tusen överlappande frekvensband). Ökning av frekvensbanden i ASR ökar ASR igenkänningsförmåga av tal men vi har realtidsbegränsning hos datorerna (CPU/RAM) ASRs tre variabler Talaroberoende Stor vokabulär (>60000 ord) Kontinuerligt tal Än så länge finns inget ASR system som kombinerar alla dessa tre egenskaper Framtiden kräver speaker independent, large-vocabulary continuous speech recognition Begränsningar ASR Brist på träningsdata Anpassar sig inte efter talaren Modellerar inte kunskapen som behövs för att förstå de ambiguösa och varierande fenomenen i talat språk. Processhungrigt och minneshungrigt. Kräver snabba datorer med mycket minne. Kräver snabba sökalgoritmer eftersom realtid. Prosodisk information utnyttjas inte Påverkas kraftigt av brus och kanalvariabilitet Begränsad intelligens och omvärldskunskap Leverar text även när vi egentligen inte vill ha diktering utan snarare en semantisk tolkning av akustiska data Framtidens ASR Integration ASR med Natural Language Understanding(NLU) Prosodisk information Anpassning av akustiska modeller till talaren under igenkänning. (Speaker Adaptation) Task-independence Lågnivå akustisk fonetisk analys (känna igen bättre utan kontext, nonsensmeningar) Robusthet och adaptering till brus och kanalvariabilitet Skilja på bakgrunds/extralingvistiska ljud och talsignal. Forska om spontant talspråk (talspr åksgrammatik?) Inlärning/Igenkänning av nya ord Nya typer av språkmodeller Pågående Forskning Talaradaptering Robusthet mot brus och kanalvariabilitet Confidence scores N-bästa omrankning/lattices Förbättrade språkmodeller (klassbaserade, LSA, bättre smoothing-tekniker) Hybrida lösningar grammatiker + SLM:er Forskning på spontant talspråk Language Identification/Multilingual Recognition Identifiering/Modellering av okända ord Använda webben som korpus till SLM ASU (automatic speech understanding)
3 ASU Automatisk språkförståelse Istället för tal-till-text konvertering så vill vi ha tal-till-koncept. Inte bara igenkänning (perception) utan också förståelse. Behöver inte känna igen allt i motsats till diktering utan fånga tolkningen av talarens yttrande ja, jajamen, japp answer(yes) Time flies like an arrow Parser output: That time passes as quicklyas an arrowpasses A command telling us to time flies the same way that an arrowtimes flies. Command telling us to time onlythose flies that are similarto arrows. Means that a type of flies known as time flies have a fondness for arrows Språkförståelse kräver både kunskap om relationer mellan ord och kunskap om ordens underliggande koncept. Kontext Normalt i ett ASU-system är domänen begränsad till en viss situation och kontext därför faller många varianter bort. Tolkningen av språk förenklas av domänrestriktionen För att förstå behöver man dock inte känna igen allt. Tolkningen kan bli densamma även om ett ord missas. Lägg till en låt på spellistan request(playlist_add) Jag vill l ägga till en låt till spellistan request(playlist_add) Parsning av tal I många system parsar man yttrandet för att få en syntaktisk representation som man lättare ska kunna tolka. Robust parsning: Tal följer inte alltid samma grammatik som text och ibland får man bara fragment av yttranden från taligenkänning vilket kräver annan typ av parsning Måste kunna extrahera disfluenser (tvekljud öh, felsägningar, repetitioner, omstart etc.) Which flights uhleave (pause) leave bef- after noon? Tal ogrammatiskt? och fragmentariskt Tekniker: Keywordspotting Semantiska grammatiker Djupare parsning i kombination med robustare tekniker Probabilistiska grammatiker (PCFG) Statistisk parsning Keywordspotting Ett försök att hitta en metod som tillåter kontinuerligt tal men som bara lyssnar till isolerade delar. Känner igen ord eller kommandon ur längre yttranden Exempel: Jag vill beställa en pizza Jag skulle vilja ha en pizza Öhm, en pizza skulle jag vilja ha ena Semantiska grammatiker Istället för att utgå från syntax så utgår dessa från semantiken för en viss domän. Är inte mer allmänna än att de täcker domänen. When does the flight 573 arrive in Atlanta? When does it arrive in Dallas? InfoRequest when does Flight arrive in City? Fångar it och matchar till Flight. En syntaktiskt parser skulle matcha it till en möjlig NP Problemet är att det är svårt att återanvända semantiska grammatiker
4 Speech Recognition Grammar Specification Standarder för grammatiker för taligenkänning är på gång i W3C I want to book a flight from Prague to Paris <book-flight> <depart>prague</depart> <arrive>paris</arrive> </book-flight> Vanliga parsningsmetoder Använder en vanlig grammatik för att parsa yttranden Blir ofta för restriktiv eftersom taligenkänning kan korrumpera input Används ihop med taligenkänningsgrammatiker och inte SLM:er eftersom man då bara får hypoteser som följer taligenkänningsgrammatiken Dialogdragstaggning Fungerar med samma metoder som ordklasstaggning men här taggar man hela yttranden till dialogdrag Statistiska metoder Maskininlärning Dialogsystem (DS) Datorprogram som gör det möjligt för oss att interagera med datorer med naturliga språk (såsom svenska, japanska etc). System som klarar längre dialoger, inte bara en fråga följd av ett svar och som låter användare tala någorlunda fritt (d v s inte bara kommandon). Det kan gälla både talad och skriven dialog liksom kombinationer av skriven/talad dialog. De är oftast begränsade till en specifik domän Multimodala dialogsystem blandar grafiska gränsnitt med dialog. Dialogsystem Svenska kommersiella DS Bilregistret (SpeechCraft): SAS SpeechLine (SpeechCraft): SJ:s automatiska t ågtidsupplysning (Presector): , välj 1 Sjöfartsverkets sjöväderupplysning (SpeechCraft): Telias nummerupplysning Autosvar (Presector): teliamobiles röststyrda aktietjänst (SpeechCraft): 4444 (endast för teliamobile-kunder) Västernorrlands länstrafik / Din Tur (SpeechCraft): , välj sedan 1 Västtrafiks röststyrda tidtabellsupplysning (Sigma): , välj 1
5 Dialogdesign Design genom egen inspiration: Tänk ut själv vad du tror användare skulle vilja göra och säga, fråga andra vad de tror, enkäter och intervjuer Design genom observation: Titta på hur vi gör i H-H dialoger i liknande situationer Studera transkriberade människa-människa dialoger (talkorpusar) Men H-H dialoger skiljer sig från H-M dialoger Design genom simulering: Wizard of OZ-experiment låt användare tro att de använder ett riktigt system men använd dig av en Wizard som låtsas vara ett system. Utgå från hur användarna betedde sig för att bygga systemet. Design genom iteration: Bygg en prototyp och testa den på användare. Bygg sedan en ny version utifrån testresultaten. Studera H-M dialogerna. Dialogsystem och Talteknologi Kombinerar ASR/TTS Kräver turtagningstekniker Verifiering: Vi måste försäkra oss att det vi fått från taligenkänningen är korrekt Felhantering: om det blivit fel som måste vi kunna komma på rätt spå r igen Vi måste tänka på vad systemet säger och hur det kommer på verka användaren. Vart vill du åka? Jag vill åka till Stocholm Vi måste se till att det systemet säger låter bra och uppfattas rätt (rätt fokus) Dynamiska språ kmodeller/grammatiker Till vilket telefonnummer vill du skicka sms:et? (anv ända en modell för telefonnummer) Vi måste kunna tolka det vi känner igen och tvärtom och kunna känna igen det vi pratar om. Turtagning När ska systemet (TTS:en) säga något? När ska systemet lyssna (ASR)? Turtagning ofta striktare än vad vi har i människa-människa dialog: systemet pratar till punkt, användaren kan börja prata först efter en stund (eller efter ett pip) och har en viss tid på sig för sitt yttrande Barge-in= användaren kan avbryta systemet För att kunna göra dialogen mer flytande använder man sig av Barge-in d v s man låter taligenkänning vara igång medan talsyntesen pratar så att användaren kan avbryta systemet. Ett problem är att systemet måste skilja på användarens medvetna avbrott och andra ljud (bakgrundsljud, extralingvistiska ljud, återkoppling fr ån användaren etc) Måste hålla reda på vart användaren bröt för att veta vad han hann höra Verifiering P g a att resultaten från taligenkänningen är tvivelaktiga så brukar dialogsystem kolla med användaren om de har uppfattat rätt med möjlighet för användaren att korrigera Explicit verifering S: Vart vill du åka? U: Till Västerås. S: Du vill åka till Borås. Stämmer det? Implicit verifiering S: Vart vill du åka? U: Till Västerås. S: Vilken dag vill du åka till Borås? Användarbeteende Några typer av användare: Fru Pratig: Hej, jag ska äntligen på semester och tänkte boka en resa till någon varm plats. Hur är vädret I Brasilien? Herr Kryptisk: San Fransisco temperatur Fröken Fåordig: tio När saker går fel När saker går fel så brukar användare: Hyperartikulera Tala långsammare Göra pauser mellan ord Tala högre Ändra fokus vilket INTE hjälper taligenkänningen!
6 Speech Browser Opera Diktering Dragon CALL-system Listen Dialogsystem GoDiSApplikationer Demo-session Opera Speech browser Gratis talbrusare för engelska Gör det möjligt att surfa på nätet med talkommandon: Gå till en viss sida Få text uppläst Zooma ut/in, reload Gå längst ner/högst upp på sidan Klicka osv. Kan användas på talsajter Möjlighet att lägga till egna kommandon Diktering Finns många gratis dikteringssystem på nätet. Dragon är kommersiellt och anses vara det bästa dikteringssystemet (tillhör Scansoft idag). Project LISTEN (Literacy Innovation that Speech Technology ENables) is an inter-disciplinary research project at Carnegie Mellon University to develop a novel tool to improve literacy an automated Reading Tutor that displays stories on a computer screen, and listens to children read aloud. Demo GoDiS-applikationer AgendaTalk DJGoDiS (mp3spelare) VideoGodis LightGoDiS Dico (mobiltelefon) mfl Kursbeskrivning Kursen ger en introduktion och översikt till talteknologi ur ett datalingvistiskt perspektiv. Kursen tar upp grunderna för text-till-tal-analys, talsyntes, taligenkänning och ger en inblick i talspråkets karakteristika.
7 Kurssammanfattning Användningsområden för talteknologi Kort historik om talteknologi Talperception och talproduktion Talets akustik Spektrogram och Källa-Filter teori Digital Signalbehandling Analog till digital signal sampling/kvantifiering Delarna i ett TTS-system Textanalys (TEXT -till-ord) Tokenisering TTS Homografdisambiguering Lingvistisk behandling (ORD-till-SEGMENT + prosodi) Uttal frasering Talsyntes (SEGMENT + PROSODI TALSIGNAL) Konkateneringssyntes Formantsyntes Artikulatorisk syntes Talande huvuden Konkateneringssyntes Segmentdatabas Hitta rätt segment: Unit selection Limited domain Återsyntes: LPC, PSOLA, MBROLA Jämf örelse av syntesmetoder Utvärdering av talsyntes Talsyntes och prosodi i dialogsystem, mark- up spr åk (Stinas lektion) Sannolikhetslära Sannolikhetslärans grunder Betingade sannolikheter Bayes lag Statistiska metoder Markovmodeller (HMM:er) ASR Varför ASR är så svårt? Parametrisering av talsignal i ASR (mfcc-analys, vektorkvantisering) Mönsterigenkänning Talarverifiering/Talarigenkänning Dynamisk programmering (DTW, minimum edit distance) Taligenkänningssystem (HMM-system) Sannolikhet i ASR: P(Ord Akustik) HMM:er P(Akustik Ord) Språkmodeller P(Ord) och Taligenkänningsgrammatiker (Nuance) Avkodning: Viterbialgoritmen, N -bästa Utvärdering av ASR-system Word Error Rate Perplexitet Prestanda Talarberoende/talaroberoende, vokabulär, typ av tal Mänsklig taligenkänning vs automatisk taligenkänning Taligenkänning i dialogsystem (ASU) Talteknologiföretag ( AOL AT&T Acapela (Swe) Scansoft (Swe) IBM Apple Microsoft Loquendo Nuance NTT Philips SpeechWorks Tellme Fluency Linguamatics Pipebeach (Swe) VoiceProvider (Swe) Telia Research (Swe) Artificial-solutions (Swe) Telefonica R&D Voxit (Swe) Dialogue Technologies (Swe) Lab 3: Skriva Nuancegrammatik Skriva en NuanceGrammatik för någon av följande domäner. Talande MP3-spelare Talande filofax
8 Steg i labben! 1. Fundera ut/samla in användaryttranden i domänen. Vad skulle man vilja säga till en MP3-spelare och Filofax. Hur tror ni användare skulle formulera sig? Försök fånga varianter av formuleringar för samma koncept. Exempel videodomänen: 1. Jag vill spela in en film 2. Kan du inte spela in en film åt mig 2. Fånga dessa i en NuanceGrammatik. 3. Kompilera grammatiken och testa. (testa med tal, med parse-tool, genom att generera del av grammatiken) 4. Byt taligenkänningspaket med en annan grupp (annan domän) och utvärdera varandras paket. 1. Spela in 20 domä nyttranden per gruppmedlem med transkription 2. Kör batchrec med paketet 5. Skriv en kort rapport om hur ni har gått tillväga. 1. Vad ni tycker ni har lyckats fånga, vad som saknas i er grammatik. Redogör för utvärderingen av den andra gruppens taligenk ä nningspaket (WER). Verkar deras grammatik täcka st örre delen av dom änen?
NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden
NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance
NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006. Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden
NUANCE TUTORIAL TALTEKNOLOGI KURSEN VT2006 Labkonstruktör: Rebecca Jonson Labhandledare: Håkan Burden Laboration 3 börjar med en Nuance-tutorial som först och främst går ut på att lära sig lite hur Nuance
Talteknologi introduktion. Hur realistisk var HAL? Dagens situation? Kursupplägg Talteknologikursen. Kurskrav
Talteknologi introduktion Rebecca Jonson Doktorand i Språkteknologi (GSLT, Lingvistik Gbg) AAST-kursen VT 2007 Computers are getting smarter all the time; scientists tell us that soon they will be able
Överblick. Dialogsystem. En dialogsystemsarkitektur. Dialogsystemsarkitektur. Talförståelse. Dialoghantering
Överblick Dialogsystem Del I Dialogsystemsarkitektur Människa-maskin-dialog jämfört med människa-människa-dialog Dialog-initiativ, barge-in, verifiering Dialogspecifikation Några svenska röststyrda tjänster
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter
Automatisk taligenkänning som hjälpmedel för att bedöma muntliga språkfärdigheter Mikko Kurimo Institutionen för signalbehandling och akustik Aalto-universitetet Innehåll 1. Hur automatisk taligenkänning
Litteratur ASR. Taligenkänning Introduktion till taligenkänning. Upplägg taligenkänningsdelen. Dagens litteratur. Varför taligenkänning?
Litteratur ASR Taligenkänning Introduktion till taligenkänning Talteknologi, VT 2006 Rebecca Jonson Jurafsky & Martin. Kap 5,6,7 + delar fr. andra kapitel (t ex kap 19) Blomberg, M & Elenius, K. Automatisk
Avkodning ASR prestanda
Avkodning ASR prestanda Talteknologi, VT 2005 Rebecca Jonson Dagens Litteratur p Jurafsky & Martin. 3.5, 5.9, s. 271, 7.3, p Blomberg, M & Elenius, K. Automatisk igenkänning nning av tal. s. 18-22 p Steve
Exjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson
Datalingvistisk metod och fördjupning HT05 1 Exjobbskritik Muntlig opponering på ett exjobb Stina Ericsson Datalingvistisk metod och fördjupning HT05 2 Översikt 1. Att läsa ett exjobb kritiskt 2. Opponeringen
Text-till-Talsyntes (TTS2)
Text-till-Talsyntes (TTS2) Rebecca Jonson TalTeknologikursen VT 2005 Dagens lektion Lite mer om prosodisk frasering Svar på frågan om svenska sammansättningar Några exempel på system Talsyntes Formant
Taligenkänning. Sanna Aronsson sanar429 Artificiell Intelligens, HKGBB0
Taligenkänning, HKGBB0 Abstract Ett taligenkänningssystem är att ett system som har som uppgift att identifiera enstaka ord eller hela sekvenser av ord. Detta gör den genom att jämföra denna ordsekvens
Talbaserade multimodala dialogsystem för medicinsk rådgivning
Talbaserade multimodala dialogsystem för medicinsk rådgivning Daniel Höglind (hoeglind@kth.se) & Paulina Modlitba (paulina@kth.se) Den här artikeln beskriver ett talbaserat multimodalt dialogsystem som
Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar
1 Agenda Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar 2 Nuvarande AI Funktioner en grov Analogi Rekommendation,
Text-till-Talsyntes (TTS3)
Dagens lektion: Text-till-Talsyntes (TTS3) Rebecca Jonson TalTeknologikursen VT 2005 Talsyntes Forts. Konkateneringssyntes Återsyntes LPC, PSOLA, MBROLA Jämförelse syntesmetoder Artik, Formant, Konkat
Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Stina Nyman 2012-09-16
LINKOPINGS UNIVERSITET, IDA SmartKom Hur systemet fungerar Stina Nyman 2012-09-16 stiny786 Artificiell intelligens II Sammanfattning Detta projekt kommer handla om SmartKom som är ett multimodalt dialogsystem
Litteratur ASR. Taligenkänning Introduktion till tal- och talarigenkänning. Vad är taligenkänning? Varför taligenkänning? Användningsområden
Taligenkänning Introduktion till tal- och talarigenkänning Talteknologi, HT 2007 Litteratur ASR Kap 9 påp nätet Jurafsky & Martin. Kap 5,6,7 + delar fr. andra kapitel (t ex kap 19) Blomberg, M & Elenius,
Tekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Vanliga frågor för VoiceXpress
Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur
Taligenkänning - har den en framtid som nyttoverktyg?
Taligenkänning - har den en framtid som nyttoverktyg? Examens arbete I, 10 p. Handelshögskolan vid Göteborgs Universitet Institutionen för Informatik HT 2001 Handledare: Göran Walske Författare: Zineta
Teoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
CMG Speech Attendant. Användarmanual. 19 februari PUBLIC
CMG Speech Attendant Användarmanual 19 februari 2010 www.aastra.com PUBLIC Innehåll 1 Inledning... 3 2 Tips... 3 3 Funktioner... 4 3.1 Framkoppling enligt namn... 4 3.1.1 Enkel framkoppling... 4 3.1.2
Artificiell intelligens II, 729g11 Projekt HT-11. Taligenkänning. Nina Knez
Taligenkänning 1 Sammanfattning Taligenkänning är i dagens samhälle en nödvändig teknik för många människor för att lättare ta sig fram genom vardagen. Man hittar tekniken i olika sammanhang som telefonupplysning,
HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng
Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har
Naturligt Språk-Generering (NLG), Text-till-Talsyntes (TTS) och prosodi, i dialogsystem. Stina Ericsson, Talteknologi VT06.
Talteknologi (AAST) 1 mars 2006 1 Talteknologi (AAST) 1 mars 2006 2 Naturligt Språk-Generering (NLG), Text-till-Talsyntes (TTS) och prosodi, i dialogsystem Problemet Föreställ dig ett dialogsystem som
Taligenkänning med fördjupning på Hidden Markov Models
IDA, Linköpings Universitet Artificiell Intelligens II, 729G11 HT 2008 Taligenkänning med fördjupning på Hidden Markov Models 870524-0045 jearu017@student.liu.se Sammanfattning Taligenkänning är en teknik
ASR3 Språkmodeller Taligenk änningsgrammatiker
ASR3 Språkmodeller Taligenk änningsgrammatiker Talteknologi VT2006 Rebecca Jonson Litteratur Jurafsky &Martin: kap 6 (witten-bell och good-turing översiktligt, ej 6.5), sid 316, s 573-577577 Blomberg&Elenius:
Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Språkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
ASR3 Språkmodeller Talgrammatiker
ASR3 Språkmodeller Talgrammatiker Talteknologi VT2005 Rebecca Jonson Litteratur Jurafsky &Martin: kap 6 (witten-bell och good-turing översiktligt, ej 6.5), sid 316, s 573-577577 Blomberg&Elenius: s16-17,
Syntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Webbföreläsning på kurser i Göteborg, Lund och Uppsala
Webbföreläsning på kurser i Göteborg, Lund och Uppsala Introduktion till talteknologi Johan Frid (johan.frid@ling.lu.se) 1 Talteknologi Handlar om talet som gränssnitt för datoranvändning Tillämpningar
b) NY KURS (Ange kursnamn, årskurs, önskad läsperiod, schemablocksplacering. Bifoga utkast till kursplan.)
LINKÖPINGS TEKNISKA HÖGSKOLA Tekniska fakultetskansliet FÖRSLAG TILL PROGRAMNÄMND INFÖR ÅR NÄMND/NÄMNDER: Förslagsställare (Namn, funktion, Inst/Enhet) FÖRSLAGET GÄLLER: a) EXISTERANDE KURS (Ange kurskod
Läs- och skrivstöd för dator
Assisterande verktyg Läs- och skrivstöd för dator från 190211 Louise Kjellson Logoped louise.kjellson@ Bild: pixabay.se Centralt skolstöd består av olika verksamheter som syftar till att stötta och utveckla
Kursplan för kurs på grundnivå
Kursplan för kurs på grundnivå Lingvistik IV Linguistics IV 30.0 Högskolepoäng 30.0 ECTS credits Kurskod: LIN400 Gäller från: VT 2015 Fastställd: 2014-09-03 Institution Institutionen för lingvistik Huvudområde:
Dialogue Technologies April 2005
Dialogue Technologies April 2005 En typisk självbetjäningstjänst för web ser ut enligt följande En inledande text för att användaren skall förstå tjänsten En aktuell lista med de 10 vanligast frågorna
Automatisk igenkänning av tal och talare. Automatisk igenkänning av tal. Översikt - taligenkänning. Varför taligenkänning?
GSLT Tal- och talarigenkänning M Blomberg 22-9-9 [ ] Automatisk igenkänning av tal och talare DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ Automatisk igenkänning av tal DWV%ORPEHUJ 7DOPXVLNRFKK UVHO.7+ GSLT Tal- och
Pressmeddelande 2006-03-23. Skriv med rösten - det lönar sig*
Pressmeddelande 2006-03-23 Skriv med rösten - det lönar sig* Många har under åren försökt använda taligenkänning för att förenkla och snabba på skrivprocessen. Många har misslyckats, men idag kan man med
Dialogsystem. Joakim Nivre. Introduktion till språkteknologi. Dialogsystem. Inledning. Mänskliga dialoger. Tidiga dialogsystem. Moderna dialogsystem
Joakim Nivre 1 / 34 Interaktiva datorsystem Kommunikation på (talat) naturligt språk Dialog mellan system och användare Gränssnitt mellan tillämpning och användare 2 / 34 Tillämpningar Samtalsstyrning
Pragmatik. Olika nivåer. Tumregler. Grice s samarbetsprinciper. Pragmatik och diskurs
Pragmatik och diskurs Hercules Dalianis NADA-KTH Email: hercules@nada.kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Pragmatik Studerar vilken mening yttranden har i situationer (Leech, 1983)
Svårigheter - stor variabilitet. Översikt - taligenkänning Automatisk igenkänning av tal Del 1. Varför taligenkänning?
Talteknologi 25-2-3 [ ] Översikt - taligenkänning Automatisk igenkänning av tal Del Mats Blomberg Tal, musik och hörsel KTH Inledning Problem Akustiska analysmetoder Igenkänningstekniker mönstermatchning
Talteknologi: Rolf Carlson Tal, musik och hörsel
Talteknologi och dialogsystem Rolf Carlson, Centrum för Talteknologi, KTH, KTH http://www.speech.kth.se CTT - Centrum för talteknologi Forskningsområden Talproduktion Talperception Kommunikationshjälpmedel
Olika slags datornätverk. Föreläsning 5 Internet ARPANET, 1971. Internet började med ARPANET
Olika slags datornätverk Förberedelse inför laboration 4. Historik Protokoll, / Adressering, namnservrar WWW, HTML Föreläsning 5 Internet LAN Local Area Network student.lth.se (ganska stort LAN) MAN Metropolitan
- ett statistiskt fråga-svarsystem
- ett statistiskt fråga-svarsystem 2010-09-28 Artificiell intelligens II Linnea Wahlberg linwa713 1 Innehåll Introduktion... 1 Grundprinciper för asked!... 2 Retrieval model... 4 Filter model... 6 Komponenter...
Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet 17 mars 2014
Tentamen Marco Kuhlmann, Institutionen för datavetenskap, Linköpings universitet marco.kuhlmann@liu.se 17 mars 2014 Inga hjälpmedel är tillåtna. Maximal poäng finns angiven för varje fråga. Maximal poäng
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
AI-rapport Speech recognition
AI-rapport Speech recognition The process of analyzing an acoustic speech signal to identify the linguistic message that was intended, so that a machine can correctly respond to spoken commands. Anntu228
Ontologier. Cassandra Svensson 2014-01-09
Ontologier Cassandra Svensson 2014-01-09 Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt
BIP Allt är möjligt!
Hej! BIP Allt är möjligt! Övergripande frågor Hur planerar du din undervisning så att den blir inkluderande? Hur återkopplar du så att elever utvecklar sitt lärande? Hur organiserar du klassrummet så att
Svårt att läsa och skriva
It och appar när läsningen glappar Idor Svensson IKEL Svårt att läsa och skriva Dyslexi = Huvudproblem för barn och vuxna Avkoda = Kunna läsa bokstäver (sätta samman till ord) och ord Kirkegaard Skriva
Blue Key Digitala projekt VT
Blue Key Digitala projekt VT 2 2004 Maj 2004 Martin Erikson, E00 Mikael Andersson, E00 Department of Information Technology 0 Lund Institute of Technology Sammanfattning Denna rapport behandlar vårt projekt
Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
PLANERING FÖR ENGELSKA LAG SYD ÅK 7
PLANERING FÖR ENGELSKA LAG SYD ÅK 7 TID: VECKA 45-51 S7:1 LEKTION 1: TORSDAGAR LEKTION 2: FREDAGAR S7:2 LEKTION 1: MÅNDAGAR LEKTION 2: TORSDAGAR ÄMNESOMRÅDE: FOOD, EATING OUT, TABLE TALK. Review of a movie.
TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Introduktion Marco Kuhlmann Institutionen för datavetenskap Vad är språkteknologi? Vad är språkteknologi? Språkteknologi är all teknologi som skapas
Parsning = analys. Parsningsalgoritmer. Användningsområden. L1: Introduktion
Parsning = analys Maskinell analys av naturligt språks strukturer Uppgiften som en parser löser är 1. Acceptera en sträng som grammatisk, samt oftast 2. Ge en strukturell representation av strängen som
Statistiska språkmodeller med klass
Statistiska språkmodeller med klass Experiment med modifiering av träningsdata för statistiska språkmodeller Ida Weidenmark Institutionen för lingvistik och filologi Språkteknologiprogrammet Examensarbete
Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011
Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Artificial)Intelligence) Taligenkänning)
LINKÖPINGS)UNIVERSITET) Artificial)Intelligence) Taligenkänning)! Adam%Annerhult% 2012009017%! Contents' ' ) ) ) ) ) Inledning... 3! Så fungerar taligenkänning... 4! Grundläggande egenskaper i ett taligenkänningsprogram...
Användarhandbok för Automatisk telefonist (inklusive Talad hänvisning)
Användarhandbok för Automatisk telefonist (inklusive Talad hänvisning) MEDDELANDE Informationen i detta dokument tros vara korrekt i alla hänseenden, men garanteras inte av Mitel Networks Corporation (MITEL
Ready for Academic Vocabulary?
Ready for Academic Vocabulary? Forskningsfrågor To what extent do students express that they are prepared for university studies? To what degree can students, at the end of English step 7, recognize vocabulary
SPRÅKTEKNOLOGIPROGRAMMET (STP)
SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket
Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2009
Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2009 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka
Målet är att ge maskiner förmågan att plocka ut information ur
Språkteknologi Mats Dahllöf & Eva Pettersson Institutionen för lingvistik och filologi Språkhantering i datorer med känslighet för språket som språk: Den språkvetenskapliga teorin: datorlingvistik Tillämpningsområdet:
Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?
Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera? FSR: 1, 2, 5 Rogers et al. Kapitel 13 (e/3: 12-13) 160401 Intro utvärdering 2 Översikt Att kunna om utvärdering Observation, kort repetition
Yrkeshögskolan Novia Utbildningsprogrammet i elektroteknik
Grunderna i programmeringsteknik 1. Vad är Känna till nämnda programmering, begrepp. Kunna kompilera högnivå språk, och köra program i det i kompilering, kursen använda tolkning, virtuella programmeringsspråket.
Föreläsning 7: Kognition & perception
Föreläsning 7: Kognition & perception FSR: 3, 4 Att läsa: Kapitel 2-3 i Rogers et al.: Interaction design Översikt Att kunna om perception och kognition Konceptuella modeller Metaforer Paradigm, teorier,
Maskinöversättning möjligheter och gränser
Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?
Kognitiva teorier inom MDI - Introduktion
Kognitiva teorier inom MDI - Introduktion (MDI) Inst. för informationsteknologi http://www.it.uu.se/edu/course/homepage/hci/ht10 Arbetsuppgiften till idag: Identifiera ett tydligt exempel på dålig användbarhet
729G74 IT och programmering, grundkurs. Tema 1, Föreläsning 2 Jody Foo,
729G74 IT och programmering, grundkurs Tema 1, Föreläsning 2 Jody Foo, jody.foo@liu.se Föreläsningsöversikt Kurslogistik Begreppspresentationer Uppgifter i diskret matematik Uppgifter i Python Tema 1:
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Maskinöversättning 2008
Maskinöversättning 2008 F7 Maskinöversättningens mål och möjligheter Systematiska språkskillnader sv-en sv-ty sv-fr sv-sp sv-ry Hur kan de beskrivas? Ge konkreta exempel. Hur kan de tas om hand i maskinöversättningen?
Prövning i grundläggande engelska: GRNENG 2
prövning engelska grund Malmö stad Komvux Malmö Södervärn Prövning i grundläggande engelska: GRNENG 2 A Muntligt prov 1. Samtal kring ett ämne som delas ut vid provet. 2. Romanredovisning (både muntlig
Rapport. Nyttoaspekter av tillgången till en språkdatabas. Daniel Persson. Lars Johannesson. Filip Bonnevier. Stockholm, september 2009
Rapport Nyttoaspekter av tillgången till en språkdatabas Stockholm, september 2009 Daniel Persson Lars Johannesson Filip Bonnevier Netlight Consulting AB www.netlight.se Söder Mälarstrand 27b 118 25 Stockholm
Analys/syntes-kodning
Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk
Tankar om Bliss symbolspråk i dagens värld
Tankar om Bliss symbolspråk i dagens värld Mats Lundälv President www.blissymbolics.org Bliss symbolspråk Har vi bruk för bliss idag? Mitt svar på spörsmålet är naturligtvis; ja men varför och hur? Bliss
Författare: Juha Söderqvist IT-GUI. Version 1.0. Datum
Författare: Juha Söderqvist IT-GUI Version 1.0 Datum 2017-08-18 Innehåll 1. Introduktion... 3 Human-computer interaction... 3 Grafiska användargränssnitt... 4 Operativsystem... 4 Xerox Alto Executive file
Tjänsteprototypning. och tjänsterepresentationer. Johan Blomkvist IDA-HCS-IxS
Tjänsteprototypning och tjänsterepresentationer Johan Blomkvist IDA-HCS-IxS Twitter: @hellibop Dagens föreläsning Tjänsteperspektiv Konceptualiseringar av tjänsteprototyper Tjänsteprototypning 2 Prototyp
Passiva stimulusstyrda processer. Talperceptionsteorier. Sekundära perceptoriska. Primära perceptoriska. Aktiva hypotesstyrda processer
Talperceptionsteorier Passiva stimulusstyrda processer Passiva stimulusstyrda processer Aktiva hypotesstyrda processer Perceptionsteorier Testmetoder Specifik, akustisk information för att identifiera
Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera?
Föreläsning 2: Introduktion till utvärdering varför ska vi utvärdera? FSR: 1, 2, 5 Rogers et al. Kapitel 13 (e/3: 12-13) Analys Utvärdering Implementation Prototyper Krav Design 150327 Intro utvärdering
ClaroDictionary med tal. ClaroDictionary utan tal
ClaroDictionary med tal ClaroDictionary utan tal Manual Artikelnummer 10400 och 10401 1 Innehåll Välkommen till ClaroDictionary...3 ClaroDictionary Översikt...4 ClaroDictionarys verktygsknappar...4 Knappen
Riktiga människor som samtalar. Social närvaro i fjärrundervisning
Riktiga människor som samtalar. Social närvaro i fjärrundervisning Una Cunningham Institutionen för pedagogik, didaktik och utbildningsstudier Una.cunningham@edu.uu.se Språkdidaktiska tankar För en lyckad
Unit course plan English class 8C
Hanna Rüngen Wallner Unit course plan English class 8C Spring term 2018-01-11 w.2-8 forgery safe robbery burglar crime scene Mål och syfte med arbetsområdet Utveckla sin förmåga att: - kommunicera i tal
Matematik och det nya medialandskapet
Matematik och det nya medialandskapet Per Jönsson, Malmö Högskola Thomas Lingefjärd, Göteborgs Universitet 27 januari 2010 Översikt Föränderligt medialandskap Lärande med nya medier Teknologi och programvara
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Föreläsning 5 5DV086 - Programspråk
Föreläsning 5 5DV086 - Programspråk Petter Ericson (pettter@cs.umu.se) Umeå University 6 februari, 2015 Haskell-frågor? Haskell-tips do-syntax State-monaden Dagens plan Programspråksteori Varför? Vad?
1. Vad är ett språk? 1. Vad är ett språk? 2. Språkets struktur och delar. 2. Språkets struktur och delar 2012-01-19
Språket i skolan och samhället Ulf Fredriksson Stockholms universitetet, Avdelningen för internationell pedagogik / institutionen för pedagogik och didaktik vt 2012 Språket i skolan och samhället 1) Vad
Innehåll. Styrdon (ej i boken) Fitts lag (sidan ) Natural user interfaces. Kap 6.2.9, , Kap
Interaktion 2 Innehåll Styrdon (ej i boken) Fitts lag (sidan 527-528) Natural user interfaces Kap 6.2.9, 6.2.11, 6.2.12 Kap 6.3-6.4 Styrdon Styrdon Tangentbord Pekdon Tangentbord QWERTY-layout QWERTY-layout
Interaktiva Bibliotek. Eva Eriksson. IDC Interaction Design Collegium
Interaktiva Bibliotek Eva Eriksson Innehåll Children s Interactive Library, Århus Danmark Ubiquitous Computing, Chalmers Göteborg The Interactive Children s Library Interactivespaces.net Aarhus School
Statistisk mönsterigenkänning
Statistisk mönsterigenkänning Jonas Sandström Artificiell intelligens II Linköpings universitet HT 2011 Innehållsförteckning 1. Innehållsförteckning sid 2 2. Inledning sid 3 3. Statistisk mönsterigenkänning
Digital signalbehandling Digitalt Ljud
Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1
HJÄLPFIL: ELEVAPPLIKATIONEN
HJÄLPFIL: ELEVAPPLIKATIONEN Innehållsförteckning A. Access och webbläsarkrav B. Funktioner i programmet C. Kontrollpanelen: 1. Huvudinställningar 2. Avancerade inställningar D. Om produkten: en kort översikt
Om ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Teknisk / Audiologisk Information. FREE VC och FREE VC Open FREE Exclusive och FREE Exclusive Open
Teknisk / Audiologisk Information FREE VC och FREE VC Open FREE Exclusive och FREE Exclusive Open Översikt Signalbehandling Känn dig FREE alltid och överallt Kort beskrivning Den digitala apparatfamiljen
HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish
HMM-baserad talsyntes An HMM-based Text-To-Speech System applied to Swedish Anders Lundgren Handledare: Jonas Beskow Godkänd:... Examinator:... Rolf Carlson Examensarbete vid institutionen för Tal, Musik
Chapter 1 : Who do you think you are?
Arbetslag: Gamma Klass: 9A Veckor: 34-39 År: 2019 Chapter 1 : Who do you think you are?. Syfte Förstå och tolka innehållet i talad engelska och i olika slags texter. Formulera sig och kommunicera i tal
Drömmaskiner. Den moderna tekniken i människans tjänst Drömmaskiner: Från Minimetern till Jag Vill-appen (från 1998 till idag) Björn Breidegard
Drömmaskiner Den moderna tekniken i människans tjänst Drömmaskiner: Från Minimetern till Jag Vill-appen (från 1998 till idag) Björn Breidegard Certec, Inst. för Designvetenskaper, Lunds tekniska högskola,
Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag
Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska
En röststyrd förarmiljö
En röststyrd förarmiljö April, 005 Dialogue Technologies AB Skalholtsgatan 10 B SE-164 40 Kista, Sweden www.dialoguetech.com En röststyrd förarmiljö Innehållsförteckning 1 Vision, bakgrund Förslag 1 Vision,
Johan Karlsson Johka490. Statistical machine translation JOHAN KARLSSON
Johan Karlsson Johka490 Statistical machine translation JOHAN KARLSSON Innehåll Introduktion... 2 Bakgrund... 3 Statistiska maskinöversättningssystem... 3 Hur ett SMT-system fungerar... 4 Motsvarighetsmodell