Nya analys(- och insamlings)metoder i talforskning och talteknologisk forskning. Jens Edlund KTH Tal, Musik och Hörsel

Relevanta dokument
Medicinsk Informatik VT 2004

Inledning till Wavesurfer av Christine Ericsdotter (Lingvistik, Stockholms universitet)

Människa-datorinteraktion och användarcentrerad design

Föreläsning 6: Analys och tolkning från insamling till insikt

Bilaga 4: Tidsuppskattning. Wikispeech. en användargenererad talsyntes på Wikipedia

Tillämpad experimentalpsykologi [2] Tillämpad experimentalpsykologi [1] Tillämpad experimentalpsykologi [3] Empirisk forskningsansats

Kursens bakgrund. Samverkande system. Områdesfördjupningar. Space, place and location. Simulering av folkmassor. Design av samverkande system

Ventilen. Nytt på IT- fronten. System som kan göra intelligenta saker, såsom att efterlikna mänskligt beteende och tänkande

Design av användargränssnitt. Processen snarare än produkten

Utvärdering. Användbarhet. + beställarperspektivet! Innehåll. Varför?

Infrastrukturer för registerbaserad forskning. Maria Nilsson Enheten för registerforskning 24 maj 2016

uppmärksamhet Riktad och delad Riktad Relationships between attentional concepts and general states of arousals Selective attention

Ärade herr kansler, herr rektor, herrar dekaner, övriga närvarande,

Kognitiva teorier inom MDI - Introduktion

Patricija Jaksetic Erik Wistrand. Psykologi del 2 - kognition. Förra gången pratade vi om perception...

VAD ÄR KOMMUNIKATION?

Vad gör Norrbotten till en etta i den digitala utvecklingen

Design av användargränssnitt

Datormetaforen. Från människa till dator Från dator till människa o.s.v.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Design av användargränssnitt

Kvalitativ metodik. Varför. Vad är det? Vad är det? Varför och när använda? Hur gör man? För- och nackdelar?

Kognitiv modellering inom MDI

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Högre kognitiva funktioner

Tillämpad experimentalpsykologi [2] Tillämpad experimentalpsykologi [1] Empirisk forskningsansats. Tillämpad experimentalpsykologi [3] Variabler

Medicinsk Informatik VT 2005

MILJÖÖVER- VAKNING & FRAMTIDEN

Att läsa: Sharp, Helen, Rogers, Yvonne & Preece, Jenny E. (2007) Interaction design. Wiley. Kapitel 11.

Beslutsuppgifter. Programbeskrivning. Samhällsvetenskapliga fakulteten

Tillgänglighet och teknologi en omöjlig möjlighet?

Prestations- och belastningsanalys för utveckling av svensk elithandboll

Image quality Technical/physical aspects

Intelligenta kranar för utomhusbruk

DIGITALISERING TEKNIK MED MÄNNISKA

Steg för Steg Att använda Statistics explorer med data från SKLs databas

Forskningsperspektiv inom MDI Vetenskap, mångvetenskap och tvärvetenskap Vad är forskning inom MDI?

Arbetsuppgifter. Vad gör du? Egentligen? Vad behövs? Gruppincheckning

Etik, försiktighet och hållbar utveckling

DIGITALISERINGEN OCH MÄNNISKAN. Anna Ståhlbröst Professor Informationssystem Luleå Tekniska Universitet

Minnet - begrepp och principer

Studenters erfarenheter av våld en studie om sambandet mellan erfarenheter av våld under uppväxten och i den vuxna relationen

Förstärkt operatörsstöd vid fjärrstyrd skutknackning. Sökt belopp från VINNOVA: kr Sökande organisation: Interactive Institute Swedish ICT

ARTIFICIELL INTELLIGENS

Detta exjobb handlar om att skapa felträd utifrån specificerade rutiner i reparationshandböckerna för samtliga av Hägglunds fordon.

Datorkocken gör entré

samt lite algoritmer en kortfattad introduktion för studenter på Intro:DV

Medicinsk Informatik VT 2003

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

APD? APD Auditory Processing Disorder finns det? Elsa Erixon Hörselläkare. Hörsel- och Balansmottagningen Akademiska sjukhuset

Beteendevetenskaplig metod. Metodansats. För och nackdelar med de olika metoderna. Fyra huvudkrav på forskningen Forskningsetiska principer

Föreläsning 5: Analys och tolkning från insamling till insikt. Rogers et al. Kapitel 8

Interaktionsteknik. Föreläsning 6, Kognition perception. Översikt. Vad händer i medvetandet?

Assessing GIS effects on professionals collaboration processes in an emergency response task

Föreläsning 6: Kognition och perception. Rogers et al. Kapitel 3

Örat. Johnson, Kap 3. Basic audition

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

Teoretisk lingvistik och datalingvistik. Robin Cooper

LOGOPEDEXAMEN DEGREE OF MASTER OF SCIENCE IN SPEECH AND LANGUAGE PATHOLOGY

Naturligt ljud skapar effektivare ljudmiljöer

KORT GUIDE OM REKRYTERINGEN AV DIGITALA MEDARBETARE Hur du kommer igång med Robotic Process Automation

Cybersäkerhet några utmaningar. Teodor Sommestad, Doktor, Förste forskare Informationssäkerhet & IT-arkitektur Linköping

Frågetekniker. Föreläsning 3, Utvärderingstekniker MDI, Lena Palmquist 1. Än en gång: JEdit (Py Kollberg) Loggning. Tolkande dataanalys

Kvalitativ metod. Varför kvalitativ forskning?

Interaktion 2 STYRDON, PEKDON OCH ANNAN INTERAKTION ATT RÄKNA MED

Lektion 3. Anteckningar

The sexy job in the next 10 years will be statisticians, said Hal Varian, chief economist at Google. And I m not kidding.

TEKNISKA SYSTEM. Undervisning av tekniska system utmaningar och möjligheter

Ljud och interaktion. Kirsten Rassmus-Gröhn, Avd. för Rehabiliteringsteknik, Inst. för Designvetenskaper

Statistisk mönsterigenkänning

Skapandet av grunden för en svensk talbank

Hur biologiska system optimerar sin egen produktionsstyrning

TDDI16 Datastrukturer och algoritmer. Algoritmanalys

Människan och Tekniken. Fö 3 Människan och tekniken. Perception. Visuell perception

Innehåll Andreas Rosengren

Operatörer och användargränssnitt vid processtyrning

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Angreppssätt. Vilka är våra studieobjekt? Population och stickprov

Epidemiologiska data i hälsoriskbedömning Hur kommer epidemiologiska studier in? Maria Feychting

Forskningsfinansieringen för psykisk hälsa i Europa är förhållandevis liten jämfört med den

Kursplan för kurs på grundnivå

Professor och forskningschef bodahlbom.se

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

New York är en av världens mest kända städer. Här har New York valts som exempel på hur man kan tänka och arbeta geo-grafiskt.

Grundläggande textanalys. Joakim Nivre

725G61 - Laboration 7 Implementation av ett API. Johan Falkenjack

SPRÅKTEKNOLOGIPROGRAMMET (STP)

Computer Science, masterprogram

Registerforskning Oktober 2018, Stockholm City Conference Centre. Möjligheter med Artificiell Intelligens inom registerforskningen

Välkommen till Workshop Forskning och utveckling för den moderna digitala handeln

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Att utvärdera offentlig politik med registerdata

Automation, Visuell Planering och Obemannat flyg Billy Josefsson Luftfartsverket, Jonas Lundberg och Danwei Tran Luciani, Linköpings universitet

Språkstörning ur ett interaktivt perspektiv konsekvenser för lärande och utveckling ICF. Mötet? Kropp Aktivitet & Delaktighet Miljö

Modelleringsmetodologi

Multivariata metoder

Samarbete gav både MONEY och P2000 en skjuts framåt

Översikt. 1. Avgränsa kognitiv psykologi. Prototyper och scheman. 2. Tillämpade/praktiska skäl

Energi ur ett användarfokus. Lisa Ossman och Carolina Hiller

Transkript:

Nya analys(- och insamlings)metoder i talforskning och talteknologisk forskning Jens Edlund KTH Tal, Musik och Hörsel

Om mig Arbetar som forskare på KTH Tal, Musik och Hörsel Lingvistik, fonetik, datorlingvistik i grunden Talforskning och talteknologisk forskning sedan 90- talet - Industri och akademi - Huvudsakligen KTH 2015: blandade databehovsrelaterade sidouppdrag

Om KTH Tal, Musik och Hörsel Grundades 1951 av Gunnar Fant

Om tal Inte talad text (och text är sällan skrivet tal) I normalfallet - Ansikte mot ansikte - Kraftigt multimodalt - Emergent, transient Inspelat tal är en representation av serier av mänskliga beteenden som växer fram, inkrementellt, över tid

Om talteknologi Analys, beskrivning, visualisering, modellering, kategorisering, igenkänning, manipulation, generering av tal Syften från grundforskning till diagnos och vård, till underhållning och information, till transaktion och effektivisering... Och så kommunikation, förstås Använder text som resurs Bör använda ljud (åtminstone talljud) Dessutom allt som finns att tillgå!

Om taldata Idag: stora datamängder (paradfall för big data ) Svår distinktion mellan insamling och analys - I en iterativ process - Det som är resultat i en evaluering blir indata till nästa steg - Stegvis automatisering - Human in the loop...

Brister (?) i befintliga metoder Offrar ofta ekologisk validitet för experimentell kontroll - Inspelningar i laboratoriemiljö - Krystade och sökta uppgifter - Urval baserat på politik och (missriktad?) vetenskapsteori snarare än hur användargruppen ser ut Offrar skärpa för generalitet - Standardiserade uppgifter - Breda frågeställningar Offrar effektivitet för återbrukbarhet - Standardscheman för uppmärkning som inte passar uppgiften - Stanndardiserade evalueringar som inte mäter det som är relevant

Nya metoder Aktivt område - Det görs ganska mycket här - Mycket sker mer eller mindre dolt i industrin Nyckelpunkter - Wisdom of the crowd - Analys/insamling som positiv sidoeffekt - Icke-linjära processer - Kollaborativ analys (människa-människa och människadator)

Några specifika metoder Audience response systems - ARS Wizard of Oz Crowd sourcing Human computation/games with a purpose Människa/dator-återkoppling Visualisering

Audience Response Systems Hollywood! Stringent utvärderad metod Men: måste återskapas

ARS results General statistics - Subjects clicked on average 29 times per subject (1/6 seconds) - Varying from 10 clicks (1/17 seconds) to 50 clicks (1/3.5 seconds). KDE Estimates

Temporal precision and latency Cross-correlation between ARS and objective data Small (0.22, 0.25, 0.27) correlation 0.3 0.2 0.1 0-0.1 0.1 0.3 0.5 0.7 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 2.7 click+cut click + match click+both

Precision and recall Peak height vs cumulative number of identifiable problems in the peak-preceding regions Peak height Identifiable Unidentifiable

Vad ARS kan ge Snabb annotering (realtid*annoterare) Låg kognitiv belastning Lämplig för öppna, svåroperationaliserade frågor Lämplig för långa transienta datasekvenser

Trollkarlen från Oz Gammal teknik Hur många känner till den? Kan användas på många nivårer Human-in-the-loop - Komponentbaserade trollkarlar Wizard-As-Subject Computer-in-the-loop

Crowd sourcing Amazons mekaniska turk i all ära... Wikipedia och andra - Exempel: Syntesprojekt

Human computation/games with a purpose Von Ahns exempel: - ESP game - Captchas Statistik från, låt säga, Word Feud Perceptionstester i form av spel

Återkopplingsloopar Människa och maskin i samverkan Få ut mer än summan av delarna Exempel: syntesinläsning med utvärdering - Inläsning, analys, återsyntes, bedömning(ar, omläsning) - Ger data på varje nivå

Visualisering Uttnyttja människans (än så länge) bättre mönstermatchning Cocktail omedelbara ljudmiljöer Ljudbrowsing - Proportioner: män/kvinnor, missnöja/nöjda - Sökning i parameterrymder

Tack för er tid!