Vem är jag? Vilka är ni? Vad gör vi här? Talets produktion, perception och akustik 1 (T-PPA 1) Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Mattias Heldner (kort CV) Docent Talkommunikation, KTH 2008 PhD Fonetik, Umeå universitet 2001 Forskare, KTH Tal, musik och hörsel 2002 Postdoc, TeliaSonera Sweden AB, R&D 2005 Konsult, Södermalms talteknologiservice (STTS) 2006 Vik. Lektor, Göteborgs universitet 2006 Logopedi är läran om språk-, tal-, röst- och sväljningsstörningar samt behandling av dessa. Talets produktion, akustik och perception T-PPA 1 Kursmoment 1 av 4 i fonetik, inom kursen Lingvistik: Grundkurs inom Logopedprogrammet. 1 2 http://www.ling.gu.se/~jonas/teaching/tppa/a/ http://www.studentlitteratur.se/fonetikensgrunder 3 4
http://www.ling.gu.se/~mattias/t-ppa_1/index.htm http://www.ling.gu.se/~mattias/t-ppa_1/info2008/ kurslitteratur.htm 5 6 Dagens lektion: Introduktion, talets byggstenar 7 8
Vad är fonetik? Vad har det med logopedi att göra? Fonetik (av grekiska!"#$ (fone), "ljud") är läran om ljud, vetenskapen om talet, särskilt talljuden. Den ägnar sig åt både att beskriva språkljud, bl.a. hur de bildas (talproduktion), och hur de uppfattas och förstås(talperception). (källa: Wikipedia) Logoped är en skyddad yrkesbeteckning för en utbildad person, vars uppgift är att utreda och avhjälpa olika kommunikationsbekymmer som en sökande patient är drabbad av. Det kan till exempel röra sig om talproblem hos barn eller afasi. Logopeder kan även arbeta med att bedöma och behandla sväljningssvårigheter, röststörningar och stamning. (källa: Wikipedia) Logopedi är läran om språk-, tal-, röst- och sväljningsstörningar samt behandling av dessa. Studier i ämnet logopedi har sin utgångspunkt i den språkliga kommunikationsförmågans betydelse för människans perception, kognition, kommunikation och sociala samspel. (källa: Utbildningsplan för logopedprogrammet) Vem behöver fonetik? Alla som sysslar med språk... Språklärare behöver t ex kunna diagnostisera uttalsfel för att kunna korrigera dem men även förstå hur stavning och uttal hänger ihop för att veta när stavningen kan bli problematisk Logopeder behöver både förstå hur talapparaten fungerar rent generellt och kunna diagnosticera tal för att kunna behandla det Talteknologer behöver förstå tal för att skapa modeller av talet i talsyntes, taligenkänning, dialogsystem osv. 9 10 Vem behöver fonetik? Lingvister som sysslar med historisk lingvistik, t ex uttalseller stavningsförändringar över tid Lingvister som ska göra fältarbeten, fonologiska beskrivningar eller skrivsystem till obeskrivna språk Dövlärare eller döva som vill förbättra sitt tal Skådespelare, präster, lärare, annat folk som talar inför folk Alla, kort sagt... Hur vi människor kommunicerar med tal Ur talarens perspektiv hur talet produceras Ur ett överföringsperspektiv vad talet har för akustiska egenskaper Ur lyssnarens perspektiv hur talet uppfattas Fonetikens 3 huvudområden: talets produktion, akustik och perception, med andra ord! Man kan vara intresserad av fonetik av olika anledningar... 11 12
Ur språkligt perspektiv Ljudsystem i olika språk (Fonologi) Hur många vokaler har ett visst språk? Hur påverkar olika ljud varandra när de kombineras till ord? Talets rytm och melodi (Prosodi) Hur ser betoningssystemet ut? Hur grupperas och avgränsas enheter i språket från varandra? Hur används prosodin i turtagningen? Ur språkligt perspektiv Inomspråklig variation (Dialektologi, Sociolingvistik) Dialekter, yrkesspråk, talstilar, brytning... Icke-lingvistisk variation (Paralingvistik), dvs. egenskaper i talet som är förbundna med talarens: Kön, ålder, sinnestillstånd, hälsotillstånd, talstyrka... Och mycket, mycket mer... 13 14 Ur medicinskt perspektiv Språket och hjärnan (Neurolingvistik) Lokalisering Test som vägledning för neurokirurgi Fysiologiska talhandikapp (Talfysiologi) Pre/postoperationell vägledning och träning Hörselhjälpmedel (Audiologi) Skadeanpassade filter Cochlearinplantat Taktila hörselhjälpmedel 15 Ur medicinskt perspektiv Rehabilitering (Logopedi) Diagnosticering Testning 16
Två pionjärer inom den forskning som rör förhållande mellan talet och hjärnan Ur medicinskt perspektiv Carl Wernicke 1848 1904 Paul Broca 1825 1880 17 18 Ur medicinskt perspektiv: Cochleaimplantat Hur låter det då? Ja, det kan ju bara den säkert veta som har ett, men här är ett par simuleringar. 4 kanaler + original 8 kanaler + original 19 Ur psykologiskt perspektiv Talperception Bottom up eller top down? Kategorisk perception? Är talperceptionen speciell? Psykoakustik Vilken är minsta uppfattbara skillnad för Tonhöjd (halvtonssteg)? Ljudstyrka (3 db steg)? Duration (100 ms steg)? 20
Ur psykologiskt perspektiv Ur juridiskt perspektiv Psykofysik Viken är den relevanta skalan för att beskriva upplevd tonhöjd, ljudstyrka, duration? Rättsfonetik (Forensic phonetics) Rättslingvistik (Forensic linguistics) I filmens underbara värld är ju detta en enkel sak 21 22 Voiceprint en gammal dröm Ordet voiceprint var förstås avsett att leda tankarna till fingerprint. 23 Ur juridiskt perspektiv Talaridentifiering/talarverifiering Vem är talaren? Är det samma talare? Voice line-ups (röstkonfrontation) Akustisk analys Lyssnarpaneler Talstilsigenkänning Vilken region kommer talaren ifrån? Vilken samhällsklass tillhör talaren? Ursprungsigenkänning Viket land kommer talaren ifrån? 24
Ur talteknologiskt perspektiv Signalbehandling Spektralanalys Källa/filterteori Talsyntes Vilken typ ger bäst uppfattbarhet/ flexibilitet? Vilken roll spelar prosodin? Ur talteknologiskt perspektiv Taligenkänning Var sitter den språkligt mest relevanta informationen? Hur kan vi inkorporera omvärldskunskap? Dialogsystem Hur beteer sig användare i kontakt med talande och lyssnande datorer 25 26 Ur talteknologiskt perspektiv Gunnar Fant med den första svenska talsyntesen OVE I Talarigenkänning Var sitter den mest talarspecifika informationen? Är talare tillräckligt olika för att säkert kunna identifieras Hur bra är vi som mänskliga lyssnare? 1953 27 28
... och här några år senare med OVE II Det verkar finnas många anledningar att studera fonetik... Ska vi sätta igång? Vi ska börja med det här med med vad som är så speciellt med det mänskliga talet... 1962 29 30 Rhesusapornas läten Den språkliga koden: Vad är det som är så fiffigt med människornas tal? 1) Fin mat 2) Fin mat 3) Sämre mat 4) Larm 5) Underkastelse 6) Underordning 7) Återhämtning 8) Rop på hjälp 31 32
Den språkliga koden: Rhesusaporna vs. människan Rhesusaporna har en relativt liten repertoar (25-50 betydelser) Rhesusapornas läten är helheter man kan inte ta isär fin mat för att kombinera t ex mat med något annat för att få sämre mat 33 Den språkliga koden: Rhesusaporna vs. människan Människornas tal är segmenterbart, dvs uppbyggt av ett begränsat antal mindre bitar: Vokaler, konsonanter, prosodiska mönster mm Bitarna kan kombineras på många olika sätt men enligt vissa mönster... Fonem kombineras till stavelser och morfem fonotax Morfem kombineras till ord morfologi Ord kombineras till yttranden syntax/ grammatik... till en potentiellt oändlig repertoar 34 Talets byggstenar Alla mänskliga språk är uppbyggda på samma sätt: små enheter kombineras till större enheter som kombineras till ännu större enheter. Två nyckelbegrepp i detta sammanhang är morfem och fonem. Ordbildning: morfem Betydelsebärande morfem (fest, gå, blå, himmel) kallas innehållsmorfem språkets minsta betydelsebärande enheter Funktionsmorfem (t ex bildar adjektiv av substantivisk ordstam fest+lig, eller substantiv på adjektivisk ordstam tjock +is) 35 36
Ordbildning: morfem Morfem som används för att konstruera avledningar kallas avledningsmorfem (prefix, suffix) Böjningsmorfem specificerar ord i termer av bestämdhet, numerus, tempus mm Ordbildning: sammansättning Sammansatta ord består av två eller flera innehållsmorfem + ev avledningsmorfem Svenskan och många andra språk vimlar av ord och ordformer bildade med sammansättning, avledning och böjning 37 38 Ordbildningarna Mer ordbildning 1) bild ordstam 2) bild+ning avledning 3) ord+bildning sammansättning 4) ordbildning+ar böjning 5) ordbildningar+na böjning Flick-or-na-s Filip-stad-s-väg-en Ene-by-berg-s-väg-en Gran-berg-s-träsk-vägen Gran-bäck-s-torp-s-vägen Evedal-s-{bron, gatan, vägen, näs, bäcken, stigen, kroken, forsen, vadet, berget, kullen, udden, sjön, ängen, backen, kvarn, bo, by, hagen, gränd, torp, gård. liden...} 39 40
Fonem Morfemen fogas ihop av vokaler och konsonanter fonem Fonemen betyder ingenting i sig själva Men kan kombineras till obegränsat många meningsfulla strukturer Varje språk har sin egen uppsättning vokaloch konsonatfonem 41 CONSONANTS (PULMONIC) THE INTERNATIONAL PHONETIC ALPHABET (revised to 2005) Bilabial Labiodental Dental Alveolar Post alveolar Retroflex Palatal Velar Uvular Pharyngeal Glottal Plosive ;<<= ><<? @<<" A<<B C<<D E<<F G Nasal H I J K # L M Trill! N O Tap or Flap <<<<! P <Q Fricative R<<S T<<<U V<<W <X<$$Y Z<<[ \<<% ]<<^ _<<` a<<b c<<d e<<f Lateral fricative g<<h Approximant & i <j k l Lateral approximant m <' n o Where symbols appear in pairs, the one to the right represents a voiced consonant. Shaded areas denote articulations judged impossible. CONSONANTS (NON-PULMONIC) Clicks Voiced implosives Ejectives p Bilabial ( Bilabial Examples: " Dental q Dental/alveolar ; Bilabial! (Post)alveolar # Palatal > Dental/alveolar r Palatoalveolar s Velar C Velar ) Alveolar lateral t Uvular X Alveolar fricative OTHER SYMBOLS /<<<<Voiceless labial-velar fricative <<$<Voiced labial-velar approximant < Alveolo-palatal fricatives <<Æ Voiced alveolar lateral flap VOWELS Close Close-mid Open-mid Open Front Central Back $ % & ' ( ) 6 7 8 + *!, -!. / 0 1 2 9 5 3 4 " # + : 2005 IPA Where symbols appear in pairs, the one to the right represents a rounded vowel. SUPRASEGMENTALS!" Primary stress $±!# 42 Ø<<<<<Voiced labial-palatal approximant! Simultaneous Z and _ Voiceless epiglottal fricative Grovfonetiska vokallistan Grovfonetiska konsonantlistan i! vit (ij vit) " vitt y! syl (yj syl) # bytt ø! föl ø föll e! vet (e behöva) $! väv $ rätt %! hal a hall &! hus (&' hus) ( hund u! bo (u' bo) ) bott o! gå * gått æ! här æ kärv œ! smör œ förr + betedde [p,] pappa [p] spik [b] bada [t,] tå [t] stil [-] bort [d] dag [.] bord [k,] katt [k] skål [/] gå [m] mat [0] omvända [n] nu [1] hörn [2] en_get [3] lång [0] anföra [r] rak [4] röd... [f] fisk [v] vad [5] vin [s] såg [6] fors [7] kök [8] jul [h] hes [9] behöva [:] sjö [6] försök [l] lök [;] kärl 43 44
Fonotax Grammatik/syntax Hur konsonanter och vokaler kan fogas ihop till morfem, dvs vilka fonem som får kombineras med vilka och deras inbördes ordningsföljd Främst hur konsonanter får kombineras (C)(C)(C)V(C)(C)(C) * Jag läsa vill universitet på Jag vill läsa på universitetet 45 46 Denes & Pinson The Speech Chain Sammanfattningsvis: Människornas språk kan uttrycka mer än Rhesusapornas... 47 48
Talkommunikationskedjan 1. Neurolingvistisk programmering 2. Neuromuskulär fas 3. Organisk fas 4. Aerodynamisk fas 5. Akustisk fas 6. Neuroreceptiv fas 7. Neurolingvistisk identifiering Det finns mycket som kan gå snett varför fungerar det ändå så bra? Omvärldskunskap Konsensus med kommunikationspartnern Välgrundade förväntningar 49 50 Talkommunikationskedjan Talkommunikationskedjan Vi behöver inte all information i signalen Vi matchar det relevanta mot vad vi redan vet eller förväntar oss Detta leder till att vi förstår även om informationen är ofullständig Men det kan gå fel och då blir det förstås missförstånd Återkoppling Kinestetisk feedback Proprioceptiva och taktila sensationer Auditiv feedback Stimulering av talarens hörselorgan av ljudvågor från talarens egen mun dels via luften, dels via benledning 51 52
Återkoppling Hörande som blir döva eller gravt hörselskadade får sitt tal gradvis försämrat först påverkas prosodin (melodin i talet) Man kan framkalla stamning hos personer som normalt inte stammar genom att låta dem lyssna på sitt eget tal i hörlurar med någon tiondels sekunds fördröjning Talkommunikationskedjan och fonetiken Allmän och grundläggande klassificering av talljud, t ex IPA, är huvudsakligen baserad på vad som händer i den organiska fasen av talet Den akustiska fasen är den del av talet som är lättast att studera instrumentellt!akustisk fonetik 53 54