et Kommunikation med ljud Vad är fonetik? Vad är fonetik? Fonetikens tre huvudområden Produktion Akustik Perception Men dessa kan appliceras på en mängd området som t.ex.... Fonetik i ett språkligt perspektiv Ljudsystem i olika språk (Fonologi) Hur många vokaler har ett visst språk Hur påverkar olika ljud varandra när de kombineras till ord? ets rytm och melodi (Prosodi) Hur ser betoningssystemet ut? Har språket kontrastiv accent? Hur realiseras frågeintonation? Fonetik i ett språkligt perspektiv Inomspråklig variation (Dialektolgi, Sociolingvistik) Dialekter Yrkesspråk stilar Brytning Icke-lingvistisk variation (Paralingvistik) Egenskaper i talet som är förbundna med talarens: Kön Ålder Sinnestillstånd Hälsotillstånd styrka... och mycket, mycket mer Fonetik i ett medicinskt perspektiv Språket och hjärnan (Neurolingvistik) Lokalisering Test som vägledning för neurokirurgi Fysiologiska talhandikapp (fysiologi) Pre/postoperationell vägledning och träning Hörselhjälpmedel (Audiologi) Skadeanpassade filter Cochlearinplantat Taktila hörselhjälpmedel Rehabilitering (Logopedi) Diagnosticering Testning Fonetik i ett psykologiskt perspektiv perception Bottom up eller top down Kategorisk perception Är talperceptionen speciell? Psykoakustik Vilken är minsta uppfattbara skillnad för Tonhöjd Ljudstyrka Duration? Psykofysik Viken är den relevanta skalan för att beskriva upplevd Tonhöjd, ljudstyrka, duration? Fonetik i ett teknologiskt perspektiv Signalbehandling Spektralanalys Källa/filterteori syntes Vilken typ ger bäst uppfattbarhet Vilken roll spelar prosodin? igenkänning Var sitter den språkligt mest relevanta informationen? Hur kan vi inkorporera omvärldskunskap? arigenkänning Var sitter den mest talarspecifika informationen? Är talare tilräckligt oilka för at säkert kunna identifieras Hur bra är vi som mänskliga lyssnare? Fonetik i ett juridiskt perspektiv aridentifiering Vem är talaren? Är det samma talare? - Voice line-ups - Akustisk analys - Lyssnarpaneler stilsigenkänning Vilken region kommer talaren ifrån? Vilken samhällsklass tillhör talaren? Ursprungsigenkänning Viket land kommer talaren ifrån? Gunnar Fant med den första svenska talsyntesen 1953
... och här några år senare 1962 Vad händer egentligen när vi talar med varandra? en tanke får lingvistisk struktur som omvandlas till riktade nervimpulser som instruerar musklerna i talapparaten som producerar en ljudvåg som utbreder sig i rummet och möter lyssnaren vars trumhinnor sätts i rörelse en rörelse som fortplantas till basilarmembranet som påverkar hårcellerna och hörselnerven som omvandlar signalen till nervimpulser som transporteras till hjärnan där de ges en lingvistisk tolkning Et volia! Budskapet har nått sitt slutmål! En mycket komplicerad kedja med andra ord där mycket kan gå fel, men för det mesta ändå inte gör det. produktion och talperception försiggår på tre nivåer, såväl hos talaren som lyssnaren: Lingvistisk Fysiologisk Akustisk På den lingvistiska nivån genereras resp. tolkas den språkliga koden i lingvistiska enheter Sats Fras Ord Fonem (enskilt ljud) Den lingvistiska koden omvandlas till en fysiologisk kod som sätter musklerna i talapparaten i rörelse Som genererar en fysisk kod (ljudvågor) Muskulära rörelse och akustiska resultat varierar mycket: mellan olika talare för olika yttranden av samma talare i olika kommunikativa situationer med talstilen med talstyrkan Låt oss ta en närmare titt på några av komponenterna i den här komplicerade kedjan och låt oss då börja med talare som sin egen lyssnare, dvs... Återkoppling Vi vet att återkoppling är viktigt, men mycket är okänt när det gäller denna hur denna mekanism reglerar talet i detalj. Vi vet dock att Hörande som blir döva eller gravt hörselskadade får sitt tal gradvis försämrat först påverkas prosodin (melodin i talet) Åtminstone vissa typer av stamning har att göra med återkopplingen
Man kan framkalla stamning hos personer som normalt inte stammar genom att låta dem lyssna på sitt eget tal i hörlurar med någon tiondels sekunds fördröjning. Här ett exempel: Utan fördröjning Med 0.4 s fördröjning Innan vi går vidare med talet kan det vara intressant att jämföra talet med en annan viktig form av lingvistisk kommunikation, nämligen skriften. Tecknen oberoende av kontext Ljuden beroende av kontext Jämförelse med skrift sätter sökarljuset på många centrala aspekter av tal, så låt os titta lite närmare på de olika punkterna i tur och ordning och då börja med den första. Tecknen oberoende av kontext Ljuden beroende av kontext Hur många gånger har vi inte både sagt och hört: Och då sa han precis såhär. Jag kommer ihåg precis vartenda ord! Men det gör vi inte kommer ihåg vartenda ord alltså. Vårt minne för den exakta ordalydelsen räcker på sin höjd några sekunder. Detta är t.ex. ett problem med vittnesmål. Vittnen tror ofta att de kommer ihåg exakt, men många studier har visat att så inte är fallet. Vi tar till oss budskapet, men glömmer nästan omedelbart den exakta ordalydelsen. En annan betydelsefull skillnad är snabbheten i kommunikationen Tecknen oberoende av kontext Ljuden beroende av kontext... Här några exempel Man kan skilja på talhastighet (speech rate) och artikulationshastighet (articulation rate). Under normalt tal artikulerar man ungefär 70-80 % av taltiden. Tabellen nedan visar exempel på uppmätta artikulationshastigheter för några olika talstilar. Medelduration (s) hastighet fonem stavelser fonem/s stav./s fon/min. stav/min Diktläsning 0.115 0.295 8.7 3.4 521 203 Prosaläsning 0.086 0.207 11.6 4.8 698 290 Spontantal 0.075 0.176 13.3 5.7 796 341 En relevant jämförelse här är att en mycket driven maskinskrivare kan komma upp i hastigheter på c:a 400 nedslag i minuten, dvs knappt diktläsningshastighet. Läshastigheten kan förstås vara större för en van läsare. en är standardiserad men i tal är variationen stor. Tecknen oberoende av kontext Ljuden beroende av kontext språksvarianter inom ett givet språk Genuin dialekt (folkmål, bygdemål) Regional riksspråksvariant Sociolekt Situationell variation yrkesspråk, jargong slang ritual, ceremoni
Om skriften är standardiserad, så gäller detta verkligen inte för talet. Inte ens det vi brukar tala om som rikssvenska (eller standardsvenska) är befriat från en ganska avsevärd variation. Går vi sedan till de varianter av talspråk som de flesta använder i sin vardag någon form av regional standard eller dialekt kan variationen vara enorm. Just den dialektala variationen inom det svenska språkområdet håller på att kartläggas i ett stort svenskt forskningsprojekt, Swedia 2000. Tolv talare, män och kvinnor, äldre och yngre, har spelats in på 107 orter någorlunda jämt fördelade inom Sverige och de svensktalande delarna av Finland. SweDia 2000: Svenska dialekter 12 talare per dialekt: 6 äldre: 3 kvinnor och 3 män 6 yngre: 3 kvinnor och 3 män I vissa fall har inspelningar gjort av dialekt och regional svenska. Vissa dialektområden är tvåspråkiga. SweDia 2000: Svenska dialekter Orter där inspelningar har gjorts i Sverige och Finland är markerade med bollar: blå Lund gröna Stockholm röda Umeå SweDia 2000: Svenska dialekter I Finland talas svenska i de områden som kartan utvisar. Färgerna visar var inspelningar har gjorts av SWEDIA 2000. Låt oss göra en liten utvikning här och bekanta oss lite närmare med den dialektala variationen i det svenska språkområdet. Exemplen kommer från projektet SweDia 2000 hemsida swedia.nu Tillbaka till annan variation i talet, variation med avseende på kön och ålder. Kvinna Man Flicka (7 år) Pojke (7 år) Den något märkliga frasen är hämtad från en inspelning där variation i talstyrka studerades. I just de här exemplen är dock talstyrkan den för talarna normala. Ytterligare en skillnad består i att skriften består av diskreta tecken, medan talet är kontinuerligt Tecknen oberoende av kontext Ljuden beroende av kontext Att skriften är diskret innebär bl.a. att man kan konstruera palindromer, dvs. ord eller meningar som blir desamma när man läser dem baklänges. Ordet anna blir t.ex. anna även baklänges. Men hur är det då med talet. Låt oss lyssna! framlänges baklänges
En lite mer avancerad palindrom, men vad är det egentligen han säger?? baklänges framlänges Medan tecknen är helt kontextberoende varierar språkljuden alltid mer eller mindre beroende på kontexten. Tecknen oberoende av kontext Ljuden beroende av kontext Lyssna på följande: 1) Det var manen jag sa. 2) Det var baden jag sa. och 3) a ur manen 4) a ur baden 5) Det var baden jag sa, med a ur manen inklippt i baden. Ett problem som hänger intimt samman med kontextproblemet är segmenteringsproblemet. ljuden följer på varandra utan några mellanrum (bortsett från pauser mellan fraser och liknade). Lyssna t.ex. på följande: Jag det är inte så lätt att avgöra, men hör vi ett lite längre stycke är det tvärtom så att vi har lite svårt att förstå hur det kunde låta så konstigt för nu är det ju kristallklart, eller hur? Hur är det då möjligt för oss att uppfatta de enskilda ljuden? Att vi kan uppfatta de enskilda ljuden (åtminstone under vissa omständigheter) är klart, annars skulle vi inte kunna skilja på t.ex. bil och pil. Vad säger han egentligen? Ja, ett svar är att talförståelse åtminstone delvis är vad man kallar top-down. Med detta menas att vi tolkar det vi hör genom att jämföra det med förväntningar som genereras av det vi redan hört plus sådant som vi vet av andra skäl. Låter det komplicerat? Låt oss göra ett litet experiment så klarnar det nog. Ja, ett svar är att talförståelse åtminstone delvis är vad man kallar top-down. Med detta menas att vi tolkar det vi hör genom att jämföra det med förväntningar som genereras av det vi redan hört plus sådant som vi vet av andra skäl. Låter det komplicerat? Låt oss göra ett litet experiment så klarnar det nog. Var i frasen kommer bruset? Exempel 1 Exempel 2 Exempel 3
Rätt svar Fonemet inom parentes var utbytt mot ett brusljud Exempel 1 Under na(tt)en släpade soldaterna försiktigt fram kanonen till skogsdungen Exempel 2 Under natten släpade sol(da)terna försiktigt fram kanonen till skogsdungen Exempel 3 Under natten släpade soldaterna försiktigt fram (ka)nonen till skogsdungen Betydelsen av ordinitial information. Det finns en hel del forskning som visar att vi känner igen ord långt innan de uttalats färdigt. Hur långt innan beror på en rad faktorer som kontext, hur vanliga orden är, om vi får några ledtrådar att gå på (semantic priming) etc. Betydelsen av ordinitial information. Exempel 1 1 2 3 4 5 6 7 8 Exempel 2 1 2 3 4 5 6 7 8 Exempel 3 1 2 3 4 5 6 7 8 Vi tänker oftast inte på den variation som finns i talljuden; ett a är ett a. Men analyserar man talljudens akustiska egenskaper upptäcker man snart att variationen är mycket stor. Man behöver bara tänka på hur olika talet låter beroende på om det produceras av kvinnor eller män, barn och vuxna. Några exempel på just a. Att vi kan hantera denna variation skulle man kunna tro beror på att vi som vuxna talare hunnit skaffa oss sådan erfarenhet att vi har en mycket stor databas att hitta jämförelser ur. Men så enkelt är det inte. Spädbarn, så små som 10 15 veckor gamla klarar åtminstone av att höra att ett a är ett a även om det uttalas av olika talare. För att visa den saken gjorde Kuhl m.fl. följande experiment. Spädbarn (18 20 veckor gamla) lärde sig att skilja mellan vokalen [a] och vokalen [i] uttalade av en kvinnlig talare. Inlärningen gick till på följande vis. Paralingvistisk variation När den kvinnliga rösten säger vokalen [a] händer inget speciellt, men när hon säger [i] börjar en leksaksbjörn till vänster om barnet spela på en trumma. Barnet lär sig snart att när [i] hörs kommer något skojigt att inträffa och tittar då spontant mot björnen. Vad händer då om man byter talare och det istället är en manlig talare som uttalar vokalerna? Jo, barnet reagerar rätt omedelbart på första försök. Barnet har alltså förmåga att generalisera vokalkvaliteterna utan att de knyts till någon speciell talare och detta utan någon speciell förgående träning. Till sist lite om variation som funktion av talstyrkan. I ett forskningsprojekt jag medverkat i var just de akustiska konsekvenserna av variation i talstyrka det som studerades. Här följer några exempel.
Paralingvistisk variation Paralingvistisk variation Paralingvistisk variation Version 1 2 3 4 5 Avstånd (m) 0.3 1.5 7.5 37.5 187.5 Fonerat tal Viskat tal Version 1 2 3 4 5 Avstånd (m) 0.3 1.5 7.5 37.5 187.5 Fonerat tal Viskat tal Version 1 2 3 4 5 Avstånd (m) 0.3 1.5 7.5 37.5 187.5 Fonerat tal Viskat tal Kvinnlig talare Manlig talare Barn Det finns med andra ord mycket som kan gå snett så varför går det då så bra? Omvärldskunskap Konsensus med kommunikationspartnern Välgrundade förväntningar Vi behöver inte all information i signalen Vi matchar det relevanta mot vad vi redan vet eller förväntar oss Detta leder till att vi förstår även om informationen är ofullständig Men det kan gå fel och då blir det förstås missförstånd Den språkliga koden Uttryck och innehåll, form vs. betydelse Inget nödvändigt samband mellan uttryck och innehåll (tecknets arbiträritet) Undantag: ljudsymbolik Den språkliga koden Språkliga enheter: ljud, stavelse, ord, fras, mening, text kombinationen styrs av språkspecifika regler => grammatik grammatik: - fonologi - morfologi -syntax - semantik Fonologi Språkets ljudinventarium fonem: minsta betydelseskiljande ljudenhet i ett språk (/s/) (bakre vs. främre /r/) regler för hur dessa ljud får bilda stavelser eller ord --> kombinationer betoning intonation Morfologi Beskriver de minsta betydelsebärande enheterna i ett språk morfem och deras funktion, och hur de bildar ord huset, två morfem: hus + -et => ordstam och best. form
Syntax Regler för kombination av ord i grammatiska meningar Semantik Språkligt innehåll ordbetydelse betydelse av en mening betydelse av en kommunikativ situation => kunskap om kontexten/världen