KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten

KÄLLA-FILTER Repetition - Repetition av resonans och filter Komplexa ljudvågor: deltoner Amplitudspektrum - Talapparaten som resonator - Talapparaten som källa-filtersystem - Spektrum, Spektrogram, spektrograf Analys/dekomposition av komplexa vågor: Fourrier analys Periodiska signaler och operiodiska signaler och deras spektra Fria och bundna svängningar Repetition (ff) Talapparaten i källa-filter perspektivet Bundna svängningar och resonans Resonans och filter Filteregenskap, filterkurva, transferfunktion Bandbred Lågpassfilter, högpassfilter, bandpassfilter Ljud och klang uppstår i samverkan av ett källjud och ett filter Språkljud uppstår efter samma princip: det finns en ljudkälla och filter (resonatorer) Ljudkällor: tonande källa, bruskälla, pulskälla --> exhalatorisk luftström stöter på ett hinder Filter: ansatsrörets ihåligheter tjänar som resonatorer --> ett system av filter med flera toppar Ljudkällor i talapparaten Ljudkällor i talapparaten (ff) Tonande källa: struphuvud, periodiska svängningar bidrar till en periodisk källsignal med övertoner, typiskt källspektrum som är avtagande med -12dB/oktav Pulssignal: källsignalen är operiodisk och har en avtagande amplitud över hela spektrum (-6dB/oktav) Bruskälla: kan bildas på olika ställen i talapparaten mellan glottis och läpparna med en trång passage genom vilken luftströmmen pressas, varvid turbulent brus uppstår; källsignalen är operiodisk och har i närmaste konstant amplitud över hela spektrum 1

Filter i talapparaten Filter i talapparaten (ff) Håligheter mellan ljudkällan och läpparna/näsborrar bidrar främst med sina resonansegenskap För tonande orala ljud med glottis som ljudkälla (t.ex. vokaler och sonorantiska orala konsonanter: munhålan och området nedanför velofarynx (nedre svalget) För tonande nasala ljud (konsonanter och vokaler) tillkommer nasofarynx (nässvalget) och näshåla För tonlösa ljud med icke-laryngal ljudkälla (obstruenter) finns resonansrum mest nedanför hindret, som tjäner som ljudkälla, men också resonansrum uppströms (dvs. mellan hindret och andningsapparaten) Talapparaten har flera resonatorer med sina respektiva filteregenskap (filterkurva, transferfunktion) Vuxna talare tre resonansfrekvenser upp till 3kHz för orala vokaler --> tre filtertoppar Filter i talapparaten (3) För män en resonans för varje khz För kvinnor med vanligtvis kortare ansatsrör ligger de något högre och därmed glesare Förändringar av form och längd av ansatsröret påverkar resonansfrekvenserna Samma typ av artikulatorisk variation av kvinnor och män påverkar akustiska förändringar/resonansfrekvenser på liknande sätt Vokaler och deras resonanser Artikulatorisk variation för vokaler (olika tungpositioner) för olika resonanskurvor med sig Exempel: för schwa som bildas utan någon trängre passage med nästan konstant tvärsnitt genom hela ansatsröret --> resonanstoppar på jämn avstånd Däremot: finns det mer variation i ansatsrörets tvärsnitt för andra vokaler som resulterar i en annorlunda fördelning av resonanstoppar Vokaler - resultat av källa och filter Ingående glottal källsignal med egen styrka (amplitud) som adderas ihopp med ansatsrörets resonansegenskap för varje frekvens Även om transferfunktionen inte visar en generell amplitudavtagning mot högre frekvens så är högre toppar svagare i det resulterandet spektrum pga avtagande amplitude i källsignalen Deltonernas frekvenser påverkas inte alls! Vokaler - resultat av källa och filter (ff) Om ingående källsignalens tonhöjd varieras men transferfunktionen hålls konstant, uppfattas också vokalens kvalitet som samma, men på olika tonhöjd Exempel: transferfunktion för schwa adderad med grundton på 100Hz eller 200Hz förnimmas som ljud med samma kvalitet (nämligen schwa), en gång på lägre tonhöjd, en gång på högre tonhöjd Inte individuella deltonernas framhävning relevant för vokalens identitet 2

Viskning - resultat av källa och filter Glottis som bruskälla, med mindre styrka än tonande ljud Källsignalens spektrum genomgående med konstant amplitud Talapparatens transferfunktion för individuella vokaler Energitoppar/amplitudtoppar på samma frekvenser som för tonande vokaler Energitoppar/amplitudtoppar lägre pga källsignalens mindre styrka Filtertoppar och formanter Energitoppar i det fullständiga ljudspektrum (källfunktion plus transferfunktion) av talljud kallas för formanter Toppen med lägsta frekvensen kallas för första formanten (F1), den näst högre för andra formanten (F2), sedan tredje formanten (F3) osv. Frekvensvärdet som har störst amplitudvärde står för formantfrekvensen Filtertoppar och formanter (ff) Formanternas intensitet i db Intensitetsnivå betecknas som L1, L2, L3 osv i analogi till de andra värden (L = level ) För vokaler har F1 högst intensitet, sedan F2 följd av F3 Sonoranter har stark F1, men svaga högre F Tonlösa frikativor svag F1 och F2 men starka högre formanter Formanter och bandbredd Olika formanterna har olika bandbredd Bandbredd betecknas med B och samma siffer som tillhörande formant: F1 och B1 (L1), F2 och B2 (L2), F3 och B3 (L3) osv Energitoppens bredd 3dB under toppens högsta punkt Vokalernas lägre formanter ca. 50Hz, högre formanter är bredare Konsonanter bredare formanter Formanter och bandbredd (ff) Konsonanter bredare formanter med lägre intensitet Hindret i talapparaten bidrar till dämpning Nasala ljud (vokaler och konsonanter) har större bandbredd pga näshålans mjuka väggar, som absorberar ljudvågen Formanter Formantfrekvens mest relevanta egenskapen av ett ljud Syntetisk variation av intensitetsnivå eller bandbredd påverkar inte uppfattningen av vokalens identitet, det gör däremot variation av formantfrekvens Syntetisk variation av intensitetsnivå eller bandbredd påverkar uppfattningen av naturlighet av ett ljud Topp med mycket låg frekvens i spektrum ingen formant utan resultat av deltonernas styrka 3

Spektralanalys För att anlysera talets spektra använder man spektrografer, som framställer spektrogram Spektrogram är akustiska registreringar med tre dimensioner: tid, frekvens och intensitet Ett spektrum för varje punkt längs tidsaxeln Sammansättning av spektrala skivor i tidsförloppet Spektrogram Horisontellt, vågrätt, x-axeln: tidsdimension Vertikalt, lodrätt, y-axeln: frekvens Svärtningsgrad: intensitet Bandpassfilter körs längs y-axeln Bredband kring 300Hz Smalband kring 50Hz Spektrogram (ff) Spektrogram (3) Bredband: sämre detalj i frekvensdimension, men bättre upplösning i tidsdimension --> fångar in flera deltoner tillsammans --> glottispulser synlig för lägre F0 (t.ex. manlig röst) Smalband: bra upplösning i frekvensdimension --> deltoner syns Kombination av bra upplösning i frekvensoch tidsdimension tekniskt inte genomförbart Kombination av bra upplösning i frekvensoch tidsdimension tekniskt inte genomförbar Större bandbred fördelaktig för formantanalys, då deltoner integreras i talapparatens filterkurva Bättre upplösningen i tidsdimension önskvärd, då hastiga variationer är synliga (t.ex. glottis- och klusilpulser) Akustik och Perception Akustik och Perception (ff) Hittills: akustiska mönster i samband med talproduktionen Inte alla mätbara deler lika väsentliga för perceptionen/igenkänning/förnimmelöse av specifika ljud Ibland ersätter andra akustiska drag de primära Tonhöjd: Grundfrekvens (F0) Deltoner kan ersätter den förnimmade grundtonen Öppna vokaler högre F0 än slutna vokaler (ca.20hz) när de uppfattas ligger på samma tonhöjd Viskandet: tonaccentskillnaden uppfattas även när grundtonen inte är nävarande 4

Akustik och Perception (3) Akustik och Perception (4) Ljudstyrka: intensitet, frekvens, duration Längd: duration (varaktig längd) Människan hör inte alla frekvenser lika bra Mellan 50ms och 200ms uppfattas längdvariation som styrkevariation Normalisering: ljud med inneboende mindre intensitet behöver inte har samma intensitet som dem med inneboende starkare intensitet för att de uppfattas har samma styrka Samma varaktighet, då ett dynamisk ljud uppfattas vara längre än ett statisk ljud Kvalitet (klangfärg): typisk energifördelning (energitoppar) för enskilda ljud Röstfärg, attityd etc. inte relevant 5