Spektrogram att göra ljud synligt 2011-02-23 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 80 % kväve och 20 % syre. Denna gasblandning trycks mot jordens yta av jordens gravitation. o Gasen utövar ett konstant tryck på alla föremål som finns i gasen. o Detta tryck kallar man för atmosfäriskt tryck. Vad våra öron förnimmer som ljud är avvikelser från det atmosfäriska trycket. Föremål som vibrerar i gasblandningen gör att det växelvis bildas förtätningar och förtunningar i gasen. o En förtätning innebär att luftrycket höjs en kort stund. o En förtunning innebär att lufttrycket sänks en kort stund. Dessa förtätningar och förtunningar fortplantar sig utåt, som ett expanderande klot, ifrån källan. o Det är dock inte en förflyttning av materia som äger rum. I stället är det energi som fortplantar sig utåt genom att knuffa luftmolekylerna fram och tillbaka. o http://www.gmi.edu/~drussell/demos/waves/wavemotion.html o http://www.kettering.edu/~drussell/demos/rad2/mdq.html o Jämför detta med människor på en idrottsläktare som bildar en mexikansk våg. En mexikansk våg kan röra sig runt hela läktaren. Trots det behöver varje enskild människa på läktaren bara stå upp och sedan sätta sig ned igen vid rätt tidpunkt. o http://www.kettering.edu/~drussell/demos/waves-intro/waves-intro.html o Varje enskild luftmolekyl behöver således inte röra sig mera än någon hundratusendels millimeter för att en förtätning/förtunning ska förflytta sig långa vägar. Vad är frekvens för någonting? Frekvens är ett mått på hur ofta någonting händer under en bestämd tid. Man brukar ange frekvens i Hz (Hertz), vilket innebär ggr per sekund. o Ljud med låg frekvens upplever vi som dova/mörka/djupa. o Ljud med hög frekvens upplever vi som gälla/vassa/pipiga. Frekvensomfånget för mänskliga öron sträcker sig från 20 Hz till 20000 Hz. o Det riktigt djupa mullrandet i en åska ligger under 50 Hz i frekvens. o En basröst har en grundtonsfrekvens på under 100 Hz. o Ett bi skapar ett surr på ungefär 200 Hz med sina vingslag. o En stickmyggas inande ligger på sådär 600 Hz. o Ett knott inar på ca 1000 Hz. o Genom att vissla kan man skapa toner mellan sådär 500 och 3000 Hz. o En del elektroniska apparater (teve, t.ex.) kan ge upphov till pipande ljud som kan ligga mellan 5000 och 20000 Hz i frekvens. Sidan 1 (7)
Omfånget för frekvensuppfattning är olika för olika individer, men för alla gäller att det minskar med åldern, i synnerhet känsligheten för de högsta frekvenserna. o 10-åring hör ljud på frekvenser upp till 19 000 20 000 Hz. o En 25-åring hör ljud upp till 15 000 17 000 Hz. o En 45-åring hör ljud upp till 13 000 16 000 Hz. Spektrogrammet att göra ljud synligt Ljud kan göras om till visuell information genom att man analyserar ljudets frekvenssammansättning. Denna process kallas för Fourieranalys. Resultatet framställs i en graf som har tid på x-axeln och frekvens på y-axeln. En sådan graf kallas för spektrogram. En enkel ton på ett spektrogram En sinuston är den enklaste typen av ljud en ren ton med en bestämd frekvens och en konstant styrka. När man visslar frambringar man en ton som är ganska lik en ren sinuston. o Nedan har vi ett spektrogram som visar en vissling på 1000 Hz. o För de som vill koppla till musiklära motsvarar detta tonen B5 på ett ungefär. o Y-axeln visar oss vilken/vilka frekvenser är inblandade. o X-axeln visar hur frekvensen ändras över tid. o I det här fallet blir det ingen förändring över tid tonen är konstant på 1000 Hz. Visslingens frekvensomfång varierar mellan individer. o En lägsta ton på 600 800 Hz är inte ovanligt. o En högsta ton på 2500 3000 Hz är inte ovanlig. o Testa ditt eget visselomfång nästa gång du har laboration! Sidan 2 (7)
En melodi på spektrogram Man kan vissla en melodi, och då syns tonbyten tydligt på spektrogrammet. o Nedan har vi början på Blinka lilla stjärna: Varje streck representerar en ton i melodin. o Varje nota (förutom den sjunde och den fjortonde) upprepas två gånger. Den sjunde och den fjortonde är i stället dubbelt så långa som de andra. o Frekvensen för den lägsta tonen (de två första och den sista) är ungefär 1100 Hz. o Frekvensen för den högsta tonen (femte och sjätte) är ungefär 1800 Hz. Dova/djupa/mörka toner. Mycket dova toner (100 200 Hz) kan man inte frambringa med vissel. o Tonen i spektrogrammet nedan har gjorts genom att blåsa över en flaskmun. Sidan 3 (7)
Komplexa ljud på spektrogram Hittills har vi bara tittat på enkla toner nu tittar vi på mera komplexa ljud. Ett komplext ljud är ett ljud som har flera frekvenskomponenter samtidigt. o De flesta ljud både i naturen och i människans mindre naturliga omgivning är komplexa. o Till och med visslingarna som vi har tittat på är egentligen inte rena sinustoner, utan innehåller en del andra frekvenskomponenter (som dock är ganska svaga). Det ljud som vi åstadkommer med rösten är ett komplext ljud låt oss titta närmare på det. I spektrogrammet nedan har en manlig talare uttalat vokalen [ɛ] (som i lät). o Vi ser sinustoner på många olika frekvenser samtidigt. o Tonerna kommer med jämna mellanrum. o Det är som om man har tiotals tomtar i halsen som står och visslar. Det är stämbanden som skapar detta regelbundna mönster. o Den lägsta frekvensen (150 Hz) återspeglar hur ofta stämläpparna slår ihop per sekund det kallar vi för grundtonsfrekvens eller f0 (läses f-noll). o I det här fallet hålls grundtonsfrekvensen helt konstant på 150 Hz, d.v.s. stämläpparna slår ihop 150 ggr per sekund. o Strecken ovanför grundtonen kallas för övertoner. o Gemensamt kallas grundtonen och övertonerna för deltoner. o Varje överton är ett helt multiplikat av grundtonen det betyder att första övertonen är 300 Hz, den andra 450 Hz, den tredje är 600 Hz o.s.v. o Sådana harmoniska frekvensmönster är typiska för periodiska ljudkällor i naturen. Själva röstkällan om vi inte hade något huvud. o Det ljud som skapas av stämbanden formas när det åker upp igenom talröret. o Själva stämbandsljudet, röstkällan, är ganska rått och strävt ljud det låter egentligen artificiellt eller metalliskt på något sätt. Sidan 4 (7)
Olika vokaler ut på spektrogram Talröret formar det ljud som röstkällan producerar till olika vokaler o Vi kan alltså ställa in talröret på olika sätt för att skapa olika vokaler vokalklangen bestäms av hur vi ställer in talröret, inte vad vi gör med stämbanden. o På följande spektrogram uttalas vokalsekvensen [ i a u i ] med en konstant grundtonsfrekvens (f-noll = 137 Hz). i a u i o De olika deltonerna som ingår i rösten ändras i styrka (svärta på spektrogrammet) när vi byter vokal. Hos [i] har deltonerna mest styrka vid ungefär 300 och 2200 Hz; hos [a] har de mest styrka vid ungefär 700 och 1300 Hz; hos [u] är de starkast vid ungefär 400 Hz och 800 Hz. o Spektrogrammet kan ställas in så att detta framgår på ett något tydligare sätt. i a u i Sidan 5 (7)
Det första spektrogrammet på föregående sida är ett smalbandsspektrogram. o Smalbandsspektrogrammet gör en noggrann analys av sådant som händer i frekvensled man kan se precis vilka frekvenser är inblandade. o Det är däremot svårt att se vad som händer över tid p.g.a. dålig tidsupplösning. Det senare spektrogrammet är ett bredbandsspektrogram. o Bredbandsspektrogrammet gör en noggrann analys av det som händer i tidsled man kan t.ex. se varje gång stämläpparna klappar ihop. o Frekvensledet är däremot suddigare fast detta är en fördel när man vill analysera talrörets effekt på röstkällan, eftersom dessa effekter ofta flera deltoner samtidigt. o När det gäller språkljud är man oftast mest intresserad av den grova frekvensstrukturen då är det alltså bättre att visa ljudet som bredbandsspektrogram. Det som skapar vokalklang är de breda frekvensbanden som vi ser i bredbandsspektrogrammet. Sådana band kännetecknar vokaler och kallas för formanter. o Första formanten i [i] är runt 300 Hz, den andra är på 2200 Hz och den tredje på knappt 3000 Hz. o För [a] är första formanten runt 700 Hz, den andra runt 1300 Hz och den tredje ungefär 2300 Hz. o För [u] är första formanten ungefär 400 Hz och den andra ungefär 800 Hz. Den tredje formanten i [u] brukar vara mycket svag, och det är den här också. (Notera att [u] låter som vokalen i bod och dos, inte som vokalen i bud och hus.) Periodiska och operiodiska ljud Hittills har vi tittat enbart på periodiska ljud. o Periodiska ljud skapas av regelbundna svängningar eller vibrationer, t.ex. av stämläpparnas svängningar. o Periodiska ljud kännetecknas av en regelbunden frekvensstruktur, med en grundton och övertoner som är hela multiplikat av grundtonen. Operiodiska ljud brus och skrap o Operiodiska ljud blir till när oregelbundna svängningar äger rum. o T.ex. brukar ett operiodiskt ljud uppstå när man skrapar två föremål mot varandra eller när man skapar turbulens i en luftström. o Det finns ingen grundton eller övertoner i operiodiska ljud. o I operiodiska ljud är frekvensstrukturen alltså oregelbunden. o Svärtan i spektrogrammet har därför en oregelbunden spridning. Vitt brus o Brus som sprider sig jämnt över hela det hörbara frekvensområdet (från 20 till 20000 Hz) kallas för vitt brus. o Det brus som man hör i sin omgivning är dock ofta format på ett eller annat sätt, så att det inte sträcker sig över hela frekvensområdet. Vissa typer av språkljud är brusiga o Frikativor skapas genom att man gör en förträngning i munhålan. Man trycker ut luft genom förträngningen, luften blir turbulent och ger upphov till ett brusigt ljud. o Explosionsfasen i klusiler skapas på ett liknande sätt. När man upphäver klusilens tillslutning rusar luften snabbt ut genom öppningen, blir turbulent och skapar ett brusljud. Sidan 6 (7)
Operiodiska ljud (brusljud) på spektrogram Nedan har vi två spektrogramexempel på frikativor. o Till vänster har vi [f] i sekvensen [ɐfɐ] och till höger [s] i sekvensen [ɐsɐ]. ɐ f ɐ ɐ s ɐ Jämfört med [s] är [f] svagt och sprider sig över en stor del av frekvensområdet. o [f] är det språkljud som mest liknar vitt brus detta eftersom brusljudet inte utsätts för någon filtrering i talröret. o [s] är ljudstarkt (mycket svärta i spektrogrammet) och har mest styrka i området runt 6000 Hz. o Dessa olikheter i brusets frekvensstruktur är det som avgör klangförnimmelsen. Sidan 7 (7)