3D- LJUD. Binaural syntes med hjälp av HRTF- filter och duplexteorin. DT1174 Ljud som informationsbärare Sandra Liljeqvist

Relevanta dokument
Källorienterat ljud Del 1

VARFÖR LJUD OCH HÖRSEL?

Varför ljud och hörsel?

1 Figuren nedan visar en transversell våg som rör sig åt höger. I figuren är en del i vågens medium markerat med en blå ring prick.

Ljud och interaktion. Kirsten Rassmus-Gröhn, Avd. för Rehabiliteringsteknik, Inst. för Designvetenskaper

Ljudinteraktion. Kirsten Rassmus-Gröhn, Avd. för Rehabiliteringsteknik, Inst. för Designvetenskaper

TFEI02: Vågfysik. Tentamen : Lösningsförslag

TFEI02: Vågfysik. Tentamen : Svar och anvisningar. t s(x,t) =s 0 sin 2π T x. v = fλ =3 5 m/s = 15 m/s

Technical Method For Producing 3D Audio

Ljudfysik Patrik Eriksson 2001

Bilateral anpassning med BAHS

Akustiska faktorer som inverkar vid ljudlokalisering

I Rymden finns ingen luft. Varför kan man inte höra några ljud där?

Produktion av 3D-ljud

Ljudteknik 5p tch Hz from Scra

MEDIESIGNALER INTRODUKTION

TFEI02: Vågfysik. Tentamen : Svar och anvisningar. t 2π T x. s(x,t) = 2 cos [2π (0,4x/π t/π)+π/3]

FYSIKUM STOCKHOLMS UNIVERSITET Tentamensskrivning i Vågrörelselära och optik, 7 poäng, FyL2 Tisdagen den 19 juni 2007 kl 9-15

Centralt innehåll. O Hur ljud uppstår, breder ut sig och kan registreras på olika sätt. O Ljudets egenskaper och ljudmiljöns påverkan på hälsan.

Ljud. Låt det svänga. Arbetshäfte

= T. Bok. Fysik 3. Harmonisk kraft. Svängningsrörelse. Svängningsrörelse. k = = = Vågrörelse. F= -kx. Fjäder. F= -kx. massa 100 g töjer fjärder 4,0 cm

Vår hörsel. Vid normal hörsel kan vi höra:

Formelsamling finns sist i tentamensformuläret. Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7,5hp Kurskod: HÖ1004 Tentamenstillfälle 1

3. Metoder för mätning av hörförmåga

I can t believe it s not surround sound

Bilaga A, Akustiska begrepp

Preliminära resultat. Ljudutbredning Påverkan av väder och vind. Vad bestämmer ljudutbredningen? Hur väl stämmer beräkningsmetoden?

Problem Vågrörelselära & Kvantfysik, FK november Givet:

Svar och anvisningar

Planerad station, Misterhult.

Kod: Datum Kursansvarig Susanne Köbler. Tillåtna hjälpmedel. Miniräknare Linjal Språklexikon vid behov

Ljudteknikern.se - din ljudtekniker på nätet

Laboration 1 Fysik

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University

Talperception. Talperception. Örat. Örat

Digital Signalbehandling i Audio/Video

Vad är ljud? När man spelar på en gitarr så rör sig strängarna snabbt fram och tillbaka, de vibrerar.

Kapitel 35, interferens

1. Ge en tydlig förklaring av Dopplereffekt. Härled formeln för frekvens som funktion av källans hastighet i stillastående luft.

(ii) Beräkna sidoförskjutningen d mellan in- och utgående strålar, uttryckt i vinklarna θ i och tjocklekar t i. (2p)

Svar: Inbromsningssträckan ökar med 10 m eller som Sören Törnkvist formulerar svaret på s 88 i sin bok Fysik per vers :

Grundläggande Akustik

Kod: Datum Kursansvarig Susanne Köbler. Tillåtna hjälpmedel. Miniräknare Linjal Språklexikon vid behov

Mål med temat vad är ljud?

DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1. Frekvensfunktioner FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM. x(n)= Asin(Ωn)

Talets akustik repetition

Vågrörelselära och optik

Lösning till tentamen i Medicinska Bilder, TSBB31, DEL 1: Grundläggande 2D signalbehandling

C-UPPSATS. Låter konsthuvudstereo illa vid högtalarlyssning?

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University

Instuderingsfrågor till Hörseln. HÖRSELN. Allt ljud vi hör är ljudvågor i luften, När ljudvågorna når in örat så hörs ljudet.

Ljud, Hörsel. vågrörelse. och. Namn: Klass: 7A

FYSIKUM STOCKHOLMS UNIVERSITET Tentamensskrivning i Vågrörelselära och optik, 10,5 hp, FK4009 Torsdagen den 21 augusti 2008 kl 9-15

F2 Samhällsbuller, Psykoakustik, SDOF. Samhällsbuller i Sverige. Socialstyrelsens miljörapport 2009

Handledning laboration 1

CROS/BiCROS. En överblick från Signia. signia-pro.se/crosnx

undanträngda luften vilket motsvarar Flyft kraft skall först användas för att lyfta samma volym helium samt ballongens tyngd.

BINAURALT LJUD I TÄVLINGSINRIKTADE SPEL

FAFF Johan Mauritsson 1. Föreläsningar. Våglära och optik. Världens minsta film. Projekten

Spelares inställning till HRTF-teknik i FPS-spel. SEBASTIAN BRIEGER och FREDRIK GÖTHNER

HRTF lösning för stereodipol

DT1130 Spektrala transformer Tentamen

Grundläggande akustik. Rikard Öqvist Tyréns AB

Vågrörelselära och optik

Ljudets och ljusets böjning och interferens

Bildbehandling i frekvensdomänen

Mätningar med avancerade metoder

Laboration i tidsdiskreta system

Faltningsreverb i realtidsimplementering

Svar och anvisningar

Mätning av högtalarens tonkurva

BFL102/TEN1: Fysik 2 för basår (8 hp) Tentamen Fysik mars :00 12:00. Tentamen består av 6 uppgifter som vardera kan ge upp till 4 poäng.

TNMK054 - LJUDTEKNIK 1 FILTER OCH VCF

92FY27: Vågfysik teori och tillämpningar. Tentamen Vågfysik. 17 oktober :00 13:00

Andra EP-laborationen

DEN RUNDA TUNNELN EN UNDERSKATTAD FIENDE

PROV I FYSIK KURS B FRÅN NATIONELLA PROVBANKEN

Upp gifter. c. Hjälp Bengt att förklara varför det uppstår en stående våg.

BINAURAL LJUDLOKALISERING AV VERTIKALA LJUDKÄLLOR

Uppgifter. Uppgifter. Uppgift 2. Uppgift 1

Examensarbete kandidatnivå

Vågrörelselära och optik

WALLENBERGS FYSIKPRIS

WALLENBERGS FYSIKPRIS

Där a = (1, 2,0), b = (1, 1,2) och c = (0,3, 1) Problem 10. Vilket är det enda värdet hos x för vilket det finns a och b så att

Ljudalstring. Luft Luft Luft Luft Luft Luft Luft Luft. Förtätning

Gyptone Undertak 4.1 Akustik och ljud

Grundläggande signalbehandling

Laborationsrapport. Joseph Lazraq Byström, Julius Jensen och Abbas Jafari Q2A. 22 april Ballistisk pendel

Lösningar till Tentamen i fysik B del 1 vid förutbildningar vid Malmö högskola

God ljudmiljö i skola

i(t) C i(t) = dq(t) dt = C dy(t) dt y(t) + (4)

Svängningar och frekvenser

Vågrörelselära och optik

Audio & Videoteknik 2D2021, 2D1518

Ultraljudsfysik. Falun

Hörapparaten som öppnar upp din värld

3. Mekaniska vågor i 2 (eller 3) dimensioner

Frekvensplanet och Bode-diagram. Frekvensanalys

Lab lanserade R.A. Moog Inc. en ny synt: Minimoog. Den var designad av Bill Hemsath och Robert Moog och kom att revolutionera musikhistorien.

Transkript:

3D- LJUD Binaural syntes med hjälp av HRTF- filter och duplexteorin DT1174 Ljud som informationsbärare Sandra Liljeqvist sanlil@kth.se 2012-11- 14

Inledning Mitt mål är att illustrera binaural syntes med två olika metoder, nämligen HRTF-filter och duplexteorin. Binaural syntes innebär att efterlikna hur vi, med våra två öron, lokaliserar ljudkällor och skapa illusionen av att ett ljud kommer ifrån olika platser i rummet. Detta med en stereo-ljudfil som lyssnas på genom ett par hörlurar. För båda metoderna har jag endast fokuserat på horisontalplanet då vi är extra känsliga för individuella skillnader i ytterörats form och huvudets storlek när det gäller att lokalisera ljud i höjdled. Bakgrund Koordinatsystem Eftersom vi i det här fallet endast rör oss i horisontalplanet krävs bara ett tvådimensionellt koordinatsystem. Vinkeln som används för att bestämma riktningen i horisontalplanet (för det annars sfäriska koordinatsystemet) kallas azimuth och brukar ofta gå från 0 till 180 på höger sida om huvudet och från 0 till -180 på vänster sida. HRTF En metod för att återskapa de ledtrådar som behövs för att lokalisera en ljudkälla är att undersöka impulssvaret från ljudkällan på trumhinnan. Dess utseende beror på hur ljudet har interagerat med överkroppen, huvudet och öronmusslorna och bidrar till att vissa frekvenser förstärks och andra dämpas. Detta kallas Head Related Impulse Response (HRIR) och det som i praktiken används för att falta ljudet är dess fouriertransform som kallas Head Related Transfer Function (HRTF). HRTF är en funktion av fyra variabler, frekvensen och tre koordinatvariabler, och räcker för att positionera en ljudkälla i både sidled, höjdled och avstånd. En stor del i hur vi uppfattar ett ljuds positionering beror på individuella detaljer som exempelvis hur öronmusslan är utformad och huvudets storlek. Detta skapar självklart problem då ett filter kommer att fungera olika bra för olika människor. Dessa skillnader blir, som tidigare nämnt, extra påtagliga i höjdled, men är mindre uppenbara i sidled. På grund av detta brukar HRTF-databaser ofta innehålla flera olika uppsättningar filter med vissa variationer, för att passa så många som möjligt. Duplexteorin En metod för modellering är den så kallade duplexteorin. Denna beskriver de starkast bidragande faktorerna till det binaurala hörandet, nämligen skillnaden i ankomsttid och intensitet mellan de båda öronen. Dessa beräknas för ett sfäriskt huvud utan ytteröron och kallas Interaural Time Difference (ITD) och Interaural Level Difference (ILD). 2

Så länge ljudet inte kommer rakt framifrån eller bakifrån kommer ljudvågsfronten att anlända till respektive öra vid olika tidpunkter. Denna tidsskillnad utnyttjar hjärna för att kunna lokalisera ljudkällan. Även skillnader i ljudstyrka är en viktig ledtråd för positioneringen. I första hand höga frekvenser dämpas och upplevs som svagare vid det bortre örat. Detta beror på att diffraktion inträffar för våglängder större än huvudets diameter. Dessa böjs alltså runt huvudet och ljudet upplevs som ungefär lika starkt för båda öronen. När våglängden är kortare än huvuddiametern kan däremot huvudet betraktas som akustiskt stort och det skapas en så kallad ljudskugga. Reproduktion Filer binauralsyntes_hrtf.m raw_synthesis.m IRC_1003_R_HRIR.mat binauralsyntes_itd_ild.m ITD.m Beskrivning De tre första filerna ovan utgör ett exempel på binaural syntes med hjälp av HRIR/HRTF. Värdena för impulssvaret återfinns i filen IRC_1003_R_HRIR.mat och matlab-filen raw_synthesis.m sätter ihop ljudet, med hjälp av dessa värden, längs en given bana. Båda dessa kommer från Listen HRTF Database skapad av Institut de Recherche et Coordination Acoustique/Musique. För att lyssna på ljudet har jag satt ihop den körbara filen binauralsyntes_hrtf.m som, i stort sett, anger banan, anropar raw_synthesis för att skapa ljudet och spelar upp det. Tanken är att få känslan av att ljudkällan snurrar runt huvudet, men glöm inte att ljudet måste lyssnas på genom ett par hörlurar för att effekten ska kunna upplevas. De två nedre filerna är helt egenskapade och ska illustrera binaural syntes med hjälp av approximativa beräkningar enligt duplexteorin. ITD (tidsskillnaden) beräknas i funktionen ITD.m (för beräkningsmetod se bilaga 1) och för att efterlikna ILD har jag använt mig av lågpassfilter med olika brytfrekvenser för olika vinklar. Detta stämmer inte helt överens med hur det fungerar i verkligheten, som självklart är mycket mer komplicerad, men ger en acceptabel illustration. För att lyssna på ljudet används filen binauralsyntes_itd_ild.m och även denna måste lyssnas på genom hörlurar. Förhoppningen är att skapa illusionen av att ljudkällan är framför och bakom ett par gånger för att sedan snurra runt huvudet. 3

Bilaga 1 - Beräkningar ITD För beräkning av ITD har jag använt mig av en metod där skillnaden i ankomsttid endast är beroende av skillnaden i direkt sträcka mellan ljudkällan och de båda öronen. Jag har således gjort en grov approximation och inte tagit hänsyn till den ytterligare sträckan runt huvudet. cosθ = sinθ = r + a r + L b r + L a = r + L cosθ r b = r + L sinθ L! = a + 2r! + b! L! = a! + b! ITD = L! L! c ILD Beräkning av för vilken frekvens ett huvud, med given radie, räknas som akustiskt stort och därmed kommer skapa en ljudskugga. Jag har använt mig av radien r = 0.07 m och ljudhastigheten c = 344 m/s vilket ger akustiskt stort kr 1 k 1 r = 1 0,07 k = 2πf c f = kc 1 2π = 0,07 344 782 Hz 2π Jag har utefter denna beräkning använt mig av brytfrekvensen 800 Hz för lågpassfiltret vid θ = ± 90 (rakt till höger och rakt till vänster) för att sedan höja brytfrekvensen för mindre vinklar och öka för större. 4

Källförteckning Duda, Richard. 1996-2000. 3-D Audio for HCI, Department of Electrical Engineering, San Jose State University, http://interface.cipic.ucdavis.edu/sound/tutorial/index.html (Hämtad 2012-11-12) Kästel, David. 2005. Analys av teknik för implementering av 3D-ljud i Gizmo3D, Department of Science and Technology, Linköpings Universitet 5