EXAMENSARBETE 2007:283 CIV Interaktiv testmetodik för utvärdering av vardagsljud som upplevs obehagliga med fokus på barn med autism David Lindegren Luleå tekniska universitet Civilingenjörsprogrammet Arena media, musik och teknik Institutionen för Arbetsvetenskap Avdelningen för Ljud & Vibrationer 2007:283 CIV - ISSN: 1402-1617 - ISRN: LTU-EX--07/283--SE
Interaktiv testmetodik för utvärdering av vardagsljud som upplevs obehagliga med fokus på barn med autism David Lindegren, Luleå tekniska universitet Institutionen för arbetsvetenskap, Avdelningen för Ljud och Vibrationer
Förord Jag vill tacka Luleå tekniska universitet som givit mig möjligheten att skriva detta examensarbete under ett år som Research Trainee. Ett stort tack till min handledare docent Örjan Johansson som har varit ett stort stöd under året och lagt ner ohyggligt mycket mer tid än vad som han fått betalt för. Vill även tacka professor Lennart Gustafsson för idéer och tankar kring projektet och information om autism. Tack även till de föräldrar som ställde upp på intervju och personal samt elever på Oasen som lät mig komma dit och störa deras vardag. Personalen på Instutionen för Arbetsvetenskap ska också ha ett stort tack för diskuterande och hjälp med de ibland väldigt triviala uppgifterna. Slutligen vill jag ge en stor kram till min älskade son Vincent och min underbara sambo Emma, utan er skulle livet vara trist! 2
Abstract Extreme sensitivity to noise is a problem that almost all of the autistic children suffers from. A sound that is extremely annoying does not need to be loud. It seems like the character of the sound is most important. Identified examples are vacuum cleaners, ventilation systems, washing machines and pouring water in the kitchen sink. The characteristics and temporal variations of these sounds, regarding autism, are sparsely investigated. People with autism and sound sensitivity often need hearing protection in normal situations. One way to make this situation more endurable for children with autism is increased knowledge and higher demands on the indoor environment. Children, and in particular those with autism, also have a hard time concentrating for such long times that it takes to go through a listening test. An interactive listening method, where specific characteristics of the sounds could be varied and adjusted to acceptable level, was succesfully created and tested to eliminate this concentration factor when making tests with autistic children. As a result from the listening tests and psykoacoustic analysis of the sounds a more detailed model for Annoyance was created. This enables more accurate evaluation of venues and different sound sources and is used to investigate which characteristics that are most important. Roughness, Loudness and a newly created High frequency tonality quota seem to be the most important of the psychoacoustics indices for the model and Roughness and High frequency tonality are the two factors that causes the highest disturbance. Extrem känslighet för buller är ett problem som nästan alla autistiska barn har. Ett ljud som är extremt störande behöver inte vara starkt, det är snarare ljudets karaktär som är mest betydelsefull. Typiska ljudkällor som är störande och obehagliga är dammsugare, ventilationsljud, tvättmaskiner och rinnande kranvatten. Karaktären och temporala variationer hos denna typ av ljud är sparsamt undersökta med avseende på autistism. Det är vanligt förekommande att personer med autism och ljudöverkänslighet behöver hörselskydd i normala situationer. Ett sätt att förbättra situationen för autistiska barn är ökad kunskap och högre krav på ljudmiljön inomhus. Barn, och i synnerhet de med autism, har svårt att koncentrera sig nog länge för att genomgå ett lyssningstest. Därför utvecklades en interaktiv testmetodik där specifika egenskaper hos ljudet kan varieras och justeras till acceptabla nivåer. Som ett resultat av lyssningstester och psykoakustisk analys av ljuden skapades en modell som beskriver Störnivå som funktion av Råhet, Hörstyrka och en variabel definierad som Högfrekvenstonalitet. Råhet och Högfrekvenstonalitet är de två faktorer som visade sig vara de som relaterar bäst till störnivån. 3
INNEHÅLL Innehåll 1 Introduktion 6 1.1 Bakgrund och problemställning................. 6 1.2 Syfte............................... 7 1.3 Metod.............................. 7 2 Teori 8 2.1 Autism.............................. 8 2.2 Psykoakustik.......................... 9 2.2.1 Kritiska band, basilarmembranet och maskering.... 10 2.2.2 Loudness / Hörstyrka.................. 12 2.2.3 Skarphet........................ 13 2.2.4 Råhet och fluktuationsgrad............... 14 2.2.5 Tonalitet........................ 14 2.2.6 Högfrekvens-tonalitet................. 16 2.2.7 Binauralt hörande.................... 17 2.3 Korskorrelation......................... 18 2.4 Binauralteknik.......................... 19 2.4.1 Crosstalk cancellation................. 20 3 Metod 22 3.1 Testpersoner........................... 22 3.2 Experimentell design...................... 23 3.3 Inspelning............................ 23 3.3.1 Uppställningar..................... 24 3.3.2 Utrustning....................... 25 3.4 Ljuden som spelades in - Stimuli till tester........... 26 3.5 Testuppställningar för lyssningstest............... 28 3.6 Testprocedur.......................... 29 3.6.1 Test 1.......................... 29 3.6.2 Test 2.......................... 30 3.6.3 Test 2b......................... 30 3.6.4 Test 3.......................... 30 3.7 Analysmetoder......................... 30 4 Resultat 32 4.1 Intervju............................. 32 4.2 Test 1a,1b............................ 33 4.3 Test 2a, 2b............................ 37 4
INNEHÅLL 4.4 Test 3.............................. 39 5 Diskussion 41 6 Slutsats 43 6.1 Fortsatt arbete.......................... 43 Referenser 44 7 Appendix A, Resultat 46 5
1 INTRODUKTION 1 Introduktion 1.1 Bakgrund och problemställning Bulleröverkänslighet är en ökande problematik, som i hög grad kan relateras till stress och dåliga ljudmiljöer. Bland de drabbade är barn med autism en grupp av speciellt intresse eftersom de ofta är överkänsliga för buller i vardagsmiljön. Autism är en sjukdom eller ett tillstånd med många besvärliga symptom. Ett symptom, som visar sig speciellt tydligt för autistiska barn, är den extrema reaktionen på ljud. På grund av autismens komplexitet saknas en djup förståelse för vad som orsakar denna överkänslighet trots att det gjorts mycket forskning i området, t.ex. [1, 2, 3]. Autistiska personer uppvisar vanligtvis egenskaper som överdriven fokus på detaljer och extrem förmåga att uppfatta skillnader från det förväntade. Men även andra, för hörseln unika egenskaper finns. Autistiska barn är vanligtvis känsliga för vissa typer av ljud där ljudets karaktär är viktigare än dess styrka. Det finns forskning gjord på autistiskas hörsel men med inriktining på hörtrösklar och detaljupplösning istället för de störande ljudens karaktär. Problemen är tydligast för ljud som andra skapar. Exempel på ljud som nämnts i detta sammanhang är dammsugare, ventilationsbuller, rinnande vatten och matberedare. Gemensamt för dessa ljud är ett bredbandigt spektra med tydliga, ljusa och harmoniska tonkomponenter. Det handlar i många fall också om komplexa ljudmiljöer där en nedsatt förmåga avseende selektivt hörande gör att en del bakgrundsljud upplevs oerhört störande. En normalt fungerande binaural hörselförmåga kan undertrycka dessa bakgrundsljud. För att komma närmare lösningen på autismens gåtor finns det anledning till en detaljerad analys av hörförmågan hos personer med autism och de störande ljudens specifika egenskaper. En ökad förståelse för varför barnen låser in sig på grund av vissa typer av ljud kan även leda till en ökad förståelse om varför andra stimuli ger liknande reaktioner. Lyssningstest på autistiska personer har visat sig överskatta deras hörselskador på grund av svårigheter i att avgöra om testpersonen är engagerad i testet eller inte. Dessutom måste många data kasseras eftersom personerna inte slutför testet. För att undvika dessa problem krävs en genomtänkt teststrategi som tar hänsyn till autistiska personers speciella förutsättningar. En hypotes baserad på tidigare studier är att ljudets karaktär kan beskrivas baserat på musikteoretiska grunder. Exempelvis om det finns harmoniska avvikelser som uppkommer vid ojämna intervall. 6
1 INTRODUKTION 1.2 Syfte Syftet med det här examensarbetet är att utveckla en interaktiv testmetodik för att möjliggöra lyssningstester med barn med autism och att identifiera kritiska egenskaper hos ljud som upplevs stressande och obehagliga. 1.3 Metod Testmetodiken ska utformas så att testpersonen aktiveras under hela testet och att medverkan av förälder eller lärare är möjlig. För att definiera skillnader och likheter i hörselförmågan hos autistiska personer analyseras ljudens egenskaper i detalj baserat på psykoakustiska index. Som ett resultat av lyssningstesten skapas en modell för störnivå baserad på ett antal signifikanta mätparametrar. För att upprätthålla barnens engagemang och koncentration tillåts testpersonerna själva skapa ljud och styra testet. Lyssningstestet utformas så att barnens föräldrar eller lärare kan vara med. För att öka tryggheten hos barnet och för att barnet inte ska känna sig instängt eller isolerat från den trygga personen används inte hörselkåpor i testet. Autentisk återgivning av inspelat ljud säkerställs genom att använda högtalare och en teknik som kallas cross talk cancellation (2.4.1). Den utvecklade testmetodiken omfattar lyssningstest i tre steg. Ljudmaterialet spelas in binauralt för att möjliggöra återgivning och analys av komplexa ljud i sitt naturliga sammanhang.test 1 består av en situation där barn får blanda ljud från olika källor för att minimera störnivå. Detta för att hitta störande komponenter i ljuden samt en lägsta godkänd nivå för olika psykoakustiska storheter. I test 2 betygsätts ljud från samma källor som i test 1 och rangordnas med avseende på störnivå. Detta test ska ge betyg som kan matchas mot olika psykoakustiska mätstorheter för att skapa en modell för störnivå. Med egenskaper som skarphet, fluktuationsgrad och råhet i åtanke analyseras ljuden i frekvens- och tidsdomän (se 2.2 för information om psykoakustik). I sista testet, test 3, betygssätts en mindre grupp av ljuden från test 2 av en annan grupp personer. Dessa nya betyg används för att validera modellen från test 2. 7
2 TEORI 2 Teori 2.1 Autism Autism kännetecknas av begränsningar i sociala förmågor och kommunikation. Fantasi, lek, olika intressen blir också begränsade och förmågan att se helheter är svag [4]. Förutom de symptom som dessa nedsättningar medför finns också ofta andra effekter hos de autistiska, perceptionsstörningar (hörsel, känsel et.c), hyperaktivitet, hypoaktivitet och sömnproblem. Synförmågan är vanligtvis intakt och har inte ovan nämnda begränsningar. Ett annat vanligt symptom till autism är epilepsi som är i högre grad förekommande hos dessa än hos icke autistiska människor. Dessa senare nämnda effekter är ej nödvändiga för en diagnos, människor kan ha autism utan flera av dessa symptom. Hur allvarliga symptomen blir och hur de yttrar sig beror i stor utsträckning på omgivningens inställning och individens begåvning. Begåvning påverkas i sin tur inte av autism, det finns både personer med mer eller mindre intelligens i den gruppen. Enligt bland annat Khalfa [5] kan autistiska, även de med konventionella hörselnedsättningar, få problem när de hör vissa typer av ljud. Detta kan vara ljud som dammsugare, tvättmaskiner och så vidare. De här ljuden behöver nödvändigtvis inte vara starka, vilket påminner om hur personer med hyperakusi reagerar. Cirka 20% av autistiska personer har hyperakusi (se Rosenhall [6]) vilket dock inte är nödvändigt för att vara överkänslig. Hyperakusi definieras som en otrolig överkänslighet för ljud i vissa frekvensområden [7]. Autistiska personer har svårt att göra ett lyssningstest på grund av deras speciella sociala situation och svårigheter med koncentration. Enligt Ulf Rosenhall mfl. [6] leder detta till att hörselskadan hos autistiska personer ofta överskattas. En annan metod än den som använts behövs för att förbättra resultaten. Hörtröskeln är normal hos autistiska barn, men det dynamiska omfånget är sämre. De upplever dessutom oftare än normalhörande rena toner mycket starkare än vad de egentligen är. Khalfa [5] menar att hörstyrka spelar en stor roll i störnivå och på grund av att barn med autism är mer känsliga för vissa hörstyrkenivåer, speciellt för tonala ljud, lider dessa barn större risk att störas av vardagliga ljud. Autistiska har en betydligt bättre förmåga att bestämma tonhöjd i rena omgivningar utan störande faktorer. Om brus introduceras förlorar de snabbt den förmågan och blir till och med sämre på att urskilja tonhöjd, men utan bakgrundsbrus är de oftare bättre än kontrollgrupperna av normalhörande [8]. 8
2 TEORI Många av dessa egenskaper kan förklaras av det som Lepistö tar upp i en artikel om just diskriminering av rena toner [9]. Där nämns att autistiska har ökade perceptuella lågnivå-funktioner. Detta kan bero på att minikolonnerna, samlingar av nervceller i hjärnan, organiserar sig på ett annat sätt hos autistiska än hos personer utan diagnosen. Minikolonnerna växer smalare och högre i antal vilket gynnar diskriminering av stimuli. Bredare minikolonner stärker förmågan att generalisera vilket styrker de ovan nämnda symptomen. Att ha en stark förmåga att ta in lågnivåinformation men en svagare förmåga att förstå vad som tas in ställer till det på många sätt för personerna. Ett exempel är att tonhöjd är en viktig prosaiskt ledtråd vilket gör att autistiska borde vara väldigt duktiga på att uppfatta tal och intentioner, men eftersom de djupare antydningarna kräver mer analys för att uppfattas är snarare motsatsen sann. Det är helt enkelt fler saker som spelar roll, som att tonhöjdsförändringarna måste länkas till innehållet i talet. Ett annat exempel på att autistiska personer har problem med högnivåprocessering av stimuli är att deras förmåga till att urskilja specifika röster i en folkmängd är begränsad, det vill säga att de har svårt att utnyttja det binaurala hörandet [10]. Tidigare har forskare trott att detta berodde på att autistiska har en sämre kommunikation mellan hjärnhalvorna, men det är inte fallet. Normalhörande personer är väldigt duktiga på att använda denna coctailparty-effekt som med hjälp av binaural information låser lyssnandet på olika källor och kan lättare sortera bort oönskat sorl. Detta kan innebära att autistiska tycker att situationer där denna funktion används för att sortera bort störande ljud kan vara väldigt obehagliga. Dessa tillfällen och områden kanske även är extra störande för normalhörande. 2.2 Psykoakustik Ljudvågor som sprids genom luften går väldigt exakt att mäta upp med konventionella instrument. Hur vi människor uppfattar dessa vågor är svårare att mäta och för att sätta siffror och ord på hur ett ljud tolkas tillämpas psykoakustiken. Människans hörsel fungerar till viss del som en frekvensanalysator som har ett spann på ca. 20-20000 Hz. Redan här avviker örat från ett perfekt mätinstrument eftersom det förstärker och försvagar frekvenserna enligt ett givet mönster, beroende på ljudtrycksnivå, se figur 1. Andra effekter, som hur vi kan särskilja specifika ljudkällor i en högljudd miljö, kan inte heller förklaras bara med att monouralt analysera vilka frekvenser som finns representerade i rummet. I detta fall måste det binaurala hörandet (2.2.7) tas hänsyn till och sådana mätningar kan göras med två mikrofoner i 9
2 TEORI ISO 226:2003 120 100 100 phon Ljudtrycksnivå [db] 80 60 40 80 60 40 Reviderade Tidigare 20 20 0 Minimum level 16 32 64 124 250 500 1000 2000 4000 8000 Frekvens [Hz] Figur 1: Upplevd ljudtrycksnivå i olika frekvensband och nivå, ISO226:2003 olika uppställningar, till exempel med ett konsthuvud (2.4). Psykoakustik används ofta numera i ljuddesign, när en designer eller forskare ska skapa en ljudmiljö eller upplevelse som ska lura mottagaren att den är någon annan stans eller gör något virtuellt. Ett exempel är surroundljud med två högtalare där ljuden som spelas upp förändras i frekvensplanet så att det låter som de kommer från olika håll. Örat färgar ljud som faller in i olika riktningar och genom att mäta upp dessa kan ljuden modifieras att låta som att de härstammar från en källa som befinner sig var som helst i lyssnarens omgivning. 2.2.1 Kritiska band, basilarmembranet och maskering Vid beräkning av nästan alla typer av ljudupplevelser behövs någon slags frekvensspektra. Normalt används i mjukvara en FFT (fast Fourier transform) med hög upplösning för att få med all den information som kan uppfattas av örat. Även digitala filter i form av ters- eller oktavband används ofta. Problemet med FFT:n är att den i höga frekvensområdet blir för detaljerad och i vissa fall erhålls för dålig upplösning för de låga frekvenserna. Örats upplösning och 10
2 TEORI även några andra effekter baseras på något som kallas kritiska band. Det är ett sätt att beskriva hur örat tolkar ljudvågorna som sprids genom hörselsnäckan. Basilarmembranet i snäckan sätts i gungning på olika områden beroende på ljudets frekvens och absorberar där ljudvågen som tolkas om av hårceller på membranet till elektiska impulser som skickas vidare till hörselcentra i hjärnan. Dessa områden som påverkas av olika specifika toner kallas kritiska band och kan ses som mekaniska passbandsfilter. Toner som ligger inom samma kritiska band har människan svårare att särskilja än toner som ligger i separata band. Upplevelsen av toner inom samma band ger snarare upphov till svävningar och ökad råhet (2.2.4) än att man kan höra två separata toner. Brus med en bandbredd som är större än ett kritiskt band upplevs också starkare än ett mer smalbandigt brus med samma ljudstyrkenivå [11]. hel. o.f. Cochlea 0 8 16 24 32 mm 0 160 320 480 640 0 600 1200 1800 2400 mel 0 3 6 9 12 15 18 21 24 Bark 0 0.25 1 4 16kHz 0.125 0.5 2 8 Längd Tonsteg Tonhöjd Kritiska band Frekvens Figur 2: Positioner på basilarmembranet och vad det motsvarar i olika index. Från helicotrema till ovala fönstret. Bandbredden på dessa kritiska band-filter varierar med centerfrekvens, se figur 3, vilket i stora drag ligger mellan tersband och sjättedels oktavband. Under 500Hz är bandbredden konstant kring 100Hz. Totala hörbara området brukar uppdelas i 24 kritiska band, z. Observera att den modellen med fasta lägen på de kritiska banden egentligen är fel och en mer korrekt modell ska ha flytande gränser beroende på vilka ljud som kommer in i örat. Positionen på membranen ger upphov till två andra effekter. Detta är tidsfördröjningen som läggs till innan lägre toner absorberas av membranet och det andra är läckaget/maskeringen av ljud högre upp i frekvens. Membranet är konstruerat så att ljusa toner absorberas tidigt på membranet, direkt efter ovala fönstret, medan mörkare toner absorberas sist längst in i snäckan. Därför kommer mörka toner att maskera ljusare eftersom dessa mörka kommer att excitera 11
Bandbredd [Hz] 2 TEORI Centerfrekvens [Hz] Figur 3: Bandbredd beroende på mittfrekvens. de kritiska band som ligger tidigare i snäckan, inte lika mycket som det band som matchar tonen men klart märkbart. Den temporala maskering som uppkommer i hörseln skapas när signalerna anländer till hjärnan och hörselcortex. Ljud som anländer tidigt till örat kommer till viss del att maskera senare ljud men även tidiga ljud kan maskeras av ljud som infaller senare tätt inpå. Detta beror på att den upplevda nivån konstrueras av en integration över tiden av ljudet som kommer in i örat. Ljud som kommer in tätt inpå varandra i regionen 5-30ms tolkas för övrigt ofta som ekon av örat enligt McGraw [11]. 2.2.2 Loudness / Hörstyrka Loudness eller hörstyrka är ett centralt begrepp när upplevelsen av ljud ska beskrivas. Modellen används också när andra psykoakustiska storheter ska beräknas som skarphet (2.2.3) och tonalitet (2.2.5). Hörstyrka ska representera hur vi uppfattar ljud och i mer komplexa ljud visa vilka frekvensområden som faktiskt hörs. Örats frekvenssvar påverkar ljuden olika beroende på nivå och frekvensinnehåll. Det finns en beräkningsmetod baserad på en modell av Zwicker [12] som är standardiserad i DIN 45631, ISO-rekommendation 532 B. I den beräknas specifik hörstyrka N (z) och total hörstyrka N(z) enligt följande. Först filtreras ljudet genom ett tersbandsfilter som väger de olika banden beroende på hur 12
2 TEORI ytterörat påverkar. Detta är överföringsfunktionen från luftburet ljud utanför örat till vätskeburet ljud i mellan- och innerörat med motsvarande impedansändring. Efter det delas ljudet upp i 24, överlappande, kritiska band (se 2.2.1) som liknar basilarmembranets uppbyggnad. Den specifika hörstyrkan (N ) beräknas, för varje kritiska band (z), enligt följande: N (z) = N 0 ( ) 1 k [ ( ) 10 k L EHS(z) 1 s+s 10 L E (z) L EHS (z) k ] 10 1 s (1) s = 10 0.22 0.005z 1, k = 0.23 och N 0 0.068 Bark (referens-hörstyrka). Här anges alla nivåer i db. L EHS (z) är excitationsnivån i band z som motsvarar hörtröskelnivån i samma band. Excitationen av varje kritiskt band kan beräknas och läggs samman genom att integrera ekvation (1) över alla 24 banden. Eftersom varje band har ett diskret värde för hela bandet kan man beräkna N (total hörstyrka) som summan i ekvation 2. N = 24 i=0 N (i) (2) 2.2.3 Skarphet Ljud som har ett frekvensspektra som i stora drag består av höga frekvenser betraktas ofta som skarpa eller gälla. Skarphet är överlag känt som en bidragande faktor för störnivån hos ljud. För att mäta denna känsla introducerade G. von Bismarck [13] 1974 en beräkningsmetod för skarphet. Denna metod har vidareutvecklats av Zwicker [12] och Aures [14] för att få fram en mer korrekt modell. Den metod som används av Head-Acoustics mjukvara (3.3.2) är enligt referenslitteraturen: S = C R 24Bark 0 N (z) g (z)dz ln ( ) acum (3) N+20 20 där g (z) tidigare var en bitvis exponentiell viktfunktion mellan 1 och 4. Numera används en modifierad variant g (z) = e 0.171 z. Båda funktionerna gör att högre frekvenser påverkar skarphetsnivån mer än låga. 13
2 TEORI 2.2.4 Råhet och fluktuationsgrad Periodiska förändringar i en ljudsignals amplitud med modulationsfrekvens < 20Hz uppfattas av örat som amplitudförändringar över tiden, fluktuationsgrad [15]. Då modulationsfrekvensen är större än 20Hz kommer örat inte att uppfatta dessa som ändringar i amplituden utan den uppfattas som konstant, det är detta som kallas råhet. Signaler med hög fluktuationsgrad upplevs mer irriterande och svåra att ta bort fokus från än ljud med hög råhet. För att beräkna fluktuationsgrad används ofta en funktion baserad på Zwickers modell för loudness (2.2.2). R ( ) 24Bark 0 log N max N dz min S = 0.36 vacil (4) (T/0.25)+(0.25/T) där N max och N min är lokala minimum och maximum för respektive band och period. T är tiden mellan två efter varandra följande hörstyrkemaxima. För att se till att inte alltför närliggande maxima tas med i beräkningen för fluktuationsgrad (kom ihåg att f mod < 20Hz) lågpassfiltreras signalen innan beräkningen av S utförs. Filtrets brytfrekvens ligger strax ovan 20Hz. Fluktuationer med en modulationsfrekvens mellan 20 och 300Hz kommer inte att upplevas som att de ändrar amplituden på ljudet utan snarare kommer dessa modulationer att ändra tonkaraktären hos ljudet. Det kommer att låta rått. Noggrann undersökning av råhet av bland andra Terhardt [15] och Kemp [16] visar att den är beroende av center- och modulationsfrekvens samt modulationsgrad. Kemp har även visat att frekvens- och amplitudmodulerade ljud ger samma mängd av råhet. Råhet anses vara en oberoende storhet för att beskriva en viss typ ljudupplevelse. Den är proportionell mot modulationsgraden upphöjt i p, där exponenten p har visats vara mellan 1.5 och 2. R m p För en mer detaljerad beskrivning av hur en modell av råhetsberäkning används i HEAD acoustic-mjukvaran hänvisas till kapitel 4.5 i Appendix B från informationsmaterialet som ingår i HEAD-sviten [17]. 2.2.5 Tonalitet Tonalitet mäter den tonala delen av ett ljud. Det möjliggör ett sätt att skilja mellan intressanta ljud och brus. Sådana intressanta ljud är framförallt upp- 14
2 TEORI byggt av tonala komponenter som visas i ett spektrogram som linjer eller som smalbandigt brus med en bandbredd som är mindre än ett kritiskt band. Brus, eller bredbandigt brus, har knappt någon tonalitet alls. Terhardt [18] föreslår följande modell för att hitta tonala komponenter. Först söks lokala maxima i spektrat som uppfyller kravet att vara minst 7dB starkare än de sex omkringliggande koefficienterna. När sådana hittas specifieras en tonal komponent med nivån L i och frekvens f i som motsvarar frekvens och nivå från centervärdet i gruppen om de 7 värden som ligger kring komponenten. Om dessa tonala komponenter tas bort från spektrat kallas det som då finns kvar för ett brus-spektra. L i beräknas för att ta reda på om komponent nummer i uppfattas av örat eller om det maskeras av kringliggande brus/komponenter. Varje komponent jämförs med brusspektrat och de andra komponenterna, de som har ett L i < 0 tas inte med i vidare beräkningar. I nästa steg beräknas en viktfunktion, w T. w T = n [w 1 ( z i ) w 2 ( f i ) w 3 ( L i )] 2 (5) i=0 Dessa funktioner, eller delvikter, är specifierade enligt följande. Specifik bandbredd för varje komponent (sätts till 0 för helt tonala komponenter som inte är av bruskaraktär): ( ) 0.13 1/0.29 w 1 ( z i ) = z i + 0.13 Frekvensvikt och en nivåvikt w 2 ( f i ) = 1 1+0.2 ( fi 0.7k + 0.7k f i ) 2 ( w 3 ( L i ) = 1 exp L ) i 15 För att beräkna den totala tonaliteten behövs, förutom w T, en till vikt. w GR beräknas på följande sätt: w GR = 1 N GR N (6) 15
2 TEORI där N GR är hörstyrkenivån i de band med bruskaraktär och N är totala hörstyrkenivån för hela ljudet. Resultaten från ekvation (5) och (6) sätts in i följande ekvation för att få den totala tonaliteten för ljudet. K = C w 0.29 t w 0.79 GR (7) Konstanten C måste bestämmas så att en sinuston med frekvens 1kHz och ljudnivån 60dB resulterar i tonalitet 1. 2.2.6 Högfrekvens-tonalitet Upplevd tonhöjd följer inte frekvens linjärt, se figur 4. På grund av detta kommer matematiskt korrekta övertoner att upplevas som svävande vid höga frekvenser. Övertoner över 600Hz upplevs lägre än vad de egentligen är, vilket kommer att ge en mer rå upplevelse, speciellt om grundtonen ligger under 600Hz. I metodavsnittet Analys (3.7) beskrivs algoritmen som konstruerats för att mäta storheten High frequency tonality quota eller Högfrekvenstonalitet. Ton HF kommer att användas i fortsättningen. 2400 2000 Tonhöjd [mel] 1600 1200 800 400 0 0 1 2 4 8 12 16 Frekvens [khz] Figur 4: Tonhöjd som funktion av frekvens. Den streckade linjen visar en linjär ökning. 16
2 TEORI 2.2.7 Binauralt hörande Binauralt hörande är till stor del ansvarigt för den goda förmåga normalhörande har för att sortera ljudintryck och isolera ljudkällor, främst spatialt. Till detta hör alla funktioner som blir bättre av att två öron används istället för bara ett. Binauralteknik är ett stort område som fortfarande är under utveckling och används ofta för att auralisera olika inspelningar och simuleringar. Av detta kan en ljudupplevelse skapas som ska likna en naturlig lyssningssituation så bra som möjligt. För höga frekvenser använder sig hörseln av ledtrådar från hur ytterörat färgar ljudet för att avgöra från vilket håll det kommer. Huvudet fungerar också vid små våglängder som en bra isolator och skuggar det ena örat om ljudet kommer in tillräckligt snett. Vi höga frekvenser är det framförallt nivå och tidsskillnad som utgör de största ledtrådarna till var i rummet en ljudkälla är placerad. Störningsundertryckningen beror bland annat på skillnader i maskeringsnivå (se längst ner 2.2.1 för maskering) mellan öronen. Maskerande ljud är ofta diffusa i rummet och påverkar då öronen på ett lika starkt sätt, genom att utnyttja detta kan då ett önskvärt ljud förstärkas genom att man riktar bara ett öra mot källan. På grund av huvudets skuggningseffekt kommer skillnaden mellan öronen att vara större för det ljudet och det kommer inte att undertryckas lika mycket som maskeringsljudet. Ljudet kommer snarare att förstärkas av hörselcentrats korrelationsanalys av signalerna från höger och vänster öra. För låga frekvenser, mindre än 2000Hz, påverkar ytterörat mindre effektivt så den färgningen är knappt märkbar. I dessa frekvenser med en våglängd som är lika stor eller större än ytterörat bestäms riktningshörande i större utsträckning av fasskillnaden mellan öronen för samma ton, interaural time difference (ITD). För dessa frekvenser blir inte heller huvuddiffraktionen komplex på grund av att våglängden för tonerna är 17cm eller längre och då betydligt större än ansiktets detaljer. Huvudet kan betraktas som en sfär med öronen på var sin sida enligt figur 5. Den inkommande ljudvågen antas också vara en plan våg infallande mot huvudet. θ och ψ är vinklar mellan respektive vektorer. Denna förenkling förutsätter egentligen att källan är långt bort från åhöraren i förhållande till ljudets våglängd. Tack vare denna förbättrade lokaliseringsförmåga kan t.ex. ljud som kommer från oönskade riktningar undertryckas och hörseln kan inriktas för att förstärka en viss ljudkälla. Det visar sig till exempel att i en samling talande människor kan lätt hörseln koncentreras till en specifik talare i gruppen, den så kallade coctailpartyeffekten. Om den sfäriska modellen, figur 5, skulle 17
2 TEORI u lr u θ ψ R R sin θ Rθ Figur 5: Infallande ljud mot ett huvud användas i ett statiskt läge skulle öronen ha svårt att avgöra om ett ljud kom framifrån eller bakifrån. Vi människor löser detta genom att vrida på huvudet, bara en bråkdel av en grad räcker. Modellens θ ersätts då med θ γ där γ är den vridna vinkeln. θ blir θ γ (8) Detta ger skillnad i fasförändring för ljud som infaller framifrån respektive bakifrån och på så sätt avgör hörseln vilken riktning ljudet har. 2.3 Korskorrelation Korskorrelation definieras enligt ekvation 9 som summan av två diskreta funktioner som skiftas och multipliceras. Det påminner mycket om konventionell faltning men till skillnad från faltningen så vänds inte en av funktionerna. ( f g) i j f j g i+ j (9) Korskorrelationsfunktionen i Head Acoustiv Artemis används för att undersöka om signalerna till vardera öra är korrelerade eller ej. Maxvärdet på korskorrelationen används som en mätparameter för att avgöra om det finns nytta av att använda binauralt hörande för att skärma bort ljudet. Är korrelationen liten kan ljudet lätt väljas bort av hörseln. Ljudet måste manuellt A-vägas innan korrelationsfunktionen används. 18
2 TEORI 2.4 Binauralteknik För lyssningstester och utvärderingsuppgifter används allt oftare binaurala inspelningar för att få en så korrekt återgivning som möjligt. Med en bättre återgivning kan lyssnaren få en mer rättvis bild om hur det känns i den inspelade miljön och kan utvärdera upplevelsen mer som denne skulle göra om testet utfördes på plats. Riktig situation Inspelning med konsthuvud Lyssning med hörlurar eller högtalare med crosstalk cancellation HRTF Hörselgång HRTF Hörselgång Mikrofonrespons Hörlursrespons EQ + + + EQ + Hörselgång Lika för autentisk återgivning Figur 6: Signalkedjan som måste uppfyllas om perfekt återgivning ska erhållas. Figur 6 beskriver de filtreringar som måste göras för att erhålla en autentisk återgivning av ett inspelat ljud. Det är lätt att se här att det finns många svårigheter med denna typ av inspelning och att få hela kedjan överensstämmande, speciellt om resultatet ska användas i ett lyssningstest med många olika testpersoner. Till exempel är varken hörselgångsfrekvensgången och HRTF:en (Head Related Transfer Function) exakt lika för olika människor vilket påverkar resultatet. HRTF:en för konsthuvudet speglar ett slags medelhuvud och inte är riktigt perfekt för någon. EQ:n har lättare för att kompensera för mikrofon och högtalarfelen så att de blir betydelselösa vid normala ljudtryck, det är dessutom lättare att kompensera för de stegen i signalkedjan eftersom att de är lika genom hela testet. En persons HRTF kan återskapas genom att mäta på den personen och påverka ljudet med den EQ som finns i blockdiagrammet på ett sätt som gör att överföringsfunktionen blir bättre. Då måste dock varje persons HRTF utvärderas för att resultatet ska bli relevant och ljudkällan måste ha en dominant riktning för att effekten ska bli så lätt att mäta som möjligt. Även ytterörat, som är en viktig del för att avgöra om ett ljud kommer frami- 19
2 TEORI från/bakifrån, är ofta bara gjord som en kompromiss och ska motsvara något slags medelöra. Öronmusslan påverkar även riktningskänsligheten i medianplanet för högre frekvensområden [19]. Stationära inspelningar kan för vissa innebära en osäkerhet för om ljudet kommer framifrån eller bakifrån, speciellt när personen inte får någon akustisk respons från omgivningen när denne vrider huvudet. Effekten syns tydligt i figur 5 och ekvation 8 om γ sätts till 0. Där blir, något överdrivet, effekten en total osäkerhet i om ljudet härstammar framifrån eller bakifrån. Normalt används hörlurar för att återge denna typ av inspelningar. Detta isolerar lyssnaren från omgivningen så att den påverkas så litet som möjligt av externa källor och rumsakustiken i lyssningsrummet. Nackdelen med hörlurar är att lyssnaren får ljudet väldigt nära inpå och situationen kan kännas onaturlig för lättstressade personer. För sådana situationer kan istället ett stereo-system med två högtalare användas med ett filter för minimering av överhörning mellan monitorerna, så kallad Cross talk cancellation (2.4.1). 2.4.1 Crosstalk cancellation Figur 7 visar ett blockschema över en tidig uppsättning för crosstalk cancellation enligt M R Schroeder [20]. S i den figuren representerar överföringsfunktionen mellan respektive högtalare och örat som sitter på samma sida som högtalaren medan A är överföringsfunktionen mellan högtalare och örat på motsatt sida. Dessa funktioner antas för enkelhetens skull vara likadana för både vänster och höger sida. Tidigare mättes dessa upp (med till exempel ett konsthuvud) men kan i nyare processorer kalibreras manuellt under körning med hjälp av några färdiginställda funktioner. En sådan kalibrering ställer dock krav på omgivningen för att kunna fungera, till exempel måste närmsta sidovägg ligga på ett ganska stort avstånd från högtalarna. För låga frekvenser konvergerar funktionerna så att nästan bara fasen skiljer dem åt. För att mäta upp S och A måste även konsthuvudets resonanser i hörselgången tas med i beräkningarna så att man inte dämpar för mycket nära den frekvensen. För att ta bort förstärkningen S på ljudet som kommer från vänster högtalare till vänster öra sätts en (1/S) i serie med båda högtalarna. Då blir förstärkningsfunktionen 1 från höger högtalare till höger öra och 0 från höger högtalare till vänster öra. Överhörning här i systemet gör dock att det inte blir riktigt så enkelt. det innebär att en utsläckningssignal måste skickas från den andra högtalaren. A K h måste alltså läggas till vänster kanal för att ta bort höger signal från vänster sida. Alltså, totala utsläckningsfunktionen från K h till K v ska alltså 20
2 TEORI K v K h C C 1 1-C 2 1 1-C 2 1 S 1 S Vänster ut Höger ut A A S S Lyssnare Figur 7: Ett typiskt blockschema vara ( A/S), vilket i fortsättningen förkortas till C. Den här utsläckningssignalen kommer också då att överhöras till det andra örat (via A) och det här måste också släckas ut, vilket leder till en ny signal som måste tas bort och så vidare i oändlighet. Trots detta tydligt rekursiva problem har Schroeder visat att det går att simultant lösa ekvationerna. Detta resulterar i (1/1 C 2 ). och (1/S) som visas i Figur 7. Schroeders test visar att denna funktion fungerar bra i sweet spot och om lyssnaren tittar rakt framåt. När lyssnaren vrider huvudet mer än 10 grader försvinner den illusionen av 3d-rumseffekter och placeringen av ljudkällor och det känns som att ljudet kommer från insidan av huvudet istället. Den funktion som används i den Lexicon-processor som använts i lyssningstesten har en ännu mer avancerad funktion än denna som bättre kan hantera vridning av huvud och kan kalibreras under lyssningssessionen. 21
3 METOD 3 Metod 3.1 Testpersoner För att hitta ljud som barn med autism ofta anser vara störande kontaktades FA - Föreningen Autism i Norrbotten. Tre föräldrar ringde tillbaka och kunde delta i intervju via telefon. Intervju genomfördes även med en lärare från specialskolan Oasen, en skola där det finns klasser som består endast av barn med autism. Informationen från dessa intervjuer (4.1) ligger som grund till valet av ljud i lyssningstesten. Syftet med testen är både att ta reda på vad i ljuden som är irriterande för denna kontrollgrupp av normalhörande men även att få reda på om metoden som konstruerats är användbar på en grupp barn. Därför kontaktades ett antal grundskolor för att få kontakt med en grupp mellanstadieelever som har en liknande åldersspridning som den tilltänkta gruppen autistiska barn. Porsöskolan svarade och en klass 10-11-åringar valde att ställa upp. Dessa barn genomförde både test 1 och test 3. Test 2 var ett mer komplicerat test för att betygsätta och rangordna ett antal ljud och för det testet behövdes ett antal vuxna personer med ett längre tålamod än barnen. För detta kontaktades personalen på Oasen igen som experter som både är vuxna och har lång erfarenhet av att umgås med autistiska barn. För ett senare test, test 2b, användes en ny referensgrupp som bestod av 12 personer från Luleå tekniska universitet. Där de flesta hade tidigare erfarenhet av lyssningstest. Test 1: Utfördes av 12 av eleverna i årskurs 4 på Porsöskolan i Luleå. Lika fördelning på båda kön. Test 2: Utfördes av 6 personer som jobbar som lärare på en skola för autistiska barn, 2 män och 4 kvinnor. Test 2b: Referenstest som utfördes av 12 personer från Luleå tekniska universitet. Test 3: Testpersonerna i test 3 var resten av klass 4 på Porsöskolan. 15 barn varav 8 killar och 7 tjejer. 22
3 METOD 3.2 Experimentell design Experimentljuden baseras på dammsugare på grund av att de fyller upp de flesta av de irriterande egenskaper som nämndes i intervjuerna. De har även nämnts i litteraturen som vanliga störobjekt. De har olika ljudkällor som innehåller både kraftiga tonala komponenter samt bruskällor. Det är dessutom ett ljud som de flesta är vana att höra och har någon slags referens till. Följande experimentella design, tabell 1 konstruerades för att skapa en variation i ljuden och lätt kunna kombinera dessa till testen senare. Två dammsugare valdes ut, en industridammsugare och en dammsugare som används i hemmet. På dessa dammsugare isolerades först insugsljudet från resten av dammsugaren och det spelades in. Därefter spelades även motorljudet in separat. Källseparation kan som här åstadkommas genom att sätta källa 1 i rummet som inspelningen ska ske i och dra dammsugarslangen genom ett litet hål i väggen. Den andra källan, källa 2, hamnar då på andra sidan väggen, se figur 8. Ekofria rummet i LTU Designlab har öppningar som tillåter detta. Tabell 1: Designmatris för ljud 01-12 Ljud 01 02 03 04 05 06 07 08 09 10 11 12 Dammsugare + + + + + + - - - - - - Efterlang + + + - - - + + + - - - Källa + - * + - * + - * + - * Tabell 2: Förklaring till designmatris Parameter + & Dammsugare Hemma Industri Efterklang Lång (Hall) Kort (Ekofri) Källa Insug (+ = med munstycke, * = utan) Motor 3.3 Inspelning För att erhålla ljudexempel till lyssningstesten och för att samla in resultaten från test 1 användes följande metoder för binaural inspelning. 23
3 METOD 3.3.1 Uppställningar Först spelades ljuden in som skulle användas i lyssningstesten. Inspelningen gjordes med hjälp av Head Acoustics konsthuvudteknik (HMSIII) och deras mjukvara Artemis. Konsthuvud 2,0m Källa Källa 2 Figur 8: Uppställning för inspelning. Källkonstruktionen beskrivs mer ingående i avsnitt 3.2. Källorna spelades in i ekofri miljö, med en träskiva under källan (se beige cirkel i figur 8) för att simulera en verkligare situation. Dammsugare används sällan utan golv. Samma inspelningar gjordes även i klangrik miljö, hallen utanför ekofria labbet, för att kunna variera efterklangstiden som en designvariabel. Resultaten av inspelningen finns beskrivna i Stimuli (3.4). Den andra inspelningen utfördes för att erhålla resultaten från Test 1. En identisk uppställning som i testet användes med bara några ändringar, se figur 9. Fotografier av elevernas inställningar (3.6.1) användes som referens för att kunna ställa in mixerbordet på samma sätt som eleverna gjort och samma ljud som de skapat spelades in. Även referensinspelningar gjordes från grundljuden, dvs med reglarna inställda i sina ursprungslägen. Detta för att ge ett mer överskådligt resultat i form av en differensfunktion. 24
3 METOD 1,80m Lexicon ljudprocessor Mixerbord 2,10m Konsthuvud Laptop + Ljudkort Figur 9: Uppställning för inspelning. 3.3.2 Utrustning För inspelningar i LTU Designlab och på Porsöskolan användes följande utrustning. Head acoustics HMSIII konsthuvud. Head acoustics mikrofonförstärkare. PC med Windows XP (Designlab). Artemis HEAD recorder (Designlab). Bärbar PC med Windows NT (Porsöskolan). För att skapa 4-kanaliga ljud från stereoinspelningarna användes Adobe Audition. I lyssningstesten användes följande utrustning för uppspelning. Mixerbordet var med i signalkedjan även när det inte användes, bara för att få en identisk signalkedja för varje test. 25
3 METOD Bärbar PC med Windows XP och WinAmp v5.34 för att spela upp flerkanaliga ljud. Creative Sound Blaster 5.1, Model #SB0490. USB-ljudkort. Ljudmixer Phonic MM 1002. Lexicon MC-1 Digital Controller för crosstalk cancellation. 2st ADAM S2-A, aktiva studiomonitorer. 3.4 Ljuden som spelades in - Stimuli till tester Ljuden för test 1 skapades som kombinationer av de 12 binauralt inspelade ljuden i tabell 1. Testljud A-I definieras i tabell 3. Tabell 3: Designmatris för ljud A-I Ljud Källfiler A 10 & 11 B 08 & 09 C 11 & 12 D 07 & 04 E 05 & 08 F 03 & 08 G 06 (nästan helt utan tonala komponenter) H 05 I 02 Test 1 baseras på ljud A-F. Test 2 baseras på modifieringar av ljud G, H och I samt inspelad modifieringar av ljud E från test 1. Test 2b baseras på det ljud med lägst och högst skattad störnivå från varje grupp i test 2 för att normera grupperna mot varandra för validering. Test 3 baseras på ljuden med lägst skattad störnivå från test 2. 26
3 METOD Ljud A - F är av liknande karaktär (se Resultat, fig 13 för att se spridningen i specifik hörstyrka i fjärdedels bark) men eftersom det är olika källor som ligger i kanal höger/vänster 1 och höger/vänster 2 kommer olika parametrar att ändras när man rör reglarna beroende på vilket ljud som testpersonen lyssnar på. Om till exempel ett av ljuden har hög skarphet sänks totala skarpheten mycket om nivån på det ljudet sänks. I figur 10 visas en kombination av ljud 01 och 02. 6 Sone 5 4 3 2 02 01 1 0 0 3,5 7 10,5 14 17,5 21 Kritiskt band [Bark] Figur 10: Två källor plot:ade mot varandra, visar på de olika karaktärerna på motor- respektive insugsljud Ljudgrupperna som använts i test 2 skapades genom att filtrera grundljuden (G-I) med olika notchfilter. I nästan alla fall användes ett filter med Q = 4 där centerfrekvens valdes till olika övertoner. För varje nytt ljud togs en eller flera övertonsserier bort, ibland med tillhörande grundton. Ljudgrupp G x bestod av ljud G (se 3.2 för mer information om ljudet) och 4 filtrerade varianter av det ljudet. I varje variant har olika övertons-serier filtrerats bort med hjälp av ett antal 4:e ordningens notch-filter. Denna filtrering är gjord för att variera tonaliteten och dissonansmängden i ljuden. Ljudgrupp H x bestod av ljud H och har filtrerats enligt samma princip som grupp 1 men även har ett bredare filter, ordning 2, använts i en av filtreringarna för att ta bort ett högfrekvent brusområde. Ljudgrupp E x är konstruerad av 4 ljud från inspelningarna av test 1. 4 karaktäriserande varianter valdes ut från inspelningarna av ljud E i test 1. Slutligen bestod grupp I x av ljud I och är konstruerad på samma sätt som grupp G x. 27
3 METOD 3.5 Testuppställningar för lyssningstest För att återge det inspelade ljudet så exakt som möjligt används normalt hörlurar. Detta kan upplevas som en konstruerad situation, speciellt för barn som inte är vana vid lyssningstest. Därför har ljuden i detta test presenterats via högtalare där signalerna modifierats med en cross-talk cancellation -algoritm (dämpning av överhörning, se 2.4). Att använda sig av högtalare och inte hörlurar ger också fördelen att en förälder eller lärare som barnet känner väl kan sitta med under testet utan att barnet ska känna sig avskärmad. I test 1 låg mixerbordet framför lyssnaren, i de övriga användes laptop datorn. Använd mjukvara och hårdvara definieras i avsnitt 3.3.2. För att inte signalkedjan skulle vara annorlunda mellan testen fanns även mixerbordet med i till exempel test 2 där det i övrigt inte används. 1,80m Lexicon ljudprocessor Mixerbord 2,10m Lyssnare Laptop + Ljudkort Figur 11: Uppställningen. Högtalarna i testet var placerade i sittande huvudhöjd, dvs. ungefär 110cm över golvet på hörnen av två bord. Lyssningspersonen satt i en vanlig klassrumsstol. 28
3 METOD 3.6 Testprocedur 3.6.1 Test 1 Syftet med det första testet är att undersöka vilka egenskaper som förändras mest när testpersonerna får blanda två ljud där resultatet har en konstant ljudnivå, +/- 1dB. Med syfte att undersöka vilken karaktär hos ljuden som behöver förändras tillåts testpersonerna även sätta nivåerna utan restriktionerna. Förutom de faktiska data som Test 1 ger, fungerar testet även som en försöksplattform för ett interaktivt sätt att genomföra skattningstest där personer med speciella krav på stimulans ska ingå. Till exempel barn. Testuppställningen finns redovisad i avsnitt 3.5. Under testet fick varje elev arbeta med att ställa in nivåer på två reglage på ett mixerbord (se 3.3.2 för detaljer om utrustningen). Varje vridreglage styr nivån på ett stereospår som innehåller en av källorna. Första uppgiften, test 1a, gick ut på att nivåerna skulle ställas in så att totalljudet var så lite störande som möjligt. Den enda begränsningen var att båda gröna lamporna skulle hållas lysande och dessutom att inga fler lampor fick börja lysa, figur 12(a). Ljudtrycksnivå-spannet på minsta och högsta ljudnivå som uppfyllde denna begränsning är +/- 1dB. (a) Ljudnivå ok (b) Ljudnivå, hög för (c) Ljudnivå, låg för Figur 12: Hur lamporna lyste beroende på ljudnivå I den andra uppgiften, test 1b, skulle eleverna ställa in ljudet så att störnivån var så acceptabel som möjligt i en klassrumssituation. Ljudet skulle alltså vara så starkt som möjligt utan att störnivån blev för hög. Inställningarna dokumenterades genom fotografi direkt vid testet så att de inställda ljuden senare kunde spelas in med konsthuvudet utan att barnen skulle behöva stanna kvar 29
3 METOD längre tid än nödvändigt. Se 3.3.1 för detaljer om inspelningsuppställningen. Inspelningarna resulterade i 120 ljud + ett antal referensinspelningar som redovisas i avsnitt 4.2. 3.6.2 Test 2 I test 2 skattade och rangordnade testpersonerna störnivån för ett antal ljud för att ta reda på vilka egenskaper i ljuden som ger en hög störnivå. Fyra grupper av ljud skapades och varje grupp skulle rangordnas var för sig. Försökspersonerna fick lyssna på varje lista, slumpmässigt utvald ordning både av grupperna och inom grupperna. Uppgiften var att för varje grupp placera ljuden på en skala från 1 till 10, där 1 var inte alls störande till 10, extremt störande. Personerna fick lyssna på ljuden hur många gånger de ville. Resultaten från test 2 matchas mot olika psykoakustiska index genom korrelationoch regressionsanalys. Redovisas i Resultat 4.3. 3.6.3 Test 2b För att jämföra resultatet mellan grupperna i test 2 konstruerades ytterligare ett test. I test 2b användes samma uppställning som i test 2. I detta test rangordnas 8 ljud avseende störnivå. 2 ljud togs från varje grupp i test 2, respektive grupps lägsta och högsta betyg. Personerna lyssnade på ljuden efter en slumpmässig ordning och betygsatte dem på samma sätt som i test 2. 3.6.4 Test 3 Syftet med test 3 var att validera modellen av störnivå som sattes i test 2. Uppställningen var samma som i test 2 (se 3.5). För att barnen som planerades utföra testet inte skulle tappa intresset och tycka att det var ansträngande och/eller långtråkigt (och på så sätt tappa fokus) användes bara 4 ljud i detta test. De fyra ljuden valdes ut från test 2, ljuden med i medelvärde högst skattad störnivå från varje grupp valdes. Resultatet från det här testet är betyg vilka redovisas i Resultat 4.3. 3.7 Analysmetoder Resultaten från de olika testen analyseras statistiskt medelvärde/median, standardavvikelse och konfidensintervall. Test 1 används för att undersöka vilka frekvensintervall och psykoakustiska index som sänks mest respektive minst 30
3 METOD och vilka som ändras signifikant. Detta visas genom att jämföra medelvärde och 95%-igt konfidensintervall för 1/3 kritiska band och för de psykoakustiska index som bedömdes relevanta (2). I första uppgiften av test 1 används dessa värden och jämförs med originalljudet. På så sätt kan signifikanta förändringar hittas där inte 95%-intervallet skär linjen som motsvarar ingen förändring. I uppgift två jämförs index och specifik hörstyrka med varandra för att identifiera vilka som ändrats mest. För att utvärdera om det finns råa och ostämda tonkomponenter konstruerades följande algoritm. Tonalitet mäts både i hela spektrat, T tot och den del av ljudet som vars frekvens är större än 600Hz. För att mäta tonalitet i det övre registret filtreras ljuden med ett högpassfilter av andra ordningen med 600Hz brytfrekvens och därefter mäts totala tonaliteten efter filtreringen T high. Kvoten mellan T high och T tot kallas högfrekvenstonalitet och används för att beskriva hur många toner som finns över 600Hz och hur mycket som finns under den gränsen. Om det bara finns toner ovanför gränsen kommer kvoten ändå att bli tillräckligt hög för att ge resultat. Ton HF = T high /T tot I Test 2 analyseras den skattade störninivån i förhållande till nivåskillnader på olika index och genom stegvis regressionsanalys skapas en modell för störnivå som funktion av signifikanta mätstorheter. Ljudens akustiska egenskaper beskrivs med hjälp av psykoakustiska storheter som skarphet, råhet, fluktuationsgrad, hörstyrka, specifik hörstyrka i 1/3:e dels kritiska band, tonalitet, dissonansmängd samt korskorrelation och A-vägd ljudtrycksnivå. En stegvis regressionsanalys skapar en modell genom att först hitta den variabel som ger den bästa förklaringsgraden till betygsvariationen. Sedan går den igenom de andra variablerna och ser vilken som bäst förklarar residualerna till modellen i steg 1. För varje variabel som ger ett p-värde lägre än den gräns som satts, α Enter, läggs ännu en variabel till modellen. Om en variabel får ett högre p-värde än α Remove på grund av en senare variabel som läggs till tas den tidigare bort. Denna algoritm fortsätter tills det inte finns någon ny variabel som får ett tillräckligt lågt p-värde för att läggas till. Betygsmodellen från test 2 valideras genom korrelationsanalys med resultaten från test 3. 31