Förslag till X-jobb (år 2002) Musikinstrument Vad bestämmer tonen hos violinen? Alla vet att en Stradivarius-fiol har en ton som knappast kan överträffas men hitills har ingen kunnat förklara varför eller ens ge en uttömmande beskrivning av tonen. Traditionellt arbetar man i frekvensdomänen för att beskriva klangliga egenskaper hos instrument. För komplicerade spektra som varierar relativt snabbt över tiden, som exempelvis en fiolton, verkar det inte ge en komplett bild av klangen. I tidsdomänen kan däremot tonens förlopp inklusive attack och utsvängningsförlopp beskrivas bättre men nackdelen är att detaljrikedomen lätt blir för stor. Examensarbetet avser analys och syntes av violintoner i tidsdomänen samt lyssningstest för att utvärdera vilka parametrar i syntesen som är viktigast. Vad bestämmer tonen hos gitarren? Kontakta Erik Jansson erik@speech.kth.se En god klassisk gitarr byggd av en mästare är ganska dyr (ca 60 000 kr) och det krävs flera års väntan på att den ska bli färdig. Gitarrer massfabriceras också till ett betydligt lägre pris men de saknar många av de önskade egenskaperna hos den goda gitarren. Gitarrsträngen exciteras genom en impuls, knäppning, som får klinga av. Pulsen ger upphov till ett nästan periodiskt förlopp som driver resonanser i gitarrkroppen. Gitarrtonens spektrum ändras under hela tonen och det kan vara opraktiskt att arbeta i frekvensdomänen när man vill karaktärisera gitarrens ton. Examensarbetet omfattar analys och syntes i tidsdomänen kombinerat med lyssningstest där parametrarna i syntesen utvärderas. Nyansering i pianospel Kontakta Erik Jansson erik@speech.kth.se Pianot har ett stort dynamiskt omfång mellan ppp och fff, ungefär 40 db för en enstaka ton. En svårighet som pianisten måste behärska är att få två toner att låta lika starka. En liten ökning av hammarens hastighet i anslaget ger större vibrationsamplitud på strängen men även ökad övertonshalt och båda faktorerna bidrar till den uppfattade ljudstyrkan. Arbetet omfattar dels utveckling av ett system för att mäta hammarens hastighet med hög precision, dels bestämning av minsta uppfattbara ändring i anslagshastighet och ljudstyrka i olika register och nyanser. Det kan ske genom lyssningstest där försökspersoner får jämföra inspelade pianotoner, eller genom analys av spridningen när pianister får upprepa en ton eller melodifragment ett stort antal gånger. Exjobbet har anknytning till styrning av pianon med MIDI-interface. Kontakta Anders Ask enfelt andersa@speech.kth.se
Pianoklang och duplexsträngning Pianon och flyglar tillverkas av många fabrikanter i vitt skilda prisklasser men konstruktionerna är förvillande lika. Fackmannen (pianisten, pianoteknikern) brukar dock ganska lätt kunna identifiera prisklass, och ibland även fabrikat, enbart genom att lyssna. Frågan är hur små ändringar i spektruminnehållet som behövs för att särskilja klangen från två instrument. Viktiga komponenter i konstruktionen är filthammarnas komplians, strängarnas inharmonicitet, infästningen av strängarna vid resonansbotten ("steget"), och resonansbottens svängningsmoder. Den kända pianotillverkaren Steinway & Sons har dessutom en konstruktionsfiness med s.k. duplex-strängning som påstås framhäva vissa deltoner. Exjobbet består dels av en akustisk analys av några flyglar (spektrumskillnader sträng - resonansbotten - utstrålat ljud, mätningar av stegets mobilitet, modalanalys av resonansbotten), och dels ett lyssningstest där pianister och pianotekniker får bedöma original och manipulerade pianotoner. Trumslagets dynamik Slagverkare förväntas kunna producera komplicerade rytmer i olika tempo och styrkegrad med mycket varierande kombinationer av klubbor och instrument. Återverkan från instrumentet ("studsen") är en viktig komponent som det gäller att utnyttja i speltekniken. Hur samverkar trumstock (klubba) och trumskinn (cymbal, xylofonstav) och vad utmärker optimala kombinationer? Arbetet innehåller mätningar av trumstockens rörelse, kontakttider och krafter mot underlaget samt försök till beskrivning av samspelet slagverkare trumstock trumma med en enkel biomekanisk modell. Rörblad för saxofon - ny design i kolfiber Luftflödet in i en saxofon eller klarinett styrs av en till synes enkel ventil. En böjlig tunga av trä (sv. rörblad, eng. reed) tätar mot en svagt krökt yta på munstycket. Rörbladet, oftast kallat "rör", tillverkas traditionellt av trä. Under senare år har man börjat tillverka rör i syntetiska material, främst kolfiberkompositer. Vid avancerat spel kan belastningen på rörbladet bli så hög att även ett kolfiberrör bryts sönder efter några toner. Examensarbetet går ut på att analysera och modellera belastningsfallet, mäta rörelser och krafter på rörbladet, beräkna realistiska påkänningar för att förstå brottmekanismer, samt dimensionera, tillverka och prova ett nytt rörblad. Examensarbetet utförs i nära samarbete med en professionell musiker och en instrumentmakare. Se även http://www.speech.kth.se/music/x-jobb-files/music_xjobs_saxreeds.html
Röstfunktion Sång och text Manliga operasångare kännetecknas av en topp i röstspektrat vid ca 3 khz, "sångformanten". Den bildas genom att formanterna 3, 4 och 5 ligger nära varandra och varierar relativt litet mellan olika vokaler. Man kan eliminera sångformanten genom att filtrera rösten med ett inversfilter inställt på fjärde formantens frekvens. Frekvensområdet vid 3 khz är viktigt för att vi skall kunna uppfatta konsonanter. Exjobbet går ut på att undersöka sångformantens betydelse för textuppfattbarhet genom att omväxlande presentera sjungna stavelser som inversfiltreras och som inte filtrerats. För att göra textuppfattbarheten lagom svår presenteras materialet i bakgrundsbrus, filtrerat på lämpligt sätt för att exempelvis efterlikna orkesterackompanjemang. Kvinnor i buller Kontakta Johan Sundberg pjohan@speech.kth.se Varför är en del kvinnoröster omöjliga att höra i bullrande miljö? En hypotes är att det beror på övertonshalten i röstkällan, dvs den signal som det pulserande luftflödet genom stämbanden ger upphov till. Dålig stämbandsslutning medför relativt sett svaga övertoner i röstkällan Uppgiften kan vara att leta igenom ett antal kvinnoröster och utvärdera hur bra det går att uppfatta vad som sägs när deras tal blandas med lämpligt brus (partybabbel). Fonationsbeteendet hos ett antal röster som hörs bra respektive dålig analyseras sedan genom inversfiltrering av vokaler uttalade på olika tonhöjd och med olika röststyrka för att utröna röstkällans egenskaper. Konsonantljuden analyseras med långtidsmedelvärdat spektrum av löpande tal. Den akustiska analysen kan kombineras med höghastighetsfilmning av stämbands-vibrationerna i samarbete med Huddinge sjukhus. Medicinsk röstanalys Kontakta Johan Sundberg pjohan@speech.kth.se Vid medicinsk analys av röstfunktion är det av stort intresse att få ett mått på hur energiskt stämbanden slår ihop utan att behöva använda invasiva metoder (dvs föra ned sensorer i halsen). De två följande förslagen handlar om hur man skulle kunna extrahera sådan information direkt ur en mikrofonsignal. Hur flödar luften förbi stämbanden? Ljudet av stämbandsvibrationerna deformeras kraftigt av resonanserna i ansatsröret och ut kommer vokaler och konsonanter. Detta är en komplikation om man är intresserad av de ursprungliga stämbandsvibrationerna. Man kan då tillgripa så kallad inversfiltrering, i vilken ansatsrörets resonanser kompenseras bort. Det är dock svårt att ställa in sådana filter manuellt. Med LPC-analys kan adaptionen av filtret göras någorlunda automatiskt. Examensarbetet handlar om att finna en lagom komplicerad variant av LPC-analysen. Den ska kunna köras i realtid på en signalprocessor eller en snabb persondator så att metoden kan användas kliniskt (röstanalys, signalbehandling, realtidsprogrammering).
Hur mycket tar man i med rösten? Ibland är man inte intresserad av att analysera vågformen på luftflödet förbi stämbanden för att bestämma röststyrkan, utan söker enbart ett skalärt mått på hastigheten eller energin hos stämbandsslutningen. Preliminära försök visar att man med Hilbert-transformation och mätning av toppfaktorn i signalen kan få ett sådant mått med ganska lite beräkningar. Examensarbetet handlar om att förfina och utvärdera detta mått, utreda huruvida det korrelerar med perceptuella röstbedömningar gjorda av röstexperter, samt att kartlägga dess typiska samvariation med tonhöjd och röststyrka. Resultaten har direkt tillämpning i den kliniska röstvården (röstanalys, signalbehandling, experimentell metodik). Rumsakustik Vibrationer i podiegolv Podiegolvet kan tänkas ha betydelse för ljudutstrålningen från vissa instrument i symfoniorkestern - främst violoncelli, kontrabasar och vissa slagverk - på grund av att vibrationer i instrumenten leds ner i golvet. Med en lämplig konstruktion av podiet kan troligen en del lågfrekventa deltoner framhävas genom ljudutstrålning från det vibrerande golvet. Podiet i några berömda konsertsalar anses ha just denna egenskap. Uppgiften består i inspelning och analys av vibrationsnivåer i podiegolv under spel, överslagsberäkningar av hur mycket golvvibrationerna kan bidra till ljudnivån i olika frekvensband, samt verifiering genom drivning av golvet med vibrator och mätning av ljudnivåer på podiet och ute i salen. Realtidssimulering av rumsakustik Interaktiva institutet utvecklar en mjukvarubaserad server för 3D-ljud i VR miljöer och interaktiva applikationer, bla för KTHs VR-KUB. Som en del i detta projekt kommer ett delsystem att utvecklas för realtidssimulering av rumsakustik. Uppgiften består i att bygga ett system för realtidssimulering av rumsakustik som skall användas i forskning kring akustiksimulering. Systemet bör vara modulärt och skall i första hand bestå av ett antal programmoduler för hantering av geometrin som ligger till grund för den akustiska simuleringen. Så kallad Beam tracing -teknik är den simuleringsmetodik som kommer att användas i projektet. Utgångspunkten är en geometrisk beskrivning av den miljö som skall simuleras utökad med akustisk information. Geometrin delas upp i konvexa polyedrar, grannpolyedrar länkas samman i en granngraf. Möjliga reflektioner för en ljudkälla representeras av ett träd med pyramidutsnitt. När resultatet skall beräknas kan relevanta reflektioner snabbt beräknas med hjälp av dessa träd. Goda kunskaper i C++ och datorgeometri behövs samt kännedom om akustik, speciellt rumsakustik. Tillsammans med uppdragsgivaren specificeras ett prototypsystem för realtidssimulering av rumsakustik och detta implementeras i C++. Eventuellt kan vissa delar komma att implementeras i Java. Resultatet består av ett antal fungerande programmoduler som kan användas i forskning kring realtids-3d-ljud. Interaktiva institutet förbehåller sig rättigheterna till skriven kod. Övriga villkor preciseras i avtal vid projektets början. Kontakta Peter Lundén peter.lunden@interactiveinstitute.se
Instrumentsyntes Ljudnivå och spektrumlutning hos musikinstrument En grundregel för akustiska musikinstrument är att diskanten höjer sig snabbare än basen när man spelar starkare. Emellertid är det nästa inga syntar som gör detta på rätt sätt. Examensarbetet handlar om att ta reda på hur professionella musiker helst vill att samvariationen mellan tillförd kraft, ljudnivå och spektrumlutning skall uppföra sig. Vi är också intresserade av att undersöka andra detaljaspekter av interaktionen mellan musiker och instrument. Hur stabil är en attraktor? Examensarbetet handlar om att försöka kvantifiera oregelbundenhet med hjälp av delar ur kaos-teorin och icke-linjär dynamik. Man kan ur en godtycklig kvasiperiodisk signal (röst eller ton) lätt bilda en s.k. attraktorkurva, t ex som en Lissajou-figur på ett oscilloskop. Kurvans stabilitet över tiden tycks för ögat avspegla stabiliteten i tonen. Frågan är om man kan hitta ett matematiskt-numeriskt mått på hur stabil attraktorkurvan är. Detta skulle vara av intresse både inom röstanalys och vid utvärdering av toner från syntar. Dålig röstfunktion yttrar sig ofta i oregelbundna stämbandssvängningar. Under årtionden har man försökt hitta olika lämpliga mått på oregelbundenhet, men inget har visat sig robust i alla lägen. Synt-toner blir snabbt tråkiga om de inte inrymmer en "lagom" oregelbundenhet. (ljudanalys, tillämpad matematik, numeriska metoder) Performance Interaktiv musik på nätet Musik är ett av de viktigaste områdena på nätet och "mp3" är just nu det vanligaste sökordet i alta vista. Genom att tillämpa aktuell forskning finns möjlighet att utveckla nya interaktiva tjänster inom musikområdet. Möjliga projekt: 1. Musikalisk sökmotor: Spela dom första tonerna i melodin och programmet söker i olika databaser på nätet efter tex midi eller not-filen. 2. Plugin eller JAVA program för att spela upp midifiler från nätet med musikaliskt uttryck (tex från the classical midi archive med över 8000 midifiler, http://ftp.sunet.se/cma/midi.html ) 3. En översikt över olika format för att representera musik (midi, mp3, mp7 realaudio) och dess användbarhet i olika interaktiva miljöer som tex flash, vrml, java. 4. Utveckla en "edutainment" mjukvara för att framföra musik inom någon VR miljö typ vrml eller flash. Kontakta Anders Friberg andersf@speech.kth.se
Känslor i musik Aktuell forskning visar att det är möjligt att framföra datorgenererad musik så att den ger associationer till olika känslor enbart genom att variera själva interpretationen. Det är även möjligt att formulera generella automatiska regler för detta. En prototyp har utvecklats på institutionen, se http://www.speech.kth.se/~roberto/emotion/ Möjliga projekt är att 1. utveckla emotionssyntesen för andra instrument tex sångröst eller fiol, 2. utveckla ett automatiskt system som kan känna igen olika känslor i framförd musik eller sång, 3. undersöka möjligheten att använda variation av klangfärg och rumsmiljö (t ex akustik och ljus) för att förstärka kommunikationen av känsloaspekter. När startar en ton? Kontakta Roberto Bresin roberto@speech.kth.se Olika instrument har olika typer av attacker med varierande tidskonstanter. I sång finns även de olika språkljuden att ta hänsyn till, dvs tycker vi att tonen startar på en initial konsonant eller startar den på den efterföljande vokalen? Arbetet består i att bestämma toners perceptuella onset med hjälp av lyssningstest. Se även http://www.speech.kth.se/music/performance/ Kontakta Anders Friberg andersf@speech.kth.se Egna förslag till examensarbeten diskuteras gärna!