Rev. 150119 US MEDIESIGNALER INTRODUKTION 1
VILKA PROBLEM LÖSER VI MED SIGNAL- BEHANDLING? Akustik. Inspelning av sorl från fikarummet vid TFE. Varför pratar alla så högt? Varför hör man inte vad någon säger? Vad bör man göra för att förbättra miljön? Vilka teoretiska metoder finns? 2
VILKA PROBLEM LÖSER VI MED SIGNALBEHANDLING? Bildbehandling: Av misstag har ett foto tagits med felaktig avståndsinställning (fokus). Med signalbehandling kan felet reduceras i efterhand. 3
EX2. FLADDERMUSSIGNAL 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 x 10-3 sek 4
FLADDERMUSFREKVENSER Obs! Frekvensinnehållet är 1/3 av orginalets. 0 1 2 3 4 5 6 7 8 x 10 5 4 Hz
EX3. LJUDSIGNALER FRÅN FIKARUM 0 1 2 3 4 5 6 7 8 9 10 sek 6
FIKARUMSFREKVENSER 0 0.5 1 1.5 2 2.5 3 3.5 4 x 10 3 Hz 7
NÅGRA STANDARDSIGNALER OCH DERAS SPEKTRUM Sinus (400 Hz) 0 2000 5 4000 10 Fyrkant (400 Hz) Harmonisk avklingning 1/k (k udda) 0 2000 5 4000 10 8
NÅGRA STANDARDSIGNALER OCH DERAS SPEKTRUM Sågtand (400 Hz) Harmonisk avklingning 1/k 0 2000 4000 Triangel (400 Hz) Harmonisk avklingning 1/k 2 (k udda) 0 2000 100 5 24000 10 9
VAD ÄR LJUD? HUR UPPFATTAR VI LJUD?
LJUDVÅGOR Ljud uppstår när något vibrerar lufttryck Högtalarmembran Förtätning Förtunning
LJUDVÅGOR Ljudvågens egenskaper: Frekvens Våglängd Amplitud
FREKVENS Antalet svängningar per sekund Anges i Hertz (Hz) En period tiden för en svängning En period (0,2 s) 5 Hz 0 0,2 0,4 0,6 0,8 1 Tid (s)
HÖRSELTEST 20Hz 600Hz 10000Hz 30Hz 700Hz 11000Hz 40Hz 800Hz 12000Hz 50Hz 900Hz 13000Hz 60Hz 1000Hz 14000Hz 70Hz 2000Hz 15000Hz 80Hz 3000 Hz 16000Hz 90Hz 4000Hz 17000Hz 100Hz 5000Hz 18000Hz 200Hz 6000Hz 19000Hz 300Hz 7000Hz 20000Hz 400Hz 500Hz 8000Hz 9000Hz
FREKVENS Vi kan höra 20-20000 Hz Försämras med åldern Unga barn kan höra upp till 23 khz Över 60 år hör man sällan över 8 khz Under 20 Hz infraljud Vi känner ofta vibrationerna Över 20 khz ultraljud
LJUDVÅGOR
VÅGLÄNGD Ljudet breder ut sig med ljudets hastighet Beroende av medium Material, temperatur mm Ca 340 m/s i luft, rumstemperatur Våglängd Våglängd Hastighet Frekvens
FREKVENS Tidsplan Frekvensplan En enda ton (sinusvåg) Fördubbling av frekvensen en oktav 220 Hz 440 Hz 880 Hz = Amplitud Frekvens
FREKVENS Ljud innehåller oftast flera frekvenser Alla ljud kan skapas genom att addera sinustoner + Amplitud = 440 880 Frekvens 440 + 880 Hz 440 Hz
TONHÖJD OCH KLANG Komplext ljud, t ex ett instrument Grundton + övertoner Olika instrument har olika frekvensinnehåll Klangfärg Vi uppfattar grundfrekvensen som tonhöjden
KLANGFÄRG Gitarr Klarinett Människa Tid Frekvens 0 500 1000 1500 2000 0 500 1000 1500 2000 0 500 1000 1500 2000 2500 3000 3500
KLANGFÖRÄNDRING - EQ Vi kan förändra ljudets klangfärg utan att musiken förändras equalization Dämpa vissa frekvenser Lågpassfilter släpper bara igenom låga, dämpar höga Högpassfilter vice versa Bandpassfilter släpper igenom frekvenser inom visst frekvensområde Original Lågpass Högpass Bandpass <3400 Hz >200 Hz 200-3400 Hz (som telefon)
AMPLITUD Volym SPL (Sound Pressure Level) Ljudtrycksnivå Förändrat tryck på trumhinnan Mäts som lufttryck, i bar Normalt lufttryck ca 1 bar Örat uppfattar skillnader på delar av en bar (mikro= miljondel) Små, små förändringar
AMPLITUD Hörselgränsen är förändringar på 0,0002 bar (2 10-10 ) Högsta gräns smärtgräns 0,2 mbar (milli=tusendel) (2 10-4 ) Skillnad 1:1 000 000 Hörseln är logaritmiskt
LOGARITMISK SKALA Linjär Logaritmisk 1000000 1000000 100000 10000 500000 1000 100 100000 1000 0 10 0 log(100)=2 (10 2 ), log(1000)=3 (10 3 ) osv
DECIBEL Decibel förkortas db Tryck referens är hörseltröskeln=0,0002 bar Dubbelt tryck ökar 6 db 20 db 10 gånger högre tryck Smärtgränsen är 120 db Det är så örat uppfattar ljudnivån! db = 20 log( Tryck ) Tryck referens
DECIBEL OLIKA LJUD
FÖRSTÄRKARDECIBEL Ofta ser man på stereoanläggningar skalor där det högsta värdet är 0 db, sedan bara negativa värden 0 db den högsta volymen anläggningen kan ge Denna används som referens! Samma princip kvoten av lägre utsignaler relativt referensen ger negativa db
OLIKA FENOMEN Beats örat kan inte separera två väldigt närliggande frekvenser Man hör snittfrekvensen och amplituden varierar som skillnaden mellan frekvenserna Utnyttjas när man stämmer stränginstrument 1 0.5 0-0.5-1 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 1 0.5 0-0.5-1 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 2 1 0-1 -2 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 200 Hz 208 Hz 200 + 208 Hz (hörs 204 Hz, beat på 8 Hz)
RUMSUPPFATTNING Två öron ger stereomöjligheter vi kan uppfatta vart ett ljud kommer ifrån Ett öra kan inte lokalisera en ljudkälla ordentligt Öronen och hjärnan analyserar skillnaden i intensitet mellan öronen skillnaden i ankomsttid effekterna av ytterörat Kan även användas av ett öra (monolyssning)
RUMSUPPFATTNING Det uppstår en akustisk skugga för ena örat Ljudet måste reflekteras Förlorar intensitet Tar längre tid Låga frekvenser kan runda huvudet, tar dock längre tid
RUMSUPPFATTNING Stereohögtalare Utnyttjar intensitetskillnader till att placera ut instrument mellan högtalarna Om ljudkällan är lika stark i båda öronen befinner sig rakt framför Surround fler högtalare gör att ljudkällor kan placeras ut runtom i rummet
RUMSUPPFATTNING Ljudet sprids åt alla håll från en ljudkälla Bara en liten del når lyssnaren direkt (direktljud) Resten studsar runt och reflekteras eller absorberas Olika frekvenser reflekteras olika, klangen ändras Reflekterat ljud anländer senare och från andra håll än direktljudet Direktljud tidiga reflektioner reverb
RUMSUPPFATTNING
RUMSUPPFATTNING Tidiga reflektioner inom 50 ms Örat och hjärnan sammanfogar ljud inom ca 30 ms, allt tolkas som en och samma ljudkälla Reflektioner gör ljudet fylligare och ger en uppfattning om rummets storlek Större rum tar längre tid att reflektera Litet rum/kyrkosal?
25 ms delay
50 ms delay
75 ms delay
RUMSUPPFATTNING Reverb reflektioner som anländer efter 50 ms Kommer från alla möjliga håll Ger värme och fyllnad till ljudet Hjärnan använder reverbets tid och klang (oftast basfrekvenser som hänger kvar längst) för att uppfatta hårdheten på omgivande ytor Reverbets volym i förhållande till direktljud ger en uppfattning om avståndet till källan
RUMSUPPFATTNING Direktljud ger information om ljudkällans placering, storlek och klangfärg Tidiga reflektioner ger information om rummets storlek Reverb ger information om rummets ytor. Proportionen mellan reverb och direktljud ger uppfattning om avstånd
LJUDEFFEKTER På konstgjord väg kan man ändra rummet som en inspelning ägt rum i Genom att lägga på distortion och begränsa bandbredden (frekvenserna) kan man t ex få rösten att verka komma ur en flygplansradio Talinspelning utan effekter Talinspelning med reverb Talinspelning med distortion Talinspelning med distortion och bandbreddsbegränsning
INSPELNING OCH DIGITALISERING
HUR FÅNGAR MAN LJUDET? I början (Edison uppfann fonografen 1877) spelade man in mekaniskt man sjöng in i en tratt, luftstötarna påverkade ett membran och ljudvågorna ristades in i skivor Nu (sedan 1920-talet) spelas allt in elektriskt Mikrofonen
DIGITALISERING En ljudsignal är analog Vi kan inte höra digitalt ljud Digitalt är bra för att lagra och bearbeta ljud! Kopiera utan förluster A/D-omvandlare (analog digital) D/A-omvandlare tillbaka, till högtalare
DIGITALT LJUD Digitalt ljud lagras binärt, som ettor och nollor Antingen är det en signal eller inte Kan ge bättre kvalitet mer säkerhet Lätt att kopiera Läs av en analog signal och koda den Kolla vad nivån är med jämna intervall
SAMPLING Läs av signalen med ett visst tidsintervall CD-kvalitet 44100 Hz (44,1 khz) samplerate Kan få med frekvenser upp till 22 khz 22 khz, 11 khz kan räcka för talinspelning
KVANTISERING Man måste digitalisera signalens nivå också Hur många ettor och nollor ska användas för varje sampel? Vilket bitdjup? Ju fler bitar desto större noggrannhet CD 16 bitar = 65536 nivåer, 8 bitar = 256 nivåer
DIGITAL SIGNAL Signalen blir taggig innehåller extra frekvenser Slätas ut innan den omvandlas till analog signal Ju högre sampel- och bitvärde desto mindre taggig
DIGITALT LJUD Olika samplerates och bitdjup 44,1 khz, 16 bit (original) 22,05 khz, 16 bit 44,1 khz, 8 bit 22,05 khz, 8 bit 11,025 khz, 8 bit Tal 44,1 khz, 16 bit Tal 11,025 khz, 8 bit
DIGITALT LJUD Råformat för ljud är.wav (PC) och.aif (MAC) CD-kvalitet: 44,1 khz, 16 bit, stereo Filstorleken blir stor 44 100 16 2 = 1 411 200 bit/s (176 400 byte/s) ca 10,6 MB/min CD som rymmer 650 MB rymmer 60 min musik
KOMPRIMERING Lossless förlustfri Går att återskapa filen till originalskick Tar bort överflödig information, t ex flera nollor i rad T ex FLAC minskar filstorleken 30-50 % Lossy förluster uppstår Viss information går förlorad för alltid Går att minska filstorleken mer
KOMPRIMERING MP3 lossy komprimering Tar både bort både överflödig information och riktig information Utnyttjar psykoakustik och människans hörsels egenskaper, komprimerar i frekvensplanet Tar bort sånt som vi ändå inte hör, t ex låga toner med frekvenser nära högre toner Komprimerar ner till en tiondel av filstorleken utan att (de flesta) människor kan höra skillnad!
AKUSTIK Tänk på hur omgivningen låter vid inspelningen Vi hör selektivt och kan urskilja ljud i störiga miljöer, vi tänker inte på störningarna Mikrofoner tar upp allt ljud Hörs inte förrän vid uppspelning Försök lyssna på inspelningen Jobbigt att spela in nytt ljud
AKUSTIK Vilket rum spelas ljudet in i? Efterklangen Stående vågor Beroende på rumsdimensionerna förstärks vissa frekvenser, med våglängder som passar i rummet I en studio försöker man bygga bort reflektioner