Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå (loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.
|
|
- Alexandra Martinsson
- för 8 år sedan
- Visningar:
Transkript
1 Psykoakustik TSBK35 fö 10 p.3 Ljudtrycksnivå TSBK35 fö 10 p.4 Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det ska märkas så lite som möjligt. Alla moderna ljudkodningsmetoder utnyttjar psykoakustik vid kodningen, vilket ger en signifikant förbättring av den upplevda kvaliteten. Ljudet kan representeras som en tryckvåg med trycket p. Ljudtrycksnivån (sound pressure level, SPL) definieras som SPL =10 log 10 ( p p 0 ) 2 [db] där p 0 =20µP a är det minsta ljudtryck som kan uppfattas för en ton vid 2 khz. Ofta beskriver man ljud i termer av ljudintensiteten I, vilket är effekten per ytenhet (W/m 2 ) i ljudvågen. I är proportionell mot p 2. Sålunda kan SPL också beräknas som SPL =10 log 10 I I 0 [db] där I 0 =10 12 W/m 2 motsvarar intensiteten för en våg med tryck p 0. Hörnivå (loudness) TSBK35 fö 10 p.1 Hörselns omfång TSBK35 fö 10 p.2 Hörnivån för ett ljud definieras av nivån på en ton vid 1 khz som uppfattas som lika starkt som ljudet. Hörnivån beror på intensiteten, frekvensinnehåll och längd. Figuren visar hur hörnivån varierar med nivå och frekvens för tonsignaler. Hörnivån 0 db sätter en gräns för hur svaga ljud som kan uppfattas, den så kallade hörseltröskeln. Figuren visar hela omfånget för människans hörsel, samt typiska värden för tal och musik.
2 TSBK35 fö 10 p.7 TSBK35 fö 10 p.8 Hörseltröskel Hörseltröskel Hörseltröskeln är viktig i ljudkodningssammanhang. Frekvenskomponenter i insignalen som ligger under tröskeln kan tas bort utan att lyssnaren märker någon skillnad. Om kvantiseringsbruset för de frekvenskomponenter som skickas ligger under tröskeln kommer det inte att vara märkbart. Figuren visar hur hörseltröskeln typiskt varierar med åldern. Maskering TSBK35 fö 10 p.5 Frekvensmaskering TSBK35 fö 10 p.6 Förutom hörseltröskeln kan man även utnyttja ett fenomen som kallas maskering (eng. masking) vid ljudkodning. Maskering innebär att starka ljud dränker ut svaga ljud. Dessa svaga ljud kan då tas bort helt eller kvantiseras hårdare. Maskeringen uppträder både i tid (temporal maskering) och i frekvens. Avståndet mellan nivån för en signalkomponent och den maskeringskurva den ger upphov till vid en viss frekvens brukar benämnas signal to mask ratio, SMR. Ju högre SMR, desto mindre maskering. Ett starkt ljud maskerar svagare ljud vid närliggande frekvenser.
3 Smalbandigt brus TSBK35 fö 10 p.11 Smalbandigt brus TSBK35 fö 10 p.12 Figuren visar hur smalbandigt brus maskerar tonsignaler vid olika frekvenser. Figuren visar hur smalbandigt brus maskerar tonsignaler vid olika nivåer. Toner TSBK35 fö 10 p.9 Temporal maskering TSBK35 fö 10 p.10 Ett starkt ljud maskerar svagare ljud både innan (pre-masking) och efteråt (post-masking). Post-masking varar mycket längre än pre-masking. Figuren visar hur en ton vid 1 khz maskerar andra tonsignaler.
4 TSBK35 fö 10 p.15 TSBK35 fö 10 p.16 Kritiska band Barkskalan Som synes i tidigare kurvor beror maskeringens bredd på frekvensen hos den maskerande komponenten. Detta är direkt kopplat till hur hörselsinnet fungerar rent fysiskt. Man brukar därför beskriva signalen i den så kallade barkskalan, där man delar in frekvenserna i band som motsvarar hörselsinnets frekvensupplösning. z f l f u f z f l f u f Bark Hz Hz Hz Bark Hz Hz Hz TSBK35 fö 10 p.13 TSBK35 fö 10 p.14 Smalbandigt brus Smalbandigt brus Figuren visar hur maskeringen för smalbandigt brus ser ut beskriven i barkskalan. Maskeringen ser i princip likadan ut för alla frekvenser (jämför med tidigare figur.) Maskering för smalbandigt brus vid 1 khz vi olika nivåer.
5 TSBK35 fö 10 p.19 TSBK35 fö 10 p.20 Psykoakustiska modeller MDCT Vid ljudkodning kodas signalen typiskt i block av storleksordningen 1000 sampel. För att utnyttja psykoakustiken mäter man blockets innehåll av olika frekvenskomponenter (helst i barkskalan). Man försöker även klassificera de olika banden som toner eller brus. Prototypmaskeringskurvor för de olika banden kombineras med hörseltröskeln till en total SMR-kurva. Bitar delas ut till de olika banden så att SNR (om möjligt) är större än SMR för alla band. Om bitarna inte räcker, delas de ut så att den totala skillnaden mellan SMR och SNR minimeras. Skillnaden mellan SMR och SNR brukar kallas noise to mask ratio, NMR. En populär transform i ljudkodningssammanhang är MDCT (modified DCT) som är en utvidgning av vanlig DCT till överlappande block. Antag att x t (k) är sampel i signaldomänen och X t (m) sampel i transformdomänen för block t. n 1 X t (m) = w(k) x t (k) cos( π 2n (2k +1+n )(2m +1)) 2 för m =0,..., n 2 1 k=0 w(k) är en fönsterfunktion som ska uppfylla vissa krav: w(k) =w(n 1 k), w(k) 2 + w(k + n 2 )2 =1 MDCT TSBK35 fö 10 p.17 Transformen tar alltså n sampel och transformerar till n 2 transformkomponenter. För nästa block tar man n 2 sampel från förra blocket och n 2 nya sampel. TSBK35 Fönstring i MDCT fö 10 p.18 Inverstransform: y t (p) =w(p) 4 n 2 1 X t (m) cos( π n 2n (2p +1+n )(2m +1)) 2 m=0 för p =0,...,n 1 x t (q) =y t 1 (q + n 2 )+y t(q) för q =0,..., n 2 1 Exempel på fönsterfunktioner: w(k) =sin( π n (k )) w(k) =sin( π 2 sin2 ( π n (k )))
6 TSBK35 fö 10 p.23 TSBK35 fö 10 p.24 Blockstorlek vs kvantiseringsbrus Blockstorlek vs kvantiseringsbrus Ett block om 512 sampel från en musiksignal. I början är det tyst och drygt halvägs in i blocket börjar musiken. Blocket transformeras (DCT), kvantiseras och inverstransformeras Kvantiseringen av transformkomponenterna gör att den del av signalen som var tyst nu innehåller ljud. Om blockstorleken är för stor kan det hända att den temporala maskeringen inte räcker till, utan att man hör lite brus innan det riktiga ljudet börjar (pre-echo). Blockstorlek vs kvantiseringsbrus TSBK35 fö 10 p.21 MPEG-1 audio TSBK35 fö 10 p.22 Om vi istället delar blocket i två block om 256 sampel och transformerar och kvantiserar får vi 0.25 Ljudkodningsdelen i videokodningsstandarden MPEG-1. Stöder samplingsfrekvenser på 32, 44.1 och 48 khz En eller två kanaler: Mono Två monokanaler (Dual channel) Stereo Simple stereo: En högerkanal och en vänsterkanal. Joint stereo: Utnyttja beroendet mellan kanalerna Bruset innan ljudet börjar är nu mycket kortare och maskeras lättare. I ljudkodare är det därför vanligt att man kan välja mellan flera olika blockstorlekar för att kunna anpassa kodningen till signalen. Datatakt på 32 till 224 kbit/s per kanal.
7 TSBK35 fö 10 p.27 TSBK35 fö 10 p.28 Joint stereo MPEG-1 layers Beroendet mellan de två kanalerna kan utnyttjas på två olika sätt. Middle/Side stereo: Istället för att koda vänster och höger kanal, kodar man summan respektive skillnaden mellan höger och vänster kanal. Skillnadskanalen innehåller oftast lite information och är därför lättkodad. Intensity stereo: För höga frekvenser ges stereoinformationen mer av tidsenvelopen än av det exakta frekvensinnehållet. För frekvenser över någon nivå kodar man bara en kanal med frekvensinnehåll, men man skickar olika skalfaktorer för höger och vänster kanal. Middle/Side och Intensity stereo kan kombineras. Tre nivåer (layers) av komprimering, med olika komplexitet och kompression Layer I Enkel, passar för > 128 kbit/s per kanal (DCC) Layer II Mer komplex, passar för datatakter runt 128 kbit/s per kanal (DAB) Layer III Störst komplexitet, ger bäst kompression, godtagbar kvalitet vid 64 kbit/s per kanal (mp3) Alla tre nivåerna bygger i grunden på en delbandskodare med 32 lika breda frekvensband. MPEG-1, layer I TSBK35 fö 10 p.25 MPEG-1, layer II TSBK35 fö 10 p.26 Kodas i frames om 384 sampel (12 sampel varderera från varje delband). En psykoakustisk modell används för att fördela bitar till de olika delbanden. Varje delband ges mellan 0 och 15 bitar, och en skalfaktor som används för att skala om kvantiseraren. Kvantiseringen är likformig. Skalfaktorerna och bittilldelningen skickas som sidoinformation i bitströmmen. Kodas i frames om 1152 sampel (3 12 sampel varderera från varje delband). En psykoakustisk modell används för att fördela bitar till de olika delbanden. Varje delband ges mellan 0 och 15 bitar, och 0-3 skalfaktorer (varje grupp om 12 sampel ha var sin skalfaktor, eller så kan de dela på skalfaktor) som används för att skala om kvantiserarna. Kvantiseringen är likformig. Skalfaktorerna och bittilldelningen skickas som sidoinformation i bitströmmen.
8 TSBK35 fö 10 p.31 TSBK35 fö 10 p.32 MPEG-1, layer III Vorbis 1152 sampel/frame. Först använder man samma delbandskodare som i layer I och II. Därefter görs en MDCT inom delbanden, med blocklängd 12 eller 36, för att förfina frekvensuppdelningen. Därigenom får man en frekvensuppdelning som bättre kan anpassas till barkskalan. Till skillnad från Layer I och II så används olikformig kvantisering (en typ av kompander). Skalfaktorer tilldelas till olika frekvensband, som nästan motsvarar kritiska band, för att skala om kvantiserarna. Statisk huffmankodning (fixa kodord) används för att ytterligare minska datatakten. Open source-projekt för att göra en ljudkodare som inte innehåller några patenterade delar. MDCT med blockstorlek mellan 64 och 8192 (jämna tvåpotenser). Envelopen till transformdatat beräknas och skickas kompakt som frekvenssvaret till ett linjärt filter, eller som en styckvis linjär (i db-skala) funktion. Residualen, dvs transformdatat dividerat med envelopen vektorkvantiseras och huffmankodas. Standarden tillåter också att man kan låta omgivande frames använda det tillgängliga bitutrymmet om de skulle visa sig vara svårare att koda. På så sätt kan den momentana datatakten variera något från block till block. Envelop typ 1 TSBK35 fö 10 p.29 Kvantisering och huffmankodning TSBK35 fö 10 p.30 Ett antal olika vektorkvantiserare skickas som sidoinformation. Antalet dimensioner maximalt I praktiken används bara små dimensioner. Kvantiserarna är antingen generella (explicita värden på alla vektorer), eller gitterkvantiserarer (rekonstruktionspunkterna läggs ut i ett regelbundet mönster). Till varje kvantiserare skickas även en huffmankod.
9 Residualkodning TSBK35 fö 10 p.35 Kvantiseringspass TSBK35 fö 10 p.36 Varje kanal delas in i ett antal lika stora partitioner. För varje partition specificeras vilka kvantiserare som ska användas för den partitionen. Man kan koda med en enda kvantiserare, eller så kan man kvantisera i flera pass (multi-stage VQ). Det finns även en möjlighet att interleava flera kanaler till en enda kanal innan kvantiseringen. Kvantiseringspass TSBK35 fö 10 p.33 Interleaving TSBK35 fö 10 p.34
10 TSBK35 fö 10 p.39 TSBK35 fö 10 p.40 Kanalkorrelation Dolby Digital Korrelationen mellan kanalerna (i stereofallet höger och vänster kanal) kan utnyttjas på några olika sätt. Genom interleaving kan man utnyttja beroendet mellan kanalerna i vektorkvantiseringen. Ett annat alternativ är att koda det största värdet samt skillnaden mellan det största och det minsta värdet. Skillnadssignalen kan sen kvantiseras hårdare än maxsignalen. I extremfallet tas den bort helt. Den enda stereoinformationen ges då av kanalernas olika envelop (jämför Intensity Stereo i mp3) Stöder samplingsfrekvenser på 32, 44.1 och 48 khz. Upp till 5+1 kanaler. Datatakt mellan 32 och 640 kbit/s. Ljud kodas i frames som består av 1536 sampel. I första hand används MDCT med n = 512, Om ett block innehåller en transient från låg amplitud till hög används i stället MDCT med n = 256. Dolby Digital, forts. TSBK35 fö 10 p.37 AAC TSBK35 fö 10 p.38 Man kan kombinera kanaler så att man bara skickar en kanal med frekvensinnehåll plus skalfaktorer för alla kanalerna (jfr intensity stereo för mp3). För rena stereosignaler kan man koda antingen vänster och höger kanal för sig, eller summa- och skillnadskanaler (jfr middle/side stereo för mp3). Transformkoefficienterna kodas med exponent plus normerad mantissa. Bittilldelningen skickas inte explicit. Istället skickar man en SMR-kurva och så får avkodaren göra bittilldelningen till mantissorna utgående från den kurvan och de avkodade exponenterna. Naturligtvis bör kodaren göra bittilldelningen på samma sätt. Advanced Audio Coding Kodningsmetod som först standardiserades i MPEG-2 och senare också i MPEG-4. MDCT med blockstorlek n = 2048 eller n = 256. Olikformig kvantisering (en typ av kompander). Huffmankodning av kvantiserade koefficienter (färdiga tabeller att välja bland, 2 eller 4 koefficienter i taget). I MPEG-4 tillkom saker som aritmetisk kodning och vektorkvantisering.
11 ATRAC1 Spectral Band Replication (SBR) Adaptive Transform Acoustic Coding Kodningsmetod använd i MiniDisc. Signalen delas i tre frekvensband ( khz, khz och khz) med en enkel delbandskodare. Därefter görs MDCT-kodning på varje delband. Två olika blockstorlekar (64 och 512). Bittilldelning till de olika komponenterna enligt någon psykoakustisk modell. Datatakt 292 kbit/s. En metod där man skär bort högpassinnehållet ur ljudsignalen innan kodningen. Vid avkodningen återskapas högfrekvensinnehållet från lågpassinnehållet. Man skickar även med lite extra information i det kodade datat för att hjälpa till vid återskapandet av högpasssignalen. Kan användas tillsammans med nästan vilken kodningsmetod som helst. I kombination med mp3 kallas det mp3pro. I kombination med AAC kallas det aacplus. Påstås ge procents minskning av datatakten vid samma upplevda kvalitet. aacplus används i DRM (Digital Radio Mondiale) som är digitalradio via kort- och mellanvågsbanden, samt i den nya versionen av DAB. TSBK35 fö 10 p.41 TSBK35 fö 10 p.42
Människans hörsel är ganska väl studerad och det finns bra modeller för den.
Psykoakustik Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det ska märkas så
Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.
Psykoakustik Ljudtrycksnivå Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det
4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck
Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 3. Ljudkodning
Föreläsning 10: Ljudkodning ( Audio Coding )
Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 1. Ljudkodning
Linjär prediktion. Prediktiv kodning. Linjär prediktion. Prediktiv kodare och avkodare
Prediktiv kodning Linjär prediktion Närliggande sampel i en signal är oftast starkt korrelerade med varandra, det kan därför vara en bra ide att försöka utnyttja denna korrelation (minnet) innan kvantiseringen
En generell prediktiv kodare utnyttjar signalens utseende N steg tillbaka i tiden för kodningen, dvs vi kodar efter den betingade fördelningen
Prediktiv kodning Närliggande sampel i en signal är oftast starkt korrelerade med varandra, det kan därför vara en bra ide att försöka utnyttja denna korrelation (minnet) innan kvantiseringen för att få
Analys/syntes-kodning
Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk
Digital Signalbehandling i Audio/Video
Digital Signalbehandling i Audio/Video Institutionen för Elektrovetenskap Laboration 1 (del 1) Martin Stridh Lund 2005 2 Kapitel 1 Musikkompression Denna laboration handlar om kompression av ljud och musik
Föreläsning 7: Bild- och videokodning
Föreläsning 7: Bild- och videokodning Inledning - varför bildkodning - tillämpningar - grundprinciper Förlustfri kodning - Variabellängdskodning - Skurländskodning - Huffmankodning Irreversibla kodningsmetoder
Spektrala Transformer
Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)
Spektrala Transformer
Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)
Skurlängdskodning. aaaabbbbbbbccbbbbaaaa. Man beskriver alltså sekvensen med ett annat alfabet än det ursprungliga.
Datakompression fö 4 p1 Skurlängdskodning Ibland har man källor som producerar långa delsekvenser av samma symbol Det kan då vara praktiskt att istället för att beskriva sekvensen som en följd av enstaka
Transformkodning Idé: 1. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block
Transformkodning Idé:. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block med en lämplig, reversibel transform till en ny sekvens.
Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19
Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Tillåtna hjälpmedel: Valfri miniräknare (utan möjlighet till trådlös kommunkation). Valfri litteratur, inkl. kursböcker, formelsamlingar.
Grundläggande ljud- och musikteori
Grundläggande ljud- och musikteori Jan Thim Magnus Eriksson Lektionens syfte Syftet med denna lektion är är att att ge ge förståelse för för decibelbegreppet, spektrum, digitalisering och och olika olika
EXAMENSARBETE. Skillnader mellan elgitarrtoner vid olika tonhöjd av LAME MP3-kodning. Henrik Alakangas. Filosofie kandidatexamen Ljudteknik
EXAMENSARBETE Skillnader mellan elgitarrtoner vid olika tonhöjd av LAME MP3-kodning Henrik Alakangas Filosofie kandidatexamen Ljudteknik Luleå tekniska universitet Institutionen för konst, kommunikation
DT1130 Spektrala transformer Tentamen
DT3 Spektrala transformer Tentamen 6 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:
Digital signalbehandling Digitalt Ljud
Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1
Grundläggande signalbehandling
Beskrivning av en enkel signal Sinussignal (Alla andra typer av signaler och ljud kan skapas genom att sätta samman sinussignaler med olika frekvens, Amplitud och fasvridning) Periodtid T y t U Amplitud
FLAC (Free Lossless Audio Coding)
Datakompression fö 9 p.1 FLAC (Free Lossless Audio Coding) Distorsionsfri kodning av ljud Ljudsignalen delas in i block (typiskt några tusen sampel). Koda summa/skillnad av de två stereokanalerna om det
I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler
Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Kodning av tal Kodning av musik MPEG-4 Audio toolbox Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder
Kodning av tal Kodning av musik MPEG-4 Audio toolbox
Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder
Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7 hp Kurskod: HÖ1015 Tentamenstillfälle 4
IHM Kod: Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7 hp Kurskod: HÖ115 Tentamenstillfälle 4 Datum 213-11-7 Tid 4 timmar Kursansvarig Susanne Köbler Tillåtna hjälpmedel Miniräknare Linjal
Kodning med distorsion
Kodning med distorsion Vi har en signal x n, n = 1... N som ska kodas. Alfabetet är en delmängd av de reella talen A R. Alfabetet kan vara kontinuerligt. Om vi inte har kravet att den avkodade signalen
Adaptiv aritmetisk kodning
Datakompression fö 8 p.1 Adaptiv aritmetisk kodning Aritmetisk kodning är väldigt enkel att göra adaptiv, eftersom vi bara behöver göra en adaptiv sannolikhetsmodell, medan själva kodaren är fix. Till
Ordbokskodning. Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning)
Datakompression fö 6 p.1 Ordbokskodning Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning) Man skapar en ordbok som innehåller 2 b olika sekvenser av symboler
Exempel, minnesfri binär källa. Ordbokskodning. Lempel-Zivkodning. Lempel-Zivkodning, forts.
Datakompression fö 6 p.3 Datakompression fö 6 p.4 Ordbokskodning Exempel, minnesfri binär källa Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning) Man skapar
Källkodning. Egenskaper hos koder. Några exempel
Källkodning Källkodning innebär att vi avbildar sekvenser av symboler ur en källas alfabet på binära sekvenser (kallade kodord). Mängden av alla kodord kalls för en kod. (Man kan förstås tänka sig att
Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts.
Datakompression fö 3 p.3 Datakompression fö 3 p.4 Optimala koder Övre gräns för optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning)
Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or.
Datakompression fö 3 p.1 Optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning) som har lägre kodordsmedellängd. Det existerar förstås
Örat. Johnson, Kap 3. Basic audition
Det här kapitlet handlar om det man brukar kalla det perifera hörselsystemet och lite om hur processningen på den nivån ser ut och vilka skalor som bäst kan beskriva detta. Så låt oss då först bara påminna
Signaler och system, IT3
Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Att sända information mellan datorer. Information och binärdata
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson (Maria Kihl) Att sända information mellan datorer värd 11001000101 värd Två datorer som skall kommunicera. Datorer förstår
MEDIESIGNALER INTRODUKTION
Rev. 150119 US MEDIESIGNALER INTRODUKTION 1 VILKA PROBLEM LÖSER VI MED SIGNAL- BEHANDLING? Akustik. Inspelning av sorl från fikarummet vid TFE. Varför pratar alla så högt? Varför hör man inte vad någon
Föreläsning 1: Bild- och ljudkodning
Föreläsning 1: Bild- och ljudkodning 1. Kursöversikt 2. Introduktion till bild- och ljudkodning - syfte - historik - antal bitar per bildpunkter/sampel 3. Två principiella klasser : distorsionsfri och
DT1130 Spektrala transformer Tentamen
DT3 Spektrala transformer Tentamen 5 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: p, B: 6 p, A: 8 p Tillåtna hjälpmedel:
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson Att sända information mellan datorer värd 11001000101 värd Två datorer som skall kommunicera. Datorer förstår endast
SMS047 Mediakodning. Introduktion. Frank Sjöberg. Introduktion. Introduktion
SMS047 Mediakodning Frank Sjöberg Email: frank@sm.luth.se Rum A3207 Kursen behandlar kodning av fyra olika typer av media Text & annan data Bild Ljud (ej tal) Video Vi kommer i första hand att studera
TSBB16 Datorövning A Samplade signaler Faltning
Name: ID number: Passed: LiU-ID: Date: TSBB16 Datorövning A Samplade signaler Faltning Utvecklad av Klas Nordberg Computer Vision Laboratory, Linköping University, Sweden 24 augusti 2015 Introduktion Denna
Digital kommunikation. Maria Kihl
Digital kommunikation Maria Kihl Läsanvisningar Kihl & Andersson: 2.1-2.3, 3.1-2, 3.5-6 (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 8.1, 8.2 Forouzan 5th: 3.1-3.4, 3.6, 4.1-4.2, 5.1, 6.1.1, 6.1.3 2 Protokoll
Språkljudens akustik. Akustik, akustiska elementa och talanalys
Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns
Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation
Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation Etapp 1 Problem med mätsignalen m.a.p. sampling, vikning och spektraltäthet Problembeskrivning Uppdragsgivaren överväger att skaffa nya A/D-omvandlare
Kapitel 2 o 3. Att skicka signaler på en länk. (Maria Kihl)
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson (Maria Kihl) Att sända information mellan datorer värd äd 11001000101 värd äd Tåd Två datorer som skall kllkommunicera.
Aritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12
Aritmetisk kodning Vi identifierar varje sekvens av källsymboler med ett tal i intervallet [0, 1). Vi gör det med hjälp av fördelningsfunktionen (cumulative distribution function) F. För enkelhets skull
DIGITAL KOMMUNIKATION
EN KOR SAMMANFANING AV EORIN INOM DIGIAL KOMMUNIKAION Linjär kod En binär linjär kod kännetecknas av att summan av två kodord också är ett kodord. Ett specialfall är summan av ett kodord med sig själv
Digital kommunikation. Maria Kihl
Digital kommunikation Maria Kihl Läsanvisningar Kihl & Andersson: 2.1-2.3, 3.1-2, 3.5-6 (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 5.3, 8.1, 8.2 2 Protokoll När människor kommunicerar använder vi ett språk.
Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden.
Videokodning Begrepp och beteckningar Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden. Bilderna skickas antingen progressivt (hela bilden på en gång) eller med interlace
Rekommendation. Den mänskliga hörseln. Den mänskliga hörseln. Det perifera hörselsystemet: anatomi och fysiologi
Rekommendation Den mänskliga hörseln Mattias Heldner heldner@kth.se Repetera Engstrand kapitel 10 om hörselsystemet. Betydligt mer lättillgänglig än Moore... Johnson också på en bra nivå Den mänskliga
Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer. Khalid Sayood, Introduction to Data Compression
TSBK35 fö 1 p.3 TSBK35 fö 1 p.4 Kurslitteratur Kompression av ljud och bild Harald Nautsch harna@isy.liu.se http://www.icg.isy.liu.se/courses/tsbk35/ ISY Bildkodning, Linköpings universitet Khalid Sayood,
Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden-
Analogt och Digital Bertil Larsson Viktor Öwall Analoga och Digitala Signaler Analogt Digitalt 001100101010100000111110000100101010001011100010001000100 t Analogt kontra Digitalt Analogt få komponenter
Denna våg passerar mikrofonen, studsar mot väggen och passerar åter mikrofonen efter tiden
Lösning till inlämningsuppgift 1 Beskriv först ljudtrycket för den infallande vågen som en funktion av tiden. Eftersom trycket ökar linjärt mellan sågtandsvågens språng och eftersom periodtiden är T=1
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson Att göra Kursombud Williams bok???? Kolla schemat: Övningar flyttade Labanmälan ska funka nu 2 Att sända information
Bilaga A, Akustiska begrepp
(5), Akustiska begrepp Beskrivning av ljud Ljud som vi hör med örat är tryckvariationer i luften. Ljudet beskrivs av dess styrka (ljudtrycksnivå), dess frekvenssammansättning och dess varaktighet. Ljudtrycksnivå
GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen
GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen 26.02013 kursens övningsuppgifter eller gamla tentamensuppgifter, eller Matlab-, Scilab- eller Octave- programmerbara kalkylatorer eller datorer. 1.
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson
Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson Att sända information mellan datorer värd 11001000101 värd Två datorer som skall kommunicera. Datorer förstår endast
Ämnesområde Hörselvetenskap A Kurs Signalteori, 7,5 hp Kurskod: HÖ1007 Tentamenstillfälle
Institutionen för hälsovetenskap och medicin Kod: Ämnesområde Hörselvetenskap A Kurs Signalteori, 7,5 hp Kurskod: HÖ1007 Tentamenstillfälle Datum 2013-08-19 Tid 4 timmar Kursansvarig Susanne Köbler Tillåtna
INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:
INT 3 F4 Medieteknik Del2 Komprimering, ljud och rörliga bilder DSV Peter Mozelius Bildkomprimering Olika algoritmer för bildkomprimering: Icke-förstörande komprimering RLE Run Length Encoding Huffman-kodning
EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG
FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal
Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7 hp Kurskod: HÖ1015 Tentamenstillfälle 1
Hälsoakademin Kod: Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7 hp Kurskod: HÖ115 Tentamenstillfälle 1 Datum 211 11 3 Tid 4 timmar Kursansvarig Susanne Köbler Tillåtna hjälpmedel Miniräknare
Shannon-Fano-Elias-kodning
Datakompression fö 5 p.1 Shannon-Fano-Elias-kodning Antag att vi har en minnesfri källa X i som tar värden i {1, 2,...,L}. Antag att sannolikheterna för alla symboler är strikt positiva: p(i) > 0, i. Fördelningsfunktionen
Kihl & Andersson: , 3.1-2, (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 5.3, 8.1, 8.2
Kihl & Andersson: 2.1-2.3, 3.1-2, 3.5-6 (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 5.3, 8.1, 8.2 Hej Hej Vad är klockan? 14.00 Hej då New connection Connection approved Request for data Data transfer End connection
TSBK35 Kompression av ljud och bild
TSBK35 Kompression av ljud och bild Övningshäfte 0 februari 013 Innehåll I Problem 1 1 Informationsteori................................ 1 Källkodning................................... 3 3 Kvantisering...................................
Föreläsning 2. Transmissionslänk. Repetition: Internetprotokollens skikt. Mål
Föreläsning Mål Behandla utbredningsmedium Förstå störningar som kan påverka signalen Förstå hur man digitaliserar information Förse exempel av digitala dataformat Förstå varför källkodning är nyttigt
Talperception. Talperception. Örat. Örat
Talperception Studiet av talperception handlar om lyssnarens förmåga att uppfatta den akustiska signalen som en talare producerar som en sekvens av meningsfulla ord och idéer Talperception Vi ska behandla
Tentamen i Signaler och kommunikation, ETT080
Inst. för informationsteknologi Tentamen i Signaler och kommunikation, ETT080 2 juni 2006, kl 14 19 Skriv namn och årskurs på alla papper. Börja en ny lösning på ett nytt papper. Använd bara en sida av
Ulrik Söderström 20 Jan Signaler & Signalanalys
Ulrik Söderström ulrik.soderstrom@tfe.umu.se 20 Jan 2009 Signaler & Signalanalys Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt
Ljudlära. Ljud är Periodicitet. Introduktion. Ljudlära viktigt ur två aspekter:
Introduktion Ljudlära Ljudlära viktigt ur två aspekter: 1. Ljudets fysikaliska egenskaper 2. Vad vi uppfattar med hörseln Syfte: att lära sig göra relevanta kopplingar mellan faktisk vetenskap och sinnlig
Ulrik Söderström 19 Jan Signalanalys
Ulrik Söderström ulrik.soderstrom@tfe.umu.se 9 Jan 200 Signaler & Signalanalys l Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt
TNMK054 - LJUDTEKNIK 1 FILTER OCH VCF
TNMK054 - LJUDTEKNIK 1 FILTER OCH VCF NÅGRA FREKVENSER Bastrumma Kropp 60-80Hz, snärt 2,5kHz Virveltrumma Kropp 240Hz, krispighet 5kHz HiHat & cymbaler Gongljud 200Hz, briljans 7,5-12kHz Hängpuka Kropp
Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen.
Elektronik - digital signalbehandling Föreläsning: Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2010-10-01 1 2008-10-06 Elektronik - digital
Prislista Rotel 2014-03
Prislista Rotel 2014-03 Hemmabioreceiver RSX 1562 5 x 100W RMS, 7.1 kanal processing, Dolby TrueHD, Dolby Digital Plus and dts-hd Master Audio, dts HD Hi-Resolution 27 000 kr 6 x HDMI (V1.4) ingångar /
3. Metoder för mätning av hörförmåga
3. Metoder för mätning av hörförmåga Sammanfattning Förekomst och grad av hörselnedsättning kan mätas med flera olika metoder. I kliniskt arbete används oftast tonaudiogram. Andra metoder är taluppfattningstest
AD-DA-omvandlare. Mätteknik. Ville Jalkanen. ville.jalkanen@tfe.umu.se 1
AD-DA-omvandlare Mätteknik Ville Jalkanen ville.jalkanen@tfe.umu.se Inledning Analog-digital (AD)-omvandling Digital-analog (DA)-omvandling Varför AD-omvandling? analog, tidskontinuerlig signal Givare/
Försättsblad till skriftlig tentamen vid Linköpings universitet G33(1) TER4(63)
Försättsblad till skriftlig tentamen vid Linköpings universitet Datum för tentamen 2017-01-07 Sal (2) G33(1) TER4(63) Tid 8-12 Kurskod TSBB16 Provkod TEN2 Kursnamn/benämning Provnamn/benämning Institution
Svängningar och frekvenser
Svängningar och frekvenser Vågekvationen för böjvågor Vågekvationen för böjvågor i balkar såväl som plattor härleds med hjälp av elastiska linjens ekvation. Den skiljer sig från de ovanstående genom att
Laplace, Fourier och resten varför alla dessa transformer?
Laplace, Fourier och resten varför alla dessa transformer? 1 Bakgrund till transformer i kontinuerlig tid Idé 1: Representera in- och utsignaler till LTI-system i samma basfunktion Förenklad analys! Idé
Sammanfattning TSBB16
Sammanfattning TSBB16 Frekvensfunktion =H(omega) Kombinationen av amplitud och faskarakteristik är unik. H(ω) = D(ω) e^jψ(ω)=y(t)/x(t). Detta är frekvensfunktionen. H(ω)=utsignal/insignal D(ω) = H(ω).
Elektronik. Dataomvandlare
Elektronik Dataomvandlare Johan Wernehag Institutionen för elektro- och informationsteknik Lunds universitet 2 Översikt Analoga och digitala signaler Nyquistteorem Kvantiseringsfel i analog-till-digital
Laboration Audiometri
Audiometri 1(1) Uppsala universitet Inst. för Neurovetenskap, enheten för Fysiologi VT 07, GS, LP För Neural reglering och rörelse Laboration Audiometri Avsikten med laborationen är 1. Att klargöra hur
Mätningar med avancerade metoder
Svante Granqvist 2008-11-12 13:41 Laboration i DT2420/DT242V Högtalarkonstruktion Mätningar på högtalare med avancerade metoder Med datorerna och signalprocessningens intåg har det utvecklats nya effektivare
Föreläsning 12. Modellbaserad ljudkodning. Modellbaserad bildkodning. Utblickar Mediakommunikation över Internet Multi-view video
Föreläsning 12 Modellbaserad ljudkodning Modellbaserad bildkodning Utblickar Mediakommunikation över Internet Multi-view video 1 Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller
TSKS21 Signaler, Information och Bilder Lab 2: Digitalisering
TSKS21 Signaler, Information och Bilder Lab 2: Digitalisering Mikael Olofsson 8 februari 2017 Fyll i detta med bläckpenna Laborant Personnummer Datum Godkänd 1 1 Allmänt Denna laboration syftar till att
Frekvensplanet och Bode-diagram. Frekvensanalys
Frekvensplanet och Bode-diagram Frekvensanalys Signaler Allt inom elektronik går ut på att manipulera signaler genom signalbehandling (Signal Processing). Analog signalbehandling Kretsteori: Nod-analys,
DT1120/DT1130 Spektrala transformer Tentamen
DT/DT3 Spektrala transformer Tentamen 86 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:
DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1. Frekvensfunktioner FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM. x(n)= Asin(Ωn)
DIGITALA FILTER TILLÄMPAD FYSIK OCH ELEKTRONIK, UMEÅ UNIVERSITET 1 Frekvensfunktioner x(n)= Asin(Ωn) y(n) H(z) TILLÄMPAD FYSIK OCH ELEKTRONIK, UMEÅ UNIVERSITET 2 FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM
Burrows-Wheelers transform
Datakompression fö 7 p.1 Burrows-Wheelers transform Transformen själv ger ingen kompression, men gör det lättare att koda signalen med en enkel kodare. Antag att vi vill koda en sekvens av längd n. Skapa
Fysiska lagret. Kanal. Problem är att kanalen har vissa begränsningar: Kanalen är analog Kanalen är bandbreddsbegränsad och är oftast störd (av brus)
Fysiska lagret Sändare Digital information Kanal Mottagare Problem är att kanalen har vissa begränsningar: Kanalen är analog Kanalen är bandbreddsbegränsad och är oftast störd (av brus) Kanalens kapacitet
DT1130 Spektrala transformer Tentamen
DT Spektrala transformer Tentamen 72 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:
Varför ljud och hörsel?
Ljud & Hörsel Varför ljud och hörsel? Varför ljud och hörsel? Varför ljud och hörsel? Interaktionsdesign ligger flera decennier bakom filmindustrin George Lucas (1977): Ljudet är halva upplevelsen Varför
Hörselorganens fysiologi. Rekommendation. Introduktion. Hertz vs Bark
Hörselorganens fysiologi Mattias Heldner heldner@kth.se Rekommendation Repetera Engstrand kapitel 10 om hörselsystemet. Betydligt mer lättillgänglig än Moore... Introduktion Hertzskalan ingen bra skala
Tentamen i ESS 010 Signaler och System E3 V-sektionen, 16 augusti 2005, kl 8.30 12.30
Tentamen i ESS 00 Signaler och System E3 V-sektionen, 6 augusti 2005, kl 8.30 2.30 Examinator: Mats Viberg Tentamen består av 5 uppgifter som vardera ger maximalt 0 p. För godkänd tentamen fordras ca 20
Digital Signalbehandling i Audio/Video
Digital Signalbehandling i Audio/Video Institutionen för Elektrovetenskap Laboration 1 (del 2) Stefan Dinges Lund 25 2 Kapitel 1 Digitala audioeffekter Den här delen av laborationen handlar om olika digitala
Ljudteknik. Digital representation. Vad är ljud?
Ljudteknik Digital representation Vad är ljud? 1 3 grundstenar för ljud» Alstring» Överföring» Mottagning Örat Hörseln» Lufttrycksvariationer ger mekaniska vibrationer i trumhinnan» Hörselbenet växlar
Elektronik Dataomvandlare
Elektronik Översikt Analoga och digitala signaler Dataomvandlare Pietro Andreani Institutionen för elektro- och informationsteknik Lunds universitet Nyquistteorem Kvantiseringsfel i analog-till-digital
Signalbehandling Röstigenkänning
L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1
VARFÖR LJUD OCH HÖRSEL?
Ljud och hörsel VARFÖR LJUD OCH HÖRSEL? VARFÖR LJUD OCH HÖRSEL? VARFÖR LJUD OCH HÖRSEL? Interaktionsdesign ligger flera decennier bakom filmindustrin George Lucas (1977): Ljudet är halva upplevelsen VARFÖR
( ), så kan du lika gärna skriva H ( ω )! ( ) eftersom boken går igenom laplacetransformen före
Några allmänna kommentarer gällande flera av lösningarna: Genomgående används kausala signaler och kausala system, vilket innebär att det är den enkelsidiga laplacetransformen som används. Bokens författare
Projekt 6. Fourieroptik Av Eva Danielsson och Carl-Martin Sikström
Projekt 6. Fourieroptik Av Eva Danielsson och Carl-Martin Sikström Introduktion I detta experiment ska vi titta på en verklig avbildning av fouriertransformen. Detta ska ske med hjälp av en bild som projiceras
Formelsamling finns sist i tentamensformuläret. Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7,5hp Kurskod: HÖ1004 Tentamenstillfälle 1
Ämnesområde Hörselvetenskap A Kurs Akustik och ljudmiljö, 7,5hp Kurskod: HÖ1004 Tentamenstillfälle 1 Datum 2011-06-01 Tid 4 timmar Kursansvarig Åsa Skagerstrand Tillåtna hjälpmedel Övrig information Resultat:
Signaler några grundbegrepp
Kapitel 2 Signaler några grundbegrepp I detta avsnitt skall vi behandla några grundbegrepp vid analysen av signaler. För att illustrera de problemställningar som kan uppstå skall vi först betrakta ett