Föreläsning 1: Bild- och ljudkodning

Relevanta dokument
Föreläsning 7: Bild- och videokodning

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer. Khalid Sayood, Introduction to Data Compression

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck

En generell prediktiv kodare utnyttjar signalens utseende N steg tillbaka i tiden för kodningen, dvs vi kodar efter den betingade fördelningen

Linjär prediktion. Prediktiv kodning. Linjär prediktion. Prediktiv kodare och avkodare

FLAC (Free Lossless Audio Coding)

SMS047 Mediakodning. Introduktion. Frank Sjöberg. Introduktion. Introduktion

Föreläsning 10: Ljudkodning ( Audio Coding )

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler

Kodning av tal Kodning av musik MPEG-4 Audio toolbox

Föreläsning 12. Modellbaserad ljudkodning. Modellbaserad bildkodning. Utblickar Mediakommunikation över Internet Multi-view video

Skurlängdskodning. aaaabbbbbbbccbbbbaaaa. Man beskriver alltså sekvensen med ett annat alfabet än det ursprungliga.

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Att sända information mellan datorer. Information och binärdata

Digital signalbehandling Digitalt Ljud

Kapitel 2 o 3. Att skicka signaler på en länk. (Maria Kihl)

Datakompression. Harald Nautsch ISY Bildkodning, Linköpings universitet.

Kursinnehåll. Datakompression. Föreläsningar, preliminärt program. Examination

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Kompression av ljud och bild

Ordbokskodning. Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning)

Exempel, minnesfri binär källa. Ordbokskodning. Lempel-Zivkodning. Lempel-Zivkodning, forts.

Profilen Kommunikation för Y, Yi, D & IT

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer

Signal och bildbehandling SBB. Två (nästan identiska) profiler på D/IT resp Y programmen inom området datorer & bilder Profilansvarig: Klas Nordberg

Data och Information. Dr. Johan Hagelbäck.

Signal och bildbehandling SBB

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

Adaptiv aritmetisk kodning

Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden.

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Analys/syntes-kodning

Profilen Kommunikation

Profilansvarig: Lasse Alfredsson se även länk från programmets profilwebbsida:

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:

Signaler och system, IT3

Kodning med distorsion

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen.

Datorkommunikation. Examination Översikt. Kurslitteratur. Datorkommunikation. Kursens hemsida

Digital kommunikation. Maria Kihl

Digital kommunikation. Maria Kihl

2 Vad händer när man ringer? 2 Vad händer när man ringer?

Digitalitet. Kontinuerlig. Direkt proportionerlig mot källan. Ex. sprittermometer. Elektrisk signal som representerar ljud.

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Image Coding. Common Image Formats GIF

Övningar modul 1 - Dataöverföring & fysisk infrastruktur

Föreläsning 17 - Komprimering

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Common Image Formats. Image Coding GIF. GIF (Graphis Interchange Format)

Kihl & Andersson: , 3.1-2, (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 5.3, 8.1, 8.2

Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden-

Profilen Kommunikation för Y, Yi, D & IT. Profilansvarig: Erik G. Larsson Professor, ISY/Kommunikationssystem

Kodning av ansiktstextur med oberoende komponenter

Examination Kurslitteratur

Transformkodning Idé: 1. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block

Kommunikationssystem grundkurs, 2G1501 Övningar modul 1 Dataöverföring & fysisk infrastruktur 1 Dataöverföring

Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning

Redaktion. Innehåll. Combitech Systems AB. Ledare...3. Utveckling mot effektivare bildöverföring...4. Bild- och videokodning...6

Lab 3 Kodningsmetoder

Profilen Kommunikation för Y, Yi, D & IT. Profilansvarig: Erik G. Larsson Professor, ISY/Kommunikationssystem

Distansutbildning. av Anders Andersson. Västanvik Resurs- och Utvecklingscenter

Paper or screen. Systemlagret. Vision technology. Audio technology. Current loudspeakers and sound equipment is good enough?

Ljudteknik. Digital representation. Vad är ljud?

Föreläsning 2. Transmissionslänk. Repetition: Internetprotokollens skikt. Mål

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå (loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Föreläsning i webbdesign. Bilder och färger. Rune Körnefors. Medieteknik Rune Körnefors rune.kornefors@lnu.se

Boxee Box vs Apple TV

TSBK04 Datakompression. Övningsuppgifter

Analoga och Digitala Signaler. Analogt och Digitalt. Analogt. Digitalt. Analogt få komponenter låg effektförbrukning

BILDKODNING TEORI. Källkodning. Analogt - och samplat

TSBK04 Datakompression Övningsuppgifter

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

Det finns två sätt att generera ljus på. Ge exempel på dessa och förklara vad som skiljer dem åt.

Grundläggande ljud- och musikteori

Tentamen i Signaler och kommunikation, ETT080

Källkodning. Egenskaper hos koder. Några exempel

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny

Föreläsning 2. Transmissionslänk. Störningar (1/2) T Introduktion till modern telekommunikation Gunnar Karlsson, Bengt Sahlin 1

Datorkommunikation. Examination Översikt. Kurslitteratur. Datorkommunikation. Kursens hemsida

Industriell ekonomi åk 2 VT15. Inriktningen Systemteknik

Sammanfattning TSBB16

MEDIESIGNALER INTRODUKTION

Kurs PM för KTH-CSC. Kursens upplägg Nivå: C Betyg: A F Språk: Svenska Föreläsningar 48h Seminarier 9h Laborationer 28h

F3 Datarepresentation teckenkodning och datakompression EDAA05 Datorer i system! Roger Henriksson!

F3 Datarepresentation teckenkodning och datakompression

Att fånga den akustiska energin

Europeiska unionens officiella tidning

5:8 CD och DVD. CD spelaren Det krävs ett litet tekniskt underverk för att spela upp en cd skiva. Vi går igenom grundkomponenterna.

A/D D/A omvandling. Lars Wallman. Lunds Universitet / LTH / Institutionen för Mätteknik och Industriell Elektroteknik

Profilen Kommunikation för Y, Yi, D & IT

Filformat och lagring

Föreläsning 1. Information och data

Datateknik GR (A), Flash, Photoshop och Datakunskap, 7,5 hp

Profilansvarig: Lasse Alfredsson se även länk från programmets profilwebbsida:

Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring. Att göra. Att sända information mellan datorer

Data och information. Grunderna i datatransmission och fysiska skiktet. Media: vågledare. Datatransmission. Kodning av diskret information

Grunderna i datatransmission och fysiska skiktet. Bitarna möter verkligheten Sidorna i boken

Kapitel 3 o 4. Tillförlitlig dataöverföring. (Maria Kihl)

Transkript:

Föreläsning 1: Bild- och ljudkodning 1. Kursöversikt 2. Introduktion till bild- och ljudkodning - syfte - historik - antal bitar per bildpunkter/sampel 3. Två principiella klasser : distorsionsfri och distorderande kodning 4. Modeller för bild- och ljudsignaler samt därav inspirerade kodningsmetoder

Kursöversikt - föreläsningar F1: Introduktion till bild- och ljudkodning F2: Informationsteoretiska begrepp F3: Källkodningsteori, Huffmankodning F4: Aritmetisk kodning, Lempel-Ziv-kodning F5: Analoga signaler, Skalär kvantisering F6: Vektorkvantisering F7: Prediktiv kodning F8: Transformkodning F9: Delband/Wavelet-kodning F10: Audiokodning F11: Videokodning F12: Talkodning, Modellbaserad videokodning, Video/audio över nätverk

Kursöversikt - övrigt Kurslitteratur: 12 föreläsningar 8 lektioner 2 datorlektioner 2 laborationer (varav en är schemalagd) 1. K. Sayood, Introduction to Data Compression 2. Diskreta Markovprocesser (kurshemsidan) 3. Övningshäfte, formelsamling (kurshemsidan) 4. Kurshemsida: www.icg.isy.liu.se/courses/tsbk02/ - labbokning, labbanvisningar, extramaterial

Bild- och ljudkodning Syfte: effektiv (digital) representation av bilder, video, tal och musik. Bivillkor: - god kvalitet - tålighet mot kanalfel - realtidsprestanda - kostnadseffektiv

Bild- och ljudkodning Telekommunikation Bildanalys Spektralanalys Perception Bild/ Ljudkodning Psykoakustik Datorgrafik Talsyntes Digital signalbehandling

Tillämpningar Stillbilder Fax Teleradiologi Webb Digitalkameror Bilddatabaser Video Bildtelefoni Videokonferens Multimedia Videokameror Digital-TV DVD, Blu-ray Ljud CD Mobiltelefoner MP3-spelare DAB Film/video-ljud

Telefoni g Ericsson 1905 Smartphone 2014

Television Baird 1930 OLED 2014

Den elektroniska bilden analogt format Bilden avsöks linje för linje och ger upphov till en analog signal. I Bairds mekaniska TV-system användes 30 linjer och videobandbredd ca 10 khz.

Den elektroniska bilden digitalt format Bildpunkt (pixel) En bildpunkt representeras med en eller flera databitar. Representationen kallas Pulskods-modulation (PCM).

Bilder: hur många bildpunkter? Baird 30*50 (ca) TV (PAL) 720*576 HDTV 1920*1080 QFHD 3840*2160 Digitalkamera 2-40Milj.

Hur många bitar per bildpunkt? Bitar/bildpunkt Bildtyper Exempel 1 4 8 12-16 8*3=24 8*4=32 binära enkel datorgrafik gråskalebilder högkontrast Färgbilder (RGB) RGB med alpha fax tidiga spel telefoto röntgen digital foto datorgrafik

Ljud: antal bitar per sampel och per sekund (PCM-kodning) CD-kvalitet 16 bitar per sampel 44100 sampel per sekund Två kanaler =>1.4 Mbit/s Betraktas ofta som referens ( okomprimerat ljud ) Modern kodningsmetoder: 64 kbit/s med god kvalitet Digital telefoni 8 bitar per sampel 8000 sampel per sekund => 64 kbit/s Moderna kodningsmetoder: 4 kbit/s med god kvalitet

Video: antal bitar per sekund (PCM-kodning) TV-kvalitet 3*8 bitar (RGB) per bildpunkt 720*576 bildpunkter per bild (PAL) 25 bilder per sekund => 250Mbit/s HDTV-kvalitet 3*8 bitar (RGB) per bildpunkt 1920*1080 bildpunkter per bild (1080i) 25 bilder per sekund => 1.24Gbit/s

Video: kodningsmetoder Model-based Video coding 3G Mobile videophone Video CD Digital TV, DVD HDTV 8 16 64 384 1.5 5 20 kbit/s Mbit/s Very low bitrate Low bitrate Medium bitrate High bitrate MPEG-4 H.264 H.263 H.261 MPEG-1 MPEG-2

Distorsionsfri ( lossless ) kodning (Datakompression) Representera en digital signal med färre bitar än originalet på så sätt att signalen kan rekonstrueras exakt. Den undre begränsningen ges av entropin för data (baseras på Informationsteori). Exempel: ZIP, compress, GIF, PNG, FLAC

Distorderande ( lossy ) kodning Representera en digital eller analog signal med så få bitar som möjligt så att signalen kan rekonstrueras med godtagbar kvalitet. Exempel: GSM, JPEG, MPEG-2, H.264, MPEG-1 layer 3 (mp3), AAC, WMA,...

Typisk kodarstruktur Analog signal Sampling kvantisering Digital Signal (PCM) Distorderande kodning Distorderad digital signal Distorsionsfri Kodning

Kodning av bild och ljud bygger på modeller S(t) t Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder Signalmodeller determ. modeller statistiska modeller Signalteoretiska kodningsmetoder Syn/hörsel-modeller spatio/temporal modeller maskeringsegenskaper Perceptionsbaserade kodningsmetoder

Statistiska signalmodeller Minnesfria signaler Varje signalvärde är oberoende av övriga signalvärden. t Signaler med minne Signalvärden är beroende av ett eller flera övriga signalvärden. t

Exempel på statistisk modell för signaler med minne Markov-modellen P 22 P 12 s2 P 11 s 1 P21 P 31 P 13 P 23 P 32 s 3 P 33

Autoregressiv modell - en amplitudkontinuerlig Markovmodell x k x k = S a i x k-i + n k n k : minnesfri process Lämpar sig väl för att modellera ljudsignaler

Korrelationsmodell För bilder kan 2-dimensionella korrelationsfunktioner vara användbara: x ij E{ X ij X } kl = ke - a( i - k )2 + b( j -l ) 2 x kl eller E{ X ij X } - a i - k -b j -l kl = ke

Exempel på kodning av minnesfri källa Gråskalebild med nivåer mellan 0-3. Statistisk redundans: de olika nivåerna förekommer olika ofta (se figur). Kodningsmetod: Variabel-längdkodning (VLC) 50 % 0 1 2 3 nivå PCM 0-00 1-01 2-10 3-11 VLC 0-0 3-10 1-110 2-111 2 bitar/bildpunkt 1.75 bitar/bildpunkt i genomsnitt!

Exempel på kodning av minneskälla Bildtyp: fax. Statistisk redundans: närliggande bildpunkter har ofta samma värde. Kodningsmetod: koda skurlängderna. Skurkod: 15,15,15,4,5,6,4,6,5,3, Antag 4 bitar/skur: 45*4 = 180 bitar jfr. okodat: 15*15 = 225 bitar

Prediktiv kodning (DPCM) (för AR-processer) t Prediktion (linjär/rörelsekompenserad) VLC Princip: gissa (prediktera) hur bilden ser ut, beräkna skillnaden (felbilden), variabel-längdkoda felbilden.

Transformkodning (för 2D-korrelerade källor) x ij x kl

Modellbaserade kodningsmetoder - används vid kodning av talsignaler - och för kodning av ansiktsbilder

Perceptionsbaserade kodningsmetoder (är mer användbara för ljudkodning än för bildkodning) db 40 30 20 10 0 Dämpningskurva 2 4 6 8 10 12 khz

Fraktalkodning Grundidé: sök självliknande delar i bilden... sådan symmetri ger enkel matematisk beskrivning...

Fraktalkodning, forts. Varje bild kan göras självlik...