Föreläsning 7: Bild- och videokodning



Relevanta dokument
Föreläsning 1: Bild- och ljudkodning

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck

Föreläsning 10: Ljudkodning ( Audio Coding )

SMS047 Mediakodning. Introduktion. Frank Sjöberg. Introduktion. Introduktion

Skurlängdskodning. aaaabbbbbbbccbbbbaaaa. Man beskriver alltså sekvensen med ett annat alfabet än det ursprungliga.

En generell prediktiv kodare utnyttjar signalens utseende N steg tillbaka i tiden för kodningen, dvs vi kodar efter den betingade fördelningen

Linjär prediktion. Prediktiv kodning. Linjär prediktion. Prediktiv kodare och avkodare

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden.

Redaktion. Innehåll. Combitech Systems AB. Ledare...3. Utveckling mot effektivare bildöverföring...4. Bild- och videokodning...6

Transformkodning Idé: 1. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Image Coding. Common Image Formats GIF

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Common Image Formats. Image Coding GIF. GIF (Graphis Interchange Format)

Kapitel 2 o 3. Att skicka signaler på en länk. (Maria Kihl)

BILDKODNING TEORI. Källkodning. Analogt - och samplat

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Att sända information mellan datorer. Information och binärdata

Ordbokskodning. Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning)

Exempel, minnesfri binär källa. Ordbokskodning. Lempel-Zivkodning. Lempel-Zivkodning, forts.

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå (loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Föreläsning 2. Transmissionslänk. Repetition: Internetprotokollens skikt. Mål

Kompression av ljud och bild

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Bildlagring och - komprimering

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer. Khalid Sayood, Introduction to Data Compression

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

Analys/syntes-kodning

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Lab 3 Kodningsmetoder

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:

Digital signalbehandling Digitalt Ljud

FLAC (Free Lossless Audio Coding)

Frekvensplanet och Bode-diagram. Frekvensanalys

Signal och bildbehandling SBB

Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning

Signal och bildbehandling SBB. Två (nästan identiska) profiler på D/IT resp Y programmen inom området datorer & bilder Profilansvarig: Klas Nordberg

Spektrala Transformer

Föreläsning i webbdesign. Bilder och färger. Rune Körnefors. Medieteknik Rune Körnefors rune.kornefors@lnu.se

Spektrala Transformer

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg

Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts.

Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or.

-med fokus på robusthet

Föreläsning 17 - Komprimering

Spektrala Transformer för Media

Grundläggande ljud- och musikteori

Spektrala Transformer för Media

QosmioEngine För avancerad video

Sammanfattning TSBB16

Distansutbildning. av Anders Andersson. Västanvik Resurs- och Utvecklingscenter

Föreläsning 12. Modellbaserad ljudkodning. Modellbaserad bildkodning. Utblickar Mediakommunikation över Internet Multi-view video

Projekt 3: Diskret fouriertransform

Spektrala transformer Laboration: JPEG-kodning

INT 3 F3. En texts läsbarhet. Teckensnitt. Medieteknik Del1. Färger, teckensnitt och bildformat

Föreläsning 2. Transmissionslänk. Störningar (1/2) T Introduktion till modern telekommunikation Gunnar Karlsson, Bengt Sahlin 1

Hemtenta 2 i Telekommunikation

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg

MPEG-4-kompatibel settop-box för IP-nät baserad på öppna standarder

Spektrala transformer Laboration: JPEG-kodning

Lab 4: Digital transmission Redigerad av Niclas Wadströmer. Mål. Uppstart. Genomförande. TSEI67 Telekommunikation

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

Kodning av ansiktstextur med oberoende komponenter

A/D D/A omvandling. Lars Wallman. Lunds Universitet / LTH / Institutionen för Mätteknik och Industriell Elektroteknik

Övningar modul 1 - Dataöverföring & fysisk infrastruktur

Aritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12

TSBK35 Kompression av ljud och bild

DT1130 Spektrala transformer Tentamen

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny

OH Slides F: Wide Area Networks

Shannon-Fano-Elias-kodning

Paper or screen. Systemlagret. Vision technology. Audio technology. Current loudspeakers and sound equipment is good enough?

Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden-

Elektriska kretsar och fält - några exempel på tillämpningar

Adaptiv aritmetisk kodning

Kapitel 3 o 4. Tillförlitlig dataöverföring. (Maria Kihl)

Torstens Digitalbildguide

Tillförlitlig dataöverföring Egenskaper hos en länk Accessmetoder. Jens A Andersson

QosmioEngine: För avancerad video

Kommunikationssystem grundkurs, 2G1501 Övningar modul 1 Dataöverföring & fysisk infrastruktur 1 Dataöverföring

Signal- och bildbehandling TSEA70

Burrows-Wheelers transform

Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring. Att göra. Att sända information mellan datorer

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler

Kodning av tal Kodning av musik MPEG-4 Audio toolbox

Laboration i Fourieroptik

DIGITAL KOMMUNIKATION

Spektrala Transformer

Digital kommunikation. Maria Kihl

Analoga och Digitala Signaler. Analogt och Digitalt. Analogt. Digitalt. Analogt få komponenter låg effektförbrukning

Kihl & Andersson: , 3.1-2, (ej CDM) Stallings: 3.1-4, 5.1, 5.2, 5.3, 8.1, 8.2

2 Vad händer när man ringer? 2 Vad händer när man ringer?

Lösningar ETS052 Datorkommunikation,

TENTAMEN. Kurs: Kursnummer: Audio&Videoteknik, 2D2021. Program: Åk: HME02 Åk 2. Datum: Tid: :00. Omfattning och betygsgränser:

Digital video. Tillgänglig/nödvändig bandbredd för olika typer av mediedistribution

Fysiska lagret. Kanal. Problem är att kanalen har vissa begränsningar: Kanalen är analog Kanalen är bandbreddsbegränsad och är oftast störd (av brus)

Digital kommunikation. Maria Kihl

Pixelgrafik. Utdrag ur Adobe Photoshops handbok. Om bitmappsbilder (pixelbilder) Om vektorgrafik (kallas ibland objektgrafik)

Institutionen för systemteknik Department of Electrical Engineering

Transkript:

Föreläsning 7: Bild- och videokodning Inledning - varför bildkodning - tillämpningar - grundprinciper Förlustfri kodning - Variabellängdskodning - Skurländskodning - Huffmankodning Irreversibla kodningsmetoder - prediktiv kodning - Transformkodning - JPEG - Waveletkodning - JPEG2000 Videokodning - 3D prediktiv kodning - Hybrid transform/prediktiv kodning - Rörelseestimering Videokodningsstandarder - MPEG, H.263 MPEG-4 - Video - Syntetiska bilder - Ansiktskodning Modellbaserad kodning - Analys av ansiktsrörelser - Bildsyntes Video-överföring i forntid Alexander Baird 1930 Antal linjer: 30 Bandbredd: ca 3 khz 1

Varför bildkodning? Rå digitaliserad TV: 270 Mbit per sekund ADSL: 2 Mbit per sekund TV via ADSL: 135 abonnemang behövs... Komprimering är ofrånkomlig! Exampel på produkter som använder avancerad bildkodningsteknik 2

Tillämpningar Stillbilder Fax (2.4-14.4 kbit/s) Web (56-512 kbit/s) Teleradiologi (64-384 kbit/s) Digitalkamera (0.1-1 MB/bild) Bilddatabaser(> 1 GB) Video Bildtelefoni (8-128 kbit/s) Videokonferens (64-384 kbit/s) Multimedia (0.3-2 Mbit/s) Digital-TV (2-6 Mbit/s) DVD (6-19 GB) Bildkodning som teknik/vetenskaps-område Telekommunikation Bildbehandling Bildkodning Datorgrafik Digital signalbehandling 3

Bildkodning baseras på... Statistisk redundans ---------------------- reversibel kodning Maskeringseffekter i synsystemet ------ irreversibel kodning (osynlig distorsion) Selektering av bildinformation ---------- irreversibel kodning (synlig distorsion) Reversibel (förlustfri) kodning 1. utnyttja statistisk redundans: - olika symbolsannolikheter (p i ) eller - symbolberoenden, 2. använd variabla kodordslängder eller variabelt antal symbols per kodord (VLC), 3. adaptera till föränderlig statistik, 4

Reversibel kodning - exempel 1 Bildtyp: fax. Statistisk redundans: närliggande bildpunkter har ofta samma värde. Kodningsmetod: Skurlängdskodning. Skurkod: 15,15,15,4,5,6,4,6,5,3, Antag 4 bitar/skur: 45*4 = 180 bitar jfr. okodat: 15*15 = 225 bitar Reversibel kodning - exempel 2 Gråskalebild med nivåer mellan 0-3. Statistisk redundans: de olika nivåerna förekommer olika ofta (se figur). Kodningsmetod: Huffmankodning (olika kodordsländger) % 50 0 1 2 3 Histogram nivå PCM 0-00 1-01 2-10 3-11 Huffman 0-0 3-10 1-110 2-111 2 bitar/bildpunkt 1.75 bitar/bildpunkt i genomsnitt! 5

Andra VLC metoder Aritmetisk kodning En metod som möjliggör enkel anpassning till ny källstatistik. Universell kodning Ett gemensamt namn på metoder som automatiskt anpassar sig till källstatistiken. Ett exempel är Lempel-Ziv koding. Gränser för reversibla metoder Praktisk kompressionsgräns för gråskalebilder: ca 2 ggr (för fax-bilder 5-10 ggr). Teoretisk gräns ges av Shannons entropimått: H = p i log(1/ p i ) Där p i är sannolikheten för pixel (eller block-)värde i. 6

Irreversibla kodningsmetoder Prediktiv kodning Transformkodning Waveletkodning Grundprincip: förlustfri transformation Kvantisering (A/D omvandling) VLC kodning En bild och dess histogram 256*256*8 bitar Direkt VLC-kodning ger ca 7 bitar per bildpunkt 7

Differentiell kodning (prediktiv kodning) princip: Källsymbolerna predikteras från föregående symboler source symbols VL-coder to channel predictor Prediktorn använder "all" tidigare kunskap för att skapa en differenssignal med så låg amplitud som möjligt. Differensbild efter en-stegs prediktion VLC ger 2,6 bitar per bildpunkt 8

Prediktiv kodning - egenskaper + enkel metod + reversibel/irreversibel försämrad kantskärpa måttlig kompression Transformkodning Transformkodning bygger på att vissa (spatiala) frekvenskomponenter förekommer oftare än andra. Metoden utvecklades under 1970-talet. Den ligger till grund för den s.k. JPEG-standarden. (JPEG = Joint Photographic Experts Group) 9

Exempel - fullbilds Fourier transform 2D DFT Reduction 2D IDFT Praktisk transformkodning (JPEG) 1. Bilden delas upp i små block, ex.vis 8*8 bildpunkter. 2. Varje block approximeras som en viktad summa av lämpligt valda basblock. 3. Vikterna överförs till mottagaren. + + + + a 1 a 2 a 3 a 4 a 5 För perfekt rekonstruktion åtgår lika många vikter som det finns bildpunkter i blocket, ex.vis 64 st. 10

DCT-transformens basblock 1D - DCT basfunktioner [C] i,j = c cos ( 2j + 1) i π N 2N (c = 1 om i= 0 annars c = 2) 2D transformer fås genom yttre produkter av 1D transformer 11

Transformkodning, forts. Om man samlar ihop samtliga vikter som hör till ett block erhålles dess transform : DC-komponenten 8 8 8 bildblock Transform 8 Exampel - transformen av ett bild block 12

Adressering av transformkomponenterna görs i ett zig-zag mönster: Skurlängderna och amplituderna Huffmankodas. Exempel: JPEG 256 KB 16 KB 13

Transformkodning - egenskaper + hög kompression + reglerbar kvalitet synliga blockgränser Waveletkodning (delbandskodning, subband coding ) en vidareutveckling av transformkodning Fördelar: lägre komplexitet inga blockeffekter progressiv uppdatering 14

Waveletkodning forts. Princip: bilden delas iterativt upp i (vertikala/horisontella) högpass och lågpassband med hjälp av filter: Vid kodningen läggs färre bitar på lågenergikomponenter Waveletkodning - egenskaper + hög kompressionsgrad + naturlig distorsion (suddighet) + Ingår i den nya JPEG-standard (JPEG2000) 15

JPEG2000 vs JPEG högre dynamik (16-32 bitar/bildpunkt) bättre kodningsprestanda (25-30% lägre datatakt) progressiv transmission reversibel kodning inom Region-of-interest accepterad standard (2001). Jämförelse vid 64 ggr kompression JPEG JPEG2000 16

Videokodning (kodning av bildsekvenser) Temporal-prediktiv kodning Hybrid transform - prediktiv kodning Modellbaserad kodning Temporal-prediktiv kodning t Prediktion (linjär/rörelsekompenserad) VLC Princip: gissa (prediktera) hur bilden ser ut, beräkna skillnaden (felbilden), variabellängd-koda felbilden. 17

Hybrid transform - prediktiv kodning bildsekvens Predikterad bild Rekonstruerad föregående bild T: DCT transform Q: quantizer VLC: variable length coder Rörelsekompenserande prediktion (H.263, MPEG) ME: Motion estimator P: temporal predictor 18

19

20

21

22

Exempel H.263, 13 kbit/s H.263, 20 kbit/s 23

24

25

26

27

Demo: Peter & Clinton 28