Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden.

Storlek: px
Starta visningen från sidan:

Download "Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden."

Transkript

1 Videokodning Begrepp och beteckningar Videosignalen består av en sekvens av bilder, typiskt 24, 25 eller 30 bilder i sekunden. Bilderna skickas antingen progressivt (hela bilden på en gång) eller med interlace (en halv bild i taget med dubbla bildfrekvensen, först alla jämna linjer, sen alla udda linjer). På engelska kallas en helbild för frame och en halvbild för field.

2 Färgformat Färginformationen lagras med en luminans- och två krominanssignaler (YCbCr) Krominanssignalerna samplas oftast grövre än luminanssignalen. 4:4:4 Ingen nersampling av krominanssignalerna. 4:2:2 Krominanssignalerna nersamplade en faktor 2 i horisontal ledd. 4:1:1 Krominanssignalerna nersamplade en faktor 4 i horisontal ledd. 4:2:0 Krominanssignalerna nersamplade en faktor 2 både i horisontal och vertikal ledd.

3 Nersampling 4:4:4 4:1:1 Y Cb Cr Y Cb Cr 4:2:2 4:2:0 Y Cb Cr Y Cb Cr 4:2:0 är det vanligaste formatet.

4 Motion JPEG (2000) Koda varje bild i sekvensen med JPEG eller JPEG Utnyttjar inte beroendet mellan närliggande bilder. En tillämpning för Motion JPEG 2000 är digitalbio, där man lagrar bilderna med hög upplösning (upp till ) och använder ganska måttlig kompression.

5 DCI - Digital Cinema Initiatives Tre levels på upplösning 1. Max upplösning , 24 bilder i sekunden. 2. Max upplösning , 48 bilder i sekunden. 3. Max upplösning , 24 bilder i sekunden. Pixlarna är kvadratiska. 12 bitars upplösning per färgkomponent. Ingen nersampling av krominanssignalerna. Level 1 har alltså en rådatatakt på ca 7.6 Gbit/s. Bilddatat kodas med Motion JPEG Maximal datatakt är 250 Mbit/s efter kompression.

6 Hybridkodning Närliggande bilder i en sekvens är oftast väldigt lika varandra, alltså är det en bra idé försöka utnyttja detta vid kodningen. De flesta videokodningsmetoder använder sig av hybridkodning, där man gör prediktiv kodning i tidsled och transformkodning i bildplanet. För att kompensera för kamerarörelser, zoomningar och objekt i bilden som rör på sig, använder man rörelsekompensering. Detta görs oftast blockvis.

7 Rörelsekompensering Bild X t 1 Bild X t Sökområde b i Vi ska koda bilden X t med hjälp av prediktion från föregående bild X t 1. För varje block b i i bilden X t letar vi efter ett block b i i föregående bild X t 1 som är så likt b i som möjligt. Sökningen görs i ett begränsat område runt b i :s position. Resultatet är en rörelsevektor som måste skickas till mottagaren. Skillnadsblocket b i b i kodas med en transformkodare och skickas till mottagaren.

8 Hybridkodare med rörelsekompensering - T Q VLC rek. T 1 + ME: rörelseestimering P: rörelsekompenserad prediktion T: blockbaserad transform Q: kvantisering VLC: variabellängdskodning P ME VLC

9 Rörelsekompensering Mottagaren kan med hjälp av föregående avkodade bild ˆX t 1, de mottagna rörelsevektorerna och de avkodade skillnadsblocken skapa en ny avkodad bild ˆX t. För att undvika felfortplantning bör kodaren göra rörelsekompenseringen från en avkodad version ˆX t 1 av föregående bild, istället för från X t 1. Med jämna mellanrum bör man överföra en bild som kodas oberoende av andra bilder.

10 Val av blockstorlek Hur ska man välja blockstorlek för rörelsekompenseringen? Ju mindre block man använder, desto bättre blir prediktionen. Tyvärr måste man ju skicka över sidoinformation i form av rörelsevektorer till mottagaren, så ju mindre block man väljer desto mer sidoinformation måste skickas. De flesta kodningsstandarder gör rörelseestimering på block av storlek bildpunkter.

11 Rörelseestimering Rörelseestimeringen är ofta en stor flaskhals i en hybridkodare, eftersom man måste göra stora sökningar för att hitta de bästa rörelsevektorerna. För att få realtidsprestanda kan man behöva använda specialhårdvara för rörelseestimering. Man kan även använda snabbare sökmetoder, t.ex. logaritmisk sökning, för att snabba upp rörelseestimeringen. Det är då inte säkert att man hittar den bästa rörelsevektorn, eftersom man inte prövar alla möjligheter, men oftast blir det tillräckligt bra.

12 Exempel Två på varandra följande bilder ur en videosekvens. Kameran panorerar åt höger, vilket gör att stillastående delar i bilden verkar röra sig åt vänster. Spelaren med bollen rör sig åt höger i bilden.

13 Ett av blocken Block som ska predikteras: Sökområde i tidigare bild centrerat kring samma position (±20 bildpunkter) och position för den bästa matchningen. Rörelsevektorn är skillnaden i position mellan centrum och bästa match: (-7,1).

14 Exempel, rörelsevektorer

15 Exempel Rörelsekompenserad prediktion av bild 2, respektive bild 2 i original.

16 Exempel Prediktionsfel utan respektive med rörelsekompensering. Rörelsekompenseringen ger en felbild som är lättare att koda, dvs lägre datatakt vid samma distorsion, alternativt lägre distorsion vid samma datatakt.

17 Standarder De två stora organisationerna som tar fram videkodningsstandarder är ITU (International Telecommunication Union) och MPEG (Moving Picture Experts Group). MPEG är ett samarbete mellan ISO (International Organization for Standardization) och IEC (International Electrotechnical Commission). ITU och MPEG har samarbetat om vissa standarder. 1990: H : MPEG : MPEG-2/H : H : MPEG : MPEG-4 AVC/H : HEVC/MPEG-H/H.265 Förutom de öppna standarderna finns det flera proprietära format, t.ex. RealVideo och Windows Media.

18 Bildtyper I Intra. Bilden kodas oberoende av närliggande bilder. P Predicted. Bilden kodas med rörelsekompensering från föregående I- eller P-bild. B Bidirectional. Bilden kodas med rörelsekompensering från tidigare och/eller senare I- eller P-bilder i sekvensen. Man kan oftast även välja kodningsmetod för varje makroblock. I en I-bild måste alla makroblock kodas som I-block, i en P-bild kan makroblocken kodas som I- eller P-block och i en B-bild kan makroblocken kodas som I-, P- eller B-block.

19 H.261 Lågtaktskodare avsedd framför allt för videokonferenser och videotelefoni. Typisk datatakt kbit/s (ISDN). Standarden klarar datatakter upp till 2 Mbit/s. Baserad på rörelsekompensering på makroblock om bildpunkter och DCT på block om 8 8 bildpunkter. Bildstorlek (CIF), eller (QCIF). Färgformat 4:2:0. Varje makroblock innehåller då 4 luminansblock och 2 krominansblock. Låg framerate, typiskt bilder/s Bara I- och P-bilder (kallas INTRA mode resp INTER mode i H.261).

20 H.261, forts. Rörelsevektorerna kan vara maximalt ±15. Skillnaden till föregående rörelsevektor variabellängdkodas,med korta kodord för små skillnader. 32 olika kvantiserare att välja på för varje makroblock, likformiga med olika steglängd. Möjlighet finns också att välja kvantiserare för en hel grupp om 11 3 makroblock, för att spara bitar. För varje makroblock skickar man också information om vilka av de 6 blocken som innehåller nollskilda komponenter överhuvudtaget. De kvantiserade blocken zigzag-scannas och skurlängdskodas. De vanligast förekommande paren (skurlängd, nollskild komponent) kodas med en tabellerad variabellängdskod, övriga par kodas med en 20-bitars fixlängdskod. Ger acceptabel bildkvalitet vid 128 kbit/s vid små rörelser.

21 H.263 Utvecklad variant av H.261, med samma användningsområden. Möjlighet till längre rörelsevektorer Fler bildformat möjliga, t.ex. 4CIF ( ). Aritmetisk kodning kan användas Rörelsekompensering med halvpixelprecision (interpolering) PB-bilder (enklare variant av B-bilder) Jämfört med H.261 får man ungefär samma kvalitet vid halva datatakten.

22 MPEG-1 Likt H.261 använder MPEG-1 rörelsekompensering på makroblock om bildpunkter och DCT på block om 8 8 bildpunkter. Önskvärt med random access, dvs att man kan hoppa in någonstans mitt i sekvensen och ändå kunna avkoda, därför ser man till att det finns I-bilder med jämna mellanrum. I MPEG-1 introducerades B-bilder, där man kan prediktera både från föregående och följande I- eller P-bilder. Prediktion får inte göras från andra B-bilder. B-bilder gör att man kanske måste skicka bilderna i en annan ordning än de visas, eftersom mottagaren måste ha tillgång till efterföljande bilder för att kunna avkoda. B-bilderna ger möjlighet till hög kompression.

23 Omordning Antag att man kodar var 12:e bild som en I-bild och har två B-bilder mellan varje par av I/P-bilder, så att sekvensen av kodade bilder ser ut som I 0 B 1 B 2 P 3 B 4 B 5 P 6 B 7 B 8 P 9 B 10 B 11 I 12 B 13 B 14 P P 3 predikteras från I 0, P 6 predikteras från P 3 et c. B 1 och B 2 predikteras från I 0 och P 3, B 4 och B 5 predikteras från P 3 och P 6 et c. Kodaren måste då koda och skicka bilderna i ordningen I 0 P 3 B 1 B 2 P 6 B 4 B 5 P 9 B 7 B 8 I 12 B 10 B 11 P 15 B 13 B för att avkodaren ska kunna avkoda korrekt.

24 MPEG-1, forts. Rörelsekompenseringen tillåter godtyckligt stora rörelsevektorer, och halvpixelprecision. Kvantiseringen liknar den som görs i JPEG, med kvantiseringsmatriser. Standardmatrisen för I-block ser ut som

25 MPEG-1, forts. Standardkvantiseringsmatris för P- och B-block:

26 MPEG-1, forts. Kvantiseringsmatriserna skalas sedan med en faktor som kan ändra värde från makroblock till makroblock, vilket används för att styra datatakten. Luminans- och krominansblock har separata kvantiseringsmatriser. Det är möjligt att skicka med egna kvantiseringsmatriser i bitströmmen. De kvantiserade koefficenterna zigzagscannas och nollor skurlängdskodas. Paren (skurlängd, nollskild komponent) kodas med fixa variabellängdskoder. MPEG-1 används till exempel i VideoCD. Upplösning (25 frames/s) eller (30 frames/s). Videodatatakt Mbit/s.

27 MPEG-2 (H.262) Nästan identisk med MPEG-1. En MPEG-2-avkodare ska även klara av att avkoda MPEG-1-strömmar. Tillåter större upplösningar och högre datatakter än vad MPEG-1 gör. Tillåter att man kodar fields separat (MPEG-1 kodar bara en hel frame i taget) Typiska format för MPEG-2 kodad video är , 25 bilder/s eller , 30 bilder/s (DVD, digitaltv) , (HDTV, Blu-ray)

28 Profiles/levels I MPEG-sammanhang talar man om profiler (profiles) och nivåer (levels). En profile definerar en delmängd av de möjliga algoritmerna som får användas. En level sätter begränsningar på parametrarna i bitströmmen (t.ex. upplösning, längd på rörelsevektorer, datatakt). I MPEG-2 finns det 5 profiler (Simple, Main, SNR Scalable, Spatially Scalabe, High) och 4 levels (Low, Main, High 1440, High).

29 Profiles/levels Några exempel: Main profile, low level: Max upplösning , 30 bilder/s. Maximal datatakt 3 Mbit/s. Färgformat 4:2:0. Main profile, main level: Max upplösning , 30 bilder/s. Maximal datatakt 10 Mbit/s. Färgformat 4:2:0. High profile, high level: Max upplösning , 60 bilder/s. Maximal datatakt 100 Mbit/s. Färgformat 4:2:2.

30 MPEG-4 Multimediakodning. Man beskriver en scen som kan innehålla ett flertal bild- och ljudkällor. Varje källa kodas med en lämplig kodningsmetod. I avkodaren sätts alla källorna samman till en scen. Videokodaren är i grunden en DCT-kodare med rörelseestimering, av liknande typ som i övriga MPEG-standarder och H.263. Dock kan videon ha godtycklig form, inte bara rektangulär. Man måste alltså skicka över forminformation till avkodaren också.

31 MPEG-4, forts. Stillbilder Stillbilder kodas i MPEG-4 med en delbandskodare (waveletkodare) som använder nollträd (zero-trees). Sprites En sprite i MPEG-4 är en stillbild som finns som bakgrund i en hel videosekvens, ofta mycket större än själva videon så att man kan låta kameran panorera över den. Genom att använda sprites kan man skicka över bakgrunden en gång för alla, så att man slipper skicka den i varje frame. Syntetiska objekt Mänskliga ansikten kan beskrivas med en tredimensionell trådmodell, med tillhörande textur. Trådmodellen kan sedan animeras, med väldigt låg datatakt (man skickar bara över information om hur trådmodellen rör sig). Texturen behöver bara skickas över en gång.

32 MPEG-4, ljudkodning Ett flertal olika ljudkodningsmetoder stöds. Generell vågformskodning av ljud (AAC). Talkodning. Text-to-speech. Stöd för att syntetisera tal från text finns. Kan synkroniseras med animeringen av ansiktsmodeller. Musikbeskrivningsspråk. Beskriv instrument och vilka toner de spelar (jämför med MIDI).

33 Exempel: Scen i MPEG-4

34 H.264/MPEG-4 AVC Den senaste videokodningsstandarden är H.264 (även kallad MPEG-4 Advanced Video Coding och MPEG-4 part 10) och togs fram i samarbete mellan ITU-T och MPEG. H.264 är en av de kodningsmetoder som används på Blu-rayskivor (även MPEG-2 och VC-1 stöds) och för sändning av HDTV-material enligt DVB-standarderna (även MPEG-2 stöds). Den första varianten av H.264 kom Flera utvidgningar har tillkommit senare (t.ex. 3D/multiview coding).

35 H.264 I likhet med tidigare MPEG-standarder är H.264 en hybridkodare, där man gör rörelsekompenserad prediktion från tidigare (och senare) bilder och där prediktionsfelet kodas med en transformkodare. Kodaren använder en makroblockstorlek på bildpunkter. Makroblocken kan kodas som I-, P- eller B-block (dvs utan prediktion, med prediktion från en tidigare bild eller med prediktion från både tidigare och senare bilder). Man behöver inte koda hela bilden på samma sätt. Varje bild kan delas i flera delar (s.k. slices) och man väljer för varje slice om den är av typ I, P eller B. Även på makroblocknivå kan man ha olika sorters makroblock i en slice. För en I-slice måste alla makroblock vara av typ I, för en P-slice kan makroblocken vara av typ I eller P och för en B-slice kan makroblocken vara av typ I, P eller B.

36 H.264 Rörelsekompenseringen kan förutom att göras på makroblock (16 16 bildpunkter) även göras på mindre block (16 8, 8 16, 8 8, 4 8, 8 4 och 4 4). Kodaren har alltså möjligheten att dela upp makroblocket i mindre delar om den inte lyckas göra en bra rörelsekompensering för hela makroblocket. Till skillnad från andra MPEG-standarder som använder en DCT på block av storlek 8 8, så använder H.264 en heltalstransform av storlek 4 4 enligt Heltalstransformen är inte normerad, men detta kan man kompensera för i kvantiseringen.

37 H.264 Varje makroblock om bildpunkter delas alltså upp i 16 stycken transformblock för luminansen och 4 stycken transformblock för vardera krominansdel (förutsatt att man använder 4:2:0-format). DC-nivåerna för transformblocken kan sedan transformeras ytterligare ett steg med en DWHT (4 4 för luminansen, 2 2 för krominanserna). Transformkomponenterna kvantiseras likformigt och källkodas. Det finns flera olika källkodningsmetoder att välja mellan.

38 H.264 I utökningarna av H.264 har man infört stöd för större transformblock (8 8, 8 4 och 4 8). 8-punkterstransformen ser ut som Som synes är inte heller denna transform normerad, men detta kompenseras för i kvantiseringen.

39 H.264 H.264 tillåter att man gör prediktion även från B-bilder, vilket t.ex. inte är tilllåtet i MPEG-2. För att undvika problem med kausalitet måste kodaren se till att två B-bilder inte predikteras från varandra. Antalet referensbilder för rörelsekompenseringen kan vara ända upp till 16 (till skillnad från andra MPEG-standarder där man max kan ha två referensbilder, en tidigare I/P-bild och en senare). Detta ger en större möjlighet för kodaren att hitta en bra prediktion för varje block. I H.264 finns det också stöd för att använda viktad prediktion, dvs att man använder prediktionskoefficienter och inte bara tar skillnader mellan pixelvärden.

40 H.264 Även för I-block görs en prediktion. Denna prediktion använder bildpunkter i omgivande, redan kodade block. Prediktionen görs som en linjär interpolation från de omgivande bildpunkterna. Antingen kan man göra en enda prediktion för hela makroblocket, vilket går att göra på 4 olika sätt, eller så delas luminansmakroblocket i 16 stycken små block om 4 4 bildpunkter. Prediktionen för vart och ett av de små blocken kan göras på 9 olika sätt. För krominansblocken kan man bara göra den enkla prediktionen på hela blocket (4 olika sätt, samma prediktion på både Cb och Cr).

41 H.264 Det finns två olika källkodningsmetoder att använda i H.264. VLC Kvantiserade och skurlängdskodade transformkomponenter kodas med tabellerade koder (CAVLC). Övriga data (rörelsevektorer, headerdata, et c.) kodas med Exp-Golomb-koder. CABAC Context Adaptive Binary Arithmetic Coding. Aritmetisk kodning. All data kodas med betingning (kontexter) och alla sannolikhetsmodeller uppdateras kontinuerligt.

42 Profiles och levels H.264 har ett antal profiles och levels. Som för alla MPEG-standarder bestämmer profile vilka typer av algoritmer som får användas och level sätter gränser på numeriska parametrar (t.ex. upplösning, framerate och datatakt). Några exempel på profiler: BP Basic Profile. Bara I- och P-slices, inga B-slices. Bara 4 4-transformer. Bara VLC som källkodningsmetod. Bara progressiv kodning (frames). MP Main Profile. Tillåter även B-slices, interlace (fields) och CABAC. HiP High Profile. Tillåter även 8 8-transformer. (Det ingår även andra mindre skillnader mellan, profilerna, men de listade skillnaderna är de viktigaste). High Profile är det som används i DVB och på Blu-rayskivor.

43 Komplexitet Eftersom det finns så många olika sätt att koda varje makroblock blir en H.264-kodare typiskt mycket långsammare än kodare för enklare MPEG-standarder. Till exempel kan ett I-block predikteras på 592 olika sätt ( olika sätt att prediktera luminansen, 4 olika sätt att prediktera krominanserna, ( ) 4 = 592). På samma sätt kan man för varje P- eller B-makroblock välja mellan många olika blockstorlekar för rörelseestimeringen och mellan flera olika referensbilder att göra prediktion från. För att få en snabb kodning kan man inte göra uttömmande sökning, utan man får använda algoritmer som snabbt sorterar bort de prediktionsmoder som förmodligen inte kommer att ge bra resultat. Förmodligen tappar man lite i kodningsprestanda, men får en snabbare kodare.

44 Deblocking Framför allt när man kodar med låga datatakter får man många blockartefakter från transformkodningen. Dessa artefakter gör, förutom att ge störande visuella fel, att rörelsekompenseringen inte fungerar så bra. För att råda bot på detta gör man i H.264 lågpassfiltrering på blockgränserna. Resultat med och utan filtrering nedan.

45 Multiview, 3D Det har den senaste tiden blivit populärt att ha flera kameror som filmar samma scen från olika vinklar (eller, om det är fråga om datorgenererat material, renderar videon från flera olika vinklar). Detta kan t.ex. används för 3D-bio, eller för multiviewvideo, där tittaren kan välja betraktningsvinkel. På samma sätt som bilder efter varandra i en videosekvens är väldigt lika varandra, kommer bilder från kameror nära varandra att vara väldigt lika varandra. En kodningsmetod för 3D/multiview kan alltså göra prediktiv kodning mellan olika kameror och inte bara i tidsled. Den senaste versionen av H.264 har stöd för 3D och multiview.

46 3D/multiview coding Prediktion både i tidsled och mellan kameror.

47 High Efficiency Video Coding HEVC är den senaste videokodningsstandarden under utveckling i samarbete mellan ISO/IEC och ITU-T. Fokus i arbetet med HEVC har legat på att ta fram en kodare för högupplöst video. Det börjar redan finnas displayer med upplösningen 4K UHD ( ) och 8K UHD ( ). Ett annat mål är att se till att avkodaren kan utnyttja parallellarkitekturer. Arbetet med HEVC började i januari 2010 och den första versionen av standarden antogs i januari 2013.

48 HEVC blockschema

49 Blockstruktur Basenheten för kodning kallas Coding Tree Unit (CTU), bestående av ett kvadratiskt block av pixlar av storlek 64 64, eller Detta motsvarar makroblocken som används i tidigare standarder. Färgformatet är 4:2:0. En CTU delas upp i ett antal Coding Units (CU) i en quadtree-struktur. Den minsta tillåtna storleken på en CU är 8 8.

50 Prediktion Beslutet att använda intra- (I) eller interprediktion (P eller B) görs på CU-nivå. Varje CU delas upp i ett antal Prediction Units (PU). Standarden tillåter storlekar på en PU från ner till 4 4. Vid intraprediktion har måste storleken på en PU vara samma som motsvarande CU för alla storlekar förutom den minsta. I detta fall är det tillåtet att dela en CU i fyra stycken PU. Vid interprediktion kan man dela upp en CU i en, två eller fyra stycken PU. Det är bara tillåtet att dela till fyra PU när CU har den minsta storleken.

51 PU-storlekar Möjliga sätt att dela en CU i flera PU. För intraprediktion är bara M M och M/2 M/2 tillåtna. För interprediktion kan de fyra undre alternativen bara användas när M 16.

52 Transform Prediktionsfelet (från intra- eller interprediktion) för varje CU delas med hjälp av ett quadtree upp i ett antal Transform Units (TU). Storleken på en TU kan vara 32 32, 16 16, 8 8 eller 4 4. Vid intraprediktion måste TU ha samma storlek som PU. Vid interprediktion är uppdelningen i TU oberoende av uppdelningen i PU. Transformerna som används är heltalsapproximationer av skalade DCT. För intrakodning av TU av storlek 4 4 används även en heltalsapproximation av en DST (Discrete Sine Transform).

53 Framestrukturer Varje bild (frame) som kodas kan delas upp i slices och tiles. En slice består av ett antal CTU:s i raster-scan-ordning som kan avkodas korrekt utan att använda data från andra slices. Detta betyder att ingen intraprediktion görs över slicegränser. En tile är en rektangulär area av bilden som kan avkodas korrekt utan att korrekt utan att använda data från andra tiles. En slice kan bestå av flera tiles. En tile kan bestå av flera slices. Slices och tiles kan därmed avkodas parallellt.

54 Slices och tiles

55 Slice-typer Varje slice kodas som en I-slice, en P-slice eller en B-slice. I Alla CU:s kodas med intraprediktion. P CU:s kodas antingen med intraprediktion eller interprediktion från en tidigare bild (en rörelsevektor). B CU:s kodas antingen med intraprediktion eller interprediktion från en tidigare bild och/eller en senare bild (en eller två rörelsevektorer).

56 Intraprediktion Intraprediktionen använder tidigare avkodade pixelvärden från närliggande block för att skapa prediktionssignalen, genom att interpolera i en av 33 olika riktningar. Dessutom kan man även välja att göra en planprediktion eller DC-prediktion. Det finns alltså 35 olika sätt att göra prediktionen för varje block.

57 Interprediktion Varje inter-pu kan ha en eller två rörelsevektorer och referensbildsindex. Rörelsevektorerna använder kvartspixelnoggrannhet. Subpixelvärden interpoleras från tillgängliga pixelvärden med linjära filter.

58 Kvantisering och källkodning Kvantiseringen som används är likformig kvantisering. Skalningsmatriser som ger olika steglängder för olika transformkomponenter kan användas. Källkodningsmetoden kallas CABAC (Context Adaptive Binary Arithmetic Coding). Detta är samma metod som används i H.264.

59 Efterbehandling När en bild är avkodad filtreras den för att reducera blockartefakter och andra fel inuti blocken. Deblocking: Linjär filtrering på blockgränserna för att reducera blockartefakterna. Detta fanns redan i H.264. Sample Adaptive Offset (SAO): Icke-linjär filtrering inuti blocken för att reducera ringningsartefakter nära skarpa kanter och falska konturer (eng. banding) i platta områden. Kräver att lite extra information måste överföras i den kodade strömmen.

60 Deblocking Avkodad bild utan (a) och med (b) deblocking.

61 SAO Uppifrån och ned: Med SAO, utan SAO, originalbild.

62 Kodarja mfo relse

63 Kodarja mfo relse

64 Framtida utökningar Det kommer att komma flera utökningar till HEVC-standarden, till exempel: Skalbar kodning 3D/stereo/multi-view Utökade bildformat (ökat bitdjup i indata, 4:2:2, 4:4:4)

Föreläsning 7: Bild- och videokodning

Föreläsning 7: Bild- och videokodning Föreläsning 7: Bild- och videokodning Inledning - varför bildkodning - tillämpningar - grundprinciper Förlustfri kodning - Variabellängdskodning - Skurländskodning - Huffmankodning Irreversibla kodningsmetoder

Läs mer

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck

4/27/12. Fönstring i MDCT. Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 3. Ljudkodning

Läs mer

En generell prediktiv kodare utnyttjar signalens utseende N steg tillbaka i tiden för kodningen, dvs vi kodar efter den betingade fördelningen

En generell prediktiv kodare utnyttjar signalens utseende N steg tillbaka i tiden för kodningen, dvs vi kodar efter den betingade fördelningen Prediktiv kodning Närliggande sampel i en signal är oftast starkt korrelerade med varandra, det kan därför vara en bra ide att försöka utnyttja denna korrelation (minnet) innan kvantiseringen för att få

Läs mer

Linjär prediktion. Prediktiv kodning. Linjär prediktion. Prediktiv kodare och avkodare

Linjär prediktion. Prediktiv kodning. Linjär prediktion. Prediktiv kodare och avkodare Prediktiv kodning Linjär prediktion Närliggande sampel i en signal är oftast starkt korrelerade med varandra, det kan därför vara en bra ide att försöka utnyttja denna korrelation (minnet) innan kvantiseringen

Läs mer

Föreläsning 10: Ljudkodning ( Audio Coding )

Föreläsning 10: Ljudkodning ( Audio Coding ) Föreläsning 10: Ljudkodning ( Audio Coding ) 1. Inledning PCM, standardmetoder, MDCT, psykoakustik, ljudtryck 2. Hörselsinnet Hörnivåkurvor, hörseltröskel, maskeringseffekter, Barkskalan 1. Ljudkodning

Läs mer

Skurlängdskodning. aaaabbbbbbbccbbbbaaaa. Man beskriver alltså sekvensen med ett annat alfabet än det ursprungliga.

Skurlängdskodning. aaaabbbbbbbccbbbbaaaa. Man beskriver alltså sekvensen med ett annat alfabet än det ursprungliga. Datakompression fö 4 p1 Skurlängdskodning Ibland har man källor som producerar långa delsekvenser av samma symbol Det kan då vara praktiskt att istället för att beskriva sekvensen som en följd av enstaka

Läs mer

BILDKODNING TEORI. Källkodning. Analogt - och samplat

BILDKODNING TEORI. Källkodning. Analogt - och samplat BILDKODNING TEORI Källkodning Analogt - och samplat Temporalt Vertikalt Horisontalt o-o-o-o-o-oo-o-o-o o-o-o- 1 Två oberoende processer Sampling Tre dimensioner: horisontell, vertikal och tid Kvantisering

Läs mer

Ordbokskodning. Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning)

Ordbokskodning. Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning) Datakompression fö 6 p.1 Ordbokskodning Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning) Man skapar en ordbok som innehåller 2 b olika sekvenser av symboler

Läs mer

Exempel, minnesfri binär källa. Ordbokskodning. Lempel-Zivkodning. Lempel-Zivkodning, forts.

Exempel, minnesfri binär källa. Ordbokskodning. Lempel-Zivkodning. Lempel-Zivkodning, forts. Datakompression fö 6 p.3 Datakompression fö 6 p.4 Ordbokskodning Exempel, minnesfri binär källa Enkel variant av kodning med variabelt antal insymboler och fixlängds kodord. (Jfr tunstallkodning) Man skapar

Läs mer

Föreläsning 1: Bild- och ljudkodning

Föreläsning 1: Bild- och ljudkodning Föreläsning 1: Bild- och ljudkodning 1. Kursöversikt 2. Introduktion till bild- och ljudkodning - syfte - historik - antal bitar per bildpunkter/sampel 3. Två principiella klasser : distorsionsfri och

Läs mer

Transformkodning Idé: 1. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block

Transformkodning Idé: 1. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block Transformkodning Idé:. Tag datasekvensen och dela in den i block av storlek N (eller N N om signalen är tvνadimensionell). Transformera dessa block med en lämplig, reversibel transform till en ny sekvens.

Läs mer

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå(loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den. Psykoakustik Ljudtrycksnivå Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det

Läs mer

SMS047 Mediakodning. Introduktion. Frank Sjöberg. Introduktion. Introduktion

SMS047 Mediakodning. Introduktion. Frank Sjöberg. Introduktion. Introduktion SMS047 Mediakodning Frank Sjöberg Email: frank@sm.luth.se Rum A3207 Kursen behandlar kodning av fyra olika typer av media Text & annan data Bild Ljud (ej tal) Video Vi kommer i första hand att studera

Läs mer

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg Videoteknik KTH NADA Medieteknik Nils Wennerstrand P Gunnar Kihlander, Anders Nyberg HELA KEDJAN från kamera till bildskärm DV JPEG MPEG VGA Insamling Bearbetning Utsändning Presentation Y/C PAL RGB Kompatibilitet

Läs mer

Analys/syntes-kodning

Analys/syntes-kodning Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk

Läs mer

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå (loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Psykoakustik. Ljudtrycksnivå. Hörselns omfång. Hörnivå (loudness) Människans hörsel är ganska väl studerad och det finns bra modeller för den. Psykoakustik TSBK35 fö 10 p.3 Ljudtrycksnivå TSBK35 fö 10 p.4 Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen

Läs mer

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg

HELA KEDJAN. Videoteknik. från kamera till bildskärm. Nils Wennerstrand P. KTH NADA Medieteknik. Gunnar Kihlander, Anders Nyberg Videoteknik KTH NADA Medieteknik Nils Wennerstrand P Gunnar Kihlander, Anders Nyberg HELA KEDJAN från kamera till bildskärm 1 DV JPEG MPEG VGA Insamling Bearbetning Utsändning Presentation Y/C PAL RGB

Läs mer

MPEG-4-kompatibel settop-box för IP-nät baserad på öppna standarder

MPEG-4-kompatibel settop-box för IP-nät baserad på öppna standarder MPEG-4-kompatibel settop-box för IP-nät baserad på öppna standarder - en systemstudie Examensarbete utfört i bildkodning av Magnus Andrén LITH-ISY-EX-3328-2003 Linköping 2003 MPEG-4-kompatibel settop-box

Läs mer

Redaktion. Innehåll. Combitech Systems AB. Ledare...3. Utveckling mot effektivare bildöverföring...4. Bild- och videokodning...6

Redaktion. Innehåll. Combitech Systems AB. Ledare...3. Utveckling mot effektivare bildöverföring...4. Bild- och videokodning...6 ntime T E M A : T R E N D E R I N O M B I L D Ö V E R F Ö R I N G Nr 3 september 2002 Bild- och videokodning sid 6 DVB den digitala TV-revolutionen sid 12 Strömmande teknik i 3G-system för mobilkommunikation

Läs mer

Adaptiv aritmetisk kodning

Adaptiv aritmetisk kodning Datakompression fö 8 p.1 Adaptiv aritmetisk kodning Aritmetisk kodning är väldigt enkel att göra adaptiv, eftersom vi bara behöver göra en adaptiv sannolikhetsmodell, medan själva kodaren är fix. Till

Läs mer

Människans hörsel är ganska väl studerad och det finns bra modeller för den.

Människans hörsel är ganska väl studerad och det finns bra modeller för den. Psykoakustik Människans hörsel är ganska väl studerad och det finns bra modeller för den. Detta kan utnyttjas vid ljudkodning för att placera distorsionen (kvantiseringsbruset) så att det ska märkas så

Läs mer

Aritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12

Aritmetisk kodning. F (0) = 0 Exempel: A = {1, 2, 3} k=1. Källkodning fö 5 p.1/12 Aritmetisk kodning Vi identifierar varje sekvens av källsymboler med ett tal i intervallet [0, 1). Vi gör det med hjälp av fördelningsfunktionen (cumulative distribution function) F. För enkelhets skull

Läs mer

Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts.

Optimala koder. Övre gräns för optimala koder. Gränser. Övre gräns för optimala koder, forts. Datakompression fö 3 p.3 Datakompression fö 3 p.4 Optimala koder Övre gräns för optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning)

Läs mer

Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or.

Optimala koder. Det existerar förstås flera koder som har samma kodordsmedellängd. Enklaste fallet är att bara byta 0:or mot 1:or. Datakompression fö 3 p.1 Optimala koder En prefixkod kallas optimal om det inte existerar någon annan kod (för samma alfabet och sannolikhetsfördelning) som har lägre kodordsmedellängd. Det existerar förstås

Läs mer

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet 1. Multimedia för persondator distribuerad via Internet 2. Multimedia för persondator lagrad på CD-ROM 3. Digital distribuerad

Läs mer

FLAC (Free Lossless Audio Coding)

FLAC (Free Lossless Audio Coding) Datakompression fö 9 p.1 FLAC (Free Lossless Audio Coding) Distorsionsfri kodning av ljud Ljudsignalen delas in i block (typiskt några tusen sampel). Koda summa/skillnad av de två stereokanalerna om det

Läs mer

Shannon-Fano-Elias-kodning

Shannon-Fano-Elias-kodning Datakompression fö 5 p.1 Shannon-Fano-Elias-kodning Antag att vi har en minnesfri källa X i som tar värden i {1, 2,...,L}. Antag att sannolikheterna för alla symboler är strikt positiva: p(i) > 0, i. Fördelningsfunktionen

Läs mer

QosmioEngine För avancerad video

QosmioEngine För avancerad video QosmioEngine För avancerad video Qosmio förenar QosmioEngines och QosmioPlayers högkvalitativa videofunktioner, Harman Kardon högtalare och SRS TruSurround XT: s funktioner för surroundljud och digital

Läs mer

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Common Image Formats. Image Coding GIF. GIF (Graphis Interchange Format)

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Common Image Formats. Image Coding GIF. GIF (Graphis Interchange Format) Image Coding Common Image Formats GIF (Graphis Interchange Format) Lossless, but only in 256 colors Uses LZW for compression (Patent problem) PNG (Portable Network Graphics) More flexible replacement for

Läs mer

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler

I. Talkodning. Kodning av tal Kodning av musik MPEG-4 Audio toolbox. Talkodning Historik. Talgenerering. Talsignalen - vokaler Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Kodning av tal Kodning av musik MPEG-4 Audio toolbox Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder

Läs mer

Kodning av tal Kodning av musik MPEG-4 Audio toolbox

Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av tal Kodning av musik MPEG-4 Audio toolbox Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller 3D-objekt belysning kameraprojektion ljudgenerering Modellbaserade kodningsmetoder

Läs mer

Kodning av ansiktstextur med oberoende komponenter

Kodning av ansiktstextur med oberoende komponenter Kodning av ansiktstextur med oberoende komponenter Jörgen Ahlberg Report no. LiTH-ISY-R-2297 ISSN 1400-3902 Avdelning, Institution Division, department Datum Date Image Coding Group 2000-10-02 Department

Läs mer

Paper or screen. Systemlagret. Vision technology. Audio technology. Current loudspeakers and sound equipment is good enough?

Paper or screen. Systemlagret. Vision technology. Audio technology. Current loudspeakers and sound equipment is good enough? Paper or screen Systemlagret Vision technology Audio technology Current loudspeakers and sound equipment is good enough? 3D? Ljudlandskap? Stämningsbakgrund? 1 Systemlagret I PC, Router, Switch HW Grafikkort,

Läs mer

Torstens Digitalbildguide

Torstens Digitalbildguide Thor Stone Education Torstens Digitalbildguide 1 Det finns två huvudtyper av digital bild, vektorbaserad och pixelbaserad. - Vektorbaserade bilder bygger på en matematisk formel och kan storlekförändras

Läs mer

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Image Coding. Common Image Formats GIF

Synsinnet. Komprimeringsexempel. Förlustkomprimering - Bakgrund. Image Coding. Common Image Formats GIF Image Coding Förlustkomprimering - Bakgrund Bilder överförs för att visas upp för en människa. Människan är otålig och halvblind Otålig Frustrerande med väntan framför skärmen Halvblind Det mänskliga synsinnet

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 5 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer. Khalid Sayood, Introduction to Data Compression

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer. Khalid Sayood, Introduction to Data Compression TSBK35 fö 1 p.3 TSBK35 fö 1 p.4 Kurslitteratur Kompression av ljud och bild Harald Nautsch harna@isy.liu.se http://www.icg.isy.liu.se/courses/tsbk35/ ISY Bildkodning, Linköpings universitet Khalid Sayood,

Läs mer

TSBK35 Kompression av ljud och bild

TSBK35 Kompression av ljud och bild TSBK35 Kompression av ljud och bild Övningshäfte 0 februari 013 Innehåll I Problem 1 1 Informationsteori................................ 1 Källkodning................................... 3 3 Kvantisering...................................

Läs mer

Vinjetter TDDC91 Datastrukturer och algoritmer

Vinjetter TDDC91 Datastrukturer och algoritmer Vinjetter TDDC91 Datastrukturer och algoritmer 17 augusti 2015 2 Scenario 1 Man har inom Posten Logistik AB skrivit programvara för sortering av kundinformation och vill standardisera användningen av sorteringsalgoritmer.

Läs mer

Kvalitetsaspekter på videostreaming till mobiltelefoner E R I K O T T E R B E R G

Kvalitetsaspekter på videostreaming till mobiltelefoner E R I K O T T E R B E R G Kvalitetsaspekter på videostreaming till mobiltelefoner E R I K O T T E R B E R G Examensarbete Stockholm, Sverige 2007 Kvalitetsaspekter på videostreaming till mobiltelefoner E R I K O T T E R B E R G

Läs mer

Videosignalen. Blockdiagram över AD omvandling (analogt till digitalt)

Videosignalen. Blockdiagram över AD omvandling (analogt till digitalt) Videosignalen Analog/digital Även om vi idag övergår till digital teknik när vi ska insamla, bearbeta och spara videomaterial, så är dock vår omvärld analog. Det innebär att vi i videokameran och TV monitorn

Läs mer

Distansutbildning. av Anders Andersson. Västanvik Resurs- och Utvecklingscenter

Distansutbildning. av Anders Andersson. Västanvik Resurs- och Utvecklingscenter Distansutbildning av Anders Andersson Västanvik Resurs- och Utvecklingscenter VRC är en ek. förening bildad av: Sveriges Dövas Riksförbund Sveriges Dövas Ungdomsförbund Västanviks folkhögskola Dalarnas

Läs mer

Varför måste man kunna detta? Videoformat. Komprimering. Komprimeringsprinciper. Samplingsprinciper. Begrepp

Varför måste man kunna detta? Videoformat. Komprimering. Komprimeringsprinciper. Samplingsprinciper. Begrepp Varför måste man kunna detta? Videoformat Kalle Prorok 2007 Sidan 126-153,156-161,162-175 Veta vad man ska åstadkomma/beställa Det är ganska rörigt och blir lätt fel Tänka på framtiden Kommer vi behöva

Läs mer

Källkodning. Egenskaper hos koder. Några exempel

Källkodning. Egenskaper hos koder. Några exempel Källkodning Källkodning innebär att vi avbildar sekvenser av symboler ur en källas alfabet på binära sekvenser (kallade kodord). Mängden av alla kodord kalls för en kod. (Man kan förstås tänka sig att

Läs mer

Laboration 4: Digitala bilder

Laboration 4: Digitala bilder Objektorienterad programmering, Z : Digitala bilder Syfte I denna laboration skall vi återigen behandla transformering av data, denna gång avseende digitala bilder. Syftet med laborationen är att få förståelse

Läs mer

Föreläsning 12. Modellbaserad ljudkodning. Modellbaserad bildkodning. Utblickar Mediakommunikation över Internet Multi-view video

Föreläsning 12. Modellbaserad ljudkodning. Modellbaserad bildkodning. Utblickar Mediakommunikation över Internet Multi-view video Föreläsning 12 Modellbaserad ljudkodning Modellbaserad bildkodning Utblickar Mediakommunikation över Internet Multi-view video 1 Kodning av bild och ljud bygger på modeller (Fö.1) S(t) t Genereringsmodeller

Läs mer

Fysikalisk mätning av vägmarkeringars area

Fysikalisk mätning av vägmarkeringars area VTI notat 53 2003 VTI notat 53-2003 Fysikalisk mätning av vägmarkeringars area Författare Elisabeth Ågren FoU-enhet Drift och underhåll Projektnummer 80571 Projektnamn Empiriska studier inom CDU T25 Uppdragsgivare

Läs mer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer Bildförbättring i spatial domänen (kap. 3) Punktoperationer Gråskaletransformationer Logiska & aritmetiska operationer Filtrering Faltning Lågpassfilter Högpassfilter Bildförbättring (enhancement) Förbättra

Läs mer

Vad är "media. Vad brukar vi mena med media?

Vad är media. Vad brukar vi mena med media? Media, Multimedia och videokodning 2D1518 Audio-, Video och Multimediaproduktion http://www.nada.kth.se/kurser/kth/2d1516/ och 2D1553 Mediaproduktion http://www.nada.kth.se/kurser/kth/2d1553/ 2002-10-29

Läs mer

Institutionen för systemteknik Department of Electrical Engineering

Institutionen för systemteknik Department of Electrical Engineering Institutionen för systemteknik Department of Electrical Engineering Examensarbete Digital videoregistrering Examensarbete utfört i elektroniksystem av Viktor Eliasson LiTH-ISY-EX-ET--12/0402--SE Linköping

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning

Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning TNMK30, 2010 Föreläsning Bilder... Tobias Trofast, LiU 1 Dagens föreläsning Olika grafikformat Bitdjup Färglägen och kanaler Komprimering Filformat Bildkvalitet Upplösning & Interpolering Objektgrafik

Läs mer

QosmioEngine: För avancerad video

QosmioEngine: För avancerad video tech-rapport qosmioengine QosmioEngine: För avancerad video 02 03 06 09 10 Qosmio förenar de avancerade videofunktionerna i QosmioEngine och QosmioPlayer, Harman Kardon- högtalare och äkta Dolby Home Theatre

Läs mer

Videokomprimering och distribution

Videokomprimering och distribution Videokomprimering och distribution Digital video representerar flera olika codecs, d. v. s. kompressionsalgoritmer. Upprinnelsen till detta beror på att enormt stora dataflöden skall hanteras på kort tid.

Läs mer

3.0. Tips och Trix Sida 1 av 18

3.0. Tips och Trix Sida 1 av 18 3.0 https://beta.scratch.mit.edu/ Tips och Trix 2018-08-31 Sida 1 av 18 Innehåll Starta nytt program 3 Scenens koordinatsystem 3 Centrumpunkt / rotationspunkt 4 Sprajtens inställningar 5 Placering i Z-led

Läs mer

TBSK 03 Teknik för Advancerade Datorspel

TBSK 03 Teknik för Advancerade Datorspel TBSK 03 Teknik för Advancerade Datorspel Översikt 3D och Stereoskopi Introduktion Bildskärmsteknik Depth Cues Limiteringar Design-riktlinjer Texturkompression Introduktion Algoritmer & Standarder (DXT,

Läs mer

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering: INT 3 F4 Medieteknik Del2 Komprimering, ljud och rörliga bilder DSV Peter Mozelius Bildkomprimering Olika algoritmer för bildkomprimering: Icke-förstörande komprimering RLE Run Length Encoding Huffman-kodning

Läs mer

Kodning med distorsion

Kodning med distorsion Kodning med distorsion Vi har en signal x n, n = 1... N som ska kodas. Alfabetet är en delmängd av de reella talen A R. Alfabetet kan vara kontinuerligt. Om vi inte har kravet att den avkodade signalen

Läs mer

'LJLWDODELOGHUR KGLJLWDOELOGPDQLSXOHULQJ

'LJLWDODELOGHUR KGLJLWDOELOGPDQLSXOHULQJ 'LJLWDODELOGHUR KGLJLWDOELOGPDQLSXOHULQJ Nyckelord: Sampling, kvantisering, upplösning, geometriska operationer, fotometriska operationer, målning, filtrering 'LJLWDOUHSUHVHQWDWLRQR KODJULQJDYELOGHU En

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

TSBK04 Datakompression. Övningsuppgifter

TSBK04 Datakompression. Övningsuppgifter TSBK04 Datakompression Övningsuppgifter Innehåll 1 Informationsteoretiska begrepp........................ 1 2 Källkodning................................... 4 Copyright c 2004 Bildkodningsgruppen, Linköpings

Läs mer

3D så långt ögat ögonen når

3D så långt ögat ögonen når 3D så långt ögat ögonen når Mårten Sjöström & Roger Olsson SSNfs Årskonferens, Örebro 22 Mars, 2011 1 Innehåll 3D nu igen? Ny 3D med ny teknik och ny kunskap Hur ser vi avstånd, och hur kan det återskapas?

Läs mer

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal

Läs mer

4 Paket- och kretskopplade nät

4 Paket- och kretskopplade nät 4 Paket- och kretskopplade nät Kommunikationssystem 2G1501 Syftet: Syftet med detta kapitel är att förstå egenskaperna hos, och skillnaderna mellan, de tre olika kopplade nätverkstyperna kretskopplade

Läs mer

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet 1. Multimedia för persondator och mobiltelefon distribuerad via Internet 2. Multimedia för persondator lagrad på CD-ROM

Läs mer

International Olympiad in Informatics 2011 22 29 July 2011, Pattaya City, Thailand Tävlingsuppgifter Dag 2 Svenska 1.3. Papegojor

International Olympiad in Informatics 2011 22 29 July 2011, Pattaya City, Thailand Tävlingsuppgifter Dag 2 Svenska 1.3. Papegojor Papegojor Yanee är fågelentusiast. Sedan hon läst om IP over Avian Carriers (IPoAC), har hon spenderat mycket tid med att träna en flock papegojor att leverera meddelanden över långa avstånd. Yanees dröm

Läs mer

-med fokus på robusthet

-med fokus på robusthet Datavetenskap Hannes Persson Redovisning av JPEG2000 -med fokus på robusthet Magisteruppsats 2001:05 Redovisning av JPEG2000 -med fokus på Robusthet Hannes Persson 2001 Hannes Persson och Karlstads universitet

Läs mer

Konvertering. (Conversion chapter 3, Watkinson) Sebastian Olsson Anders Stenberg Mattias Stridsman Antonios Vakaloudis Henrik Wrangel

Konvertering. (Conversion chapter 3, Watkinson) Sebastian Olsson Anders Stenberg Mattias Stridsman Antonios Vakaloudis Henrik Wrangel Konvertering (Conversion chapter 3, Watkinson) Sebastian Olsson Anders Stenberg Mattias Stridsman Antonios Vakaloudis Henrik Wrangel Introduktion Input: videovågform med kontinuerlig tid och en kontinuerlig

Läs mer

MPEG-4 innehåller bl.a:

MPEG-4 innehåller bl.a: MPEG MPEG står för Moving Picture Experts Group och är en ISO standard från januari 1988. MPEG-1 var ursprungligen inriktad på lagring av audio och video på CD-ROM. Den kom, förutom att användas i miljontals

Läs mer

Spektrala Transformer för Media

Spektrala Transformer för Media Spektrala Transformer för Media Filtrering och transformer i 2D Linjär bildbehandling Principerna från -dimensionell signalbehandling kan appliceras även på 2D-signaler Tillämpningar: Bildförbättring (brusreducering)

Läs mer

Spektrala Transformer för Media

Spektrala Transformer för Media Spektrala Transformer för Media Filtrering och transformer i 2D DT2/3 Spektrala Transformer Jonas Beskow Linjär bildbehandling Principerna från -dimensionell signalbehandling kan appliceras även på 2D-signaler

Läs mer

SNABBGUIDE för Windows Media Encoder (media kodaren) - Sänd live med din webbkamera

SNABBGUIDE för Windows Media Encoder (media kodaren) - Sänd live med din webbkamera SNABBGUIDE för Windows Media Encoder (media kodaren) - Sänd live med din webbkamera Instruktionerna till denna kameraguide är en enkel kom igång guide. Grundkrav: En webbkamera som är kopplad till datorn

Läs mer

Kompression av ljud och bild

Kompression av ljud och bild Kompression av ljud och bild Harald Nautsch harna@isy.liu.se ISY Informationskodning, Linköpings universitet http://www.icg.isy.liu.se/courses/tsbk35/ Kurslitteratur Rekommenderad bok: Khalid Sayood, Introduction

Läs mer

After Effects Lathund

After Effects Lathund After Effects After Effects Lathund After Effects En komposition är det samma som ett filmklipp i After Effects. En komposition kan vara hela filmen/ animationen eller så använder man sig av flera kompositioner

Läs mer

TSBK04 Datakompression Övningsuppgifter

TSBK04 Datakompression Övningsuppgifter TSBK04 Datakompression Övningsuppgifter Innehåll 1 Informationsteoretiska begrepp........................ 1 2 Källkodning................................... 4 Copyright c 2004 Bildkodningsgruppen, Linköpings

Läs mer

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer

Kurslitteratur. Kompression av ljud och bild. Föreläsningar, preliminärt program. Laborationer TSBK35 källkodning p.3/89 TSBK35 källkodning p.4/89 Kurslitteratur Kompression av ljud och bild Harald Nautsch harna@isy.liu.se http://www.icg.isy.liu.se/courses/tsbk35/ ISY Informationskodning, Linköpings

Läs mer

NEX-3/NEX-5/NEX-5C A-DRH-100-92(1) 2010 Sony Corporation

NEX-3/NEX-5/NEX-5C A-DRH-100-92(1) 2010 Sony Corporation NEX-3/NEX-5/NEX-5C 3D-funktionerna som levereras med uppdateringen av den fasta programvaran beskrivs i den här broschyren. Se häftet Handledning och Bruksanvisning till α som finns på medföljande CD-ROM-skiva.

Läs mer

PÅ SPANING I FORMATDJUNGELN

PÅ SPANING I FORMATDJUNGELN PÅ SPANING I FORMATDJUNGELN För den som tittar på tv i Sverige är formatfrågan enkel det finns bara två format: standard och hd. Förutom att det inte är riktigt sant. Följ med på en vindlande vandring

Läs mer

Föreläsning i webbdesign. Bilder och färger. Rune Körnefors. Medieteknik. 2012 Rune Körnefors rune.kornefors@lnu.se

Föreläsning i webbdesign. Bilder och färger. Rune Körnefors. Medieteknik. 2012 Rune Körnefors rune.kornefors@lnu.se Föreläsning i webbdesign Bilder och färger Rune Körnefors Medieteknik 1 2012 Rune Körnefors rune.kornefors@lnu.se Exempel: Bilder på några webbsidor 2 Bildpunkt = pixel (picture element) Bilder (bitmap

Läs mer

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson Att göra Kursombud Williams bok???? Kolla schemat: Övningar flyttade Labanmälan ska funka nu 2 Att sända information

Läs mer

RÄTTMALL/Omtenta i TV-teknik 5p

RÄTTMALL/Omtenta i TV-teknik 5p RÄTTMALL/Omtenta i TV-teknik 5p 030613 I de tentamensfrågor som har alternativa svar, kan om inte annat anges, ett eller flera av alternativen vara rätt. Rätt rad (alla fyra rutor markerade eller tomma

Läs mer

P L A Y. Adobe Produktguide. Adobe Photoshop Elements 4.0 Adobe Premiere Elements 2.0

P L A Y. Adobe Produktguide. Adobe Photoshop Elements 4.0 Adobe Premiere Elements 2.0 P L A Y Adobe Produktguide Adobe Photoshop Elements 4.0 Adobe Premiere Elements 2.0 Svensk programvara med svenska instruktioner! Ny version Adobe Photoshop Elements 4.0 Allt du behöver för att redigera,

Läs mer

INT 3 F3. En texts läsbarhet. Teckensnitt. Medieteknik Del1. Färger, teckensnitt och bildformat

INT 3 F3. En texts läsbarhet. Teckensnitt. Medieteknik Del1. Färger, teckensnitt och bildformat INT 3 F3 Medieteknik Del1 Färger, teckensnitt och bildformat DSV Peter Mozelius En texts läsbarhet Teckensnitt Teckengrad Radlängd Radavstånd Papper/Skärm Bakgrundsfärg Teckensnitt Teckensnitt kan delas

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 6 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

10/13/08. TV-standarder. Lennart Ståhlberg/STV Video Data Vad gör kameran? Vad gör kameran? Parallell till serieomvandlare

10/13/08. TV-standarder. Lennart Ståhlberg/STV Video Data Vad gör kameran? Vad gör kameran? Parallell till serieomvandlare TV-standarder Lennart Ståhlberg/STV Video Data lennart.stahlberg@stv.se Vad gör kameran? Vad gör kameran? Parallell till serieomvandlare 1 10/13/08 Pre WW2 system Från 30 och 32 linjer / bild 1927 Mekaniska

Läs mer

Institutionen för systemteknik Department of Electrical Engineering

Institutionen för systemteknik Department of Electrical Engineering Institutionen för systemteknik Department of Electrical Engineering Examensarbete Digital videoväxel Examensarbete utfört i bildkodning av Henrik Länger Olle Eriksson LITH-ISY-EX--04/3669--SE Linköping

Läs mer

2 Vad händer när man ringer? 2 Vad händer när man ringer?

2 Vad händer när man ringer? 2 Vad händer när man ringer? 41 GSM-boken 2.1 Blockschema Bilden här intill visar ficktelefonen så som våra ögon ser den, ett hölje med antenn. I höljet finns ett hål att prata i, där sitter mikrofonen, och en massa småhål att lyssna

Läs mer

Perfekt skärpa i Photoshop

Perfekt skärpa i Photoshop Perfekt skärpa i Photoshop Lathunden innehåller viktiga nyckelbegrepp från kursen och alla riktvärden du behöver. Dessutom finns ett antal tips och förtydliganden som inte nämndes i kursen. Alla värden

Läs mer

Spektrala transformer Laboration: JPEG-kodning

Spektrala transformer Laboration: JPEG-kodning Spektrala transformer Laboration: JPEG-kodning 1 Introduktion I denna laboration kommer du att få experimentera med transfom-baserad bildkompression enligt JPEG-metoden. Du kommer att implementera en förenklad

Läs mer

Multimedia? Produktion för Webb och Multimedia

Multimedia? Produktion för Webb och Multimedia Multimedia? Produktion för Webb och Multimedia Vad är Multimedia? En kombination av olika medietyper som text, grafik, ljud, video och animering, osv. Integration av vad tidigare var separata kommunikationsmetoder

Läs mer

Digital signalbehandling Digitalt Ljud

Digital signalbehandling Digitalt Ljud Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1

Läs mer

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Jens A Andersson Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson Att sända information mellan datorer värd 11001000101 värd Två datorer som skall kommunicera. Datorer förstår endast

Läs mer

Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring. Att göra. Att sända information mellan datorer

Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring. Att göra. Att sända information mellan datorer Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring Jens A Andersson (Maria Kihl) Att göra Kursombud 2 Att sända information mellan datorer 11001000101 värd värd Två datorer som skall

Läs mer

TSBK 10 Teknik för avancerade datorspel Fö 9: Nätverk, Peter Johansson, ISY

TSBK 10 Teknik för avancerade datorspel Fö 9: Nätverk, Peter Johansson, ISY TSBK 10 Teknik för avancerade datorspel Fö 9: Nätverk, Peter Johansson, ISY Fysik Datorgrafik Spelmekanismer AI Nätverk Nätverksaspekter i spel z Fleranvändarspel blir allt populärare z Roligare att spela

Läs mer

Kapitel 3 o 4. Tillförlitlig dataöverföring. (Maria Kihl)

Kapitel 3 o 4. Tillförlitlig dataöverföring. (Maria Kihl) Kapitel 3 o 4 Att skicka signaler på en länk Tillförlitlig dataöverföring Jens A Andersson (Maria Kihl) Att sända information mellan datorer 11001000101 värd värd Två datorer som skall kommunicera. Datorer

Läs mer

Europeiska unionens officiella tidning

Europeiska unionens officiella tidning 6.5.2014 L 133/43 KOMMISSIONENS GENOMFÖRANDEFÖRORDNING (EU) nr 459/2014 av den 29 april 2014 om ändring av vissa förordningar rörande klassificering av varor i Kombinerade nomenklaturen EUROPEISKA KOMMISSIONEN

Läs mer

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Att sända information mellan datorer. Information och binärdata

Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk. Att sända information mellan datorer. Information och binärdata Kapitel 2 o 3 Information och bitar Att skicka signaler på en länk Jens A Andersson (Maria Kihl) Att sända information mellan datorer värd 11001000101 värd Två datorer som skall kommunicera. Datorer förstår

Läs mer

Sensorer i digitalkameror

Sensorer i digitalkameror Sensorer i digitalkameror Kretskort Minneskort Sensor Detektorelement (pixel). Typisk storlek: 2-5 m Typiskt antal: 5-20M Sensortyper i digitalkameror CCD (Charge Coupled Device) CMOS (Complementary Metal

Läs mer

BILDBEHANDLINGSMETOD INNEFATTANDE BRUSREDUCERING I BILD MED LOKALT ADAPTIV FILTERKÄRNA

BILDBEHANDLINGSMETOD INNEFATTANDE BRUSREDUCERING I BILD MED LOKALT ADAPTIV FILTERKÄRNA BILDBEHANDLINGSMETOD INNEFATTANDE BRUSREDUCERING I BILD MED LOKALT ADAPTIV FILTERKÄRNA Author: Stefan Olsson Published on IPQ website: April 10, 2015 Föreliggande uppfinning avser en metod för bildbehandling

Läs mer

Photo Story 3. Manual till Photo Story 3 1

Photo Story 3. Manual till Photo Story 3 1 Photo Story 3 Manual till Photo Story 3 1 1. Programförklaring...3 Tips på användning... 4 2. 1 - Starta nytt projekt...4 3. 2 - Importera bilder...5 Leta efter bilder... 5 Tidslinjen... 6 4. 3 - Lägga

Läs mer