Bildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet

Relevanta dokument
Histogram över kanter i bilder

Matematisk modellering fortsättningskurs Visuell variation

ATTRIBUTION ATTRIBUERING AV DIGITALA KANALER ATT S1

Objective:: Linjärt beroende och oberoende version 1.0

Figur 2: Bild till uppgift 1 a) b) Figur 3: Bilder till uppgift 7 5

Skapa remissvar till regeringen, skicka för godkännande, godkänna, diarieföra och skicka svar

Junior- och ungdomsta vlingar

Hantera remissvar i Public 360

Stockholm Till de organisationer som undertecknat beslutet om samverkan

Skapa rapport till regeringen, skicka för godkännande, godkänna, diarieföra och skicka rapport

Quadrocopter Bygguide. Carl Westman December 29, 2015

Ansiktsigenkänning med MATLAB

KARTLÄGGNING. 1.2 Finns det en integrationsstrategi i ert arbete mot denna ma lgrupp?

Bebyggelse. Översiktsplan Kumla kommun 2040

LYCKA TILL! kl 8 13

Föreningens bästa vän

KSGnytt. Rektorn har ordet

Digital Signalbehandling i Audio/Video

Linjär algebra kurs TNA002

Föreningens bästa vän

Faktoranalys - Som en god cigarr

För ingenjörs- och distansstudenter Linjär Algebra ma014a ATM-Matematik Mikael Forsberg

y z 3 = 0 z i )

LINJÄR ALGEBRA OCH DIFFERENTIALEKVATIONER, M0031M VT-16

Laboration 1. Grafisk teknik (TNM059) Introduktion till Matlab. R. Lenz och S. Gooran (VT2007)

SF1624 Algebra och geometri

EGENVÅRDSMARKNADEN 2015

tala är silver dela är guld

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

VA GBESKRIVNING PARKERING

Bildbehandling, del 1

Stöd inför omtentamen i Linjär algebra TNA002.

reella tal x i, x + y = 2 2x + z = 3. Här har vi tre okända x, y och z, och vi ger dessa okända den naturliga

Fly me to the moon. Laboration om relationer, TDDC75 Diskreta strukturer. Mikael Asplund. 5 september 2017

DELÅRSRAPPORT FÖR PERIODEN 1 JANUARI 30 JUNI 2015

Såhär kommer vi att arbeta mot målen: Genomgångar, räkna i aktuellt kapitel, jobba med arbetsblad, läxor, muntliga redovisningar

DELÅRSRAPPORT FÖR PERIODEN 1 JANUARI 30 SEPTEMBER 2015

Statistisk mönsterigenkänning

Inför tentamen i Linjär algebra TNA002.

Trygghetsplan för Ekeby förskola

SKRIVNING I VEKTORGEOMETRI

Socialförvaltningen Vård och omsorg

Kommunikationer. Översiktsplan Kumla kommun 2040

La ttla st sammanfattning

TEM Projekt Transformmetoder

Bildbehandling i frekvensdomänen

SF1624 Algebra och geometri Lösningsförslag till modelltentamen DEL A

Vi skalla främst utnyttja omskrivning av en matris för att löas ett system av differentialekvaioner. 2? Det är komplicerat att

Arbetsförmedlingen i framtiden. Anders Forslund IFAU och Uppsala universitet Seminarium, SNS

INSIGHTLAB: KOMPETENSKORT EXECUTIVE SUMMARY Gör dina val medvetet

Fingerprint Matching

ETT STARKT VARUMÄRKE BYGGS INIFRÅN...

VÄGBESKRIVNING: Från Örebro: Fra n E18 sva nger du av Kolba ck va stra, va g 252. Efter 8 km kommer. Markanplan.

Laboration 2. Grafisk teknik (TNM059) Digital Rastrering. S. Gooran (VT2007)

Prislista 2019 Fjärrvärme

Checklista som kan anva ndas för att komma igång med DigiExam och allma nna rekommendationer fo r att lyckas med provtillfa llet.

Nr 1 Va ren Almö. Foto: Håkan Nilsson

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation

DEL I. Matematiska Institutionen KTH. Lösning till tentamensskrivning på kursen Linjär algebra II, SF1604, den 17 april 2010 kl

Exempel :: Spegling i godtycklig linje.

Varmt välkommen till KONVENT oktober. Lajv, rollspel och workshops. med. Svenska Kyrkans Unga Söderköping Gröna Draken

MEDLEMSINFO

1 som går genom punkten (1, 3) och är parallell med vektorn.

Kvalitetssa kring av MS-va rden i Sverige

6.1 Skalärprodukt, norm och ortogonalitet. TMV141 Linjär algebra E VT 2011 Vecka 6. Lärmål 6.1. Skalärprodukt. Viktiga begrepp

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

Exempel :: Spegling i godtycklig linje.

(d) Mängden av alla x som uppfyller x = s u + t v + (1, 0, 0), där s, t R. (e) Mängden av alla x som uppfyller x = s u där s är ickenegativ, s 0.

M = c c M = 1 3 1

Sammanfattninga av kursens block inför tentan

FRAMTIDEN A R REDAN HA R

Egenvärden och egenvektorer. Linjär Algebra F15. Pelle

TAIU07 Matematiska beräkningar med Matlab

Trygghetsplan för Hällabrottets förskola

Fö relä sning 2, Kö system 2015

Vektorgeometri för gymnasister

Trivselregler Brf Ronnebyga rden

Linjär algebra Föreläsning 10

Natur och grönstruktur. Översiktsplan Kumla kommun 2040

TMV166 Linjär algebra för M, vt 2016

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

Linjär Algebra, Föreläsning 2

Egenvärden och egenvektorer

V x + ΔV x ) cos Δθ V y + ΔV y ) sin Δθ V x ΔV x V y Δθ. Dela med Δt och låt Δt gå mot noll:

A = (3 p) (b) Bestäm alla lösningar till Ax = [ 5 3 ] T.. (3 p)

LATHUND FÖR GENOMFÖRANDE AV. Final i Snabbpistol på papperstavlor

SF1624 Algebra och geometri Lösningsförslag till tentamen DEL A

Laboration 1. Grafisk teknik Rastrering. Sasan Gooran (HT 2004)

Kodning av ansiktstextur med oberoende komponenter

Vi på ung scen/o st a r mycket glada o ver att ni kommer och ser vår fo resta llning Jag vill ha lyckliga slut.

Trygghetsplan för Matildelunds förskola

UPPSALA UNIVERSITET Matematiska institutionen Styf. Exempeltenta med lösningar Programmen EI, IT, K, X Linjär algebra juni 2004

BOKSLUTSKOMMUNIKÉ 1 JANUARI 31 DECEMBER 2013

Finansiering, subvention och prissättning av läkemedel

Linköpings Universitet. TNM034 - Avancerad Bildbehandling. Beathoven. emiax775. Emil Axelsson Anna Flisberg Karl Johan Krantz.

Vektorerna är parallella med planet omm de är vinkelräta mot planets normal, dvs mot

Linjär Algebra, Föreläsning 20

Frågorna 1 till 6 ska svaras med ett kryss för varje korrekt påstående. Varje uppgift ger 1 poäng. Använd bifogat formulär för dessa 6 frågor.

Integritetspolicy. Org nr: Ventus Norden Växel: Integritetspolicy Sverige

Robotarm och algebra

Transkript:

Bildmosaik Bilddatabaser, TNM025 Linko pings Universitet Anna Flisberg Linne a Mellblom annfl042 linme882 28 maj 2015

Innehåll 1 Introduktion 2 2 Metod 2 2.1 Features.............................................. 2 2.2 Representation av features.................................... 2 2.3 LBP................................................ 2 2.4 PCA................................................ 2 2.5 Databas.............................................. 3 2.6 Mosaikbild............................................ 3 3 Resultat 3 4 Diskussion 3 5 Förslag till förbättringar 4 A Resultatbilder 5 1

1 Introduktion Målet med projektet i kursen TNM025 är att skapa ett program i Matlab som kan komponera en så kallad mosaikbild. Givet en inbild ska programmet försöka återskapa denna bild genom att ersätta områden i inbilden med olika databasbilder. Mosaikbilden som skapas kommer därmed innehålla en mängd olika databasbilder. På nära avstånd kommer varje enskild databasbild att synas men på ett längre avstånd kommer mosaikbilden i sin helhet att efterlikna orginalbilden. 2 Metod W är en representation för mättnad och nyans i enhetsskivan med komplexa värden. Denna implementation är given av Reiner Lenzs föreläsningar i kursen TNM025, 2015. 2.3 LBP Local Binary Pattern, förkortat LBP är en effektiv metod för att beskriva texturer [1]. LBP kategoriserar pixlarna i en bild genom att tröskla de 8 grannarna av varje pixel där tröskelvärdet är pixelvärdet, multiplicera med en given matris och betrakta resultatet som ett tal i denna pixel, se figur 2.3. Det är över detta tal som histogrammet beräknas. För att skapa en mosikbild behövs en databas med en stor mängd varierade bilder. Bilderna i databasen analyseras för att ta fram huvudkomponenter som beskriver egenskaper som kan jämföras. Den generella strategin för att bygga upp databasen är följande: 1. Välj ut features som ska mätas, exempelvis färgrymd. 2. Välj representation för features, vanligen histogram. 3. Komprimera representationen genom PCA. För att skapa mosaikbilden delas orginalbilden upp i mindre områden som ska ersättas med en bild från databasen. Analys görs på varje område och jämförs med de huvudkomponenter som beskriver egenskaperna för bilderna i databasen. Jämförelsen kan ses som en distans och beräknas genom exempelvis euklidisk avstånd. Genom detta mått kan den bild i databasen som är mest lik varje område väljas ut. 2.1 Features Features kallas de egenskaper som väljs ut för att ge beskrivande information om bilderna, exempelvis färgrymd eller struktur. Det är med dessa features som jämförelse sker för att hitta bilder i databasen matchar området i inbilden. I detta projekt används CIELAB, LBP och W som features. 2.2 Representation av features Histogram används för för att visa fördelningarna CIELAB och LBP. För att få en statistisk representation normaliseras histogrammen. 2.4 PCA Figur 1: Metod för LBP. Principal Component Analysis, förkortat PCA, är en linjär ortogonal transform som konverterar ett dataset med variabler som möjligen är korrelerade till ett dataset där variablerna säkert är okorrelerade [2]. Detta gör det möjligt att med endast ett fåtal huvudkomponenter beskriva ett dataset av en högre dimension. Korrelationsmatriser som beskriver bilderna i databasen beräknas för de features som representeras med hjälp av histogram 1, där Hist är histogram över de valda features. Korr = Hist Hist (1) Histogrammen har dimensionerna Y n, där Y är antal bins från histogrammet och n är antal bilder i databasen som ska jämföras. Detta ger en korrelationsmatris av dimension Y Y. Ur denna tas sedan egenvärden och egenvektorer fram. Egenvektorerna bygger nu upp ett nytt koordinatsystem där egenvärdena utgör variansen längs med de nya koordinataxlarna. Nu beräknas featurevektorer för alla valda features enligt 2 featurev = Hist eigv ectors; (2) 2

3 Featurevektorerna kan nu ses som en komprimerad version av histogrammen da de representeras av ett fa rre antal dimensioner i det nya koordinatsystemet. 2.5 Databas Databasen byggs upp genom att la sa in n antal bilder. Fo r varje bild bera knas histogram utifra n de features som valts. Dessa histogram lagras i en stor matris, som blir antal bins antal bilder, da r histogrammen ger antal bins. Det a r utifra n denna stora matris som korrelationsmatrisen enligt ekvation 1 bera knas. Sedan bera knas PCA som ger huvudkomponenterna fo r varje bild i databasen fo r varje feature. Na r databasen byggs upp, bera knas a ven dessa huvudkomponenter i kvadrat. Denna kvadrat anva nds na r distansbera kning ska ske vid ja mfo relse mellan en querybild och en databasbild. Fo rbera kningen sker fo r att snabba pa processen. 2.6 Resultat Figur 2: En tiger. Mosaikbild Fo r att bygga upp den nya bilden bryts orginalbilden ned i ett antal omra den. Fo r varje omra de bera knas sedan samma features (QHist) som na r databasen bera knades. Sedan bera knas ocksa featurevektorer fo r varje omra de enligt ekvation 3 da r eigv ectors a r de huvudkomponenter vi fa tt fra n databasen. Figur 3: Resultat av berg som inte blev sa bra. Mer resultatbilder finns i bilaga A. Qf eaturevn = QHistn eigv ectors (3) 4 Qf eaturevi ja mfo rs sedan med alla bilder databasen fo r att hitta den bild som a r mest lik omra det. Ja mfo relsen sker genom en euklidisk distansfunktion, L2-norm. Att va lja vilka features som skulle bera knas fo r att fa det ba sta resultatet var na got som vi funderade mycket kring. Na r det ga ller fa rgrymd testades fo rst RGB men vi insa g ganska snabbt att det blev sva rt att fa till en vettig distansfunktion. HSV fungerade inte heller som vi ville eftersom ma ttnad representeras av en vinkel. Med CIELAB fick vi va rt ba sta resultat, eftersom det a r en ungefa rligt ja mnfo rdelad fa rgrymd. distansi = db2i 2 q dbi q = omra de Diskussion (4) dbi = bild nummer i, i databasen Fo r varje feature bera knas en distans enligt ekvation 4. Genom att kombinera dessa distanser och vikta dem olika fa s en slutgiltig distansen fram. Den bild i databasen som a r mest lik omra det fa s genom att ta den distans som a r minst. Databasbilder ersa tter varje omra de och en mosaikbild a r skapad! Att va ga in W go r att ma ttnaden fo rba ttras lite, dock med nackdelen att bera kningarna fo r W tar va ldigt la ng tid. W go r ocksa att homogena omra den hanteras ba ttre, vilket a r ett problem som fortfarande a tersta r. I figur 3 kan man tydligt se att homogena bla a omra den ersa tts med gro na bilder. 3

LBP använde vi för att kunna väga in mönster i beräkningen av vilken bild som skulle plockas från databasen. Detta för att mosaikbilden ska få liknande struktur. Att hitta en viktning mellan CIELAB, W och LBP som gav ett resultat som vi var nöjda med, var något som vi kämpade med. Det var svårt att förutse hur olika viktningar skulle påverka mosaikbilderna och i slutändan så testade vi oss fram för att få ett bra resultat. Storleken på områdena som plockas ut från inbilden avgör också hur pass bra resultatet blir. Om området blir för stort försvinner med stor sannolikhet detaljer i bilden. För små områden ger troligtvis mer homogena områden vilket vårt program som sagt inte alltid klarar av. Att läsa in databasen är det som tar mest tid. 100 000 bilder med alla features (CIELAB, W, LBP) tog cirka 35 minuter. Efter förbättringar och optimeringar är nu inläsningstiden förkortas till 14 minuter. Då det är en engångsföreteelse så känns tiden rimlig. Väljer vi bort att beräkna W så halverar vi inläsningstiden för databasen men som vi nämnde ovan hjälper W oss med mättnad och homogena områden. Storleken på databasen spelar stor roll i hur resultatet blir. Databasbilderna ska helst representera så många färger som möjligt för att ett område ska kunna ersättas med en representativ bild. Detta upptäcktes i början när färre bilder användes och resultatet inte blev så bra. 5 Förslag till förbättringar Några förbättringar som skulle kunna göras i projektet är att en databasbild har en begränsning på hur många gånger den får förekomma i en mosaikbild. På detta sätt kan man ta bort upprepningar. Dessa upprepningar är lätta för oss människor att upptäcka och om vi då tar bort dessa så kommer troligtvis bilden att upplevas bättre. En annan förbättring som vore trevlig är att inbilden analyseras i förväg så att områdena som väljs ut och ska ersättas har olika storlek beroende på om inbilden är detaljerad eller inte i just sagda område. På detta sätt kan stora homogena områden ersättas av en större bild medan mer detaljrika områden delas upp i flera mindre. Referenser [1] Beskrivning av metoden Local Binary Pattern. http://www.scholarpedia.org/article/ Local_Binary_Patterns 28 maj 2015 [2] Beskrivning av metoden Principal component analysis. http://en.wikipedia.org/wiki/ Principal_component_analysis 28 maj 2015 4

A Resultatbilder 5