7 MÖNSTERDETEKTERING

Relevanta dokument
Signal- och bildbehandling TSEA70

Signal- och bildbehandling TSBB03

Signal- och Bildbehandling FÖRELÄSNING 4. Multiplikationsteoremet. Derivatateoremet

Signal- och bildbehandling TSBB14

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

Signal- och Bildbehandling FÖRELÄSNING 7. En bild är en 2D signal. För en digital bild gäller. Fig. 2.1

Spektrala Transformer för Media

Spektrala Transformer för Media

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 11-14, 16/11-28/

Signal- och bildbehandling TSBB03 och TSEA70

Signaler, information & bilder, föreläsning 12

Stora bilden av Linjära algebran. Vektorrum, linjära transformationer, matriser (sammanfattning av begrepp)

Signal- och bildbehandling TSEA70

Bildbehandling i frekvensdomänen

Facit till Signal- och bildbehandling TSBB

Signal- och bildbehandling TSEA70

Stokastiska vektorer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSEA70

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer

Signal- och bildbehandling TSBB03, TSBB14

TATA42: Föreläsning 8 Linjära differentialekvationer av högre ordning

Signal- och bildbehandling TSBB14

TEM Projekt Transformmetoder

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Transformer i sannolikhetsteori

Signal- och bildbehandling TSBB03

TSBB31 Medicinska bilder Föreläsning 3

Tentamen Bildanalys (TDBC30) 5p

Lågpassfiltrering. Signal- och Bildbehandling FÖRELÄSNING 8. Lågpassfiltrering

Kontinuitet och gränsvärden

Bildbehandling, del 1

1 Konvexa optimeringsproblem grundläggande egenskaper

SF1901: Sannolikhetslära och statistik

LINJÄR ALGEBRA II LEKTION 6

Bildbehandling i frekvensdomänen. Erik Vidholm

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Övningshäfte 6: 2. Alla formler är inte oberoende av varandra. Försök att härleda ett par av de formler du fann ur några av de övriga.

Signal- och bildbehandling TSBB14

Matematisk statistik för D, I, Π och Fysiker

Projekt 3: Diskret fouriertransform

Signaler, information & bilder, föreläsning 14

Implementering av digitala filter

1 De fyra fundamentala underrummen till en matris

SF1901 Sannolikhetsteori och statistik I

DT1120 Spektrala transformer för Media Tentamen

1 Positivt definita och positivt semidefinita matriser

Föresläsningsanteckningar Sanno II

Lösningsförslag till tentamen i SF1683 och SF1629 (del 1) 18 december xy = y2 +1

Maclaurins och Taylors formler. Standardutvecklingar (fortsättning), entydighet, numerisk beräkning av vissa uttryck, beräkning

MATEMATIK GU. LLMA60 MATEMATIK FÖR LÄRARE, GYMNASIET Analys, ht Block 5, översikt

Histogramberäkning på en liten bild

DT1130 Spektrala transformer Tentamen

5 GRÅSKALEOPERATIONER

1. (3p) Ett RSA-krypto har parametrarna n = 77 och e = 37. Dekryptera meddelandet 3, dvs bestäm D(3). 60 = = =

Signal- och bildbehandling TSBB03

DT1130 Spektrala transformer Tentamen

Algebraiska egenskaper hos R n i)u + v = v + U

Definitionsmängd, urbild, domän

Egenvärden och egenvektorer

Vectorer, spannet av vektorer, lösningsmängd av ett ekvationssystem.

Bildbehandling En introduktion. Mediasignaler

Föreläsning 1: Signaler, matriser och processer. Leif Sörnmo 28 augusti 2009

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Ht Läsanvisningar till Hilbertrum och partiella differentialekvationer. Del 1. Ur Anton, Rorres; Elementary Linear Algebra

1. För vilka värden på konstanterna a och b är de tre vektorerna (a,b,b), (b,a,b) och (b,b,a) linjärt beroende.

SF1911: Statistik för bioteknik

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 15-18, 30/11-12/

Fingerprint Matching

Ansiktsigenkänning med MATLAB

ANDRAGRADSKURVOR Vi betraktar ekvationen

14 september, Föreläsning 5. Tillämpad linjär algebra

15 september, Föreläsning 5. Tillämpad linjär algebra

SF1901: Sannolikhetslära och statistik

Läsanvisningar till kapitel

Låt vara en reell funktion av en reell variabel med definitionsmängden som är symmetrisk i origo.

Lipschitz-kontinuitet

Tentamen, Programmeringsteknik för BME, F och N

Laboration 1. Grafisk teknik Rastrering. Sasan Gooran (HT 2004)

Institutionen för matematik KTH. Tentamensskrivning, , kl B1119, Vektoranalys, för Open.

Ortogonal dekomposition. Minstakvadratmetoden.

TATA42: Föreläsning 9 Linjära differentialekvationer av ännu högre ordning

Basbyten och linjära avbildningar

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University

MATRISTEORI. Pelle Pettersson MATRISER. En matris är ett rektangulärt schema med tal, reella eller komplexa, vilka kallas matrisens

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Vektorgeometri för gymnasister

Abstrakt algebra för gymnasister

Signaler, information & bilder, föreläsning 16

1 Duala problem vid linjär optimering

Kap Dubbelintegraler.

Kap 2. Sannolikhetsteorins grunder

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

10.4. Linjära höljet LINJÄRA RUM

TNM030 Tentasammanfattning (frågor) Nathalie Ek, Sammanfattning. TNM030 - Bildbehandling och bildanalys

Crash Course Algebra och geometri. Ambjörn Karlsson c januari 2016

Väntevärde och varians

Stokastiska vektorer och multivariat normalfördelning

Transkript:

7 MÖNSTERDETEKTERING 7.1 Korrelation Korrelation av två bilder f(x,y) och g(x,y) kan språkligt sett betyda att man gör just det som utsäges av (7.1). Bilderna läggs alltså på varandra med den ena bilden translaterad. För varje sådan förskjutning utförs dubbelintegralen (7.1). Detta innebär att vi gör som vid faltning. Enda skillnaden är att vi inte viker (roterar) f (eller g)-funktionen utan använder den som den är. Vi betecknar korrelation med faltning med och definierar den därmed enligt f (x, y) g(x, y) f (-x, -y) g(x, y) [ enl. def. av faltning ] variabelbyte f ( x, y) g(, ) dd s x, t y f (s, t) g(s x, t y) dsdt. (7.1) Med diskreta signaler, digitala bilder, får korrelationen följande utseende. f (x, y)g(x, y) f (, ) g(x, y ) (7.2) I motsats till faltning är korrelation inte kommutativ. Genom att byta ordning på f och g i (7.1) gäller i stället att, om h(x, y) f (x, y) g(x, y) så är g(x, y) f (x, y) s x g(s x, t y) f (s, t) dsdt t y f ( x, y) g(, ) dd h( x, y) (7.3) Det kan här vara på sin plats att begrunda hur korrelationen i ekvation (7.2) förhåller sig till begreppen korskorrelation, autokorrelation, korskovarians och kovarians som används i samband med stokastiska signaler. Korskorrelationen och autokorrelation för stokastiska signal definieras enligt Z 1 (m) E[X(n) Y(n m)], (7.4) W 1 (m) E[X(n) X(n m)], (7.5) 109

110 Bildbehandling där E noterar väntevärdet och X(n) och Y(n) är två stokastiska signaler. På liknande sätt definieras korskovarians och kovarians enligt, Z 2 (m) E (X(n) mx ) Y(n m) my, (7.6) W 2 (m) E[(X(n) m x ) (X(n m) m x )], (7.7) där m x och m y är medelvärden av X(n) och Y(n). För att skatta korskorrelation och autokorrelation av en diskret stokastisk signal kan man använda nedanstående formler, z 1 (m) lim N w 1 (m) lim N 1 N1 N n0 1 N1 N n0 x(n) y(n m), (7.8) x(n) x(n m). (7.9) Detta är ekvivalent med beräkning av korskorrelation och autokorrelation för en diskret deterministisk signal. Nedanstående ekvationer är onormaliserade varianter av (7.8) och (7.9), z 1 (m) x(n) y(n m), (7.10) n w 1 (m) x(n) x(n m). (7.11) n Dessa två ekvationer visar hur korrelation och autokorrelation används i kompendiet. Vi använder alltså ordet korrelation istället för korskorrelation. Notera att (7.10) är den endimensionella motsvarigheten till (7.2). 7.2 Korrelation och matchade filter Korrelation (eller om man så vill faltning) är en mycket naturlig och rättfram form av mönsterigenkänning. Antag att vi vill detektera (känna igen, lokalisera, signalera för) förekomsten av ett visst litet mönster a(x,y) i en bild b(x,y), t ex det mönster som visas i Fig. 7.1. På engelska kallas detta template matching. Observera att prototypmönstret (som föreställer bokstaven A) i det generella fallet inte bara är svart/vitt utan har full gråskala. Om vi i bilden b(x,y) har en blandad kompott av gråskalevariationer i vilka vi här och där kan skymta något som liknar mönstret a(x,y) så påstår vi nu att korrelationsbilden c(x, y) (ab)(x, y) a(, ) b(x, y ) (7.12) kommer att uppvisa större positiva maxima där a(x,y) eller snarlika mönster förekommer i b(x,y) än om vi använt någon annan korrelator än a(x,y) med samma energiinnehåll. Orsaken är följande.

Kapitel 7. Mönsterdetektering 111 Fig. 7.1 I de punkter där bilden b(x,y) innehåller mönstret a(x,y) får utbilden c(x,y) maximalt svar om korrelationen utföres med just a(x,y). Sats för Matchat filter. För ett visst mönster a(x,y) ger en normerad korrelator f ett maximalt svar c(0, 0) f (x, y) a(x, y) dxdy för det fall att f matchas till a dvs f (x, y) a(x, y) a Bevis. Eftersom f (x, y) 1 och om vi betraktar korrelationen som en inre produkt mellan vektorer så blir korrelationsvärdet c(0, 0) a f a f a där olikheten gäller för alla fall utom för f a a V. S. V. Det känsligaste filtret för att upptäcka a(x,y) är alltså a(x,y) självt. Normering av filtret är nödvändigt för satsen och beviset, men inte i praktiken. Utan normering får vi i (7.12) en allmän höjning av signalnivån med a i utbilden men med bibehållen kontrast. Korrelationsbilden c(x,y) i (7.12) kan också beräknas via Fouriertransform. Med hjälp av sambandet (7.1) och faltningsteoremet i Tab. 3.1 får vi C(u, v) A * (u, v) B(u, v) (7.13) eftersom för en reell funktion a(x,y) [a( x, y)] konj [[a(x, y)]] Beräkningsgången är därmed identisk med faltningsberäkning i Fourierdomänen. Man kan räkna ut att faltning/korrelation på en 512 x 512 bild kostar 10 milj multiplikationer och 15 milj additioner, förutsatt att Fouriertransformen implementeras med FFT. Faltning/korrelation med en kärna/prototypmönster bestående av n x n pixels utförd i signalplanet skulle kräva n 2 512 x 512 n2 4 106

112 Bildbehandling mult/add-operationer. Detta tyder på att korrelationen med kärnor mindre än ca 7 x 7 pixels lämpligen exekveras i bildplanet och inte i Fourierdomänen. Vi ska nu övergå till att presentera några varianter av matchad filtrering. Motivet för detta framgår tydligt av Fig. 7.2 där originalbilden b är den välkända testbilden och det sökta mönstret a helt enkelt den centrala delen av denna. I Fig. 7.2 b) visas resultatet av vanlig matchad filtrering och vi hade måhända väntat oss att finna ett markant utslag i centrum. Avsaknaden av detta beror på att varje region av inbilden b som har hög signalstyrka kan ge starkt utslag även om dess mönster inte särskilt väl överensstämmer med a. Detta inträffar särskilt ofta för vanliga, unipolära bilder (med enbart positiva pixelvärden).

Kapitel 7. Mönsterdetektering 113 g) Fig. 7.2 Korrelationsexperiment. I samtliga bilder visas negativa pixelvärden som 0=svart. a) Ingångsbild b(x,y). b) Sökt mönster a(x,y). c) Resultat från matchat filter 1 [A B], dvs vanlig korrelation. Observera den oönskade korrelationen från ljusa områden i bilden f(x,y) d) Normerad korrelation. e) Korrelation utan lokal DCnivå. f) Fasfilter 1 A B B. Här syns korrelationsspiken som en vit punkt i origo. g) Symmetriskt fasfilter.

114 Bildbehandling De varianter av matchad filtrering vi ska presentera nedan är normerad korrelation, matchning utan DC-komponent, samt olika typer av fasfilter. Normerad korrelation Givet mönstret a och bilden b utföres följande beräkning för att få fram resultatet a n (x, y), [a b](x, y) a n (x, y) a(x, y) b(x, y) omgivn a(, ) b(x, y ),, a 2 (, ),omgivn b 2 (x, y ) (7.14) Här normerar man alltså bl a med bildens värde över aktuell omgivning, b(x, y) omgivn. Normerad korrelation ger ett lite bättre resultat än vanlig korrelation. I enlighet med vad som sagts tidigare behöver man egentligen inte normera med korrelationskärnan, a(x, y), detta ger ju bara allmän förändring av signalnivån i utbilden medan kontrasten bibehålls. Normerad korrelation fungerar hyggligt i enkla fall, t ex när man vill känna igen olika bokstäver i tryckt text. Matchning utan DC-komponent Givet mönstret a och bilden b utföres följande beräkning för att få fram resultatet d(x,y). d(x, y) [a(, ) a ] [b(x, y ) b ] (7.15) [a(, ) a ] b(x, y ) Som synes har vi först subtraherat både korrelationskärnan a och bilden b med respektive medelvärden a och b, där b är det lokala medelvärdet över aktuell omgivning. Därmed uppträder såväl positiva som negativa termer i korrelationssummeringen. Resultatet visas i Fig. 7.2 c). Beräkningsarbetet ökar marginellt jämfört med den förenklade beräkningsformeln i (7.12). Faktorerna a i skall modifieras med medelvärdet över korrelations/faltningskärnan a vilket görs en gång för alla. Motsvarande modifiering av pixelvärdena b i behövs inte (varför?). Vi får höga värden i svarssignalen d där variationen i b överensstämmer med a, medan d 0 där b saknar variation.