Bildbehandling En introdktion Mediasignaler
Innehåll Grndläggande bildbehandling Foriertransformering Filtrering Spatialdomän Frekvensdomän
Vad är bildbehandling? Förbättring Image enhancement Återställning Image restoration Analys Image analysis
Vad är en digital bild? Ett 2-dimensionellt fält som innehåller värden
Pixel Innehållet i en bild 14 Mpixel = 14 miljoner pixlar 14*3 =42 miljoner värden Gråskala 8 bitar 0 255 Färg 24 bitar 0=svart 255=vit 3*8 bitar 2^24 = 1678 miljoner färger
Färgsystem färgrymder Färgkomponenter Trefärgssystem Lminanskomponenter Gråskala Intensitetskomponenter Färg RGB HSV YCbCr
RGB Röd Grön Blå Motsvarar konerna i det mänskliga ögat Används i kameror tv etc. Vanligaste färgrymden 8 bitars pplösning 2 8 R * 2 8 G * 2 8 B = 2 24 = 167 millioner färger 16 bitars pplösning 2 16 R * 2 16 G * 2 16 B = 2 48 = ~ obegränsat antal färger RGB
CMYK Cyan Ljsblå Magenta Lila Gl Svart Används i t.ex. skrivare Varför svart? En blandning av CMY är inte riktigt svart Det mesta som skrivs t är svart Tre färger kan göra papperet vått CMYK
YUV YCbCr Y är lminans gråskala U och V är färginformation Y = 0.299R + 0.587G + 0.114B U = - 0.147R - 0.289G + 0.436B V = 0.615R - 0.515G - 0.100B Y är mycket viktigare än U & V för det mänskliga ögat Det mänskliga ögat är mera känsligt för förändringar i ljsstyrka än färg Sbsampling av U & V Y Y Y Y U V Y Y Y Y Y Y Y Y U U V V Y Y Y Y U U V V 4:2:0 4:1:1 4:2:2
HSV HSI HSB Färgton He 0-360 Mättnad Satration 0-100% Intensitet Vale 0-100%
Färgblandning Färger genereras genom att blanda grndfärger Röd Grön Blå - RGB Additiv färgblandning Sbtraktiv färgblandning Blandning av små tätt placerade färgelement Bildskärm TV tskrift mm
Photonspektrm
Kombinerat spektra Olika frekvensband ger helt olika bilder av samma objekt Alla frekvensband visas med synligt ljs
Andra typer av energier Ljd Ultraljd 1-5 MHz Medicinska bilder
Närhet adjacency Två pixlar räknas som grannar på olika sätt 4-adjacency 8-adjacency
Avstånd p har koordinaterna x y q har koordinaterna s t Avståndet mellan p och q Eklidiska avståndet det mest natrliga i R2 D e p q = [x-s 2 + y-t 2 ] ½ 2 1 2 1 x 1 2 1 2 D 4 avstånd D 4 p q = x-s + y-t 2 1 2 1 x 1 2 1 2
Avstånd D 8 avstånd - "schackbrädeavstånd D 8 p q = max x-s y-t Alla D 8 -grannar x y har avstånd 1 2 2 2 2 2 2 1 1 1 2 2 1 x 1 2 2 1 1 1 2 2 2 2 2 2 Kvartersavstånd City block distance Antal hs på vägen x 1 2 1 2
Foriertransform Foriertransformen används för att konvertera mellan det spatiala planet och frekvensplanet Foriertransformen är oftast komplex även om originalbilden är reell. F v FReell v FImaginär v
Foriertransform Forier transform Reell del Magnitdmatris Bild Imaginär del Fasmatris
Foriertransform Foriertransformaen innehåller både positiva och negativa frekvenser Den är komplex
Foriertransform Komplexa tal Verklig + imaginär del Polära koordinater Magnitd / spektrm Fasvinkel / fas spektrm Effektspektrm / spektraltäthet Mått av energi j e F F Im Re 2 2 F Re Im tan 1 Im Re 2 2 2 F P
Foriertransform Smalt Brett Brett Smalt
2-D Foriertransform 2-D Foriertransform Separabel i x- and y-riktning dx dy e y x f e dy dx e y x f e dxdy e y x f v F yv j x j x j yv j yv x j 2 2 2 2 2
2-D Diskret Foriertransform 1 0 1 0 / / 2 1 0 1 0 / / 2 1 01 1 01... 1 M x N y N yv M x j M x N y N yv M x j e v F y x f...n- v and M e y x f MN v F
2-D DFT Centrera i mitten mltiplicera bilden med -1 x+y x y f x y 1 F M / 2 v N / 2 F00 hamnar mitt i bilden =M/2+1 v=n/2+1 I MATLAB fftshift efter fft2 Medelvärde Ingen frekvens dvs. ingen ändring 1 F00 MN M 1N 1 x0 y0 f x y
2-D FFT Originalbild Centrerad Foriertransform Ocentrerad Foriertransform
2-D FFT Skalning Addition Shiftning Faltning v af y x af 1 b v a F ab by ax f v G v F y x g y x f / / 2 v F e b y a x f N bv M a j * * v G v F y x g y x f v G v F y x g y x f
2-D FFT Inverstransformering behöver både magnitd och fasmatris Magnitd Fasvinkel Originalbild Invers med bara magnitd Invers med bara fas
Filtrering Spatialdomän Filtrering av pixlar Frekvensdomän Filtrering av frekvenser Kan ha samma effekt Olik effektivitet
Spatial filtrering Operation på pixlar Områden av pixlar 5x5 filterkärna = 25 pixlar Linjära filter Samma effekt på hela bilden Olinjära filter Effekten beror på bilden Adaptiva filter Effekten förändras Bild Yttre förtsättningar
Filterkärnor Varje fält i filtret har ett värde Smman blir 1 För att inte ändra medelvärdet 1 1 1 1 1 1 1 1 1 /9 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 /25 0 1 0 1 1 1 0 1 0 /5
Faltning Filterkärnan faltas med bilden Spegelvänd filtret Bilden kan även speglas Flytta filtret över alla pixlar i bilden Beräkna ett nytt värde för den mittersta pixeln 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 0 1 0
Faltning 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 1 1 1 1 1 1 1 1 1
Faltning 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 5+6+7+4+5+5+3+5+6/9=38/9=4
Faltning 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 4+6+7+6+3+5+5+6+7/9=51/9=567
Faltning 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 3+3+0+8+9+0+0+0+0/9=23/9=256 23/4=575
Linjära filter Lågpassfilter Medelvärdesfilter Gör bilden sddigare Minskar effekten av brs 1 1 1 1 1 1 1 1 1 Högpassfilter Kantdetektering Framhäver brs 0-1 0-1 4-1 0-1 0
Lågpassfilter Alla pixlar i kärnan har lika stort värde Stora förändringar förminskas Små förändringar ändras inte Filterkärnans storlek bestämmer effektens storlek 3x3 5x5
Högpassfilter Vissa filter hittar kanter i en bara en riktning Sobel Prewitt 1 2 1 0 0 0-1 2-1 1 0-1 1 0-1 1 0-1 Andra filter hittar kanter i båda riktningar Laplace 0 1 0 1-4 1 0 1 0 0-2 0-2 8-2 0-2 0
Sobel Prewitt Svart kant 1 2 1 0 0 0-1 2-1 1 0-1 2 0-2 1 0-1
Laplace 0 1 0 1-4 1 0 1 0
Öka skärpan Sharpening 0 0 0 0 1 0 0 0 0 0-1 0 + -1 4-1 = 0-1 0 0-1 0-1 5-1 0-1 0 + =
Olika medelvärdesfilter Aritmetiskt medelvärdesfilter S xy representerar pixlar i en rektanglär del av bilden som har storlek mxn Geometriskt medelvärdesfilter Tenderar att förlora mindre bilddetaljer jämfört med ett aritmetiskt filter fˆ x y 1 mn s t g s t S xy fˆ x y s t S g s t xy 1 mn
Original Med störning Arithmetiskt medelvärdesfilter Geometriskt medelvärdesfilter
Olinjära filter Filter vars svar baseras på pixlarna som finns i området av filtret Medianfilter Max och min filter Mittpnktsfilter Alfa-trimmade medelvärdesfilter
Medianfilter Tom filterkärna Effekten beror på pixlarna i bilden 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 345555667 5
Medianfilter Tom filterkärna Effekten beror på pixlarna i bilden 5 6 7 5 4 6 7 8 4 4 5 5 4 6 3 5 4 5 3 5 6 4 5 6 7 5 4 4 3 2 5 6 7 8 7 8 3 5 5 7 8 7 4 3 3 2 3 3 5 3 3 7 8 9 223333455 3
Medianfilter
Filtrering i frekvensdomänen Dämpa vissa frekvenser Lämna andra oförändrade Mltiplicera med ett filter Elementvis mltiplikation Gv = FvHv Filtrera både reell och imaginär del Ändrar inte fasen
LP- och HP-filter
Idealt lågpassfilter Ta bort alla frekvenser högre än gränsfrekvensen D 0 D v är avståndet från origo i ett centrerat spektrm 0 0 0 1 D v D if D v D if v H 2 2 2 / 2 / N v M v D
Idealt lågpassfilter
Idealt lågpassfilter Tydliga ringningseffekter Faltningsteoremet Filtrering i frekvensdomänen motsvarar faltning med filtrets invers i spatialdomänen
Gassiskt LP-filter Dv=avstånd från mitten Radien σ får vara brytfrekvens D 0 Inversen är också Gassisk inga ringningseffekter 2 2 2 / v D e H 2 0 2 / 2 D v D e H
Gassiskt HP-filter Motsatsen till ett Gassiskt lågpass-filter H 1 e D Inga ringningseffekter 2 v/ 2D 2 0
Dämpa ett visst frekvensområde Lämna resten oförändrat 2 1 2 2 0 2 1 0 0 0 0 W D v D W D v D W D W D v D v H Bandspärrfilter
Ta bort en frekvens Lätt att ta bort vissa frekvenser Exempel: Ta bort den genomsnittliga grånivån Ställ medelvärde till noll F 00 = 0 F M / 2 N / 2 om centrerat H v 0 1 if else v M / 2 N / 2 Notch-filter
Bandspärrfilter
Spatialdomän vs. frekvensdomän Faltning vs. Mltiplikation Stora filter Mltiplikation effektivare än faltning Snabbare mindre operationer mindre energiåtgång Små filter Färre antal operationer i spatialdomänen Frekvenseffekt Omöjligt att skapa i spatialdomänen
Bildkvalité Peak Signal-To-Noise Ratio PSNR Mått på hr lika två bilder är Objektiv Baserad på pixellikhet Mean Sqare Error MSE MSE = 1 MN M i=0 PSNR = 10 log 10 MAX 2 PSNR = 20 log 10 N j=0[or i j Rec i j ] 2 MSE MAX MSE