Grundläggande 1D och 2D Signalbehandling för Bilder Baserat på ett äldre kompendium av Per-Erik Danielsson

Grndläggande D och D Signalbehandling för Bilder Baserat på ett äldre kompendim av Per-Erik Danielsson Maria Magnsson Avdelningen för datorseende Instittionen för systemteknik Linköpings niversitet Linköping, September 3 Department of Electrical Engineering Linköping University SE-58 83 Linköping, Sweden Instittionen för systemteknik Linköpings niversitet 58 83 Linköping

Innehåll Introdktion till Bildbehandling 3. Signalbehandling och digitala bilder...... 3. Enmodellförbildanalys... 4.3 Datorseende... 5.4 Bildkodning... 5.5 Maskinvaraförbildbehandling... 6.6 Bildgenerering... 6 Endimensionell signalbehandling 9. Kontinerligforiertransform.... Dirac-fnktionen... 6.3 Linjärt tidsinvariant system, implssvar och faltning... 6.4 Teoremförforiertransform... 7.5 Sampling och rekonstrktion....6 Fönstring... 3.7 Tidsdiskretforiertransform(TDFT)... 4.8 Diskret foriertransform (DFT) och cirklär faltning... 4.9 Från kontinerlig till diskret foriertransform (DFT)... 5. Diskret faltning och faltningskärnor...... 7 3 Tvådimensionell signalbehandling 33 3. Dforiertransform... 33 3. Dsampling... 37 3.3 DDFT... 4 3.4 Samband:sampladkontinerligochsampladdiskretbild... 4 3.5 D-sambandförseparablafnktioner... 4 3.6 D-samband för rotationssymmetriska fnktioner... 43 3.7 D faltning och D faltningskärnor... 43 3.8 D faltningskärnor för lågpassfiltrering..... 46 3.9 Faltningkärnor för derivering... 49 3. Normalisering av faltningskärnor... 56 4 Omsampling av bilder 57 4. Translation och förstoring (ppsampling)... 57 4. Rotation... 64 4.3 Förminskning (nedsampling)... 65 Litteratrförteckning 69

Tack Detta kompendim är baserat på ett äldre kompendim av Per-Erik Danielsson. Även andra personer har arbetat med kompendiet nder årens lopp, såsom Karin Wall, Ingemar Ragnemalm, Olle Seger, samt jag själv, Maria Magnsson. Under sommaren överförde Kamalaker Reddy Dadi tet och ekvationer till L A TEX.

Kapitel Introdktion till Bildbehandling. Signalbehandling och digitala bilder En en-dimensionell signal är en fnktion som endast endast beror av en variabel. Ett eempel på detta är sinsvågen (t) =sin(t). (.) På liknande sätt är en n-dimensionell signal en fnktion som beror av n st oberoende variabler. Ett eempel på en två-dimensionell signal är f(, y) =sin( y) +. (.) Inom signalbehandlingen begränsar man sig ofta till en-dimensionella signaler med tiden t som variabel. Två-dimensionell signalbehandling kallas ofta bildbehandling. Det vi i dagligt tal menar med en bild är j en två-dimensionell fnktion. De oberoende variablerna betecknas ofta med och y och betraktas som spatiala (rms-) koordinater. Den två-dimensionella signalen f(, y) i (.) kan illstreras med Fig.. nedan, där f(, y) = avbildas på svart, f(, y) = avbildas på vitt och övriga värden på f(, y) med proportionella gråskalevärden. Det bör också nämnas att disciplinen bildbehandling också sysslar med mång-dimensionella bilder. Så behandlas t e bildsekvenser där tiden t är den tredje variabeln, och bildvolymer där (, y, z) ärett vanligt sätt att beteckna de tre rms-koordinaterna. Generaliseringen från en-dimensionell till fler-dimensionell signalbehandling är i långa stycken rättfram och relativt självklar. Oavsett detta bör tvidgningen till två dimensioner göras och noteras. Till detta kommer att effekter och samband eisterar för två-dimensionella signaler som helt saknar motsvarighet i en-dimensionell signalbehandling. Ett sådant fall är rotation. En digital bild f D (i, j) är en två-dimensionell array med bildpnkter. En bildpnkt brkar kallas piel (pictre element). Antalet pilar tgör bildens storlek. En vanligt storlek är 5 5 = 8 = y.5.5 Figr.. Gråskalebild enligt (.). 3

4 Introdktion till Bildbehandling segmentering binära operationer gråskalefiltrering tröskelsättning etikettering egenskapsetrahering klassifisering digitalkamera gråskalebild binär bild resltat informationsredktion Figr.. En bildanalysmodell. /4 Mpiel. Oftast kvantiseras pielvärdet så att ett ändligt antal gråskalevärden kan representeras. Åtta bitar ger t e 56 gråskalenivåer vilket gör att minnestrymmet för den ovan nämnda bilden blir /4 Mbyte. I en digital bild är alltså de två spatiala koordinaterna i och j diskretiserade och amplitden f D (i, j) äroftakvantiserad. En digital bild f D (i, j) representerar oftast en fysikalisk bild eller en kontinerlig två-dimensionell signal f(, y). En översättning mellan dem kan vara ( f D (i, j) =f D + 57, y ) 55, f(, y)/k 55, + 57 =, f(, y)/k, (.3) rond [55f(, y)/k], annars, där i 5 och j 5, dvs bildstorleken är 5 5, k är en konstant, är samplingsavståndet och amplitden f D (i, j) är kvantiserad i 56 nivåer från till 55. Om bilden sedan ska visas på en dataskärm, måste de 56 olika nivåerna omvandlas till olika färger eller gråskalevärden. Detta görs via en så kallad färgtabell. Den vanligaste gråskalefärgtabellen avbildar värdet på svart, värdet 55 på vitt och mellanliggande värden proportionellt på olika gråtoner. Nmera blir det mer och mer vanligt att fler än 8 bitar används för att lagra varje pielvärde. I MATLAB t e, lagras pilarna oftast i flyttalsformat med dbbel precision, 64 bitar, vilket gör att minnesåtgången för att lagra en bild ökar med en faktor 8. Då bilden ska visas på dataskärmen måste dock flyttalsvärdena först omvandlas till heltalsvärden mellan och 55 (typiska värden) som via färgtabellen konverteras till de färger eller gråtoner som ska visas på skärmen. Enligt ekvation (.3) kan den digitala bilden knytas till den bakomliggande kontinerliga signalen. Samplingsteoremet ger oss vägledning att bedöma om omvändningen också är möjlig, dvs om den bakomliggande kontinerliga signalen kan erhållas r den digitala bilden. Inom bildbehandlingen arbetar vi med kontinerliga och diskreta linjära filter. Linjära filter definieras och konstreras antingen i rmsdomänen eller i frekvensdomänen för att ppfylla speciella kriterier för brsndertryckning, kantdetektering, linjedetektering, ndertryckande av höga frekvenser eller låga frekvenser eller för framhävande av vissa frekvensband. Efter att ha definierat ett filter så kan den egentliga filtreringen tföras antingen i rmsdomänen såsom faltning eller i frekvensdomänen genom att använda diskret foriertransform DFT och mltiplikation. En minskning av skärpan i bilden (smoothing), kan sålnda göras med en lokalt viktad medelvärdesbildning. Detta är då ett linjärt filter som definieras med hjälp av ett antal viktskoefficienter i rmsdomänen och som tföres genom faltning. Men filtret kan också beskrivas i termer av frekvens och är då ett lågpassfilter.. En modell för bildanalys Fig.. visar en enkel modell för bildanalys som innehåller flera olika bildbehandlingsoperationer. Från vänster till höger finner vi först en digital-kamera som med hjälp av optik tar in en bild av en 3D-scen, samplar och digitaliserar en bild. Här sker en oerhörd dataredktion. Natrens stokastiska processer har sitt rsprng på atomär nivå och detta gigantiska informationsflöde kan vi endast registrera delvis. Nästa steg är gråskale-filtrering. Det är vanligt att de första stegen i en typisk bildbehandlingssekvens jst består av linjär filtrering. Erfarenheten har emellertid visat att mycket få problem kan

.3 Datorseende 5 lösas med enbart linjär filtrering. I högre grad än för traditionell signalbehandling gäller att bildbehandling tycks erfordra icke-linjära filtreringar och transformationer. Olinjär filtrering innebär att en tgångspiel inte längre kan ttryckas som en linjär viktad smma av ingångspiel. Olinjära filter kan inte heller definieras i frekvensdomänen. En vanlig olinjär filtreringsoperation är att prodcera medianen (inte medelvärdet) av en omgivning av bildpnkter hos ingångsbilden. En speciell form av olinjär operation är tröskelsättning, dvs översättningen av en flernivåbild till en två-nivåers binär bild på så sätt att varje piel i gråskalebilden jämförs med en tröskel. Efter tröskelsättningen har pilarna endast två olika värden, och, där betyder bakgrnd och betyder objektpnkt. Ett antal sammanhängade objektpnkter tgör ett objekt. På denna binära bild kan man n tföra binära operationer. Det finns många olika varianter, varav en är att fylla igen hål i objekt. Vid etiketteringen tilldelas pilarna i de olika objekten olika etiketter så att man ska knna skilja dem åt. Att rskilja och etikettera ett antal objekt från bakgrnden kallas segmentering. Det finns även andra metoder för segmentering än tröskelsättning - binärfiltrering - etikettering som visas i figren. I nästa steg kan det bli aktellt att för ett visst segmenterat objekt ta fram mätvärden av typ medelintensitet, tetr etc. Egenskapsetraktionen reslterar i en serie mätvärden för varje objekt i bilden. Vilka mätvärden (featres) som man bör räkna fram r bilden är synnerligen tillämpningsberoende, men som eempel kan vi nämna storlek (area), form (kan definieras på många sätt), färg, orientering, medelintensitet, granlaritet, position dvs (, y)-lägen i bilden, närmsta avstånd till annat objekt, etc. Allt detta samlas i en egenskapslista. Resltatet efter dataetraktionen är inte längre en bild tan en lista. Flera algoritmer har tvecklats för segmentering och egenskapsetraktion. Notera att den rsprngliga digitala bilden, liksom prodcerade mellanresltat inte behöver kastas bort nder segmentering och egenskapsetraktion. I det sista steget användes egenskapslistan för att klassificera, dvs artbestämma, känna igen, avgöra vilken sort ett objekt tillhör. I vissa tillämpningar kan det vara hela bilden eller scenen som skall klassas. I ganska många fall, t e indstriell avsyning, screening av medicinska preparat, finns bara två möjliga svar; godkänd/icke godkänd, cancer/icke cancer. Oftast bör man införa en tredje klass, vet ej, dvs ndvika beslt i vissa fall, vilket komplicerar klassningsalgoritmerna. I många fall är det emellertid mycket vnnit att göra ett binärt beslt med innebörden godkänd/tveksam. Om det godkända fallen blir avsevärt flera än de tveksamma är atomatiseringen meningsfll även om de tveksamma måste lämnas till icke-atomatiserad eftergranskning. Klassificering eller mönsterigenkänning, som det också kallas, är en väl tvecklad disciplin som av tradition baseras på matematiskt-statistiska metoder. En viktig och teoretiskt intressant aspekt på klassificering- och igenkänningsalgoritmer är möjligheten att träna fram ett optimalt beteende (besltsfattande). Användning av neronnät har i hög tsträckning handlat om att ppnå läraktighet i denna mening. Detta kompendim behandlar inte klassificering vidare..3 Datorseende Datorseende kan sägas innefatta allt om grndläggande bildbehandling, men tökat med 3D-geometri, kamerakalibrering och objektigenkänning. En pågående trend är att koppla samman datorseende med området maskininlärning. Då skapar man system som analyserar och lär sig från bilder. Dessa förvärvade knskaper tnyttjas sedan för att lösa nya ppgifter..4 Bildkodning I samband med bildbehandling bör några ord sägas om området bildkodning. Det praktiska målet för kodning är att komprimera data så att bilden kan lagras och överföras mera effektivt. Många bilder är i själva verket högeligen redndanta; ofta kan datamängden redceras (komprimeras) med en faktor. Ett typiskt eempel är ett dokment, dvs en svart-vit binär bild, som ofta innehåller ganska stora areor av tomma vita ytor. I stället för att spendera en bit på varje bildpnkt så kan man prodcera en kodad version på så sätt att varje linje innehåller de -lägen där bildens värde välar från svart till vitt eller tvärtom. Änn bättre är måhända att endast registrera avstånden mellan två sådana omslag i bildpnktsvärdet vilket kallas rn-length-coding. En kodares prestanda mäts i form av komprimeringsfaktorn för en given maimal distorsion, dvs den tillåtna differensen mellan originalet och den rekonstrerade, den avkodade bilden. Under arbetet med att finna den viktiga informationen i en bild och ndertrycka den icke viktiga så kommer bildkodning att använda liknande filter och filtreringsmetoder som de som används i bildbehandling. Ovanstående indikerar att lågnivåbildbehandling och bildkodning ofta är identiska vad gäller både

6 Introdktion till Bildbehandling mål och metoder. En skillnad kan dock vara att bildkodning normalt avser att hantera alla slags bilder medan bildbehandling/bildanalys vanligtvis avstämmes till en speciell applikation där endast en mycket begränsad typ av bilder kan förekomma..5 Maskinvara för bildbehandling Maskinvara för bildbehandling är vanligtvis men inte alltid åtskild från det bildgenererande organet. För de följande diskssionerna antar vi emellertid att bilden har prodcerats och digitaliserats. En frktbar diskssion kräver ytterligare några distinktioner, nämligen mellan lågnivåbildbehandling - högnivåbildbehandling speciell maskinvara - generell maskinvara trstning för sltanvändare - trstning för tveckling och forskning Eftersom så stor del av lågnivåbildbehandling tycks bestå av likformiga och ganska enkla operationssteg, t e omgivningsoperationer, har denna del av bildbehandlingstekniken varit ett speciellt mål för ny datorarkitektr, t e parallella processorer i olika variationer och organisationsformer. Det bör nderstrykas att bildbehandlingstillämpningar (om de är lyckosamma) rör sig gradvis från eperimenterande med en algoritm eller metod på ett fåtal bilder över programkörningar över ett större material för att till slt bli mera prodktiva eekveringar för sltanvändaren. Hastighetskravet finns här hela tiden. Försök och misstag är typiska i de första stegen av procedren där användaren vill ha snabbt svar för att knna tvärdera sin egen tankegång. Redan på detta stadim kan algoritm innebära ganska krävande beräkningar. Behovet av snabbhet vid mera prodktiva körningar är självklart. Hastighetskravet kommer att öka i framtida tillämpningar. Sant tredimensionella bilder, volymer, prodceras av många nya bildgenererande organ. Nya satelliter kommer att förse oss med en aldrig sinande ström av bilder av långt högre pplösning än vad vi har idag. Desstom kommer användning av generella metoder för datorseende att öka snarare än minska behovet av beräkningskraft för att processa en viss bild. Detta gör att trots att datorerna hela tiden blir snabbare och snabbare så är det ändå viktigt att bildbehandlingsoperationerna implementeras effektivt. Det är därför som vi i kompendiet ibland kommer med förslag på hr de olika algoritmerna ska knna implementeras på ett effektivt sätt..6 Bildgenerering Med bildgenerering (engelska: Imaging) menar vi här skapandet, genererandet av bilder. Detta är alltså en lätt avvikelse från hvdområdet bildbehandling. Emellertid vill vi betona att bildbehandling i nästan alla tillämpningar är starkt kopplad till den process som genererar själva bilden. Desstom anser vi att det är lämpligt att här peka på de enastående framsteg som har ägt rm inom detta område. En tänkbar indelning av bildgenererande organ och teknologi sklle knna vara följande: ) Bildgenerering med elektromagnetisk strålning röntgenkristallografi medicinsk och indstriell röntgen röntgendatortomografi (engelska: Compter Tomography (CT)) gamma-kamera SPECT (Single Photon Emission CT) optik och optiska sensorer av alla slag CCD- och CMOS-sensorer, fotomltiplikatorer laserscanners för djpmätning mikroskop, teleskop bildsensorer i satelliter

.6 Bildgenerering 7 IR-sensorer och IR-kameror mikrovågsdetektorer och antenn syntetisk apertrradar, radioastronomi MRI (Magnetic Resonance Imaging) ) Bildgenerering med partikelstråle transmissionselektronmikroskopi (engelska: transmission electron microscopy (TEM)) svepelektronmikroskopi (engelska: scanning electron microscopy (SEM)) positronkamera (engelska: positron emission tomography (PET)) bildgenerering inom kärnfysikalisk forskning 3) Bildgenerering med ltraljd vilket inklderar ett stort antal olika varianter, mestadels för medicinskt brk. Praktiskt taget alla dessa olika tekniker är i ett tillstånd av mycket snabb tveckling. Även det väl tvecklade området ljsmikroskopi ändrar sig snabbt nder trycket av eventellt datoriserad bildbehandling. Datorstyrda mikroskopbord, atomatisk foksering, tvåkamera-system för hög och låg pplösning, zoomningsmöjligheter, laserscanningteknik, konfokala system är några metoder som kan adderas till äldre av typen ljsfält, mörkfält, faskontrast, florocens etc.

Kapitel Endimensionell signalbehandling Idag sker signalbehandlingen i elektrisk apparatr hvdsakligen digitalt. Digitala signaler är samplade, vilket innebär att man läser av signalvärden på en kontinerlig signal med ett visst tidsmellanrm. Man måste också kvantisera signalens amplitd, vilket ger en tids- och amplitddiskret signal. En sådan signal kallas digital, medan en signal som är tids- och amplitdkontinerlig kallas analog. Mobiltelefoner, i stor tsträckning vanlig telefoni, CD- och DVD-skivor, ljdspelare och olika styrsystem är eempel på tillämpningar som använder sig av digitala signaler. Det är ofta tveckling av billiga och små digitala enheter som möjliggör en övergång från analog till digital teknik. Trots att mycket av den signalbehandling som tförs idag sker digitalt på digitala signaler, så kan man inte bortse från den bakomliggande kontinerliga signalen. I telefoni och ljdanläggningar eempelvis, är det nödvändigt att återskapa den analoga signalen r den digitala versionen. Den analoga elektriska signalen skickas till en högtalare där den omvandlas till ljd så att vi människor kan höra den. Vi kommer längre fram i kompendiet, när vi stderar sampling, se att det finns en mycket stark koppling mellan den bakomliggande kontinerliga signalen och den diskreta samplade versionen. Detta kapitel ger en kortfattad genomgång av teorin kring D signalbehandling. För den läsare som vill fördjpa sig i området rekommenderas böckerna [], [], [6], [9], [] och [] av Bracewell, Cha, Oppenheim, Söderkvist och Svärdström. 9

Endimensionell signalbehandling. Kontinerlig foriertransform Den en-dimensionella foriertransformen av en signal g(t) definieras och dess invers är G(ω) = g(t) = π g(t)e jωt dt (.) G(ω)e jωt dω (.) Det är vanligt att man betecknar foriertransformen av en fnktion med samma bokstav som fnktionen, fast man använder stor bokstav. Ekvation (.) ovan är en fnktion av vinkelfrekvensen ω. Om man tför variabelbytet ω = πf så fås följande alternativa matematiska beskrivning av foriertransformen och dess invers, G(f) = g(t) = g(t)e jπft dt, (.3) G(f)e jπft df. (.4) Ibland betecknas foriertransformen G(f) = F[g(t)] och den inversa foriertransformen på motsvarande sätt g(t) =F [G(f)]. Alla signaler som eisterar i natren och som vi kan mäta är reella. För en reell fnktion g(t) kan man visa att dess foriertransform G(f) är hermitisk, dvs G(f) =G ( f). (.5) Fnktionerna G(f) och G( f) är alltså varandras konjgat. Detta kan också ttryckas som ReG(f) =ReG( f), (.6) ImG(f) = ImG( f). (.7) ReG(f) är alltså en jämn fnktion och ImG(f) är en dda fnktion. Eftersom G(f) är en komple fnktion kan den skrivas på polär form där kallas för signalens amplitdspektrm och G(f) =A(f)e jφ(f), (.8) A(f) = G(f) (.9) Φ(f) =argg(f) (.) kallas för signalens fasspektrm. Kvantiteten G(f) kallas för signalens effekt- eller energispektrm. I Fig.. visas den reella signalen g(t) = Π((t )/), dess foriertransform med realdelen ReG(f) och imaginärdelen ImG(f). Vidare visas amplitdspektrm A(f) = G(f) och fasspektrm Φ(f). En god hjälp för att intitivt förstå foriertransformen är korrespondensen mellan egenskaperna jämn/dda respektive reell/imaginär i signal- och forierdomänerna. De flesta av dessa korrespondenser blir ppenbara om vi skriver fnktionen g(t) =e(t)+o(t), där e(t) är en jämn (even) fnktion och o(t) är en dda (odd) fnktion, e(t) =/[g(t)+g( t)], o(t) =/[g(t) g( t)].

. Kontinerlig foriertransform.5 g(t).5.5 Re G(f).5 5 5.5 Im G(f).5.5.5.5.5.5.5 A(f) = G(f) 3 Φ(f) = arg G(f).5.5.5 3 Figr.. Signalen g(t) = Π((t )/), dess foriertransform ReG(f) + jimg(f), amplitdspektrm A(f) = G(f) och fasspektrm Φ(f) = arg G(f). En jämn fnktion e(t) består av enbart cosinskomponenter, en dda fnktion o(t) av enbart sinskomponenter. Av detta följer att foriertransformen kan skrivas G(f) = e(t) cos(πft) dt j o(t) sin(πft) dt. (.) Om ovanstående resltat (.) kombineras med det faktm att foriertransformen av en reell fnktion är en hermitisk fnktion (.5) fås de viktiga observationerna foriertransformen av en jämn, reell fnktion är jämn och reell och foriertransformen av en dda, reell fnktion är dda och imaginär. Dessa resltat m fl är illstrerade i Fig... I Fig..3 och Fig..4 visar vi ett antal forierpar för några vanligt förekommande fnktioner. Implståget definieras enligt ( ) t + T III = δ(t nt ). (.) T n= där δ() är den så kallade dirac-implsen (se nedan). För implstågets foriertransform gäller F [ ( )] t T III = III(fT)= T T k= ( δ f k ) T (.3)

Endimensionell signalbehandling Rektangelfnktionen har definitionen, t >, Π(t) = (, t = ) (.4), t <. Triangel-fnktionen har definitionen Λ(t) = { t, t,, t >. (.5) Signm-fnktionen har definitionen sgn(t) = {, t <,, t >. (.6) Sinc-fnktionen har definitionen sinc(t) = sin(πt). (.7) πt Jämna impls-paret har definitionen II(t) = ( δ t + ) + ( δ t ) (.8) och dda impls-paret har definitionen I I (t) = ( δ t + ) ( δ t ). (.9) Några allmänna observationer är följande: Diskontiniteter i en fnktion och/eller dess derivator ger långsam avklingning till av transformen för f. Mera eakt gäller att om n:te derivatan (fnktionen själv räknas som :te derivatan) är diskontinerlig så avtar G(f) somo ( f (n+)). Liten tbredning i den ena domänen ger stor tbredning i den andra. Ett litet antal fnktioner har samma principiella tseende i båda domänerna, däribland den Gassiska e t och implståget (/T )III(t/T ).

. Kontinerlig foriertransform 3 Figr.. Forierpar för jämna och dda fnktioner (efter Bracewell).

4 Endimensionell signalbehandling Figr.3. Forierpar (efter Bracewell).

. Kontinerlig foriertransform 5 Figr.4. Fortsättning av forierpar (efter Bracewell).

6 Endimensionell signalbehandling. Dirac-fnktionen Dirac-fnktionen eller dirac-implsen är en mycket användbar fnktion inom såväl signal- som bildbehandlingen. För dirac-fnktionen δ(t) gäller följande två ekvationer, δ(t) =, t, (.) δ(t) dt =. (.) Dirac-fnktionen kan beskrivas med gränsvärdet ( ) t T Π δ(t) då T, (.) T där Π definierades i (.4). Det finns en mängd andra gränsvärden som också går bra, t e denna sekvens av gass-fnktioner T ep( πt /T ) δ(t) då T. (.3) Formen på plsen med vilken vi definierar dirac-fnktionen har alltså inte någon betydelse. Fnktionerna (/T )Π(t/T )ochδ(t) är skisserade i Fig..5. Man brkar rita δ(t) som en pil där pilens höjd motsvarar dirac-implsens integral. Dirac-fnktioner eisterar inte i natren, men en tillräckligt kort och stark pls kan ofta modelleras med en dirac-fnktion. (/T) Π(t/T) /T δ (t) T t t Figr.5. Rektangelplsen (/T )Π(t/T ) och dirac-fnktionen δ(t) illstrerade. En viktig räkneregel som gäller för dirac-fnktionen är δ(at) = δ(t), (.4) a där a är en konstant och a. Ovanstående samband inses genom att både HL och VL är för t samt att integralen över HL respektive VL är lika med värdet / a, vilket inses via (.)..3 Linjärt tidsinvariant system, implssvar och faltning Fig..6 illstrerar innebörden av begreppet system. Då systemet påverkas av en insignal (t) genererar det tsignalen y(t). Insignal (t) System Utsignal y(t) Figr.6. Ett system som påverkas av en insignal (t) genererar en tsignal y(t). Signaler och system är alltså mycket nära kntna till varandra. Ett vanligt sätt att karaktärisera ett system är genom att ange dess implssvar. Låt en dirac-fnktion vara insignal till ett system. Utsignalen kommer då att vara systemets implssvar, vilket ofta anges h(t). Det är vanligt att skriva h(t) på rektangeln som betecknar systemet, se Fig..7. För ett linjärt tidsinvariant system (LTI-system) gäller följande egenskaper:

.4 Teorem för foriertransform 7 Linjäritet Antag att insignalerna (t)och (t) ger tsignalerna y (t)ochy (t). Om då insignalen A (t)+b (t) ger tsignalen A y (t)+b y (t) så är systemet linjärt. Tidsinvarians Antag att insignalen (t) ger tsignalen y(t). Om då insignalen (t + T ) ger tsignalen y(t + T )är systemet tidsinvariant. a) δ(t) h(t) h(t) b) (t) h(t) y(t) Figr.7. Implssvaret h(t) illstrerat. Om implssvaret h(t) är känt för ett linjärt tidsinvariant system så kan tsignalen y(t) beräknas för en godtycklig kontinerlig insignal (t) genom faltning enligt formeln y(t) =( h)(t) =(t) h(t) = (τ)h(t τ)dτ. (.5) Följdaktligen gäller att faltning med med dirac-fnktion inte påverkar originalfnktionen, dvs δ(t) h(t) = δ(τ)h(t τ)dτ = h(t). (.6) För faltning använder vi oftast skrivsättet y(t) =( h)(t) för att poängtera att faltning inte är en pnktvis operation som t e mltiplikation av två fnktioner. Ibland kan det dock vara praktiskt att i stället skriva y(t) = (t) h(t). Genom ett enkelt variabelbyte kan faltningsintegralen i (.5) skrivas om till y(t) =(h )(t) =h(t) (t) = (t τ)h(τ)dτ, (.7) vilket ibland kan vara ett fördelaktigare skrivsätt. Faltning är alltså en kommtativ operation. Faltning enligt (.7) illstreras i Fig..8. Den vikta versionen av signalen förskjts över signalen h. I varje läge beräknas integralen av prodkten, vilkens resltat avsätts på platsen för markören. Markören följer med förskjtningen av (t τ) och genomlöper därmed alla resltat-signalens positioner. Det är viktigt att känna till vad som händer då en fnktion faltas med en förskjten dirac-fnction. Det gäller att δ(t a) (t) =(t a) (.8) vilket kan formleras som Vid faltning mellan en förskjten dirac-impls och en fnktion, flyttas fnktionen till dirac-implsens läge. Sambandet är också illstrerat i Fig..9..4 Teorem för foriertransform För foriertransformen gäller ett antal grndläggande teorem som vi härmed rekapitlerar tan bevis. Vi nderförstår att F[g(t)] = G(f). Fnktionen står till vänster om dbbelpilen och foriertransformen till höger i teoremen nedan.

8 Endimensionell signalbehandling ( τ) h( τ) y(t)=(*h)(t) τ t τ t t (t τ) t τ Figr.8. Faltning av kontinerliga signaler. (t) t (t a) δ(t a) a t a t Figr.9. Vid faltning mellan en förskjten dirac-impls och en fnktion, flyttas fnktionen till dirac-implsens läge. Skalningsteoremet g(at) ( ) f a G (.9) a Vi noterar alltså att om fnktionen g(t) komprimeras tefter t-aeln med ökande a i signaldomänen så breddas foriertransformen. Faktorn / a är nödvändig som skalfaktor för bevarande av energin (se Rayleigh s teorem nedan). Linjäritetsteoremet a g (t)+b g (t) a G (f)+b G (f) (.3) Translationsteoremet g(t a) e jπaf G(f) (.3) Vid translation i signaldomänen förändras alltså inte amplitden G(f) av en viss frekvenskomponent, tan endast fasläget, dvs förhållandet mellan real - och imaginärdel. Faltningsteoremet (g g )(t) G (f) G (f) (.3)

.4 Teorem för foriertransform 9 Mltiplikationsteoremet (g g )(t) G (f) G (f) (.33) Modlationsteoremet g(t) cos(πf t) G (f f )+ G (f + f ) (.34) Korrelation g g (t) =g (t) g ( t) G (f) G (f) (.35) Korrelation, betecknad med, är detsamma som faltning tan vikning, dvs om g (t) ochg (t) är reella gäller att g g (t) =g ( t) g (t). Om fnktionerna är komplea tillkommer konjgering. Atokorrelation g g(t) =g(t) g ( t) G (f) G(f) = G(f) (.36) Atokorrelationen är en fnktions korrelation med sig själv. Atokorrelationens foriertransform är alltså fnktionens effekt- eller energispektrm. Derivatateoremet d dt [g(t)] = g (t) jπf G(f) (.37) Eftersom F[g(t)] = G(f) kan vi helt enkelt skriva d jπf. (.38) dt Derivering av faltning d dt (g g )(t) =(g g )(t) =(g g )(t) (.39) Detta inses lättast genom att observera att deriveringsoperatorn är en fnktion som enligt närmast föregående teorem har foriertransformen jπf. Ur signalbehandlingssynpnkt är deriveringsoperationen en faltning. Uttrycket ovan är alltså liktydigt med tre fnktioner faltade med varandra. Ordningsföljden är likgiltig eftersom faltning är en kommtativ operation. Att derivering är faltning kan inte nog nderstrykas. Ekvation (.39) sklle alltså knna skrivas d dt g g = dg dt g = g dg dt. Parsevals teorem (Effektteoremet) g (t) g (t)dt = G (f) G (f) df (.4) Detta kan skrivas g (t) g ( t)dt = G (f) G (f) df (.4) om g (t) är reell. Om vi låter t vara tid, g (t) ochg (t) ström respektive spänning så tsäger teoremet att den elektriska medeleffekten kan beräknas som smman av ström spänning för varje frekvens.

Endimensionell signalbehandling Specialfall av Parsevals teorem (Rayleigh s teorem) g(t) dt = G(f) df (.4) Om g och g sättes lika i Parsevals teorem enligt (.4) ovan fås detta specialfall som ibland brkar kallas Rayleigh s teorem. Teoremet tsäger att den totala energin är densamma i signaldomän och forierdomän..5 Sampling och rekonstrktion En samplad signal s(t) är en fnktion som är endast i ett antal ekvidistanta pnkter på t-aeln. Den representerar den kontinerliga signalen g(t) genom att { g(t) δ(t nt ), för t = nt, n =...,,,,,... s(t) = för t nt. Fnktionen g(t) är alltså den bakomliggande kontinerliga signalen som vi samplat (läst av, registrerat, detekterat) med intervallet T tefter t-aeln. Den samplade signalen kan ses som prodkten av g(t), /T och implståget. Uttrycket för den samplade signalen blir därmed s(t) =g(t) ( ) t T III = g(t) δ (t nt ), (.43) T n= vilket kan illstreras som i Fig.. a) och till i Fig... Denna definition skiljer sig från en annan ganska vanlig definition av sampling som illstreras i Fig.. b) och Fig.. där g D (n) =g(t) t=nt = g(nt ), n =...,,,,,... (.44) a) b) g(t) s(t) T III ( ) t T g(t) t = nt g (n) D Figr.. a) Modell av sampling. b) Alternativ modell av sampling. I fortsättningen kallar vi g D (n) för den diskreta representationen av g(t). Den samplade signalen s(t) och den diskreta signalen g D (n) skiljer sig i två avseenden s(t) är definierad tefter hela t-aeln medan g D (n) bara är definierad i ett antal ekvidistanta pnkter, n =...,,,,,,... I dessa pnkter gäller att s(t) =g D (n) δ(t nt ), t = nt, (.45) dvs den samplade signalen s(t) är lika med den diskreta signalen g D (n) mltiplicerad med diracplser. Mltiplikationen i signaldomänen motsvaras av faltning i forierdomänen. Därför kan vi med tnyttjande av implstågets foriertransform (.3) skriva den samplade signalens foriertransform som S(f) = III(fT) G(f) = T k= ( G f k ), (.46) T vilket illstreras i Fig... Utseendet kommer av att faltning med de diskreta dirac-plserna i implståget ger pprepade kopieringar av (/T )G(f).

.5 Sampling och rekonstrktion g(t) t sampla sampla s(t) =g(t) T III ( ) t T T g D (n) =g(nt ) t n Figr.. Illstration av de två modellerna att sampla. Foriertransformen S(f) i Fig.. avviker tyvärr avsevärt från G(f) i form av ett överlapp eller vikningsdistorsion. Detta är betänkligt eftersom vi i vår digitaliserade värld måste använda diskreta sampel för att representera kontinerliga signaler. Om vi ökar samplingsfrekvensen /T som i Fig..3 a)- c) förbättras emellertid sitationen väsentligt. I forierdomänen är n de olika kopiorna av G(f) inte längre överlappande förtsatt att g(t) är bandbegränsad, dvs saknar frekvenser över en viss högsta frekvens W. Detta ger oss samplingsteoremet. Samplingsteoremet Låt signalen g(t) samplas till s(t). Om samplingsfrekvensen /T är större än gånger g(t):s maimala frekvens W,dvs > W, (.47) T så kan g(t) rekonstreras fllständigt i varje pnkt av t-aeln med hjälp av s(t). Tekniken för sådan rekonstrktion illstreras av Fig..3 c)-e). I forierdomänen mltiplicerar vi S(f) med rektangelfnktionen T Π(f T) och återfår därmed det rena rsprngliga frekvensinnehållet i den kontinerliga signalen g(t), G(f) =S(f) T Π(fT). (.48) Motsvarande operation i signaldomänen är faltning med rektangelfnktionens (inversa) foriertransform som är sinc(t/t )= sin(πt/t). (.49) πt/t Eftersom sinc-fnktionen har oändlig tsträckning är operationen g(t) =s(t) sinc(t/t ) (.5) i praktiken omöjlig att tföra eakt. Ekvation (.49) är dock en viktig teoretisk modell gentemot vilken praktiska, approimativt riktiga, metoder kan tvärderas.

Endimensionell signalbehandling Signaldomän Forierdomän g(t) G(f) A a) t W f (/T )III(t/T ) III(fT) /T b) T t /T f s(t) S(f) A/T c) t vikningsdistorsion /T f Figr.. Samplingsteoremet illstrerat. Om samplingsfrekvensen /T är för låg får man vikningsdistorsion. Korrekt rekonstrktion är då inte möjlig. Signaldomän Forierdomän g(t) G(f) A a) t W f (/T )III(t/T ) III(fT) /T b) T t /T f s(t) S(f) A/T c) t /T f sinc(t/t ) T Π(fT) T d) t f g(t) =s(t) sinc(t/t ) G(f) =S(f) T Π(fT) e) t W f Figr.3. Samplingsteoremet illstrerat. Om samplingsfrekvensen /T är tillräckligt hög är perfekt rekonstrktion möjlig.

.6 Fönstring 3.6 Fönstring En avvikelse från den ideala sitation som tmålas i Fig..3 är det faktm att vi inte kan känna till eller mäta pp en signal g(t) eller dess samplade variant från till +. Vi får nöja oss med ett begränsat intervall, ett fönster. I Fig..4 har vi illstrerat detta på så sätt att en signal g(t) = cos(πf t) har mltiplicerats med rektangelfönstret ( ) t Π, NT där NT är fönstrets tsträckning tefter t-aeln. Den fönsterbegränsade signalen kallar vi r(t) och den fås n som ( ) t r(t) =g(t) Π. NT I forierdomänen har vi G(f) = δ(f + f )+ δ(f f ), NTsinc(NTf)=F [ ( )] t Π, (.5) NT R(f) =G(f) NTsinc(NTf)= sinc(nt(f + f )) + sinc(nt(f f )). Signaldomän g(t) Forierdomän G(f) a) t f f f Π(t/NT ) NTsinc(NTf) hvdlob b) NT t f sidolober r(t) R(f) c) t f f f Figr.4. Fönsting av en cosinssignal. De distinkta frekvenserna vid ±f breddas. Det är önskvärt med så smal hvdlob och så små sidolober som möjligt. Skillnaden mellan G(f) och R(f) härrör från sinc-fnktionen i (.5). Med mycket stort fönster N T blir denna sinc-fnktion smal som en dirac-pls och R(f) blir då mycket lik G(f), dvs R(f) G(f). Ett litet NT-fönster breddar emellertid dessa fnktioner och förvanskar frekvensinnehållet avsevärt, dvs R(f) G(f). Ett annat sätt att se på fönstring är hr det på verkar frekvensinnehållet. De distinkta frekvenserna vid ±f breddas efter fönstring. Som indikerats i figren har sinc-fnktionen NTsinc(NTf) en hvdlob och flera sidolober. För att bevara de distinkta frekvenserna vid ±f är det önskvärt att hvdloben är så smal som möjligt och att sidoloberna är så små som möjligt. Ibland är det ena önskemålet viktigare än det andra. Det finns flera andra fönster nämnda i litteratren, t e hamming-, hanning- och blackmanfönster. Dessa ger mindre sidolober till priset av en breddad hvdlob.

4 Endimensionell signalbehandling.7 Tidsdiskret foriertransform (TDFT) Fnktionen s(t) är en kontinerlig signal som har värden skilda från endast i sampelpnkterna. Foriertransformen av s(t) kan räknas t enligt S(f) = = s(t)e jπtf dt = n= [ n= g(t)δ(t nt )] e jπtf dt där vi använt (.) och (.43). Ekvation (.5) med (.44) insatt ger g(t)δ(t nt )e jπtf dt = n= g(nt )e jπntf (.5) S(f) = n= g D (n)e jπntf. (.53) Den samplade signalens foriertransform S(f) kan alltså ttryckas som en smma av viktade diskreta sampelpnkter g D (n). Genom att göra variabelbytet Ω=πfT (.54) i (.53) fås en annan vanlig foriertransform, nämligen den tidsdiskreta foriertransformen, vars definition är G T (Ω) = g D (n)e jωn. (.55) n= Den inversa tidsdiskreta foriertransformen ges av g D (n) = π π π G T (Ω)e jωn dω (.56) som lämnas tan bevis. Den tidsdiskreta foriertransformen G T (Ω) säges ha normerad vinkelfrekvens. Dess period är alltid π och därför oberoende av sampelavståndet T..8 Diskret foriertransform (DFT) och cirklär faltning Den diskreta foriertransformen (DFT) kan beräknas som en ändlig smma över en begränsad del av g D (n), G D (k) = N n= Den inversa diskreta foriertransformen (IDFT) tföres som g D (n) = N N n= g D (n)e jπnk/n, k N. (.57) G D (k)e jπnk/n, n N. (.58) som lämnas tan bevis. Faktorn /N förekommer i IDFT men inte i DFT. För DFT gäller en mängd teorem liknande dem som gäller för kontinerlig foriertransform och TDFT. Eempel på sådana teorem är skalningsteoremet och skiftteoremet som finns beskrivna i bl a [6] och för D i Tab. 3.. Något som är specifikt för DFT:n är dess faltningsteorem. Teorem för cirklär faltning Det gäller att mltiplikation DFT-domänen motsvaras av cirklär faltning i den andra domänen, (g D N h D )(m) = N n= g D (n)h D ((m n) N ) G D (k) H D (k), (.59) där N noterar cirklär faltning och ( ) N betecknar modlo N operation, dvs h D ( ) kan ppfattas som periodiskt pprepad eller cirklär.

.9 Från kontinerlig till diskret foriertransform (DFT) 5 Bevis Antag att vi har två sekvenser g D (n) ochh D (n) med längden N. Deras respektive DFT:er definieras som G D (k) = H D (k) = N n= N n= g D (n)e jk(π/n)n, k =,...,N, (.6) h D (n)e jk(π/n)n, k =,...,N. (.6) Om dessa två DFT:er mltipliceras ihop fås ett resltat med längden N som vi kan kalla Y D (k). Låt oss n bestämma relationen mellan sekvenserna g D (n) ochh D (n). Vi har Invers DFT av detta blir y D (m) = N N k= Y D (k) =G D (k) H D (k). (.6) Y D (k)e jk(π/n)m = N Sätt n in (.6) och (.6) i (.63). Detta ger y D (m) = N N k= [ N n= N k= G D (k)h D (k)e jk(π/n)m. (.63) g D (n)e jk(π/n)n ] e jk(π/n)m (.64) [ y D (m) = N N N ] g D (n) h D (l) e jk(π/n)(m n l). (.65) N n= l= k= Smman innanför klamrarna i (.65) kan n skrivas N e jk(π/n)(m n l) = e jπ(m n l) =, f.ö. k= e π(m n l)/n Om n (.66) sätts in i (.65) fås { N, l = m n pn =(m n)n, p heltal (.66) y D (m) =(g D N h D )(m) = vilket tillsammans med (.6) bevisar (.59). V.S.V N n= g D (n)h D [(m n) N ] (.67).9 Från kontinerlig till diskret foriertransform (DFT) Fig..5 illstrerar n hela sambandet mellan den kontinerliga foriertransformen och DFT. Vi börjar med den kontinerliga signalen g(t) och dess foriertransform G(f).Vi tänker oss att g(t) är begränsad och att G(f) är tillräckligt begränsad så att största delen av G(f):s energi ligger i intervallet f < /(T ). Det går inte att anta att både g(t) ochg(f) är begränsade. Man kan visa att om g(t) är begränsad så kan inte G(f) vara begränsad och vice versa, jämför gärna med forierparen i Fig..3 och Fig..4. Fnktionen G(f) kan egentligen ha både en realdel och en imaginärdel (det kan också g(t) ha), men i Fig..5 har vi valt att inte visa detta. Först samplas g(t) till s(t) genom mltiplikation med implståget vilket ger s(t) =g(t) T III Detta ger en pprepning i forierdomänen enligt S(f) =G(f) III(fT)= T ( t T k= ). (.68) ( G f k ) T (.69)

6 Endimensionell signalbehandling och vi ser i Fig..5 att S(f) T G(f), T <f< T. (.7) Det tidsdiskreta forierparet g D (n), G T (Ω) från ekvation (.55) visas också i figren. Notera att G T (Ω) är en frekvensskalad variant av S(f) med skalfaktorn Ω = πft. Detta inses genom att kombinera (.53), (.54) och (.55) vilket ger sambandet ( ) Ω G T (Ω) = S (.7) πt och vi ser i figren att G T (Ω) ( ) Ω T G. (.7) πt g(t) Signaldomän G(f) Forierdomän s(t) SAMPLA NT t F s(t) =g(t) T III ( ) t S(f) G(f)/T T S(f) T f F T NT t T T f g D (n) g D (n) =g(nt ) G T (Ω) G T (Ω) = S ( ) ( Ω πt G Ω ) πt /T TDFT N n π π Ω g D (n) g D (n) =g(nt ) G D (k) G D (k) =S ( ) ( k NT G k ) NT /T DFT N N n N N k Figr.5. Samband mellan kontinerlig foriertransform, samplad kontinerlig foriertransform, TDFT och DFT. För att den diskreta foriertransformen (DFT) ska vara symmetrisk rnt origo och lättare gå att jämföra med de övriga fnktionerna i Fig..5, definierar vi den något annorlnda än tidigare i (.57) och (.58). DFT:n definieras n som G D (k) = N/ n= N/ g D (n)e jπnk/n, N k N, (.73) där k och n är heltal. Den inversa diskreta foriertransformen får då tseendet g D (n) = N N/ k= N/ G D (k)e jπnk/n, N n N, (.74)

. Diskret faltning och faltningskärnor 7 som enkelt kan bevisas genom att ersätta G D (k) med med högerledet av (.73). Formlerna för DFT och IDFT för fnktionerna g D (n) ochg D (k) gäller alltså eakt. Om man kontrollerar dessa fnktioners värde tanför definitionsområdena N/ k, n N/ pptäcker man att de är periodiska. Detta beror i sin tr på att e jφ är en periodisk fnktion. Det repetetiva tseendet på fnktionerna g D (n) och G D (k) är också indikerat i Fig..5. Man kan välja att betrakta fnktionerna antingen begränsade till definitionsområdena eller som periodiska. Det senare synsättet är ofta lämpligt för förståelse av ppträdandet hos DFT och IDFT. Relation mellan kontinerlig foriertransform och DFT Vi vet sedan tidigare att de diskreta sampelvärdena g D (n) överensstämmer perfekt med den kontinerliga fnktionen g(t) i pnkterna n =,,, 3,... enligt g D (n) =g(nt ), N n N. (.75) På motsvarande sätt finns en perfekt överensstämmelse mellan G D (k) ochs(f) och en ngefärlig överensstämmelse mellan G D (k) ochg(f) enligt ( ) k G D (k) =S ( ) k NT T G, N NT k N. (.76) förtsatt att g D (n) =förn< N/ ochn N/. Relationen mellan kontinerlig frekvens f och diskret frekvens k är alltså f = k NT, (.77) där N är antalet sampelpnkter och T är sampelavståndet. Bevis Sätt in f = k/nt i (.7) och (.53). Dett ger ( ) ( ) k k T G S = g D (n)e jπnk/n = {g D (n) =förn< N/ ochn N/} NT NT N V.S.V = N N/ n= N/ n= g D (n)e jπnk/n = {(.73)} = G D (k) (.78) Ekvation (.76) visar att foriertransformen G(f) kan beräknas approimativt i N pnkter genom att först sampla g(t) och därefter applicera en DFT på dessa diskreta sampelpnkter. För att DFTvärdena G D (k) ska överensstämma med G(f) måste de dock skalas på både höjden och bredden enligt ekvation (.76). Notera att den kontinerliga foriertransformen G(f) aldrig kan återskapas perfekt r den diskreta foriertransformen G D (k) eftersom sambandet mellan G D () och G() är approimativt. Någon kanske argmenterar att detta sklle gå om G(f) vore bandbegränsad. I ett sådant fall är dock g(t) inte begränsad. Eftersom N är ett ändligt tal kommer sampelpnkterna i g D (n), N/ N/, inte att räcka för hela den oändligt långa g(t). Den obegränsade fnktionen g(t) måste därför först begränsas genom fönstring till g fönstr (t). Foriertransformen av denna fnktion, G fönstr (f), blir då obegränsad och vi är tillbaka till fallet som beskrivs i Fig..5.. Diskret faltning och faltningskärnor Faltning av två kontinerliga signaler definieras som y(t) =(h g)(t) = h(t a)g(a) da. (.79)

8 Endimensionell signalbehandling Om n h och g är diskreta signaler, dvs sekvenser av sampel förvandlas integralen till en smma med ttrycket y(t) = h(t a)g(a) = h(a)g(t a). (.8) a= a= Notera att vi, trots att det rör sig om diskreta signaler, har valt att kalla variabeln t istället för som tidigare n. Minst en av de två ingångssekvenserna h(t), g(t) brkar vara ändlig, dvs begränsad till N st värden skilda från. I Fig..6 visas ett fall med nmeriska värden där alla tre sekvenserna är ändliga, och därmed före och efter de ändliga intervallen. Faltningsformeln ger att beräkningen sker i a-rmmet där h-sekvensen speglas och glider framåt för ökande värden på t. g(t)={...,,,,,,,,,...} h(t)={...,,,,3,,,,,...} 3 (h*g)(t)={...,,,6,7,7,3,,,...} (h g)(t) = a= h(t a) g(a) a= Beräkningsteknik: speglad 3 6 7 7 3 t= g(a) i a rmmet h(t a) 6 7 7 t= 3 (h*g)(t) i t rmmet Figr.6. Diskret faltning. Faltning sker oftast som en operation av en relativt kort sekvens (sekvensen h) på en längre, potentiellt oändlig sekvens (sekvensen g) i Fig..6. I ett sådant fall kallas sekvensen h faltningskärna, (engelska: convoltion kernel), faltningsoperator, linjär operator eller kort och gott filter. Det kan n vara lämpligt att något disktera olika en-dimensionella faltningskärnors filtreringsegenskaper. Mera om detta kommer att sägas längre fram då vi behandlar tvådimensionella signaler. Vi använder beteckningen {a, b}/k istället för{ a/k, b/k } Storheten nedanför snedstrecket är sålnda en (normaliserings-)faktor som är gemensam för alla koefficienterna i faltningskärnan. Operatorerna {, }/ {,, }/4 {, 3, 3, }/8 {, 4, 6, 4, }/6 är alla medelvärdesbildande i viss mening. De bevarar DC-komponenten (medelvärdet)i insignalen medan högfrekventa komponenter ndertryckes. Eftersom de alla fyra är jämna fnktioner (med origo symmetriskt placerat) blir deras foriertransformer reella och jämna fnktioner, se Fig..7. Notera dock att för {, }/ blir t-resltatet förskjtet ett halvt sampelavstånd jämfört med in-sampelvärdena. Detta är något som programmeraren måste ha kontroll på. Hr gör man då för att beräkna en faltningskärnas foriertransform? Nedan härleds den kontinerliga foriertransformen, TDFT:n och DFT:n för faltningskärnan {,, }/4. Vi förtsätter att origo ligger i mitten av kärnan så att { /4, /, /4, n =,, h D (n) =, för övrigt.

. Diskret faltning och faltningskärnor 9 Kontinerlig foriertransform av faltningskärnan {,, }/4 Sätt dirac-plser på varje element i operatorn och antag sampelavstånd T. Detta ger den kontinerliga fnktionen h(t) =[δ(t + T )+δ(t)+δ(t T )]/4. Foriertransformera h(t) till H(f) = 4 ejπtf + + 4 e jπtf = cos(πtf)/+/ = cos (πtf). Operatorn {,, }/4 har alltså foriertransformen cos (πtf). TDFT av faltningskärnan {,, }/4 Sätt in faltningskärnans värden h D (n) i TDFT-formeln (.55) H T (Ω) = h D (n)e jωn = 4 e jω( ) + e jω + ( ) Ω 4 e jω =cos n= Operatorn {,, }/4 har alltså TDFT:n cos (Ω/). DFT av faltningskärnan {,, }/4 Sätt in faltningskärnans värden h D (n) i DFT-formeln (.73) H D (k) = N/ n= N/ h D (n)e jπk n N = 4 e jπk N + e jπk N + 4 e jπk N =cos Operatorn {,, }/4 har alltså DFT:n cos (πk/n). Notera att N är en fri parameter. ( ) πk N Alla tre transformerna ger likvärdiga resltat, som dock är skalade i förhållande till varandra. I Fig..7 föredrog vi dock att använda den kontinerliga foriertransformen av faltningskärnan eftersom den är lättare att jämföra med kontinerlig foriertransform av kontinerliga fnktioner. Differentieringsoperatorn {, -}/T har ingen DC-komponent. Däremot förstärker den (ger tslag för, detekterar) förekomster av ojämnheter, språng och partier av stark ltning i den signal som den appliceras på. En liknande effekt har operatorn {,, -}/T fast med mindre känslighet för små ojämnheter. Att denna operator verkligen beräknar den approimativa derivatan illstreras i Fig..8. Till vänster visas att derivatan g (t ) approimativt beräknas som g (t ) g(t + T ) g(t T ). T Till höger visas att faltning med {,, -}/T ger precis samma resltat, dvs T g(t T )+ T g(t + T )= g(t + T ) g(t T ). T En nackdel med {, }/T är att tgångsresltatet blir förskjtet ett halvt sampelavstånd jämfört med ingångsresltatet.

3 Endimensionell signalbehandling Signaldomän Forierdomän / / cos(πtf) a) b) c) d) /4 3/8 /8 T / T T /4 3/8 /8 t t t cos (πtf) cos 3 (πtf) cos 4 (πtf) /T f /T f /T f 3/8 /4 /4 /6 /6 T t /T f Figr.7. Medelvärdesbildande faltningskärnor och deras foriertransformer. g(t) g(t T) g(t+t) g(t) g(t) g(t T) g(t+t) g(t) t T t /T /T t Figr.8. Faltning med {,, -}/T motsvarar approimativ derivering. Operatorerna och deras foriertransformer kan stderas i Fig..9. Följande regel gäller som bekant för foriertransformen vid derivering av en fnktion, [ ] d F dt [g(t)] = F[g (t)] = jπf G(f). (.8) Eftersom derivering gör att foriertransformen mltipliceras med jπf kan man se det som om deriveringsoperationen tför en faltning. Derivering kan därmed skrivas som en faltning enligt d dt [g(t)] = d g(t). (.8) dt Deriveringsoperatorn d/dt har alltså foriertransformen jπf. Differentieringsoperatorerna i Fig..9 följer denna linjära fnktion i närheten av origo. Dbbel differentiering får vi om vi t e använder operatorn { -}/T två gånger vilket är liktydigt med att applicera operatorn {,, }/T = {, }/T {, }/T. Denna operator visas med sin foriertransform längst ner i Fig..9. I närheten av origo följer den :a derivatorns foriertransform (jπf) = 4π f som sig bör. Vi ska pprepa och tvidga diskssionen om derivatorer i avsnitt 3.9.

. Diskret faltning och faltningskärnor 3 a) Signaldomän Forierdomän /T (/T )sin(πtf) T t /T f /T b) /T T /T t (/T ) sin(πtf) /T f c) /T ( 4/T )sin (πtf) /T T t /T f /T Figr.9. Differentierande faltningskärnor med foriertransformer.

Kapitel 3 Tvådimensionell signalbehandling I detta kapitel och de följande kommer vi in på två-dimensionell signalbehandling, dvs bildbehandldling eller engelskans image processing. Det finns mycket litteratr inom området, både tidskriftsartiklar och böcker och vi väljer att som eempel referera till några av böckerna [3], [4], [5], [7], [8] och []. 3. D foriertransform En endimensionell signal är en fnktion som endast endast beror av en variabel. Ett eempel på detta är sinsvågen, (t) =sin(t). (3.) På liknande sätt är en n-dimensionell signal en fnktion som beror av n st oberoende variabler. Ett eempel på en två-dimensionell signal är f(, y) =sin( y)+. (3.) Inom signalbehandlingen begränsar man sig ofta till en-dimensionella signaler med tiden t som variabel. Inom bildbehandlingen arbetar man hvdsakligen med två-dimensionella signaler. Det vi i dagligt tal menar med en bild är j en två-dimensionell fnktion. De oberoende variablerna betecknas ofta med och y och betraktas som spatiala (rms-) koordinater. Den två-dimensionella signalen f(, y) i (3.) illstrerades i Fig.., där f(, y) = avbildas på svart, f(, y) = avbildas på vitt och övriga värden på f(, y) med proportionella gråskalevärden. Generaliseringen av från en-dimensionell till två-dimensionell signalteori är i långa stycken rättfram och relativt självklar. Oavsett detta bör tvidgningen till två dimensioner göras och noteras. Till detta kommer att effekter och samband eisterar för tvådimensionella signaler som helt saknar motsvarighet i en-dimensionell signalbehandling. Ett sådant fall är projektionsteoremet, vilket dock inte behandlas här. För en kontinerlig två-dimensionell signal f(, y) definieras dess foriertransform F (, v) med F [f(, y)] = F (, v) = f(, y)e jπ(+yv) ddy [ ] = e jπyv f(, y)e jπ d dy [ ] = e jπ f(, y)e jπyv dy d. (3.3) Som framgår av (3.3) är transformen separerbar. Vi kan t e först beräkna D-transformen i -led för varje rad i bilden. På detta resltat appliceras sedan D-transformen i y-led för varje kolmn. Detta kommer att illstreras närmare nedan i ansltning till Fig. 3.6. Den inversa foriertransformen definieras av F [F (, v)] = f(, y) = vilket står i fll överensstämmelse med det en-dimensionella fallet. F (, v)e jπ(+yv) ddv, (3.4) 33

34 Tvådimensionell signalbehandling

3. D foriertransform 35 Figr 3.. Forierpar för vissa D-signaler (efter Bracewell). Observera bl a följande. Alla signaler är jämna och reella. Därför behövs endast den reella delen av forierrymden. δ(, ) är den två-dimensionella Dirac-plsen, Π(, ) är den två-dimensionella rektangelfnktionen, Λ är en triangelfnktion. Samtliga fnktionsttryck är givna tan skalningsparametrar. Avsikten är att förmedla en kvalitativ känsla för foriertransformen av vissa elementära fnktioner. Observera också att två tekniker användes för att illstrera en D-fnktion. Ibland, som i a) användes intensiteten i gråskalan, ibland, som i h) användes istället höjden över (, v)- eller (, y)-planet i en s k 3D-plot. Fig. 3. visar ett antal två-dimensionella fnktioner och deras foriertransformer. Samtliga är reella, jämna fnktioner varav följer att också F (, v) är jämn och reell. Det kan inte nog nderstrykas att för att grafiskt beskriva en allmän två-dimensionell foriertransform krävs två plan för F Re (, v) respektive F Im (, v). Observera att (, v)-planet inte är ett komplet talplan. Eemplen i Fig. 3. kan föranleda en hel del tänkvärda observationer. Vi noterar att i Fig. 3..a) så finns ingen variation alls i y-led, endast en DC-komponent. Mycket riktigt är i Fig. 3..b) också F (, v) = överallt tom på -aeln där v =. De två Dirac-plserna i Fig. 3. b) följer rotationen av cosinsmönstret i Fig. 3. c) så att vi i Fig. 3. d) finner Dirac-plserna tefter en linje med vinkeln θ; samma linje i (, y)-planet (ej tritad) går vinkelrätt genom vågmönstret f(, y). I Fig. 3. c) är också frekvensen dbblerad. I Fig. 3. e) bildar cos(π) och cos(πy) två ortogonala cosinsvågor ett schackmönster. Vi noterar att deras interferenser i f(, y) gör att vi inte har någon vågfront som löper vare sig i -led eller y-led. Integraler tagna i -led eller y-led ger resltatet. Däremot finner vi vågfronter som löper i 45 -riktningarna och perioden för dessa vågor är ggr mindre än originalvågorna i - och y-led. I forierplanet bekräftas detta med fyra Dirac-plser på ggr större avstånd från origo än i b). Resltatet kan rimliggöras också på följande sätt. Var för sig ger de två cosinsvågorna pphov till två Dirac-plser på - respektive v-alarna. Men mltiplikationen av de två komponenterna i signalplanet motsvarar faltning i forier-planet, vilket ger Fig. 3. f). För den en-dimensionella dirac-plsen δ() i signalplanet gäller som bekant att F [δ()] =, dvs foriertransformen är konstant tefter hela -aeln. I Fig. 3. i)-j) illstreras detta faktm i det tvådimensionella fallet, dvs F [δ(, y)] = F [δ() δ(y)] =. (3.5)