DT3 Spektrala transformer Tentamen 6 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel: räknare, formelblad (bifogat) En analog signal x(t) beskrivs av Lycka till! samt x(t) = { om t < T om T t < T x(t + T ) = x(t) Signalen samplas med f s = 8 Hz, efter att ha filtrerats med ett anti-vikningsfilter vid f s /. Den samplade signalen placeras i vektorn x(n). a Skissa spektrum upp till halva samplingsfrekvensen av x(n) för de två fallen då T = 5µs respektive T = 65µs. Frekvensaxeln ska vara graderad från till π, och inbördes relationen mellan deltonernas amplituder ska framgå.(p) b En ny signal y(n) skapas genom att ta vartannat sampel av x(n), dvs y(n) = x(n). Skissa spektrum för y(n) då T = 5µs.(p) I figur ser du impulssvaren från ett antal från tvåpoliga resonatorer. Du ser även ett antal poldiagram som beskriver dessa resonatorer. Para ihop varje impulssvar med rätt poldiagram! Observera att det blir ett poldiagram över. Motivera kort varje par. (p/ korrekt par) 3 Betrakta filtret H(z) = a + bz + c z och ett vid nykvistfre- Bestäm a,b och c så att beloppsfunktionen H(ω) är noll vid ω = π 3 kvensen.(4p) (6) DT3 Spektrala Transformer HT
a 5 5 5 3 35 4 45 5 5 5 b 5 5 5 5 3 35 4 45 5.8 3.6.4 c. 5 5 5 3 35 4 45 5 4 d 5 5 5 3 35 4 45 5 e Figur. (6) DT3 Spektrala Transformer HT
4 I JPEG-kodning transformeras varje pixel-block I till en koefficientmatris C enligt 5 C = T T IT där T är basvektormatrisen för DCTn. C beskriver därmed frekvensinnehållet i pixelblocket. a Vad är den spektrala tolkningen koefficientmatrisens rad- resp. kolumnindex? Jämför gärna med FFT-spektrum av en ljudsignal. (p) b Ofta är koefficienterna störst i övre vänstra hörnet av koefficientmatrisen (låga rad- och kolumnindex). Vad är tolkningen av detta, och hur utnyttjas det i JPEG-algoritmen? (p) c Hur ska ett pixelblock vara beskaffat om informationen ska koncentreras till mitten av högerkanten på koefficientmatrisen? Skissa och motivera. (p) Figuren nedan visar en 8-punkters FFT (i belopp) av två överlagrade sinusvågor: x(n) = sin(πω n/n)+sin(πω n/n), där N = 8, ω = och ω =. Två olika fönsterfunktioner har använts - rektangulärt fönster och Hammingfönster. a Vilken av de två plottarna (fyllda eller ofyllda ringar) motsvarar Hammingfönstret? (motivera) (p) b Beskriv, med utgångspunkt i faltningsteoremet, vad fönstring gör med en signal och dess spektrum. (p) 7 6 5 4 3 3 4 5 6 7 3 (6) DT3 Spektrala Transformer HT
Lösningar x(n) är en fyrkantvåg med frekvensen f = T a Fourierseriekoefficienterna för en fyrkantvåg är c k = j kπ för udda k, och för jämna k, vi får deltoner vid f, 3f, 5f osv. T = 5µs ger f = 8Hz (ω = πf /f s = π/5). Deltoner vid 8 Hz, 4 Hz (4 Hz och uppåt tas bort av antivikningsfiltret). Spektrum kommer att ha två komponenter, vid π/5 och 3π/5, där höjden på den andra är en tredjedel av den första. π/5 3π/5 π T = 65µs ger f = 6 Hz (ω = π/5) och deltoner vid 6 Hz, 48 Hz... endast 6 Hz passerar antivikningsfiltret. Spektrum kommer att ha en komponent, vid π/5. π/5 π b Att ta vartannat sampel innebär att sampla om signalen till halva samplingsfrekvensen. Detta innebär att frekvenskomponenternas normerade vinkelfrekvens (ω uttryckt i radianer per sampel) kommer att dubbleras. Det innebär också att alla komponenter som hamnar över π vid denna frekvensdubblering kommer att vikas ned. Första komponenten blir π/5, och klarar sig undan vikning. Andra komponenten blir 6π/5, vilket är större än π och kommer därför vikas ned till pi 6π/5 = 4π/5. Spektrums två komponenter kommer alltså att ligga vid π 5 och 4π 5 där höjden på den andra komponenten är en tredjedel av den första. π/5 4π/5 π 4 (6) DT3 Spektrala Transformer HT
- c Svängning med perioden 6 sampel, dvs polvinkel π/6 = π/3. Detta stämmer för c och d. I d ligger dock polerna utanför enhetscirkeln vilket innebär ett instabilt filter (vilket inte det snällt avklingande impulssvaret antyder) Alltså c. - d Samma frekvens som ovan, π/6 = π/3. Men framförallt är systemet instabilt, dvs polradie >, dvs d. 3 - b Ingen svängning, endast dämpning, dvs polerna ligger på positiva reella axeln <, dvs b. 4 - a Vartannat sampel pos/neg betyder att frekvensen, dvs polvinkeln, är π. 3 H(z) = az + bz + c z H(z) = vid ω = π 3 betyder att vi bör placera nollställen i e±jπ/3. Ansätt därför H(z) = k (z ejπ/3 )(z e jπ/3 ) z = k z ze jπ/3 ze jπ/3 + z = k z z + z Bestäm k för enhetsförstärkning vid nykvistfrekvensen (z = ): H( ) = 3k = k = 3 Identifiera koefficienter i de två uttrycken för H(z): az + bz + c z = z z + 3 z ger a = 3,b = 3,c = 3. 4 a Rad- och kolumnindex motsvarar vertikal resp. horisontell frekvens. Koefficienter med lågt radindex motsvarar låga spatiala frekvenser i horisontalled, precis som komponenter långt till vänster i ett FFT-ljudspektrum motsvarar låga frekvenser i ljudsignalen. b Koefficienter med låga rad- och kolumnindex motsvarar låga spatiala frekvenser, t.ex. såsom hela blockets genomsnittsfärg och långsamma gradienter. I JPEG-algoritmen utnyttjar man att dessa dominerar percpetuellt, genom att ta avrunda bort koefficienter vid höga frekvenser som är nära noll, vilket ofta ger liten effekt på bilden. c Högerkanten = maximal horisontell frekvens. Mitten vertikalt = ganska långsam vertikal frekvens. Nedan visas ett sådant pixelblock (till vänster) med sin DCT koefficientmatris (till höger). 5 (6) DT3 Spektrala Transformer HT
5 a När rektangelfönstret används innebär det att signalen helt enkelt klipps av efter N = 8 sampel. Den ena sinusvågen har en frekvens som är en jämn multipel av π/n, dvs det får plats ett helt antal () perioder av vågen i intervallet. Frekvensen sammanfaller då exakt med en av DFT ns basfunktioner, vilket ger en ensam spik i spektrum. Den andra vågens frekvens faller precis mellan två basfunktioner, och sprider ut sig över ett stort område i spektrum. Med hammingfönstret kommer signalen undertryckas i ändarna av intervallet, och skillnaden blir mindre mellan de två frekvenserna. Båda kommer dock spridas över några närliggande basfunktioner. Alltså: fyllda = hamming, ofyllda = rektangel. b Fönstring innebär en multiplikation i tidsdomänen, vilket enl. faltningsteoremet motsvarar en faltning i frekvensdomänen. Det som händer är att signalens (komplexa) FFT-spektrum faltas med fönsterfunktionens spektrum. Varje ingående frekvenskomponent kommer därför spridas ut i frekvensled, vilket gör att man förlorar något i frekvensupplösning, men i gengäld förhindrar att komponetner som faller mellan basfunktionerna sprids ut över hela spektrumet (s.k. sidolober). 6 (6) DT3 Spektrala Transformer HT