Kapitel 6 Diskret representation av kontinuerliga signaler I digital signalbehandling är det vanligt att en kontinuerlig signal representeras i form av en diskret sekvens, t.ex. för att överföras eller lagras i digital form, såsom i digital telekommunikation och digitala audiotillämpningar. Vid dylika tillämpningar är det viktigt att exakt känna till vilka komponenter av en kontinuerlig signal kan representeras i form av en diskret sekvens, samt hur och under vilka villkor den kontinuerliga signalen kan rekonstrueras från den diskreta. Det är lätt att inse att varje kontinuerlig signal ej kan representeras med hjälp av en diskret sekvens, då antalet punkter i en kontinuerlig funktion x a (t) ju är mycket större än antalet värden i en diskret sekvens {x d (n)}. I allmänhet går därför en viss mängd av informationen i den kontinuerliga signalen förlorad vid övergång till en diskret representation. Det anmärkningsvärda är att det går att exakt karakterisera de funktioner x a (t) som kan representeras med hjälp av en diskret sekvens {x d (n)}. Dessutom kan en sådan funktion x a (t) rekonstrueras exakt från sekvensen {x d (n)}. Dessa viktiga resultat går i litteraturen under benämningen samplingsteoremet. 6.1 Sampling av signaler och aliaseffekten För att klargöra sambandet mellan kontinuerliga och diskreta signalrepresentationer studerar vi följande grundläggande situation. Vi betraktar en kontinuerlig signal x a (t). Denna samplas vid tidpunkterna {nt s }, så att man får den diskreta sekvensen {x a (nt s )} = {..., x a ( 2T s ), x a ( T s ), x a (0), x a (T s ), x a (2T s ),...} (6.1) Tiden T s kallas samplingstid eller samplingsperiod. Samplingsfrekvensen (i Hz) definieras som f s = 1 T s (6.2) 74
och samplingsfrekvensen angiven som en vinkelfrekvens är ω s = f s = T s (6.3) Man kan naturligtvis tänka sig ett mera komplicerat samband mellan den kontinuerliga och diskreta signalen än den i ekvation (6.1). Det visar sig emellertid att det är tillräckligt att studera diskretiseringen enligt (6.1) för att utreda sambandet mellan kontinuerliga och diskreta signalrepresentationer. Analysen av förhållandet mellan kontinuerliga och diskreta signaler görs bekvämast i frekvensplanet. För att ge en insikt i problematiken skall vi först betrakta ett enkelt exempel med en sinusformad signal. Exempel 6.1. Betrakta en sinusformad signal x 0 (t) med vinkelfrekvensen ω 0, x 0 (t) = sin(ω 0 t) (6.4) Antag att signalen samplas med samplingsperioden T s, varvid man får den diskreta sekvensen {x 0 (nt s )}, x 0 (nt s ) = sin(ω 0 T s n) (6.5) Om man ur den samplade sekvensen {x 0 (nt s )} entydigt kunde bestämma sinusfunktionens amplitud och frekvens ω 0 så skulle den kontinuerliga signalen x 0 (t) kunna rekonstrueras ur den samplade sekvensen. Detta är emellertid inte möjligt, eftersom det från sinusfunktionens periodicitet följer att x 0 (nt s ) = sin(ω 0 T s n) = sin(ω 0 ω s n) = sin(ω 0 ω s n + ln) = sin( (ω 0 + ω s l) ω s n) = sin((ω 0 + ω s l)t s n), alla heltal l (6.6) Detta innebär att signalerna x l (t) = sin((ω 0 + ω s l)t) ger samma diskreta sekvens, {x l (nt s )} = {x 0 (nt s )} för alla heltalsvärden l. Sinusfunktioner med vinkelfrekvenserna ω l = ω 0 + ω s l, l = 0, ±1, ±2,... (6.7) kan således inte urskiljas från varandra efter sampling. Situationen illustreras i det mellersta diagrammet i figur 6.1. Vinkelfrekvenserna ω l = ω 0 + ω s l (motsvarande frekvenserna f l = f 0 + f s l) kallas aliasfrekvenser till frekvensen ω 0 (respektive f 0 ) i avseende å samplingsfrekvensen 75
ω s, eftersom de alla förefaller identiska efter sampling. Fenomenet i vilket ett antal frekvenser hos den kontinuerliga signalen blir identiska efter diskretisering kallas aliaseffekten (eng. aliasing). Enligt ovan skulle det bästa man kan göra efter sampling vara att beskriva en kontinuerlig signal inom ett frekvensband av bredden ω s. Situationen är emellertid t.o.m. ännu något sämre än så; i kapitel 3 såg vi att spektret för negativa frekvenser ej var oberoende av värdet för positiva frekvenser. Speciellt gäller för reella signaler sambandet X( ω) = X (ω). Frekvensen ω i intervallet [ω s /2, ω s ] har en aliasfrekvens ω ω s i intervallet [ ω s /2, 0]. Det följer att signaler med frekvenser i intervallet [ω s /2, ω s ] efter sampling ej kan urskiljas från signaler med frekvenser i intervallet [0, ω s /2], såsom även följande exempel visar. Figur 6.1: Sampling av sinusformade signaler med samplingsfrekvensen ω s. Överst: sampling av lågfrekvent signal sin(ω 0 t) med ω 0 = ω s /4. Mitten: sampling av signalen sin(ω 1 t) ger ekvivalent samplad signal då ω 1 = ω 0 + ω s är aliasfrekvens till ω 0 (jfr exempel 6.1). Nederst: sampling av signalen sin(ω f t π) ger ekvivalent samplad signal då ω f = ω s ω 0 är den frekvens som viks in till frekvensen ω 0 (jfr exempel 6.2). Exempel 6.2. Betrakta en periodisk signal med vinkelfrekvensen ω 0 och fasen φ, x(t) = cos(ω 0 t + φ) (6.8) 76
Antag att signalen samplas med samplingsfrekvensen ω s = /T s, så att ω 0 är i intervallet (ω s /2, ω s ), dvs ω s /2 < ω 0 < ω s. Härvid fås den diskreta sekvensen {x(nt s )}, x(nt s ) = cos(ω 0 nt s + φ) = cos(ω 0 ω s n + φ) (6.9) Betrakta sedan en annan signal x f (t) med frekvensen ω f = ω s ω 0 och fasen φ, x f (t) = cos(ω f t φ) (6.10) Tydligen gäller 0 < ω f < ω s /2. Sampling av signalen x f (t) ger sekvensen x f (nt s ) = cos(ω f nt s φ) = cos(ω f ω s n φ) = cos(ω f ω s n φ n) = cos( (ω f ω s ) ω s n φ) = cos( (ω f ω s ) ω s n + φ) [jämn funktion] = cos(ω 0 ω s n + φ) [ω 0 = ω s ω f ] = x(nt s ) (6.11) Här har vi utnyttjat dels aliasegenskapen från Exempel 6.1 samt det faktum att cosinus är en jämn funktion; cos( θ) = cos(θ). Ekvationen (6.11) innebär att de diskreta sekvenserna {x(nt s )} och {x f (nt s )} ej kan urskiljas från varandra. Frekvensvikning illustreras i det nedersta diagrammet i figur 6.1. Exempel 6.2 visar att för varje periodisk signal x(t) med en frekvens ω 0 i intervallet [ω s /2, ω s ] existerar en annan periodisk signal x f (t) med frekvensen ω f = ω s ω 0 i intervallet [0, ω s /2] så att de samplade sekvenserna {x(nt s )} och {x f (nt s )} är ekvivalenta, och signalerna kan alltså ej urskiljas efter sampling. Man säger att frekvensen ω 0 från intervallet [ω s /2, ω s ] viks in till frekvensen ω f i intervallet [0, ω s /2] (frekvensvikning, eng. frequency folding), ty frekvenserna ω f och ω 0 befinner sig symmetriskt i förhållande till ω s /2 (ω 0 ω s /2 = ω s /2 ω f ). Frekvensvikning hänger ihop med aliaseffekten, ty frekvensen ω 0 = ω f + ω s är en aliasfrekvens till frekvensen ω f, som i praktiken ej kan urskiljas från frekvensen ω f. För att undvika aliaseffekten och frekvensvikning bör en signal samplas med tillräckligt hög frekvens. Om man vet att frekvensen ω 0 hos en sinusformad signal x(t) är mindre än ω max, så bör samplingsfrekvensen väljas så att ω max < ω s /2, dvs den skall satisfiera ω s > 2ω max, för att frekvensen hos x(t) skall kunna bestämmas entydigt ur den samplade sekvensen {x(nt s )}. Halva samplingsfrekvensen ω N = ω s /2 är känd 77
som Nyquist-frekvensen (efter Harry Nyquist (1889 1976), svensk-amerikansk ingenjör, även känd för fundamentala bidrag inom klassisk reglerteori). Det är ofta av intresse att bestämma den till absoluta beloppet minsta aliasfrekvensen ω 0 till en given frekvens ω. Denna är alltid i intervallet ω N < ω 0 ω N. Det är enkelt att visa, att ω 0 ges av formeln ω 0 = (ω + ω N ) mod (ω s ) ω N, om ω > ω N (6.12) där a mod b anger resten vid division av a med b. Det finns flera viktiga praktiska tillämpningar där det är viktigt att beakta aliaseffekten och frekvensvikning. Ett exempel är digitala audiotillämpningar. I CDspelare används samplingsfrekvensen 44.1 khz för lagring av den digitala audiosignalen. Nyquistfrekvensen är således 22.05 khz, vilket är något över 20 khz, som är den övre gränsen för frekvenser som människan uppfattar. Problem 6.1. Figur 6.2 visar sampling och rekonstruktionen av några sinusformade signaler. Bestäm de rekonstruerade signalernas frekvenser. Exempel 6.3. Ett vardagsexempel på aliasfenomenet kan man se på en film som visar ett roterande kärrhjul eller liknande. Den ursprungligen tidskontinuerliga periodiska rotationen representeras här som en diskret bildsekvens (ca 20 bilder per sekund) (figur 6.3). När man ser på filmen uppfattas rotationen som kontinuerlig med en frekvens som motsvarar den till absoluta beloppet minsta aliasfrekvensen. Intressant är att ett liknande fenomen kan observeras med bara ögon genom att titta snett på ett roterande hjul. Detta beror på att nervimpulserna från syncellerna i synfältets perifera delar sänds långsammare än vad hjärnans kapacitet förutsätter. Den bristande informationen kompletteras härvid i hjärnan genom rekonstruktion, vilket kan leda till rekonstruktion som uppvisar aliasfrekvenser. 6.2 Shannons samplingsteorem Resultaten i avsnitt 6.1 kan generaliseras till generella, icke-periodiska signaler. Analysen ger också en generell formel för hur en samplad kontinuerlig signal kan rekonstrueras från den samplade sekvensen. Vi skall betrakta en kontinuerlig signal x a (t) med Fouriertransformen X a (ω) definerad av ekvation (3.61). Signalen samplas med samplingstiden T s. Vi skall bestämma Fouriertransformen X s (ω) hos den samplade sekvensen {x a (nt s )}. Observera först att då en sinusfunktion sin(ωt) samplas vid tidpunkterna {nt s } = {..., 2T s, T s, 0, T s, 2T s } fås den diskreta signalen {sin(ωt s n)}. Enligt exempel 6.1 ger sinusfunktioner med frekvensen ω och dess aliasfrekvenser ω+ω s l upphov till samma diskreta sekvens (ekvation (6.6)). En frekvensutveckling av den samplade signalen 78
(a) (b) (d) (c) Figur 6.2: Sampling och rekonstruktion av sinusformade signaler. De heldragna kurvorna anger ursrunglig signal och de streckade kurvorna anger motsvarande rekonstruerad signal. {x a (nt s )} består därför av frekvenser begränsade till intervallet [ ω s /2, ω s /2]. Frekvensutvecklingen av sekvensen {x a (nt s )} kan i analogi med ekvationerna (4.24) och (4.23) skrivas x a (T s n) = T ωs /2 s X s (ω)e jωtsn dω (6.13) ω s /2 där Fouriertransformen X s (ω) ges av X s (ω) = n= x a (T s n)e jωtsn (6.14) Observera att de tidigare formlerna (4.24) och (4.23) för Fouriertransformen av en diskret sekvens är ett specialfall av (6.13), (6.14) med samplingstiden T s = 1 och ω s = /T s =. 79
Figur 6.3: Exempel på aliasing vid filmning av roterande hjul. Å andra sidan har den kontinuerliga signalen x a (t) Fouriertransformrepresentationen i enlighet med (3.60), (3.61), där x a (t) = 1 X a (ω) = Representationen (6.15) ger för x a (T s n), x a (T s n) = 1 X a (ω)e jωt dω (6.15) x a (t)e jωt dt (6.16) X a (ω)e jωt sn dω, n = 0, ±1, ±2,... (6.17) Genom att dela upp integralen i intervall av bredden ω s, [ω s l ω s /2, ω s l + ω s /2], l =..., 1, 0, 1,..., kan vi skriva (6.17) i formen x a (T s n) = 1 ωs/2 ω s/2 l= Från periodiciteten hos exponentialfunktionen följer X a (ω + ω s l)e j(ω+ω sl)t s n dω (6.18) e j(ω+ωsl)tsn = e j(ωtsn+ωstsln) = e j(ωtsn+ln) = e jωtsn, l = 0, ±1, ±2,... och (6.18) kan skrivas där vi introducerat x a (T s n) = 1 ωs/2 ω s /2 = T s = T s l= ωs /2 ω s /2 ωs /2 ω s /2 X s (ω) = 1 T s 1 [ T s X a (ω + ω s l)e j(ω+ω sl)t s n dω l= X a (ω + ω s l) ] e jωt sn dω X s (ω)e jωt sn dω (6.19) l= 80 X a (ω + ω s l) (6.20)
Ekvationerna (6.13), (6.19) och (6.20) visar, att sambandet mellan den kontinuerliga signalens x a (t) och den samplade sekvensens {x a (T s n)} Fouriertransformer X a (ω) och X s (ω) ges av ekvation (6.20). Ekvation (6.20) är den kvantitativa formuleringen av aliasfenomenet uttryckt med hjälp av signalernas Fouriertransformer. Sambandet mellan X a (ω) och X s (ω) visar explicit hur alla aliasfrekvenserna {ω+ω s l} bidrar till den samplade signalens spektrum. Faktorn 1/T s = f s = ω s /() behövs för att kompensera för att samplingsperioden är olikt ett. Sambandet (6.20) ger också en insikt i möjligheterna att rekonstruera den kontinuerliga signalen x a (t) från den samplade sekvensen {x a (T s n)}. Observera att sekvensen {x a (T s n)} definierar entydigt spektret X s (ω) och vice versa, och på samma sätt definierar spektret X a (ω) entydigt signalen x a (t) och vice versa. Det följer att rekonstruktion är möjlig om och endast om spektret X a (ω) på ett entydigt sätt kan beräknas från X s (ω). Sambandet (6.20) mellan de kontinuerliga och diskreta signalernas spektra visar exakt när detta är möjligt. Om X a (ω) är olikt noll inom ett frekvensområde ω max ω ω max för vilken ω max > ω s /2, är rekonstruktion inte möjlig, eftersom det inte går att bestämma hur stor andel av X s (ω) härstammar från de olika aliasfrekvenserna. För en bandbegränsad signal x a (t) däremot, för vilken X a (ω) försvinner för alla ω ω s /2, så kan X a (ω) bestämmas på ett entydigt sätt från X s (ω), och rekonstruktion blir möjlig. Situationen illustreras i figurerna 6.4 och 6.5. Resultatet kan kvantitativt sammanfattas i det sk. samplingsteoremet. X a (ω) ω max 0 ω max X a (ω+ω s l) ω s 0 ω s /2 ω s X s (ω) ω s /2 0 ω s /2 Figur 6.4: Spektret X a (ω) hos en kontinuerlig signal (överst), komponenterna X a (ω + ω s l) (i mitten), samt den diskreta signalens spektrum X s (ω) (nederst). Villkoret ω max < ω s /2 gäller och ingen aliasing fås. Rekonstruktion är således möjlig. Shannons samplingsteorem. En kontinuerlig signal x a (t) vars Fouriertransform X a (ω) försvinner för ω ω max, kan entydigt rekonstrueras från den samplade sekvensen {x a (T s n)} om samplings- 81
X a (ω) ω max 0 ω max X a (ω+ω s l) ω s 0 ω s /2 ω s X s (ω) ω s /2 0 ω s /2 Figur 6.5: Spektret X a (ω) hos en kontinuerlig signal (överst), komponenterna X a (ω + ω s l) (i mitten), samt den diskreta signalens spektrum X s (ω) (nederst). Här är ω max > ω s /2 och aliasing fås. Rekonstruktion är således inte möjlig. frekvensen satisfierar ω s > 2ω max. Den kontinuerliga signalen ges då av interpolationsformeln x a (t) = x a (nt s ) sin(ω s(t nt s )/2) ω s (t nt s )/2 (6.21) n= Samplingsteoremet är ett klassiskt resultat inom signalteori, som härleddes år 1949 av Claude Shannon ( Communication in the Presence of Noise, Proceedings of the Institute of Radio Engineers, vol. 37, ss. 10 21). Shannon är mest känd för fundamentala arbeten inom informationsteori och kodning, vilka ligger som grund för den moderna informationsteorin. Rekonstruktionsformeln (6.21) kallas Shannons rekonstruktionsformel. Den kan enkelt härledas med hjälp av signalernas Fouriertransformer. Principen illustreras i figur 6.6. Vi skall för fullständighetens skull presentera en härledning av formeln (6.21) nedan. Härledning av Shannons rekonstruktionsformel (6.21). Antagandet att signalen x a (t) är bandbegränsad, så att X a (ω) = 0 för ω ω max, och ω max < ω s /2 implicerar att inga aliasfrekvenser ger bidrag till summan i (6.20), och sambandet reduceras till X s (ω) = 1 T s X a (ω), ω < ω s /2 (6.22) Den kontinuerliga signalens spektrum X a (ω) kan då entydigt beräknas ur den diskreta 82
{x a (nt s )} (6.14) X s (ω) (6.21) (6.20) (6.23) x a (t) (6.15) X a (ω) Figur 6.6: Rekonstruktion av bandbegränsad kontinuerlig signal från samplad sekvens via Fouriertransformerna. sekvensens spektrum X s (ω) enligt X a (ω) = { Ts X s (ω), ω < ω s /2 0, ω ω s /2 (6.23) Å andra sidan ges signalen x a (t) av (6.15), så att Här är x a (t) = 1 = 1 ωs /2 ω s/2 = T s = T s = T s ωs /2 ω s/2 ωs /2 X a (ω)e jωt dω ω s/2 ωs/2 [ ω s /2 n= e jω(t Tsn) dω = X a (ω)e jωt dω X s (ω)e jωt dω x a (T s n)e jωt sn ] e jωt dω [(6.14)] n= ωs/2 x a (T s n) = = ω s /2 Insättning i (6.24) och beaktande av att ω s = /T s ger x a (t) = = T s n= n= e jω(t T sn) dω (6.24) ejω(t Tsn) ω s/2 j(t T s n) ω= ω s /2 1 [ e j(t T s n)ω s /2 e ] j(t T sn)ω s /2 j(t T s n) 2 t T s n sin((t T sn)ω s /2) (6.25) x a (T s n) 2 t T s n sin((t T sn)ω s /2) x a (T s n) sin((t T sn)ω s /2) ω s (t T s n)/2 83 (6.26)
x a F x f A/D x d Figur 6.7: Analog-till-digital omvandling. vilket är (6.21). 6.3 Praktisk analog-till digital och digital-till-analog omvandling Samplingsteoremet ger den teoretiska grunden för vad som är möjligt vid diskret representation av en analog signal, och hur den analoga signalen kan rekonstrueras från den diskreta sekvensen. I praktiken realiseras signalomvandlingarna med hjälp av filter av ändlig ordning samt A/D- och D/A-omvandlare, som har en ändlig resolution. 6.3.1 Praktisk analog-till-digital omvandling Från samplingsteoremet vet vi att då en kontinuerlig signal samplas, så ger frekvenser som är högre än halva samplingsfrekvensen upphov till en aliaseffekt. I praktiken innehåller kontinuerliga signaler s.g.s. alltid högfrekventa komponenter. För att undvika aliaseffekten bör dessa filtreras bort före sampling. Detta åstadkommas genom att införa ett lågpassfilter före A/D-omvandlaren enligt figur 6.7. Filtret F kallas antialias-filter. Antag att signalen x a (t) har spektret X a (ω). Filtret F i figur 6.7 påverkar frekvenskomponenterna i den analoga signalen x a enligt X f (ω) = F (jω)x a (ω) (6.27) där F (s) anger överföringsoperatorn hos filtret F, och X f (ω) är spektret hos den filtrerade signalen x f (t). Ett lågpassfilter karakteriseras av ett lågfrekvent passband ω ω 1, där F (jω) 1, och ett högfrekvent spärrband ω ω 2, där F (jω) << 1. Intervallet ω 1 < ω < ω 2 utgör ett övergångsband mellan passband och spärrband. För att undvika aliaseffekten bör filtret F väljas så att frekvenser som är högre än halva samplingsfrekvensen finns i spärrbandet, dvs ω 2 < ω s /2. De frekvenskomponenter som man önskar bevara i den diskreta signalrepresentationen bör befinna sig i passbandet. Dämpningen av frekvensen ω enligt (6.27) ges av förhållandet X f (ω) X a (ω) = F (jω) (6.28) 84
Filterförstärkningar och förhållandet mellan signalers storlek brukar anges i en speciell logaritmisk skala som kallas decibel (db). Förstärkningen F (jω) i (6.28) angiven i decibel är 20 log( F (jω) ) decibel. Faktorn 20 kommer från det faktum, att 20 log( F (jω) ) = 10 log( F (jω) 2 ). Från avsnitt 3.3.1 har vi att en signals energi vid en frekvens är proportionell mot spektrets kvadrat vid frekvensen. En decibel är alltså 10 ggr logaritmen av energin. En decibel är en tiondedel av log( F (jω) 2 ), som ej oväntat kallas bel, och som fått sitt namn efter Alexander Graham Bell (1847 1922). Det analoga lågpassfiltret bör implementeras i form av en elektronisk krets och konstrueras i praktiken vanligen med hjälp av standardkomponenter. En vanlig typ av lågpassfilter är Butterworth-filtren. Ett Butterworth-filter B n (s) av ordningen n är konstruerad så att dess frekvensförstärkning är [ ] 1/2 1 B n (jω) = (6.29) 1 + (ω/ω c ) 2n Här anger ω c filtrets bandbredd, och är en frekvens mitt i övergångsbandet, så att B n (jω c ) = 1/ 2. Ju högre filterordningen n är, desto brantare övergång mellan passbandet och spärrbandet fås. Filtrets bandbredd anges ofta i Hz; f c = ω c /(). Formeln för filtrets förstärkning kan då uttryckas som [ ] 1/2 1 B n (jω) =, där f = ω (6.30) 1 + (f/f c ) 2n Figurerna 6.8 och 6.9 visar förstärkningen hos Butterworth filter i linjär respektive logaritmisk skala. 1.2 1 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 Figur 6.8: Förstärkning hos Butterworth filter med n = 1, 2, 4 och 8. Vid specifikationen av antialias-filtret är det också ändamålsenligt att beakta resolutionen vid A/D-omvandlingen. I praktiken konstrueras filtret således så, att det dämpar frekvenser ovanför Nyquistfrekvensen ω s /2 till en nivå som inte påverkar A/Domvandlaren. Detta är fallet om det kan garanteras att frekvenserna dämpas till en nivå som understiger kvantiseringsbruset i A/D-omvandlaren. 85
0 20 40 60 80 10 1 10 0 10 1 Figur 6.9: Förstärkning hos Butterworth filter med n = 1, 2, 4 och 8 i logaritmisk skala (db). Kvantiseringsfelet vid A/D-omvandling kan bestämmas på följande sätt. Vid digital representation kan signalvärdena ej anta vilka realtalsvärden som helst, utan avrundas till en av 2 B nivåer, som beror av antalet binära siffror som används vid representationen. Detta introducerar ett kvantiseringsfel e. Om V anger hela talområdet som skall representeras, så ges avståndet q mellan kvantiseringsnivåerna av q = V/(2 B 1) V/2 B (6.31) Om man antar att det analoga signalvärdet avrundas till närmaste kvantiseringsnivå är det maximala kvantiseringsfelet ±q/2. En skattning av den genomsnittliga storleken hos kvantiseringsfelet kan bestämmas genom att anta att det är likformigt fördelat i intervallet [ q/2, q/2]. Det har då en konstant sannolikhetstäthetsfunktion P (e) = q 1, väntevärdet noll, och variansen ges av q/2 q/2 σe 2 = e 2 P (e)de = 1 e 2 de q/2 q q/2 = 1 e 3 q/2 = 1 [ q 3 q 3 3q 8 ( q3 ) ] 8 e= q/2 = q2 12 (6.32) Exempel 6.4. Betrakta ett system för analog-till-digital omvandling med samplingsfrekvensen 100 khz. Det krävs att felet på grund av aliasfenomenet är högst 2% av signalnivån. Man använder ett Butterworth filter av första ordningen, och önskar bestämma lämplig bandbredd för filtret. 86
Det gäller alltså att bestämma lämpligt värde för frekvensen ω c i ekvation (6.29) för Butterworth-filtrets förstärkning. Kravet att felet på grund av aliasfenomenet skall vara högst 2% av signalnivån motsvarar enligt (6.28), X f (ω) X a (ω) = B n(jω) < 0.02, alla ω > ω N I detta fall är Nyquistfrekvensen ω N = 1 100 2 103 = 10 5 π (rad/s). Kravet uppfylls av ett Butterworth filter av första ordningen om frekvensen ω c väljs så att [ 1 1 + (ω/ω c ) 2 ] 1/2 < 0.02 gäller för alla ω > ω N. Detta är fallet om [ ] 1/2 [ 1 = 1 ] 1/2 < 0.02 1 + (ω N /ω c ) 2 1 + (10 5 π/ω c ) 2 som ger ω c = 10 3, eller f c = 1.0 khz. Problem 6.2. Bestäm lämpligt värde för frekvensen ω c om man använder ett Butterworth-filter av fjärde ordning i exempel 6.4. Exempel 6.5. Betrakta problemet att bestämma lämplig samplingsfrekvens och antialias-filter då man använder en 12 bitars A/D-omvandlare, och det intressanta frekvensbandet som man önskar representera i den digitala signalen består av frekvenser mellan 0 och 4 khz. För att aliaseffekten ej skall påverka diskretiseringen skall antialias-filtret dämpa frekvenser som ger upphov till aliaseffekt till en nivå som motsvarar kvantiseringsfelets storlek. Kvantiseringsfelets storlek är maximalt q/2, där q = V/(2 B 1) V/2 B, och V anger insignalens maximala amplitud. Om vi betraktar kvantiseringsfelet statistiskt som ett brus, så är dess genomsnittliga storlek enligt (6.32) σ e = q/ 12 = q/(2 3). För att garantera att en signal av maximal storlek V dämpas till en nivå som motsvarar kvantiseringsfelets storlek bör frekvenserna i spärrbandet dämpas minst med faktorn V/σ e 3 2 B+1. I detta exempel antogs B = 12, och vi har således kravet X f (ω) X a (ω) 1 3 2 B+1 = 1 = 83 db B=12 14189 Antialias-filtret bör således satisfiera F (jω) 1/14189 för alla ω ω s /2. Om vi som antialias-filter väljer ett Butterworth filter, så får vi villkoret [ ] 1/2 1 1 1 + (f/f c ) 2n 14189, f f s/2 87
Om vi väljer f c = 4 khz (motsvarande den högsta frekvens som skall representeras) och filterordningen n = 6 (ett vanligt använt Butterworth filter) fås [ ] 1/2 1 = 1 1 + (f/4) 12 14189 vid f 20 khz Det följer att samplingsfrekvensen skall vara minst f s = 2 20 khz = 40 khz. Vi skall till slut även uppskatta aliasfelet vid 4 khz. Det största bidraget till aliasfelet vid denna frekvens härstammar från aliasfrekvensen f s 4 khz, alltså den frekvens i intervallet (f s /2, f s ), som genom frekvensvikning blandas med frekvensen 4 khz, jämför avsnitt 6.1. Frekvensen f s 4 khz = 36 khz dämpas med faktorn [ 1 ] 1/2 = 1.88 10 6 1 + (36/4) 12 Då en signal vid f c = 4 khz av Butterworth filtret dämpas med faktorn 1/ 2, är förhållandet mellan aliasfelet och signalnivån vid 4 khz approximativt (1.88 10 6 )/(1/ 2) = 2.7 10 6. 6.3.2 Praktisk digital-till-analog omvandling Shannons rekonstruktionsformel (6.21) definierar den ideala rekonstruktionsformeln, som exakt rekonstruerar en bandbegränsad signal. Formeln är emellertid främst av teoretiskt intresse, och är inte speciellt användbar i praktiken. En begränsning hos (6.21) är att x a (t) är en funktion av alla sampel x a (T s n), < n <. Formeln lämpar sig därför i allmänhet inte för realtidstillämpningar, eftersom beräkning av x a (t) kräver kunskap om (alla) framtida sampelvärden x a (T s n), med T s n > t. En annan egenskap som begränsar användningen av (6.21) är det faktum att vikterna sin((t T s n)ω s /2)/(ω s (t T s n)/2) konvergerar rätt långsamt mot noll då t T s n växer, vilket medför att många termer bör medtas för att approximera summan i (6.21) noggrant. Vid digitala implementeringar har den ideala rekonstruktionsformeln dock funnit praktiska tillämpningar, jämför nedan. På grund av dessa orsaker används i praktiken rekonstruktionsmetoder som är enklare att implementera. Den ideala rekonstruktionsformeln (6.21) ger en insikt i hur en sådan metod skall konstrueras. Man kan enkelt visa att signalen x a (t) enligt (6.21) ges som utsignalen från ett idealt lågpassfilter, vars insignal är sekvensen {x a (T s n)}. Det ideala lågpassfiltret har förstärkningen 1 för ω ω s /2 och förstärkningen 0 för ω > ω s /2. Ett sätt att approximera den ideala rekonstruktionsformeln är därför att använda ett reellt, icke-idealt, analogt lågpassfilter H med en lämpligt vald bandbredd ω b < ω s /2. Jämför figur 6.10. Ett reellt filter har alltid ett övergångsband mellan passbandet, där förstärkningen är ungefär 1, och spärrbandet, där förstärkningen är liten. Ju smalare övergångsbandet är, desto högre krav ställs på det analoga filtret. Vid rekonstruktion av en bandbegränsad signal med bandbredden ω max bör ω max befinna sig i filtrets passband, 88
D/A x d x H xa Figur 6.10: Digital-till-analog omvandling. för att alla frekvenser hos signalen skall fås med, medan Nyquistfrekvensen ω N = ω s /2 bör befinna sig i filtrets spärrband, för att undvika aliasfrekvenser. Ju mindre skillnaden ω N ω max är, desto högre krav ställs således på rekonstruktionsfiltret. Det är av denna orsak som signalen i en CD-spelare översamplas med fyrfaldig frekvens 4 f s = 4 44.1 khz före D/A omvandling. Översamplingen lämnar ω max oförändrad, men fyrdubblar ω s /2. Detta gör den maximalt tillåtna bredden hos det analoga filtrets övergångsband betydligt större, vilket medger mera realistiska filterspecifikationer för det analoga rekonstruktionsfiltret. I den översamplade signalen bör de mellanliggande signalvärdena {x a (T s n+t s /4)}, {x a (T s n+2t s /4)} och {x a (T s n+3t s /4)} rekonstrueras från sekvensen {x a (T s n)}, men då detta kan göras digitalt utgör strikta filterspecifikationer inget problem. I CD-teknik rekonstrueras de tre mellanliggande signalvärdena med hjälp av den ideala rekonstruktionsformeln (6.21). CD-spelaren använder således också framtida signalvärden. Det analoga filtret som rekonstruerar den kontinuerliga signalen bör däremot implementeras i form av hårdvara med hjälp av elektroniska kretsar. Valet av lågpassfiltret H efter D/A-omvandlaren beror av funktionen hos D/Aomvandlaren. En vanlig typ av D/A-omvandlare producerar en styckevis konstant utsignal enligt x(t) = x d (nt s ), nt s t < nt s + T s (6.33) Detta slags element kallas för nollte ordningens hållkrets (eng. zero-order hold; ZOH), eftersom signalen x(t) mellan samplingstidpunkterna kan uppfattas som utsignalen från ett nollte ordningens system. Spektret hos den kontinuerliga utsignalen från en nollte ordningens hållkrets fås enligt definitionen, X(ω) = Här ges integralen av nts+t s nt s e jωt dt = x(t)e jωt dt = Ts 0 n= nts+ts x d (nt s ) e jωt dt (6.34) nt s e jω(t +nt s ) dt [t = t nt s ] Ts = e jωnts e jωt dt 0 = e jωnt 1 [ s e jωt s 1 ] ( jω) 89
= e jωnts 1 jω e jωts/2[ e jωts/2 e jωts/2] = e jωnt s e jωt s/2 T s sin(ωt s /2) ωt s /2 = e jωnts T s ZOH(ω) (6.35) där vi infört beteckningen ZOH(ω) = e jωts/2 sin(ωt s/2) ωt s /2 (6.36) Insättning i (6.34) ger X(ω) = T s n= x d (nt s )e jωnts ZOH(ω) (6.37) Här observerar vi i enlighet med (6.14) att spektret X d (ω) hos den diskreta sekvensen {x(nt s )} är X d (ω) = x d (nt s )e jωnt s (6.38) så att (6.37) kan skrivas som n= X(ω) = ZOH(ω) T s X d (ω) (6.39) Denna ekvation ger spektret hos den kontinuerliga utsignalen från en nollte ordningens hållfunktion som funktion av den diskreta sekvensens spektrum. Faktorn T s = /ω s kompenserar för det faktum att det diskreta spektret X d (ω) definierats för en sekvens som samplats med perioden T s, och den har motsvarande funktion som faktorn 1/T s som förekommer i ekvation (6.20). Ekvation (6.39) definierar spektret hos den kontinuerliga utsignalen x(t) från en nollte ordningens hållfunktion för alla frekvenser. Observera att det diskreta spektret X d (ω) är periodiskt med perioden ω s ; X d (ω + ω s l) = X d (ω) (jämför t.ex. ekvation (6.38)). Spektret X(ω) består således av alla aliasfrekvenser till frekvenserna hos den diskreta signalen. Dessutom viktas de olika frekvenserna med faktorn ZOH(ω), som karakteriserar hållfunktionens dynamik. Figur 6.11 illustrerar den diskreta signalen {x(nt s )}, den kontinuerliga signalen x(t) från hållkretsen, samt spektren i ekvation (6.39). Funktionen ZOH(ω) är densamma som förekom i exempel 3.5. Vi såg tidigare att funktionen innehåller en betydande mängd högfrekventa komponenter (jämför anmärkning 3.4), som bör filtreras bort för att ej ge upphov till icke-önskade sidoeffekter i den rekonstruerade analoga signalen. För att korrekt rekonstruera den analoga signalen filtreras x(t) enligt figur 6.10. Den analoga signalen x a (t) i figur 6.10 har spektret X a (ω) = H(jω) ZOH(ω) T s X d (ω) (6.40) 90
x d (nt s ) X d (ω) nt s 0 ω s 2ω s x(t) ZOH(ω) X(ω) t 0 ω s 2ω s Figur 6.11: Signalerna {x(nt s )} och x(t) samt frekvensfunktionerna i ekvation (6.39). Enligt sambandet (6.20) eller (6.23) är vid ideal rekonstruktion X a (ω) = T s X d (ω) för frekvenser ω < ω s /2 och X a (ω) = 0 för högre frekvenser. Valet av lågpassfiltret H kan göras på basen av ekvation (6.40) så att ideal rekonstruktion approximeras till en specificerad noggrannhet. Exempel 6.6. Betrakta rekonstruktionen av en analog audiosignal enligt figur 6.10 med en nollte ordningens hållfunktion. Signalen är bandbegränsad med bandbredden 20 khz. Samplingsfrekvensen är 176.4 khz. Det krävs att aliasfrekvenser dämpas med minst 50 db och de intressanta signalkomponenterna får ändras med maximalt 0.5 db. Figur 6.12 illustrerar det diskreta spektret X d (ω) samt faktorn ZOH(ω) från nollte ordningens hållfunktion. Enligt (6.39) dämpar nollte ordningens hållfunktion frekvenser vid 20 khz med faktorn ZOH(ω) = sin(ωt s/2) ωt s /2 = 0.9790 = 0.184 db vid ω = 20 10 3 Den totala dämpningen av produkten av nollte ordningens hållfunktion och filtret H ges av H(jω) ZOH(ω) = H(jω) ZOH(ω). Från den logaritmiska definitionen av decibelskalan följer att den totala dämpningen i decibel helt enkelt är summan av de enskilda dämpningarna angivna i decibel, 20 log( H(jω) ZOH(ω) ) = 20 log( ZOH(ω) ) + 20 log( H(jω) ) (db) Det följer således från specifikationerna att filtret H får ha maximalt en dämpning motsvarande 0.5 0.184 = 0.316 db vid 20 khz. Med andra ord skall filtrets H förstärkning vid 20 khz satisfiera olikheten 20 log( H(jω) ) 0.316 db. 91
Eftersom signalen är bandbegränsad försvinner det diskreta spektret X d (ω) för frekvenser mellan 20 khz och Nyquistfrekvensen 88.2 khz. Det följer att X d (ω) = 0 också för frekvenser mellan 88.2 khz och frekvensen (176.4 20) khz. Enligt (6.39) är den lägsta aliasfrekvens som påverkar signalen således frekvensen (176.4 20) khz, ty på grund av periodiciteten är X d (ω) ekvivalent vid ω = 176.4 20 khz och ω = 20 khz. Enligt (6.39) dämpas frekvenser vid 176.4 20 = 156.4 khz med faktorn ZOH(ω) = sin(ωt s/2) ωt s /2 = 0.125 = 18 db vid ω = 156 10 3 Det följer från specifikationerna att filtret H bör dämpa frekvenser vid 156.4 khz ZOH(ω) X d (ω) 0.184 db 18 db 0 20 156.4 176.4 f (khz) Figur 6.12: Diskreta signalens spektrum X d (ω) och faktorn ZOH(ω) i exempel 6.6. minst med en faktor motsvarande 50 18 = 32 db. Med andra ord skall filtrets H förstärkning vid 156.4 khz satisfiera olikheten 20 log( H(jω) ) 32 db. Om vi antar ett Butterworth filter med ordningen n och bandbredden f c får vi från ovan villkoren 20 log[1 + (20/f c ) 2n ] 1/2 0.316 db 20 log[1 + (156.4/f c ) 2n ] 1/2 32 db Det minsta (heltals) n för vilket dessa olikheter satisfieras är n = 3, varvid t.ex. valet f c = 32 khz uppfyller specifikationerna. 92
6.3.3 Några exempel från digital kommunikation Viktiga tillämpningar av digital representation av analoga signaler finns inom digital kommunikation. Som tidigare konstaterats, kan bitsekvenser överföras genom modulering av bärvågor. Bitsekvenserna i sin tur representerar symbolsekvenser. Dessa kan kan i sin tur bestå av de diskreta signaler som representerar en bandbegränsad signal. En standardmetod för att bestämma den digitala representationen av en analog signal är pulskodmodulering (eng. pulse-code modulation PCM). Vid denna samplas den analoga, bandbegränsade, signalen vid ekvidistanta tidpunkter genom multiplikation med en pulssekvens (se figur 6.13). Resultatet kvantiseras och representeras digitalt. Då endast en bråkdel av den totala samplingsperioden T s behövs för processering och överföring av den digitalt kodade signalen, är det möjligt att använda samma kommunikationskanal (frekvensband) för samtidig överföring av flera signaler. Detta kan åstadkommas genom att tilldela de olika signalerna antingen var sin tidsslot (TDMA Time Division Multiple Access) eller kodord (CDMA Code Division Multiple Access). TDMA Principen för TDMA (Time Division Multiple Access) visas i figur 6.14 och den praktiska implementering av förfarandet visas schematiskt i figur 6.15. TDMA används t.ex. i GSM mobiltelefonsystem för parallell överföring av flera signaler på samma kommunikationskanal. T s Figur 6.13: Pulskodmodulering. Analog signal (överst) modulerar en pulssekvens (i mitten) och resultatet ger efter kvantisering en digital samplad signal (nederst). 93
T s Figur 6.14: Pulskodmodulering och TDMA. Flera analoga signaler kan överföras på samma kanal genom pulskodmodulering. CDMA En svaghet hos TDMA är att om signalöverföringen är korrumperad av brus, kan symbolen under en tidsslot som hänför sig till en enskild signal lätt tappas bort helt. En metod som är mera robust mot brus fås genom att i stället sprida de enskilda signalernas symboler över alla tidslots genom att representera de olika symbolerna med hjälp av givna kodord. För att inse hur detta kan åstadkommas betrakta ett trivialt exempel där fyra separata signaler sänds över samma kanal. Antag att under ett samplingsintervall symbolerna s 1, s 2, s 3 och s 4 associerade med de fyra signalerna skall sändas. I TDMA skulle då symbolerna sändas separat under samplingsintervallet som den diskreta sekvensen {x(1), x(2), x(3), x(4)} = {s 1, s 2, s 3, s 4 }. I CDMA däremot sprids symbolerna över hela sekvensen {x(n), n = 1, 2, 3, 4} med hjälp av lämpligt valda kodord. Tag t.ex. de fyra kodordsekvenserna {c 1 (n)} = {1, 1, 1, 1} {c 2 (n)} = {1, 1, 1, 1} {c 3 (n)} = {1, 1, 1, 1} {c 4 (n)} = {1, 1, 1, 1} Observera att kodordssekvenserna är ortogonala, dvs 4 c k (n)c l (n) = n=1 I CDMA representeras symbolen s 1 { 0, om k l 4, om k = l med hjälp av kodsekvensen {c 1 (n)} i form av 94
x 1 lågpassfilter (antialias) G LP lågpassfilter (rekonstruktion) G LP y 1 x 2 G LP P CM kanal P CM G LP y 2 x M. G LP pulskodmodulering kommunikationskanal pulskoddemodulering. G LP y M Figur 6.15: Principskiss av ett TDMA system. De inkommande analoga (tidskontinuerliga) signalerna x i lågpassfiltreras och fördelas tidsslots med en multiplexer. Den resulterande signalen pulskodmoduleras till en sekvens digitala symboler som kan transmitteras med hjälp av en bärvåg (jfr avsnitt 3.1.1). Den mottagna signalen demoduleras till en tidsdiskret signalsekvens, ur vilken de enskilda signalerna rekonstrueras med hjälp av en multiplexer (synkroniserad med sändarens) samt analoga rekonstruktionsfilter. sekvensen {s 1 c 1 (n), n = 1, 2, 3, 4}, symbolen s 2 representeras analogt som sekvensen {s 2 c 2 (n), n = 1, 2, 3, 4}, symbolen s 3 som sekvensen {s 3 c 3 (n), n = 1, 2, 3, 4} och symbolen s 4 som sekvensen {s 4 c 4 (n), n = 1, 2, 3, 4}. Den transmitterade signalen {x(n), n = 1, 2, 3, 4} tas sedan som summan av de enskilda symbolernas sekvenser, x(n) = s 1 c 1 (n) + s 2 c 2 (n) + s 3 c 3 (n) + s 4 c 4 (n), n = 1, 2, 3, 4 (6.41) I motsats till TDMA sprids de olika symbolerna alltså över alla element i den transmitterade signalen. Tack vara kodsekvensernas ortogonalitet (6.41) kan den korrekta symbolen enkelt bestämmas vid mottagaren: värdet hos symbolen s k fås helt enkelt genom att multiplicera den transmitterade signalen {x(n)} elementvis med motsvarande kodordsekvens c k (n), dvs 1 4 4 x(n)c k (n) = 1 4 [s 1 c 1 (n) + s 2 c 2 (n) + s 3 c 3 (n) + s 4 c 4 (n)] c k (n) n=1 4 n=1 = s k (6.42) CDMA används i 3G (tredje generationens mobiltelefoni). Bandbredd och symbolhastighet Nyquists och Shannons samband mellan kontinuerliga och diskreta signalrepresentationer har intressanta implikationer för symbolhastigheten, dvs antalet symboler som 95
kan transmitteras per tidsenhet över en kommunikationskanal med given bandbredd. Vi har sett att det finns ett entydigt samband mellan spektren hos en diskret sekvens med samplingsfrekvensen f s och en kontinuerlig bandbegränsad signal med bandbredd < f s /2. Enligt (6.22) består den kontinuerliga signalens spektrum då av exakt samma frekvenskomponenter som den diskreta signalens spektrum. Det följer att den kontinuerliga signalen bör ha samma bandbredd som den diskreta signalen för att tillåta ett entydigt samband mellan signalerna. Eftersom en diskret signal med samplingsfrekvensen f s kan ha ett spektrum bestående av frekvenser upp till f s /2, följer att en associerad kontinuerlig signal också består av frekvenskomponenter upp till f s /2. Vid amplitudmodulering av en bärvåg upptar en sådan signal bandbredden f s (jfr avsnitt 3.1.1). Från det ovan nämnda följer följande fundamentala resultat: Maximala symbolhastigheten hos en brusfri kommunikationskanal med bandbredden f är f symboler per sekund. 96