Metod för manipulation av prosodi i naturligt tal. Christer Ahlström

Storlek: px
Starta visningen från sidan:

Download "Metod för manipulation av prosodi i naturligt tal. Christer Ahlström"

Transkript

1 Examensarbete Metod för manipulation av prosodi i naturligt tal av Christer Ahlström LiTH-IDA-Ex-2/

2 Linköpings universitet Institutionen för datavetenskap Examensarbete Metod för manipulation av prosodi i naturligt tal av Christer Ahlström LiTH-IDA-Ex-2/ Handledare och examinator: Bertil Lyberg

3 SAMMANFATTNING Detta arbete går ut på att förändra en talsignals prosodiska egenskaper. Matematiskt sett betyder det att tiden och frekvensen ska kunna skalas oberoende av varandra, ett till synes olösbart problem. Tre olika metoder för manipulation av prosodin har studerats. Den första, PSOLA, är en klassisk metod som arbetar i tidsdomänen. Skalningar utförs genom att stycka upp signalen i korta bitar och sätta samman dem med ett nytt avstånd sinsemellan. Om signalen inte behöver skalas mycket är detta en bra metod, både med avseende på beräkningsintensitet och röstkvalitet. Den andra metoden, LPC, bygger på källa/filter-teorin. Ett pulståg driver ett tidsvariabelt filter som definieras av en autoregressiv modell. Resultaten blir tyvärr aldrig riktigt bra. LPC:s stora styrka ligger snarare i talkodningssammanhang där metoden erbjuder en kraftigt komprimerad representation av talet. Den tredje och sista metoden, sinusmodellering, delar upp signalen i parametrar för frekvens, fas och amplitud. Rekonstruktionen matar in dessa parametrar i en cosinusoscillator som återskapar signalen. Stora skalfaktorer kan hanteras medan de stora nackdelarna är tunga beräkningar och vissa problem med injustering av modellen. Den sinusmodell jag utgått från har två problem. Dels ger den ifrån sig klickande ljud och dels förändras formantstrukturen vid frekvensskalning. Dessa brister har rättats till vilket beskrivs i rapporten. De tre metoderna har implementerats i en enkel demonstrator med grafiskt gränssnitt. Denna är till för att det ska gå att testa de undersökta algoritmerna utan att behöva bry sig om de underliggande beräkningarna. iii

4 IV

5 INNEHÅLL 1. Inledning Uttryck och facktermer Användningsområden Rapporten och dess upplägg Tack Pitchdetektering Vad är grundfrekvens? Automatisk detektering av grundfrekvens Tidsdomänen Cepstrumdomänen Frekvensdomänen Feldetektering En jämförelse mellan metoderna TD-PSOLA Pitch- och tidsskalning En ny variabel fönsterfunktion Resultat Kommentarer och förbättringar Linjärprediktion Den autoregressiva modellen Pitch- och tidsskalning Residualen som excitationsignal Resultat Kommentarer och förbättringar Sinusmodellering Frekvensspår Frekvens- och tidsskalning Formantbevarande pitchskalning Förbättring av fasinterpolationen Resultat Kommentarer och förbättringar...4 v

6 VI 6. Demonstrator Funktionalitet Implementation och design Tidsuppskattning Jämförelser och slutsatser Tidsskalning Pitchskalning Mina förbättringsförslag När passar vilken metod bäst? Fönsterstorlek igen Begränsningar och framtida arbete Bibliografi 53 Bilaga A.Brusreducering 55 Bilaga B.Filsystem 57

7 1. INLEDNING Bakom den humanistiskt klingande rubriken Metoder för manipulation av prosodi i naturligt tal döljer sig ett komplicerat signalbehandlingsproblem. Det är en svår uppgift att manipulera talets grundton och utsträckning i tiden. Manipulationen medför kortfattat att dualerna tid och frekvens ska skalas oberoende av varandra. Problemet visas tydligt om en tidsskalning utförs genom att spela upp ett meddelande med dubbla hastigheten. Resultatet blir en frekvenshöjd röst som låter som Piff och Puff. Visserligen ganska roligt att lyssna till, men inte särskilt användbart. Syftet med arbetet har varit att studera och eventuellt vidareutveckla olika metoder för oberoende tids- och pitchskalning. Någon av de studerade metoderna skulle även implementeras i en demonstrator. Eftersom metoderna som studerats är minst 15 år gamla har det funnits tid för tekniken att mogna vilket gjort det mycket svårt att hitta revolutionerande förbättringar. 1.1 Uttryck och facktermer Vardagligt förekommande termer inom signalteorin förutsätts läsaren känna till. Dessa innefattar begrepp som faltning, filter, fönster, fouriertransform och autokorrelation. Termer som hör hemma i talteknologin är kanske inte lika välkända för den tänkte läsaren. De flesta av dessa förklaras därför i början av kapitel 2. För att undvika förvirring kan jag redan nu nämna att pitch och grundfrekvens är samma sak (den mänskliga lyssnaren uppfattar den lägsta frekvensen, grundfrekvensen, som talarens pitch [1]) och att segmentduration är utsträckningen i tiden för ett kort segment av en talsignal. Begreppet prosodi är ett samlingsnamn som betecknar användandet av tryckstyrka, tonhöjdsförhållande och temporala varaktighetsförhållanden i talet [2]. En mer beskrivande beteckning skulle kunna vara satsmelodi. 1

8 2 INLEDNING 1.2 Användningsområden Det finns ett stort antal intressanta användningsområden. Här redovisas ett axplock. Hjälpmedel för hörselskadade Genom att spela upp talet långsammare blir det tydligare och därmed lättare att uppfatta. Hjälpmedel för synskadade Taltidningar och talböcker har en stor nackdel jämfört med pappersutgåvor, det går inte att snabbt ögna igenom innehållet. Om det däremot gick att spela upp talet med en högre hastighet skulle man kunna lyssna igenom materialet på samma sätt som man skummar en text. Denna tidsflaskhals är även tydlig i många andra applikationer. Talande gränssnitt till datorer och snabbavlyssning av telefonsvarare är några exempel. Text-till-tal-system Vid konkateneringssyntes sätter man samman korta talfragment till ord och meningar. Fragmentens grundton får inte vara olika i de olika bitarna för då blir inte ljudet enhetligt. Eftersom det är orimligt att bygga databaser med alla möjliga grundtonsvariationer behöver man skala frekvensen. Detta är även ett krav för att kunna ändra prosodin och därmed göra en mer naturlig syntes. Talanalys Intonationsmodeller för olika dialekter kan studeras genom att manipulera de prosodiska parametrarna olika i olika delar av en inläst mening. Det går då exempelvis att överföra en dialekt till en annan (med begränsningen att många dialekter byter ut ord, stavelser och fonem). 1.3 Rapporten och dess upplägg Svårighetsgraden på denna rapport är anpassad så att en blivande civilingenjör i datateknik, elektroteknik eller liknande ska kunna läsa och förstå innehållet. Vissa avsnitt kräver lite mer av läsaren än andra men i det stora hela hoppas jag att materialet ska vara översiktligt och lättsmält. Överlag har jag inte ägnat mig åt petitesser och finlir utan koncentrerat mig på det centrala i varje metod. För att ändå återge de fällor, genvägar och erfarenheter jag funnit finns i många kapitel rubriken Kommentarer och förbättringar. Där har jag försökt att samla mina lärdomar angående sådant som normalt inte står i litteraturen. En stor del av uppgiften var att studera befintliga metoder och mängden teori i rapporten har anpassats därefter. Det är svårt att dra en klar linje mellan vad jag läst mig till och vad jag kommit fram till själv. Överlag är dock Kommentarer och förbättringar egna tankar men även andra delar är egna påfund, t.ex. avsnitt 3.2 om variabla fönster och avsnitt 5.4 om fasinterpolation. Av samma orsak vill jag

9 1.4 TACK 3 be om ursäkt för den knappa hänvisningen till referenser. Om samma material återges i flera olika källor ser man det snart som känd kunskap vilket inte behöver refereras. Många resultat bygger på hur jag uppfattar kvaliteten på det modifierade ljudet. Eftersom det är svårt att vara objektiv och kritisk mot sitt eget arbete bör dessa tas med en nypa salt. I rapporten illustreras ett fåtal talsignaler för att beskriva metoderna. Resultaten bygger dock på ett tiotal olika meningar som lästs in av både manliga och kvinliga talare på olika språk. Det finns många mer eller mindre bra metoder för att skala tid och frekvens. De flesta bygger dock på någon av tre olika principer. Dessa beskrivs i kapitel 3 till kapitel 5. Vissa av metoderna behöver ett bra estimat av pitchfrekvensen varför kapitel 2 behandlar automatisk pitchdetektering. För att knyta samman resultaten jämförs alla metoderna i kapitel 7. Metoderna har implementerats i en enkel demonstrator med grafiskt gränssnitt. Denna är till för att det ska gå att testa de undersökta algoritmerna utan att behöva bry sig om de underliggande beräkningarna. Demonstratorn beskrivs i kapitel Tack Ett stort tack till alla som tycker sig behöva en klapp på axeln. Speciellt vill jag tacka min handledare och tillika examinator Bertil Lyberg, Mustapha Skhiri och Sonia Sangari för mycken hjälp och trevligt sällskap i labbet samt Samuel Björkman och Tomas Lingvall för idogt korrekturläsande. Samtidigt vill jag passa på att skylla eventuella fejl och mistag på nyss nämnda korrekturläsare.

10 4 INLEDNING

11 2. PITCHDETEKTERING Vad är grundfrekvensen i naturligt tal, hur uppkommer den och hur kan den detekteras? Dessa frågor diskuteras i detta kapitel varefter olika metoder för automatisk pitchdetektering studeras. 2.1 Vad är grundfrekvens? Människans tal bildas genom att luft pressas från lungorna via luftstrupen, struphuvudet, svalget och vidare genom mun- och ibland näshålan. Struphuvudet består av ett antal rörliga brosk som med hjälp av olika muskler och ligament kan kontrollera röstspringan (glipan mellan stämbanden, även kalld glottis). Då springan är sluten kommer utandningsluften att pressas fram mellan stämbanden som då börjar vibrera. Den frekvens som stämbanden svänger med kallas f eller grundfrekvensen. De ljud som uppstår då stämbanden vibrerar kallas tonande. I normalt tal är alla vokaler och vissa konsonanter tonande. Tonlösa ljud bildas med röstspringan i en öppnare ställning utan stämbandsvibration. Svalget, munhålan och näshålan färgar ljudet då det passerar de övre talorganen. Håligheterna fungerar som resonatorer vars resonansegenskaper förändras då hålrummen ändrar storlek och form. De sammankopplade luftkropparna bidrar tillsammans till en förstärkning av vissa deltoner. De områden av frekvensskalan där deltonerna förstärkts kallas formanter, se figur 2-1 på sida 6. Om ljudet som skapas vid stämbanden tjänstgör som insignal g(t) så skulle de övre talorganen kunna liknas vid ett tidsvariabelt filter, H t. Denna liknelse gentemot ett linjärt system är mycket användbar vid modellering av talsystemet. Separationen av glottispulserna och de övre talorganen gör det nämligen mycket enklare att till exempel skala grundfrekvensen. 5

12 6 PITCHDETEKTERING Relativ amplitud f f f F 1 F 2 F 3 f Pulser från stämbanden g(t) Övre talorganen H t x(t) Tal som kommer ut från munnen Figur 2-1: Insignalen till filtret skapas då luft passerar stämbanden. Frekvensen f är den frekvens som stämbanden vibrerar med. Överföringsfunktionen bildas av resonatorer i de övre talorganen och ger här upphov till formanterna F1, F2 och F3 i utsignalen. 2.2 Automatisk detektering av grundfrekvens Detektering av grundfrekvensen är viktigt i många talbehandlingsproblem. Det finns många olika metoder som alla har sina för- och nackdelar. De tre huvudsakliga kategorierna bygger på att talsignalen behandlas i tids-, frekvens- eller cepstrumdomänen. Var och en av dessa huvudkategorier kommer att behandlas i efterföljande avsnitt. 2.3 Tidsdomänen Då en signal korreleras med sig själv får man fram dess autokorrelation, se ekvation (2.1). Denna definition gäller för tidsdiskreta ändliga signaler. Om signalen är periodisk eller quasiperiodisk kommer den att uppvisa stora likheter med sig själv då fördröjningen d är lika med signalens period. En rättfram väg att få fram grundfrekvensen torde då vara att plocka fram periodtiden mellan två maxvärden i autokorrelationsfunktionen (akf). r N d = N d 1 n = xn xn + d (2.1) För att kunna hantera ickestationära signaler som talsignaler måste en korttids-akf användas, se ekvation (2.2). En lämplig ramlängd är 1-3 ms. Denna längd är lämplig eftersom talsignaler inte nämnvärt ändrar sin karaktär under så korta intervall. I ekvationen är q startadressen för den aktuella tidsramen medan w är ett fönster som tvingar ned signalen till noll utanför ramen. q + N 1 rdq = xn n = q xn + d wn q (2.2)

13 2.3 TIDSDOMÄNEN 7 En stor felkälla vid användandet av autokorrelationmetoden är att formanterna ofta detekteras istället för grundtonen. Lyckligvis finns det olika sätt att förbehandla signalen för att komma runt detta problem. En metod som ger bra resultat är centerklippning (center clipping) Centerklippning Vid centerklippning sätter man alla värden i signalen till noll om magnituden är mindre än ett visst tröskelvärde, se figur 2-2. Detta förstör formantstrukturen i signalen utan att direkt påverka periodiciteten. För att inte viktig information ska tas bort måste man vara försiktig när man väljer klippnivån (CL). Ett lämpligt tillvägagångssätt är att först dela in signalen i 1-3 ms långa ramar (detta bör vara samma ramlängd som används i akf:en så att beräkningarna kan utföras i samma beräkningsloop). Ramen delas vidare in i ytterligare tre segment där maxvärdet av första och tredje segmentet beräknas. Klippnivån väljs sedan till ungefär 8 % av det minsta av dessa värden (att nivån är lämplig visas experimentellt i bl.a. [5]). När CL är vald kan elementen nollställas enligt ekvation (2.3) där q betecknar aktuellt segment. q x CL n( = x q n CL x q n J CL x q CL x q n + CL x q CL Periodtiden fastställs till sist genom att mäta tiden mellan intilliggande lokala maximum i signalsegmentets akf. (2.3) 3 x CL CL 3 Fragment av signalen x(n) Klippt signalsegment t [sek] Figur 2-2: Segment q av signalen x(n) visas tillsammans med en klippt variant av sig själv. Även klippnivåerna CL är utritade.

14 8 PITCHDETEKTERING 2.4 Cepstrumdomänen En talsignal består av en faltning mellan ett högfrekvent pulståg gn från stämbanden och en lågfrekvent envelopp hn som bildas i de övre talorganen, se figur 2-1 på sida 6. Cepstrumanalys är en metod för att separera dessa två komponenter. Faltning i tidsdomänen blir multiplikation i fourierdomänen (2.4). Logaritmeras resultatet övergår produkten i en summation. I högerledet i (2.5) ger det högfrekventa pulståget den första termenen medan den andra representerar filtrets envelopp. Inverstransformeras resultatet enligt ekvation (2.6) kan grundfrekvensens periodtid utläsas som det högquefrenta bidraget. Quefrens är den storhet som cepstrum har i tidsdomänen. Detta kan förklaras av att C är jämn och reell varför inverstransformen lika gärna kan beräknas med cosinustransformen. Denna har samma egenskaper som fouriertransformen, d.v.s. den ordnar signalens energiinnehåll efter stigande frekvens. På så vis kommer cn att beskriva signalens frekvensinnehåll. Se figur 2-3. xn = g h n X = G b H (2.4) C = log X = log G + log H (2.5) cn = F 1 log X < = F 1 log G < + F 1 log H < Sammanfattningsvis är cepstrum alltså en olinjär transformation av periodogrammet som definieras enligt ekvation (2.7) och som separerar två sammanfaltade komponenter av olika frekvens. (2.6) c 9( Se F 1 log Fxn ( = (2.7).8.6 Högquefrent topp t [sek] Figur 2-3: Den högquefrenta komponenten visar en tydlig topp vid 7 ms (15 Hz) vilket motsvarar grundfrekvensen. De lågquefrenta topparna är bidrag från de övre talorganen och kan ignoreras.

15 2.5 FREKVENSDOMÄNEN Frekvensdomänen De flesta metoder för pitchdetektering i frekvensdomänen bygger på två väldigt lika principer: 1. beräknas som en bråkdel av någon högre delton. f 2. f beräknas som skillnaden mellan två konsekutiva toppar (deltoner). Här undersöks ett alternativt tillvägagångssätt, nämligen att använda wavelettransformen,wt, istället för den vanliga korttids fouriertransformen, STFT. Transformen visar stora likheter med hur människan bearbetar ljud och har olika tidsupplösning för olika frekvenser, se figur 2-4. Fördelen är att snabba ickestationära och svårpredikterade signaler kan undersökas med bra resultat, något som andra metoder har problem med [7]. Tid-frekvensupplösning i STFT Tid-frekvensupplösning i WT Frekvens Frekvens Tid Tid Figur 2-4: Tid-frekvensupplösning för korttids- och wavelettransformer. Varje yta representerar en punkt i upplösningen av tid och frekvens och för wavelets gäller alltså att bättre tidsupplösning kompenseras med sämre frekvensupplösning så att ytan förblir konstant Wavelettransformen (WT) Den tidskontinuerliga WT definieras av 1 -- B 2 W x ab = a xt t b a dt = B a X 25 a e j b d Wavelettransformen är alltså en skalärprodukt mellan signalen xt och en translaterad och skalad version av den så kallade waveletfunktionen t. Kännetecknande för waveletfunktionen är att den har bandpasskaraktär. Skalningsparametern a påverkar centerfrekvensen och bandbredden på t medan b påverkar translationen. För små värden på skalningsfaktorn a erhålls god tidupplösning B B (2.8)

16 1 PITCHDETEKTERING medan stora a ger bra frekvensupplösning. Skalningsfaktorn är till för att alla skalade funktioner ska få samma energi. I sista ledet definieras WT i termer av xt och t :s respektive fouriertransformer Multiupplösnings-wavelet Ett ljud samplat i en punkt är en funktion som är konstant i intervallet [,1]. Låt V vara ett vektorrum innehållande alla dessa funtioner. Ett tvåpunkters ljud kommer på samma sätt att ha två konstanta intervall över [,.5[ och [.5,1] med vektorrumet V 1. Fortsätter man med samma uppdelning kommer man att få ett rum innehållande alla styckvis konstanta funktioner mellan [,1]. Då j ökar kommer även upplösningen av funktionerna i V j att öka. Basfunktionerna som spänner upp V j kallas skalningsfunktioner. Nästa steg är att ta fram waveletfunktionerna. Dessa väljs som det ortogonala komplementet till V j i V j + 1 och betecknas W j. Beroende på vilka egenskaper hos signalen som ska undersökas väljs olika basfuntioner. T.ex. är Daubechies filter användbara för pitchdetektering Pitchdetektering a 1A 2 Pulståget från stämbanden ger upphov till nollgenomgångar i talsignalen. Om signalen filtreras med en deriverande funktion (exempelvis Daubechies filter) kommer ett maximum att uppträda för varje nollgenomgång. Wavelettransformens förmåga att använda olika skalor (närliggande skalor visar maxvärden på samma position för glottispulserna) tillsammans med de deriverande egenskaperna är något som tagits fasta på för pitchdetektering, se [6]. Där har funktionerna V j t = 2 k A 2 2 k t t = 2 k A 2 2 k t (2.9) (2.1) valts som wavelet respektive skalningsfunktion. t är en lågpassfunktion medan t är en högpassfunktion. För att avgränsa frekvensbandet och samtidigt anpassa (2.9) och (2.1) till talsignalens intressanta frekvensområde låter man t få skalningsfaktorn enligt k a 2 k a F = ---- s f 1 (2.11)

17 2.6 FELDETEKTERING 11 Skalningsfaktorn för waveletfunktionen blir av samma anledning 2 k b F = ---- s f 2 (2.12) Frekvenserna f 1 och f 2 är här övre och undre gräns för talsignalen medan F s är samplingsfrekvensen. Det slutliga filtret 7 t byggs upp som faltningen mellan wavelet och skalningsfunktionerna med skalningsfaktorer enligt (2.11) och (2.12). 7 t = ka t kb t (2.13) Den filtrerade signalen påminner om en sinus där grundfrekvensen kan beräknas genom periodtiden. Onogrannheten i samplingen tvingar dock fram interpolation mellan samplingpunkterna för att inte slutresultatet ska påverkas negativt. 2.6 Feldetektering Med alla undersökta metoder uppstår det fel i pitchdetekteringen. Det finns tre vanliga orsaker till att ett estimat bör ratas: Det finns ingen energi i signalen. Det finns ingen energi i den filtrerade signalen (wavelet). Pitchestimatet är felaktigt. De opålitliga värden som direkt kan tas bort ur estimatet är frekvenser som beräknas i tidpunkter då signalens energi är väldigt låg (mellan ord etc.). Även frekvenser som ligger ovanför 1 khz är osannolika eftersom människor vanligtvis inte är kapabla till så höga grundtoner. Sätter man frekvensen till noll i dessa tveksamma fall uppnås ett bättre estimat. Resultatet kan bli än bättre om man behandlar alla maximum (i autokorrelation och wavelet-fallet) beroende på dess omedelbara omgivning. Eftersom topparna kommer med lokalt regelbundna intervall kan de toppar som upptäcks på fel plats tas bort. Det är även möjligt att lägga till maximum där de borde vara och på så sätt få ett jämnare estimat. 2.7 En jämförelse mellan metoderna Alla föreslagna metoder gör ett bra jobb med att estimera grundfrekvensen hos långsamt varierande talsignaler. De principiella skillnader som kan ses i figur 2-5 beror mycket på olika tröskelvärden mellan metoderna. Ska man rekommendera en metod får det bli autokorrelationsmetoden. Detta då den är stabil och ger ett pålitligt resultat. Det som fäller avgörandet är att cepstrummetoden inte alltid hittar grundfrekvensen och då väljer att kategorisera talet som tonlöst. Waveletmetoden till sist misslyckas emellanåt genom att välja

18 12 PITCHDETEKTERING en multipel av grundfrekvensen istället för den verkliga. Det som talar för den mer komplicerade waveletmetoden är att den klarar av kraftigt varierande frekvenser och snabba ickestationära signaler, se figur 2-6. Turligt nog är dessa faktorer inte nämnvärt viktiga för naturligt tal så någon av de andra metoderna kan användas. Pitch autokorr, f [Hz] Pitch cepstrum, f [Hz] Pitch wavelet, f [Hz] Signal t [s] Figur 2-5: Jämförelse av pitchdetektering m.h.a. autokorrelation (överst), cepstrum (mitten) och wavelets (nederst). Skillnaderna mellan metoderna beror i det stora hela på olikheter i tröskelvärdena mellan metoderna. Nederst visas testsignalen som i detta fall är en inspelad mansröst.

19 2.7 EN JÄMFÖRELSE MELLAN METODERNA 13 Pitch autokorr, f [Hz] Pitch cepstrum, f [Hz] Pitch wavelet, f [Hz] Signal t [s] Figur 2-6: Jämförelse av pitchdetektering m.h.a. autokorrelation (överst), cepstrum (mitten) och wavelets (nederst). Skillnaderna mellan metoderna visas här tydligt och det är bara waveletmetoden som kan återge frekvensen korrekt. Observera dock de felaktiga insvängningsvärdena. Nederst visas testsignalen som i detta fall är ett frekvenssvep från 1 till 3 Hz.

20 14 PITCHDETEKTERING

21 3. TD-PSOLA TD-PSOLA står för TimeDomain PitchSynchronous OverLap-Add. Namnet i sig självt förklarar egentligen hur metoden fungerar: TD Beräkningarna görs i tidsdomänen. OL Signalen delas i överlappande småbitar (segment). A Segmenten adderas vid rekonstruktionen. PS Segmentens storlek bestäms av pitchperioden. Talsignalen delas alltså upp i korta överlappande segment. Pitch- och tidsskalningarna utförs genom att sätta samman segmenten med nytt avstånd sinsemellan och genom att upprepa eller hoppa över vissa segment för att fylla ut tidsrymden. Som allmän referens gällande PSOLA har Mark Kahrs bok använts [13]. 3.1 Pitch- och tidsskalning Storleken på segmenten bestäms av pitchperioden som tas fram med någon av metoderna i kapitel 2. Överst i figur 3-1 på sida 16 har en signal märkts upp med sin pitchperiod. Om talsignaler hade varit helt periodiska skulle pitchskalningar kunna göras enligt (3.1) och (3.2). s i n är här en ram som fönstrats fram pitchsynkront ur den ursprungliga signalen sn. T är den önskade pitchperioden medan är den ursprungliga. T p s i n = sn wn it p (3.1) B ŝ n = s i n i T T p i = B Tyvärr är talsignaler inte stationära. Däremot är det vanligt att de är bitvis periodiska. För att utnyttja kvasistationäriteten görs fönsterstorleken tidsvaribel. Storleken är en kompromiss mellan två olika situationer. Ett för litet överlapp bildar glapp i slutresultatet medan ett för stort överlapp ger en harmonisering av signalen. Genom att välja fönsterbredden till dubbla periodlängden hamnar man mitt emellan dessa lägen. Överlappet kommer således att sträcka sig ut över halva de intilliggande pitchsegmenten. (3.2) 15

22 16 TD-PSOLA Ram n Ram n+1 Ram n Sampel Figur 3-1: Vid pitchsänkning flyttas de fönstrade ramarna isär innan de sätts ihop. Detta leder till att vissa ramar måste hoppas över för att inte signalens utsträckning i tiden ska ändras. Här är skalfaktorn 1.3. Vid pitchsänkning flyttas ramarna (pitchsegment plus överlapp) isär och för att tidsskalan ska bibehållas hoppas vissa ramar över. Detta kan till exempel göras så fort man hämtar data som ligger mer än en period bort i ursprungssignalen, se figur 3-1. På samma sätt får vissa ramar dubbleras vid pitchhöjning. Det är viktigt att inse att ramarna inte förlängs eller krymps ihop, till exempel genom omsampling. Istället skjuts de in över eller dras isär från intilliggande ramar varpå superpositionering resulterar i en pitchskalad signal, se återigen figur 3-1. Även vid tidsskalning kommer vissa ramar att hoppas över eller upprepas. Detta handlar i praktiken om att skala om de tidsindex som representerar pitchsegmenten. Dessa fylls sedan ut med så många ramar som möjligt, se figur 3-2.

23 3.2 EN NY VARIABEL FÖNSTERFUNKTION Ram n+5 Ram n+4 Ram n+3 Ram n+2 Ram n+1 Ram n Sampel x 1 4 Figur 3-2: Vid tidsskalning upprepas eller kasseras vissa ramar. Här skalas signalen med en faktor 1.5 varför vissa ramar upprepas. 3.2 En ny variabel fönsterfunktion Som nämns ovan medför en pitchhöjning att ramarna trycks ihop och att överlappet därmed blir större. För att minska effekterna av ramarnas påverkan av varandra kan man använda olika typer av fönster. Då periodtiden ökas eller lämnas orörd är ett mjukt fönter som hanning att föredra. Om däremot periodtiden minskas är det bättre att använda ett fönster som är mer centrerat och tar bort mer av överlappsinformationen. Ett fönster som uppfyller dessa egenskaper är kaiserfönstret, se figur 3-3. Resultat från skalning ses i figur Hanningfönster 1 Kaiserfönster, β= Sampel Sampel Figur 3-3: Hanningfönstret till vänster och kaiserfönstret till höger.

24 18 TD-PSOLA.5 Ursprungliga signalen Pitchskalad signal, hanningfönster Pitchskalad signal, kaiserfönster med β= Figur 3-4: Den ursprungliga signalen har en pitchperiod utmärkt. Med sträckade linjer visas den centrala del som PSOLA försöker bevara. Skillnaden mellan Hanning- och Kaiserfönstren kan här ses på djupet av dalarna där Kaiserfönstret återger den ursprungliga kurvformen bättre. 3.3 Resultat Tidsskalningar fungerar mycket bra för rimliga skalfaktorer. Det faktum att information tas bort respektive upprepas utgör en naturlig begränsning för metoden. Nedskalning till halva längden ger klart godkända resultat och vidare skalning är inte intressant eftersom det även naturligt är svårt att uppfatta så snabbt tal. När talet förlängs är det upprepningar av samma information som utgör begränsningen. Vid cirka 3 procents förlängning ändrar ljudet karaktär och låter mer stramt. Bortsett från denna defekt kan signalen förlängas med uppemot 3% innan ljudkvaliten försämras nämnvärt. En studie av spektrogram över de tidskalade signalerna och den ursprungliga visar på god överensstämmelse, se figur 3-5. Pitchskalningar kan utföras i storleksordningen 2-3 procent. Höjningar blir i regel sämre än motsvarande sänkning av pitchen. Detta beror på att superpositionen av segmenten ibland ger oväntade resultat. Ju mer segmenten trycks ihop desto mer kommer de att påverka varandra. Vid sänkning av pitchen kommer inte detta att ge lika stora effekter eftersom den centrala delen av det ursprungliga pitchsegmentet bevaras bättre. Vad som händer mellan periodcentrum är inte lika känsligt och uppfattas mest som om talet knorrar. Ett exempel på pitchskalning visas i figur 3-6 på sida 2.

25 3.4 KOMMENTARER OCH FÖRBÄTTRINGAR 19 4 Sprektrogram över den ursprungliga signalen Frekvens [Hz] Sprektrogram över signalen rekonstruerad till dubbla längden 4 Frekvens [Hz] Sprektrogram över signalen rekonstruerad till halva längden 4 Frekvens [Hz] Tid [s] Figur 3-5: Spektrogram över den ursprungliga signalen och signalen skalad till dubbla respektive halva längden. Talsignalen utgörs av en kvinnoröst som säger A lathe is a big tool; grab every dish of sugar. 3.4 Kommentarer och förbättringar Ramarna skulle kunna knuffas i fas genom att de förskjuts i förhållande till varandra. Hur pass bra en sådan metod fungerar beror givetvis på hur mycket man kan knuffa ramarna innan det hörs att grundfrekvensen ändras mellan varje period. Om skalfaktorerna är tidsvaribla (vilket de ofta är om talets prosodi ska ändras) är det bra om skalfunktionerna är relativt mjuka. Det är därför bra att lågpassfiltrera skalfunktionerna innan användning i PSOLA-algoritmen. Om snabba förändringar är ett krav kan istället ett fåpunktigt medianfilter användas för att runda av de brantaste topparna. Anledningen till detta är att stora och plötsliga omskalningar innebär att en enskild ram kommer att upprepas många gånger. Detta skapar eko och bör undvikas.

26 2 TD-PSOLA En enkel autokorrelations-baserad metod har använts för pitchdetektering. PSOLA-algoritmen är helt utelämnad åt de data som detekteringen erbjuder. Eftersom uppdelningen i ramar bygger på dessa data är det viktigt att de stämmer överens med verkligheten. Uppenbarligen finns här plats för förbättringar. Till exempel skulle flera olika skattningar kunna användas och viktas samman till en mer korrekt pitchperiod Ursprungliga signalen Signalen rekonstruerad med pitchperioden skalad en faktor Signalen rekonstruerad med pitchperioden skalad en faktor Tid [s] Figur 3-6: Pitchskalning med en faktor 1.2 resp..8. Här är det dalarna som ligger i mitten av pitchsegmenten och dessa rekonstrueras som synes bra. Däremellan skiljer sig resultaten mer från originalet.

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

Analys/syntes-kodning

Analys/syntes-kodning Analys/syntes-kodning Många talkodare bygger på en princip som kallas analys/syntes-kodning. Istället för att koda en vågform, som man normalt gör i generella ljudkodare och i bildkodare, så har man parametrisk

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Kurssammanfattning Fyra kärnkoncept Sampling Faltning Poler och nollställen Fouriertransform Koncept #1: Sampling En korrekt samplad signal kan rekonstrueras exakt, dvs ingen information

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 5 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 6 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University Exempelsamling Grundläggande systemmodeller Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University Version: 0.11 September 14, 2015 Uppgifter markerade med (A)

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

Tentamen i TMA 982 Linjära System och Transformer VV-salar, 27 aug 2013, kl

Tentamen i TMA 982 Linjära System och Transformer VV-salar, 27 aug 2013, kl Tentamen i TMA 982 Linjära System och Transformer VV-salar, 27 aug 2013, kl 8.30-12.30 Examinatorer: Lars Hammarstrand och Thomas Wernstål Tentamen består av två delar (Del I och Del II) på sammanlagt

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT Spektrala transformer Tentamen 72 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

Signal- och bildbehandling TSBB03

Signal- och bildbehandling TSBB03 Tentamen i Signal- och bildbehandling TSBB03 Tid: 2004-06-0 kl. 8-2 Lokaler: Garnisonen Ansvarig lärare: Maria Magnusson Seger besöker lokalen kl. 9.00 och 0.45. tel 073-804 38 67 Hjälpmedel: Räknedosa,

Läs mer

Tentamen i ESS 010 Signaler och System E3 V-sektionen, 16 augusti 2005, kl 8.30 12.30

Tentamen i ESS 010 Signaler och System E3 V-sektionen, 16 augusti 2005, kl 8.30 12.30 Tentamen i ESS 00 Signaler och System E3 V-sektionen, 6 augusti 2005, kl 8.30 2.30 Examinator: Mats Viberg Tentamen består av 5 uppgifter som vardera ger maximalt 0 p. För godkänd tentamen fordras ca 20

Läs mer

Tentamen ssy080 Transformer, Signaler och System, D3

Tentamen ssy080 Transformer, Signaler och System, D3 Tentamen ssy080 Transformer, Signaler och System, D3 Examinator: Ants R. Silberberg 19 oktober 2011 kl. 08.30-12.30 sal: Hörsalsvägen Förfrågningar: Ants Silberberg, tel. 1808 Lösningar: Anslås torsdag

Läs mer

Talets akustik repetition

Talets akustik repetition Pétur Helgason VT 29 Talets akustik repetition 29-3-3 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 8 % kväve och 2 % syre.

Läs mer

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny Tidigare har vi gått igenom Fourierserierepresentation av periodiska signaler och Fouriertransform av icke-periodiska signaler. Fourierserierepresentationen av x(t) ges av: där a k = 1 T + T a k e jkω

Läs mer

7. Sampling och rekonstruktion av signaler

7. Sampling och rekonstruktion av signaler Arbetsmaterial 5, Signaler&System I, VT04/E.P. 7. Sampling och rekonstruktion av signaler (Se också Hj 8.1 3, OW 7.1 2) 7.1 Sampling och fouriertransformering Man säger att man samplar en signal x(t) vid

Läs mer

Digital Signalbehandling i Audio/Video

Digital Signalbehandling i Audio/Video Digital Signalbehandling i Audio/Video Institutionen för Elektrovetenskap Laboration 1 (del 2) Stefan Dinges Lund 25 2 Kapitel 1 Digitala audioeffekter Den här delen av laborationen handlar om olika digitala

Läs mer

Tentamen ssy080 Transformer, Signaler och System, D3

Tentamen ssy080 Transformer, Signaler och System, D3 Tentamen ssy080 Transformer, Signaler och System, D3 Examinator: Ants R. Silberberg oktober 009 kl. 4.00-8.00 lokal: Johanneberg Förfrågningar: Ants Silberberg, tel. 808 Lösningar: Anslås torsdag okt.

Läs mer

DIGITAL KOMMUNIKATION

DIGITAL KOMMUNIKATION EN KOR SAMMANFANING AV EORIN INOM DIGIAL KOMMUNIKAION Linjär kod En binär linjär kod kännetecknas av att summan av två kodord också är ett kodord. Ett specialfall är summan av ett kodord med sig själv

Läs mer

2F1120 Spektrala transformer för Media Tentamen

2F1120 Spektrala transformer för Media Tentamen F Spektrala transformer för Media Tentamen 68 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: :9 p, : p, 5: 7 p Tillåtna hjälpmedel: räknare, formelblad

Läs mer

Digital signalbehandling Digitalt Ljud

Digital signalbehandling Digitalt Ljud Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1

Läs mer

Signalanalys med snabb Fouriertransform

Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, MVE030 Signalanalys med snabb Fouriertransform Den här laborationen har två syften: dels att visa lite på hur den snabba Fouriertransformen fungerar, och lite om vad man bör

Läs mer

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Tillåtna hjälpmedel: Valfri miniräknare (utan möjlighet till trådlös kommunkation). Valfri litteratur, inkl. kursböcker, formelsamlingar.

Läs mer

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 3 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

Laplace, Fourier och resten varför alla dessa transformer?

Laplace, Fourier och resten varför alla dessa transformer? Laplace, Fourier och resten varför alla dessa transformer? 1 Bakgrund till transformer i kontinuerlig tid Idé 1: Representera in- och utsignaler till LTI-system i samma basfunktion Förenklad analys! Idé

Läs mer

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University

Exempelsamling Grundläggande systemmodeller. Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University Exempelsamling Grundläggande systemmodeller Klas Nordberg Computer Vision Laboratory Department of Electrical Engineering Linköping University Version: 0.1 August 25, 2015 Uppgifter markerade med (A) är

Läs mer

DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1. Frekvensfunktioner FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM. x(n)= Asin(Ωn)

DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1. Frekvensfunktioner FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM. x(n)= Asin(Ωn) DIGITALA FILTER TILLÄMPAD FYSIK OCH ELEKTRONIK, UMEÅ UNIVERSITET 1 Frekvensfunktioner x(n)= Asin(Ωn) y(n) H(z) TILLÄMPAD FYSIK OCH ELEKTRONIK, UMEÅ UNIVERSITET 2 FREKVENSSVAR FÖR ETT TIDSDISKRET SYSTEM

Läs mer

Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet?

Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet? Kan vi beskriva ett system utan någon fysikalisk kännedom om systemet? 1 Om svaret på frågan är ja så öppnar sig möjligheten att skapa en generell verktygslåda som fungerar för analys och manipulering

Läs mer

Projekt 3: Diskret fouriertransform

Projekt 3: Diskret fouriertransform Projekt 3: Diskret fouriertransform Diskreta fouriertransformer har stor praktisk användning inom en mängd olika områden, från analys av mätdata till behandling av digital information som ljud och bildfiler.

Läs mer

AD-DA-omvandlare. Mätteknik. Ville Jalkanen. ville.jalkanen@tfe.umu.se 1

AD-DA-omvandlare. Mätteknik. Ville Jalkanen. ville.jalkanen@tfe.umu.se 1 AD-DA-omvandlare Mätteknik Ville Jalkanen ville.jalkanen@tfe.umu.se Inledning Analog-digital (AD)-omvandling Digital-analog (DA)-omvandling Varför AD-omvandling? analog, tidskontinuerlig signal Givare/

Läs mer

Ulrik Söderström 20 Jan Signaler & Signalanalys

Ulrik Söderström 20 Jan Signaler & Signalanalys Ulrik Söderström ulrik.soderstrom@tfe.umu.se 20 Jan 2009 Signaler & Signalanalys Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt

Läs mer

Ulrik Söderström 19 Jan Signalanalys

Ulrik Söderström 19 Jan Signalanalys Ulrik Söderström ulrik.soderstrom@tfe.umu.se 9 Jan 200 Signaler & Signalanalys l Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt

Läs mer

Bildbehandling i frekvensdomänen

Bildbehandling i frekvensdomänen Uppsala Tekniska Högskola Signaler och system Handledare: Mathias Johansson Uppsala 2002-11-27 Bildbehandling i frekvensdomänen Erika Lundberg 800417-1602 Johan Peterson 790807-1611 Terese Persson 800613-0267

Läs mer

Mätningar med avancerade metoder

Mätningar med avancerade metoder Svante Granqvist 2008-11-12 13:41 Laboration i DT2420/DT242V Högtalarkonstruktion Mätningar på högtalare med avancerade metoder Med datorerna och signalprocessningens intåg har det utvecklats nya effektivare

Läs mer

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Den laborationen har syften: dels att visa lite hur den snabba Fouriertransformen fungerar, och lite om vad man den an dels att

Läs mer

Laboration i Fourieroptik

Laboration i Fourieroptik Laboration i Fourieroptik David Winge Uppdaterad 30 januari 2015 1 Introduktion I detta experiment ska vi titta på en verklig avbildning av Fouriertransformen. Detta ska ske med hjälp av en bild som projiceras

Läs mer

Laboration i tidsdiskreta system

Laboration i tidsdiskreta system Laboration i tidsdiskreta system A. Tips Användbara MATLAB-funktioner: conv Faltning square Skapa en fyrkantvåg wavread Läs in en ljudfil soundsc Spela upp ett ljud ones Skapa en vektor med godtyckligt

Läs mer

Fouriermetoder MVE295 - bonusuppgifter

Fouriermetoder MVE295 - bonusuppgifter Fouriermetoder MVE295 - bonusuppgifter Edvin Listo Zec 920625-2976 edvinli@student.chalmers.se Sofia Toivonen 910917-4566 sofiato@student.chalmers.se Emma Ekberg 930729-0867 emmaek@student.chalmers.se

Läs mer

Grundläggande signalbehandling

Grundläggande signalbehandling Beskrivning av en enkel signal Sinussignal (Alla andra typer av signaler och ljud kan skapas genom att sätta samman sinussignaler med olika frekvens, Amplitud och fasvridning) Periodtid T y t U Amplitud

Läs mer

DT1120 Spektrala transformer för Media Tentamen

DT1120 Spektrala transformer för Media Tentamen DT Spektrala transformer för Media Tentamen 77 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: 3:9 p, 4: 3 p, 5: 7 p Tillåtna hjälpmedel: räknare,

Läs mer

Signal- och Bildbehandling FÖRELÄSNING 4. Multiplikationsteoremet. Derivatateoremet

Signal- och Bildbehandling FÖRELÄSNING 4. Multiplikationsteoremet. Derivatateoremet Signal- och Bildbehandling FÖRELÄSNING 4 Fouriertransformen, forts Mer egenskaper av fouriertransformen Enkel tillämpning: Filtrera bort oönskat buller från vacker visselton Fouriertransformen, slutsats

Läs mer

Kvalificeringstävling den 30 september 2008

Kvalificeringstävling den 30 september 2008 SKOLORNAS MATEMATIKTÄVLING Svenska Matematikersamfundet Kvalificeringstävling den 30 september 2008 Förslag till lösningar Problem 1 Tre rader med tal är skrivna på ett papper Varje rad innehåller tre

Läs mer

Signaler och system, IT3

Signaler och system, IT3 Signaler och system, IT3 Vad är signalbehandling? 1 Detta dokument utgör introduktionsföreläsningen för kursen Signaler och system för IT3 period 2. Kursen utvecklades år 2002 av Mathias Johansson. 1 Vad

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB Tid: --, kl. - Lokaler: U, U, U Ansvarig lärare: Maria Magnusson besöker lokalen kl.. och. tel. Hjälpmedel: Räknedosa, medskickad formelsamling, OH-film, sa och

Läs mer

Att fånga den akustiska energin

Att fånga den akustiska energin Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte

Läs mer

REGLERTEKNIK Laboration 5

REGLERTEKNIK Laboration 5 6 SAMPLADE SYSTEM 6. Sampling av signaler När man använder en dator som regulator, kan man endast behandla signaler i diskreta tidpunkter. T.ex. mäts systemets utsignal i tidpunkter med visst mellanrum,

Läs mer

SF1635, Signaler och system I

SF1635, Signaler och system I SF65, Signaler och system I Tentamen tisdagen 4--4, kl 8 Hjälpmedel: BETA Mathematics Handbook. Formelsamling i Signalbehandling rosa), Formelsamling för Kursen SF65 ljusgrön). Obs : Obs : Obs : Obs 4:

Läs mer

RÄKNEEXEMPEL FÖRELÄSNINGAR Signaler&System del 2

RÄKNEEXEMPEL FÖRELÄSNINGAR Signaler&System del 2 t 1) En tidskontinuerlig signal x( t) = e 106 u( t) samplas med sampelperioden 1 µs, varefter signalen trunkeras till 5 sampel. Den så erhållna signalen får utgöra insignal till ett tidsdiskret LTI-system

Läs mer

Signal- och bildbehandling TSBB03

Signal- och bildbehandling TSBB03 Tentamen i Signal- och bildbehandling TSBB3 Tid: 28-5-29 kl. 8-2 Lokal: TER2 Ansvarig lärare: Maria Magnusson besöker lokalen kl. 9. och.4 tel 73-84 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling,

Läs mer

Samtidig visning av alla storheter på 3-fas elnät

Samtidig visning av alla storheter på 3-fas elnät Samtidig visning av alla storheter på 3-fas elnät Med nätanalysatorerna från Qualistar+ serien visas samtliga parametrar på tre-fas elnätet på en färgskärm. idsbaserad visning Qualistar+ visar insignalerna

Läs mer

Spektralanalys - konsten att hitta frekvensinnehållet i en signal

Spektralanalys - konsten att hitta frekvensinnehållet i en signal Spektralanalys - konsten att hitta frekvensinnehållet i en signal Bengt Carlsson, Erik Gudmundson och Marcus Björk Systems and Control Dept. of Information Technology, Uppsala University 7 november 013

Läs mer

3. Metoder för mätning av hörförmåga

3. Metoder för mätning av hörförmåga 3. Metoder för mätning av hörförmåga Sammanfattning Förekomst och grad av hörselnedsättning kan mätas med flera olika metoder. I kliniskt arbete används oftast tonaudiogram. Andra metoder är taluppfattningstest

Läs mer

= y(0) för vilka lim y(t) är ändligt.

= y(0) för vilka lim y(t) är ändligt. Lösningsförslag till tentamensskrivning i SF633 Differentialekvationer I och SF637 Differentialekvationer och transformer III Lördagen den 4 februari, kl 4-9 Hjälpmedel: BETA, Mathematics Handbook Redovisa

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB Tid: 3-5-3 Lokaler: TER Ansvarig lärare: Maria Magnusson besöker lokalen kl. 8.5 och.3 tel 73-8 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling, OH-film,

Läs mer

FOURIERANALYS En kort introduktion

FOURIERANALYS En kort introduktion FOURIERAALYS En kort introduktion Kurt Hansson 2009 Innehåll 1 Signalanalys 2 2 Periodiska signaler 2 3 En komplex) skalärprodukt 4 4 Fourierkoefficienter 4 5 Sampling 5 5.1 Shannon s teorem.................................

Läs mer

DT1120/DT1130 Spektrala transformer Tentamen

DT1120/DT1130 Spektrala transformer Tentamen DT/DT3 Spektrala transformer Tentamen 86 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: 4 p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

TEM Projekt Transformmetoder

TEM Projekt Transformmetoder TEM Projekt Transformmetoder Utförs av: Mikael Bodin 19940414 4314 William Sjöström 19940404 6956 Sammanfattning I denna laboration undersöks hur Fouriertransformering kan användas vid behandling och analysering

Läs mer

Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation

Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation Etapp 1 Problem med mätsignalen m.a.p. sampling, vikning och spektraltäthet Problembeskrivning Uppdragsgivaren överväger att skaffa nya A/D-omvandlare

Läs mer

TSKS06 Linjära system för kommunikation Lab2 : Aktivt filter

TSKS06 Linjära system för kommunikation Lab2 : Aktivt filter TSKS06 Linjära system för kommunikation Lab2 : Aktivt filter Sune Söderkvist, Mikael Olofsson 9 februari 2018 Fyll i detta med bläckpenna Laborant 1 Laborant 2 Personnummer Personnummer Datum Godkänd 1

Läs mer

Signal- och bildbehandling TSEA70

Signal- och bildbehandling TSEA70 Tentamen i Signal- och bildbehandling TSEA70 Tid: 000-03-8 kl. 4-8 Lokaler: Garnisonen Ansvariga lärare: Olle Seger, Maria M Seger besöker lokalerna kl 500 och 700 tel 070/33 79 48 Hjälpmedel: Räknedosa,

Läs mer

Signal- och bildbehandling TSEA70

Signal- och bildbehandling TSEA70 Tentamen i Signal- och bildbehandling TSEA70 Tid: 2003-08-22 kl. 4-8 Lokaler: G36 Ansvarig lärare: Maria Magnusson Seger besöker lokalen kl. 6.00. tel 0702/33 79 48 Hjälpmedel: Räknedosa, OH-film, medskickad

Läs mer

Kompletterande material till föreläsning 5 TSDT08 Signaler och System I. Erik G. Larsson LiU/ISY/Kommunikationssystem

Kompletterande material till föreläsning 5 TSDT08 Signaler och System I. Erik G. Larsson LiU/ISY/Kommunikationssystem ompletterande material till föreläsning 5 TSDT8 Signaler och System I Erik G. Larsson LiU/ISY/ommunikationssystem erik.larsson@isy.liu.se November 8 5.1. Första och andra ordningens tidskontinuerliga LTI

Läs mer

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG

EXEMPEL 1: ARTVARIATION FÖRELÄSNING 1. EEG frekvensanalys EXEMPEL 2: EEG FÖRELÄSNING EXEMPEL : ARTVARIATION Kurs- och transform-översikt. Kursintroduktion med typiska signalbehandlingsproblem och kapitelöversikt. Rep av transformer 3. Rep av aliaseffekten Givet: data med antal

Läs mer

Laboration 3 Sampling, samplingsteoremet och frekvensanalys

Laboration 3 Sampling, samplingsteoremet och frekvensanalys Laboration 3 Sampling, samplingsteoremet och frekvensanalys 1 1 Introduktion Syftet med laborationen är att ge kunskaper i att tolka de effekter (speglingar, svävningar) som uppkommer vid sampling av en

Läs mer

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten KÄLLA-FILTER Repetition - Repetition av resonans och filter Komplexa ljudvågor: deltoner Amplitudspektrum - Talapparaten som resonator - Talapparaten som källa-filtersystem - Spektrum, Spektrogram, spektrograf

Läs mer

Föreläsning 6: Spektralskattning: icke parametriska metoder. Leif Sörnmo 4 oktober 2009

Föreläsning 6: Spektralskattning: icke parametriska metoder. Leif Sörnmo 4 oktober 2009 Föreläsning 6: Spektralskattning: icke parametriska metoder Leif Sörnmo 4 oktober 2009 1 Metoder för spektralskattning icke-parametriska korrelogram, periodogram fönstring, medelvärdesbildning minimum-varians

Läs mer

Föreläsning 10, Egenskaper hos tidsdiskreta system

Föreläsning 10, Egenskaper hos tidsdiskreta system Föreläsning 10, Egenskaper hos tidsdiskreta system Reglerteknik, IE1304 1 / 26 Innehåll Kapitel 18.1. Skillnad mellan analog och digital reglering 1 Kapitel 18.1. Skillnad mellan analog och digital reglering

Läs mer

Poler och nollställen, motkoppling och loopstabilitet. Skrivet av: Hans Beijner 2003-07-27

Poler och nollställen, motkoppling och loopstabilitet. Skrivet av: Hans Beijner 2003-07-27 Poler och nollställen, motkoppling och loopstabilitet Skrivet av: Hans Beijner 003-07-7 Inledning All text i detta dokument är skyddad enligt lagen om Copyright och får ej användas, kopieras eller citeras

Läs mer

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen

Läs mer

i(t) C i(t) = dq(t) dt = C dy(t) dt y(t) + (4)

i(t) C i(t) = dq(t) dt = C dy(t) dt y(t) + (4) 2 Andra lektionen 2. Impulssvar 2.. En liten krets Beräkna impulssvaret för kretsen i figur genom att beräkna hur y(t) beror av x(t). R x(t) i(t) C y(t) Figur : Första ordningens lågpassfilter. Utsignalen

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Fouriertransformer Fourier Gif mig en wågform och jag skola skrifva den som en summa af sinuswågor! Jean-Baptiste Fourier 1768-1830 Fouriertransformen Transformerar kontinuerliga

Läs mer

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 15-18, 30/11-12/

Uppsala Universitet Matematiska Institutionen Bo Styf. Sammanfattning av föreläsningarna 15-18, 30/11-12/ Uppsala Universitet Matematiska Institutionen Bo Styf Transformmetoder, 5 hp ES, gyl, Q, W 0-0-9 Sammanfattning av föreläsningarna 5-8, 30/ - / 0. Z-transformen ska avslutas och sedan blir det tentaförberedelser.

Läs mer

Sammanfattning TSBB16

Sammanfattning TSBB16 Sammanfattning TSBB16 Frekvensfunktion =H(omega) Kombinationen av amplitud och faskarakteristik är unik. H(ω) = D(ω) e^jψ(ω)=y(t)/x(t). Detta är frekvensfunktionen. H(ω)=utsignal/insignal D(ω) = H(ω).

Läs mer

Elektronik 2018 EITA35

Elektronik 2018 EITA35 Elektronik 218 EITA35 Föreläsning 1 Filter Lågpassfilter Högpassfilter (Allpassfilter) Bodediagram Hambley 296-32 218-1-2 Föreläsning 1, Elektronik 218 1 Laboration 2 Förberedelseuppgifter! (Ingen anmälan

Läs mer

GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen

GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen 26.02013 kursens övningsuppgifter eller gamla tentamensuppgifter, eller Matlab-, Scilab- eller Octave- programmerbara kalkylatorer eller datorer. 1.

Läs mer

TSBB16 Datorövning A Samplade signaler Faltning

TSBB16 Datorövning A Samplade signaler Faltning Name: ID number: Passed: LiU-ID: Date: TSBB16 Datorövning A Samplade signaler Faltning Utvecklad av Klas Nordberg Computer Vision Laboratory, Linköping University, Sweden 24 augusti 2015 Introduktion Denna

Läs mer

Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter Laura Enflo & Giampiero Salvi

Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter Laura Enflo & Giampiero Salvi Kompletterande räkneuppgifter i Spektrala Transformer Komplex analys, sampling, kvantisering, serier och filter & Giampiero Salvi Komplex analys Om man endast använder den reella tallinjen är det inte

Läs mer

Kundts rör - ljudhastigheten i luft

Kundts rör - ljudhastigheten i luft Kundts rör - ljudhastigheten i luft Laboration 4, FyL VT00 Sten Hellman FyL 3 00-03-1 Laborationen utförd 00-03-0 i par med Sune Svensson Assisten: Jörgen Sjölin 1. Inledning Syftet med försöket är att

Läs mer

6 Derivata och grafer

6 Derivata och grafer 6 Derivata och grafer 6.1 Dagens Teori När vi plottar funktionen f(x) = x + 1x 99x 8 med hjälp av dosan kan man få olika resultat beroende på vilka intervall man valt. 00000 100000-00 -100 100 00-100000

Läs mer

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 Möjligheter/Problem med 2-dimensionella mätdata Uppstart: Se planen (kursens hemsida) Etapp 1 Mätdata i 2 dimensioner behöver utredas/signalbehandlas

Läs mer

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Denna våg passerar mikrofonen, studsar mot väggen och passerar åter mikrofonen efter tiden

Denna våg passerar mikrofonen, studsar mot väggen och passerar åter mikrofonen efter tiden Lösning till inlämningsuppgift 1 Beskriv först ljudtrycket för den infallande vågen som en funktion av tiden. Eftersom trycket ökar linjärt mellan sågtandsvågens språng och eftersom periodtiden är T=1

Läs mer

Signalbehandling Röstigenkänning

Signalbehandling Röstigenkänning L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1

Läs mer

TSDT15 Signaler och System

TSDT15 Signaler och System TSDT5 Signaler och System DATORUPPGIFTER VÅREN 03 OMGÅNG Mikael Olofsson, mikael@isy.liu.se Efter en förlaga av Lasse Alfredsson February, 03 Denna uppgiftsomgång behandlar faltning samt system- & signalanalys

Läs mer

Tillämpning av komplext kommunikationssystem i MATLAB

Tillämpning av komplext kommunikationssystem i MATLAB (Eller: Vilken koppling har Henrik Larsson och Carl Bildt?) 1(5) - Joel Nilsson joelni at kth.se Martin Axelsson maxels at kth.se Sammanfattning Kommunikationssystem används för att överföra information,

Läs mer

SF1635, Signaler och system I

SF1635, Signaler och system I SF635, Signaler och system I Tentamen tisdagen 0--, kl 4 00 9 00 Hjälpmedel: BETA Mathematics Handbook Räknedosa utan program Formelsamling i Signalbehandling (rosa), Formelsamling för Kursen SF635 (ljusgrön)

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB Tid: 205-0-, 8-3 Lokaler: U, U3, U Ansvarig lärare: Maria Magnusson besöker lokalerna kl. 9.30 och.30 tel 073-80 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling,

Läs mer

Transformer och differentialekvationer (MVE100)

Transformer och differentialekvationer (MVE100) Chalmers tekniska högskola och Göteborgs universitet Matematik 25 januari 2011 Transformer och differentialekvationer (MVE100 Inledning Fouriertransformen Fouriertransform är en motsvarighet till Fourierserier

Läs mer

2 Laborationsutrustning

2 Laborationsutrustning Institutionen för data- och elektroteknik 2002-02-11 1 Inledning Denna laboration syftar till att illustrera ett antal grundbegrepp inom digital signalbehandling samt att närmare studera frekvensanalys

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Fouriertransformer Fourier Gif mig en wågform och jag skola skrifva den som en summa af sinuswågor! Jean-Baptiste Fourier 768-830 Fouriertransformen Transformerar kontinuerliga signaler

Läs mer

4 Fler deriveringsregler

4 Fler deriveringsregler 4 Fler deriveringsregler 4. Dagens Teori Derivatan av potensfunktioner. Potensfunktioner med heltalsexponenter, som du redan kan derivera, kallas polynomfunktioner, som till exempel: f(x) = 2x4 x3 + 2x

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB4 Tid: -5-8 Lokaler: TER3 Ansvarig lärare: Maria Magnusson besöker lokalen kl. 8.45 och.45 tel 8336, 73-84 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling,

Läs mer

Laplace, Fourier och resten varför alla dessa transformer?

Laplace, Fourier och resten varför alla dessa transformer? Laplace, Fourier och resten varför alla dessa transformer? 1 Vi har sett hur ett LTI-system kan ges en komplett beskrivning av dess impulssvar. Genom att falta insignalen med impulssvaret erhålls systemets

Läs mer

Lab lanserade R.A. Moog Inc. en ny synt: Minimoog. Den var designad av Bill Hemsath och Robert Moog och kom att revolutionera musikhistorien.

Lab lanserade R.A. Moog Inc. en ny synt: Minimoog. Den var designad av Bill Hemsath och Robert Moog och kom att revolutionera musikhistorien. Lab 1 1970 lanserade R.A. Moog Inc. en ny synt: Minimoog. Den var designad av Bill Hemsath och Robert Moog och kom att revolutionera musikhistorien. Minimoogen var egentligen en ganska enkel synt. Den

Läs mer

Föreläsning 5. Approximationsteori

Föreläsning 5. Approximationsteori Föreläsning 5 Approximationsteori Låt f vara en kontinuerlig funktion som vi vill approximera med en enklare funktion f(x) Vi kommer använda två olika approximationsmetoder: interpolation och minstrakvadratanpassning

Läs mer

TSIU61: Reglerteknik

TSIU61: Reglerteknik TSIU61: Reglerteknik Föreläsning 11 Tidsdiskret implementering Gustaf Hendeby gustaf.hendeby@liu.se TSIU61 Föreläsning 11 Gustaf Hendeby HT1 2017 1 / 17 Innehåll föreläsning 11 ˆ Sammanfattning av föreläsning

Läs mer

Försättsblad till skriftlig tentamen vid Linköpings universitet G33(1) TER4(63)

Försättsblad till skriftlig tentamen vid Linköpings universitet G33(1) TER4(63) Försättsblad till skriftlig tentamen vid Linköpings universitet Datum för tentamen 2017-01-07 Sal (2) G33(1) TER4(63) Tid 8-12 Kurskod TSBB16 Provkod TEN2 Kursnamn/benämning Provnamn/benämning Institution

Läs mer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer Bildförbättring i spatial domänen (kap. 3) Punktoperationer Gråskaletransformationer Logiska & aritmetiska operationer Filtrering Faltning Lågpassfilter Högpassfilter Bildförbättring (enhancement) Förbättra

Läs mer

DIGITALA FILTER DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1

DIGITALA FILTER DIGITALA FILTER. Tillämpad Fysik Och Elektronik 1 DIGITALA FILTER TILLÄMPAD FYIK OCH ELEKTRONIK, UMEÅ UNIVERITET 1 DIGITALA FILTER Digitala filter förekommer t.ex.: I Photoshop och andra PC-programvaror som filtrerar. I apparater med signalprocessorer,

Läs mer

Försättsblad till skriftlig tentamen vid Linköpings universitet KÅRA T1 T2 U2 U4

Försättsblad till skriftlig tentamen vid Linköpings universitet KÅRA T1 T2 U2 U4 Försättsblad till skriftlig tentamen vid Linköpings universitet Datum för tentamen 2016-10-28 Sal (5) KÅRA T1 T2 U2 U4 Tid 8-12 Kurskod TSBB16 Provkod TEN2 Kursnamn/benämning Provnamn/benämning Grundläggande

Läs mer

Talmängder. Målet med första föreläsningen:

Talmängder. Målet med första föreläsningen: Moment 1..1, 1.., 1..4, 1..5, 1.. 1..5, 1..6 Viktiga exempel 1.7, 1.8, 1.8,1.19,1. Handräkning 1.7, 1.9, 1.19, 1.4, 1.9 b,e 1.0 a,b Datorräkning 1.6-1.1 Målet med första föreläsningen: 1 En första kontakt

Läs mer