Metod för manipulation av prosodi i naturligt tal. Christer Ahlström

Storlek: px
Starta visningen från sidan:

Download "Metod för manipulation av prosodi i naturligt tal. Christer Ahlström"

Transkript

1 Examensarbete Metod för manipulation av prosodi i naturligt tal av Christer Ahlström LiTH-IDA-Ex-2/

2 Linköpings universitet Institutionen för datavetenskap Examensarbete Metod för manipulation av prosodi i naturligt tal av Christer Ahlström LiTH-IDA-Ex-2/ Handledare och examinator: Bertil Lyberg

3 SAMMANFATTNING Detta arbete går ut på att förändra en talsignals prosodiska egenskaper. Matematiskt sett betyder det att tiden och frekvensen ska kunna skalas oberoende av varandra, ett till synes olösbart problem. Tre olika metoder för manipulation av prosodin har studerats. Den första, PSOLA, är en klassisk metod som arbetar i tidsdomänen. Skalningar utförs genom att stycka upp signalen i korta bitar och sätta samman dem med ett nytt avstånd sinsemellan. Om signalen inte behöver skalas mycket är detta en bra metod, både med avseende på beräkningsintensitet och röstkvalitet. Den andra metoden, LPC, bygger på källa/filter-teorin. Ett pulståg driver ett tidsvariabelt filter som definieras av en autoregressiv modell. Resultaten blir tyvärr aldrig riktigt bra. LPC:s stora styrka ligger snarare i talkodningssammanhang där metoden erbjuder en kraftigt komprimerad representation av talet. Den tredje och sista metoden, sinusmodellering, delar upp signalen i parametrar för frekvens, fas och amplitud. Rekonstruktionen matar in dessa parametrar i en cosinusoscillator som återskapar signalen. Stora skalfaktorer kan hanteras medan de stora nackdelarna är tunga beräkningar och vissa problem med injustering av modellen. Den sinusmodell jag utgått från har två problem. Dels ger den ifrån sig klickande ljud och dels förändras formantstrukturen vid frekvensskalning. Dessa brister har rättats till vilket beskrivs i rapporten. De tre metoderna har implementerats i en enkel demonstrator med grafiskt gränssnitt. Denna är till för att det ska gå att testa de undersökta algoritmerna utan att behöva bry sig om de underliggande beräkningarna. iii

4 IV

5 INNEHÅLL 1. Inledning Uttryck och facktermer Användningsområden Rapporten och dess upplägg Tack Pitchdetektering Vad är grundfrekvens? Automatisk detektering av grundfrekvens Tidsdomänen Cepstrumdomänen Frekvensdomänen Feldetektering En jämförelse mellan metoderna TD-PSOLA Pitch- och tidsskalning En ny variabel fönsterfunktion Resultat Kommentarer och förbättringar Linjärprediktion Den autoregressiva modellen Pitch- och tidsskalning Residualen som excitationsignal Resultat Kommentarer och förbättringar Sinusmodellering Frekvensspår Frekvens- och tidsskalning Formantbevarande pitchskalning Förbättring av fasinterpolationen Resultat Kommentarer och förbättringar...4 v

6 VI 6. Demonstrator Funktionalitet Implementation och design Tidsuppskattning Jämförelser och slutsatser Tidsskalning Pitchskalning Mina förbättringsförslag När passar vilken metod bäst? Fönsterstorlek igen Begränsningar och framtida arbete Bibliografi 53 Bilaga A.Brusreducering 55 Bilaga B.Filsystem 57

7 1. INLEDNING Bakom den humanistiskt klingande rubriken Metoder för manipulation av prosodi i naturligt tal döljer sig ett komplicerat signalbehandlingsproblem. Det är en svår uppgift att manipulera talets grundton och utsträckning i tiden. Manipulationen medför kortfattat att dualerna tid och frekvens ska skalas oberoende av varandra. Problemet visas tydligt om en tidsskalning utförs genom att spela upp ett meddelande med dubbla hastigheten. Resultatet blir en frekvenshöjd röst som låter som Piff och Puff. Visserligen ganska roligt att lyssna till, men inte särskilt användbart. Syftet med arbetet har varit att studera och eventuellt vidareutveckla olika metoder för oberoende tids- och pitchskalning. Någon av de studerade metoderna skulle även implementeras i en demonstrator. Eftersom metoderna som studerats är minst 15 år gamla har det funnits tid för tekniken att mogna vilket gjort det mycket svårt att hitta revolutionerande förbättringar. 1.1 Uttryck och facktermer Vardagligt förekommande termer inom signalteorin förutsätts läsaren känna till. Dessa innefattar begrepp som faltning, filter, fönster, fouriertransform och autokorrelation. Termer som hör hemma i talteknologin är kanske inte lika välkända för den tänkte läsaren. De flesta av dessa förklaras därför i början av kapitel 2. För att undvika förvirring kan jag redan nu nämna att pitch och grundfrekvens är samma sak (den mänskliga lyssnaren uppfattar den lägsta frekvensen, grundfrekvensen, som talarens pitch [1]) och att segmentduration är utsträckningen i tiden för ett kort segment av en talsignal. Begreppet prosodi är ett samlingsnamn som betecknar användandet av tryckstyrka, tonhöjdsförhållande och temporala varaktighetsförhållanden i talet [2]. En mer beskrivande beteckning skulle kunna vara satsmelodi. 1

8 2 INLEDNING 1.2 Användningsområden Det finns ett stort antal intressanta användningsområden. Här redovisas ett axplock. Hjälpmedel för hörselskadade Genom att spela upp talet långsammare blir det tydligare och därmed lättare att uppfatta. Hjälpmedel för synskadade Taltidningar och talböcker har en stor nackdel jämfört med pappersutgåvor, det går inte att snabbt ögna igenom innehållet. Om det däremot gick att spela upp talet med en högre hastighet skulle man kunna lyssna igenom materialet på samma sätt som man skummar en text. Denna tidsflaskhals är även tydlig i många andra applikationer. Talande gränssnitt till datorer och snabbavlyssning av telefonsvarare är några exempel. Text-till-tal-system Vid konkateneringssyntes sätter man samman korta talfragment till ord och meningar. Fragmentens grundton får inte vara olika i de olika bitarna för då blir inte ljudet enhetligt. Eftersom det är orimligt att bygga databaser med alla möjliga grundtonsvariationer behöver man skala frekvensen. Detta är även ett krav för att kunna ändra prosodin och därmed göra en mer naturlig syntes. Talanalys Intonationsmodeller för olika dialekter kan studeras genom att manipulera de prosodiska parametrarna olika i olika delar av en inläst mening. Det går då exempelvis att överföra en dialekt till en annan (med begränsningen att många dialekter byter ut ord, stavelser och fonem). 1.3 Rapporten och dess upplägg Svårighetsgraden på denna rapport är anpassad så att en blivande civilingenjör i datateknik, elektroteknik eller liknande ska kunna läsa och förstå innehållet. Vissa avsnitt kräver lite mer av läsaren än andra men i det stora hela hoppas jag att materialet ska vara översiktligt och lättsmält. Överlag har jag inte ägnat mig åt petitesser och finlir utan koncentrerat mig på det centrala i varje metod. För att ändå återge de fällor, genvägar och erfarenheter jag funnit finns i många kapitel rubriken Kommentarer och förbättringar. Där har jag försökt att samla mina lärdomar angående sådant som normalt inte står i litteraturen. En stor del av uppgiften var att studera befintliga metoder och mängden teori i rapporten har anpassats därefter. Det är svårt att dra en klar linje mellan vad jag läst mig till och vad jag kommit fram till själv. Överlag är dock Kommentarer och förbättringar egna tankar men även andra delar är egna påfund, t.ex. avsnitt 3.2 om variabla fönster och avsnitt 5.4 om fasinterpolation. Av samma orsak vill jag

9 1.4 TACK 3 be om ursäkt för den knappa hänvisningen till referenser. Om samma material återges i flera olika källor ser man det snart som känd kunskap vilket inte behöver refereras. Många resultat bygger på hur jag uppfattar kvaliteten på det modifierade ljudet. Eftersom det är svårt att vara objektiv och kritisk mot sitt eget arbete bör dessa tas med en nypa salt. I rapporten illustreras ett fåtal talsignaler för att beskriva metoderna. Resultaten bygger dock på ett tiotal olika meningar som lästs in av både manliga och kvinliga talare på olika språk. Det finns många mer eller mindre bra metoder för att skala tid och frekvens. De flesta bygger dock på någon av tre olika principer. Dessa beskrivs i kapitel 3 till kapitel 5. Vissa av metoderna behöver ett bra estimat av pitchfrekvensen varför kapitel 2 behandlar automatisk pitchdetektering. För att knyta samman resultaten jämförs alla metoderna i kapitel 7. Metoderna har implementerats i en enkel demonstrator med grafiskt gränssnitt. Denna är till för att det ska gå att testa de undersökta algoritmerna utan att behöva bry sig om de underliggande beräkningarna. Demonstratorn beskrivs i kapitel Tack Ett stort tack till alla som tycker sig behöva en klapp på axeln. Speciellt vill jag tacka min handledare och tillika examinator Bertil Lyberg, Mustapha Skhiri och Sonia Sangari för mycken hjälp och trevligt sällskap i labbet samt Samuel Björkman och Tomas Lingvall för idogt korrekturläsande. Samtidigt vill jag passa på att skylla eventuella fejl och mistag på nyss nämnda korrekturläsare.

10 4 INLEDNING

11 2. PITCHDETEKTERING Vad är grundfrekvensen i naturligt tal, hur uppkommer den och hur kan den detekteras? Dessa frågor diskuteras i detta kapitel varefter olika metoder för automatisk pitchdetektering studeras. 2.1 Vad är grundfrekvens? Människans tal bildas genom att luft pressas från lungorna via luftstrupen, struphuvudet, svalget och vidare genom mun- och ibland näshålan. Struphuvudet består av ett antal rörliga brosk som med hjälp av olika muskler och ligament kan kontrollera röstspringan (glipan mellan stämbanden, även kalld glottis). Då springan är sluten kommer utandningsluften att pressas fram mellan stämbanden som då börjar vibrera. Den frekvens som stämbanden svänger med kallas f eller grundfrekvensen. De ljud som uppstår då stämbanden vibrerar kallas tonande. I normalt tal är alla vokaler och vissa konsonanter tonande. Tonlösa ljud bildas med röstspringan i en öppnare ställning utan stämbandsvibration. Svalget, munhålan och näshålan färgar ljudet då det passerar de övre talorganen. Håligheterna fungerar som resonatorer vars resonansegenskaper förändras då hålrummen ändrar storlek och form. De sammankopplade luftkropparna bidrar tillsammans till en förstärkning av vissa deltoner. De områden av frekvensskalan där deltonerna förstärkts kallas formanter, se figur 2-1 på sida 6. Om ljudet som skapas vid stämbanden tjänstgör som insignal g(t) så skulle de övre talorganen kunna liknas vid ett tidsvariabelt filter, H t. Denna liknelse gentemot ett linjärt system är mycket användbar vid modellering av talsystemet. Separationen av glottispulserna och de övre talorganen gör det nämligen mycket enklare att till exempel skala grundfrekvensen. 5

12 6 PITCHDETEKTERING Relativ amplitud f f f F 1 F 2 F 3 f Pulser från stämbanden g(t) Övre talorganen H t x(t) Tal som kommer ut från munnen Figur 2-1: Insignalen till filtret skapas då luft passerar stämbanden. Frekvensen f är den frekvens som stämbanden vibrerar med. Överföringsfunktionen bildas av resonatorer i de övre talorganen och ger här upphov till formanterna F1, F2 och F3 i utsignalen. 2.2 Automatisk detektering av grundfrekvens Detektering av grundfrekvensen är viktigt i många talbehandlingsproblem. Det finns många olika metoder som alla har sina för- och nackdelar. De tre huvudsakliga kategorierna bygger på att talsignalen behandlas i tids-, frekvens- eller cepstrumdomänen. Var och en av dessa huvudkategorier kommer att behandlas i efterföljande avsnitt. 2.3 Tidsdomänen Då en signal korreleras med sig själv får man fram dess autokorrelation, se ekvation (2.1). Denna definition gäller för tidsdiskreta ändliga signaler. Om signalen är periodisk eller quasiperiodisk kommer den att uppvisa stora likheter med sig själv då fördröjningen d är lika med signalens period. En rättfram väg att få fram grundfrekvensen torde då vara att plocka fram periodtiden mellan två maxvärden i autokorrelationsfunktionen (akf). r N d = N d 1 n = xn xn + d (2.1) För att kunna hantera ickestationära signaler som talsignaler måste en korttids-akf användas, se ekvation (2.2). En lämplig ramlängd är 1-3 ms. Denna längd är lämplig eftersom talsignaler inte nämnvärt ändrar sin karaktär under så korta intervall. I ekvationen är q startadressen för den aktuella tidsramen medan w är ett fönster som tvingar ned signalen till noll utanför ramen. q + N 1 rdq = xn n = q xn + d wn q (2.2)

13 2.3 TIDSDOMÄNEN 7 En stor felkälla vid användandet av autokorrelationmetoden är att formanterna ofta detekteras istället för grundtonen. Lyckligvis finns det olika sätt att förbehandla signalen för att komma runt detta problem. En metod som ger bra resultat är centerklippning (center clipping) Centerklippning Vid centerklippning sätter man alla värden i signalen till noll om magnituden är mindre än ett visst tröskelvärde, se figur 2-2. Detta förstör formantstrukturen i signalen utan att direkt påverka periodiciteten. För att inte viktig information ska tas bort måste man vara försiktig när man väljer klippnivån (CL). Ett lämpligt tillvägagångssätt är att först dela in signalen i 1-3 ms långa ramar (detta bör vara samma ramlängd som används i akf:en så att beräkningarna kan utföras i samma beräkningsloop). Ramen delas vidare in i ytterligare tre segment där maxvärdet av första och tredje segmentet beräknas. Klippnivån väljs sedan till ungefär 8 % av det minsta av dessa värden (att nivån är lämplig visas experimentellt i bl.a. [5]). När CL är vald kan elementen nollställas enligt ekvation (2.3) där q betecknar aktuellt segment. q x CL n( = x q n CL x q n J CL x q CL x q n + CL x q CL Periodtiden fastställs till sist genom att mäta tiden mellan intilliggande lokala maximum i signalsegmentets akf. (2.3) 3 x CL CL 3 Fragment av signalen x(n) Klippt signalsegment t [sek] Figur 2-2: Segment q av signalen x(n) visas tillsammans med en klippt variant av sig själv. Även klippnivåerna CL är utritade.

14 8 PITCHDETEKTERING 2.4 Cepstrumdomänen En talsignal består av en faltning mellan ett högfrekvent pulståg gn från stämbanden och en lågfrekvent envelopp hn som bildas i de övre talorganen, se figur 2-1 på sida 6. Cepstrumanalys är en metod för att separera dessa två komponenter. Faltning i tidsdomänen blir multiplikation i fourierdomänen (2.4). Logaritmeras resultatet övergår produkten i en summation. I högerledet i (2.5) ger det högfrekventa pulståget den första termenen medan den andra representerar filtrets envelopp. Inverstransformeras resultatet enligt ekvation (2.6) kan grundfrekvensens periodtid utläsas som det högquefrenta bidraget. Quefrens är den storhet som cepstrum har i tidsdomänen. Detta kan förklaras av att C är jämn och reell varför inverstransformen lika gärna kan beräknas med cosinustransformen. Denna har samma egenskaper som fouriertransformen, d.v.s. den ordnar signalens energiinnehåll efter stigande frekvens. På så vis kommer cn att beskriva signalens frekvensinnehåll. Se figur 2-3. xn = g h n X = G b H (2.4) C = log X = log G + log H (2.5) cn = F 1 log X < = F 1 log G < + F 1 log H < Sammanfattningsvis är cepstrum alltså en olinjär transformation av periodogrammet som definieras enligt ekvation (2.7) och som separerar två sammanfaltade komponenter av olika frekvens. (2.6) c 9( Se F 1 log Fxn ( = (2.7).8.6 Högquefrent topp t [sek] Figur 2-3: Den högquefrenta komponenten visar en tydlig topp vid 7 ms (15 Hz) vilket motsvarar grundfrekvensen. De lågquefrenta topparna är bidrag från de övre talorganen och kan ignoreras.

15 2.5 FREKVENSDOMÄNEN Frekvensdomänen De flesta metoder för pitchdetektering i frekvensdomänen bygger på två väldigt lika principer: 1. beräknas som en bråkdel av någon högre delton. f 2. f beräknas som skillnaden mellan två konsekutiva toppar (deltoner). Här undersöks ett alternativt tillvägagångssätt, nämligen att använda wavelettransformen,wt, istället för den vanliga korttids fouriertransformen, STFT. Transformen visar stora likheter med hur människan bearbetar ljud och har olika tidsupplösning för olika frekvenser, se figur 2-4. Fördelen är att snabba ickestationära och svårpredikterade signaler kan undersökas med bra resultat, något som andra metoder har problem med [7]. Tid-frekvensupplösning i STFT Tid-frekvensupplösning i WT Frekvens Frekvens Tid Tid Figur 2-4: Tid-frekvensupplösning för korttids- och wavelettransformer. Varje yta representerar en punkt i upplösningen av tid och frekvens och för wavelets gäller alltså att bättre tidsupplösning kompenseras med sämre frekvensupplösning så att ytan förblir konstant Wavelettransformen (WT) Den tidskontinuerliga WT definieras av 1 -- B 2 W x ab = a xt t b a dt = B a X 25 a e j b d Wavelettransformen är alltså en skalärprodukt mellan signalen xt och en translaterad och skalad version av den så kallade waveletfunktionen t. Kännetecknande för waveletfunktionen är att den har bandpasskaraktär. Skalningsparametern a påverkar centerfrekvensen och bandbredden på t medan b påverkar translationen. För små värden på skalningsfaktorn a erhålls god tidupplösning B B (2.8)

16 1 PITCHDETEKTERING medan stora a ger bra frekvensupplösning. Skalningsfaktorn är till för att alla skalade funktioner ska få samma energi. I sista ledet definieras WT i termer av xt och t :s respektive fouriertransformer Multiupplösnings-wavelet Ett ljud samplat i en punkt är en funktion som är konstant i intervallet [,1]. Låt V vara ett vektorrum innehållande alla dessa funtioner. Ett tvåpunkters ljud kommer på samma sätt att ha två konstanta intervall över [,.5[ och [.5,1] med vektorrumet V 1. Fortsätter man med samma uppdelning kommer man att få ett rum innehållande alla styckvis konstanta funktioner mellan [,1]. Då j ökar kommer även upplösningen av funktionerna i V j att öka. Basfunktionerna som spänner upp V j kallas skalningsfunktioner. Nästa steg är att ta fram waveletfunktionerna. Dessa väljs som det ortogonala komplementet till V j i V j + 1 och betecknas W j. Beroende på vilka egenskaper hos signalen som ska undersökas väljs olika basfuntioner. T.ex. är Daubechies filter användbara för pitchdetektering Pitchdetektering a 1A 2 Pulståget från stämbanden ger upphov till nollgenomgångar i talsignalen. Om signalen filtreras med en deriverande funktion (exempelvis Daubechies filter) kommer ett maximum att uppträda för varje nollgenomgång. Wavelettransformens förmåga att använda olika skalor (närliggande skalor visar maxvärden på samma position för glottispulserna) tillsammans med de deriverande egenskaperna är något som tagits fasta på för pitchdetektering, se [6]. Där har funktionerna V j t = 2 k A 2 2 k t t = 2 k A 2 2 k t (2.9) (2.1) valts som wavelet respektive skalningsfunktion. t är en lågpassfunktion medan t är en högpassfunktion. För att avgränsa frekvensbandet och samtidigt anpassa (2.9) och (2.1) till talsignalens intressanta frekvensområde låter man t få skalningsfaktorn enligt k a 2 k a F = ---- s f 1 (2.11)

17 2.6 FELDETEKTERING 11 Skalningsfaktorn för waveletfunktionen blir av samma anledning 2 k b F = ---- s f 2 (2.12) Frekvenserna f 1 och f 2 är här övre och undre gräns för talsignalen medan F s är samplingsfrekvensen. Det slutliga filtret 7 t byggs upp som faltningen mellan wavelet och skalningsfunktionerna med skalningsfaktorer enligt (2.11) och (2.12). 7 t = ka t kb t (2.13) Den filtrerade signalen påminner om en sinus där grundfrekvensen kan beräknas genom periodtiden. Onogrannheten i samplingen tvingar dock fram interpolation mellan samplingpunkterna för att inte slutresultatet ska påverkas negativt. 2.6 Feldetektering Med alla undersökta metoder uppstår det fel i pitchdetekteringen. Det finns tre vanliga orsaker till att ett estimat bör ratas: Det finns ingen energi i signalen. Det finns ingen energi i den filtrerade signalen (wavelet). Pitchestimatet är felaktigt. De opålitliga värden som direkt kan tas bort ur estimatet är frekvenser som beräknas i tidpunkter då signalens energi är väldigt låg (mellan ord etc.). Även frekvenser som ligger ovanför 1 khz är osannolika eftersom människor vanligtvis inte är kapabla till så höga grundtoner. Sätter man frekvensen till noll i dessa tveksamma fall uppnås ett bättre estimat. Resultatet kan bli än bättre om man behandlar alla maximum (i autokorrelation och wavelet-fallet) beroende på dess omedelbara omgivning. Eftersom topparna kommer med lokalt regelbundna intervall kan de toppar som upptäcks på fel plats tas bort. Det är även möjligt att lägga till maximum där de borde vara och på så sätt få ett jämnare estimat. 2.7 En jämförelse mellan metoderna Alla föreslagna metoder gör ett bra jobb med att estimera grundfrekvensen hos långsamt varierande talsignaler. De principiella skillnader som kan ses i figur 2-5 beror mycket på olika tröskelvärden mellan metoderna. Ska man rekommendera en metod får det bli autokorrelationsmetoden. Detta då den är stabil och ger ett pålitligt resultat. Det som fäller avgörandet är att cepstrummetoden inte alltid hittar grundfrekvensen och då väljer att kategorisera talet som tonlöst. Waveletmetoden till sist misslyckas emellanåt genom att välja

18 12 PITCHDETEKTERING en multipel av grundfrekvensen istället för den verkliga. Det som talar för den mer komplicerade waveletmetoden är att den klarar av kraftigt varierande frekvenser och snabba ickestationära signaler, se figur 2-6. Turligt nog är dessa faktorer inte nämnvärt viktiga för naturligt tal så någon av de andra metoderna kan användas. Pitch autokorr, f [Hz] Pitch cepstrum, f [Hz] Pitch wavelet, f [Hz] Signal t [s] Figur 2-5: Jämförelse av pitchdetektering m.h.a. autokorrelation (överst), cepstrum (mitten) och wavelets (nederst). Skillnaderna mellan metoderna beror i det stora hela på olikheter i tröskelvärdena mellan metoderna. Nederst visas testsignalen som i detta fall är en inspelad mansröst.

19 2.7 EN JÄMFÖRELSE MELLAN METODERNA 13 Pitch autokorr, f [Hz] Pitch cepstrum, f [Hz] Pitch wavelet, f [Hz] Signal t [s] Figur 2-6: Jämförelse av pitchdetektering m.h.a. autokorrelation (överst), cepstrum (mitten) och wavelets (nederst). Skillnaderna mellan metoderna visas här tydligt och det är bara waveletmetoden som kan återge frekvensen korrekt. Observera dock de felaktiga insvängningsvärdena. Nederst visas testsignalen som i detta fall är ett frekvenssvep från 1 till 3 Hz.

20 14 PITCHDETEKTERING

21 3. TD-PSOLA TD-PSOLA står för TimeDomain PitchSynchronous OverLap-Add. Namnet i sig självt förklarar egentligen hur metoden fungerar: TD Beräkningarna görs i tidsdomänen. OL Signalen delas i överlappande småbitar (segment). A Segmenten adderas vid rekonstruktionen. PS Segmentens storlek bestäms av pitchperioden. Talsignalen delas alltså upp i korta överlappande segment. Pitch- och tidsskalningarna utförs genom att sätta samman segmenten med nytt avstånd sinsemellan och genom att upprepa eller hoppa över vissa segment för att fylla ut tidsrymden. Som allmän referens gällande PSOLA har Mark Kahrs bok använts [13]. 3.1 Pitch- och tidsskalning Storleken på segmenten bestäms av pitchperioden som tas fram med någon av metoderna i kapitel 2. Överst i figur 3-1 på sida 16 har en signal märkts upp med sin pitchperiod. Om talsignaler hade varit helt periodiska skulle pitchskalningar kunna göras enligt (3.1) och (3.2). s i n är här en ram som fönstrats fram pitchsynkront ur den ursprungliga signalen sn. T är den önskade pitchperioden medan är den ursprungliga. T p s i n = sn wn it p (3.1) B ŝ n = s i n i T T p i = B Tyvärr är talsignaler inte stationära. Däremot är det vanligt att de är bitvis periodiska. För att utnyttja kvasistationäriteten görs fönsterstorleken tidsvaribel. Storleken är en kompromiss mellan två olika situationer. Ett för litet överlapp bildar glapp i slutresultatet medan ett för stort överlapp ger en harmonisering av signalen. Genom att välja fönsterbredden till dubbla periodlängden hamnar man mitt emellan dessa lägen. Överlappet kommer således att sträcka sig ut över halva de intilliggande pitchsegmenten. (3.2) 15

22 16 TD-PSOLA Ram n Ram n+1 Ram n Sampel Figur 3-1: Vid pitchsänkning flyttas de fönstrade ramarna isär innan de sätts ihop. Detta leder till att vissa ramar måste hoppas över för att inte signalens utsträckning i tiden ska ändras. Här är skalfaktorn 1.3. Vid pitchsänkning flyttas ramarna (pitchsegment plus överlapp) isär och för att tidsskalan ska bibehållas hoppas vissa ramar över. Detta kan till exempel göras så fort man hämtar data som ligger mer än en period bort i ursprungssignalen, se figur 3-1. På samma sätt får vissa ramar dubbleras vid pitchhöjning. Det är viktigt att inse att ramarna inte förlängs eller krymps ihop, till exempel genom omsampling. Istället skjuts de in över eller dras isär från intilliggande ramar varpå superpositionering resulterar i en pitchskalad signal, se återigen figur 3-1. Även vid tidsskalning kommer vissa ramar att hoppas över eller upprepas. Detta handlar i praktiken om att skala om de tidsindex som representerar pitchsegmenten. Dessa fylls sedan ut med så många ramar som möjligt, se figur 3-2.

23 3.2 EN NY VARIABEL FÖNSTERFUNKTION Ram n+5 Ram n+4 Ram n+3 Ram n+2 Ram n+1 Ram n Sampel x 1 4 Figur 3-2: Vid tidsskalning upprepas eller kasseras vissa ramar. Här skalas signalen med en faktor 1.5 varför vissa ramar upprepas. 3.2 En ny variabel fönsterfunktion Som nämns ovan medför en pitchhöjning att ramarna trycks ihop och att överlappet därmed blir större. För att minska effekterna av ramarnas påverkan av varandra kan man använda olika typer av fönster. Då periodtiden ökas eller lämnas orörd är ett mjukt fönter som hanning att föredra. Om däremot periodtiden minskas är det bättre att använda ett fönster som är mer centrerat och tar bort mer av överlappsinformationen. Ett fönster som uppfyller dessa egenskaper är kaiserfönstret, se figur 3-3. Resultat från skalning ses i figur Hanningfönster 1 Kaiserfönster, β= Sampel Sampel Figur 3-3: Hanningfönstret till vänster och kaiserfönstret till höger.

24 18 TD-PSOLA.5 Ursprungliga signalen Pitchskalad signal, hanningfönster Pitchskalad signal, kaiserfönster med β= Figur 3-4: Den ursprungliga signalen har en pitchperiod utmärkt. Med sträckade linjer visas den centrala del som PSOLA försöker bevara. Skillnaden mellan Hanning- och Kaiserfönstren kan här ses på djupet av dalarna där Kaiserfönstret återger den ursprungliga kurvformen bättre. 3.3 Resultat Tidsskalningar fungerar mycket bra för rimliga skalfaktorer. Det faktum att information tas bort respektive upprepas utgör en naturlig begränsning för metoden. Nedskalning till halva längden ger klart godkända resultat och vidare skalning är inte intressant eftersom det även naturligt är svårt att uppfatta så snabbt tal. När talet förlängs är det upprepningar av samma information som utgör begränsningen. Vid cirka 3 procents förlängning ändrar ljudet karaktär och låter mer stramt. Bortsett från denna defekt kan signalen förlängas med uppemot 3% innan ljudkvaliten försämras nämnvärt. En studie av spektrogram över de tidskalade signalerna och den ursprungliga visar på god överensstämmelse, se figur 3-5. Pitchskalningar kan utföras i storleksordningen 2-3 procent. Höjningar blir i regel sämre än motsvarande sänkning av pitchen. Detta beror på att superpositionen av segmenten ibland ger oväntade resultat. Ju mer segmenten trycks ihop desto mer kommer de att påverka varandra. Vid sänkning av pitchen kommer inte detta att ge lika stora effekter eftersom den centrala delen av det ursprungliga pitchsegmentet bevaras bättre. Vad som händer mellan periodcentrum är inte lika känsligt och uppfattas mest som om talet knorrar. Ett exempel på pitchskalning visas i figur 3-6 på sida 2.

25 3.4 KOMMENTARER OCH FÖRBÄTTRINGAR 19 4 Sprektrogram över den ursprungliga signalen Frekvens [Hz] Sprektrogram över signalen rekonstruerad till dubbla längden 4 Frekvens [Hz] Sprektrogram över signalen rekonstruerad till halva längden 4 Frekvens [Hz] Tid [s] Figur 3-5: Spektrogram över den ursprungliga signalen och signalen skalad till dubbla respektive halva längden. Talsignalen utgörs av en kvinnoröst som säger A lathe is a big tool; grab every dish of sugar. 3.4 Kommentarer och förbättringar Ramarna skulle kunna knuffas i fas genom att de förskjuts i förhållande till varandra. Hur pass bra en sådan metod fungerar beror givetvis på hur mycket man kan knuffa ramarna innan det hörs att grundfrekvensen ändras mellan varje period. Om skalfaktorerna är tidsvaribla (vilket de ofta är om talets prosodi ska ändras) är det bra om skalfunktionerna är relativt mjuka. Det är därför bra att lågpassfiltrera skalfunktionerna innan användning i PSOLA-algoritmen. Om snabba förändringar är ett krav kan istället ett fåpunktigt medianfilter användas för att runda av de brantaste topparna. Anledningen till detta är att stora och plötsliga omskalningar innebär att en enskild ram kommer att upprepas många gånger. Detta skapar eko och bör undvikas.

26 2 TD-PSOLA En enkel autokorrelations-baserad metod har använts för pitchdetektering. PSOLA-algoritmen är helt utelämnad åt de data som detekteringen erbjuder. Eftersom uppdelningen i ramar bygger på dessa data är det viktigt att de stämmer överens med verkligheten. Uppenbarligen finns här plats för förbättringar. Till exempel skulle flera olika skattningar kunna användas och viktas samman till en mer korrekt pitchperiod Ursprungliga signalen Signalen rekonstruerad med pitchperioden skalad en faktor Signalen rekonstruerad med pitchperioden skalad en faktor Tid [s] Figur 3-6: Pitchskalning med en faktor 1.2 resp..8. Här är det dalarna som ligger i mitten av pitchsegmenten och dessa rekonstrueras som synes bra. Däremellan skiljer sig resultaten mer från originalet.

DT1130 Spektrala transformer Tentamen

DT1130 Spektrala transformer Tentamen DT3 Spektrala transformer Tentamen 5 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: E: 9 p, D:.5 p, C: p, B: 6 p, A: 8 p Tillåtna hjälpmedel:

Läs mer

Spektrala Transformer

Spektrala Transformer Spektrala Transformer Tidsdiskreta signaler, kvantisering & sampling Tidsdiskreta signaler Tidskontinuerlig signal Ex: x(t) = sin(ωt) t är ett reellt tal ω har enheten rad/s Tidsdiskret signal Ex: x(n)

Läs mer

Tentamen i ESS 010 Signaler och System E3 V-sektionen, 16 augusti 2005, kl 8.30 12.30

Tentamen i ESS 010 Signaler och System E3 V-sektionen, 16 augusti 2005, kl 8.30 12.30 Tentamen i ESS 00 Signaler och System E3 V-sektionen, 6 augusti 2005, kl 8.30 2.30 Examinator: Mats Viberg Tentamen består av 5 uppgifter som vardera ger maximalt 0 p. För godkänd tentamen fordras ca 20

Läs mer

Tentamen ssy080 Transformer, Signaler och System, D3

Tentamen ssy080 Transformer, Signaler och System, D3 Tentamen ssy080 Transformer, Signaler och System, D3 Examinator: Ants R. Silberberg 19 oktober 2011 kl. 08.30-12.30 sal: Hörsalsvägen Förfrågningar: Ants Silberberg, tel. 1808 Lösningar: Anslås torsdag

Läs mer

Digital signalbehandling Digitalt Ljud

Digital signalbehandling Digitalt Ljud Signalbehandling Digital signalbehandling Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2008-10-06 Elektronik - digital signalbehandling 1

Läs mer

2F1120 Spektrala transformer för Media Tentamen

2F1120 Spektrala transformer för Media Tentamen F Spektrala transformer för Media Tentamen 68 Tentamen består av fem uppgifter där varje uppgift maximalt ger p. Normalt gäller följande betygsgränser: :9 p, : p, 5: 7 p Tillåtna hjälpmedel: räknare, formelblad

Läs mer

Tentamen ssy080 Transformer, Signaler och System, D3

Tentamen ssy080 Transformer, Signaler och System, D3 Tentamen ssy080 Transformer, Signaler och System, D3 Examinator: Ants R. Silberberg oktober 009 kl. 4.00-8.00 lokal: Johanneberg Förfrågningar: Ants Silberberg, tel. 808 Lösningar: Anslås torsdag okt.

Läs mer

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny

Teori... SME118 - Mätteknik & Signalbehandling SME118. Johan Carlson 2. Teori... Dagens meny Tidigare har vi gått igenom Fourierserierepresentation av periodiska signaler och Fouriertransform av icke-periodiska signaler. Fourierserierepresentationen av x(t) ges av: där a k = 1 T + T a k e jkω

Läs mer

Talets akustik repetition

Talets akustik repetition Pétur Helgason VT 29 Talets akustik repetition 29-3-3 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 8 % kväve och 2 % syre.

Läs mer

DIGITAL KOMMUNIKATION

DIGITAL KOMMUNIKATION EN KOR SAMMANFANING AV EORIN INOM DIGIAL KOMMUNIKAION Linjär kod En binär linjär kod kännetecknas av att summan av två kodord också är ett kodord. Ett specialfall är summan av ett kodord med sig själv

Läs mer

7. Sampling och rekonstruktion av signaler

7. Sampling och rekonstruktion av signaler Arbetsmaterial 5, Signaler&System I, VT04/E.P. 7. Sampling och rekonstruktion av signaler (Se också Hj 8.1 3, OW 7.1 2) 7.1 Sampling och fouriertransformering Man säger att man samplar en signal x(t) vid

Läs mer

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19

Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Resttentamen i Signaler och System Måndagen den 11.januari 2010, kl 14-19 Tillåtna hjälpmedel: Valfri miniräknare (utan möjlighet till trådlös kommunkation). Valfri litteratur, inkl. kursböcker, formelsamlingar.

Läs mer

Signalanalys med snabb Fouriertransform

Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, MVE030 Signalanalys med snabb Fouriertransform Den här laborationen har två syften: dels att visa lite på hur den snabba Fouriertransformen fungerar, och lite om vad man bör

Läs mer

Laboration i Fourieroptik

Laboration i Fourieroptik Laboration i Fourieroptik David Winge Uppdaterad 30 januari 2015 1 Introduktion I detta experiment ska vi titta på en verklig avbildning av Fouriertransformen. Detta ska ske med hjälp av en bild som projiceras

Läs mer

Mätningar med avancerade metoder

Mätningar med avancerade metoder Svante Granqvist 2008-11-12 13:41 Laboration i DT2420/DT242V Högtalarkonstruktion Mätningar på högtalare med avancerade metoder Med datorerna och signalprocessningens intåg har det utvecklats nya effektivare

Läs mer

Laboration i tidsdiskreta system

Laboration i tidsdiskreta system Laboration i tidsdiskreta system A. Tips Användbara MATLAB-funktioner: conv Faltning square Skapa en fyrkantvåg wavread Läs in en ljudfil soundsc Spela upp ett ljud ones Skapa en vektor med godtyckligt

Läs mer

Bildbehandling i frekvensdomänen

Bildbehandling i frekvensdomänen Uppsala Tekniska Högskola Signaler och system Handledare: Mathias Johansson Uppsala 2002-11-27 Bildbehandling i frekvensdomänen Erika Lundberg 800417-1602 Johan Peterson 790807-1611 Terese Persson 800613-0267

Läs mer

AD-DA-omvandlare. Mätteknik. Ville Jalkanen. ville.jalkanen@tfe.umu.se 1

AD-DA-omvandlare. Mätteknik. Ville Jalkanen. ville.jalkanen@tfe.umu.se 1 AD-DA-omvandlare Mätteknik Ville Jalkanen ville.jalkanen@tfe.umu.se Inledning Analog-digital (AD)-omvandling Digital-analog (DA)-omvandling Varför AD-omvandling? analog, tidskontinuerlig signal Givare/

Läs mer

DT1120 Spektrala transformer för Media Tentamen

DT1120 Spektrala transformer för Media Tentamen DT Spektrala transformer för Media Tentamen 77 Tentamen består av fem uppgifter där varje uppgift maximalt ger 4 p. Normalt gäller följande betygsgränser: 3:9 p, 4: 3 p, 5: 7 p Tillåtna hjälpmedel: räknare,

Läs mer

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform

Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Laboration i Fourieranalys, TMA132 Signalanalys med snabb Fouriertransform Den laborationen har syften: dels att visa lite hur den snabba Fouriertransformen fungerar, och lite om vad man den an dels att

Läs mer

Projekt 3: Diskret fouriertransform

Projekt 3: Diskret fouriertransform Projekt 3: Diskret fouriertransform Diskreta fouriertransformer har stor praktisk användning inom en mängd olika områden, från analys av mätdata till behandling av digital information som ljud och bildfiler.

Läs mer

FOURIERANALYS En kort introduktion

FOURIERANALYS En kort introduktion FOURIERAALYS En kort introduktion Kurt Hansson 2009 Innehåll 1 Signalanalys 2 2 Periodiska signaler 2 3 En komplex) skalärprodukt 4 4 Fourierkoefficienter 4 5 Sampling 5 5.1 Shannon s teorem.................................

Läs mer

Att fånga den akustiska energin

Att fånga den akustiska energin Att fånga den akustiska energin När vi nu har en viss förståelse av vad ljud egentligen är kan vi börja sätta oss in i hur det kan fångas upp och efterhand lagras. När en ljudvåg sprider sig är det inte

Läs mer

Spektralanalys - konsten att hitta frekvensinnehållet i en signal

Spektralanalys - konsten att hitta frekvensinnehållet i en signal Spektralanalys - konsten att hitta frekvensinnehållet i en signal Bengt Carlsson, Erik Gudmundson och Marcus Björk Systems and Control Dept. of Information Technology, Uppsala University 7 november 013

Läs mer

Kvalificeringstävling den 30 september 2008

Kvalificeringstävling den 30 september 2008 SKOLORNAS MATEMATIKTÄVLING Svenska Matematikersamfundet Kvalificeringstävling den 30 september 2008 Förslag till lösningar Problem 1 Tre rader med tal är skrivna på ett papper Varje rad innehåller tre

Läs mer

SF1635, Signaler och system I

SF1635, Signaler och system I SF65, Signaler och system I Tentamen tisdagen 4--4, kl 8 Hjälpmedel: BETA Mathematics Handbook. Formelsamling i Signalbehandling rosa), Formelsamling för Kursen SF65 ljusgrön). Obs : Obs : Obs : Obs 4:

Läs mer

Samtidig visning av alla storheter på 3-fas elnät

Samtidig visning av alla storheter på 3-fas elnät Samtidig visning av alla storheter på 3-fas elnät Med nätanalysatorerna från Qualistar+ serien visas samtliga parametrar på tre-fas elnätet på en färgskärm. idsbaserad visning Qualistar+ visar insignalerna

Läs mer

= y(0) för vilka lim y(t) är ändligt.

= y(0) för vilka lim y(t) är ändligt. Lösningsförslag till tentamensskrivning i SF633 Differentialekvationer I och SF637 Differentialekvationer och transformer III Lördagen den 4 februari, kl 4-9 Hjälpmedel: BETA, Mathematics Handbook Redovisa

Läs mer

Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation

Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation Projekt 1 (P1) Problembeskrivning och uppdragsspecifikation Etapp 1 Problem med mätsignalen m.a.p. sampling, vikning och spektraltäthet Problembeskrivning Uppdragsgivaren överväger att skaffa nya A/D-omvandlare

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB Tid: 3-5-3 Lokaler: TER Ansvarig lärare: Maria Magnusson besöker lokalen kl. 8.5 och.3 tel 73-8 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling, OH-film,

Läs mer

3. Metoder för mätning av hörförmåga

3. Metoder för mätning av hörförmåga 3. Metoder för mätning av hörförmåga Sammanfattning Förekomst och grad av hörselnedsättning kan mätas med flera olika metoder. I kliniskt arbete används oftast tonaudiogram. Andra metoder är taluppfattningstest

Läs mer

Signalbehandling Röstigenkänning

Signalbehandling Röstigenkänning L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1

Läs mer

Kompletterande material till föreläsning 5 TSDT08 Signaler och System I. Erik G. Larsson LiU/ISY/Kommunikationssystem

Kompletterande material till föreläsning 5 TSDT08 Signaler och System I. Erik G. Larsson LiU/ISY/Kommunikationssystem ompletterande material till föreläsning 5 TSDT8 Signaler och System I Erik G. Larsson LiU/ISY/ommunikationssystem erik.larsson@isy.liu.se November 8 5.1. Första och andra ordningens tidskontinuerliga LTI

Läs mer

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation

Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 (P2) Problembeskrivning och uppdragsspecifikation Projekt 2 Möjligheter/Problem med 2-dimensionella mätdata Uppstart: Se planen (kursens hemsida) Etapp 1 Mätdata i 2 dimensioner behöver utredas/signalbehandlas

Läs mer

GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen

GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen GRUNDKURS I SIGNALBEHANDLING (454300), 5sp Tentamen 26.02013 kursens övningsuppgifter eller gamla tentamensuppgifter, eller Matlab-, Scilab- eller Octave- programmerbara kalkylatorer eller datorer. 1.

Läs mer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer

Bildförbättring i spatial domänen (kap. 3) Bildförbättring (enhancement) Spatial domän. Operatorer. Tröskling (threshold) Gråskale-transformationer Bildförbättring i spatial domänen (kap. 3) Punktoperationer Gråskaletransformationer Logiska & aritmetiska operationer Filtrering Faltning Lågpassfilter Högpassfilter Bildförbättring (enhancement) Förbättra

Läs mer

TSBB16 Datorövning A Samplade signaler Faltning

TSBB16 Datorövning A Samplade signaler Faltning Name: ID number: Passed: LiU-ID: Date: TSBB16 Datorövning A Samplade signaler Faltning Utvecklad av Klas Nordberg Computer Vision Laboratory, Linköping University, Sweden 24 augusti 2015 Introduktion Denna

Läs mer

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten

KÄLLA-FILTER. Repetition. Talapparaten i källa-filter perspektivet. Repetition (ff) Ljudkällor i talapparaten (ff) Ljudkällor i talapparaten KÄLLA-FILTER Repetition - Repetition av resonans och filter Komplexa ljudvågor: deltoner Amplitudspektrum - Talapparaten som resonator - Talapparaten som källa-filtersystem - Spektrum, Spektrogram, spektrograf

Läs mer

Denna våg passerar mikrofonen, studsar mot väggen och passerar åter mikrofonen efter tiden

Denna våg passerar mikrofonen, studsar mot väggen och passerar åter mikrofonen efter tiden Lösning till inlämningsuppgift 1 Beskriv först ljudtrycket för den infallande vågen som en funktion av tiden. Eftersom trycket ökar linjärt mellan sågtandsvågens språng och eftersom periodtiden är T=1

Läs mer

SF1635, Signaler och system I

SF1635, Signaler och system I SF635, Signaler och system I Tentamen tisdagen 0--, kl 4 00 9 00 Hjälpmedel: BETA Mathematics Handbook Räknedosa utan program Formelsamling i Signalbehandling (rosa), Formelsamling för Kursen SF635 (ljusgrön)

Läs mer

TSDT15 Signaler och System

TSDT15 Signaler och System TSDT5 Signaler och System DATORUPPGIFTER VÅREN 03 OMGÅNG Mikael Olofsson, mikael@isy.liu.se Efter en förlaga av Lasse Alfredsson February, 03 Denna uppgiftsomgång behandlar faltning samt system- & signalanalys

Läs mer

Föreläsning 10, Egenskaper hos tidsdiskreta system

Föreläsning 10, Egenskaper hos tidsdiskreta system Föreläsning 10, Egenskaper hos tidsdiskreta system Reglerteknik, IE1304 1 / 26 Innehåll Kapitel 18.1. Skillnad mellan analog och digital reglering 1 Kapitel 18.1. Skillnad mellan analog och digital reglering

Läs mer

Signal- och bildbehandling TSBB14

Signal- och bildbehandling TSBB14 Tentamen i Signal- och bildbehandling TSBB4 Tid: -5-8 Lokaler: TER3 Ansvarig lärare: Maria Magnusson besöker lokalen kl. 8.45 och.45 tel 8336, 73-84 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling,

Läs mer

Sammanfattning TSBB16

Sammanfattning TSBB16 Sammanfattning TSBB16 Frekvensfunktion =H(omega) Kombinationen av amplitud och faskarakteristik är unik. H(ω) = D(ω) e^jψ(ω)=y(t)/x(t). Detta är frekvensfunktionen. H(ω)=utsignal/insignal D(ω) = H(ω).

Läs mer

Språkljudens akustik. Akustik, akustiska elementa och talanalys

Språkljudens akustik. Akustik, akustiska elementa och talanalys Akustik, akustiska elementa och talanalys Språkljudens akustik Mattias Heldner KTH Tal, musik och hörsel heldner@kth.se Talsignalen mer lättåtkomlig än andra delar av talkommunikationskedjan Det finns

Läs mer

Tillämpad Fysik Och Elektronik 1

Tillämpad Fysik Och Elektronik 1 FREKVENSSPEKTRUM (FORTS) TILLÄMPAD FYSIK OCH ELEKTRONIK, UMEÅ UNIVERSITET 1 ICKE-PERIODISKA FUNKTIONER Icke- periodiska funktioner kan betraktas som periodiska, med oändlig periodtid P. TILLÄMPAD FYSIK

Läs mer

Kundts rör - ljudhastigheten i luft

Kundts rör - ljudhastigheten i luft Kundts rör - ljudhastigheten i luft Laboration 4, FyL VT00 Sten Hellman FyL 3 00-03-1 Laborationen utförd 00-03-0 i par med Sune Svensson Assisten: Jörgen Sjölin 1. Inledning Syftet med försöket är att

Läs mer

Lab 4: Digital transmission Redigerad av Niclas Wadströmer. Mål. Uppstart. Genomförande. TSEI67 Telekommunikation

Lab 4: Digital transmission Redigerad av Niclas Wadströmer. Mål. Uppstart. Genomförande. TSEI67 Telekommunikation TSEI67 Telekommunikation Lab 4: Digital transmission Redigerad av Niclas Wadströmer Mål Målet med laborationen är att bekanta sig med transmission av binära signaler. Det innebär att du efter laborationen

Läs mer

Svängningar och frekvenser

Svängningar och frekvenser Svängningar och frekvenser Vågekvationen för böjvågor Vågekvationen för böjvågor i balkar såväl som plattor härleds med hjälp av elastiska linjens ekvation. Den skiljer sig från de ovanstående genom att

Läs mer

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem Avsnitt Linjära ekvationssystem Elementära radoperationer Gausseliminering Exempel Räkneschema Exempel med exakt en lösning Exempel med parameterlösning Exempel utan lösning Slutschema Avläsa lösningen

Läs mer

Poler och nollställen, motkoppling och loopstabilitet. Skrivet av: Hans Beijner 2003-07-27

Poler och nollställen, motkoppling och loopstabilitet. Skrivet av: Hans Beijner 2003-07-27 Poler och nollställen, motkoppling och loopstabilitet Skrivet av: Hans Beijner 003-07-7 Inledning All text i detta dokument är skyddad enligt lagen om Copyright och får ej användas, kopieras eller citeras

Läs mer

Faltningsreverb i realtidsimplementering

Faltningsreverb i realtidsimplementering Faltningsreverb i realtidsimplementering SMS45 Lp1 26 DSP-system i praktiken Jörgen Anderton - jorand-3@student.ltu.se Henrik Wikner - henwik-1@student.ltu.se Introduktion Digitala reverb kan delas upp

Läs mer

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription

Idag. Tillägg i schemat. Segmenteringsproblemet. Transkription Tillägg i schemat 21/9 slutar 16.00 ist f 15.00 5/10 slutar 16.00 ist f 15.00 Idag talkommunikationskedjan ljudvågor, enkla och sammansatta vågrörelser frekvens och amplitud ljudtryck, decibel källa-filter-modellen

Läs mer

Spektrogram att göra ljud synligt

Spektrogram att göra ljud synligt Spektrogram att göra ljud synligt 2011-02-23 Vad är ljud för någonting? Vi människor lever och rör oss i ett skikt med gas som ligger ovanpå jordens yta. Gasen består av ca 80 % kväve och 20 % syre. Denna

Läs mer

4 Laboration 4. Brus och termo-emk

4 Laboration 4. Brus och termo-emk 4 Laboration 4. Brus och termoemk 4.1 Laborationens syfte Detektera signaler i brus: Detektera periodisk (sinusformad) signal med hjälp av medelvärdesbildning. Detektera transient (nästan i alla fall)

Läs mer

Blandade problem från elektro- och datateknik

Blandade problem från elektro- och datateknik Blandade problem från elektro- och datateknik Sannolikhetsteori (Kapitel 1-10) E1. En viss typ av elektroniska komponenter anses ha exponentialfördelade livslängder. Efter 3000 timmar brukar 90 % av komponenterna

Läs mer

Tentamen i Signaler och kommunikation, ETT080

Tentamen i Signaler och kommunikation, ETT080 Inst. för informationsteknologi Tentamen i Signaler och kommunikation, ETT080 2 juni 2006, kl 14 19 Skriv namn och årskurs på alla papper. Börja en ny lösning på ett nytt papper. Använd bara en sida av

Läs mer

Analys av egen tidsserie

Analys av egen tidsserie Analys av egen tidsserie Tidsserieanalys Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo 9 december 25 3 25 Antal solfläckar 2 15 1 5 5 1 15 2 25 3 Månad Inledning Vi har valt att betrakta

Läs mer

Säsongrensning i tidsserier.

Säsongrensning i tidsserier. Senast ändrad 200-03-23. Säsongrensning i tidsserier. Kompletterande text till kapitel.5 i Tamhane och Dunlop. Inledning. Syftet med säsongrensning är att dela upp en tidsserie i en trend u t, en säsongkomponent

Läs mer

Ansiktsigenkänning med MATLAB

Ansiktsigenkänning med MATLAB Ansiktsigenkänning med MATLAB Avancerad bildbehandling Christoffer Dahl, Johannes Dahlgren, Semone Kallin Clarke, Michaela Ulvhammar 12/2/2012 Sammanfattning Uppgiften som gavs var att skapa ett system

Läs mer

1. Vi har givet två impulssvar enligt nedan (pilen under sekvenserna indikerar den position där n=0) h 1 (n) = [ ]

1. Vi har givet två impulssvar enligt nedan (pilen under sekvenserna indikerar den position där n=0) h 1 (n) = [ ] TEKNISKA HÖGSKOLAN I LUND Institutionen för elektro- och informationsteknik Kurskod: ESS00 Tentamen i Digital Signalbehanding Datum: 0 5 Time period: 08.00 3.00 Bedömning: Sex uppgifter. Varje uppgift

Läs mer

Digital signalbehandling fk Adaptiv filtrering

Digital signalbehandling fk Adaptiv filtrering Institutionen för data- och elektroteknik 1999-11-16 Inledning Det finns många sammanhang då parametrarna inte är bekanta i förväg utan vårt måste anpassa sig till situationen. Några exempel bortfiltrering

Läs mer

Signal- och bildbehandling TSBB03, TSBB14

Signal- och bildbehandling TSBB03, TSBB14 Tentamen i Signal- och bildbehandling TSBB03, TSBB4 Tid: 00-0- Lokaler: G33 Ansvarig lärare: Maria Magnusson besöker lokalen kl. 4.50 och 6.50 tel 073-804 38 67 Hjälpmedel: Räknedosa, medskickad formelsamling,

Läs mer

Ett enkelt OCR-system

Ett enkelt OCR-system P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor

Läs mer

Lennart Carleson. KTH och Uppsala universitet

Lennart Carleson. KTH och Uppsala universitet 46 Om +x Lennart Carleson KTH och Uppsala universitet Vi börjar med att försöka uppskatta ovanstående integral, som vi kallar I, numeriskt. Vi delar in intervallet (, ) i n lika delar med delningspunkterna

Läs mer

KOMIHÅG 18: Ekvation för fri dämpad svängning: x + 2"# n. x j,

KOMIHÅG 18: Ekvation för fri dämpad svängning: x + 2# n. x j, KOMIHÅG 18: ------------------------------------------------------ Ekvation för fri dämpad svängning: x + "# n x + # n x = # n x j, 1 med konstanterna! n = k m och!" n = c m. ------------------------------------------------------

Läs mer

Frekvensplanet och Bode-diagram. Frekvensanalys

Frekvensplanet och Bode-diagram. Frekvensanalys Frekvensplanet och Bode-diagram Frekvensanalys Signaler Allt inom elektronik går ut på att manipulera signaler genom signalbehandling (Signal Processing). Analog signalbehandling Kretsteori: Nod-analys,

Läs mer

Skillnader vokaler - konsonanter. Konsonanters akustiska mönster. Vokaler. Konsonanter. Konsonantklasser. Sonoranter

Skillnader vokaler - konsonanter. Konsonanters akustiska mönster. Vokaler. Konsonanter. Konsonantklasser. Sonoranter Konsonanters akustiska mönster Ô Skillnader vokaler - konsonanter Ô Indelning konsonanter Ô Enskilda konsonantklassers typiska drag Ô Artikulationsställe och akustisk representation Skillnader vokaler

Läs mer

Checklista för funktionsundersökning

Checklista för funktionsundersökning Linköpings universitet Matematiska institutionen TATA41 Envariabelanalys 1 Hans Lundmark 2015-02-10 Checklista för funktionsundersökning 1. Vad är definitionsmängden D f? 2. Har funktionen några uppenbara

Läs mer

Föreläsning 11, Dimensionering av tidsdiskreta regulatorer

Föreläsning 11, Dimensionering av tidsdiskreta regulatorer Föreläsning 11, Dimensionering av tidsdiskreta regulatorer KTH 8 februari 2011 1 / 28 Innehåll 1 Kapitel 19.2. Polplaceringsmetoden 2 3 4 5 6 2 / 28 Innehåll 1 Kapitel 19.2. Polplaceringsmetoden 2 3 4

Läs mer

MODELLERING AV DYNAMISKA SYSTEM OCH INLUPP 2

MODELLERING AV DYNAMISKA SYSTEM OCH INLUPP 2 UPPSALA UNIVERSITET AVDELNINGEN FÖR SYSTEMTEKNIK EKL och PSA, 2002, rev BC 2009, 2013 MODELLERING AV DYNAMISKA SYSTEM DATORSTÖDD RÄKNEÖVNING OCH INLUPP 2 1. Överföringsfunktioner 2. Tillståndsmetodik Förberedelseuppgifter:

Läs mer

Matematik D (MA1204)

Matematik D (MA1204) Matematik D (MA104) 100 p Betygskriterier med eempeluppgifter Värmdö Gymnasium Betygskriterier enligt Skolverket Kriterier för betyget Godkänd Eleven använder lämpliga matematiska begrepp, metoder och

Läs mer

1. a) I en fortskridande våg, vad är det som rör sig från sändare till mottagare? Svara med ett ord. (1p)

1. a) I en fortskridande våg, vad är det som rör sig från sändare till mottagare? Svara med ett ord. (1p) Problem Energi. a) I en fortskridande våg, vad är det som rör sig från sändare till mottagare? Svara med ett ord. (p) b) Ge en tydlig förklaring av hur frekvens, period, våglängd och våghastighet hänger

Läs mer

Datorlaboration :: 1 Problembeskrivning ::

Datorlaboration :: 1 Problembeskrivning :: Datorlaboration :: Ett hyrbilsföretags problem Laborationen går ut på att lösa Labbuppgift 1 till 5. Laborationen redovisas individuellt genom att skicka laborationens Mathematicafil till Mikael Forsberg

Läs mer

Signaler & Signalanalys

Signaler & Signalanalys Ulrik Söderström ulrik.soderstrom@tfe.umu.se Jan 8 Signaler & Signalanals Sinusspänning Sinus och cosinus samma form men fasförskjutna Fasförskjutning tidsfördröjning Sinus och cosinus är väldigt enkla

Läs mer

Funktionsstudier med derivata

Funktionsstudier med derivata Funktionsstudier med derivata Derivatan ett kraftfullt verktyg för att studera och tolka funktioner Det här avsnittet handlar om att man kan använda derivatan till att bestämma en funktions egenskaper

Läs mer

Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen.

Föreläsning: Digitalt Ljud. signalbehandling. Elektronik - digital signalbehandling. Signal och spektrum. PC-ljud. Ton från telefonen. Elektronik - digital signalbehandling Föreläsning: Digitalt Ljud Bengt Mandersson Hur låter signalbehandling Institutionen för elektro- och informationsteknik 2010-10-01 1 2008-10-06 Elektronik - digital

Läs mer

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag

Perception. Intonation och tonhöjd. Intrinsisk F0. Intonation och tonhöjd (ff) Akustiska och perceptoriska drag. Perception av prosodiska drag Perception Akustiska och perceptoriska drag Samband mellan akustiska och perceptoriska drag Tyngpunkt på perceptorisk relevanta drag Prosodi Vokaler Konsonanter Perception i största allmänhet Primära akustiska

Läs mer

Laboration i Fourieroptik

Laboration i Fourieroptik Laboration i Fourieroptik David Winge Uppdaterad 4 januari 2016 1 Introduktion I detta experiment ska vi titta på en verklig avbildning av Fouriertransformen. Detta ska ske med hjälp av en bild som projiceras

Läs mer

A/D- och D/A- omvandlare

A/D- och D/A- omvandlare A/D- och D/A- omvandlare Jan Carlsson 1 Inledning Om vi tänker oss att vi skall reglera en process så ställer vi in ett börvärde, det är det värde som man vill processen skall åstadkomma. Sedan har vi

Läs mer

Mer om analytisk geometri

Mer om analytisk geometri 1 Onsdag v 5 Mer om analytisk geometri Determinanter: Då man har en -matris kan man till den associera ett tal determinanten av som också skrivs Determinanter kommer att repeteras och studeras närmare

Läs mer

Regressionsmodellering inom sjukförsäkring

Regressionsmodellering inom sjukförsäkring Matematisk Statistik, KTH / SHB Capital Markets Aktuarieföreningen 4 februari 2014 Problembeskrivning Vi utgår från Försäkringsförbundets sjuklighetsundersökning och betraktar en portfölj av sjukförsäkringskontrakt.

Läs mer

7 MÖNSTERDETEKTERING

7 MÖNSTERDETEKTERING 7 MÖNSTERDETEKTERING 7.1 Korrelation Korrelation av två bilder f(x,y) och g(x,y) kan språkligt sett betyda att man gör just det som utsäges av (7.1). Bilderna läggs alltså på varandra med den ena bilden

Läs mer

Vågor. En våg är en störning som utbreder sig En våg överför energi från en plats till en annan. Det sker ingen masstransport

Vågor. En våg är en störning som utbreder sig En våg överför energi från en plats till en annan. Det sker ingen masstransport Vågor En våg är en störning som utbreder sig En våg överför energi från en plats till en annan. Det sker ingen masstransport Vågtyper Transversella Mediets partiklar rör sig vinkelrätt mot vågens riktning.

Läs mer

Approximation av funktioner

Approximation av funktioner Vetenskapliga beräkningar III 8 Kapitel Approximation av funktioner Vi skall nu övergå till att beskriva, hur man i praktiken numeriskt beräknar funktioner I allmänhet kan inte ens elementära funktioner

Läs mer

Grundläggande signalbehandling

Grundläggande signalbehandling Digital Signalbehandling Lab 1 Grundläggande signalbehandling Denna version: juli 2007 LERTEKNIK REG Namn: Personnr: AU T O MA RO TI C C O N T LINKÖPING L Datum: Godkänd: 1 Introduktion Syftet med denna

Läs mer

Yrkeshögskolan Novia Utbildningsprogrammet i elektroteknik

Yrkeshögskolan Novia Utbildningsprogrammet i elektroteknik Grunderna i programmeringsteknik 1. Vad är Känna till nämnda programmering, begrepp. Kunna kompilera högnivå språk, och köra program i det i kompilering, kursen använda tolkning, virtuella programmeringsspråket.

Läs mer

Vocoding och frekvensskiftningsexperiment inom det audiologiska forskningsfältet Av Morgan Karlsson

Vocoding och frekvensskiftningsexperiment inom det audiologiska forskningsfältet Av Morgan Karlsson Vocoding och frekvensskiftningsexperiment inom det audiologiska forskningsfältet Av Morgan Karlsson Vocoding Några av de första försöken att återskapa tal elektroniskt gjordes på 30-talet av fysikern Homer

Läs mer

1 Grundläggande kalkyler med vektorer och matriser

1 Grundläggande kalkyler med vektorer och matriser Krister Svanberg, mars 2015 1 Grundläggande kalkyler med vektorer och matriser Trots att läsaren säkert redan behärskar grundläggande vektor- och matriskalkyler, ges här i Kapitel 1 en repetition om just

Läs mer

PRÖVNINGSANVISNINGAR

PRÖVNINGSANVISNINGAR PRÖVNINGSANVISNINGAR Prövning i Matematik D Kurskod Ma 104 Gymnasiepoäng 100 Läromedel Prov Muntligt prov Inlämningsuppgift Kontakt med examinator Övrigt Valfri aktuell lärobok för kurs Matematik D t.ex.

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

SF1624 Algebra och geometri Lösningsförslag till tentamen Fredagen den 23 oktober, 2009 DEL A

SF1624 Algebra och geometri Lösningsförslag till tentamen Fredagen den 23 oktober, 2009 DEL A SF1624 Algebra och geometri Lösningsförslag till tentamen Fredagen den 23 oktober, 2009 DEL A (1) (a) Bestäm de övriga rötterna till ekvationen z 3 11z 2 + 43z 65 = 0 när det är känt att en av rötterna

Läs mer

TATM79: Föreläsning 2 Absolutbelopp, summor och binomialkoefficienter

TATM79: Föreläsning 2 Absolutbelopp, summor och binomialkoefficienter TATM79: Föreläsning 2 Absolutbelopp, summor och binomialkoefficienter Johan Thim 2 augusti 2016 1 Absolutbelopp Absolutbelopp Definition. För varje reellt x definieras absolutbeloppet x enligt { x, x 0

Läs mer

Apparater på labbet. UMEÅ UNIVERSITET 2004-04-06 Tillämpad fysik och elektronik Elektronik/JH. Personalia: Namn: Kurs: Datum:

Apparater på labbet. UMEÅ UNIVERSITET 2004-04-06 Tillämpad fysik och elektronik Elektronik/JH. Personalia: Namn: Kurs: Datum: UMEÅ UNIVERSITET 2004-04-06 Tillämpad fysik och elektronik Elektronik/JH Apparater på labbet Personalia: Namn: Kurs: Datum: Återlämnad (ej godkänd): Rättningsdatum Kommentarer Godkänd: Rättningsdatum Signatur

Läs mer

SF1669 Matematisk och numerisk analys II Bedömningskriterier till tentamen Torsdagen den 4 juni 2015

SF1669 Matematisk och numerisk analys II Bedömningskriterier till tentamen Torsdagen den 4 juni 2015 SF1669 Matematisk och numerisk analys II Bedömningskriterier till tentamen Torsdagen den 4 juni 2015 Allmänt gäller följande: För full poäng på en uppgift krävs att lösningen är väl presenterad och lätt

Läs mer

Absolut möjligt. Problemet. per-eskil persson

Absolut möjligt. Problemet. per-eskil persson per-eskil persson Absolut möjligt Absolutbelopp nämns inte i kursplanerna för gymnasiet, samtidigt som förkunskaper kring dem efterfrågas av högskolan. Med utgångspunkt i en kurs för lärarstudenter konstruerades

Läs mer

1 Duala problem vid linjär optimering

1 Duala problem vid linjär optimering Krister Svanberg, april 2012 1 Duala problem vid linjär optimering Detta kapitel handlar om två centrala teoretiska resultat för LP, nämligen dualitetssatsen och komplementaritetssatsen. Först måste vi

Läs mer

ALA-c Innehåll. 1 Linearization and Stability Uppgift Uppgift Egenvärdesproblemet Uppgift

ALA-c Innehåll. 1 Linearization and Stability Uppgift Uppgift Egenvärdesproblemet Uppgift Vecka ALA-c 6 Innehåll Linearization and Stability RÄKNEÖVNING VECKA. Uppgift 9........................................ Uppgift 9.5...................................... 5 Egenvärdesproblemet 9. Uppgift

Läs mer

Föreläsning 17: Jämviktsläge för flexibla system

Föreläsning 17: Jämviktsläge för flexibla system 1 KOMIHÅG 16: --------------------------------- Ellipsbanans storaxel och mekaniska energin E = " mgm 2a ------------------------------------------------------ Föreläsning 17: Jämviktsläge för flexibla

Läs mer

Linjär algebra på några minuter

Linjär algebra på några minuter Linjär algebra på några minuter Linjära ekvationssystem Ekvationssystem: { Löses på matrisform: ( ) ( ) I det här fallet finns en entydig lösning, vilket betyder att determinanten av koefficientmatrisen

Läs mer