Tentamen i kursen Audio & Videoteknik 2003-05-26, kl 08:15 12:15, KTH-Syd Haninge Inga hjälpmedel Hur fungerar vår hörsel? (2p) Akustiska lufttrycksvariationer tas upp av ytterörat. Dessa omvandlas till mekaniska vivrationer av trummhinnan. Hörselbenet växlar ner signalen för att skydda nerverna i hårcellerna. Hårcellerna omvandlar sedan de mekaniska vibrationerna till elektriska signaler som skickas till hjärnans hörselcentrum. Nämn minst fyra faktorer som påverkar akustiken i ett rum.(2p) 1. Rummets storlek 2. Material i vägar, golv och tak 3. Vägg, golv och taks inbördes förhållanden 4. Inventariers form och material Beskriv principen för de två vanligaste kondensatormikrofontyperna. (2p) Kondensatormikrofon En kondensatormikrofon har ett tunt ledande membran som utgör ena delen av en plattkon-densator. När en laddning läggs över kondensatorn kommer kondensatorns laddning att variera när membranet svänger. Kondensat-ormikrofoner är generellt mycket bra men betydligt dyrare än dynamiska mikrofoner. Mikrofontypen kräver någon form av förspänning, antingen genom ett batteri i mikrofonen eller genom så kallad fantommatning, en spänningsmatning från mixerbordet till mikrofonen. En kondensatormick är väldigt känslig och snabb, vilket gör att den hinner med transienter bra. Den är även känslig för mekanisk. Dess karakteristik gör att den lämpar sig för upptagningar som kräver hög känslighet och/eller hög snabbhet, såsom musik där upptagningen sker på visst avstånd, exempelvis kör och kammarmusik, eller svaga, subtila ljud. Elektret mikrofon En variant på kondensatormikrofonen är elektretmikrofonen (eng.electret microphone). Den fungerar på i stort sett samma sätt, men kräver inte någon strömförsörjning då detta har ersatts av ett permanent laddat membran. Rumsresonanser är ett akustiskt problem som kan beräknas enligt formeln; F = V / (2 x L), där f är rumsresonansen, V är ljudets hastighet och L är avståndet mellan ytorna. (2p) a) Hur uppstår stående vågor i ett rum?
b) Om ett rum är 5m långt, 4m brett och 3m högt, vilka rummets egenresonanser? Vad är och hur mäter man Intermodulationsdistorsion, IM? (2p) InterModulationsdistortion (IM) En form av harmonisk distorsion är intermodulation (IM-distorsion) som avser en form av förvrängning som uppstår när två eller flera toner i kombination med varandra bildar nya störtoner vars frekvens är summan och/eller skillnaden av de ursprungliga tonerna i signalen. Mäts enligt normen SMPTE (Society of Motion Picture and television Engineers) Mätfrekvenser 60Hz och 7kHz i förhållandet 4:1 Summaförstärkare Lågpassfilter dämpar 60Hz 26 db Aktivt filter dämpar 60Hz 210dB Absolutnivådetektor likriktar 7kHz signalen som sedan används till referens Aktivt lågpassfilter, återstår endast modulationsprodukterna Summan av modulationsprodukterna mäts relativt DC-nivån Kanalseparationen skiljer sig ganska markant mellan t.ex gramofon, radio och digitala system. Vad är kanalseparation och i vilken storhet mäts den? (1p) Kanalseparationen anger hur väl separerade och fria från överhörning mellan ljudkanalerna signalen är. Denna mäts i db Beskriv utförligt hur A/D omvandlingen går till. (4p) A/D omvandlingen STEG 1- tidsmässig uppdelning av den analoga signalen, sample. Sample/Hold krets gör analoga signalen tidsdiskret, d v s uppdelad i tidsdomän. Antalet sample/sek = samplingsfrekvens, För CD 44.1kHz för DVD upp till 192kHz
STEG 2 - Omvandling från samples till siffervärden kallas kvantisering och innebär att signalen delas upp i amplitudsteg. Systemets upplösning = ordlängd, ex 8 bitar -> 256 steg(video8), 16bitar=65 535steg (CD) Vad motsvarar efterklangtiden T? (1p) Den motsvarar en ljudtrycksnivåminskning med 60dB Vad är FIR och IIR och vad används de till i digitala system (1p) Det är två digitala filter, Finit Impuls Response och Infinit Impuls Respons, som används för att filtrera bort kvantiseringsresterna vid D/A-omvandlingen. Vad är en baffel? (1p) En skärm för att förhindra akustisk kortslutning på högtalare Hur EFM kodar man, och vilket är det huvudsakliga syftet med EFM kodning? (2p) EFM-kodning Eight To Fourteen Modulation Används för att sänka bandbreddsbehovet på skivan. Varje 16 bitars sample delas upp i två 8-bits ord Av varje 8 bits ord framställs ett 14-bits ord, minst 2 nollor max 10 nollor. EFM-signalen flanktriggas sedan till en lågfrekvent signal Trots att varje 16 bitars sample blir 31 bitar lång blir bithastigheten från skivan lägre (ca 1/6-del) efter flanktriggningen. Detta är syftet med EFM-kodningen
Beskriv CCD-cellens arbetssätt i tre steg. (3p) OMVANDLING FRÅN LJUS TILL ELEKTRISK LADDNING När en foton tas upp i en halvledarkristall uppstår fotoelektriska strömmar. Laddningens storlek i en CCD-cell är proportionellt mot det infallande ljuset. LAGRING AV ELEKTRISK ENERGI När en fotoelektrisk laddning uppstår mellan N- och P- materialet lagras denna genom att en spänning ligger över elektroderna. TRANSPORT AV LADDNING I fas ett lagras energin i en sk potentialbrunn I fas två ges den intilliggande cellen samma potential och elektronerna flyter ut i den bredare brunnen över båda cellerna I fas tre bryts spänningen till cell ett och hela laddningen flyttas över till cell två. Vad krävs för överspelning utan radérhuvud och hur har man löst detta i DAT systemet? (2p) Genom att använda 8-10 modulation och att dra nytta av azimuthdämpningen. Modulationen gör att skillnaden i våglängd inte överstiger 4:a och att inga DC komponenter spelas in. Dessutom läggs signalspektrat så högt som möjligt. Vad säger nykvistteoremet för något? (1p) Samplingsfrekvensen måste vara minst dubbelt så hör som högsta samplade frekvens Vad är azimuthdämpning för något? (1p) Det är att vid korta våglängder blir magnitiseringen grundare på bandet och vid högre frekvenser blir den djupare. Beskriv kort DVD familjens standarder. (3p) DVD standarden är alltså ett flertal format för olika applikationer: DVD-ROM (Read Only Memory) DVD-Video DVD-Audio DVD-R/DVD-RW (Write once/rewritable) DVD-RAM (Random Access Memory) DVD-ROM, DVD-Video och DVD-Audio har samma disc specifikation, fysiska format och filsystem men skiljer sig i applikation, medan DVD-R/RW och DVD-RAM skiljer sig även vad gäller den fysiska specifikationen och filsystemet. Hur fungerar MO, beskriv kortfattat principen för magnetoptisk lagring. (2p) Magnetoptisk lagring.vid inspelning hettas en mycket liten punkt upp av lasern till en temperatur över curie-punkten ca 180 grader. Samtidigt påverkas skivans magnetfält
från andra sidan av magnethuvudet. Detta för att det är lättare att skifta polaritet då skivan värms upp. Väl fokuserad laser på 780 mm och ett mycket riktat magnetfält gör det möjligt att skriva punkter med diametern 0.3 mm vilket ger samma packningstäthet som CD.Man behöver inget raderhuvud utan kan skriva ny data över den gamla.. Dessutom innebär magnetfältsmodulation att mönstret blir snyggare vilket ger färre datafel vid avspelning. När en punkt på skivan bestrålas av den fokuserade laserstrålen påverkas det reflekterade ljuset av magnetfältets riktning, s.k Kerr-effekten. Beroende av får fotodioderna olika mycket ljus på sig. En reflekterad laserstråle påverkas av det magnetiska tillstånd den reflekterade ytan har. Vad är vikningsdistortion för något? (2p) Vid sampling uppstår sidband eller multiplar av samplingsfrekvensen. Om samplingsfrekvensen är för låg hamnar dessa inom insignalens område. Dessa färgar då insignalen vilket kallas vikningsdistortion. Man undviker detta genom att höja samplingsfrekvensen och filtrera bort sidbanden. Nämn minst 2 vanliga problem med A/D och D/A omvandlare. (1p) - Fel i S/H kretsarna läckning/spänningsfall i kondensatorn - Ickelinjäritet i omvandlarna klockans exakthet - Distortion i omvandlarna kvantiseringsdist vid låga amplituder Beskriv den perceptiva komprimeringsmetoden ATRAC. (3p) ATRAC ATRAC arbetar adaptivt och anpassar tids- och frekvensdomän efter aktuell signal. I tidsdomän arbetar systemet från 1.45 till 11.6 ms beroende på om ljudet varierar långsamt eller fort. Vid långsamma variationer används den längre mätintervallen vilket medgör större kapacitet att mäta i frekvensdomänen istället och tvärt om. ATRAC utnyttjar dels hörskeltröskeln, dels den dynamiska maskeringseffekten för att ta bort icke hörbara signaler. Används av MD HUR ÄR SYSTEMET UPPBYGGT Analyskretsarna mäter om signalen ändras snabbt eller långsamt vilket styr tidsintervallet i mätningarna och därmed upplösningen i frekvensdomän. Sedan delas signalen upp i tre frekvensband; 0-5.5125Khz, 5.5125-11.025kHz och 11.025-22.05kHz. Dessa tre frekvensband filtreras och cosinustransformeras sedan i tre MDCS. Ut ur dessa får vi 52 st ickeuniforma frekvensband där varje möjlighet att minska bitflödet används. Vid avspelning fungerar MDCT-blocken reversibekt och återskapar två 16-bitars ljudsignaler före D/A omvandlaren.
Beskriv skillnaden mellan MJPEG och MPEG samt principen för dessa komprimeringsmetoder. (4p) MPEG används för rörliga bilder. Fungerar genom att göra analys av bilder med vissa intervall. Första steget påminner om M-JPEG enligt ovan. Men för att minska datamängden tar man bort ytterligare information och litar på att intilliggande bilder har ungefär samma information. Man arbetar således med "huvudbilder" och "underbilder", I-frames och subframes. Bilderna mellan "huvudbilderna" överförs endast med hänsyn till förändringen till föregående och nästkommande fullt analyserade bild. M-JPEG är en metod där varje bild analyseras och vars data innehåller all information för att bygga upp en hel bild. Metoden mycket lämplig för redigering eftersom man kan klippa varsomhelst. Nackdel är att datamänden blir större än t.ex MPEG. Beskriv Mpeg Audios tre lager (3p) Lager 1 DCT filter, jämn fördelning över banden, frekvensmaskning Lager 2 3 ramar i filtret, viss temporalmaskning Lager 3 bättre filter med variabelfördelning, frekvensmaskning, temporalmaskning, basfrekvenser i mono, huffmankodning, variabel bitrate Vilka två huvuddelar delas midiinformationen upp i? (1p) Channel messages och System messages Redogör för följande ljudalstringsmetoder: (2p) a) Subtraktiv syntes b) Additiv syntes Vilken information består Midisignalen av? (1p) - Vilken tangent som tryckts ned - Hur hårt den tryckts ned - Hur länge den tryckts ned Vad betyder följande uttryck? (2p) a) Monofonisk b) Duofonisk c) Polyfonisk d) multitimbral Hur bildas ljus? (3p) En atom består av en kärna kring vilken en eller flera elektroner cirklar. Elektronerna bildar skal i olika nivåer beroende på deras energiinnehåll. Ju högre energiinnehåll en elektron har desto längre ut cirkulerar den, vilket innebär ett mer energirikt elektronskal. Om en elektron tillförs energi platsar den inte längre i sitt naturliga elektronskal, utan hoppar ut till ett mer energirikt skal, beroende på elektronens nya energinivå, elektronen exciteras. Där cirklar elektronen slumpvis tid, varefter den faller tillbaks ner mot sitt ursprungliga skal.
När elektronen faller tillbaka till sitt ursprungliga elektronskal avger, emitterar, elektronen energiskillnaden i form av en kvantiserad energimängd, en foton, d.v.s. ljus, vars energiinnehåll kan beräknas m.h.a. Plancks konstant. Ju högre energimängd som avges, desto kortare våglängd får fotonens svängningsrörelse, vilket vi tolkar som ett blåaktigare ljus. Vilka egenskaper hos synsinnet utnyttjar man då man återger rörliga bilder? (1p) Upplösningsförmåga flimmerkänslighet LYCKA TILL!