KVALITET OCH STANDARD. Aktivitet 4



Relevanta dokument
Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning

Digital bildhantering

Pixelgrafik. Utdrag ur Adobe Photoshops handbok. Om bitmappsbilder (pixelbilder) Om vektorgrafik (kallas ibland objektgrafik)

Torstens Digitalbildguide

SeniorNet Huddinge

Så skapas färgbilder i datorn

De olika exportmetoderna för rasterfiler inne i ArcMap är BMP, TIFF, GIF och PNG.

Filformat / bildformat

Exportera karta juni 2010

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR. en handledning för myndigheter i Västra Götalandsregionen och Göteborgs Stad

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR

Prioritet. Varför digitalisera? Apparater; i allmänhet. Datorn

Optimala bildinställningar för leverans TEORIHÄFTE TILL KURSEN

Att lyckas med utskrifter

Föreläsning i webbdesign. Bilder och färger. Rune Körnefors. Medieteknik Rune Körnefors rune.kornefors@lnu.se

Avsnitt 1 Multimedia på Internet Introduktion

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

LITEN GRAFISK HJÄLPREDA

ESSArch vid Riksarkivet i Sverige

Grunder. Grafiktyper. Vektorgrafik

Digital arkivering i Örebro kommun - riktlinjer

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:

Att skapa er logotyp. Kreativitet

Välkommen till Flyerskola!

Inför tryck. Färger: CMYK eller dekorfärger. Observera att inga dubbletter av dekorfärgerna är tillåtna.

Chaos desktop viewer manual

Digital dokumenthantering

Samling och kaffe. Temakväll Bildhantering i släktforskningen Genomgång kring temat. Forska själv. Forska själv. Diskussion kring temat

Kravspecifikationer för digitalisering Svenska litteratursällskapet i Finland Digitaliseringstjänster

PROJEKTBESKRIVNING fastställd av styrgruppen

Mediaverktyg. Grafik. Video. Ljud. Animationer. Strömmande media. Webb


9 Webbföreläsningar. 9.1 Streaming

INT 3 F3. En texts läsbarhet. Teckensnitt. Medieteknik Del1. Färger, teckensnitt och bildformat

John S. Webb 2006 (text citat från Adobe)

Multimedia? Produktion för Webb och Multimedia

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

Adobe Photoshop Elements Skapa bakgrundsbilder för webbsidor

Guide till tryckfärdigt original

Riktlinjer och mål för digitaliseringsarbete

Effektiv fotoproduktion Ulrik Södergren - ulrik@digitalfotografen.se

Metadata i e-pliktleveranser

Bildoptimering för webben

Rasterbilder. En guide till god hantering

Rasterbilder: En guide till god hantering

Lägg till bilder i Disgen

Från foto till bildskärm och tryck med bästa kvalitet Ulrik Södergren

TRYCK OCH FÄRGHANTERING LATHUND

Svenska kyrkans bestämmelser

IT ur arkivperspektiv

Dagens agenda. Lagring & berarbetning av data. Filer och filformat Metadata Komprimering Kryptering Olika typer av data Filsystem Databaser

Regionala Cancercentrum Logotyp

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

Arkivkrav vid införande av nytt IT-system

Alla presentationstekniker har olika behov; bandbredd, lagring samt bildkvalitet

ATT ARBETA MED VEKTORGRAFIK

VARUMÄRKET Bergdalens IK

Aktivitetsrapport från Aktivitet 3 Digitala Leveranser

Riktlinjer för digital arkivering i Linköpings kommun

Förutsättningar för gallring efter skanning 1 (5) Tillsynsavdelningen Datum Dnr RA /1121 Håkan Lövblad

Bildredigering i EPiServer & Gimp

Vad är MoReq1? Falk Sundsvall 2006

Att bevara historiska bilder. Digitalisera, beskriva, söka, visa, långtidslagra

Bilddatabaser och digitalisering - plattform för ABM-samverkan

Datateknik GR (A), Flash, Photoshop och Datakunskap, 7,5 hp

Riktlinjer för digital arkivering. Riktlinjerna gäller för hela den kommunala förvaltningen och kommunala bolag.

LEVERANSFRAMSTÄLLAN. Version (8)

SeniorNet Huddinge

Riktlinjer och förutsättningar för skanning och ersättningsskanning i Stockholms stad. stockholm.se

Digitalt foto Modern teknik för alla fotografer

Karin Bredenberg Specifikation av olika leveranstyper/aflevereringstyper och leveransprocessen. Karin Bredenberg,

INTYG OM LEVERANS AV SÄKERHETSMATERIAL Nedanstående regler gäller för produktioner med stöd beslutade efter

Skapa PowerPoint-presentation

Inställningar för Adobe InDesign

SkanRead hjälp. SkanRead 2.0. Elevdata AB

NVDB Teknisk Lösning - Teknisk beskrivning av datautbyte

Spela in och exportera din PowerPoint som en film via Premiere Elements

Adobe Photoshop Elements 5.0 Adobe Premiere Elements 3.0. Adobe Produktguide

Hur man införskaffar e-böcker till Reader

DIGITAL BILDBEHANDLING GRUNDKURS. Sammanställd av

Bilder. Bilder och bildformat

Sharpdesk Sharpdesk Dokumenthanteringslösning

Spela in och spara din PowerPointpresentation

LEVERANSFRAMSTÄLLAN. Version (8) Datum:

Kort lektion i Scannerteknik

Bilduppladdning i Järnvägshistoriskt forum (gäller MS Windows för PC)

Stadsarkivets anvisningar 2011:1 Hantering av allmänna e-handlingar som ska bevaras i Uppsala kommun

Elektronisk informationshantering IQPC PDF/A standarden Use case WSP Sverige

NVDB Teknisk Lösning - Teknisk beskrivning av datautbyte

Här finns de allra vanligaste frågorna. Klicka på frågan för att komma till svaret.

Filformat och långtidslagring Magnus Wåhlberg Filformat och Långtidslagring

Förbundet Vi Ungas. Grafiska handbok

Adobe Acrobat 7.0. Få jobbet gjort med kraftfulla intelligenta dokument

Arkivering av webbplatser några anvisningar

4. Skrivmaterial och informationslagring. Innehållsförteckning ARKIVHANDBOK Landstingsarkivet

innehåll kap 1. inledning kap 2. annonsformat kap 3. logotyp kap 4. annonsen kap 5. foto och illustration kap 6. leverans

Arkiv- och informationshantering

Österåkers kommuns styrdokument

viktig information om annonser i sonic

Transkript:

KVALITET OCH STANDARD Aktivitet 4

Kvalitet och standard, Arbetsgruppens rapport KVALITET OCH STANDARD Aktivitet 4 ARBETSGRUPPENS RAPPORT ALLMÄN PRESENTATION AV FRÅGESTÄLLNINGEN Digitalisering av samlingar eller enskilda objekt är något som sker hos alla kulturarvsinstitutioner. Idag sker det utan samverkan och samarbete, vilket fått till följd att digitalisering sker på olika sätt med olika kvalitet på respektive institution. Att standardisera denna process är därför en viktig angelägenhet, inte bara för de deltagande institutionerna, utan också för alla de som utnyttjar det digitaliserade materialet. Att ta fram rekommendationer för kvaliteten på det digitaliserade materialet såväl som att standardisera och beskriva bästa tillvägagångssätt i digitaliseringsprocessen har därför blivit en självklar och viktig del av projektet. UPPDRAG Uppdraget har bestått i att utreda och sammanställa rekommendationer för kvalitet och standard för digitala avbildningar. Med digitala avbildningar avses digitalt lagrade fotografiska avbildningar av objekt ingående i kulturarvsinstitutionernas samlingar. Arbetsgruppen skall även dokumentera och fastställa best practices för att skapa, lagra och tillgängliggöra avbildningar. Efter en revidering av projektplanen gjordes ett tillägg till uppdraget, nämligen att beskriva tillämpningen av best practices vid användning av olika typ av utrustning. Tillvägagångssätt för bästa resultat vid digitalisering, kan skilja sig något åt beroende på hur hög kvalitet den använda utrustningen håller. Vid revideringen bestämdes också att avrapportering ska ske både i form av en skriftlig rapport och i form av en webbpublikation där gruppens arbete redovisas. Webbpublikationen är tänkt att bli ett levande dokument som kan vara till hjälp för alla som är intresserade av digitalisering av historiskt material. ORGANISATION AV ARBETET Arbetet i delaktiviteten har organiserats efter en modell i ett antal olika faser. - Inventering och kartläggning - Utredning och framtagning av best practices - Sammanställning av resultat - Webbpublikation Första fasen har bestått i en inventering och kartläggning av de olika institutionernas arbetssätt idag, vilken utrustning man använder, hur man lagrar de data som blir resultatet av en digitaliseringsprocess, etc. I den andra fasen har dels ett utredande arbete pågått, dels ett mera praktiskt undersökande arbete för att få fram de rekommendationer som är ett av målen med projektet. Den tredje fasen är sammanställning av de resultat som uppnåtts vid arbetet med fas ett och två. Den sista delen av arbetet är att omforma den skriftliga sammanställningen till en webbpublikation. Aktivitetsplanens olika aktiviteter kom att behandlas inom ramarna för ett antal arbetsgrupper. Antalet deltagare har varierat något men totalt har tio personer från de olika institutionerna varit 237

Kvalitet och standard, Arbetsgruppens rapport involverade i delaktiviteten. Redovisning av resultaten följer denna uppdelning. Eftersom antalet deltagare var begränsat beslöts tidigt att någon arbetsgrupp fick arbeta med flera av ovan nämnda frågeställningar. De olika arbetsgrupperna har varit följande: 1. Filformat 2. Produktionstekniska metadata 3. Kvalitet på bildfiler 4. Färghantering 5. Autenticitet 6. Att bevara digital information på lång och kort sikt 7. Guider Dessa sammanställdes efter provdigitaliseringarna och är en sammanfattning av bästa tillvägagångsätt och dessutom en praktisk handledning när det gäller digitaliseringar av olika typer av objekt. GENOMFÖRANDE Delaktivitetens arbete påbörjades i oktober 2001. Initialt gjordes en ordentlig kartläggning av de olika områden som arbetsgruppernas arbete pågick inom. Resultatet av kartläggningen låg sedan till grund för ett intensivt arbete med att ta fram grundläggande metoder och instruktioner för de rekommendationer som uppdraget omfattar. Dessa rekommendationer tillämpades senare vid ett antal provdigitaliseringar som skedde hos alla de deltagande institutionerna där olika praktiska aspekter diskuterades. Arbetet i de olika arbetsgrupperna har varierat något men har omfattat litteraturstudier, seminarier, informationssökning, provdigitaliseringar och diskussioner. RESULTAT OCH SLUTSATSER Vi tolkade vårt uppdrag på så sätt att resultatet av arbetsgruppernas arbete bör vara tydliga rekommendationer för dels de deltagande institutionerna, men också rekommendationer som är tillämpbara för alla de som arbetar med digitalisering av historiskt material. Arbetsgruppernas kartläggning låg också till grund för diskussioner om hur beskrivningar av bästa tillvägagångssätt eller best practices skulle utformas. Varje arbetsgrupp har redovisat sina resultat och slutsatser i bilagan Bästa tillvägagångssätt vid digital bildhantering, som medföljer rapporten. Sammandrag av slutsatser av mer allmän karaktär följer här. 1. Filformat Uppdraget för arbetsgruppen för filformat var att utreda och analysera format för långtidslagring, presentation och leverans av digitala filer för att kunna ge råd och anvisningar om lämpliga format för olika ändamål. Kartläggningen av filformat visade att det finns en lång rad filformat att välja på för olika typer av ändamål. Ett av de viktigaste ändamålen vid digitalisering är att hitta rätt typ av format för långtidslagring av data. Idag finns, i princip, endast ett alternativ, nämligen okomprimerad TIFF. Det är viktigt att spara en högupplöst fil för framtida ändamål då man digitaliserar. Okomprimerad TIFF är det filformat som, i dagsläget, är lämpligast att användas för långtidslagring. Det är denna fil (eller en kopia av den) som vi kallar masterfil. Masterfil är den högupplösta fil som skapas vid inläsningen av en bild och som kan och bör hålla sk. faksimilkvalitet. Masterfilen kan sedan användas för att skapa olika typer av visningsformat. Det är viktigt att poängtera att masterfilen bör sparas tillsammans med metadata för framtida bruk. De flesta visningsformat sänker bildkvaliteten betydligt och skapar en bild lämplig för skärmvisning med andra parametrar som styrande, t.ex. bandbredd för den som ska se filen över Internet. Ofta handlar det om att anpassa visningsfilen för visning via modemförbindelser, vilket 238

Kvalitet och standard, Arbetsgruppens rapport innebär filer med låg kvalitet. Om man sparar masterfilen kan man från denna generera nya visningsformat eller skapa underlag för tryck. Detta är inte möjligt om man ej sparat masterfilen utan följden blir ofta omdigitalisering om man vill göra något nytt med sitt digitaliserade material. När det gäller format för visning via bildskärm så bör man helt enkelt välja det som passar ens behov bäst. Om man har sparat en masterfil av den digitaliserade förlagan så kan man alltid utgå från denna och generera en ny visningsbild om behoven skulle ändras. Olika filformat har olika för- och nackdelar och man bör kartlägga de krav man ställer på visningsbilden innan man väljer filformat för denna. Utvecklingen för hela tiden fram nya filformat för bildskärmsvisning med egenskaper anpassade för olika behov. Bästa tillvägagångssätt är att man vid en digitalisering alltid skapar och lagrar en högupplöst masterfil. Filen ska lagras i okomprimerad TIFF tillsammans med metadata för framtida bruk. Från masterfilen kan en brukskopia skapas som sedan används vid generering av olika visningsformat. Innan man bestämmer sig för ett visningsformat bör man göra en kravspecifikation på de krav man ställer på sitt visningsformat, nuvarande och eventuella framtida, för att lättare kunna välja rätt format. 2. Produktionstekniska metadata Uppdraget för arbetsgruppen var att analysera och utreda vilken metadata som bör registreras vid den digitala bildfångsten för att säkerställa hög kvalitet i det långsiktiga bevarandet. En viktig sak som ofta förbises vid digitaliseringsprojekt är skapandet och bevarandet av produktionstekniska (och administrativa) metadata tillsammans med masterfilen. Dessa metadata är mycket viktiga då man i framtiden vill återanvända en långtidslagrad bildfil. Utan dessa metadata är möjligheten att få en rättvis uppfattning om hur originalet egentligen såg ut nästan obefintlig. Produktionstekniska metadata bör alltid skapas vid digitaliseringstillfället och, om möjligt, exporteras från TIFF-filens filhuvud då masterfilen skapas. Tillgången till metadata höjer bildfilens värde och förbättrar dess användbarhet under en lång tidsperiod. Det är viktigt att man vid val av bildfångstapplikation undersöker dess möjligheter att automatiskt generera metadata och att lagra dessa direkt i filhuvudet på TIFF-filen. En bildfångstapplikation bör även ha stöd för import/export av metadata till olika format, främst ASCII. Andra typer av metadata som också bör skapas är kontextuella och administrativa metadata. Inte minst administrativa metadata fyller en viktig funktion vid långtidslagring. Produktionstekniska metadata är viktiga för en digital fils framtida bruk. Dessa metadata bör alltid skapas vid produktionstillfället. Produktionstekniska metadata bör också, om möjligt, exporteras till en fil i ascii-format för lagring eller import av data till andra system. Tillsammans med produktionstekniska metadata bör också administrativa metadata skapas och, om möjligt, lagras i TIFF-filens filhuvud. 3. Kvalitet på bildfiler Uppdraget till arbetsgruppen bildkvalitet var att rekommendera en gemensam minimistandard för den digitala avbildningens kvalitet med utgångspunkt i avbildningens syfte. En av utgångspunkterna för många digitaliseringsprojekt är just i vilket syfte man digitaliserar. Frågorna cirkulerar ofta runt utrustning och hur man skall nå upp till den kvalitet man eftersträvar. Likaså hur man undviker att göra fel och förstöra de avbildningar man skapat. 239

Kvalitet och standard, Arbetsgruppens rapport Frågorna är många och svaren inte alltid så enkla. Att uppnå en god kvalitet på sin avbildning är en viktig del i ett digitaliseringsprojekt, speciellt om man vill skapa en sk. masterfil som sedan skall långtidslagras. Att uppnå rätt bildkvalitet är en av de parametrar som avgör om ett bilddigitaliseringsprojekt ska betraktas som lyckat eller misslyckat. Rätt bildkvalitet uppnås genom att man kontrollerar hela digitaliseringsprocessen, från början till slut. All utrustning som ingår i processen bör kalibreras. Rummet som man arbetar i kan, med enkla medel, anpassas för att ge en miljö som underlättar digitaliseringsarbetet och vidarebearbetning av de digitala filerna. Lagring av de digitala bildfilerna bör ske i ett format som bevarar den uppnådda kvaliteten. Detta för att man ej ska behöva göra om digitaliseringen vid ett senare tillfälle om man bestämmer sig för ett annat användningsområde för de digitala filerna. Rätt bildkvalitet är naturligtvis också kopplat till vad man har tänkt göra med det digitaliserade materialet. Om det endast är en tillgänglighetsaspekt (läs skärmvisning), som ligger till grund för beslutet att digitalisera, kan det naturligtvis vara tillräckligt med digitalisering på en enkel utrustning i en icke-kontrollerad miljö. Om det däremot är ett material som digitaliseras för att skyddas från t.ex. slitage bör man överväga en digitalisering med faksimilkvalitet som mål. Materialet löper då onekligen en risk att förstöras och bevarandeaspekter bör då vägas in vid beslutet om digitalisering. Om målet med digitaliseringen är att kunna återtrycka ett material så ska man alltid arbeta i en kontrollerad miljö. Det är svårt, för att inte säga omöjligt, att använda digitala bildfiler i en tryckprocess som framställts i en okontrollerad miljö. Det tryckta resultatets utseende kommer med all sannolikhet att avvika från den förlaga som digitaliserades. Om man, i efterhand, ska korrigera dessa avvikelser kommer det att krävas en betydande arbetsinsats. Bästa tillvägagångssätt vid val av bildkvalitet är att man gör en noggrann utvärdering av eventuella framtida behov för det material som ska digitaliseras. Först därefter, görs ett val av bildkvalitet för det digitaliserade materialet. Det är viktigt att notera att man vid vissa val automatiskt kan komma att välja bort framtida möjligheter till användning av det digitaliserade materialet, genom att bildkvaliteten blir för låg. 4. Färghantering Uppdraget till arbetsgruppen färghantering var att sammanställa rekommendationer för införande och upprätthållande av en korrekt digital färghantering, s.k. colour management. En av de viktigare aspekterna på arbete med digitala avbildningar finner man i begreppet colour management. Begreppet översätts ofta med färghantering och innebär att man försöker kontrollera färgåtergivningsegenskaperna hos de enheter som ingår i digitaliseringsprocessen. Eftersom all utrustning har sina egna egenskaper är det viktigt att genomföra rutiner för färghantering om man vill få ett bra slutresultat vid digitalisering. Färghanteringen fungerar genom att man kalibrerar all ingående utrustning och beskriver deras färgåtergivningsegenskaper i så kallade icc-profiler. Icc-profilerna används sedan av bildbehandlingsprogram för att kompensera för de felaktiga egenskaper som finns hos den utrustning som används. En annan viktig aspekt på färghantering är att ha ljus med rätt egenskaper i det rum där digitaliseringen sker. Detta glöms ofta bort, men är en nog så viktig aspekt på arbetet med färghantering. Den typ av utrustning som kalibreras är t.ex. skannrar, bildskärmar och skrivare. Kalibrering utförs på så sätt att speciell utrustning mäter de färgegenskaperna hos t.ex. den bildskärm som ska kalibreras. Denna utrustning går att köpa och det finns även utbildning att få för den som 240

Kvalitet och standard, Arbetsgruppens rapport vill införa färghanteringskonceptet. Givetvis finns också dessa tjänster att köpa hos olika leverantörer. Om man vill införa färghantering i sin organisation bör man tänka på att redan vid inköp införskaffa utrustning som är av god kvalitet och som eventuellt är förberedd för kalibrering. Införande av detta koncept innebär också att rutiner behöver skapas för att genomföra kalibrering med jämna intervall. Ofta kan det röra sig om en gång i veckan, eventuellt tätare beroende på vilken kvalitet den utrusning man har håller, dvs hur stabil är den och hur snabbt förändras de uppmätta värdena. Det är viktigt att poängtera att man kan, även om man inte genomför detta koncept, med enkla medel kan förbättra digitaliseringsresultatet genom t.ex. anpassning av arbetsrummet. Om man vill uppnå en optimal kvalitet på det digitaliserade materialet bör färghanteringskonceptet införas. Det är viktigt att man skapar rutiner för regelbunden kalibrering av all utrustning som ingår i digitaliseringsprocessen. Även arbetsrummet bör anpassas för digitaliseringsarbetet. Man måste skapa rutiner för att spara och arkivera de iccprofiler som varit aktiva vid digitaliseringen, både som enskilda profiler, samt beskrivna i det produktionstekniska metadata som skapas vid digitaliseringstillfället. 5. Autenticitet Uppdraget till arbetsgruppen autenticitet var att utreda och sammanställa best practices för autenticitet, d.v.s. regler för att säkra äkthet och tillförlitlighet för digitala reproduktioner. Att kunna bevisa att ett dokument är autentiskt har alltid varit en viktig fråga för vårt samhälle. I och med digitalteknikens framväxt har frågan om digitala dokuments autenticitet aktualiserats. Att fastställa ett digitalt dokuments autenticitet stöter till viss del på helt andra frågeställningar än vad som gäller för analoga dokument. Frågan är aktuell och det pågår ett flertal projekt världen över med syfte att lösa åtminstone en del av problematiken kring detta. Vi har under arbetets gång funnit att det är ett pågående arbete vilket gör att vi valt att redovisa en del av detta. Slutsatsen är att det finns olika tekniska möjligheter, t.ex. checksummor, digitala signaturer, etc. för att till viss del lösa autenticitetsproblemet, men att det är för tidigt att dra några egentliga slutsatser ännu, eftersom arbetet med autenticitetsproblemet för digitala dokument ännu inte hunnit så långt som vore önskvärt. 6. Att bevara digital information på lång och kort sikt Uppdraget till arbetgruppen var att resonera om huvudprinciper för kort- och långtidslagring av digitala avbildningar, samt att resonera om med vilken teknik och på vilka databärare deltagande institutionerna bör lagra sitt digitala material. Principer för datamigrering skall också undersökas. Arbetsgruppen skall resonera om hur institutionerna bör se på administrationen av långtidsbevarande för sina digitala avbildningar. En de viktigaste frågorna att lösa för kulturarvinstitutionerna är långtidslagring av digitalt material. Långtidslagring är en fråga som måste bedömas utifrån ett antal olika perspektiv. Det finns åtminstone ett tekniskt perspektiv, ett deskriptivt (metadata) perspektiv och ett perspektiv som omfattar formatfrågor, både i form av metadata och lagring. Det tekniska perspektivet omfattar frågor kring lagring och migrering av data mellan olika databärare. I en analog miljö ser man ofta till databärarens livslängd då man diskuterar långtidslagring. Ett exempel är mikrofilm där man ofta hänvisar till filmens livslängd vid bevarandefrågor. Med digitalt material är ett sådant synsätt helt felaktigt eftersom den tekniska livslängden hos utrustningen för olika lagringsmedier är betydligt kortare än livslängden hos lagringsmediet självt. Teknologiskiften kan ske med några få års mellanrum och snabbt göra en 241

Kvalitet och standard, Arbetsgruppens rapport teknik föråldrad. Det är viktigt att man ser ett digitalt arkiv som ett levande arkiv med data som hela tiden måste migreras mellan olika databärare för att fortleva. Vid skapandet av ett digitalt arkiv är det viktigt att man tar dessa frågor i beaktande redan från början för att inte låsa in sig, och inom en snar framtid få ett arbetskrävande hinder då man ska migrera data vidare. Det deskriptiva perspektivet består i mångt mycket av vilka metadata man komma att behöva för att på ett bra sätt administrera det digitala arkivet. Metadata behöver omfatta många olika områden, delvis olika beroende på vilken typ av objekt det är som arkiveras. Objektet kan bestå av digitaliserat material, dvs data i form av avbildningar av något slag. Det kan också vara en applikation som arkiveras där metadata måste omfatta saker som operativsystem och systemkrav. Detta för att göra det möjligt att köra applikationen i en framtida emulerad miljö. Det kommer också att behövas administrativa metadata för att beskriva objektets historia i arkivet, t. ex. om det skett någon konvertering från ett föråldrat filformat till ett nytt bättre filformat. En av de viktigare frågorna i ett arkiv är i vilket format som data och metadata ska arkiveras. Det finns ett antal olika projekt som har arbetat fram metadatastandarder för långtidslagring av digitalt material. Det är viktigt att man väljer ett format som är öppet och välbeskrivet med tanke på att det förmodligen kommer att vara aktivt under ett antal år framöver. Det finns också möjlighet att skapa digitala arkivobjekt innehållande både data och metadata i ett och samma objekt. Om de skapade objekten endast ska vara arkivobjekt och sällan användas är detta förmodligen det bästa valet för ett digitalt arkiv. Om det däremot ska ges tillgång till det arkiverade materialet mera frekvent bör man däremot skapa och underhålla en kopia av metadata och data för snabb åtkomst. Det finns idag ett flertal olika sätt att bygga upp ett digitalt arkiv på. Det bästa tillvägagångssättet är om man redan från början tar upp frågor kring migrering, konvertering, tillgänglighet och administration. Beroende på resurser kan detta innebära olika typer av lösningar. Det är viktigt att man lagrar flera kopior (minst två) av det arkiverade materialet, gärna på olika orter. Vid val av format för metadata är det viktigt att man väljer ett öppet, väl beskrivet, format. Då detta skrivs är de bästa formaten XML-baserade. När det gäller hur data ska arkiveras har inte samma standardiseringsprocess ägt rum utan här får man snarare välja hur man vill bygga upp sitt arkiv. Det arbete som kommit längst är förmodligen OAIS (Open Archival Information System) som utarbetats av NASA. Detta är en referensmodell för ett digitalt arkiv och man bör basera sitt arkiv på denna modell eftersom den är heltäckande och vunnit stort genomslag världen över. 7. Guider Arbetsgruppen har sammanställt ett antal praktiska guider för användning vid digital bildhantering: A. Att digitalisera i stor skala B. Att välja skanner för positiv och negativ film C. Att skanna färgnegativ D. Att skanna påsikt gråskala E. Att skanna med digitalt bakstycke F. Att skanna småbildsdia G. Att skanna glasplåtar (glasnegativ) 242

Kvalitet och standard FÖRSLAG PÅ BÄSTA TILLVÄGAGÅNGSSÄTT VID DIGITAL BILDHANTERING ÖVERSIKT 1. Filformat 2. Produktionstekniska metadata 3. Kvalitet på bildfiler 4. Färghantering 5. Autenticitet 6. Att bevara digital information på lång och kort sikt 7. Guider A. Att digitalisera i stor skala B. Att välja skanner för positiv och negativ film C. Att skanna färgnegativ D. Att skanna påsikt gråskala E. Att skanna med digitalt bakstycke F. Att skanna småbildsdia G. Att skanna glasplåtar (glasnegativ) 1. FILFORMAT ALLMÄNT OM DIGITALISERING AV ETT BILDMATERIAL Vid digitalisering av ett bildmaterial finns en mängd faktorer man måste ta hänsyn till för att erhålla "rätt" kvalitet på den digitaliserade bilden. Idealet är att låta syftet (vad man i slutänden vill eller avser göra med den digitaliserade bilden) få styra hur (vilka tekniker man använder vid bildfångsten) digitaliseringen skall gå till. I sammanhanget skall dock påpekas att den praktiska möjligheten att göra just detta i många fall regleras av de ekonomiska ramarna för digitaliseringsarbetet, dvs den utrustning med vilken man låter fånga bilden blir styrande för den maximala kvalitetsnivån. Ett exempel på detta är om man låter fånga bilderna med en ordinär digitalkamera ur vilken man enbart kan exportera de digitala bilderna i vissa bestämda filformat som redan är komprimerade, dvs bilderna uppfyller kvalitetskraven för att kunna visas på webb samtidigt som de lämnar en hel del att önska avseende kvalitetsnivå och lämplighet för långtidslagring. Avseende långtidslagring bör man således alltid se till att man använder utrustning och tekniker som möjliggör fångst av bilder i ett okomprimerat råformat såsom TIFF, som sedan kan konverteras vidare till andra, för visning på webb eller korttidslagring, mera lämpade format. 243

Sammanfattningsvis kan man alltså säga att kraven på "rätt" bildkvalitet är som störst i de fall man avser att långtidslagra det digitaliserade bildmaterialet, detta utesluter dock ej att man i andra fall även tillser att fånga bildmaterialet så att man får en kvalitetsnivå som vid långtidslagring, tvärt om är detta att rekommendera som standard eftersom man då redan tillsett att det digitaliserade bildmaterialet håller för att långtidslagra, och således undviker att behöva göra om hela digitaliseringsarbetet om det, i en framtid, skulle bli aktuellt med långtidslagring. VISNING AV BILDER Vid visning av bilder har man andra faktorer att ta hänsyn till än vid lång- och korttidslagring. Hur, i vilken form och för vem vi avser att presentera bilder styr vårt val av filformat. Förutom de sedan lång tid mer eller mindre vedertagna filformaten för visning av bilder på webben och presentation i tryck har på marknaden kommit ett antal filformat speciellt anpassade för visning på webben. Generellt för dessa filformat är att de möjliggör att bilder kan presenteras i icke förstörande komprimerad form, dvs en bild skiljer sig ej från en högupplöst bild då den presenteras. Användandet av dessa filformat ger väsentligt kortare nedladdningstider än om bilden skulle ha laddats i högupplöst form. Många av dessa nya filformat ger också möjlighet till direkt panorering och zoom utan att bilden förlorar i kvalitet. Detta är möjligt genom att endast den del av bilden som presenteras just då laddas hem eller dekomprimeras. För presentation av bildobjekt i tryck har man andra faktorer att ta hänsyn till än vid presentation på webben. Dessa faktorer styr sedan i sin tur valet av lämpligt filformat för tryck. FAKTORER VID VAL AV FILFORMAT På samma sätt som vid migration bör man utveckla någon form av riskhanteringssystem/schema för val av filformat för visning av bilder. TASI (Technical Advisory Service for Images) har funnit några generella faktorer som, förutom de redan nämnda, styr valet av filformat vid visning av bilder: För vilken utrustning är presentationen tänkt? dvs våra behov i samband med att bildobjekten presenteras Den mottagande utrustningens prestanda? Hur många färger och vilken upplösning kan den hantera? Vilken typ av bildobjekt avser vi presentera? t ex fotografi, ritning, animation eller rörlig bild (film) På vilket media avser vi att leverera bildobjekt? CD-ROM eller Webben? I det senare spelar mottagarens uppkopplingstyp stor roll för hur och vilka bildobjekt som kan tas emot problemfritt. I vilket format och på vilket media avser mottagaren att spara de mottagna bildobjekten? Metadata Några av de nya filformaten ger också möjlighet att lagra metadata om bilden i samma fil som bilden vilket gör att man ej som tidigare behöver spara eventuella metadata i separata filer. 244

Binary Large Objects (BLOB) Många av dagens databashanterare ger möjlighet att direkt komprimera bilder i databasposterna, dvs bilden komprimeras och lagras i databasens fil/filer. Detta är dock EJ att rekommendera om man ser till åtkomst av bilden ur såväl lång- som korttidslagringsperspektiv, detta pga att bilden när man komprimerar ner den i databasen ej längre är åtkomstbar annat än genom databasen eller via speciella drivrutiner för visning av bilden. Med andra ord så kan man inte komma åt att ändra bilden eller uppdatera den i databasen utan måste komprimera ner den på nytt. Det korrekta och bästa sättet ur alla aspekter att lagra bilder i en databas är att bara lagra länken till ursprungsbilden i databasen. På så sätt blir alla bilder nåbara och kan uppdateras oberoende av var och i vilken/vilka datas/databaser de finns lagrade. NYA FILFORMAT FÖR PRESENTATION AV BILDER I PIXELFORMAT Portable Network Graphics (PNG) Ett format som använder justerbar, icke förstörande komprimering, med en algoritm som vid 8- bitars bilder är 30% mer effektiv än GIF-formatet, för att visa 24-bitars fotografier eller heltonsbilder på webben. Formatet kan spara bilder i färglägena RGB, Indexerad färg, Gråskala eller ren svart/vit (punktuppbyggdbild). Medger automatisk korrigering av gammagrad utifrån vad som angivits när bilden först sparades i PNG-formatet. Filer kan också innehålla sökbar metadata i form av nyckelord och hela textsträngar. PNG-formatet har också en förstklassig hantering av transparens som kan varieras i bilden med hjälp av en extra färgkanal (alfakanal). PNG-formatet är bäst lämpat för visning av bilder på webben, men det kompletta färgstödet gör det också lämpat för tryckta dokument. JPEG2000 Ett format med syfte att förbättra det gamla JPG-formatet i fråga om komprimering, nedladdning, färg- och gammakorrigering. Bilder kan sparas i både förstörande och icke förstörande komprimering. En ny förbättrad komprimeringsalgoritm för båda formerna ger högre kvalitet och kortare nedladdningstider än det gamla JPG-formatet. Metadata i form av bildbeskrivning, fotograf och färgprofil kan lagras direkt i filen. Still Picture File Format (SPIFF) SPIFF-formatet är ett nytt format liknande det gamla JPG-formatet med en mängd förbättringar gjorda. Eftersom formatet är så nytt medger få bildprogram att det används i någon större utsträckning. Bilder i SPIFF-format kan sparas i både förstörande (JPG) och icke förstörande komprimering (SPF), samt helt okomprimerade med bibehållande av all bild- och färginfomation i likhet med dagens okomprimerade TIFF-format. Formatet medger både automatisk justering av gammagrad och en utökad färghantering. Avseende metadata finns en mängd textfält inbyggda i formatet för angivande av bildbeskrivning, datum/tid, fotograf, copyright, etc. FlashPix (FPX) Ett öppet skalbart filformat utvecklat av Kodak, dvs en bildfil innehåller en hel hierarki av samma bild i olika upplösningar. Vid visning kan sedan den upplösning som är bäst lämpad för ändamålet och mediet på vilket visningen sker väljas, så kan t ex vid visning på webben användaren själv välja i vilken upplösning bilden skall visas. Bilder kan lagras i FPX-formatet okomprimerade, med JPEG-komprimering eller enkel färgkomprimering. Varje bild i hierarkin medger komprimering oberoende av övriga bilder. FPXformatet medger steglös zoomning i bilden när den visas. Valfri metadata kan lagras i bildfilen. Bilder lagrade i FPX-formatet visas vanligen m h a en plug-in i webbläsaren, men kan också visas utan denna genom användning av klientbaserad Java. Detta ger dock en långsammare laddning av bilden. 245

PhotoCD Ett format som ursprungligen utvecklats av Kodak för lagring av bilder på CD-ROM skivor. Formatet använder förstörande komprimering för att packa och lagra varje bild i fem olika upplösningar (sex i PhotoCD Pro-formatet). PhotoCD-formatet är populärt vid distribution av bilder på CD-ROM skivor då formatet medger lagring av 100 högupplösande bilder på en CD- ROM skiva. MR SID Ett nytt format utvecklat av LizardTech Inc. i USA. MR SID-formatet använder en kombination av komprimeringsalgoritmer som ger mycket små filer med liten förlust i kvalitet och skärpa. Formatet ger full möjlighet till storleksändring, direkt panorering och zoom i samband med att bilden visas på webben, dvs endast den del av bilden som visas just då laddas hem och visas på det sätt som valts. DjVu Ett nytt format utvecklat av LizardTech i USA. DjVu-formatet har använder en kombination av komprimeringsalgoritmer vilken medger att hela dokument innehållande både text och bilder kan komprimeras ner till mycket små filer med liten förlust i kvalitet och skärpa. DjVu-formatet ger full möjlighet till storleksändring, direkt panorering och zoom i samband med att bilden visas på Webben, dvs endast den del av bilden som visas just då laddas hem och visas på det sätt som valts. Unikt för DjVu-formatet är att ett dokument kan delas upp i lager som kan komprimeras oberoende av varandra. Detta är speciellt användbart vid visning på Webben av bok- och dokumentsidor innehållande både text och bild då man t ex kan välja att ge texten maximal skärpa och djup medan man visar bilder och sidans pappersstruktur mindre noggrant. NYA FILFORMAT FOR PRESENTATION AV BILDER I VEKTORFORMAT Scalable Vector Graphics (SVG) SVG-formatet baseras helt på XML (Extensible Markup Language). Formatet är ett standardformat som tagits fram av W3C-konsortiumet. En SVG-fil består endast av text, dvs instruktionerna för hur ett ritprogram eller en browser skall rita upp vektorbilden. Till skillnad från pixelbaserade bilder, som alltid måste öppnas i någon form av bildmanipuleringsprogram vid editering, kan en SVG-fil öppnas och editeras i stort sett vilken textbaserad editor som helst. En bild i SVG-format kan alltid visas eller skrivas ut i vilken upplösning som helst eftersom den baseras på vektorer. SVG-formatet möjliggör att man kan skapa och animera bilder i vektorformat för visning på webben, något som tidigare endast var möjligt i för ändamålet speciella programvaror och till dessa låsta filformat såsom Macromedias Flash-format och Apples QuickTime-format. Bilder i vektorformat kan idag lagras med 24-bitars färgdjup i SVG-formatet. Formatet medger användandet av ICC-färgprofiler för färghantering, panorering och zoom. Eftersom SVG-formatet enbart är avsett för bilder i vektorformat lämpar det sig bäst för ritningar, animeringar och kartpresentationer (GIS, Geographical Information System). ÖVRIGA FILFORMAT Windows Bit Map Picture (BMP) Standardformat för bilder i pixelformat I Windows-miljö. BMP-formatet stödjer både lagring i helt okomprimerad form och lagring i icke förstörande komprimering, men används mest för att lagra bilder helt okomprimerade. Bilder kan i formatet endast lagras i färgläget RGB med ett färgdjup på 1, 4, 8 eller 24-bitar. 246

Formatet lever kvar i Windows-miljö då de flesta program kan hantera det och det fungerar på de flesta plattformar. Formatet lämpar sig ej speciellt väl för bilder som skall tryckas eller visning på webben. BMP-formatet finns också i en version avsett för operativsystemet OS2, dock är denna version mycket sällsynt eftersom operativsystemet OS2 idag har en mycket liten användning. Bilder lagrade i BMP-format för Windows kan även öppnas och användas i ett flertal program i Machintosh-datorer. PCX PCX-formatet är fortfarande vanligt förekommande I Windows-miljön, men börjar mer och mer ersättas av andra nyare format. Formatet har stöd för färglägena RGB, indexerad färg, gråskalor och svart/vit (punktuppbyggd bild). Bilder kan komprimeras med den icke förstörande komprimeringsmetoden RLE. Bilder kan ha ett färgdjup på 1, 4, 8, eller 24-bitar. PCX-formatet är ej lämpligt för offsettryckta dokument eller visning på webben. Tagged Image Format File (TIFF) TIFF är ett flexibelt format för bilder i pixelformat som stöds av i stort sett alla rit-, bildredigerings- och DTP- (Desk Top Publishing) program. Förutom detta kan nästan alla bildläsare producera TIFF-bilder. Formatet stödjer färglägena RGB, CMYK, lab- och indexerad färg, gråskale och svart/vit (punktuppbyggd bild). TIFF stödjer också icke förstörande komprimering (LZW) såväl som förstörande komprimering (JPG). Tagged Image Format File for Electronic Photography (TIFF/EP) Den nyligen antagna ISO-standardiserade TIFF/EP-rasterbildsformatet (ISO 12234-2:2001) bygger helt på den öppna tillverkarstandarden TIFF 6.0 (specifiserad av Adobe System Incorporated 1992-06-03) och använder exakt samma sk "Image File Header" (med pekare till en sk "Image file directory") som i TIFF 6.0. Om möjligt använder TIFF/EP redan i TIFF 6.0 definierade sk "TIFF fields" (var och en bestående av en sk "Tag" och dess värde) för att uppnå en så hög kompabilitet som möjligt med på marknaden förekommande TIFF-bildhanteringsprogramvara (se avsnittet "Produktionstekniska metadata" nedan). TIFF/EP tillåter (till skillnad från TIFFF 6.0) ej standard-värden på sk tags utan alla värden måste explicit fastställas. Genom detta kan förhoppningsvis interoperabilitet med kommande versioner av TIFF/EP tryggas. Det är mycket viktigt att INGEN efterbehandling sker av "färdig-taggade" sk master TIFF/EPfiler (gäller naturligtvis även alla "vanliga" TIFF-filer) och att dessa snarast "arkivlagras" som "Read-only" TIFF(/EP)-filer för att eventuellt inte förlora viktiga metadata när TIFF(/EP)- bildfiler öppnas i olika bildhanteringsapplikationer/bild-viewers, vilka ej är helt kompatibla med TIFF(/EP) -specifikationen vad gäller tag-strukturen. TARGA file format (TGA) Ett av de första formaten som togs fram för lagring av högupplösande bilder i pixelformat. Lagring kan i formatet ske i helt okomprimerad form och i icke förstörande form med hjälp av en mängd olika komprimerings-algoritmer. Formatet stödjer färglägena RGB och Gråskale bild med ett färgdjup på 8, 6, 24 eller 32-bitar. Idag används TGA-formatet mest vid professionell videoredigering. 247

Graphics Interchange Format (GIF) Ett populärt och vida spritt format som utvecklats och ägs av Compuserve. GIF-formatet ger möjlighet att spara bilder dels helt okomprimerat och dels komprimerat med den icke förstörande komprimeringsmetoden LZW. GIF-formatet kan endast visa 256 färger varför det bäst fungerar med bilder som använder ett begränsat antal färger, såsom logotyper, ikoner och diagram. I sin senaste version (GIF89a) har formatet både stöd för transparens (en färg definieras som genomskinlig och visas ej) samt animering (en fil kan innehålla flera bilder som visas efter varandra). GIF-formatet rekommenderas ej för offsettryck och är ej heller lämpligt för visning av fotografier på webben. Macintosh Picture format (PICT) PICT-formatet är vanligt förekommande i bild- och DTP-program för Macintosh-datorer. PICTformatet är speciellt bra på att komprimera bilder som innehåller en helfärg. Det maximala färgdjupet är 24-bitar. Formatet stödjer ej färgseparationer, är enhetsoberoende och rekommenderas inte för högupplösande tryck. Encapsulated Postscript (EPS) EPS-formatet är utvecklat av Adobe Inc. som ett generellt filformat för utskrift på skrivare med stöd för PostScript. Filer kan innehålla bilder både i vektor- och pixelformat. EPS-formatet kan enkelt konverteras till andra format, men det är oftast ej möjligt att konvertera andra format till EPS-format. En utveckling av EPS-formatet är DCS-formatet (Desktop Color Separations), som förutom att vara ett EPS-format också ger möjlighet att spara färgseparerade CMYK-bilder eller flerkanalsfiler.för EPS- och DCS-filer gäller att man måste ha tillgång till en skrivare med PostScript-drivrutiner för att kunna skriva ut dessa filer. Computer Graphics Metafile (CGM) Ett format utvecklat av ANSI (American National Standards Institute) med syfte att vara ett generellt format för utbyte av digitalt lagrade bilder. Har stöd för bilder i både vektor- och pixelformat. Windows MetaFile (WMF) Ett speciellt Windows-format som framför allt används vid överföring av vektorbilder mellan olika Windows-program. WMF-filer kan också innehålla pixelbaserad bildinformation, men de flesta bildbehandlingsprogram kan bara läsa vektorbildsinformationen. Färgstödet är begränsat till 16-bitars RGB och färgseparationer understöds ej. WMF-formatet är ej lämpligt för offsettryckta dokument eller för visning av bilder på webben. En utveckling av WMF-formatet är EMF-formatet (Enchanted MetaFile). Joint Photographic Expert Group (JPG/JPEG) Formatet, som är skapat för att kunna lagra och visa en bild med maximerad komprimering (förstörande) används oftast för att visa fotografier och andra bilder med färgtoner via HTMLfiler på webben. JPEG-formatet stöder färglägena CMYK, RGB och gråskalor. Till skillnad från GIF-formatet så behåller en bild lagrad i JPEG-format all vital färginformation i RGB-läget. JPEG-formatet använder en justerad, förstörande komprimeringsmetod som effektivt reducerar filstorleken genom att identifiera och ta bort data (dvs färgnyanser) som ej är viktiga för visningen av bilden. En högre kompressionsgrad medför lägre bildkvalitet, medan en lägre kompressionsgrad ger bättre bildkvalitet men större filer. I de flesta fall kan en bild komprimeras i JPEG-format utan att man med blotta ögat ser någon större skillnad i bildkvalitet jämfört med originalet. En JPEG-fil packas automatiskt upp när man öppnar den. 248

Man bör dock tänka på att en JPEG-bild förlorar både i kvalitet och skärpa om man manipulerar och spar den på nytt JPEG-format. Detta gör att man bör se till att, i det fall det krävs, utföra alla manipulationer av bilden i sitt originalformat innan man slutligen sparar i JPEG-format. JPEG-formatet fungerar bra för fotografier, men heltonsbilder (bilder som innehåller stora mängder av en färg) har en tendens att förlora i skärpa. JPEG-formatet kan användas både för visning av bilder på webben och i kommersiellt tryckta dokument. Bilder i JPEG-format kan också sparas progressivt, dvs bilden visas gradvis i en serie av svep under tiden den hämtas in. Detta visningssätt är speciellt skapat för visning av bilder på webben i det att betraktaren kan få en uppfattning av bilden direkt utan att behöva vänta på att hela bilden är inhämtat i sin fulla kvalitet. Vanligtvis kan man när man sparar en JPEG-bild ange i hur många svep den skall hämtas in. För progressiva JPEG-bilder gäller att dessa filer blir något större och kräver mera internminne vid visning, det är ej heller säkert att progressiva JPEGbilder kan hanteras av alla program och webbläsare. Vissa program har också svårigheter att läsa JPEG-bilder i CMYK-format. Resource Interchange File Format (RIFF) Består av en grupp av format för presentation av multimedia. Format som ingår i RIFF är Palette File format (PAL), Waveform Audio Format (WAV), MID (MIDI-format) och Device Independent Bitmap (DIB). Portable Document Format (PDF) Är en standard för distribution och visning av kompletta dokument med bibehållen layout, typografi, samt bibehållna bilder i både vektor- och pixelformat. PDF-formatet bygger på standardspråket PostScript 3 avsett för professionellt tryck, vilket gör att PDF-sidor har stor likhet med PostScript-sidor, dock kan PDF-filer också innehålla multimedia och funktioner för att söka och navigera i dokumenten. Adobe Photoshop (PSD) Adobe Photoshops eget format för bilder. Formatet stödjer fullt ut alla bildlägen och kanaler som finns i Photoshop, samt medger att man infogar ICC-profiler för färghantering. Adobe Illustrator (AI) Adobe Illustrators eget format för vektorgrafiska bilder. Är i princip ett EPS-format utan möjlighet till förhandsgranskning. AI-formatet kan bara öppnas i Adobe Illustrator och ett fåtal andra bildbehandlingsprogram varför det endast lämpar sig under bearbetningsprocessen. När bilden/ritningen är klar bör den lagras i ett, för ändamålet, mera lämpligt filformat. AI-formatet finns också i en tidigare version och heter då art-format. Interchange File Format (IFF) Ett gammalt format som ursprungligen användes som allmänt grafikformat av Amiga-datorer. IFF-formatet har stora likheter med Machintosh-datorernas PICT-format. Scitex Continuous Tone (CT) Format utvecklat för att bearbeta bilder i Scitex datorsystem. PIXAR-format (PXR) Ett 3D-format som används för framtagande av tredimensionella-bilder på PIXAR Workstation (dator utformad för avancerade grafiktillämpningar). Drawing Exchange Format (DXF) Ett filformat utvecklat av företaget Autodesk, Inc. för att kunna flytta bilder i vektorformat mellan olika 3D program eller till 2D vektorprogram. 249

Filmstrip Format för att flytta animeringar mellan Adobe Premiere (program för videoredigering) och Adobe Photoshop. Macromedia Freehand (FH) Bildredigeringsprogrammet Freehands interna filformat som finns i ett flertal versioner. Råformat (RAW) Ett grundformat som stödjer de flesta färglägen. Formatet kan användas för att flytta och öppna bilder i annan utrustning eller programvara när inget annat format fungerar. För att kunna öppna en bild i RAW-format måste man ha tillgång till en mängd grunduppgifter, såsom pixelstorlek och antalet lager bilden består av. xres (LRG) Ett format utvecklat av företaget Macromedia. LRG-formatet som har stora likheter med TIFFformatet stödjer ett färgdjup på 24 eller 32 bitar, samt ger möjlighet till en alfa-kanal. QuickTime Movie (MOV) Ett samlingsformat framtaget för publicering av bilder, animationer och film på webben och på CD-ROM. MOV-formatet stödjer ett 100-tal olika multimediaformat avsedda för lagring av bild, ljud, video, etc. QuickTime komprimerar de använda formaten när de lagras, för att sedan packa upp och koordinera bild, text och ljud när MOV-filen öppnas. Virtual Reality Modelling Language (VRML) Egentligen ett programspråk för publicering av 3D bilder på webben. VRML-format kan användas för att tredimensionellt visualisera föremål, miljöer, arkitektur, händelser och förlopp. FILKOMPRIMERING Eftersom digitaliserade filer ofta når en ansenlig storlek har olika typer av komprimeringsalgoritmer utvecklats för att minska storleken på filerna och göra dem hanterbara. Ett par av de mer betydelsefulla parametrarna för en fils storlek vid digitalisering, är kombinationen av upplösning och färgdjup. En avbildning i sk. faksimilkvalitet av en affisch i storleken 70cm x 100cm med 24 bitars färgdjup ger en fil i storleksordningen 300 MB. Att hantera filer i denna storlek kräver bra datorutrustning och en god lagringskapacitet. Ytterligare behov av att göra filerna mindre har uppstått genom användningen av Internet. Datorer kopplade mot Internet har ofta en begränsad bandbredd och för att se bilder på ett snabbt och effektivt sätt krävs att de håller en mycket liten storlek. Även med dagens ökade användning av sk. bredband kommer filstorlekarna att behöva hållas nere för att de ska kunna användas vid visning via webbsidor. Det är från denna typ av utmaningar som komprimeringstekniken har vuxit fram. Vad är komprimering? Komprimering innebär att man på olika sätt kodar om filens innehåll för att filens storlek ska bli mindre. De olika komprimeringstekniker som finns använder olika typer av algoritmer (matematiska metoder) för att uppnå resultat. Fysisk och logisk komprimering Komprimeringsalgoritmer beskrivs ofta på olika sätt men använder oftast endast två olika grundtyper av komprimering. Fysisk komprimering innebär att man komprimerar data utan att röra vid innehållet. Innehållet kan vara en bild, ljud, ett dataprogram etc. Vid användning av en sk. logisk komprimeringsmetod ersätts data i filerna med annan typ av data t.ex. United States of America ersätts med USA. Logisk komprimering fungerar bara på teckennivå och används normalt inte vid komprimering av bilder. 250

Symmetrisk och asymmetrisk komprimering Komprimering kan också delas in i två olika kategorier symmetrisk och asymmetrisk komprimering. En symmetrisk komprimeringsalgoritm använder i princip samma metod för komprimering som för dekomprimering och utför därmed ungefär samma arbete vid komprimering som vid dekomprimering. Asymmetriska komprimeringsalgoritmer använder däremot en metod vid komprimering och en annan för dekomprimering. Vanligen tar komprimeringsfasen betydligt mer tid och systemresurser i anspråk än dekomprimeringsfasen. Asymmetrisk komprimering används ofta för data som ska komprimeras en gång men dekomprimeras flera t.ex. musik i digital form (MP3). Adaptiv, semi-adaptiv och icke-adaptiv komprimering Vissa komprimeringsalgoritmer som använder sig av ordlistor är konstruerade att endast komprimera en viss typ av data. En icke-adaptiv algoritm använder sig av en statisk ordlista med strängar som man vet ofta förekommer i en fil. T.ex. om en svensk text ska komprimeras så kan ordlistan innehålla ord som och, eller, men, etc. En adaptiv algoritm har ingen fördefinierad ordlista utan bygger upp den utifrån varje enskild fil som ska komprimeras. Exempel på denna metod är LZW-komprimering. En semi-adaptiv algoritm är en mix av adaptiv och icke-adaptiv komprimering. Förstörande och icke förstörande komprimering Man kan också dela in de komprimeringsalgoritmer som finns i kategorierna förstörande och icke förstörande. När en algoritm är av typen icke förstörande innebär det att då en fil komprimeras och dekomprimeras så är innehåller slutresultatet samma data som filen bestod av från början, dvs. data bevarades i sin helhet under komprimerings- och dekomprimeringsfasen. Vid användning av en förstörande metod är resultatet det omvända, dvs ursprungsdata har inte bevarats. Vid komprimering av dokument som består av text eller numeriska data är inte en förstörande komprimeringsmetod acceptabel, däremot kan vid användning på t.ex. grafisk information som bilder en sådan komprimering vara acceptabel och kanske också värd att eftersträva. Ett bra exempel på detta är då man vill visa bilder över Internet eller användningen av MP3-formatet för ljud där målsättningen har varit att få ned filens storlek och ändå ge ett bra resultat vid visning eller uppspelning av filens innehåll. Hur går komprimering till? Det finns som, tidigare nämnts, ett antal olika komprimeringsstrategier och algoritmer som används i vid komprimering. För att illustrera hur en komprimeringsalgoritm fungerar kan vi använda oss av textsträngen aaaaaaabbbccccccddddd. En enkel komprimeringsalgoritm för denna sträng skulle omvandla den till 7a3b6c5d. En sådan komprimering skulle innebära en besparing på ca. 60% i lagringsutrymme. Detta är också exempel på en icke förstörande komprimering, dvs ingen information plockas bort från det som komprimeras. Vid förstörande komprimering finns flera olika metoder för att minska filinnehållet. Ett bra exempel på en förstörande komprimering är det som sker när man skapar en ljudfil i filformatet mp3. Här har man försökt mäta vad örat hör och inte hör vid uppspelning av musiken och följaktligen plockat bort information som inte påverkar vårt hörande. Vid konvertering av en fil från wav-formatet till mp3 så minskar filens storlek till ca. 1/12-del av den ursprungliga filstorleken. Vilka olika komprimeringsalgoritmer finns det i olika filformat? I den uppräkning av komprimeringsalgoritmer som följer, är endast de vanligaste uppräknade. Det finns betydligt fler algoritmer men de som räknas upp är de vanligast förekommande idag. 251

LZW LZW är uppkallad efter sina skapare Abraham Lempel, Jakob Ziv och Terry Welch. Komprimeringstekniken är förhållandevis enkel. Den är av typen icke förstörande dvs. ingen information tas bort från de data som komprimeras. Komprimeringstekniken fungerar på så sätt att den identifierar återkommande strängar som ordnas i en tabell med ett indexvärde. Då strängen återkommer i filen ersätts denna med det index som motsvarar strängen i tabellen. Det finns ett flertal filformat som använder sig av LZW-komprimering. De mest kända är TIFF och GIF. CCITT G3/G4 CCITT är en standardiseringsorganisation som har utvecklat en serie kommunikationsprotokoll som officiellt kallas CCITT T.4 och T.6. I dagligt tal brukar de benämnas CCITT Grupp3- och Grupp4-komprimering. Ibland kallas de också, delvis felaktigt, för Huffman kodning efter en komprimeringsalgoritm introducerad av David Huffman 1952. Grupp3- och Grupp4- algoritmerna skapades speciellt för användning på svart-vita bilder och överföring via telefoni och fax. Vid användning av Grupp3-komprimering uppnås en komprimering i skalan 5:1-8:1. Vid användning av Grupp4-komprimering uppnås det dubbla ca. 15:1. G3/G4 komprimering stöds bl.a. av filformatet TIFF. JPEG Joint Photographic Experts Group JPEG är inte en algoritm utan kan ses mer som ett bibliotek med bildkomprimeringsverktyg som kan anpassa komprimeringen efter användarens behov. Man kan skapa väldigt små filer i relativt dålig kvalitet eller något större filer i bra kvalitet men fortfarande med mycket bra komprimering. JPEG använder dock en sk. förstörande komprimering vilket gör att bildinformation tas bort och inte kommer att kunna återskapas igen. JPEG skapades primärt för användning på digitala fotografiska objekt, stillbilder, komplex grafik, etc., vilket gör att den inte fungerar lika bra på t.ex. svart-vitt material. Den komprimeringseffekt som uppnås vid användning av JPEG ligger i skala 20:1 25:1 utan att någon större synlig effekt uppstår. Vid högre komprimering kommer olika typer av synliga effekter att uppstå i bilden. JPEG stöds av bl.a. av filformaten JFIF (i dagligt tal kallat JPEG) och SPIFF. IW44 IW44 är en våglängdsbaserad komprimeringsteknik. Användning av IW44 ger en mycket hög komprimeringsgrad. Algoritmen används bl.a. i filformatet Deja-Vu. JBIG JBIG står för Joint Bi-level Image experts Group, vilket är en standardiseringskommitte inom ISO. JBIG är en komprimeringsmetod som är framtagen för bi-level data dvs. data bestående av två olika färger. JBIG är tänkt att helt ersätta de algoritmer som används av CCITT G3/G4 protokollen. Den vanligaste typen av två-färgs bilder är svart-vita bilder men tekniken kan också hantera andra färger. JBIG används bl.a. av filformatet Deja-Vu. RLE Run-Length Encoding Run-length encoding är en väldigt enkel komprimeringsalgoritm. Dess stora fördel är att den är enkel att implementera och snabb att exekvera. Nackdelen är att det kan vara svårt att få bra komprimering hos vissa typer av filer. En svart-vit bild är ett bra exempel på ett material där denna typ av algoritm fungerar bra. Den innehåller ofta stora sammanhängande områden av vitt eller svart vilket gör att man får längre strängar av samma tecken men vid komprimering av en text är det sällan man har dessa och följaktligen fungerar denna algoritm sämre här. Algoritmen fungerar på så sätt att reducerar den fysiska storleken av återkommande tecken. Exempelvis så komprimeras strängen aaaaabbbbb till 5a5b. Notabelt är att då algoritmen appliceras på en sträng av typen adsgf blir resultatet 1a1d1s1g1f vilket innebär att beskrivningen av strängen blir större efter komprimeringen än vad den var okomprimerad. RLE stöds t.ex. av filformaten TIFF, BMP och PCX. 252

MPEG Motion Pictures Experts Group MPEG är en specifikation för komprimerad dataström av filer som innehåller video och ljud. MPEG specifikationen skapades först och främst för att kunna lagra video och ljud på ett digitalt media som cd-rom eller DAT (Digital Audio Tape). MPEG är en s.k. assymetrisk komprimerings- teknik vilket innebär att det är relativt komplicerat att komprimera data, men enkelt att dekomprimera. Innebörden av detta är att komprimering kräver mer datakraft än dekomprimering och MPEG lämpar sig speciellt för data som ska komprimeras och lagras en gång men dekomprimeras och spelas upp flera gånger. MPEG finns i ett flertal olika versioner för olika ändamål och benämns då MPEG-1, MPEG-2 och MPEG-4. MPEG används också som filtyp för de datafiler som innehåller MPEG-komprimerad data. Ett filformat som vunnit stor spridning är MP3. MP3 står för MPEG-1 Audio Layer 3 och är den data i en MPEG-1- komprimerad dataström som innehåller ljud. MP3 är ett bra exempel på den typ av data som används vid MPEG-komprimering, dvs komprimeras en gång och dekomprimeras för uppspelning flera gånger. Varför ska man komprimera och när bör man låta bli? Komprimering används ofta i samband med att visningsfiler skapas. Ofta kan det vara jpegeller gif-filer som ska användas och visas via webbsidor. I detta sammanhang är komprimering motiverat eftersom det kriterium som är viktigast är den begränsade bandbredd många har som tittar på dessa filer, t.ex. användare som via modem är anslutna till Internet. I andra fall används komprimering av filer för att spara utrymme. Man kanske har begränsat med hårddisk eller annan lagring och därför väljer komprimering som en metod för att minska lagringsbehovet. Det man bör vara medveten om är att om man använder ett filformat med sk. förstörande komprimering, t. ex. jpeg, tas data bort ifrån filen. Dessa data kommer inte att kunna återställas. Om man däremot använder ett annat filformat och använder en icke förstörande komprimering, t. ex. TIFF med lzw-kompression, kommer filen att kunna återställas till sitt originaltillstånd. Om komprimering, av olika skäl bedöms vara nödvändig, så är detta att föredra framför en förstörande komprimering. Arbetsgruppens rekommendation är att visningsbilder kan, och i många fall bör, komprimeras att brukskopior av masterfiler kan komprimeras, men då med en icke förstörande metod att masterfiler avsedda för långtidslagring aldrig bör komprimeras utan lagras i filformatet TIFF, utan att komprimeras REFERENSER Murray, James D. och van Ryper, William. (1996). Encyclopedia of Graphics File Formats, second edition. 2. PRODUKTIONSTEKNISKA METADATA För att i framtiden dels möjliggöra framställning av originalliknande reproduktioner i form av bildskärmsrepresentationer samt korrektur- och kvalitetstryck och dels snabbt och enkelt kunna återsöka digitalt lagrade bilder i ett Digitalt BildDatabasSystem (DBD-system) är det mycket viktigt att helst i direkt anslutning till digitaliseringstillfället alltid registrera olika typer av sk metadata. Eftersom en betraktare av digitala bilder i ett DBD-system vanligen endast får se en mer eller mindre lågupplöst bildskärmsrepresentation eller en sk surrogat-bildfil (med begränsad detaljsamt ton- och färgåtergivning) av den inskannade förlagan (den sk digitala master-bildfilen) 253

måste såväl surrogat- som master-bildfilen åsättas relevanta metadata. Därmed kan betraktaren förhoppningsvis få en rättvis uppfattning av originalets verkliga kvalitet (dvs den analoga förlagan) i avseende på framförallt detalj- samt ton- och färgåtergivning samt verkligt fysiskt format. Med andra ord bör förlagans fysiska format samt bla den erhållna master-bildfilens pixeldimension (i x- och y-led); bitdjup/färgdjup och färgmodelltillhörighet mfl färgparametrar (tex ICC-standardiserade färgdata) registreras som sk produktionstekniska metadata i direkt anslutning till rasterbildsdata. Detta ger betraktaren/användaren i praktiken möjlighet att avgöra om kvaliteten i den digitala bildfilen i fråga räcker till åsyftat ändamål (tex till ett tidningstryck i två gångers förstoring eller till ett högkvalitativt fyrfärgsboktryck i skala 2:1). Tillgång till tillförlitliga metadata av olika slag förbättrar således i hög grad rasterbildfilens användbarhet under en lång tidsperiod. Det är viktigt att alla bildfångstapplikationer till olika digitala bildfångstutrustningar innehåller funktioner för att mer eller mindre automatiskt kunna hantera (dvs skriva till/läsa från fil) olika typer av viktiga metadata, vilka i första hand berör det tekniska framställningssättet och parameterinställningar (sk produktionstekniska metadata). Därtill behöver själva bildfångstapplikationen eller separata TIFF-tag-import/export-moduler (se nedan) kunna hantera viktiga administrativa samt i mindre utsträckning en del nödvändiga innehållsbeskrivande eller sk kontextuella metadata. För detta ändamål bör man lämpligen använda sig av nedan beskrivna standardiserade TIFFtaggar (i TIFF6- eller TIFF/EP-utbytesformatet) för att knyta bla textinformation (i ASCII-form) till de digitalt lagrade bilderna. Data i TIFF-huvudets (eng. Header) olika taggar (eng. Tags) som berör produktionstekniska förhållanden (dvs framställningssätt/parameterinställningar) bör kunna skrivas till fil (exporteras) som en ASCII-textsträng (helst automatiskt) från bildsfångst-programvaran till ett tillgängligt eller planerat DBD-system med hjälp av en sk TIFF-tag-exportmodul. Det är även viktigt att (helst automatiskt) kunna skriva in några viktiga administrativa och kontextuella metadata (eventuellt tillgängliga i DBD-systemet) i relevanta taggar i TIFF-huvudet med hjälp av en TIFF-tag-importmodul. Administrativa metadata skall i princip upplysa användaren om bla typ av databärare samt server/biblioteks- och filstrukturer som bildfilerna är relaterade till. Metadata vad gäller databärare; rastergrafiskt utbytesformat och eventuellt komprimerings/dekomprimeringssätt (eng. COmpressionDECompression/CODEC) ger framtida användare av bildfilerna viktig upplysning för att möjliggöra nödvändig migrering av rasterbildfilerna till nya magnetiska/optiska databärare; konvertering till nya datarepresentationer/utbytesformat samt nya CODEC-algoritmer utan dataintegritetsintrång). Det är som sagt även viktigt att alltid registrera olika typer av sk metadata, vilka mer eller mindre berör originalens/förlagornas proveniens/innehåll (dvs innehållsbeskrivande eller sk kontextuella metadata). Relevant textbaserad beskrivning (indexering) av erhållna rasterbildfiler i ett centralt DBDsystem är en nödvändig förutsättning för att sekundsnabbt kunna återsöka ett fåtal relevanta digitala bilder i 100-tals Internet/Intranet-baserade DBDS-servrar, vilka var och en kanske lagrar 100 000-tals rasterbildfiler. Denna typ av metadata har behandlats i projektets aktivitet Obligatoriska dataelement. Metadata bör i första hand inkludera information om vald bildfångstutrustning/system (tillverkare/modell; optik; belysningstyp och karaktär; bildfångstmjukvara (namn och version), etc) 254