Digitalisering och bevarande från projekt till långsiktiga program

Relevanta dokument
PROJEKTBESKRIVNING fastställd av styrgruppen

Bilddatabaser och digitalisering - plattform för ABM-samverkan

Med objektet i centrum. Ett ABMseminarium om olika perspektiv på bild. Varför betraktar museimannen fotografiet som ett unikt föremål, en artefakt, me

Digitalisering. enligt Kungliga biblioteket

Digital dokumenthantering för ABM II:1

Rolf-Allan Norrmosse. SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) Paper presenterat vid konferensen

Sammanfattning. 1. Inledning

Minnesanteckningar - Expertgruppen för digitalisering,

Stadsarkivets anvisningar 2011:1 Hantering av allmänna e-handlingar som ska bevaras i Uppsala kommun

Projektplan för projektet Framtid i Access (FIA)

VAL AV SAMLINGAR FÖR DIGITALISERING - KONSERVERINGSÅTGÄRDER. Stina-Maria Brantberg Konservator

Nätverksgruppen kring EU-projekt som berör digitaliseringsfrågorna

Arkivet föreningens bästa minne

LDB-Centrum. Centrum för Långsiktigt Digitalt Bevarande. Östen Jonsson. Liten insats stor nytta

IT ur arkivperspektiv

Sveriges officiella biblioteksstatistik enkät

Minnesanteckningar förda vid möte med ABM-IT/tekniska gruppen Fredagen den 19 november 2004

Tid: kl Plats: Krigssarkivet Sammanträdesrummet Stora Konferensrummet

Digital arkivering i Örebro kommun - riktlinjer

Nordiska arkivdagar. Forskarnas röst och digitalt material

SÅ VÅRDAR VI VÅR HISTORIA - RÅD OCH ANVISNINGAR I SKÖTSEL AV FÖRENINGSHANDLINGAR

Personalträff Naturrum Tåkern och Ödeshögs lokalhistoriska arkiv

Ta hand om föreningens bästa minnen

Titel: TAM-Arkiv Arkivhandbok Datum: Version: 1.0. TAM-Arkiv Arkivhandbok

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

Slutrapport. Arbetsgruppen för Högskolans e-publicering. Till Forum för bibliotekschefer, Sveriges universitets- och högskoleförbund (SUHF)

Nu tar vi arkiven till en ny digital nivå - slutrapport Författare: projektledare Johan Eriksson

Plattform för bilddatabaser

Torstens Digitalbildguide

Digitala fotografier

Adobe Acrobat 7.0. Få jobbet gjort med kraftfulla intelligenta dokument

Filformat / bildformat

Kulturarvet. tillgängligt använt återanvänt. Marie Andersson

Projektplan. Digitalisering av Kattresan

Samverkan och nätverk inom ABM-området. Infrastruktur i samverkan. 11 november Gunnar Sahlin.

Kungl. bibliotekets kunskapsstrategi

Uppdrag och inbjudan att bidra till en nationell strategi för digitalisering, elektronisk tillgång och digitalt bevarande.

Ett svenskt digitalt tidskriftsarkiv en förstudie kring de upphovsrättsliga frågorna

Open access.se underlag för styrgrupp den 16 september

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR

Yttrande: Nya villkor för public service (SOU 2012:59)

Riktlinjer och mål för digitaliseringsarbete

Designarkivet och det Digitala Arkivet. Anders Gidlöf, arkivarie och ansvarig för Digital arkivering

Dokument- och ärendehantering i Alingsås kommun Bilaga 4

Användning av pdf Vägledningen 24-timmarswebben

Att göra en modern släktbok för CD och webb med Disgen

Mellan råd och praktik En studie av åtta folkbiblioteks digitaliseringsprojekt

Rekommendationer för insamling av forskningsmaterial. Dnr 1-362/2014

Forskningsbiblioteksstatistik för kalenderåret 2008

Slutrapport Projektet OCR-tolkning för indexering av,

3. Gunilla Herdenberg berättar om KB:s inflytandestruktur

Grunder. Grafiktyper. Vektorgrafik

Bevarandestrategi för Uppsala universitetsbibliotek. Beslutad av Biblioteksnämnden

Checklista: Beständiga identifierare

Inspektionsrapport 1 (8) Tillsynsavdelningen Dnr RA /4754 A-K Andersson

När kommer boomen? E-boksutredningen. En utredning beställd av Kungliga biblioteket och Svensk. Biblioteksförening

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR. en handledning för myndigheter i Västra Götalandsregionen och Göteborgs Stad

Kungl. bibliotekets bibliografiska råd Fredag den 24 april, 2009

Arkivlänet Västernorrland

regional biblioteksplan förkortad version

Insamlingsverktyg - teknisk beskrivning av metadataformuläret

FOTOGRAFISK BILD. Ämnets syfte

Kungliga bibliotekets plan för nationell biblioteksutveckling. samverkan

FOTOGRAFISK BILD. Ämnets syfte. Kurser i ämnet

Öppna Samlingar Tema Resor

KOPIERINGSLICENS FÖR UNIVERSITET OCH YRKESHÖGSKOLOR

Riktlinjer och förutsättningar för skanning och ersättningsskanning i Stockholms stad. stockholm.se

Arkivera sociala medier och hemsidor

Lite om. Släktforskning idag med datorer och Internet

Musik och bibliotek - upphovsrätt

Slutrapport. Utbildningsforskning och reformpolitik under 50 år speglad i Torsten Huséns arbetsbibliotek

Kulturmiljöförordning (1988:1188) Anm. Rubriken har fått sin nuvarande lydelse enligt förordning (2013:554).

2. Val av sekreterare och justerare Åsa valdes till sekreterare och Marcus valdes till justerare.

Nordiska arkivdagarna 2003

Enkätundersökningen Digitalt kulturarv Västernorrland 2009

En lathund om att. Sverige

Följande publikationer skulle digitaliseras:

Forskningsbiblioteken som aktörer i publiceringsfrågor

Ett specialbibliotek om Sverige

Optimala bildinställningar för leverans TEORIHÄFTE TILL KURSEN

KB, E-boken och den egna digitaliseringen.

E-PLIKT E-PLIKT FÖR GÖTEBORGS UNIVERSITET

Workshop om informationshantering och aggregering

Det fanns en dröm! En berättelse om övergången från mikrofilmad dagspress till digital

Checklista samlingssystem

Upphovsrätt i förändring

Remissyttrande gällande Statskontorets utvärdering av Digisam och Riksarkivets ställningstagande till Digisams framtid

Sharpdesk Sharpdesk Dokumenthanteringslösning

Terminologi och klassifikation. Användning av kontrollerad ordförråd vid Torekällbergets museum Södertälje

Hej! Mer information, pappersenkät, support och definitioner når du via

EDLocal EDLocal tillgängliggör digitalt kulturarvsmaterial från lokala och regionala aktörer genom European Digital Library (EDL)

Men det är mellan alla dessa sessioner möten med andra äger rum, där erfarenheter, problem och utvecklingsfrågor delas.

Val av samlingar Nationalbiblioteket Digitaliserings- och konserveringstjänsten

Fråga Biblioteket -- Handlingsplan 2009

Ansökningsblankett för projekt inom Kulturarvslyftet

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

FOLKBILDNINGENS DIGITALA ARKIV Vad behöver göras?

Statens historiska museers digitaliseringsstrategi

Museer och konsthallar Kalenderåret 1998

Transkript:

Digitalisering och bevarande från projekt till långsiktiga program av Johan Mannerheim Innehåll 1. Inledning 2. Plattform för bilddatabaser 3. Långsiktigt bevarande av digital information 4. Digitalisering och bevarande Om författaren 1. Inledning I oktober 1999 var jag på en tredagars konferens i Utrecht om Digitisation of European Cultural Heritage. Det var påfallande vilken mångfald av projekt det finns, från enkla presentationer av godbitar ur samlingarna till filologiska projekt med avancerad tolkning av tecken och ord och samtidig presentation av textversioner från olika manuskript. Där fanns projekt, som integrerade digitalisering med lokal undervisning och forskning, och dokumenthanteringssystem med nationella ambitioner. Kvaliteten varierade naturligtvis, men de stora problemen var att så många av projekten var rumphuggna, kortsiktiga eller oavslutade i brist på resurser och att teknik och mjukvaror snabbt åldras, så att resultaten redan håller på att bli oåtkomliga för studier. Det bästa med konferensen var de rekommendationer som antogs. Man menade att nu var det dags att gå över från projekt till mer långsiktiga program: All over Europe, experience in digitisation has been gained through

pilot projects and innovative experiments in the field of cultural heritage. To bring about a transition to a stage of large-scale application, considerable effort and investments will be required to transfer existing knowledge to the operational level. 1 Också på Kungliga biblioteket har det under senare år växt fram en mångfald av digitaliseringsprojekt, t.ex. porträtt ur kart- och bildsamlingen, affischer ur KB:s samling av över 500.000 affischer, ett urval svenska femton- och sextonhundratalsböcker, en brevväxling mellan Selma Lagerlöf och Sophie Elkan och automatisk indexering av vår äldsta tidning, Posttidender, 1645 1721. Även här spretade projekten åt olika håll. 2. Plattform för bilddatabaser För att råda bot på detta har KB under 1999 drivit ett projekt kallat Plattform för bilddatabaser. Avsikten har varit att skapa en gemensam plattform för produktion, lagring, tillhandahållande och registrering av digitala och även fotografiska (ickedigitala) avbildningar. Eftersom projektet berör många olika sidor av KB:s verksamhet har projekt- och referensgrupper varit sammansatta av anställda från många olika enheter och i den arbetsgrupp som behandlat registreringsproblematiken har även representanter från två andra bibliotek deltagit. Ett område som visat sig vara viktigt har varit terminologi. Menar två bibliotekarier samma sak, när de använder ord som bild, original, bildfil och bilddatabas, eller pratar de förbi varandra? Och vad händer när en fotograf, en konservator och en dataexpert kastar sig in i diskussionen? Ett annat viktigt område har varit att formulera relevanta urvalskriterier för digitalisering. Hittills har de flesta digitaliseringsprojekt styrts av en önskan att tillhandahålla, medan bevarandeaspekten försummats. En väsentlig del av bilddatabasprojektet har rört kvalitet och standard. Hit hör frågan om vilka filformat vi ska använda för digitala bilder, för arkivering på lång sikt, för visning lokalt eller över Internet och för leverans till forskare, förlag och media. Likaså frågan om vilken bildkvalitet vi bör använda vid digitalisering av olika typer av samlingar. Här ingår upplösning, färgdjup, färgrymd och metoder för verklighetstrogen färgåtergivning. Hit hör också frågor om var olika metadata om bildfilen ska sparas: i bildfilen, i bilddatabasen eller i katalogposten. Den mest omfattande delen av projektet har gällt bildregistrering. Det har gällt formatfrågor, främst arbete på att göra det svenska MARC-formatet bättre anpassat till bilder. Det har gällt indexering, där uppdraget varit att komplettera befintliga svenska ämnesord med ord för bildbeskrivning och att ta fram en gemensam teknikoch materialterminologi. 2 Under arbetet med KB:s bilddatabasprojekt har vi mer och mer kommit till insikt om att en del av de frågor vi ställt oss inte kan lösas inom ramen för en institution. De behöver diskuteras i ett större sammanhang. KB har därför tagit initiativet till ett bredare projekt som syftar till samverkan mellan arkiv, bibliotek och museer, den s.k. ABM-sektorn. Tillsammans med Riksarkivet, Nationalmuseum och

Riksantikvarieämbetet har KB ansökt om medel hos Riksbankens Jubileumsfond och Stiftelsen framtidens kultur till ett ABM-projekt, som vi hoppas fler kulturarvsinstitutioner ska komma att delta i. Det går under arbetsnamnet Bilddatabaser och digitalisering plattform för ABM-samverkan. Registreringsdelen kommer här att få en annan inriktning än i KB-projektet, nämligen att hitta minsta gemensamma nämnare som alla kan omfatta, för att lägga grunden för samsökning inom arkivens, bibliotekens och museernas samlingar. Då kanske man inom en inte alltför lång framtid genom en enda sökning på Strindberg kan hitta arkivmaterial, tryckta böcker, handskrifter, målningar och fotografier av honom tillsammans med bilder föreställande honom inom hela ABM-sektorn. 3. Långsiktigt bevarande av digital information Ett annat område som kommer att bli allt viktigare inom hela ABM-sektorn är det långsiktiga bevarandet av digital information. Om det som produceras digitalt idag ska vara tillgängligt för forskare och allmänhet i morgon och om hundra eller tusen år, måste vi skapa lika bra metoder för att bevara den digitala informationen som vi har för den pappersbundna. KB kom på allvar in på detta område 1996 genom projekt Kulturarw 3, som siktar till att bevara digitala svenska publikationer som finns online, framförallt svenska webbsidor. Eftersom antalet webbplatser (vilket ungefär motsvarar förläggare 3 ) är stort, idag över 60.000, måste vi använda så automatiska metoder som möjligt. En insamlingsrobot söker av Internet efter svenska webbsidor och sparar de filer de är uppbyggda av. Den svenska webben omfattar för närvarande drygt sju miljoner sidor. Totalt har vi gjort sex nerladdningar sedan januari 1997 och har därigenom en historisk samling av svenska webbsidor på drygt 30 miljoner, vilket motsvarar 60 miljoner filer inklusive bilder, ljud m.m. Svårigheterna med att bevara detta är inte att bevara den egentliga digitala informationen, dvs nollorna och ettorna, eftersom en kopia är exakt lik originalet. Det är nollorna och ettorna som ska bevaras, inte det medium som bär informationen. Problemet är att de program som tolkar informationen inte går att köra på morgondagens datorer och att de nya programmen inte kommer att kunna läsa gamla filer. När det gäller webben minskar detta problem genom att de flesta filerna görs i relativt standardiserade filformat. Textformaten HTML och plain text och bildformaten GIF och JPEG utgör tillsammans 97 procent av filerna. Utsikterna för att kunna läsa dem är åtminstone under den närmaste framtiden goda. Det är bland övriga tre procent som problemen ligger: filer skapade av olika versioner av proprietära program som t.ex. MS Word, Excel, Acrobat och WordPerfect. Det finns två sätt att angripa detta problem: migrering och emulering. Migrering innebär att man ständigt tar med sig dokumenten genom att konvertera dem till den aktuella mjuk- och hårdvarumiljön. Nackdelen är, som alla som konverterat texter mellan olika

ordbehandlingsprogram vet, att viss information, t.ex. layout, kan gå förlorad, även om textinnehållet i stort sett följer med ograverat. Vid upprepade konverteringar ökar risken för informationsförlust. Vid emulering behåller man den ursprungliga filen. När man i framtiden vill läsa den skriver man ett nytt program som härmar, emulerar, det ursprungliga programmet i den nya miljön. Det pågår en del internationella projekt kring denna modell som vi följer med intresse. KB:s strategi kommer förmodligen att vara en kombination av de två modellerna. Vi kommer att migrera, men behåller de ursprungliga filerna för att kunna dra nytta av emuleringsprogram i framtiden. Nu är webbsidorna inte den enda digitala information som vi på KB behöver bevara för framtiden. Vad händer t.ex. med dagens författarmanuskript? Förr tog KB och andra bibliotek ofta emot hand-skriftsarkiv från författares dödsbo, ett material som är av stort värde för litteraturforskare som vill studera ett verks tillkomst och influenser. Idag finns detta material i författarnas persondatorer. Därför har vi tillsammans med KB:s handskriftsenhet och med stöd av författaren Sven Lindqvist, som är medlem av KB:s styrelse, startat ett litet projekt som siktar till att finna modeller att bevara digitala personarkiv. Vi försöker lära oss hur vi ska kunna ta hand om olika manusversioner, e- postkorrespondens, researchmaterial och andra spånor från författarens verkstad. Att bevara digital information på lång sikt är i själva verket ett generellt problem, inte bara inom ABM-sektorn, utan i samhället i stort, och det kommer bara att växa. Ännu nyligen var datorn ett redskap för att skapa tryckta eller skrivna dokument. Det digitala dokumentet är då en mellanform, som inte behöver bevaras när det slutliga pappersdokumentet är klart. Idag blir det allt vanligare att den digitala formen är den primära, som sedan kan spridas på olika sätt: på webben, med e-post, i form av en utskrift eller kanske rentav som en tryckt upplaga. Trots detta har de flesta institutioner och företag inte tagit itu med uppgiften att bevara denna primära information på sikt, utan förlitar sig på sekundära format som papper eller i vissa fall mikrofilm. Att utveckla modeller och metoder för att bevara digital information på mycket lång sikt är ett område som utmärkt lämpar sig för samarbete inom ABM-sektorn. 4. Digitalisering och bevarande De erfarenheter som vinns av att bevara sådan information som i sin primära form är digital, och den infrastruktur och de resurser som skapas för detta, kan också användas för att ta hand om digitaliserat material. De gör det möjligt att undvika risken för att resultaten av olika digitaliseringsprojekt efter en tid blir oåtkomliga, eftersom den datormiljö de skapats i blivit föråldrad. Vid digitalisering kan man dessutom redan från början välja filformat och mjukvaror som är så standardiserade och utbytbara som möjligt. Därigenom blir det lättare att bevara sådan information i sin sekundära, digitala form på lång sikt. Jag tänker avrunda med några tankar kring digitalisering och bevarande. Ofta tänker man slarvigt att digitalisering är en form av bevarande. Men det är det inte. Det kan

fungera precis tvärtom. Man digitaliserar för att öka tillgängligheten till en samling, en bok eller ett föremål. I de flesta digitaliseringsprojekt har man inte tänkt igenom vilka konsekvenser det kan få för originalen. En lyckad digitalisering ökar intresset för materialet. Är digitaliseringen av låg kvalitet vid exempelvis bilddigitalisering tillfredsställs inte forskarnas och allmänhetens behov av de grova bilder de erbjuds. Då söker de upp originalen, vilket ökar förslitningen av det kulturarv man ville presentera och kanske skydda. Samtidigt gör man på många institutioner upp bevarandeplaner för sina samlingar. Sällan tar man i dessa planer upp de möjligheter som en digitalisering kan ge. Många lån av originalmaterialet skulle kunna undvikas om man kunde tillhandahålla det i digital form av tillräckligt hög kvalitet. Slitaget på originalen skulle minska. Problemet är att de som arbetar med bevarande och de som arbetar med digitalisering är specialister var och en på sitt område och sällan mötas de två. Det behövs mer samarbete över gränserna både inom våra institutioner, mellan institutionerna inom hela ABM-området och mellan forskare och institutioner. Om författaren Johan Mannerheim, fil. kand. med både naturvetenskapliga och humanistiska ämnen, bibliotekarie, avdelningsdirektör, chef för Data och IT-enheten vid Kungl. biblioteket. Han har byggt upp den nationella mikrofilmningen av svensk dagspress i KB:s regi och medverkat i standardisering inom områdena mikrofilmning och "imaging". Han är boksamlare med inriktning på bokens historia och har undervisat vid Grafiska institutet i ämnet. Sedan mitten av 90-talet har han ägnat sig åt att utveckla KB:s infrastruktur på IT-området och är bl.a. ansvarig för den insamling av svenska webbsidor som KB bedriver för att bevara dem för framtiden. Noter 1 Ur Conclusions and recommendations of the international conference on Digitisation of European Cultural Heritage, Utrecht, The Netherlands, 21 23 October 1999 (Åter till texten) 2 En rapport kommer att publiceras under våren år 2000 i Kungliga bibliotekets rapportserie. (Åter till texten) 3 Det exakta antalet förläggare på den svenska delen av Internet är svårt att fastställa pga 1. att en förläggare på Internet kan ha flera webbplatser, så siffran är för hög, 2. att webbhotell kan ha många förläggare inhyrda på samma webbplats, så siffran är för låg, 3. att någon statistik över svenska utgivare eller förläggare på Internet inte finns, så antalet webbplatser, som vi känner till, är den bästa uppskattning vi har. (Åter till texten) Johan Mannerheim 2000 Åter till Human IT 1/2000