IT ur arkivperspektiv Henrik Landtmanson Arkivarie Kommunarkivet, Karlstads kommun
Två delar Digitalisering Att göra något som tidigare varit analogt, t.ex. i pappersform, digitalt. Bevarande i digital form Att istället för att bevara information, som t.ex. endast har funnits digital form eller digitaliserats, i pappersform, bevara den i digital form
Digitalisering Varför digitalisering? Digitalisering görs för att: Effektivisera det dagliga arbetet Skydda ömtåliga handlingar Förbättra tillgången till arkivmaterial Förenkla distribution av arkivmaterial
Vad digitaliseras? Exempel på handlingar som digitaliseras är: Diarieförda handlingar i verksamheten Fakturor för användning i ekonomi system Kyrkböcker p.g.a stor efterfrågan efter materialet och att slitaget då blir stort på orginalen Historiska kartor för att förbättra tillgång och distribution
Hur görs digitalisering? Digitalisering görs genom: Skanning från original Skanning från mikrofilm Fotografering från original Annan datorbehandling (t.ex. ljud och film)
Bevarande i digital form Att bevara information i digital form är annorlunda mot att bevara information på papper. Att bevara information i digital form innebär att många nya problem måste lösas.
Vad är problemen? Information på papper kan bevaras i många hundra år, utan att påverkas särskilt mycket, enbart genom en lämplig miljö och försiktig hantering. Digital information kräver datorer och program som stämmer överens med den fil som innehåller informationen för att filen ska kunna öppnas och man ska kunna ta del av informationen. Datorer och program blir idag omoderna på ca. 10 år, ofta snabbare och byts då ut och informationen i filen går då inte att ta del av. Men en fil innehåller intressant information som man vill ska bevaras. Hur ska man då kunna ta del av informationen i framtiden?
Alternativa lösningsmodeller idag Datormuseer Emulering Migrering Att spara datorer och Att digitalt skapa ett Att vid arkivering av en fil, program som kan läsa filer program som imiterar en och så länge den från olika tidsperioder. Detta skulle med utvecklingstakten för datorer och annan en annan dator och andra program, t.ex. äldre, än man normalt använder. bevaras, spara filen på ett sådant sätt att den går att ta del av med den alla olika typer av filer som Det här är ett tillvägagångssätt aktuella generationens finns snart bli ett ohanterligt stort lager av datorer och programvara. som det arbetas en del med, men som är komplicerat. datorer och program. Den här modellen används mest av de här tre.
VARFÖR ARKIVERA DIGITALT??? Bibehållna sökmöjligheter Bibehållna sammanställningsmöjligheter Nya sammanställningsmöjligheter Bibehållna distributionsmöjligheter Effektivare hantering vid arkivinstitutionen
Hårdvara Datorerna, dvs. själva maskinerna, utvecklas snabbt vilket gör det svårt att veta hur länge man kan ta del av den information man sparat. Exempel: Diskettstationer är inte längre standard i nya datorer Joysticken som fungerade till min Comodore 64 1984 fungerar inte till min Fujitsu- Siemens från 2005, som ändå är gammal Sparar man information på en CD idag kanske datorerna inte har cd-spelare om 10 år
Forts. Hårdvara Lagringsmedia Digitala lagringsmedia är t.ex. disketter, band, cd/dvd-skivor och hårddiskar Papper vet man håller i flera hundra år i bra klimat och efter försiktig användning. Digitala media vet man, nu: Varierar mycket i tillverkningskvalitet, vilket gör att de kan innehålla fel som gör informationen på dem oläslig redan vid första användning. Bryter ner sig själva över tiden. Det spelar ingen roll hur bra klimat de förvaras i eller hur försiktigt man använder dem, de kommer ändå bli oläsliga med tiden.
Forts. Hårdvara P.g.a. de här problemen måste man byta lagringsmedia över tid, för att kunna fortsätta ta del av den arkiverade informationen
Mjukvara Mjukvara, eller programvara, är de datorprogram som behövs för att kunna ta del av informationen i en datafil i en dator. Mjukvaran verkar utvecklas, om möjligt, ännu snabbare än hårdvaran. Mjukvaran finns i flera varianter för samma ändamål. Exempel: Man kan inte öppna ett dokument som man skrev på sin dator för fem år sedan trots att man ser att den ligger där Man kan inte öppna en fil som någon skickat till en fast man vet att man har t.ex. ett bildspelsprogram
Forts. Mjukvara P.g.a. den här typen av problem måste man tänka efter vilken mjukvara som ska kunna öppna filen man arkiverar, för att kunna fortsätta ta del av informationen under lång tid
Typer av information Olika typer av mjukvara producerar olika typer av information, med olika informationsinnehåll Exempel: Dokument (protokoll, brev, affischer, utlåtanden) Databaser (ärendehanteringssystem, andraverksamhetssystem, register) Bilder (fotografier, CAD-ritningar, kartor) Givetvis finns det fler typer av information och de kan också förekomma kombinerade med varandra
Filformat Med filformat menar man det sätt som digitala filer är skrivna, eller programmerade. Exempel: text lagras i en textfil som kan läsas av ett ordbehandlingsprogram en bild lagras i en bildfil som kan visas i ett bildredigeringsprogram Att välja rätt filformat är mycket viktigt vid arkivering i digital form. Beroende på filformatet behövs längre eller kortare tid mellan konverteringar och det är troligare att fler användare kan öppna filerna i det format de är arkiverade. Filformat för arkivering ska vara leverantörsoberoende och helst standardiserade enligt ISO.
Leverantörsoberoende De allra flesta filformat vi använder i vardagen är leverantörsberoende. De här formaten ägs av en leverantör, ett företag, och leverantören visar inte för någon utanför företaget hur formatet är uppbyggt, det är affärshemligheter. Det här är affärsmässigt förståeligt och formaten kan fungera mycket bra i det dagliga arbetet, men det är inte bra ur arkivsynpunkt.
Forts. Leverantörsoberoende Exempel på leverantörsberoende format:.doc (word),.xls(excel),.ppt (power point) Databasformat som Oracle, PostgreSQL, SQL Server m.fl. Bildfiler som.cdrw (Corel draw),.psp (Paint shop pro),.psd (Adobe photoshop) div. CAD- och GIS-format m.fl.
Forts. Leverantörsoberoende Leverantörsoberoende filformat är format som är öppna för vem som helst att ta del av uppbyggnaden av. Flera leverantörer, programvaruföretag, använder leverantörsoberoende format för användarna att spara information i, eller som ett alternativ att spara i. Leverantörsoberoende format ska användas vid långtidslagring!
Forts. Leverantörsoberoende Format standardiserade av ISO är mycket väl utredda och dokumenterade. De är väl spridda p.g.a. att de är likformiga och reglerade. Att använda ISO-standardiserade filformat vid arkivering i digital form är starkt rekomenderat. ISO, Internationella standardiseringsorganisationen är ett internationellt standardiseringsorgan, representerat av nationella standardiseringsinstitutioner (i Sverige av SIS). Standard, en norm som gäller för alla aspekter av något.
Exempel på leverantörsoberoende format: Dokument PDF/A, TIFF, Jpeg, XML Bilder PDF/A, TIFF, Jpeg Databaser Teckenseparerade eller positionsbestämda textfiler (.txt), XML
Dokumentation Arkivhandlingar i digital form behöver dokumenteras för att man ska förstå i vilket sammanhang de kommit till och vad informationen betyder. För att man ska förstå i vilket sammanhang de kommit till gör man en systemdokumentation som bl.a. beskriver vilket system informationen kommer ifrån, hur systemet användes i verksamheten och till vad systemet användes i verksamheten.
forts. dokumentation För att den arkiverade digitala informationen ska gå att ta del av krävs information om filen som t.ex. filformat, läsare för filformat och ev. kopplingar till andra filer. För att den arkiverade digitala informationen ska gå att förstå krävs information om innehållet om detta inte är självförklarande, t.ex. förklaringar till förkortningar och koder eller vad informationen i fält 1, 2, 3 betyder. Denna dokumentation kallas metadata i det här sammanhanget
Kort om uppbyggnad av IT-system och arkivuttag ur dem De flesta system bygger på en eller flera databaser. Systemet sammanställer och visar information ur databaserna baserat på frågor. Databaser består av flera sammankopplade tabeller med information. Databaser finns i olika fabrikat, t.ex. Oracle, SQL Server och My SQL, som är programmerade på olika sätt, är leverantörsberoende. När man ska bevara data från system kan man behöva gå bakom det man vanligen ser på skärmen, användargränssnittet, och titta på informationen direkt i databaserna. Från databasernas tabeller kan man sedan sammanställa och exportera information i ett format som är lämpligt för långtidslagring.
Lagring Lagring av material arkiverat i digital form görs på: CD/DVD (enkla att använda, passar för mindre volymer, lagras i vanligt arkivmagasin, varierande kvalitet, manuella kontroller och back-uper måste göras) Lösa hårddiskar (enkla att använda, passar för större volymer, lagras i vanligt arkivmagasin, manuella kontroller och back-uper måste göras) Hårddiskar på server (Mer komplicerat att använda, passar för större volymer, enklare åtkomst, lagras i datorhallar, automatiska kontroller och back-uper kan göras, mer känsliga för obehörig åtkomst ) Band (Mer komplicerat att använda, passar för mycket stora volymer, lagras på server eller löst med respektive för- ochh nackdelar)
forts. lagring Vid lagring av arkivmaterial i digital form ska materialet, precis som arkiv i pappersform, skyddas mot förstörelse, skada, tillgrepp och obehörig åtkomst. Exempel på åtgärder: Flera kopior av materialet, i olika lokaler och på olika media Regelbundna kontroller av lagringsmedia Rätt val av lokal och lokalskydd
Vård Vård av arkivmaterial i pappersform handlar bl.a. om kontroll av klimatet i arkivlokaler, kontroll av kartonger och inbindningar, kontroll av skador på arkivhandlingarna. För handlingar i digital form innebär det delvis samma sak, t.ex. kontroll av förvaringsmiljö och kontroll av skador på handlingar men
forts. vård p.g.a. de digitala lagringsmediernas känslighet för nedbrytning och de digitala handlingarnas känslighet för i vilken miljö de kan ses behöver lagringsmedierna kontinuerligt kontrolleras lagringsmedierna kontinuerligt, med ett intervall på 2-10 år, bytas ut. (Ex. man flyttar de lagrade filerna till nya cd-skivor) kontinuerlig kontroll hållas på utvecklingen av filformat och motsvarande läsare arkivfilerna kontinuerligt konverteras till ett annat likvärdigt format, när utvecklingen visar att filformatet snart kommer vara daterat
forts. vård Ett annat problem, som jag kopplar till arkivvården, är att handlingar i digital form är lättare att manipulera än en pappershandling. Därför måste också autenticiteten, att det som kom in till arkivet också är det som finns i och kan komma att lämnas ut från arkivet kontrolleras kontinuerligt
Framtagning Vid framtagning av arkivmaterial i pappersform tas den beställda handlingen fram, fysiskt, ur magasinet och forskaren kan direkt ta del av handlingen. Om forskaren önskar kopior görs det oftast med en vanlig kopiator eller med någon form av skanner eller digitalkamera. Kopior i pappersformat skickas med vanlig post. Vid framtagning av handlingar i digital form finns det moment som blir enklare och moment som blir svårare än vid framtagning i pappersform
forts. framtagning Vid framtagning av handlingar i digital form kan man behöva se till så att filen går att öppna, t.ex. kontrollera så att det inte är något fel på filen och så att det program man kan öppna filen med finns på datorn där filen ska öppnas se till så att informationen är läslig, t.ex. lägga in informationen i en kommaseparerad textfil i en databas eller en tabell för att den ska bli lättare att läsa se till att informationen är förståelig, t.ex. bifoga dokumentation om systemet informationen kom ifrån och vad respektive fält betyder
forts. framtagning arkivmaterial i digital form kan kopieras betydligt enklare och snabbare än arkivmaterial lagrat på annat media arkivmaterial i digital form kan distribueras betydligt enklare och snabbare än arkivmaterial lagrat på annat media, t.ex. via mail eller en webb-sida arkivmaterial i digital form kan manipuleras betydligt enklare och mindre tydligt än arkivmaterial lagrat på annat media, handlingens autenticitet kan därför behöva kontrolleras både vid utlämnandet och vid återlämnandet av handlingen
E-arkivprocessen Val av information att bevara Sammanställning av information att bevara Avställning av information att bevara Konvertering av information att bevara Sammanställning av dokumentation Framtagning av sök- och visningsverktyg Lagring Framtagning
1 1 1
1
Att läsa: Stockholms stadsarkivs handledningar om hantering av digital information http://www.ssa.stockholm.se/sv/om-stadsarkivet/vi-arbetar-for-god-arkivhantering/handledningar/ Samrådsgruppen för arkivfrågor Publikationen Allmänna handlingar och IT http://www.samradsgruppen.se/index.asp?p=1012 Statens arkivs föreskrifter om ADB-upptagningar http://www.statensarkiv.se/default.aspx?id=7677&refid=1417 (Sök på Rubrik ADB ) http://www.statensarkiv.se/sve/dokumentarkiv/filer/remissversion_tekniska%20krav_webben.pdf
Övningar Bildsamling (från byggprojekt i en stad 1920-1970 digitaliserad): Skolsystem (med uppgifter om person, klass, betyg, lärare et.c.): Digitala dokument från förening (olika dokumenttyper och filformat): Lagrings format? Metadata/sortering? Visningsmetod? Lagrings format? Visnings format? Utlämnandesätt? Lagrings format? Metadata/sortering? Utlämnandesätt?