Nordisk Arkivakademi Boden november 2009



Relevanta dokument

RADAR. Mats Berggren /

Nordisk El-Arkivseminar Island maj Svensk SIP och AIP Mats Berggren, Riksarkivet

ADDML vid Riksarkivet i Sverige

ESSArch vid Riksarkivet i Sverige

Paketstruktur. Karin Bredenberg /

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

Standarder vid digitalt bevarande. Karin Bredenberg /

Begrepp för elektroniska arkiv och digitalt bevarande. Översättning av OAIS & Begrepp för arkivenheter i olika standarder

INTERNATIONELL UTBLICK HUR MÄRKER VI AV ARBETET MED STANDARDER?

Karin Bredenberg Specifikation av olika leveranstyper/aflevereringstyper och leveransprocessen. Karin Bredenberg,

METADATASTANDARDER EN ORIENTERING

IT-avdelningen. Författare Funktion Telefon Datum Version Sid Karin Bredenberg SoU (10)

Hantera informationspaket i system för bevarande

Tidformat Tid anges enligt formatet yyyy-mm-ddthh:mm:ss Där plustiden är tidstillägg i förhållande till UTC 2.

Projekt E-ARK stöd vid digital arkivering. Björn ES Solutions

Konverteringsprojekt P47

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Testplattformen (Webbarkivering)

Från dokumenthanteringssystem till e-arkiv Anastasia Pettersson Per Carlsson

Introduktion till. (FGS) FGS Paketstruktur. Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion FGS Paketstruktur

Riksarkivets IT-verksamhet. En integrerad del av vårt dagliga arbete och långsiktiga verksamhetsutveckling. Rolf Källman

TAM 4:2010 REKOMMENDATION. Arkivfunktionalitet för IT-system. Version 1.0

Dokumenttyp Ordlista Projekt Elektroniskt bevarande, Etapp 2

DP7 Kompletterande information

Workshopmallar The e C ap a it i al a l o f S c S a c n a din i av a ia

E-arkiv, eardoch Pre-pre-ingest

LDB-Centrum. Centrum för Långsiktigt Digitalt Bevarande. Östen Jonsson. Liten insats stor nytta

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 1 METS

Rapport från ENSAM, E-arkivsamverkansgruppens metadatagrupp

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

Användarhandledning för RALF

Digital arkivering. Börje Justrell/

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 2 PREMIS

Aktivitetsrapport från Aktivitet 3 Digitala Leveranser

E-arkiv på SLL landstingsarkivet

VAPA-Service - Finska arkivverkets service för elektronisk förvaring

Teoretiska överväganden kring långsiktig lagring av elektronisk information

Pass 4. Exempel på metadatastandarder. SND Svensk nationell datatjänst

Elektroniskt bevarande. Caspar Gielissen Eskilstuna kommun, Stadsarkivet

ISO Designing and Implementing a Records System (DIRKS/DIRS), Göran Samuelsson

Rosetta. Ido Peled. A Digital Preservation System. December Rosetta Product Manager

eard Projektet Karin Bredenberg /

archive En produkt från Ida Infront - a part of Addnode Group

En introduktion till långtidsbevarande av digital information

Enkät om hur man beskriver elektroniska dokument: Sverige

Från dokumenthanteringssystem till e-arkiv Anastasia Pettersson Per Carlsson

E-plikt och metadata.

Tillämpningsanvisningar för överlämnande till digital långtidsarkivering

Moment 5: Vad är ett e-arkiv och vad krävs för att införa det i min verksamhet?

ALEPH ver. 18 ALEPH Digital Asset Module (ADAM)

SND-forum 14 nov Transfers of research data to National Archives and use of our data for research. Magnus Geber

FGS Paketstruktur Tillägg

E-plikten. Expertgruppen för metadata 20 maj

Examensarbete vid Institutionen för tillämpad IT. Thesis Project at Department of Applied Information Technology

Bevarande av webbplatser En kartläggning bland statliga myndigheter i Sverige

Vägen till e-arkivet. NUAK 19 september Margareta Ödmark Avdelningen för arkiv och registratur

archive En produkt från ida infront - a part of Addnode

Stadsarkivets anvisningar 2011:1 Hantering av allmänna e-handlingar som ska bevaras i Uppsala kommun

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

Delrapport DP3. Metadata och e-tjänster för e-arkiv Förvaltningsgemensamma Specifikationer (eard FGS) FGS för paketstruktur för e-arkiv

Digital långtidsbevaring i sjukvården

PROTAGE-projektet AAS-konferens 21 oktober 2010

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR

Vad är arkiv? Vem äger och ansvarar för informationen i arkiven?

Förvaltningsgemensamma specifikationer

Bilaga 3. En redogörelse kring metadata och XML. Status Slutlig. Sid 1 (7) Dokumenttyp. Versionsdatum

FGS Paketstruktur Tillägg

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR. en handledning för myndigheter i Västra Götalandsregionen och Göteborgs Stad

LEVERANSFRAMSTÄLLAN. Version (8)

Hur tänker KB ta hand om högskolornas e-publikationer?

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

IT ur arkivperspektiv

Svenska kyrkans bestämmelser

LEVERANSFRAMSTÄLLAN. Version (8) Datum:

FoU-projektet Långsiktigt Digitalt Bevarande (LDB)

Ett e-arkiv värt att lita på UTKAST för synpunkter

Pass 4: Metadatastandarder

DP7 FORMELL KONTROLL

Digitala fotografier

Dokumenttyp Checklista för digital arkivering Projekt Elektroniskt bevarande, Etapp 2

Anvisningar för ifyllning av Excelark för databaser (xml-filer)

(reviderad , , ) Riksarkivet IT-avdelningen. Anvisningar för ifyllning av Excelark för webbleveranser

REGEL FÖR BEVARANDE AV ELEKTRONISKA HANDLINGAR

FÖRSTUDIERAPPORT - SYDARKIVERA LABB

Internationella kopplingar Karin Bredenberg,

Arkiv- och informationsvetenskap AV, Arkivsystem, 7,5 hp

Introduktion till rättsinformationssystemet

Förvaltning av FGS:er

FGS Paketstruktur. Förvaltningsgemensam Specifikation (FGS) för paketstruktur för e-arkiv

Elektroniskt bevarande Säkra för framtiden. Caspar Gielissen Föreningen Sambruk

Digital inlämning av årsredovisning

Kompletterande frågor - Regler för informationshantering. och arkivering i IT-system/applikationer, LA 2017

Österåkers kommuns styrdokument

Digital inlämning av årsredovisning

SIMPLIFYSCAN. För intelligent scanning

Digital dokumenthantering

Digital arkivering i Örebro kommun - riktlinjer

Inspektionsrapport 1(5) Nationella divisionen Enheten för tillsyn Dnr RA /4277

Transkript:

Nordisk Arkivakademi Boden 10-11 november 2009

Attributes of a Trusted Digital Repository (OCLC 2002) Compliance with the Reference Model for an Open Archival Information System (OAIS) Administrative responsibility Organizational viability Financial sustainability Technological and procedural suitability System security Procedural accountability

OAIS modellen

OAIS Information Packages Submission Information Package (SIP): An information package that is delivered by the producer to the OAIS for use in the construction of one or more AIPs Archival Information Package (AIP): An information package consisting of the content information and the associated preservation description information (PDI), which is preserved within an OAIS Dissemination Information Package (DIP): The information package, derived from one or more AIPs, received by the customer in response to a request to the OAIS

Standarder OAIS - Reference Model for an Open Archival Information System (CCSDS/ISO) (2002) METS (Metadata Encoding & Transmission Standard) - Structure for encoding descriptive, administrative, and structural metadata (DLF/LOC) (2004) PREMIS (Preservation Metadata) - A data dictionary and supporting XML schemas for core preservation metadata needed to support the long-term preservation of digital materials (OCLC/LOC) (2005) MIX (NISO Metadata for Images in XML) - XML schema for encoding technical data elements required to manage digital image collections (ANSI/NISO) (2006) TAR (Tape Archive) Filformat för paketering av filer för effektiv lagring på tape och disk. Egna format ADDML(Archival Data Description Markup Language) Norska riksarkivets, och nu även Svenska riksarkivets, XMLformat för beskrivning av levererade filer, i synnerhet flata filer med postbeskrivningar (2001, 2008) RES - Riksarkivets eget filformat för metadata om TIFF-filer. (2003) Skall konverteras till MIX. Under utredning WARC (Web ARChive, ISO 28500) Format för paketering och arkivering av webbsidor (2008) AMD, VMD och AES X098-B Föreslagna scheman för teknisk metadata om audiofiler och videofiler.

OAIS Archival Information Package (AIP) ADDML är ett XML-schema som bland annat kan användas för att registrera postbeskrivningar vilka utgör representation information för flatfiler exporterade från databaser METS är en standard som utarbetats för att beskriva och överföra digitala objekt. METS innehåller bland annat det som i OAIS kallas Packaging Information PREMIS är en standard som utarbetats för att mer i detalj beskriva den information som i OAIS-modellen kallas Preservation Description Information (PDI)

Archives Data Description Markup Language (ADDML) Beskriver levererade filer (i synnerhet flata filer) Aktuell version januari 2009: ADDML 8.2 Teknisk, strukturell och allmänt beskrivande metadata Postbeskrivningar för flata filer Utvecklat av norska Riksarkivet Arkadukt(registrering) & Arkade(testning & konvertering)

OAIS Ingest functions

Kontrollramverk för born-digital information Kontroll rapport nej Skriv Excel fil Konvertera Excel till ADDML Behövs konvertering? ja Konvertera flatfiler och ADDML fil Leveranskontroll Paketering Utämnande förberedelser Ursprunglig ADDML ADDML fil enl std format Ursprungliga flatfiler Normaliserade flatfiler Digitala arkivet Utlämnande databas

Digitalt långtidsbevarande vid Riksarkivet 2009-11-10 Born-digital (IT-avd/Elark) Mindre än 2 TB Över 100000 filer Audio- och videofiler (S-avd/TBM) Över 25 TB (Tillväxt just nu ungefär 1 TB per vecka) Mindre än 10000 filer Multimedia (S-avd/TBM) Mindre än 1 TB Över 100000 filer Skannade bilder (MKC och SVAR) Färdigskannade volymer: 203000 (En skannad volym motsvarar en AIP med TIFF-filer) Bilder totalt: 80.6 miljoner (Varje bild finns i två format. Arkivformat: TIFF. Visningsformat: DjVu) Bilder publicerade på internet: 26.8 miljoner TIFF-filer, total mängd: ca 1300 TB (MKC ca 650 TB, SVAR ca 650 TB) DJVU-filer, total mängd: ca 13 TB

LDB Projektet: Försäkringskassans Submission Information Package

AIP vid Riksarkivet 2009-11-10 METS-fil Innehållande filidentiteter och struktur samt inbäddad PREMIS- och ADDML-metadata <PREMIS> Teknisk metadata, metadata om konverteringar samt inbäddad MIX-metadata för TIFF-filer <ADDML> Metadata om filer levererade från myndigheter samt postbeskrivningar för flatfiler TAR-fil <Datafil> Flatfil, XML-fil eller PDF-fil från myndigheter eller TIFF-fil från egen skanning <Datafil> <Datafil> <Datafil> <Datafil> <Datafil> <Dokumentationsfil> PDF-fil från myndigheten innehållande dokumentation av leveransen <Dokumentationsfil> PDF-fil upprättad av Riksarkivet innehållande information om leveransen

Kontrollramverket (KRAM) skapar en PREMIS-fil som dokumenterar konvertering och kontroller. PREMIS-filen innehåller datafilernas checksummor I PREMIS-filen kan också tjänsteanteckningar i XHTML-format inbäddas För TIFF-filer inbäddas metadata i MIX-format En EXCEL-fil används för att registrera postbeskrivning och annan metadata Skapas av levererande myndighet eller av Statens arkiv Excel-filen konverteras till en ADDML-fil i kontrollramverket AIP vid Riksarkivet 2009-11-10 Efter att kontrollramverket avslutats så uppdateras Arkis2 med information som extraheras ur ADDML-filen och PREMIS-filen. METS-fil PREMIS-metadata (med inbäddad XHTML) TAR-fil Flatfil Flatfil PDF ADDML-metdata PDF-fil med dokumentation skapad av RA Statens Arkivs arkivinformationssystem (Arkis2) innehåller metadata om paket och filer Metadata följer PREMISstandarden. Statens arkivs lagringssystem för digitalt bevarande (ESSArch) Lagringssystemet läser och skriver AIP:er till lagringsmedia (LTO-band och disk). ESSArch uppdaterar Arkis2 med metadata enligt PREMIS. METS-filen lagras även som en BLOB i Arkis2. Datafiler i form av flatfiler exporterade från databaser och eventuellt levererad dokumentation i textformat, XMLformat eller PDF/Aformat PDF-filer med dokumentation skapad av RA kan också paketeras tillsammans med datafiler och metadatafiler när AIP:n skapas AIP:n i form av ett TAR-paket med åtföljande METS-fil långtidslagras i Statens arkivs lagringssystem ESSArch METS-filen skapas av ESSArch-systemet i samband med TAR-paketeringen. Då inbäddas också metadata i PREMIS-format och ADDML-format i METS-filen. METS-filen innehåller TAR-paketets checksumma.

The PREMIS data model

PREMIS implementation

Storage Architecture

ESSArch Archival Storage system utvecklat av ESSolutions (www.essolutions.se) för Riksarkivet. ESSArch är ett back-end system för att hantera archival storage enligt OAIS-modellen. Det finns inget publikt gränssnitt. Systemet är avsett att integreras med ett arkivinformationssystem (Arkis2) eller ett bibliotekssystem. Paketerar, lagrar och återläser AIP:er för långtidsbevarande. Paketerar filer i TAR-format. Genererar metadata om AIP:er enligt METS. METS-filen kan innehålla inbäddad metadata enligt PREMIS, ADDML, MIX och XHTML. En AIP består av en TAR-fil med åtföljande METS-fil. Lagrar AIP:er i en eller flera bitwise-identiska kopior på valfritt lagringsmedia. I dag används LTO-band och disk. Automatisk regelstyrd mediamigrering. I nuvarande version för Riksarkivet sker ingen automatisk formatmigrering. Genererar, kontrollerar och lagrar checksummor. Checksummor sätts både på filnivå och paketnivå. Loggar alla AIP-händelser enligt PREMIS-standarden. Loggar även hantering av lagringsmedia. Lagrar bevarandemetadata i en lokal MySQL-databas modellerad enligt PREMIS 2.0. Den lokala databasen innehåller information om AIP:er, lagringsmedia (band och diskar) samt händelseloggar. Uppdaterar Arkis2 via SQL-anrop. Information om AIP:er, lagringsmedia och händelser skrivs löpande till Arkis2. Fysisk hantering av media (LTO-band, lösa hårddiskar etc) hanteras via ett PC-program (RABAR) som uppdateras via en streckkodsläsare. PC-applikationen kommunicerar med ESSArch via ett webbservice-interface. Leverans, mottagande, placering och uttag av lagringsmedia administreras via streckkodsapplikationen. Regler för lagring på lagringsmedia kan sättas via profiler. En profil kan reglera fyllnadsgrad på band, buffringsgrad på arbetsdisk mm. Baserat på Open Source, Linux, Apache, MySQL och Python.

Paketformat Riksarkivet: METS, PREMIS, ADDML, MIX för AIP CASPAR: XFDU och SAFE för AIP PLANETS: PP2 för AIP PROTAGE: Estniskt schema för SIP