Standarder vid digitalt bevarande Karin Bredenberg / 10 11-2009
XML som teknik extensible Markup Language, XML, är ett universellt och utbyggbart märkspråk och en förenklad efterträdare till SGML. XML blev en W3C-rekommendation 10 februari 1998. XMLrekommendationen beskriver både strukturen på XML, men också vad som krävs av en XML-tolk. Bland annat XHTML, XSL och SMIL, är baserade på XML. XML-koden kan inte definiera vilka element eller attribut som kan användas. Denna definition görs av en dokumentmall som antingen är intern eller länkas in i dokumentet. Syftet med XML är att kunna utväxla data mellan olika informationssystem. Detta görs genom att skicka data som ren text; text som även kan förstås av människor. Den 4 februari 2004 blev den senaste specifikationen av XML, XML 1.1, en W3C-rekommendation.
OAIS-modellen http://public.ccsds.org/publications/archive/650x0b1.pdf Populär version av OAIS förklaring enligt Richard Pearce-Moses
Paket SIP (Submission Information Package) - Inkommande paket AIP (Archival Information Package) - Lagrings paket DIP (Dissemination Information Package) - Utlämnings paket
Motor Arkivinformationssystem Arkis2
Standarder för paket METS Didl XFDU
METS Metadata Encoding and Transmission Standard Används för paketering av alla typer av digitala objekt http://www.loc.gov/standards/mets/ http://www.loc.gov/standards/mets/metsoverview.html
Didl Digital Item Declaration Language Används framför allt till paketering av filer av typen MPEG-21 http://xml.coverpages.org/mpeg21-didl.html http://www.chiariglione.org/mpeg/standards/mpeg- 21/mpeg-21.htm
XFDU XML Formatted Data Unit Liknar METS NASA http://sindbad.gsfc.nasa.gov/xfdu/index.html
METS Profiler Ordlistor Anpassa eget schema för validering
METS filesec Struktur för METS file inventory dmdsec admsec behaviorsec descriptive metadata administrative metadata behaviour metadata structmap structural map
METS (LDB Projektet: Försäkringskassans Submission Information Package)
Profil http://www.loc.gov/standards/mets/profiles/00000001.xml
METS exempel 1 (2)
METS exempel 2 (2)
Standarder för arkivinformation För datautbyte finns inom arkivvärlden framför allt två de facto standarder, EAC och EAD. För datautbyte där informationen gäller själva arkivinstutionen finns EAG Genom att använda en standard är det lätt att utbyta information mellan olika system Dessa tre standarder är XML baserade
Kommande Processer (Funktioner och aktiviteter). EAC-F
EAC (EAC-CPF) Encoded Archival Context Handlar om arkivbildare Allmän standard ISAAR(CPF) http://www.ica.org/sites/default/files/isaar2en.pdf EAC WG http://eac.staatsbibliothek-berlin.de/ Ny version ute för kommentarer (15 november), nytt schema före årsskiftet
EAC Exempel EAC-CPF exempel se http://eac.staatsbibliothek-berlin.de/
EAD Encoded Archival Description Handlar om arkiv Allmän standard ISAD(G) http://www.ica.org/sites/default/files/isad_g_2e.pdf EAD WG http://www.loc.gov/ead/ Revision på gång
EAD Exempel OBS! Hårt redigerat exempel
EAG Encoded Archival Guide Handlar om arkivinstutionen Allmän standard ISDIAH http://www.ica.org/sites/default/files/isdiah%20eng_0.pdf http://censoarchivos.mcu.es/censoguia/proyecto.htm
EAG Exempel För ett exempel se i standarden sid 55
EAC-F Encoded Archival Context Functions Handlar om processer (Funktioner och aktiviteter) Allmän standard ISDF http://www.ica.org/sites/default/files/isdf%20eng.pdf EAC WG http://eac.staatsbibliothek-berlin.de/ Utbytesformat ännu inte klart
Standarder för bevarande metadata Finns inte många alternativ PREMIS
PREMIS 1(2) Preservation Metadata: Implementation Strategies Data Dictionary - Omfattande information om vad som krävs för att underlätta digitalt bevarande Guider och rekommendationer för skapande, användande samt underhåll - Baserad på en stor grupp med erfarenhet från olika instutioner i att sätta upp och ha hantera digitalt bevarande Version 2 kom mars 2008 XML-scheman http://www.loc.gov/standards/premis/ http://www.loc.gov/standards/premis/v2/premis-2-0.pdf
PREMIS 2(2) Att tänka på Är en modell för hur man ska organisera/tänka på bevarande metadata Är ingen färdig lösning man måste ta fram sin egen implementation
PREMIS exempel http://www.loc.gov/standards/premis/louis-2-0.xml
Standarder för ärendehanteringsinformation Finns flera stycken Exempel: NOARK, ERMS, MoReq
NOARK5 Norska Riksarkiv Utbytesformat i XML http://www.arkivverket.no/arkivverket/lover/elarkiv/noark -5.html
Brittiska Riksarkivet (TNA) Utbytesformat i XML Version 2 ERMS för e-förvaltning i G.B. ERMS Metadata Standard är del 2 av Requirements for Electronic Records Management Systems http://www.nationalarchives.gov.uk/electronicrecords/?source=ddmenu_services2 http://www.govtalk.gov.uk/schemasstandards/schemalibrary_schema.asp?schem aid=219
MoReq2 Model Requirements Specification for the Management of Electronic Records Framtaget inom DLM-forum Utbytesformat i XML http://www.dlmforum.eu/ http://www.moreq.info Scheman kommer att uppdateras i ett interoperability - projekt
Standarder för databasinformation ADDML SIARD
ADDML Archives Data Description Markup Language För att beskriva flata filer, databas uttag Teknisk, struktur och generell beskrivande metadata Utvecklat av Norska Riksarkivet nu ett samarbete Norge och Sverige
ADDML exempel http://xml.ra.se/mets/swera003_appendix2_090713.xml (Ganska långt upp)
SIARD Software Independent Archiving of Relational Databases Skapar ett arkivpaket av ett databasuttag Schweiziska Riksarkivet Används av PLANETS http://www.bar.admin.ch/themen/00772/00811/index.html?lang=en
Standarder för stillbilder Finns inte många alternativ MIX
MIX Metadata for Images in XML Beskriver tiff-headern http://www.loc.gov/standards/mix/
MIX exempel http://www.loc.gov/standards/mix/instances/test_mix10.xml
Standarder för audio/video Finns inget färdigt Kommande: AES-X098B och AES-X098C Florerar: AMD och VMD
AES-X098B och AES-X098C Audio Engineering Society 98B hanterar audio Kommer att leverera ett schema 98C kommer när 98B har satt sig
AMD och VMD Finns hos LC Används på några få platser Enkla scheman Ej officiella
Är det alla??? Nej, det finns fler som kan användas! TextMD (Technical Metadata for Text) TEI (Text Encoding Initiative) MODS (Metadata Object Description Standard) DC (Dublin Core) Och garanterat några till. Vad använder vi?
På svenska Riksarkivet används följande standarder
Standard för paket METS Hur - Olika användande beroende på var i OAIS-modellen - Olika användande beroende på intern/extern - Olika profiler (1 för varje användningssätt) Information - http://xml.ra.se/mets
Standard för arkivbildare/auktoriteter EAC beta Hur - Striktare version - Används i första hand för leveranser till NAD Information - http://xml.ra.se/eac
Standard för arkiv EAD Hur - Striktare version - Används i första hand för leveranser till Arkis - Leveransformat till APEnet Information - http://xml.ra.se/ead
Standard för bevarande metadata PREMIS Hur - Striktare version - Skapas just nu för interna AIP Information - http://xml.ra.se/premis
Standard för databasinformation ADDML Hur - Striktare version Information - http://xml.ra.se/addml
Standard för stillbilder MIX Hur - Transformering från det interna formatet RES Information - http://xml.ra.se/mix
Vad är på gång??? Utan prioritetsordning: MoReq2?? (XML-schemana för långtidsbevarande) EAC-F EAC-CPF anpassning Audio/Video Dessa behöver utvärderas och vid antagande anpassas till striktare versioner.