IT-avdelningen. Författare Funktion Telefon Datum Version Sid Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 1 (10)



Relevanta dokument
Tidformat Tid anges enligt formatet yyyy-mm-ddthh:mm:ss Där plustiden är tidstillägg i förhållande till UTC 2.

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Nordisk El-Arkivseminar Island maj Svensk SIP och AIP Mats Berggren, Riksarkivet

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Paketstruktur. Karin Bredenberg /

DP7 Kompletterande information

Rapport från ENSAM, E-arkivsamverkansgruppens metadatagrupp

Examensarbete vid Institutionen för tillämpad IT. Thesis Project at Department of Applied Information Technology

MODS formatspecifikation för donationer

FGS Paketstruktur. Förvaltningsgemensam specifikation (FGS) för paketstruktur för e-arkiv. Specifikation RAFGS1V1. Kontakta oss

ESSArch vid Riksarkivet i Sverige

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 1 METS

Hantera informationspaket i system för bevarande

Introduktion till. (FGS) FGS Paketstruktur. Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion FGS Paketstruktur


FGS Paketstruktur. Förvaltningsgemensam Specifikation (FGS) för paketstruktur för e-arkiv

Förvaltningsgemensamma specifikationer

METADATASTANDARDER EN ORIENTERING

Standarder vid digitalt bevarande. Karin Bredenberg /

ADDML vid Riksarkivet i Sverige

DP7 FORMELL KONTROLL

Nordisk Arkivakademi Boden november 2009

Skapa informationspaket i Projekt Digidaily Specifikationer

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 2 PREMIS

Innehåll. Översikt/leveranser/och/format/ Översikt/system/KB/ Genomgång/RSS/formatet/ Komma/igång/med/leveranser/ Vanliga/problem

FGS Paketstruktur Tillägg

Heldag om FGS FGS:er och deras tekniska regelverk. Karin Bredenberg, FGS funktionen. Standarder. FGS:er och deras tekniska regelverk 1

FGS Paketstruktur Tillägg

Användarhandledning för RALF

RADAR. Mats Berggren /

Bilaga 3. En redogörelse kring metadata och XML. Status Slutlig. Sid 1 (7) Dokumenttyp. Versionsdatum

Bibliografiska metadata i MODS enligt FGS-PUBL vid leveranser av elektroniska dokument till Kungliga biblioteket

Karin Bredenberg Specifikation av olika leveranstyper/aflevereringstyper och leveransprocessen. Karin Bredenberg,

eard Projektet Karin Bredenberg /

E-pliktleverans via RSS-feeds

Bibliografiska metadata i MODS enligt FGS-PUBL vid leveranser av elektroniska dokument till Kungliga biblioteket

Förvaltning av FGS:er

Projekt E-ARK stöd vid digital arkivering. Björn ES Solutions


Tillämpningsanvisningar

EAD-EXPORT TILL ARKIS

Beskrivning av XML-schema för personalliggare

Insamlingsverktyg - teknisk beskrivning av metadataformuläret

Anvisningar för ifyllning av Excelark för databaser (xml-filer)

Metadata för digitalisering av dagstidningar i Projekt Digidaily 2 (DD2). Specifikationer

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

Förvaltningsgemensamma specifikationer (FGS) Jan Aspenfjäll & Tomas Wallin

Testplattformen (Webbarkivering)

Metadata i e-pliktleveranser

INTERNATIONELL UTBLICK HUR MÄRKER VI AV ARBETET MED STANDARDER?

Designdokument för eard SIP-Generator

Introduktion till metadata i leveranser av elektroniska dokument till KB

Aktivitetsrapport från Aktivitet 3 Digitala Leveranser

Heldag om FGS Att ta fram en FGS. Jan Aspenfjäll. FGS projekt

Myndighetsträff om e- plikten - fokus på teknik

Capture Pro Software arbetsflöde: OCR-indexering och dokumentseparation med patchkod

Geodataportalen - Metadata -Webbformulär för redigering av metadata

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 3 De förvaltningsgemensamma specifikationernas ABC

Vad är Förvaltningsgemensamma specifikationer (FGS)?

PRAKTIKFALL: Vinnaren av ediamond Award 2014! Data kan flyttas utan att information går förlorad

Enkätsammanställning DP7

Anvisningar för ifyllning av Excelark för databaser (sekventiella textfiler)

» RSS - Bygg din egen RSS!

BEAst rekommendation för hantering av bilagor till elektroniska fakturor

E-plikt och metadata.

Pass 4: Metadatastandarder

Laboration 3 HTML och struktur samt frågorna A - C övningar/uppgifter

E-plikt. Kungliga biblioteket, Stockholm. Foto: Jens Östman #FAI2016

GENERELL Informationsmodell för Bild och Funktionsregistret (BFR)

När: Fredag 18:e november :15 Vem: Peter Fredin & Daniel Jansson Var: Libris användargrupp katalogisering

E-arkiv på SLL landstingsarkivet

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

Elektroniskt bevarande. Caspar Gielissen Eskilstuna kommun, Stadsarkivet

Geodataportalen - Metadata - Dokumentation av tjänster

Konverteringsprojekt P47

Dokumenttyp Ordlista Projekt Elektroniskt bevarande, Etapp 2

IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA

Vad är XLink. XLink/XPointer/XSLT-FO. Namespace. Simple Links

Bilaga 1 Prelimina r Fö ra ndringar i fi2base

ABC till. (FGS) och FGS Paketstruktur. ABC till de. förvaltningsgemensamma. specifikationerna ABC RAFGS3D Kontakta oss

Digital inlämning av årsredovisning

Introduktion till. (FGS) FGS Personal. Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion FGS Personal

Mappningen gjordes med utgångspunkt i XML-SIE 1.0 med verktyget Altova XML Spy. SIE-gruppen förvaltar inte längre XML-SIE 1.0.

för att uppdatera dina produkter dagligen på LeGuide.com Groups webbplatser

Förvaltningsgemensamma specifikationer (FGS)

Anvisningar för ifyllning av Excelark för databaser (sekventiella textfiler)

Lägga in och publicera rapporter i rapportserien

Digital inlämning av årsredovisning

Användarhandledning pcskog Bmwin 2011

Teknisk guide för brevlådeoperatörer

Quick Guide till Mahara och din Portfolio

Schematransformation SLU

Dragningssystemet. Filbeskrivning för osigillerad resultatfil från premieobligationsdragning. Version 1.2

ALEPH ver. 18 ALEPH Digital Asset Module (ADAM)

Specifikation för metadata i e-pliktleveranser på fysisk bärare till Kungliga biblioteket

Import från Excel 3L Pro Import från Excel. Copyright VITEC FASTIGHETSSYSTEM AB

Tillämpningsanvisningar

Workshopmallar The e C ap a it i al a l o f S c S a c n a din i av a ia

Paketering i METS: Metadata för digitaliserade dagstidningar

Transkript:

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 1 (10) Att använda METS för AIP För långtidsbevarande krävs det metadata som beskriver de bevarade paketen (AIP) och vi har valt att använda METS för detta. Denna metadatafil kommer att skapas av ESSArch-systemet. Att använda METS som leveranssedel för ankommande SIP beskrivs i Att använda METS för SIP. När man använder METS så skapar man i ett XML-dokument en profil som beskriver det sätt som man valt att använda METS på. Man kan i profilen även ha med de värdelistor som man avser att använda i vissa element. I detta dokument beskrivs inte hur profilen enligt ovan används eller ser ut utan hur XMLdokumentet som används ser ut. När det hänvisas till ett Fast värde respektive Enligt ordlista i profilen är det ett värde som beskrivs i profilen. För att förtydliga detta kommer det att tas fram en METS-profil och ett anpassat schema som gör att våra restrektioner går att validera. Vid uppdateringar När man gör uppdateringar och konverteringar av de i paketet ingående filerna kommer det att skapas en ny batch dettta innebär att en ny METS kommer att skapas för det nya paketet. Om man i denna nya METS ska hänvisa till den gamla är något som man får besluta längre fram. Hur profilen för ett uppdaterat paket ska se ut får utredas vid samma tillfälle. Ordlistor För alla element och attribut där det ska användas en speciell namngivning kommer det i profilen att finnas ordlistor. Dessa ordlistor kan vid behov komma att utökas med fler termer. Ordlistorna bör sparas i separata XML-filer som sparas förslagsvis på http://xml.ra.se/vocabulary. Man hänvisar sedan till dessa ordlistor i profilen. Namngivning av filer Vid internanvändning finns det redan filnamns konventioner för de filer som ska ingå i paketet och rekommendationen är att fortsätta använda dessa. Konventionen är att filer namnges enligt BatchID + _Typ.filextension. Undantaget är själva batchfilen där vi fortsätter med namnkonventionen BatchID +.filextension Namespace I METS-dokumentet används alltid ett namespace-prefix för att underlätta möjligheten att se till vilket metadata elementet tillhör. Detta medför att i samtliga METS-dokument listas de fastslagna metadatascheman som används. Dessa kan komma att utökas. Listningen kommer att utföras i en ordlista se punkten Ordlistor. För tillfället används följande:

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 2 (10) xmlns:premis=http://xml.ra.se/premis, xmlns:mix=http://xml.ra.se/mix, xmlns:addml="http://xml.ra.se/addml" Tidformat Tid anges enligt formatet yyyy-mm-ddthh:mm:ss+01:00 1. Där plustiden är tidstillägg i förhållande till UTC 2. Genomgång av strukturen för ett METS-dokument. Mets-elementet Används till information om själva METS-filen. <mets:mets xmlns="http://xml.ra.se/mets/" xmlns:xlink= http://www.w3.org/1999/xlink " xmlns:xsi=http://www.w3.org/2001/xmlschema-instance xmlns:premis="http://xml.ra.se/premis" xmlns:mix="http://xml.ra.se/mix" xmlns:addml="http://xml.ra.se/addml" xsi:schemalocation="http://xml.ra.se/mets/ http://xml.ra.se/mets.xsd" PROFILE="http://xml.ra.se/mets/SWERA003.xml" ID=" Q0000001_METS.xml" OBJID="Q0000001" LABEL="Intern bildbatch lagring" TYPE="AIP"> mets Attribut PROFILE ID OBJID LABEL TYPE Betydelse Vilken av RA s profiler som man använt Namnet på Mets-filen BatchID En beskrivande titel metshdr-elementet Används till information om leverantören. <mets:metshdr CREATEDATE="2007-03-19T09:45:00+01:00"> 1 http://www.w3.org/tr/xmlschema-2/#datetime http://www.w3.org/tr/note-datetime 2 http://sv.wikipedia.org/wiki/utc

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 3 (10) <mets:agent ROLE="OTHER" OTHERROLE= STORAGESYSTEM TYPE="OTHER" OTHERTYPE= AUTOMATICCREATION > <mets:name>användarid från ARKIS2</mets:name> </mets:agent> </mets:metshdr> metshdr CREATEDATE Agent/role Agent/otherrole Agent/type Agent/othertype Agent/name Datum när filen skapades Fast värde OTHER. Enligt ordlista i METS. Fast värde OTHER. Enligt ordlista i METS. AnvändarID från ARKIS2 på skapande konto amdsec-elementet Används till information om metadata som krävs för bevarandet. Det kommer att finnas olika typer av det tekniska metadatat. För tillfället används formaten ADDML-fil (teknisk metadata om poststrukturerade textfiler) samt PREMIS 3 (teknisk metadata för bevarande). För Tiff-bilder används standarden Mix och denna information inkorporeras i PREMIS-filen. Det finns även andra standarder och format som kan komma att användas t.ex. MODS för MARC21-information. På kort sikt kommer det tekniska metadatat internt bestå av PREMIS- och ADDML-filer. Dessa refereras från eller inbäddas i en METSfil som sparas tillsammans med TAR-paketet. I normal fallet kommer det tekniska metadatat att inbäddas i METS-filen. Men, det kommer att finnas tillfällen där stora filer 4 gör att METSfilen blir ohanterbara med avseende på transformationer och lagring kommer informationen att sparas i egna filer och refereras i METS-filen. För inbäddad information <mets:amdsec ID="amdSec001"> <mets:techmd ID="techMD001"> <mets:mdwrap MDTYPE="OTHER" OTHERMDTYPE="ADDML"> <mets:xmldata> <addml:addml xmlns="http://xml.ra.se/addml" xsi:schemalocation="http://xml.ra.se/addml http://xml.ra.se/addml/ra_addml.xsd"> </addml:addml> </mets:xmldata> 3 Preservation Metadata: Implementation Strategies, http://www.loc.gov/standards/premis/ 4 Storlek kommer att definieras längre fram.

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 4 (10) </mets:mdwrap> </mets:techmd> <mets:techmd ID="techMD002"> <mets:digiprovmd ID="digiprovMD001"> <mets:mdwrap MDTYPE="PREMIS" OTHERMDTYPE=""> <mets:xmldata> <premis:object xsi:type="file" xsi:schemalocation="http://xml.ra.se/premis http://xml.ra.se/premis/ra_premis.xsd"> <premis:objectcharacteristicsextension> <mix:mix xmlns:mix="http://xml.ra.se/mix" xsi:schemalocation="http://xml.ra.se/mix http://xml.ra.se/mix/ra_mix.xsd"> <mix:basicdigitalobjectinformation> </mix:mix> </premis:object> </mets:xmldata> </mets:mdwrap> </mets:digiprovmd> <mets:digiprovmd ID="digiprovMD002"> </mets:amdsec> För stora filer <mets:amdsec ID="amdSec001"> <mets:techmd ID="techMD001"> <mets:mdref ID= BatchId_ADDML.xml MIMETYPE="text/xml" LOCTYPE="URL" MDTYPE="OTHER" OTHERMDTYPE= ADDML CREATED="2006-06-12T12:45:00+01:00" SIZE="1542" xlink:type="simple" xlink:href="file:batchid_addml.xml"/> </mets:techmd> <mets:techmd ID="techMD002"> <mets:digiprovmd ID="digiprovMD001"> <mets:mdref ID= Q0000001_PREMIS.xml MIMETYPE="text/xml" LOCTYPE="URL"

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 5 (10) MDTYPE="PREMIS" xlink:type="simple" CREATED="2006-06-12T12:45:00+01:00" SIZE="1542" xlink:href="file: Q0000001_PREMIS.xml"/> </mets:digiprovmd> <mets:digiprovmd ID="digiprovMD002"> </mets:amdsec> amdsec ID techmd/id digiprovmd/id amdsec-inbäddad tekniskt metadata mdwrap/mdtype mdwrap/othermdtype Fast värde amdsec001 Används för teknisk metadata. Fast värde techmd följt av tre siffrigt löpnummer Används för PREMIS metadata. Fast värde digiprovmd följt av tre siffrigt löpnummer Om det är en PREMIS-fil PREMIS, om det är ADDML OTHER. Är det andra typer av standarder och format följs rekommendationen från METS amdsec-pekare till stor fil för tekniskt metadata mdref/id Filnamnet mdref/mimetype Värde enligt filens mimetype mdref/loctype Fast värde URL mdref/mdtype Om det är en PREMIS-fil PREMIS, om det är ADDML OTHER. Är det andra typer av standarder och format följs rekommendationen från METS mdref/othermdtype mdref/size Storlek på filen i byte mdref/created Filens skapad datum på formen yyyy-mmddthh:mm:ss mdref/ xlink:type Fast värde simple mdref/ xlink:href file: följt av filnamnet för metadata-filen filesec-elementet Används till att beskriva alla filer som ingår i paketet. De filer som har pekare i amdsecelementet räknas inte upp här. Vi har valt att använda två filegrp-element, det första för att beskriva den packade filen, det andra för att beskriva de i paketet ingående filerna. Det finns

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 6 (10) möjlighet i file-elementet att ha med en checksumma och typen på checksumman om man så önskar, på den packade tar-filen ska dessa vara med. <mets:filesec> <mets:filegrp ID="fgrp001" USE="PACKAGES"> <mets:file ID="Q0000001.tar" MIMETYPE="application/x-tar" SIZE="250000000" CREATED="2007-03-19T12:45:00+01:00" USE="PACKAGE" ADMID="techMD001" CHECKSUM="d41d8cd98f00b204e9800998ecf8427e" CHECKSUMTYPE="MD5"> <FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="file:q0000001.tar"/> </mets:file> </mets:filegrp> <mets:filegrp ID="fgrp002" USE="FILES"> <mets:file ID="001.tif" MIMETYPE="text/xml" SIZE="4" CREATED="2007-03-19T13:30:00+01:00" USE="RA Image" ADMID="techMD001, digiprovmd001"> <FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="file:001.tif"/> </mets:file> <mets:file ID="002.tif" MIMETYPE="text/xml" SIZE="254" CREATED="2007-03-19T13:30:40+01:00" USE=" RA Datafile" ADMID="techMD001, digiprovmd001"> <mets:flocat LOCTYPE="URL" xlink:type="simple" xlink:href="file:002.tif"/> </mets:file> <mets:file ID="003.tif" MIMETYPE="text/xml" SIZE="98514" CREATED="2007-03-19T13:30:50+01:00" USE=" RA Datafile" ADMID="techMD001, digiprovmd001"> <mets:flocat LOCTYPE="URL" xlink:type="simple" xlink:href="file:003.tif"/> </mets:file> </mets:filesec> filesec filegrp/id (nr 1) filegrp/use (nr 1) Fast värde fgrp001 Fast värde PACKAGES. Enligt ordlista i

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 7 (10) filegrp/id (nr 2) filegrp/use (nr 2) file/id file/mimetyp file/size file/created file/use file/checksum file/checksumtype file/admid FLocat/LOCTYPE FLocat/ xlink:type FLocat/ xlink:href profilen. Fast värde fgrp002 Fast värde FILES. Filnamnet Mimetyp enligt filens mimetype (http://www.webmaster-toolkit.com/mimetypes.shtml ) Storlek på filen i byte Filens skapad datum på formen yyyy-mmddthh:mm:ss Används endast för TAR-filen. Checksumman för den paketerade filen. Används endast för TAR-filen. Typen av checksumma enligt fördefinierade värden i METS. Hänvisning till ID för techmd/digiprovmd som har rätt information för filen. Fast värde URL Fast värde simple File: följt av filnamnet structmap-elementet Är det enda obligatoriska elementet som finns i METS. Används för att beskriva strukturen i paketet. Vi har valt att använda den till att strukturera filerna i tydliga grupper. Exempel 1 (Tekniskt metadata i egna filer) <mets:structmap> <mets:div LABEL="Package" ADMID="techMD001 digiprovmd001"> FILEID="fileQ0000001.tar"/> <mets:div LABEL="Content description"> <fptr FILEID="fileQ0000001_ADDML.xml"/> <fptr FILEID="fileQ0000001_PREMIS.xml"/> <mets:div LABEL="Datafiles" ADMID="techMD001 digiprovmd001"> FILEID="fileERMS_F_20060620T120000765.xml"/> FILEID="file2002-0000003511-003.tif"/> FILEID="file2002-0000003513-003.mp3"/> FILEID="file2002-0000003512-004.mpg"/> FILEID="file2002-0000003513-002.txt"/> <mets:div LABEL="Information" ADMID="techMD001 digiprovmd001">

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 8 (10) FILEID="fileArchival_description_20060620T120000890.xml"/> <mets:div LABEL="RA Information" ADMID="techMD001 digiprovmd001"> FILEID="file2002-0000003514-005.pdf"/> </mets:structmap> Exempel 2 (Tekniskt metadata finns inbäddat, flatfilsleverans) <mets:structmap> <mets:div LABEL="Package" ADMID="techMD001 digiprovmd001"> FILEID="fileQ0004477.tar"/> <mets:div LABEL="Content description" ADMID="techMD001 digiprovmd001"/> <mets:div LABEL="Datafiles" ADMID="techMD001 digiprovmd001"> FILEID="fileKBSR.L01.D790930.A.10"/> FILEID="fileKBSR.L01.D790930.A.10.REPETERANDE_G"/> FILEID="fileKBSR.L01.D790930.A.12"/> FILEID="fileKBSR.L01.D790930.A.12.REPETERANDE_G"/> FILEID="fileKBSR.L01.D790930.A.14"/> FILEID="fileKBSR.L01.D790930.A.14.REPETERANDE_G"/> FILEID="fileKBSR.L01.D790930.A.16"/> FILEID="fileKBSR.L01.D790930.A.16.REPETERANDE_G"/> FILEID="fileKBSR.L01.D790930.A.18"/> FILEID="fileKBSR.L01.D790930.A.18.REPETERANDE_G"/> FILEID="fileKBSR.L01.D790930.A.17"/> FILEID="fileKBSR.L01.D790930.A.17.REPETERANDE_G"/> <mets:div LABEL="RA Information" ADMID="techMD001 digiprovmd001"> FILEID="file2002-0000003514-005.pdf"/> </mets:structmap> Exempel 3 (Tekniskt metadata finns inbäddat, bildbatch)

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 9 (10) <mets:structmap> <mets:div LABEL="Package" ADMID="digiprovMD001"> FILEID="file00067990.tar"/> <mets:div LABEL="Content description" ADMID="digiprovMD001"/> <mets:div LABEL="Datafiles" ADMID="digiprovMD001"> FILEID="file00000001.tif"/> </mets:structmap> structmap div nr 1 div nr 2 div nr 3 div nr 4 Huvud div Fast värde PACKAGE. Enligt ordlista i profilen. Hänvisning till alla ADMID som finns i admsec ID på den packade filen. Fast värde Content description. Enligt ordlista i profilen. Hänvisning till alla ID på filer som är beskrivande information. Alltså alla EAC, EAD samt tekniska metadatfiler (PREMIS, ADDML osv.) I de fall det endast finns PREMIS och ADDML information och denna är inbäddad i METS-filen kommer inte någon fptr att användas. Fast värde Datafiles. Enligt ordlista i profilen. För material som kommer med vid leveransen. Hänvisning till alla ID på filer som är någon typ av datafil. Fast värde Manuals Enligt ordlista i profilen. Hänvisning till alla ID på filer som är någon typ av manual. Hänvisning till alla ID på filer som är

Karin Bredenberg SoU 010-476 71 23 2009-07-13 1.5 10 (10) div nr 5 div nr 6 div nr 7 div nr 8 beskrivande och ej kan klassificeras på något annat sätt. Fast värde Information Hänvisning till alla ID på filer som är beskrivande och ej kan klassificeras på något annat sätt. Fast värde RA Manuals Enligt ordlista i profilen. För material som skapas av RA. Hänvisning till alla ID på filer som är någon typ av manual som RA lägger till i paketet Fast värde RA Information. Enligt ordlista i profilen. Hänvisning till alla ID på filer som är beskrivande och ej kan klassificeras på något annat sätt. Exempelvis PDF-fil eller XML-fil med information om RA:s hantering/kontroll av leveransen. Fast värde RA Datafiles. Enligt ordlista i profilen. För material som skapas av RA. Hänvisning till alla ID på filer som är någon typ av datafil som är skapad av RA. Till exempel de bilder som scannas.