Bilaga 3. En redogörelse kring metadata och XML. Status Slutlig. Sid 1 (7) Dokumenttyp. Versionsdatum

Relevanta dokument
Hantera informationspaket i system för bevarande

ABC till. (FGS) och FGS Paketstruktur. ABC till de. förvaltningsgemensamma. specifikationerna ABC RAFGS3D Kontakta oss

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 3 De förvaltningsgemensamma specifikationernas ABC

Heldag om FGS FGS:er och deras tekniska regelverk. Karin Bredenberg, FGS funktionen. Standarder. FGS:er och deras tekniska regelverk 1

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 1 METS

METADATASTANDARDER EN ORIENTERING

Paketstruktur. Karin Bredenberg /

DP7 Kompletterande information

Dokumenttyp Ordlista Projekt Elektroniskt bevarande, Etapp 2

Anvisningar för ifyllning av Excelark för databaser (xml-filer)

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

Introduktion till. (FGS) FGS Paketstruktur. Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion FGS Paketstruktur

IT-avdelningen. Författare Funktion Telefon Datum Version Sid Karin Bredenberg SoU (10)

Nordisk El-Arkivseminar Island maj Svensk SIP och AIP Mats Berggren, Riksarkivet

En snabb titt på XML LEKTION 6

Informationsmodellering och e-infrastrukturer

Elektroniskt bevarande. Caspar Gielissen Eskilstuna kommun, Stadsarkivet

XML-produkter. -Registret över verkliga huvudmän (RVH) Teknisk handledning för webbtjänst mot RVH (Web Services) Datum: Version: 1.

Förvaltning av FGS:er

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)


Tidformat Tid anges enligt formatet yyyy-mm-ddthh:mm:ss Där plustiden är tidstillägg i förhållande till UTC 2.

ADDML vid Riksarkivet i Sverige

Tillämpningsanvisningar för överlämnande till digital långtidsarkivering

Leveranshandledning. Elektroniskt Bevarande etapp 2 Delprojekt Verksamhetssystem Sambruk 2011 Får spridas enligt CC-BY-3.

XML. Extensible Markup Language

E-pliktleverans via RSS-feeds

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

(reviderad , , ) Riksarkivet IT-avdelningen. Anvisningar för ifyllning av Excelark för webbleveranser

Strukturering med XML och DTD

DP7 FORMELL KONTROLL

Karin Bredenberg Specifikation av olika leveranstyper/aflevereringstyper och leveransprocessen. Karin Bredenberg,

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 2 PREMIS

Delrapport DP3. Metadata och e-tjänster för e-arkiv Förvaltningsgemensamma Specifikationer (eard FGS) FGS för paketstruktur för e-arkiv

Metaspråket XML Mika Suonvieri

Välkommen till Eskil"una

Hur hänger det ihop? För att kunna kommunicera krävs ett protokoll tcp/ip, http, ftp För att veta var man skall skicka

Konstruktion av datorspråk

Introduktion till. (FGS) FGS Personal. Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion FGS Personal

Elektroniskt bevarande Säkra för framtiden. Caspar Gielissen Föreningen Sambruk

KFF Beskrivning av KFF-handläggningsprocessen 1 (10) Gällande Mikael Andersson REGISTERKARTE-GML

Svenska kyrkans bestämmelser

Svensk nationell datatjänst, SND BAS Online

WEBBUTVECKLING Kursplanering

Projekt e-arkiv och e-diarium (eard)

Vad är arkiv? Vem äger och ansvarar för informationen i arkiven?

Avtal/överenskommelse för leverans till K- samsök

Övning (X)HTML 2. Sidan 1 av

FGS:erna i dag och hur får vi dem att bli fler (FGS = Förvaltningsgemensamma specifikationer)

ITK:P2 F1. Hemsidor med HTML HTML. FTP, HTTP, HTML, XML och XHTML

Mittuniversitetet ITM Telefon RSS. Laborationskompendium för syndikering på Internet. Detta exemplar tillhör:

PRAKTIKFALL: Vinnaren av ediamond Award 2014! Data kan flyttas utan att information går förlorad

FR Nedladdning v1.3 - teknisk beskrivning

Föreläsning 4. CSS Stilmallar för webben

Sändning av uppgifter Scheman Makuleringsuppgifter Anläggningsprojekt för ett nationellt inkomstregister

esamhället och arkivet

Språk för webben introduk4on 4ll HTML

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 4. Peter Dalenius Institutionen för datavetenskap

LEVERANSFRAMSTÄLLAN. Version (8)

Metadata i e-pliktleveranser

Examensarbete vid Institutionen för tillämpad IT. Thesis Project at Department of Applied Information Technology

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

Moment 6: E-arkivet och våra verksamhetssystem

E-arkiv, eardoch Pre-pre-ingest

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

Elektroniskt bevarande, etapp 2. Caspar Gielissen, projektledare

RDA i Sverige Katarina Synnermark Olle Johansson RDA-redaktionen

Begrepp för elektroniska arkiv och digitalt bevarande. Översättning av OAIS & Begrepp för arkivenheter i olika standarder

Arkivkrav vid införande av nytt IT-system

ESSArch vid Riksarkivet i Sverige

Guide för Innehållsleverantörer

LEVERANSFRAMSTÄLLAN. Version (8) Datum:

Xhtml och CSS.Tillämpad fysik och elektronik Per Kvarnbrink (redigering Ulf Holmgren 2011)

Förvaltning av FGS:er (Förvaltningsgemensamma specifikationer för e-arkiv och e-diarium) Karin Bredenberg /

Så här läser du ditt sökresultat:

Webbteknik. Innehåll. Historisk återblick Teknisk beskrivning Märkspråk Standardisering Trender. En kort introduktion

Regler för bevarande av elektroniska handlingar vid Mittuniversitetet

Övergången till RDA i Sverige Katarina Synnermark (RDA-redaktionen) Fredrik Klingwall (XL-utveckling)

Hela dokumentet Guide till handlingsalternativ kan hämtas via adressen arkiv

Laboration 2: Xhtml och CSS.

Projekt e-arkiv och e-diarium (eard)

E-plikt och metadata.

Introduktion. Byggstenar TDBA

Förvaltningsgemensamma specifikationer (FGS) Jan Aspenfjäll & Tomas Wallin

E-plikten. Expertgruppen för metadata 20 maj

Introducerande övningar i HTML

Leveranshandledning. Tillhörande Vägledning och funktionella krav

Tillämpningsanvisningar

E-arkiv på SLL landstingsarkivet

Skicka fil till CSN. - Rapportera via fil i Mina tjänster. Skicka fil till CSN komvux och folkhögskolor, v 1.0

Förstudie e-arkiv Begreppslista Begreppslista 1.0

Moment 5: Vad är ett e-arkiv och vad krävs för att införa det i min verksamhet?

Insamlingsverktyg - teknisk beskrivning av metadataformuläret

Inspektion av arkivvården vid Myndigheten för yrkeshögskolan

Flera landsting. ETT gemensamt e-arkiv

Lektion 2 - CSS. CSS - Fortsätt så här

Introduktion till (FGS) Vägledning och förklaring till de förvaltningsgemensamma specifikationerna. Introduktion RAFGS2D

Titel: TAM-Arkiv Arkivhandbok Datum: Version: 1.0. TAM-Arkiv Arkivhandbok

Transkript:

XML 1 (7) XML Bilaga 3

XML 2 (7) Innehållsförteckning 1. BAKGRUND... 3 2. OM METADATA... 3 3. INFORMATIONSPAKET... 3 3.1 PAPPER LÄGGS I ARKIVBOXAR... 4 3.2 INFORMATIONSPAKET I XML FÖR ELEKTRONISKA HANDLINGAR... 4 3.3 INNEHÅLLET I E-ARKIVBOXEN... 4 3.4 BEVARA INFORMATIONEN... 5 3.5 HANTERA INFORMATIONSPAKET I SYSTEM FÖR BEVARANDE... 5 4. XML - GRUNDLÄGGANDE BEGREPP... 5 4.1 XML-DEKLARATION OCH TECKENKODNING... 5 4.2 ELEMENT... 5 4.3 ATTRIBUT... 6 4.4 KOMMENTARER... 6 4.5 VÄLUTFORMAD... 6 4.6 SCHEMA... 6 4.7 VALIDERAD... 7 4.8 XML NAMESPACES... 7

3 (7) 1. Bakgrund et Elektroniskt bevarande, etapp 2 har haft en arbetsgrupp som s tittat påå metadata. Samordnare för gruppen har varit Samuel Lindeborg, Falkenbergs kommun. Delprojektets övriga medlemmar var Elin Jonsson, Växjö, Henrik Erngren,, Malmö, Caspar Almalander, Eskilstuna, Christian Jarnekrantz, Helsingborg, Eva Sjöblom, Rättvik, Gith Matsson, Rättvikk och Håkan Frimodig, Luleå. Ett 10-tal personer, bland annatt från arbetsgruppen, deltog i en XML-kurs inomm ramen för projektet. Karin Bredenberg på Riksarkivet höll i kursen. Elinn Jonsson, Växjö har skrivit en sammanfattning för övriga i projektet. Texten har tidigare publicerats i projektets nyhetsbrev och som nyhet på Sambruks webbplats. Som bilaga till slutrapport för projektet Elektroniskt bevarande Etapp 2, har denn kompletterats bland annat med ett inledande stycke om metadata. 2. Om metadata Metadataa är data som beskriver data, eller information om information. Metadata har olika uppgifter att fylla. Metadataa som tillhör ett vanligt ordbehandlingsdokument är bland annat a författare, titel, kategori, språk och antal sidor. Tack vare metadata kan man på ett enkelt och snabbt sätt sökaa efter visa uppgifter och extra information, till exempel alla dokument från en viss författare. Man kan i exemplet jämföra med en fulltextsökning, som kan ta längre tid, men framförallt ge resultat där d författaren förekommer i andra egenskaper än de som omfattass av den särskilda metadata som rörr författare. Metadataa följer dels med i de objekt som levereras till ett system för bevarande, dels skapas metadata i samband med leverans och fortlöpande administrering av det som levererats. l I det här dokumentet finns ett exempel på hur elektroniska leveranser kan hållas samman medd hjälp av metadata i ettt informationspaket. 3. Informationspaket Ett system för bevarande hanterar olika typer av informationspaket. Informationspaketen håller samman och förklarar samband mellan filer som ska arkiveras. Bilden nedan förklarar kortfattat de olika informationspaketens funktion. Om du inte är bekant med XML sedan tidigare, finns en kortfattad förklaring längre fram i texten. Bilden ovan beskriver funktionerna i ett arkiv. De olika informationspaketen som hanteras beskrivs i pratbubblor. Bilden är ritadd efter OAIS-modellen CCSDS, Model for an Open Archival Information System (OAIS), 2002 http:// /public.ccsds.org/publications/archive/650x0b1.pdf

4 (7) 3.1 Papper läggs i arkivboxar När vi arkiverar handling på papper, sorteras de i en logisk ordning, vanligtvis kronologisk. Sedan läggs de ner i en arkivbox av syrafritt papper och förses med en innehållsförteckning. Boxen märks med en etikett som identifierar innehållet och som s gör att vi kan hitta den via arkivförteckningssystemet. 3.2 Informationspaket i XML för f elektroniska handlingar I ett system för bevarande av elektroniska handlingar hålls de filer som hör till samma objekt som ska arkiveras ihop i informationspaket. Ett sätt att skapa informationspaket är att använda metadatascheman i XML. En standard som s används för detta är METS som förvaltas av Library of Congress. METS är en förkortning somm står för Metadata Encoding and Transmission Standard. E-arkivsamverkansgruppens metadatagrupp ENSAM,, med deltagare från Riksarkivet, Kungliga biblioteket, Stockholms stad, REDA med flera, har tagit fram en särskild METS- i det profil som kallas SWEIP. Förkortningen står för Swedish Informationn Package och är ett förslag till leveranspaket. Inom Sambruks projekt Elektroniskt bevarande är tanken att titta på profilen med utgångspunkt från kommunernas förutsättningar, och möjligheten att a använda denna som e-arkivbox framtidaa systemet för bevarande. 3.3 Innehållet i e-arkivboxen Att just METS är användbar i detta sammanhang är att schemat är skapat för att kunna bädda in eller hänvisa till metadataa av olika slag. Med metadata menas data om data, d det vill säga förklaringar till hur data ska tolkas. I e-arkivboxen kommer att finnas beskrivande metadata enligtt standarder för arkivredovisning i sektionen <dmdsec>. Det vill säga arkivförteckningen. Dessaa data behövs för att kunna söka efter handlingar och förklara sambandet med verksamheten som skapade e dem. I sektionen för administrativ metadata <amdsec> finns bland annat metadata somm behövs förr att hanteraa bevarandeåtgärder, rättigheter och för formatspecifik teknisk metadata. Filernaa som är de som är föremål för bevarande samlas i fil-sektionen <filesec>. Det kan vara uppgifter från databaser i form av strukturerade dokument, enskilda kontorsdokument eller bilder, webbplatser med mera. Hur de olika filerna hör samman och ska struktureras definieras i <structmap>.

5 (7) Bild från Mets Primer <METS> Metadata Enchoding andd Transmission Standard: Primer and Reference Manual (2010) Du kan hämta dokumentet här: http://www.loc.gov/standards/mets/metsprimerrevised.pdf 3.4 Bevara informationen Fokus är att bevara själva informationen, och inte verksamhetssystemen med olika databaser, register, applikationer och gränssnitt. Den information om det ursprungliga systemet s somm behövs för att förstå de elektroniska handlingarna lagrass också som metadata i informationspaketen eller som länkar till särskild dokumentation. 3.5 Hantera informationspaket i system för bevarande Ett system för bevarande hanterar tre olika informationspaket: 1. Leveranspaket med det innehåll ochh den dokumentation somm producenten (verksamheten) och arkivet har kommit överens om ska överlämnas. 2. Arkivinformationspaket med innehåll från ett eller flera leveranspaket tillsammans med kompletterande bevarandeinformation. 3. Paket för attt lämna ut information, som består av innehåll och o dokumentation som särskilt syftar till att kunna tillgängliggöra handlingarna på ettt läsbart sätt. För att kunna öppna e-arkivboxarna och läsa handlingarna eller genomföra olika bevarandeåtgärder behövs självfallet någon slags applikation. Elektroniska handlingar är ä som bekant inte direkt läsbara för människan. Men tanken är att handlingarna ska vara läsbara med standardappls likationer (som till exempel webbläsare) och inte vara beroende av de ursprungliga verksamhetssystemen och tekniska miljöerna. 4. XML - grundläggande begrepp XML, eller extensiblee Markup Language, är ett märkspråk som används för att strukturera och klassificera information. XML används bland annat för att utbyta information mellan olika system. En fördel i arkivsammanhang är att texten tillsammanss med taggarna i filerna är självförklarande och förhållandevis lätt att läsa för en människa. De flesta webbläsaree kan användas för att titta på ett XML-dokume nt. Det går också att använda en vanlig texteditor. Det finns olika XML-editorer som gör att det går att kontrollera om dokumenten är korrekta. För att presentera informationen snyggt kan formatmallar som till exempel CSS (Cascading Style Sheets) användas. Här förklarar vi några av de grundläggande begreppen! 4.1 XML-deklaration och teckenkodning I den allra första raden i ett XML-dokument står det för det första att a det är ett t XML-dokument, därefter vilken version som dokumentet är skrivet i och vilken teckenkodning/teckenuppsättning som används. För att datorn ska kunna visa ett dokument korrekt, behöver den veta vilken v teckenuppsättning som ska användas. Annars kan det bli till exempel fel tecken eller underliga symboler påå skärmen. En XML-deklaration kan se ut så här: UTF-8 står för Unicode Transformations Format åtta-bitars. En delmängd av denn här teckenuppsättningen är ISO-standarden ISO-8859-1 Latin-1/West European character set som vi också kan använda. 4.2 Element Ett XML-dokumeni strukturen kan innehålla andra element och/eller text. Tecknen < > används för att markera vilken text som är elementets namn. Till exempel elementet kommun som beskrivs nedan. Ett snedstreck / i är en textfil med olika element (taggar) som bygger upp strukturen. De olika elementen elementnamnet markerar att elementet är slut. Ett element kan se ut så här:

6 (7) 4.5 Välutformad Ett XML-dokument som följer de grundläggande reglerna säger mann är välutformat (well-formed). 4.6 Schema För att lättare får en enhetlig struktur på dokumenten och för att kontrollera att de är korrekta används olika typer av scheman med regler och begränsningar. Antingen i själva XML- dokumentet eller i ett externt schema (XSD) eller dokumenttypsdefinition (DTD). För scheman som är (eller skulle kunna vara) gemensamma i ett internationellt sammanhang används vanligtvis engelska somm språk för elementen. Det finns en mängd scheman som är standardiserade. Ett exempel är strukturen för METS som används för att paketera olika digitala objekt. Det går också att dokumentera tillägg och förändringar i ett XML-schema som man använder. Elementet i schemat kallas <xs: annotation> >. De här elementen riktar sig till den som skriver eller granska själva schemat. Schemat för en lista med kommuner skulle kunna se ut så här: Det första elementett i dokumentet kallas rotelement och talar om vad v det är dokumentet beskriver. Rotelementets sluttagg måste finnas på sista raden. En lista som radar upp flera kommuner kan se ut så här: 4.3 Attribut Elementen kan också ha attributt som innehåller information som ärr viktig för att bearbeta data. Attributet har ett namn och värdet anges inom i citationstecken ". Ett attribut kan se ut så här: 4.4 Kommentarerr Meddelanden till andra som läser ett XMLdokument skrivs som kommentarer. Att det är en kommentar markeras av tecknett!--. En kommentar kan se ut ungefär så här:

7 (7) Schemat betyder attt kommunlistan kan innehålla hur många kommuner som helst och att elementet kommun innehåller text. Det talar också om att attributet kommunkod är obligatoriskt. Scheman kan förstås vara mycket mer komplicerade och tala om hur siffror ska skrivas, i vilken ordning som s element får förekomma, om man bara får välja begreppp från en fast lista och mycket m mer. För schemaspråket XML schema finns en specifikation som talar om hur olika regler ska uttryckas. 4.7 Validerad Om dokumentet stämmer överens med reglerna i ett schema sägerr man att dett är validerat. Om man använder en XML-editor så kontrollerar programvaran om dokumentet stämmer överens med det schema som man anger. 4.8 XML Namespaces Det finns också namngivningssystem med regler och begränsningarr som specificerar namn, termer och ord. W3C (World Wide Web Consortium) rekommenderar XML namespaces, vilka får ett unikt namn eller URI (uniform resource identifier) som går att hänvisa till i XMLdokumentet. Dett är för att kunna veta vad ett namnn betyder i ett visst sammanhang. Betyder "table" tabell eller bord till exempel. Namnet på den namnrymd som används ska anges i XML-deklarationen. Elementenn som hör till systemet kan ha ett prefix som anger var de hör hemma. Så här kan det se ut med element som är hämtade från METS: I det här sammanhanget är Eskilstuna kommun en av deltagarna (METS agent) ) som är inblandad i att skapa ett informationspaket i METS. Det är en organisation som har rollen arkivarie. mets: före elementets namn talar om vilken namnrymd som namnet hör hemma i.