Filformat och långtidslagring Magnus Wåhlberg 051102. Filformat och Långtidslagring



Relevanta dokument
Paketstruktur. Karin Bredenberg /

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR

METADATASTANDARDER EN ORIENTERING

ATT FRAMSTÄLLA OCH LAGRA ELEKTRONISKA HANDLINGAR. en handledning för myndigheter i Västra Götalandsregionen och Göteborgs Stad

Metadata och datastrukturer för långtidslagring


RADAR. Mats Berggren /

Digital arkivering och historiklagring Anastasia Pettersson och Anders Kölevik

Svenska kyrkans bestämmelser

Hantera informationspaket i system för bevarande

Standarder vid digitalt bevarande. Karin Bredenberg /

Tillämpningsanvisningar för överlämnande till digital långtidsarkivering

Råd för hantering av elektroniska handlingar vid Lunds universitet. Datum Författare Version Anne Lamér 1.0

Från dokumenthanteringssystem till e-arkiv Anastasia Pettersson Per Carlsson

ADDML vid Riksarkivet i Sverige

Test av programvara Författare Avd Telefon Datum Version Sid Göran Lindqvist (14) LDB-centrum. Test av programvara

INTERNATIONELL UTBLICK HUR MÄRKER VI AV ARBETET MED STANDARDER?

Digital arkivering för vanliga användare

ITK:P2 F1. Hemsidor med HTML HTML. FTP, HTTP, HTML, XML och XHTML

Projekt E-ARK stöd vid digital arkivering. Björn ES Solutions

Elektronisk informationshantering IQPC PDF/A standarden Use case WSP Sverige

Titel: Rekommendation Format för långtidslagring Datum: Version 1.0 TAM 5:2010 REKOMMENDATION. Format för långtidslagring. Version 1.

Öppna standarder. Programvaror och tjänster 2014

LEVERANSFRAMSTÄLLAN. Version (8) Datum:

LEVERANSFRAMSTÄLLAN. Version (8)

Begrepp för elektroniska arkiv och digitalt bevarande. Översättning av OAIS & Begrepp för arkivenheter i olika standarder

En kort introduktion till EAD. av Magnus Wåhlberg vid RFV/avd. för verksamhetsstöd/dokumentenheten

Chaos desktop viewer manual

Från dokumenthanteringssystem till e-arkiv Anastasia Pettersson Per Carlsson

Nordisk El-Arkivseminar Island maj Svensk SIP och AIP Mats Berggren, Riksarkivet

Exportera karta juni 2010

De olika exportmetoderna för rasterfiler inne i ArcMap är BMP, TIFF, GIF och PNG.

Bilder... Dagens föreläsning. Objektgrafik. Objektgrafik. TNMK30, 2010 Föreläsning

Elektroniskt bevarande. Caspar Gielissen Eskilstuna kommun, Stadsarkivet

Rekommendationer för tekniskt format i samband med e-pliktleveranser via nätverk


Arkivkrav vid införande av nytt IT-system

ESSArch vid Riksarkivet i Sverige

Digisams frågeschema för arbetet med myndighets/ institutionsvisa planer

Digisams frågeschema för arbetet med myndighets/ institutionsvisa planer

Dagens agenda. Lagring & berarbetning av data. Filer och filformat Metadata Komprimering Kryptering Olika typer av data Filsystem Databaser

Vektorbilder. En guide till god hantering

Riksarkivets författningssamling

Nordisk Arkivakademi Boden november 2009

TAM 4:2010 REKOMMENDATION. Arkivfunktionalitet för IT-system. Version 1.0

(reviderad , , ) Riksarkivet IT-avdelningen. Anvisningar för ifyllning av Excelark för webbleveranser

Vad är MoReq1? Falk Sundsvall 2006

Godkända format för leverans av digitala filer till Landstingsarkivet

Val av format för elektroniska handlingar - ArkivE. Nora Liljeholm / Riksarkivet /

Vektorbilder: En guide till god hantering

Testplattformen (Webbarkivering)

Elektroniskt bevarande Säkra för framtiden. Caspar Gielissen Föreningen Sambruk

Digital arkivering. Börje Justrell/

Affina avbildningar och vektorgrafik

Titel: TAM-Arkiv Arkivhandbok Datum: Version: 1.0. TAM-Arkiv Arkivhandbok

Filformat och lagring

Dokumenttyp Ordlista Projekt Elektroniskt bevarande, Etapp 2

Riktlinjer för digital slutarkivering

Karin Bredenberg Specifikation av olika leveranstyper/aflevereringstyper och leveransprocessen. Karin Bredenberg,

Bilaga 3. En redogörelse kring metadata och XML. Status Slutlig. Sid 1 (7) Dokumenttyp. Versionsdatum

archive En produkt från ida infront - a part of Addnode

Strukturering med XML och DTD

Pixelgrafik. Utdrag ur Adobe Photoshops handbok. Om bitmappsbilder (pixelbilder) Om vektorgrafik (kallas ibland objektgrafik)

En introduktion till långtidsbevarande av digital information

Nya webbtjänster med XML

HÖGSKOLAN I BORÅS Gemensamma Förvaltningen Version 1.0 Högskolekansliet Åsa Enmyren, arkivarie ARKIVHANDBOK. - För institutionspersonal

Europeiska unionens officiella tidning

Den ultimata utgåvan av alternativet till AdobeTM ALLT SAMLAT PÅ EN DVD-R

IT ur arkivperspektiv

Bilduppladdning i Järnvägshistoriskt forum (gäller MS Windows för PC)

Heldag om FGS FGS:er och deras tekniska regelverk. Karin Bredenberg, FGS funktionen. Standarder. FGS:er och deras tekniska regelverk 1

4/2013. PDF/A - det rekommenderade formatet för att information skall kunna läsas och återskapas i en framtid.

INT 3 F4. Bildkomprimering. Run Length Encoding. Medieteknik Del2. Komprimering, ljud och rörliga bilder. Olika algoritmer för bildkomprimering:

Digital inlämning av årsredovisning

BESKRIVNING AV REGISTRERINGSDATA. Nordiska arkivdagar Kenneth Ahlfors

Några kartor över medieteknikområdet. Leif Handberg KTH Medieteknik

Digital inlämning av årsredovisning

Designarkivet och det Digitala Arkivet. Anders Gidlöf, arkivarie och ansvarig för Digital arkivering

Digitalisering, analogt till digitalt Linköpings kommun

ByggR Systemkrav

Grundläggande datavetenskap, 4p

Avsnitt 1 Multimedia på Internet Introduktion

Riktlinjer och förutsättningar för skanning och ersättningsskanning i Stockholms stad. stockholm.se

FormatE. Om översynen av RA-FS 2009:2

Webbteknik. Innehåll. Historisk återblick Teknisk beskrivning Märkspråk Standardisering Trender. En kort introduktion

Godkända format för leverans av digitala filer till Landstingsarkivet

TAM 2:2008 REKOMMENDATIONER. Informationsförvaltning. Version 1.0

Riksarkivets författningssamling

ByggR Systemkrav

ByggR 2.0. Systemkrav

XML och C#.NET Att hantera XML-dokument

Anvisningar för ifyllning av Excelark för databaser (xml-filer)

Prislistan och betjäning presentation 2007

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

FALK 06 Sundsvall Från verksamhetsanalys till dokumentplan. T Sahlén

archive En produkt från Ida Infront - a part of Addnode Group

Arkivbeständighet och arkivförvaring

ISO Designing and Implementing a Records System (DIRKS/DIRS), Göran Samuelsson

Digisams frågeschema för arbetet med myndighets/ institutionsvisa planer

Standarder källa till kunskap och utveckling. Arkivarien i den digitala kommunikationen

Transkript:

Filformat och Långtidslagring 2005

Filformat och långtidslagring Termer runt L-lagring Trestegsraketen Orientering runt L-strategier Migreringshuset Teckentabeller Filformat Exempel

Allmänt om långtidslagring

Termer Bevarande Att göra en viss informationsmängd (handlingar) tillgänglig för all framtid. Långtidslagring Att göra digitalt lagrad information tillgänglig för framtida generationer. Arkivteori kontra Praktik (IT-term)

Termer forts. Konvertering Omvandling från ett filformat till ett annat, eller från en mediatyp till en annan, eller omvandling från en teckentabell till en annan. Migrering En serie av konverteringar som görs över tiden efter eller utan en migreringsplan. Transformering Att omvandla från en informationsstruktur till en annan. Ex. från en XML-struktur till en annan XML-struktur.

Trestegsraketen Medvetenhet hos ledning. Resurser tilldelas. Kunskap finns. Alternativ: Skriv ut på COM/papper och göm problemet i en källare. S.k. Print and forget.

Olika Långtidslagringsstrategier Utskrift till relativt stabila media Mikrofilm, papper, sten, metallskivor, lertavlor Totalbevarande/ Tekniskt museum Hårdvara och mjukvara Emulering (Mjukvara och datafiler i originalformat) Virtuell maskin (Emulering av ursprunglig hård- och mjukvara) Elektroniska paket (Teoretisk lösning) Metadatainkapsling med ryska dockor (Teoretisk lösning) Migrering (Löpande konvertering) Konvertering till aktuella och stabila format

Varför migreringsstrategin? Kräver löpande förvaltning, dock mindre än Tekniskt museum Viss löpande utveckling behövs, dock mindre än vid emulering Bevarar information med låga eller inga informationsförluster jämfört med utskrift Bättre för återsökning och återanvändning jämfört med utskrift

En typisk livscykel för filer/handlingar/dokument Långtidslagring av slutversion Skapandefas Arbetsmaterialfas (flera versioner) Gallring/rensning

Migreringshuset Metadata för styrning och beskrivning Struktur mellan filer Filformat (inkl. inre struktur) Teckentabell XML TIFF Verksamhetsprocess Organisation Medium Hårdvara (exkl. medium)

Teckentabeller och Filformat

Teckentabeller Använd någon av följande teckentabeller: 1. ISO 8859-1 (Western Latin I). 2. UTF-8 eller UTF-16 utifrån ISO 10646-1:2000. (Unicode 3.0 eller senare är helt kompatibelt med andra utgåvan av ISO 10646-1:2000, Universal Character Set.) I andra hand kan man använda Windows ANSI. Undvik IBM EBCDIC, PC-DOS och MacRoman.

Stabila kontra instabila format Stabila format (100-5000 år) Ex. Lertavlor, stentavlor, metallskivor, papper, COM Inga digitala filformat är stabila! Semistabila format (10-50 år) Ex. Ren text ( ASCII ), statisk XHTML, JPEG, TIFF, PDF/A Instabila format (1-10 år) Ex. MS Office, HTML, PDF

Eftersom det inte finns några stabila digitala filformat bör man ha en migreringsplan. måste man löpande kvalitetsgranska, övervaka och konvertera digitalt lagrad information. Med andra ord krävs det en aktiv förvaltning som löpande hanterar långtidslagringen av organisationens information.

Vanliga rekommendationer Under arbetsmaterialfasen kan instabila format användas. Ex. i MS Word. När en handling fastställts/låst/ blivit allmän handling så konverteras den till ett semistabilt format. Ex. till PDF/A. Ev. Görs dubbellagring i ett semistabilt och ett instabilt leverantörsformat. Ex. i CGM och AutoCAD DWG.

Livscykeln igen Långtidslagring Semistabilt format Initiering Instabila format Handläggning Instabila format Gallring/rensning

Kontorsdokument Semistabila ISO 19005-1:2005 PDF/A, Ren text/ascii, XHTML. Instabila MS Office-formaten (inkl. MS Office-XML), WordPerfect, HTML Bubblare SXW/SXC/SXD (OpenOffice.org zippade XML-filer),

Scanning (300 dpi) och rastrerad grafik Semistabila TIFF* 6.0 CCITT T.6/ grupp 4 för s/v. TIFF* 6.0 LZW (Lempel-Ziv-Welch) för färg/grå lossless. Ev. TIFF* 6.0 Uncompressed Bitmap för färg/grå. Ev. PDF/A. Ev. JFIF (JPEG File Interchange Format) med ISO 10918 JPEG. JPEG är egentligen endast en komprimeringsalgoritm. Filändelser:.jfif,.jpg,.jpeg Lossy och lossless Instabila Leverantörsformat såsom PDF, GIF 89a, FDF (Adobe Form Data Format), IBM AFP Bubblare ISO 15444-1:2004 JPEG 2000 (filändelse:.jp2,.jpf,.jpm, j2c ), W3C SVG, ISO 15948:2004 PNG *Se även ISO-standarder som ISO 12369:2004 Graphic Technology -- Prepress digital data exchange -- Tag image file format for image technology (TIFF/IT).

CAD och GIS (vektoriserade format) Semistabila GML (Geography Markup Language) för 2D och 3D. CGM (Computer Graphics Metafile ISO/IEC 8632) för 2D. (I vissa fall kan även TIFF 6.0 användas för 2D.) Instabila Leverantörsformat såsom AutoCAD DWG(Standard)/ DWF(Drawing Web Format), DXF (Drawing exchange Format) Bubblare WebCGM för 2D SVG (Scalable Vector Graphics) för 2D PDF/E för 2D/3D X3D från Web3D Consortium för 3D

Video, ljud, virtuella format Semistabila ISO 11172:1993 MPEG-1 MP3 = MPEG-1 layer 3 13818:1995 MPEG-2 Mellan instabila och semistabila ISO 14772-1:1997 VRML AU (NeXT/Sun sound file format) WAVE LPCM (MS Waveform Audio File Format with Linear PCM bitstream) Används av European Broadcast Union Instabila Quicktime, AVI (MS-Video), Macromedia, AIFF, Real-formaten, Macromedia Flash SWF... Bubblare X3D från Web3D Consortium, MPEG-4.

Affärsprocesser, finans Semistabila ebxml-ramverket, XBRL (extensible Business Reporting Language), FpML (Financial products Markup Language), OAGIS-ramverket (Open Applications Group). Instabila Leverantörsformat På väg bort? EDIFACT

Naturvetenskap Semistabila MathML (Mathematical Markup Language) Mellan Semistabila och instabila Extensible Data Format) CML (Chemical Markup Language) Instabila Leverantörsformat.

Systemutveckling och Teknik Semistabila ISO 19503 XMI (XML Metadata Interchange) DocBook STEP-ramverket SOAP Instabila I princip alla programspråk och alla leverantörsformat Bubblare W3C ECMAScript, STEPml, WfXML

Metadata och arkiv Semistabila EAD (Encoded Archival Description) ISO 15836:2003 DC (Dublin Core) med/utan W3C RDF e-government Metadata Standard inom UK egov/govtalk W3C RDF (Resource Description Framework) Instabila Leverantörsformat. Bubblare PRISM, NARA:s RFC:er för långtidslagring, EAC (Encoded Archival Context), MODS (Metadata Object Description Schema), METS (Metadata Encoding and Transportation Standard), VERS (Victorian Electronic Records Strategy), MOREQ, ISO 23081-1:2004 Records management processes - Metadata for records MARC-formaten (ex. NAD) på väg att ersätts med MARC XML eller EAD?

Allmänt Semistabila TEI (Text Encoding Initiative) IPTC NewsML XHTML Mellan semistabila och instabila HL7 (komplext), DICOM, HR-XML, CSS level 1, W3C XML Signature, OEBPS (Open ebook Forum Publication Structure), IPTC NITF (News Industry Text Format) Instabila Leverantörsformat.

PDF/A jämfört med PDF Audio och video tillåts inte. Inga script och ingen programkod är tillåten. Typsnitt ska vara inbäddade. Colourspaces i oberoende format. Ingen kryptering. Metadata.

Typiska konverteringspunkter OAIS Query Report/Result Set/Assistance Producer IP Consumer IP Order Informationspaket (DIP, SIP, AIP): IP Konverteringspunkt

Livscykeln da capo Långtidslagring Semistabilt format Initiering Instabila format Handläggning Instabila format Gallring/rensning

Exempel 1. Ordbehandling Skapa i leverantörsformat. (Ex. MS Word/WordML, Star/OpenOffice SXW ) Arbeta och spara arbetskopior i leverantörsformat. När handling fastställts konvertera/spara slutversion i PDF/A-format. (Jmf arkivläggning.) Långtidslagra PDF/A-versionen i filsystem eller i OAIS-system.

Exempel 2. CAD Skapa i PowerCAD, MicroStation, AutoCAD eller liknande. Arbeta i leverantörsformat. Ex. DWG. När ritning fastställts konvertera till CGM och spara en kopia i leverantörsformat om ritningen behöver ändras i framtiden. Långtidslagra ritning i CGM och leverantörsformat.

Exempel 3. Scanning Scanna i 300 dpi s/v och lagra i TIFF CCITT T.6. Lägg metadata i XML-fil. (Ex. PRISM, RDF/DC, OAGIS, edok eller liknande.) Arbeta med TIFF-fil i handläggningsprocess. Ändra metadata i XML-fil. Långtidslagra TIFF-fil och tillhörande metadata XML-fil i OAIS-system.

Sammanfattning Termer runt L-lagring Trestegsraketen Orientering runt L-strategier Migreringshuset Teckentabeller Filformat Exempel

Länkexempel http://www.digitalpreservation.gov/ http://www.digitalpreservation.gov/formats/ http://www.loc.gov/ http://www.govtalk.gov.uk/ http://www0.esd.org.uk/standards/egms/viewer/viewer.aspx

Frågor?