LDB-Centrum Centrum för Långsiktigt Digitalt Bevarande Östen Jonsson
LDB-Centrum Disposition Presentation av LDB-centrum Definitioner Pågående projekt Utmaningar Samarbeten/samverkan
LDB-centrum Centrum för Långsiktigt Digitalt Bevarande En del av Ltu, placering i Boden Ett nationellt kompetenscentrum Arbetar för gemensamma lösningar Arbetar tillsammans
LDB-centrum Centrum för Långsiktigt Digitalt Bevarande Parter Riksarkivet Kungliga biblioteket Luleå tekniska universitet Bodens kommun
LDB-centrum Centrum för Långsiktigt Digitalt Bevarande Verksamhet Forskning och utveckling Kompetensöverföring Uppdrag
LDB-centrum Centrum för Långsiktigt Digitalt Bevarande Framtiden Expansion Långsiktig finansiering
Vad är långsiktigt digitalt bevarande? Med långsiktigt bevarande menas bevarande över längre tid än livstiden för systemet (hårdvara & mjukvara ).
Vad är skillnaden mellan att lagra och bevara? Lagra: Informationen (ettorna och nollorna återfås på det sätt de levererades) Bevarande: Gör informationen förståelig vid varje tidpunkt
Strategier Migrering: Flytta och anpassa informationen till nya system Emulering: Utveckla programvara som kan läsa informationen i sitt ursprungliga skick
Pågående projekt PROTAGE PReservation Organizations using Tools in AGent Environments Finansieras av FP7 (www.protage.eu) Testplattformen Koncept och projekt Finansieras av Tillväxtverket och Länsstyrelsen i Norrbotten och parterna i LDB-centrum (www.ldb-centrum.se)
PROTAGE Mål: Visa på potentialen i ett agent ekosystem för att stödja automatisering av bevarande processer
PROTAGE Vad innebär det? Agenter = Artificiell intelligens Ekosystem = samspelet mellan de levande organismerna och den miljö de lever i
PROTAGE Vad är det bra för? Att hantera stora informationsmängder Automatisera
Informationsberget kräver automatisering!
PROTAGE Monitors the environment Execute preservation Trusted sources Perform deep search for newer (improved) Preservation actions Once started, the monitoring, scheduling and execution of preservation actions in the system goes on autonmously
PROTAGE Detta ger PROTAGE dig: Analys Förslag på åtgärder Förslag på verktyg att använda Gör jobbet?
Frågor? www.protage.eu
Testplattformen Koncept Konceptet Testplattformen är en fortgående process med målsättningen att bygga en testplattform för digital arkivering Projektet Projektet Testplattformen och syftar till att bygga en första prototyp för bevarande och återskapande av webbsidor.
Testplattformen Bakgrund Mycket teori lite verkstad
Testplattformen Varför just bevarande av webb? Alla parter i LDB-centrum hade behov Ett mycket vanligt och expansivt media Behöver bevaras (lagkrav) Lite gjort
Testplattformen Olika sätt att samla in webb Crawla + Kan göras från valfri plats + Utan bistånd + Klarar webbar från CMS-verktyg Många inställningsmöjligheter Lösenordsskyddade sidor? - Bakomliggande databaser - Flash - Subdomäner
Testplattformen Olika sätt att samla in webb Export ur CMS verktyget + Bevarar innehållet - Strukturen går förlorad
Testplattformen Olika sätt att samla in webb Kopiering av befintlig mappstruktur + Ger exakt kopia av webbplatsen + Alla filer kommer med Kräver relativa länkar - Kräver bevarande av CMS verktyget för att fungera bra
Testplattformen Ska klara: Samla in webb Analysera innehållet Skapa SIP och AIP (baserat på WARC) Lägga in webben i ett arkiv med metadata Återskapa webben från arkivet (Wayback) Migrera felaktiga filer i WARC filen Återskapa sidor med migrerade filer
Testplattformen LDB-centrum har Byggt ihop olika verktyg i en kedja Crawling (Heritrix) Återskapa (Wayback Machine) Droid (analys av format ner på versionsnivå) Koppling till formatregister (Pronom) Skapa SIP/AIP Återstår: Återskapa webb från arkiv (SB) Migrering och återskapande
Låt oss se vad man kan få ut av en crawling
Låt oss analysera Växjö kommuns hemsida
Testplattformen Några kända komplikationer Javascript Subdomäner Frames Olika webbläsare ger olika resultat Hur kommer framtida webbläsare att fungera?
Testplattformen (projektet) Resterande förebyggande: Utveckla crawling (verktyg, inställningar) Utveckla analysen, speciellt förbättringar Lokalisera problemfiler Integrera verktyg från PLANETS
Webben har passerat bäst före datum
Gör det enkelt!
LDB-Centrum Frågor? Webb: www.ldb-centrum.se E-post: kontakt@ldb-centrum.se Telefon: 0921 573 00