Hur tänker KB ta hand om högskolornas e-publikationer? Open Access seminariet, KTH 2007-04-13 Eva Müller Digitala biblioteket
Översikt Pliktleveranslagen och de digitala dokumenten Insamling av svenska webbsidor: Kulturarw 3 Frivilliga leveranser direkt från producenterna Den kommande e-pliktlagen KB:s infrastruktur för digitala leveranser Tillgänglighet av insamlat material Vad gör vi idag Vad som kommer att hända Hur kan ditt universitet/högskola komma med Frågor? Open Access, KTH 2007-04-14 2
Pliktleveranslagen och de digitala dokumenten Den första pliktleveranslagen kom 1661. Senaste revisionen 1993 inkluderar elektroniska dokument i fysisk form, CD-Rom, disketter, etc. Lagen ger oss ingen möjlighet att samla in digitala objekt från internet. I väntan på en ny revidering har vi vidtagit vissa åtgärder. Kulturarw3 robotinsamling av svenska webben (en ögonblicksbild, ej komplett) Avtal om frivilliga leveranser (leverantörer bestämmer vad som levereras/bevaras, kvalitetskontroll) Open Access, KTH 2007-04-14 3
Kulturarw 3 Sedan 1997, robot hämtar data ögonblicksbilder av hur webben såg ut vid insamlingstillfället. vissa adresser, t.ex. svenska dagstidningar samlas in dagligen, satsning på selektiva insamlingar i framtiden (t.ex. i anslutning till vissa större händelser som riksdagsval, jubiléer etc.) Roboten tar inte lösenordsskyddade sidor, problem med dynamiska sidor, interaktiva sidor, etc. Problem med tillgängligheten - ett särskilt undantag från Personuppgiftslagen (PUL) gör det möjligt att studera innehållet i KW3, men bara från särskilda terminaler i KB. http:///kw3/ Slutet av 2005-500 miljoner filer (ca 45 miljoner webbsidor) = 17 Tb, ca 1,500 olika MIME-typer (format) i arkivet (97 % html, gif, jpeg och pdf) =okatalogiserat tryck Open Access, KTH 2007-04-14 4
Frivilliga leveranser Sedan 2000 (ca 15 000 dokument i arkivet) Baserat på ett avtal 7 leverantörer (myndigheter, universitet, förlag) Infrastruktur under uppbyggnad ( avslutade projekt - SVEP projekt, projekt Digitala Leveranser på KB, Tillgänglighet nu och i framtiden; pågående projekt interna tester, samarbete med arkiv, LDB-centrum, internationellt samarbete) Open Access, KTH 2007-04-14 5
Den kommande e-pliktlagen En ny revidering av pliktleveranslagen under arbete, målet att utökas till att innefatta även elektroniska resurser tillgängliga över ett nätverk som internet. Den nya lagen kommer att börja gälla tidigast hösten 2008 (2009?). KB och SLBA samarbetar och skriver tillsammans på ett förslag. Önskemål: Fortsatt webbinsamling. Direkta leveranser, eller möjlighet att hämta med robot, resurser av permanent och avslutad karaktär. Metadata måste följa med i dessa leveranser. Möjligheter att göra materialet tillgänglig och använda det måste bli bättre. Open Access, KTH 2007-04-14 6
Förberedelse inför e-pliktlagen Verktyg och rutiner för mottagning och kontroll Verktyg för paketering, metadataleverans tillhandahålls av KB, utvecklas även av andra projekt/samarbetspartner Infrastrukturen under uppbyggnad - baseras på Metadata från producenterna. Metadata som skapas automatiskt från objekten och vid leverans. Automatiserade rutiner. Standarder och open source. Samarbete inom Sverige (Statens ljud- och bildarkiv, Riksarkivet med flera andra aktörer samt projekt inom området), Norden (Nordbib finansierat projekt), internationellt. Open Access, KTH 2007-04-14 7
Infrastructure - digital deposit Producer FTP or Harvesting email URN:NBN:SE number generator Metadata Resource Deliverance control + Metadata SIP email Cataloging National Library PID? http://... Resolution Service SIP Metadata Resource Bibliogr metadata National Union Cat (LIBRIS) Links to free resources Internet Internet PRONOM? KW3 harvester Format registry Digital Archive AIP KB local Resources with limited access User Open Access, KTH 2007-04-14 8
Tillgänglighet av insamlat material och URN:NBN Användandet av unika och beständiga identifikatorer är nödvändigt för att vi ska kunna garantera framtida tillgänglighet. KB har tagit ansvaret för URN:NBN inom domänen se. (Uniform Resource Name : National Bibliographic Number) Vi delar ut enstaka nummer, exempel: URN:NBN:se-2001-12345 Oranisationer och institutioner kan registrera undernamnrymder inom URN:NBN:se och själva generera sina identifikatorer, exempel: URN:NBN:se:uu:epc-2543 Vi använder även URN:NBN för att organisera och länka inom vårt eget arkiv. Vi har en fungerande uppslagstjänst (Resolution Service) som mappar mellan URN:er och URL:er. http://urn.kb.se/start Open Access, KTH 2007-04-14 9
Access via bibliotekskatalogen Olika överenskommelser mellan KB och producenterna bestämmer villkoren för våra rättigheter att visa det digitala materialet. Fritt tillgängligt material kan visas direkt via länk från katalogpost i i LIBRIS. Via länken dirigeras man antingen till producentens webbplats eller till KB:s arkiv. Kommersiella e-böcker eller annat material med begränsad tillgänglighet kan endast visas från särskilda terminaler i KBs publika utrymmen (samma gäller för Kulturarw3 enligt en undantagsregel från PUL). Två exempel Open Access, KTH 2007-04-14 10
Access 2 länkar i katalogposten Resurser med begränsad tillgänglighet Länk till producentens webbplats Länk till KBs digitala arkiv Lokalt tillgängligt på KB Open Access, KTH 2007-04-14 11
Access via URN:NBN Pekar på producentens webbplats via KBs Uppslagstjänst http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-1278 och när resursen inte längre är tillgänglig hos producenten är det tänkt att urn:nbn omdirigeras till KBs arkiv. Open Access, KTH 2007-04-14 12
Vidareutveckling/Vad gör vi idag? Nya projekt för att testa och vidareutveckla verktyg och infrastruktur Intern test av leveranserna (materialet producerat lokalt) - Vidareutveckling av infrastrukturen i ett nordiskt samarbete (resource harvesting, persistent identifikation) Målet med projektet Intern testverksamhet av digitala leveranser Mars-juni 2007 Ge underlag för eventuell anpassning/vidareutveckling av systemen Ge underlag för att skriva bra instruktioner innan tester med externa leverantörer Ge underlag för testprotokoll till de externa testerna Se över rutiner för avtalsskrivning, instruktioner för leverantörer(komma igångkit) Ge möjlighet till kompetensutveckling av personal som är ny i sammanhanget Open Access, KTH 2007-04-14 13
Interna tester Vad vill vi testa? Leveransrutiner och infrastrukturen Att det går att leverera på ett enkelt sätt med hjälp av våra instruktioner och verktyg Att våra instruktioner är tydliga Att våra verktyg går lätt att använda Att nuvarande leveranskontroll fungerar: Att det går att ta emot paket enligt våra specifikationer Att det går att läsa vilket format det är, att leveransen innehåller viktig metadata, checksummor m.m. Att kvittering och andra meddelanderutiner fungerar Att vi får in de publikationstyper vi vill samla in Att försändelsen till arkivet fungerar Metadata Ska vi ha olika nivåer på metadata? Får vi in de metadata vi behöver? Är det något som bör ändras i metadataspecifikationen? Titta särskilt på rättighetsmetadata och på metadata för resurser som består av mer än en fil (komplexa objekt) Open Access, KTH 2007-04-14 14
Interna tester. Verktygen: KB:s metadataformulär Uppsalas Metadata Mapping Tool och Zip Packager KB URN Tool KoLiBri (Deutsche Bibliothek) För vem passar verktygen? Behov av vidareutveckling? Parallellt med detta arbete Kontakter med nya leverantörer med målet att underteckna nya avtal Arbete med en abstrakt modell för arkiv-paket Arbete med en ny arkitektur för KB s digitala arkiv Open Access, KTH 2007-04-14 15
Nästa steg Externa tester from augusti 2007 Ett nytt projekt i samarbete med Danmark, Finland och Norge och finansierat av NordBib Översyn av PId (URN:NBN) och vidareutveckling av resolution service Översyn av existerande modeller för leveranspaket och harmonisering av dessa (målet att underlätta resursutbyte genom OAI baserad harvesting av resurser) Samarbete med Sun Microsystems inom "Preservation and Archiving Special Interest Group (PASIG)" Arbete med System- och Informationsarkitektur för det nya arkivet Open Access, KTH 2007-04-14 16
Hur ser leveranserna ut i framtiden? Flera verktyg att välja mellan för att leverera metadata och tillhörande objekt Möjlighet att integrera verktyg direkt i leverantörsplattform (en tilläggsmodul) Flera leveransmetoder att välja mellan Automatiserade processer Helpdesk på Digitala biblioteket/kb Open Access, KTH 2007-04-14 17
Hur kan ditt universitet/högskola komma med? Läs information på KB s webb (digitala leveranser) Ta kontakt med pliktleveransgruppen (Boel Larsson boel.larsson@kb.se) Avtal Rådgivning kring lämpliga verktyg Planering för testleveranser Open Access, KTH 2007-04-14 18
Frågor? Open Access, KTH 2007-04-14 19