SwePub Bakgrund Funktio ner Framtid Presentation för Gruppen för SwePub 2017-09-20 Miriam Björkhem & Tuija Drake, Avdelningen för Informationssystem, Enheten för metadata och systemstöd, KB för
Bakgrund En aggregerad databas med ca 1100 000 publikationsposter från 35 lärosäten och 6 myndigheter Initierades 2009 av KB:s program för OpenAccess.se med syftet att: 1. Sprida information om vetenskapliga publikationer vid svenska lärosäten (SwePub Sök) 2. Erbjuda publiceringsstatistik (SwePub för analys och bibliometri) SwePub = 65% DiVA + 35% LU, GU, KI, SLU, Chalmers, Mah Enligt regeringens budgetproposition och regleringsbrev för 2017 tilldelas KB 3,5 MSEK per år under följande tio år för att förvalta och vidareutveckla SwePub
Regeringsuppdrag Databasen SwePub Kungl. biblioteket ska i samarbete med Vetenskapsrådet och med universitet och högskolor, genom Sveriges universitets- och högskoleförbund, förvalta och vidareutveckla databasen SwePub för att möjliggöra och kvalitetssäkra bibliometriska analyser. Kungl. biblioteket ska i samband med årsredovisningen redovisa till Regeringskansliet (Utbildningsdepartementet) hur uppdraget fortskrider.
Från datalager till tjänst
Datamodell
Gränssnitt
Praxis och format Alla versioner av praxis och format finns samlade i Verktygslådan SwePubs lathund för databearbetning med kravspecifikation för metadata det senaste tillägget för att stödja kvalitetssäkring och validering av metadata
Auktoritetsregister Externa källor, t.ex. nordiska listor LIBRIS Lokala publikationsdatabaser Lokala publikationsdatabaser SwePub För urskiljning och validering av auktoriserade data som i sin tur skapar höjd metadatakvalitet Auktoritetsregister
Datamodell för ett samnordiskt publiceringskanalregister Statistik jämförbar mellan länderna Delad arbetsbörda Gemensamma definitioner
Verifiering av open access OA totalt för alla publikationstyper 2010-2016 Guld OA 9% Hybrid OA 2% Grön OA (minus överlapp) 23% Ej OA (eller status okänd) 66%
Systemkarta Lärosätenas publikationsdatabaser Diva DSpace Converis Pure Scigloo DOAJ Kanallista Data/valideringskällor GUP Höstning i SwePub MODS via OAI- PMH SwePub Felaktig data studsar tillbaka med felrapport oadoi m.m. SwePub webbsök Konvertering från MODS till MARC, indexering, deduplicering Konverter ing från MODS till RDF VIRTUOSO Normalisering Berikning Länkning Regler Deduplicering Motstridigheter Bibliometrisk mappning Lärosäten SPARQL Xsearch, SRU, datadump av deduplicerad data SCB/ UKÄämnen Vetenskapsrådet Discovery systems Bibliometriker Prisma Datadump ur originaldata med dubbletter SwePub för analys och bibliometri Spotfire, Tableau public, Qlik Visualiserings -verktyg K l I e n t e r
Kvalitetssäkringsprocessen Post från lärosäte Feltyper Dubblettkandidater Samarbetspublikationer Export för åtgärd Bedömning Export för åtgärd Kvalitetssäkrade data Export för åtgärd Bedömning
Datakvalitet
Utvecklingsområden Stabil tjänst som en del i forskningsinfrastruktur Integrerad sök- och analystjänst som utvecklas i samma takt som övrig LIBRISinfrastruktur Ökad datakvalitet i tätt samarbete med Vetenskapsrådet och lärosätena Ökat stöd för uppföljning av open access enligt behoven i KB:s samordningsuppdrag för öppen tillgång Strategiska beslut gällande auktoriteter och identifikatorer i samarbete med Vetenskapsrådet m.fl.
OA-läget i SwePub OA för sakkunniggranskade artiklar 2010-2016 Guld OA 14% Hybrid OA 3% Ej OA (eller status okänd) 61% Grön OA (minus överlapp) 22%
Behov av framtida utveckling för OA-uppföljning Deduplicering implementerad i datauttag Kategori för toll access för att definiera ej OA Uppgift om erlagd APC (publiceringskostnad) Uppgift om corresponding author för APC-koppling till organisation Mer analysvänligt utdataformat med en datarad per publikation Validering av kod-fälten som för ISSN, DOI, årtal i lokala databaser