Datum 2008-05-13 Diarienummer 112-2008-2090 Vetenskapsrådet Handläggare Ulf Kronman Lunds Universitet Projektgruppen för SwePub c/o Jörgen Eriksson 221 00 LUND Vetenskapsrådets svar på förfrågan rörande "En samlad ingång till all svensk vetenskaplig publicering - SwePub" Projektgruppen för SwePub har 2008-04-07 tillställt Vetenskapsrådet en kravspecifikation för SwePub för synpunkter. Vetenskapsrådets kommentarer gäller framför allt de inslag i kravspecifikationen som berör rådet och som kan förmodas få konsekvenser för dess verksamhet. VETENSKAPSRÅDET SWEDISH RESEARCH COUNCIL Postadress/Postal address SE-103 78 Stockholm Sweden Besöksadress/Visiting address Klarabergsviadukten 82 Tel: +46(0)8-546 44 000 Fax:+46(0)8-546 44 180 Org. nr/vat No 202100-5208 Sammanfattning och allmänna synpunkter Ansatsen att skapa ett samlat register över vetenskapliga publikationer producerade av forskare vid svenska universitet är vällovlig. En välbyggd sådan förteckning kan användas både för informationssökning och för statistikoch uppföljningsändamål, förutsatt att innehållet blir tillräckligt heltäckande och av god kvalitet. Det bör dock betonas att värdet av en söktjänst enbart för svenskproducerade vetenskapliga alster är av begränsat värde, eftersom flertalet av dagens forskare oftast är mer intresserade av internationellt täckande register. Om publikationsuppgifter från SwePub sprids till internationella söktjänster som Google, Google Scholar, Yahoo m.fl. via så kallad höstning (eng. harvesting) kommer betydelsen av databasen SwePub att öka, men däremot inte värdet av den svenska söktjänsten i SwePub. En spridning av svenska publikationsposter till internationella söksystem har i viss mån även bäring på frågan om så kallad Open Access. Om publikationsposterna innehåller länkar till dokumentens fulltext bidrar SwePub då till en ökad exponering och friare spridning av de svenska vetenskapliga publikationerna. Allteftersom intresset har ökat för bibliometriska studier av vetenskapliga publikationer har också behovet av ett svenskt centralt register över dessa blivit mer aktuellt. Detta gäller särskilt för områdena humaniora och samhällsvetenskap vars publikationer endast täcks i ringa omfattning av de kommersiella aktörerna på det bibliometriska området. En svensk databas över vetenskapliga alster i form av SwePub kan därför vara av stort värde för att ge en mer rättvisande och heltäckande bild av den svenska vetenskapliga publiceringen i uppföljande analyser och bibliometriska studier i framtiden. vetenskapsradet@vr.se 1(5)
Vetenskapsrådet noterar dock att de i kravspecifikationen föreslagna funktionerna för att identifiera organisationer och forskare saknar samordning på en nivå ovanför lärosätena, och därför riskerar att bli alltför beroende av olika lokala identifieringssystem för att bli användbar på nationell nivå. Ett projekt för att skapa en samlad ingång till all svensk vetenskaplig publicering bör även innefatta en viss utblick och ställningstaganden om projektets framtida relation till andra aktiviteter på området. Hur bör till exempel SwePub relatera till det samarbete kring bibliometriska data från Thomson Reuters (ISI) som Vetenskapsrådet och SUHF har initierat? Projektet för uppbyggnad av SwePub bör kanske även förhålla sig till framtida behov av system för uppföljning av den svenska vetenskapliga publiceringen för att fullfölja intentioner om bibliometriska underlag för resursfördelningen till de svenska universiteten som föreslås i utredningen Resurser för kvalitet (SOU 2007:81). Kan SwePub med rätt utformning tillgodose dessa framtida behov? Utöver vad som framförts ovan vill Vetenskapsrådet lyfta fram följande funktionalitet som viktig att åstadkomma i SwePub: Att tjänsten håller hög datakvalitet och har en bred täckning av den vetenskapliga publiceringen vid svenska lärosäten. Att tjänsten utformas så att information om de svenska vetenskapliga publikationerna fångas upp av internationella söktjänster. Att utgivande lärosäte(n) kan identifieras på ett unikt och enhetligt Att publikationerna ämnesklassificeras på ett sådant vis att det tillåter ämnesvisa analyser av den svenska vetenskapliga produktionen. Att SwePub på sikt även innefattar ett system för att unikt identifiera de svenska forskare som medverkat i publikationerna. Att utvecklingen av SwePub samordnas och samverkar med andra initiativ för uppföljning av den svenska vetenskapliga produktionen. Nedan följer mer detaljerade synpunkter på kravspecifikationen. Kravspecifikationens utformning och projektets genomförande Syftet med den föreslagna kravspecifikationen är något oklart, vilket i viss mån har försvårat Vetenskapsrådets bedömning. Är det framlagda förslaget en kravspecifikation för funktionaliteten i ett tänkt system eller en kravspecifikation för utformningen av ett föreslaget projekt? Detta skulle behöva förtydligas. Gränsen mellan projektet som arbetat fram kravspecifikationen ("förstudien") och själva genomförandet verkar också något oklar. I sektion 1.2 beskrivs syfte och mål för ett föreslaget genomförandeprojekt, medan det i sektion 1.3 beskrivs vilka organisationer som varit delaktiga i förstudieprojektet, utan att 2(5)
det görs någon tydlig åtskillnad mellan dessa två projekt. Ett tydliggörande av vad som klarats av inom ramen för förstudieprojektet och vad som förväntas av utförandeprojektet skulle kunna underlätta genomförandet. Som har framhållits ovan anser Vetenskapsrådet att själva sökfunktionen i SwePub blir av underordnat intresse i förhållande till analys- och spridningsfunktionen. Det kan därför vara strategiskt att inte lägga för mycket fokus på utveckling av sökgränssnittet. En integrering i Libris Webbsök verkar vara en rimlig linje och ambitionsnivå. Åmnesklassificering Valet av ämnesklassificering är en viktig fråga, speciellt med avseende på analysfunktionen i systemet. Förstudien noterar att Vetenskapsrådets analysenhet ställer sig "starkt positiv" till ämnesklassificering, vilket i sak är korrekt, men Vetenskapsrådet vill betona att det inte därmed är starkt positivt till användningen av SCB:s ämneskategorier så som föreslås av SVEPprojektet. Utförandeprojektet bör ges i uppdrag att göra en översyn av ämnesklassificeringen och överväga möjligheten att använda en förenklad version med endast två nivåer i hierarkin och 30-40 av SCB:s ämnesklasser. Syftet med detta är att i största möjliga mån minska riskerna för att forskare eller administratörer klassificerar publikationerna inom fel ämnesområde. Organisationsidentifiering Frågan om att koppla publikationerna till lärosäten nämns på ett antal ställen i kravspecifikationen (sektion 4, via bilagd formatspecifikation, sektion 7.3, sektion 8.3.1), men det verkar saknas en specifikation för ett samlat, organisationsövergripande auktoritetsregister för att identifiera svenska lärosäten. Bristen på plan för auktoritetsregister leder även till att det blir oklart i vilket format externa analyserande instanser som Vetenskapsrådet kommer att kunna hämta och använda organisations- och individdata från SwePub. Ett tydligt uppdrag till utförandeprojektet att hantera identifieringen av lärosäten och individer på ett lärosätesövergripande sätt skulle vara önskvärt. Det är vällovligt att även sikta på att implementera en funktion för analyser på institutionsnivå, men frågan är om detta är ett realistiskt mål med tanke på universitetens rörliga organisationsstruktur på institutionsnivån och forskarnas samverkan över institutionsgränserna.
Forskaridentifiering I sektionerna 6.4 och 7.4 nämns att identiteter för forskare, härrörande från lokal verifiering, ska överföras till SwePub och göras tillgängliga för sökning och analys. Här ges dock inga tydliga uppdrag till utförandeprojektet om hur identifieringen ska hanteras; vilka ID-nummer eller andra identifierare ska användas och hur ska lokala identifierare från olika lärosäten samordnas så att en lärosätesövergripande identifiering av en svensk forskare blir möjlig? Borde inte projektet för förverkligande av SwePub studera kommersiella alternativ som Thomsons Researcher ID.com eller beröra möjligheten att använda andra lärosätesövergripande identifierare som till exempel personnummer eller ett svenskt forskar-id? Datainhämtning I sektion 6.3 av kravspecifikationen föreslås att publikationsposterna ska berikas genom att ID:n inhämtade från externa system även förs över till SwePub och att kopplingar görs till material i Libris-databasen, där så är möjligt. Inget nämns dock om möjligheterna att skapa en bas av data i det centrala systemet genom att köpa in databaser från kommersiella system som Thomsons ISI-databas eller Elseviers Scopus. En sådan frågeställning skulle kunna vara värd att föra in i projektplanen. Datautbyte med andra system I sektionerna 8.2 och 9.3 nämns SwePubs funktioner för datautbyte med andra system. Dock är de tänkta funktionerna för export av data från SwePub något oklart beskrivna. Kravspecifikationen blandar här tänkta utbytesprotokoll och dataformat på ett otydligt sätt. Det torde underlätta för utförandeprojektet om det gjordes tydligare vilka accessprotokoll, t.ex. OAI-PMH, JDBC, som tjänsten ska kunna erbjuda och vilka dataformat, t.ex. MODS, OAIDC, RSS, TAB-delimited, som ska kunna levereras via dessa protokoll. Att ange XML som ett önskat utformat skapar ingen ytterligare tydlighet för utförandeprojektet, eftersom XML i sig inte är ett dataformat, utan ett ramverk för formatbeskrivningar. Mer specifika XML-baserade format som till exempel OAIDC, MODS eller RSS bör därför anges. Publikationstyper I bilagan "Formatspecifikation" föreslås ett antal dokumenttyper. Här skulle det kunna vara lämpligt att lägga till dokumenttypen "vetenskaplig utgåva" (scholarly edition), som är en viktig publikationstyp inom vissa vetenskapsområden.
Det skulle också kunna vara lämpligt att göra det möjligt att märka material av typen "forskningsöversikt" och "övrigt" som referee-granskade för att underlätta analyser med referee-granskning som urvalskriterium. Beslut i ärendet har fattats av generaldirektör Pär Omling i närvaro av biträdande generaldirektör Gunnel Gustafsson, rådsdirektör Mariann Samuelson samt administrative chefen Jan Stålhammar. Föredragande har varit analytikerna Ulf Kronman och Magnus Gunnarsson. Pär Omling Generaldirektör Jlf Kronman Analytiker us GuMarsson 5(5)