ECE-PI Unit for Publication Infrastructure School of Education and Communication in Engineering Sciences KTH - Royal Institute of Technology, Stockholm, Sweden RAPP Erik Sandewall OA-publicerade domänmodeller avseende vetenskaplig publicering och gruppstruktur Slutrapport för PARPUB-projektet Fas I och II This series of memos reports administrative and organizational issues in the Division of Publication Infrastructure The present memo can persistently be accessed as follows: Memo persistent URL: Date of manuscript: http: /piex.publ.kth.se/reports/rapp/012/ 2012-04-25 Related information can be obtained via the following www sites: The PIEX website: The author: http: /piex.publ.kth.se/ http: /www.ida.liu.se/ erisa/
1 Föreliggande dokument utgör den formella slutrapporten för ett oa.se-projekt med den långa titeln OA-publicerade domänmodeller avseende vetenskaplig publicering och gruppstruktur: Delprojekt II, Domänmodellering av rättigheter och bivillkor vid parallellpublicering av vetenskapliga artiklar. Detta är ett delprojekt endast i den bemärkelsen att den ursprungliga projektansökan upptog tre delprojekt, varav dock bara delprojekt II kom att nansieras. I genomförande har det helt enkelt varit ett normal projekt. För detta projekt används den kortare benämningen PARPUB-projektet. Jämsides med denna rapport nns också en utförlig avslutande rapport på engelska som innehåller teknisk beskrivning av de framtagna systemen (speciellt implementeringar av webbservrar) och informationsmängderna. Dess beteckning är Erik Sandewall Domain Modelling of Rights and Conditions for Parallel Publication of Research Articles Rapport från PI-gruppen vid KTH http://piex.publ.kth.se/reports/rapp/012/ Tidigare rapportering under projektets gång och dokumentation av delsystem nns angivna i referenslistan i slutet av föreliggande rapport. Slutligen nns en webbplats på http://www.ida.liu.se/ext/jir/ som fortsättningsvis avses innehålla uppdaterad information om dessa system och informationsmängder, med länkar till interaktiv användning av vissa av dessa. Bakgrund och målsättning för PARPUB-projektet Projektets mål är dels att samla in, strukturera och komplettera information som avser rättigheter och villkor för parallellpublicering av vetenskapliga artiklar, dels att göra denna information operativt tillgänglig så att den kan användas i era typer av programvarusystem, främst: System som administrerar institutionella arkiv för open access ska erbjudas en tjänst som identerar huruvida publicering i arkivet av en given, redan tidskriftspublicerad (eller tidskriftsaccepterad) artikel är förenlig med det normala publiceringskontraktet mellan respektive tidskriftsförlag och författare. System som är avsedda för forskare och som assisterar med hanteringen av artikelmanus och artiklar ska på motsvarande sätt kunna ge kontraktsinformation till sina användare. För nyttiggörandet nns speciellt ett samarbete med DiVA-projektet vid Uppsala universitet, i form av ett separat nansierat oa.se-projekt hos dem, där avsikten är att koppla in det i PARPUB-projektet framtagna systemet som ett hjälpmedel i DiVA-systemet. Information av detta slag nns i den mycket användbara, webbaserade tjänsten SHERPA/Romeo, men denna är i första hand organiserad för att man
2 ska kunna slå upp information manuellt från fall till fall. Även om det numera nns en API för programmerad access så är den av SHERPA/Romeosystemet levererade informationen ofta sådan att manuell efterbehandling ändå behövs. I PARPUB-projektet är målsättningen att kunna eliminera det manuella ingripandet i så många fall som möjligt, så att kontrollen av förlagsvillkoren kan göras automatiskt, dock med reservation för att det kan återstå vissa fall där manuellt ingripande fortfarande blir nödvändigt. För att man ska kunna implementera de nämnda nya tjänsterna identierade vi behov av ytterligare arbete på följande aspekter: Den verbalt uttryckta informationen på SHERPA/Romeos webbplats behöver omvandlas till en strukturerad form. Komplettering med information från ytterligare förlag behöver göras. Eftersom förlagen ibland ändrar sina regler, och eftersom uppköp och sammanslagning av förlag kan leda till ändring av reglerna för en given tidskrift, behövs ett system som arkiverar kopior av de kontrakt som gäller vid en viss tidpunkt och som automatiskt samlar och arkiverar nya standardkontrakt när sådana ascheras på respektive förlags webbplats. Programvara som interpreterar och tillämpar nämnda information för en given artikel och dess bibliograska metadata behöver implementeras. För att uppnå dessa mål har era servrar behövt implementeras, nämligen dels ett huvudsystem kallat JIR (Journal Information Resource) och dels några hjälpservrar. Det är JIR-servern som kan ge service till DiVA och andra liknande system. Detta är i korthet målsättningen för PARPUB-projektet. I projektplanen ingick också att etablera samarbete med SHERPA/Romeo och med användare av data, liksom med det likaledes OpenAccess.se-nansierade projektet Parallellpublicering av vetenskapliga artiklar (PAVA). Som bas för projektet fanns en tidigare genomförd omvandling av SHERPA/- Romeo-informationen till strukturerad form, och ett författarstödssystem (MADMAN) som bedömdes vara lämpligt att använda för test med denna ansats. Ursprunglig ansökan och formell projekthistorik Projektet har bedrivits i två successiva faser. Fas I utfördes under 2008 och 2009 med en nansiering av 560.000 kr; fas II under 2010 och 2011 med en nansiering 650.000 kr. Slutrapport för fas I insändes 2010-02-16 i enlighet med stipulation i beslutsbrevet. För fas II angavs datum för slutrapport till 2011-12-31. Arbetet var avslutat 2011-12-05, men underhand begärde vi och ck utsträckt rapporteringstid för att invänta tester av systemet hos tredje part. Föreliggande slutrapport insändes därför 2012-04-10. Formell slutrapport för Fas II görs alltså genom föreliggande dokument. Dock gäller att visst ytterligare arbete kommer att behövas framöver i samband med inkörningen av systemet som en resurs i DiVA-systemet.
3 Projektledare i bägge faserna har varit Erik Sandewall. I fas I deltog också Gunnar Eriksson, Preben Hansen och (adjungerad) Oscar Täckström från SICS samt Henrik Lundberg från IDA (Institutionen för datavetenskap) vid Linköpings universitet. I fas II deltog enbart Henrik Lundberg från fas I, samt därtill John Olsson även han från IDA. Samarbeten och presentation Utöver de samarbeten som skett genom projektets distribuerade karaktär har även fortlöpande kontakter upprätthållits med DiVA-projektet i Uppsala vilket avses vara den första och primära avnämaren av resultaten. Kontakter för samråd och planering av eventuella gemensamma aktiviteter har vidare skett med Romeo-Sherpa-projektet, med företrädare för Elsevier, samt med Linköping University Electronic Press genom dess chef David Lawrence. Slutligen har vi tagit del av och tillgodogjort oss erfarenheterna från det av oa.se stödda PAVA-projektet. Projektets fortskridande har presenterats genom inbjudna föredrag vid ett antal svenska och nordiska mötestillfällen för open-access-frågor. Projektresultat Projektets huvudresultat är alltså det ovannämnda JIR-systemet. Det är en programvara som tekniskt har formen av en webbserver, men vilken i dagsläget endast medger API-användning dvs det förutsätter att det anropas från en annan programvara, och inte från en webbserver. [ 1 ] Konkret är avsikten att t.ex. DiVA-systemet ska kunna skicka förfrågningar (requests) till JIR och få svar därifrån. JIR-systemet har utvecklats gradvis men den nu aktuella versionen är i drift sedan 2011-12-05 och ska betraktas som stabil. Viss vidareutveckling förutses, främst vad gäller stöd för information om villkor för prepublicering, men det rör sig då om enkla kompletteringar som har förutsetts i designen. Teknisk beskrivning av systemet och dess användning åternns i den utförliga projektrapporten som refererades på sida 1. JIR använder sig av databaser av två slag. Dels nns där en kunskapsbas som innehåller förlagsvillkor för parallellpublicering i strukturerad form; dels också en faktabas avseende tidskrifter, förlag, universitet, med mera. Den senare betecknas `Publishing Environment Factbase' och är en vidareutveckling av publiceringsdomänen inom Common Knowledge Library [ 2 ] Preliminära version av bägge dessa databaser förelåg vid projektets start men de har vidareutvecklats avsevärt inom projektets ram. Vidare har följande associerade programvaror utvecklas som hjälpmedel för uppbyggnad och underhåll av JIR-systemet och dess databaser. JIRIMP ett hjälpmedel för insamling, strukturering och kuration av de två databaserna. JIRCLI ett hjälpsystem för att demonstrera hur JIR-systemet fungerar. 1 Det går även att anropa JIR från en webbserver, men det är en icke avsedd och icke praktisk användning. 2 http://piex.publ.kth.se/ckl/
4 JIRMON en monitor som regelbundet laddar ner förlagsinformation om parallellpublicering, arkiverar resultaten, och signalerar när förändringar har inträtt. LABMOP prototyp för ett system som servar en enstaka forskare eller forskningsgrupp med hantering av artikelmanuskript under arbete. Detta har använts för att demonstrera hur JIR-systemet kan fungera i ett bredare sammanhang. Även dessa hjälpsystem dokumenteras i den nämnda utförliga projektrapporten. Slutligen har en viss komplettering av underliggande systemprogramvara behövt göras för att möjliggöra körning av dessa system inom ramen för programmeringssystem med open-source-licens. Fortsatt arbete Nästa steg är nu att DiVA-projektet kommer att göra sina tester på det bentliga JIR-systemet. Man kan förutse att om dessa tester utfaller positivt så kommer det också att leda till önskemål om viss vidareutveckling. Jag kommer självklart att stå till förfogande för detta inom ramen för det möjliga. Det nns också planer på att använda den framtagna programvaran och databaserna för andra forskningsändamål av icke-kommersiell natur. Om dessa planer realiseras kommer de förstås att rapporteras på sedvanligt sätt. Referenser till administrativa projektrapporter 1. Erik Sandewall: OA-publicerade domänmodeller avseende vetenskaplig publicering och gruppstruktur. (OA-published domain models concerning scientic publishing and research-group structure). Organizational Memo number 4, Division of Publication Infrastructure, KTH, Stockholm. Available at http://piex.publ.kth.se/reports/rapp/004/. 2. Erik Sandewall: Delrapport för OpenAccess.se-projektet 'Domänmodellering av rättigheter och bivillkor vid parallellpublicering av vetenskapliga artiklar'. (Intermediate report for the OpenAccess.se project 'Domain modelling of right and constraints for parallel publishing of research articles'). Organizational Memo number 7, Division of Publication Infrastructure, http://piex.publ.kth.se/reports/rapp/007/. 11. Erik Sandewall: OA-publicerade domänmodeller avseende vetenskaplig publicering och gruppstruktur Slutrapport för PARPUB-projektet Fas I och II (Final report for the OpenAccess.se project 'Domain modelling of right and constraints for parallel publishing of research articles'). Organizational Memo number 12, Division of Publication Infrastructure, KTH, Stockholm. Available at http://piex.publ.kth.se/reports/rapp/012/.
5 Referenser till tekniska projektrapporter 3. Preben Hansen, Gunnar Eriksson och Oscar Täckström: Steps towards automatic acquisition and recognition of IPR conditions for parallel publishing. Project report from the Swedish Institute of Computer Science (SICS). 4. Erik Sandewall: Support for Managing IPR and Parallel Publishing in the MADMAN Research Author Support System. Report number 2, ADEPT project, Division of Publication Infrastructure, KTH, Stockholm. Available at http://www.ida.liu.se/ext/caisor/pm-archive/adept/002/. 5. Erik Sandewall: Demonstrating the Use of Author-Deposit Restrictions in Publication-Related Software Systems. Report number 4, ADEPT project, Division of Publication Infrastructure, http://www.ida.liu.se/ext/caisor/pm-archive/adept/004/. 6. Erik Sandewall: Domain Modelling of Rights and Conditions for Parallel Publication of Research Articles. Final Report from Phase I of the oa.se Project. Report number 5, ADEPT project, Division of Publication Infrastructure, http://www.ida.liu.se/ext/caisor/pm-archive/adept/005/. 7. Erik Sandewall: The CAPPA Conguration and the Journal Information Resourc Report number 9, ADEPT project, Division of Publication Infrastructure, http://www.ida.liu.se/ext/caisor/pm-archive/adept/009/. 8. Henrik Lundberg and John Olsson: Automatic and Semi-Automatic Addition of Connections between Entities in Imported Romeo-Sherpa Data. Report number 10, ADEPT project, Division of Publication Infrastructure, http://www.ida.liu.se/ext/caisor/pm-archive/adept/010/. 9. Henrik Lundberg and John Olsson: Leoserve, a Webserver for Leonardo. Report number 17, Leonardo project, Department of Computer and Information Science, Linköping University. Available at http://www.ida.liu.se/ext/caisor/pm-archive/leonardo/017/. 10. Erik Sandewall: Domain Modelling of Rights and Conditions for Parallel Publication of Research Articles. Comprehensive Report from the PARPUB Project, Phase III. Report number 12, ADEPT project, Division of Publication Infrastructure, http://www.ida.liu.se/ext/caisor/pm-archive/adept/012/.