Pass 2: Datahantering och datahanteringsplaner

Relevanta dokument
Pass 2: Datahantering och datahanteringsplaner

Svensk nationell datatjänst en infrastruktur för forskningsdata inom samhällsvetenskap, humaniora och medicin

Pass 2: Datahantering och datahanteringsplaner

Pass 2: Datahantering och datahanteringsplaner

BAS Online Svensk nationell datatjänst, SND

Checklista för datahanteringsplan. Svensk Nationell Datatjänst, SND Checklista datahanteringsplan

Svensk Nationell Datatjänst, SND Checklista datahanteringsplan Checklista för datahanteringsplan

Övergripande principer för dokumentation. SND Svensk nationell datatjänst

Vad är Svensk nationell datatjänst och hur kan det bistå dig kring forskningsdata och datahantering?

Datahantering och tillgång till forskningsdata

Svensk Nationell Datatjänst, SND Checklista datahanteringsplan Checklista för datahanteringsplan

Svensk Nationell Datatjänst

Vad händer på SND. Arbetet framåt. Max Petzold

Checklista för datahanteringsplan. Svensk Nationell Datatjänst, SND Checklista datahanteringsplan

Vetenskapsrådets syn på Forskningsdata

Svensk Nationell Datatjänst, SND Checklista datahanteringsplan version 008, Checklista för datahanteringsplan

Pass 2: Datahantering och datahanteringsplaner

Hantering av forskningsdata vid Stockholms universitet

Vetenskapsrådets samordningsuppdrag om öppen tillgång till forskningsdata - datahanteringsplaner

Checklistor för innehåll i den information som enligt dataskyddsförordningen ska ges när personuppgifter samlas in

VÄLKOMNA! SND workshop 15 november

Rutiner och tidsplan för nominering till Knut och Alice Wallenberg Stiftelse: Forskningsprojekt av hög vetenskaplig potential.

Instruktioner för sökande av forskningsmedel ur Miljöforskningsanslaget

Pass 4: Metadatastandarder

Forskningsfinansiärers perspektiv på open access - problem och möjligheter? Stiftelsen Riksbankens Jubileumsfond Britta Lövgren

EXTERNA EXAMENSARBETEN

Riktlinjer för hantering av externa forskningsbidrag vid FHS

Öppen tillgång till forskningsdata Forskarsamhället i förändring

Instruktion till mallen för den informationstext som SLU ska lämna när vi samlar in personuppgifter

Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online

Forskningsdatapiloten - erfarenheter och diskussion

Administrativ rutin för projekt finansierade genom EUs ramprogram

- nya möjligheter att göra forskningen tillgänglig. Vetenskaplig publicering och Open Access Karlstads universitet, 18 februari 2010

VÄGLEDNING ATT UPPHANDLA PÅ ETT SÄKERT SÄTT

SND, Fair Data och vägen framåt

Rutin för FoU-ansökningar ställda till SIR

@RECODE_Project. Peter Linde

Policy för Linnéuniversitetets publicering av digitalt undervisningsmaterial

Svensk nationell policy för tillgängliggörande och lagring av forskningsdata. Wilhelm Widmark

Framtidens drönare. Drönare för individer och samhälle UTLYSNING

Öppen tillgång Nationella riktlinjer

DATAHANTERING. Hur forskningsmaterial hanteras, organiseras och struktureras under hela forskningsprocessen.

Arbetsgång för examensarbeten vid institutionen för Ekologi, Miljö och Geovetenskap

CUL-doktorand i etikprövningsprocessen

Om Fortes konferensbidrag

RAPPORT. Kliniska riktlinjer för användning av obeprövade behandlingsmetoder på allvarligt sjuka patienter

Riktlinjer för forskarutbildningen Gäller från och med Fastställda av fakultetsnämnden

Projektdirektiv. SKONA: SND:s konsortie- och nätverksarbete

ANSÖKAN OM ETIKPRÖVNING AV FORSKNING SOM AVSER MÄNNISKOR

Forskningsetik läkaretik. Nils Rodhe

UTLYSNING AV VETENSKAPLIGA RÅDETS ANSLAG

Skolforskningsinstitutets forskningsmedel

Drömdeg För dig som är coach

Synpunkter från SILF/SPUK

Rekommendationer för insamling av forskningsmaterial. Dnr 1-362/2014

Individrörlighet för innovation och samhällsnytta

1 Instruktion till ifyllande av ansökan: Tillgång till provsamling och personuppgift för forskning

2.2 Examina Högskoleexamina med år, ämne, plats. Kopia av bevis endast avseende högsta examen bifogas. Docentkompetens. Kopia av bevis bifogas.

Workshop Mötesplats Open Access 26 april Vad betyder Open access för vår organisation och hur integrerar vi det i organisationen som helhet?

Digikult, Göteborg Digisam Johanna Berg

Pass 6 Forskningsjuridik

Utveckling och implementering av tjänster och stöd för forskningsdata - ett universitetsövergripande arbete

Svensk nationell datatjänst, SND BAS Online

Riktlinjer för anställdas behandling av personuppgifter vid Högskolan i Borås

Utlysning av forskningsmedel inom prognoser och fo rvarning fo r extrema solstormar- Steg 2.

Forskning/Utbildning 2015

Anvisningar till rapporter i psykologi på B-nivå

FINLANDS AKADEMI NYTT I SEPTEMBERUTLYSNINGEN (5)

Etiska aspekter inom ST-projektet

Inför flytten. Hantering av forskningsmaterial inför flytten på NKS. Enheten för arkiv- och registratur UF Framtagen

Diarienr: 11/2014. Fastställd av Pedagogiska kommittén

Policy för SLU:s hantering av verksamhetsinformation

Uppsala-noden inom ULF prövar en modell för fördelning av forskningsmedel

Lokala regler för inrättande och avveckling av ämne på forskarnivå

Deltagare och forskningsetik Pär Ågerfalk

Regler och anvisningar för ansökan om bidrag till forskningssamarbeten inom idrottsforskning 2016

Nivå 2: Högskoleövergripande styrdokument samt enheters och organs arbetsordningar

Open Access-policy för vetenskaplig publicering vid Umeå universitet

Anvisning om individuell studieplan

Forskningsprocessen i Landstinget Kronoberg

Riktlinjer för ekonomiskt stöd från Nordiska samarbetsrådet för kriminologi (NSfK)

EXTERNA EXAMENSARBETEN

Studieplan för utbildning på forskarnivå inom Medieteknik Inom skolan för datavetenskap och kommunikation, KTH

Helsingfors universitet Juridiska fakulteten

Mall för ansökan 1 ANSÖKAN 2 CV

Installation. Kom i gång att använda ArcGIS Pro. Tillgång till ArcGIS pro

BRA FORSKNING GER UTDELNING

Svensk nationell datatjänst, SND BAS Online

Instruktioner till ansökningsformuläret i Prisma: Tidskriftsbidrag 2018

Rekommendation till dokumentsamordnare för insamling av forskningsmaterial. Dnr 1-453/2014

Bedömningskriterier vid anställning och befordran

Bedömningskriterier för finansiering av forskning vid HKR

MOA Workshop: Att utveckla publiceringsstöd. Greta Quesada Richardsson, Ika Jorum, Karolina Karjalainen

Kapitel 4 Behandling av personuppgifter Sida 1 av 5

Samlad expertis för bästa finansieringsutfall. Birgitta Larsson Forskningsservice Lunds Universitet

Etiska aspekter inom ST-projektet

Vetenskapsrådets generella villkor för beviljade medel till forskning och forskningsstödjande verksamhet

Slutrapport. Arbetsgruppen för Högskolans e-publicering. Till Forum för bibliotekschefer, Sveriges universitets- och högskoleförbund (SUHF)

Anvisning om bevarande och gallring av forskningshandlingar

Transkript:

Pass 2: Datahantering och datahanteringsplaner Datahanteringsplaner Ämnet för den här presentationen är datahanteringsplaner, ett praktiskt verktyg för att få kontroll över sin datahantering och se till att den är relevant för projektet man arbetar med. En första sak att tänka på är att hur en datahanteringsplan ser ut och vad den innehåller beror på i vilken fas av forskningsprocessen den skrivs och används. En datahanteringsplan som skrivs som del av en ansökan ser annorlunda ut än en som används under projektet eller en som färdigställs vid projektslutet. Det kan vara en bilaga som finansiären kräver ska lämnas in i samband med ansökan om forskningsmedel för att visa att frågor kring datahantering och -tillgängliggörande har tänkts igenom. Men datahanteringsplanen kan även vara ett dokument som forskaren aktivt använder under forskningsprocessen som stöd för en ordnad hantering av data. Mot slutet av ett projekt kan planen formuleras med hänseende till långtidsbevarande och innehålla relevant information för ett datarepositorium, dataarkiv och sekundäranvändare. Internationellt finns det allt fler finansiärer som har krav på att en datahanteringsplan ska ingå när man skriver en ansökan om forskningsmedel. I dagsläget så ska sådana datahanteringsplaner antingen vara en bilaga till ansökan och är då begränsade i längd, eller så är de skrivna som en del i själva ansökan. I båda fallen rör det sig alltså om korta planer. Finansiärerna vill inte sitta och läsa enormt långa planer för ansökningar oavsett om dessa beviljas medel eller inte, och forskarna vill skriva så korta planer som möjligt eftersom de vill utnyttja utrymmet i ansökan till att beskriva projektet. De vill inte lägga tid och utrymme på att diskutera hur data ska hanteras i ett projekt som kanske inte ens får finansiering, inte minst eftersom det till syvende och sist inte kommer hänga på datahanteringsplanens utformning om man får några forskningsmedel. Idag råder det inte konsensus bland finansiärer om vad datahanteringsplaner som lämnas in i samband med medelsansökan är. Deras anvisningar beskriver sådant som går långt utöver vad en datahanteringsplan kan förväntas innehålla, eller tar bara upp vissa aspekter, som till exempel tillgängliggörande av data. I en utlysning från 2017 skulle datahanteringsplanen omfatta hur man tänkte hantera data, publikationer, eventuell programvara 1

och pedagogiskt material som skulle tas fram inom projektet, samt hur man avsåg att publicera eller tillgängliggöra dessa. Det rörde sig således om en datapubliceringsplan lika mycket som en datahanteringsplan. Faktum är att finansiärer ofta är mer intresserade av hur forskare tänker tillgängliggöra sina data än hur de ska hanteras. I vilket fall som helst är planen som skrivs i en ansökan alltså en ganska kort historia som är till för att demonstrera att man är medveten om eventuella behov och problem som skulle kunna dyka upp. För forskarna fyller den också en annan, väsentlig, funktion: den ger en anledning till att tänka igenom de behov och kostnader som kan uppstå på grund av datahantering. Vissa delar av datahantering kostar pengar, och genom att skriva en datahanteringsplan i ett tidigt skede så kan man lägga in resursbehoven i projektbudgeten. Kanske behöver man köpa in hårdvarukrypterade hårddiskar och låsbara skåp, eller betala för en datahanterare i projektet. Under forskningsprojektet är datahanteringsplanen tänkt att fungera som en arbetsplan och ett levande dokument som kompletteras och utvecklas under projektets gång. Om forskaren skrev en plan i samband med finansieringsansökan kan den planen användas som en grund men behöver kompletteras med ytterligare detaljer. Det är viktigt att understryka att det i princip aldrig är för sent att påbörja en datahanteringsplan. Planen är tänkt att vara ett stöd för forskaren under hela forskningsprocessen. Den ska vara så detaljerad som den behöver vara för att man ska kunna hålla ordning på datahanteringen i projektet och dokumentera projektets data. Den bör omfatta exempelvis rutiner för säkerhetskopiering, principer för versionering och dokumentation av olika beslut och varför man fattat dessa. Helst ska man också veta vem som ansvarar för vad i projektet, inklusive vem som uppdaterar datahanteringsplanen, för det här är ett dokument som behöver uppdateras löpande. Beslut från början av projektet kan komma att förändras och anpassas under projektets gång, till exempel när man inser att man samlar in data från ytterligare en skola och hur ska man hantera dessa, eller att man vill inkludera en ny sorts analys som kräver andra datatyper. Behov kan tillkomma, situationer förändras, eller så inser man helt enkelt att allt inte fungerade på det sätt man ursprungligen tänkt sig. I slutet av forskningsprocessen behöver man se till att datahanteringsplanen innehåller all väsentlig information om hur data ska bevaras långsiktigt, hur 2

de ska tillgängliggöras, vad som förändras med data när de väl har arkiverats eller långtidsbevaras. Ofta ligger sådana planer inbakade i de normala rutinerna för ett datarepositorium det är fallet på SND till exempel men det finns de som diskuterar det här som datahanteringsplaner också. Så man behöver vara medveten om att det kan betyda olika saker och att olika sorters datahanteringsplaner kräver olika engagemang från forskaren. Datahanteringsplanen till finansiären kan skrivas ihop ganska snabbt under arbetet med ansökan, medan en plan som används aktivt under forskningsprocessen är mer tidskrävande och är ett levande dokument som behöver hållas aktuellt under hela projektet. Horisont 2020 Inom EU:s ramprogram Horisont 2020 har man gått tämligen långt i sina krav på såväl den plan som bifogas ansökan som på den plan forskaren använder aktivt under forskningsprocessen, och de rekommenderar att man använder sig av verktyget DMP Online för att sätta ihop planerna. En H2020-ansökan ska innehålla information om vilka standarder man tänker använda och hur man tänker dela eller tillgängliggöra data. Om man inte kan dela eller tillgängliggöra data ska man ange varför. Man ska även beskriva hur data ska långtidsbevaras och kureras så att de kan utnyttjas i framtiden. Får man väl finansiering för ett H2020-projekt så ökar kraven på datahanteringsplanen. Öppna data är grundinställningen även om det finns möjlighet att avstå, och en aktiv datahanteringsplan är en obligatorisk leverabel, det vill säga ett dokument som ska lämnas in och godkännas som en rapport eller ett resultat från projektet. Datahanteringsplanen ska lämnas in under projektets första sex månader. Planen ska omfatta hanteringen av data, vad det är som samlas in och i vilken omfattning, vilka metoder och standarder som tillämpas för datahanteringen och hur data ska tillgängliggöras och långtidsbevaras. Det finns tydliga likheter med den plan som ingår i ansökan men man förväntas vara mycket mer utförlig och mer konkret i vad man avser att göra och vilka överväganden man har gjort. En första version av planen ska alltså lämnas in som leverabel under det första halvåret, så man behöver med andra ord sätta igång med att ta fram planen tämligen omgående. Tanken är förstås att man vill uppmuntra till att datahanteringsplanen används i projektet och att planen hålls levande och uppdaterad: sker det förändringar i form av nya 3

dataset, i form av nya policyer eller på grund av externa faktorer så ska datahanteringsplanen uppdateras. Den ska också uppdateras åtminstone inför halvtidsrapportering och slutrapportering. Inom Horisont 2020 försöker man med andra ord att genom krav få datahanteringsplaner att skrivas, användas och uppdateras inom projekten. Utifrån de H2020-datahanteringsplaner som man kan hitta online finns det emellertid anledning att tro att inte alla projekt utnyttjar planerna på bästa sätt. Du hittar en länk till mer information om datahantering i Horisont 2020 under presentationen. Innehåll i datahanteringsplaner Vad är det då som kan ingå i en datahanteringsplan? Jag säger kan, för exakt innehåll beror på vilken disciplin det rör sig om, hur projektet är utformat och vilka data som samlas in i det. SND har tagit fram en checklista som ett stöd för att skriva datahanteringsplaner, men den kommer vi till i en senare presentation. Här får du en kort översikt över vad som kan tas upp i en datahanteringsplan. Någon form av databeskrivning bör finnas med: vad det är för data man samlar in, hur mycket man samlar in, hur snabbt växer de och så vidare. Ytterst påverkar det här vilka tekniska behov man har för att kunna samla in och lagra projektets data behöver man stora hårddiskar eller ett enormt serverutrymme för att kunna hantera datamängderna, eller räcker det med vad man normalt har tillgång till på sitt lärosäte? Man bör även nämna något om huruvida det finns andra dataset som redan har samlats in av en själv eller någon annan och som är relevanta för projektet. Det här är i princip motsvarigheten till att ta upp tidigare forskning i en vetenskaplig publikation, det vill säga en fråga om god forskning lika mycket som om pengar. Lagring och datahantering på kort sikt det vill säga under själva projekttiden är också något som behöver övervägas, och så är det förstås de etiska och juridiska övervägandena. Finns det över huvud taget några sådana? Datahanteringsplanen är ett bra ställe att börja fundera kring detta: o Man ska åtminstone ställa sig frågan om huvudmannaskap: det är en enkel fråga om man är en forskare på ett lärosäte, för då är det lärosätet som är huvudman. Men så fort projektet inkluderar flera lärosäten eller parter så behöver man 4

fundera över vem som är huvudman för vilka data, och var ansvaret för personuppgifter ligger. Om man använder data från andra myndigheter, från vården, privata företag, kanske från främmande länder, vem är då huvudman? Behöver man upprätta avtal om det? o Kommer man att handskas med personuppgifter eller känsliga personuppgifter? Behöver man använda informerade samtycken? Ska projektet genomgå etikprövning? o Inom vissa projekt kan det vara viktigt att fundera kring informationsklassning i gott om tid: hur känsliga data rör det sig om, och hur behöver de hanteras på grund av det? De flesta lärosäten har riktlinjer på det här området men inte alla. o Finns det frågor om upphovsrätt som man behöver förhålla sig till? o Riskerar det att förekomma Non-Disclosure Agreements, avtal om att man inte får sprida information i data hur som helst för att det kan finnas företagshemligheter eller motsvarande? I så fall, vem kan underteckna sådana å projektets vägnar och bör de undertecknas utan att lärosätets jurist har konsulterats? Eller, för doktorander, åtminstone handledaren? Det finns ett fall där en doktorand skrev under ett Non-Disclosure Agreement som sedan visade sig vara så strängt formulerat att intervjuerna var oanvändbara, eftersom risken att universitetet skulle kunna bli ersättningsskyldigt helt enkelt var för stor. Hur tänker man kring tillgängliggörande och datapublicering? Vilket är det bästa sättet för det material man ska samla in, och behöver man planera insamlingen så att det faktiskt är möjligt? Kan man ta utsnitt ur dataset för publicering? Det kan vara en god idé att fundera på det här i förväg eftersom det eventuellt kan finnas krav på publicering av underliggande data i vissa tidskrifter, och då är det bra om man tagit hänsyn till kraven. Om hela datamängden måste tillgängliggöras och man har glömt att inhämta samtycke kan man bli tvungen att kontakta informanterna på nytt. Alternativt behöver man gå igenom och avidentifiera alla data, vilket kan ta lång tid med stora dataset och kvalitativa data. 5

Arkivering och bevarande bör planeras så att man gör det lätt för sig redan från början att bevara på lång sikt och kom ihåg att för svenska arkiv är den långa sikten i princip obegränsad, för all framtid. Det är också en bra idé att i en datahanteringsplan för ett större projekt skriva in vem som ansvarar för datahantering i projektet. Kom ihåg att datahanteringsplaner ska fylla två syften: det ena syftet är att de ska fungera som stöd för forskare i deras datahantering och ska göra forskningen effektivare och mer problemfri. Det andra är att de ska förse arkiv, datarepositorier och sekundäranvändare av data med relevant information. Att glömma det ena eller andra syftet riskerar sluta i en plan som inte är användbar för någon. En forskare som betraktar datahanteringsplanen som en administrativ pålaga har inte stor nytta av den! Sammanfattning I den här presentationen har jag tagit upp att en datahanteringsplan är ett verktyg som kan användas före, under och efter ett projekt för att planera och beskriva hur data ska hanteras. De ser olika ut beroende på var i forskningsprocessen som de kommer in, men under projektet är de levande dokument som ska uppdateras efter behov. De kan innehålla diverse information beroende på projektets disciplin, storlek, datatyper med mera, men det är viktigt att komma ihåg att de ska vara till nytta både under projektet och när data lagras och återanvänds. Nästa presentation kommer att ta upp några centrala områden inom datahantering. Referenser DMP Online: https://dmponline.dcc.ac.uk/ European Commission. Research & Innovation. Participant Portal H2020 Online Manual: http://ec.europa.eu/research/participants/docs/h2020- funding-guide/cross-cutting-issues/open-access-data-management/datamanagement_en.htm 6