Datahantering och tillgång till forskningsdata Ilze Lace, forskningssamordnare ilze.lace@gu.se Elisabeth Strandhagen, forskningssamordnare elisabeth.strandhagen@gu.se Svensk Nationell Datatjänst, SND
Svensk Nationell Datatjänst Uppdrag från Vetenskapsrådet, Göteborgs universitet värduniversitet En serviceorganisation för svensk forskning inom humaniora, samhällsvetenskap och medicin & hälsa Uppdrag att bevara och tillgängliggöra forskningsdata ( dataarkiv )
Svensk Nationell Datatjänst Nationella och internationella samarbeten Samlar och delar metadata om olika databaser, men också information om datatyper, filformat mm. Medlemskap i DataCite
Svensk Nationell Datatjänst Bidrar till den teknologiska utvecklingen av standarder, metoder och verktyg för dokumentering och tillgängliggörande av data Erbjuder stöd under hela forsknings-processen
Varför göra forskningsdata tillgängliga? För att data ska användas mer effektivt För att bli citerad i meriteringssyfte (DOI) Demokrati och transparens
Varför göra forskningsdata tillgängliga? Pga krav från finansiärer: Open Access, H2020 Andra finansiärer Svenska nationella riktlinjer (VR, Utbildningsdepartementet) Pga krav från tidsskrifter
Svenska nationella riktlinjer Öppen tillgång till vetenskaplig information = publikationer, metadata och data Forskningsdata som ligger till grund för vetenskapliga publikationer, samt vetenskapliga publikationer och konstnärliga verk, som är resultatet av offentligt finansierad forskning, ska vara öppet tillgängliga. För forskningsdata är målbilden inte tidsbestämd, utan vi säger att all forskningsdata som, helt eller delvis, tas fram med offentliga medel görs öppet tillgängliga så snart det är möjligt.
Skäl att inte tillgängliggöra data? Vad säger etikprövningen? (kan prövas igen) Vad står det i samtycket? (kan inhämtas igen) Sekretess (efter sekretessprövning) Intellektuella skäl (embargotid)
Var kan jag tillgängliggöra data? Lokalt vid lärosätet Dataarkiv (SND) Publiceringsplattformer
God datahantering Utan god datahantering är Open Access till forskningsdata bara ett luftslott Björn Halleröd, huvudsekreterare för VR:s råd för forskningens infrastrukturer
Datahantering Med datahantering menas hur forskningsmaterialet hanteras, organiseras och struktureras under hela forskningsprocessen. Utförlig och strukturerad beskrivning av data innebär visst merarbete men lönar sig om man skulle behöva gå tillbaka för att verifiera analys och resultat. Det är också helt avgörande för långtidslagring och tillgängliggörande av materialet.
God hantering av data sparar tid gör forskningen effektivare bidrar till kontroll förenklar åtkomst till data (när man behöver dem, i rätt format, och aktuell version) underlättar samarbetet och datadelning inom forskargruppen (tydliga rutiner, ansvarsområden, dokumentation etc.) förbereder data för arkivering och förmedling
REWARD 1,000 cash My laptop and external hard drive were removed from my office xxx xxxxxxxxxx, in August 29. If you have found the external hard drive, PLEASE CALL ME (xxxxxxxxxxx) (Och denna forskare från London School of Economics är inte ensam men få forskare vill förstås gå med i den här klubben om de kan slippa) The drive contains many years of my teaching and research files, so I need it desperately
Tänk dig följande Du har avslutat din forskning och publicerat ett antal rapporter för att visa upp dina resultat. Rapporterna har refererats av andra och deras forskning har baserats på dina forskningsresultat. Efter ett par år ifrågasätter plötsligt en annan forskare dina data och dina metoder
Kan du bevisa att du gjort arbetet som du beskrivit? att datamaterialet inte är falsifierat? Vad borde du ha gjort under forskningsprocessen för att i efterhand kunna bevisa att arbetet skedde som du beskriver? Finns det något sätt/verktyg som kan hjälpa dig om en sådan situation skulle uppstå?
Datahanteringsplan (DMP) Att skapa en datahanteringsplan är ett effektivt sätt för forskaren att få kontroll över hur data ska hanteras under forskningsprocessen. Med ett strukturerat datamaterial, som dessutom är väldokumenterat, blir det också enklare för andra att sätta sig in i materialet.
Datahanteringsplanen - inför ansökan Internationellt Flera finansiärer ställer krav på att forskaren ska skriva en datahanteringsplan i samband med ansökan om finansiering. Beroende på finansiär och ämnesområde varierar kravet på innehåll i datahanteringsplanen. Nationellt Inget krav i nuläget men finns på agendan hos flera finansiärer - troligen ökade krav framöver
Datahanteringsplanen - inför ansökan Varför? Finansiären vill säkerställa att data kommer att hanteras på ett bra sätt under projektet och att de kan återanvändas efter projektets slut. Datahanteringsplanen som skrivs till finansiären bör t.ex. innehålla information om: - vilka data som projektet ska generera/samla in - hur data skall hanteras under projektets gång - hur data planeras att långtidsbevaras och resonemang kring hur data ska tillgängliggöras efter projektet.
Datahanteringsplanen under projektet Varför? Ger forskaren och forskargruppen bättre kontroll och översikt över materialet Skapar förutsättningar för att data hanteras säkert och systematiskt Tydliga rutiner och principer kring hur datamaterialet ska hanteras och vem som ansvarar för olika delar underlättar samarbete med kollegor och att introducera nya medarbetare.
Datahanteringsplanen vid projektslut Varför? Säkerställer att data och dokumentation förbereds för arkivering Ser till att alla relevanta aspekter kring tillgängliggörande är utredda och att materialet är dokumenterat så att återanvändning är möjlig
Datahantering genom hela forskningsprocessen Var konsekvent! När det gäller organisering av data såsom mappstrukturer, versionering och filnamngivning Tänk framåt! När det gäller teknik, dvs lagringsmedier, säkerhetskopior och filformat Gör begripligt! När det gäller metadata. Tänk på dokumentation, metadatastandarder och att bra metadata innebär att datamaterialet blir lättare att hitta, identifiera samt dela.
Färdigställa och bevara data Projektstart Datainsamlingsfasen Dataanalysfasen Tillgängliggörande av data D A T A H A N T E R I N G S P L A N Inför ansökan Under projektet Vid projektslut
DMP ska innehålla info om: Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Forskningsområde Typ av material Vilket skede i processen Krav från finansiär
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Administrativa uppgifter - Projektnamn - Projektbeskrivning - Finansiering - Primärforskare - Huvudman - Producent - etc
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Juridiska aspekter - Etikprövning - Informerat samtycke - Upphovsrätt - Avtal med andra aktörer - Skydd av respondent - Etc
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Beskrivning av materialet som ska användas - Typ av data - Befintligt material - Datainsamling (när, var, hur) - Insamlingsmetod
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Rutiner kring dokumentation - Vilken dokumentation - Vilken metadata - Metadatastandard - Terminologier, ontologier etc.
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Hur ska data hanteras under projektet? - Mappstruktur - Organisering av data - Filnamn - Versionering - Filformat - Lagring och backup - Informationsklassning och säkerhet
Exempel på mappstruktur Huvudprojekt Huvudmapp för publikation (T.ex. titeln) Dokument Data Program Resultat Ansökan om forskningsmedel Etikansökan Analysplan Analysloggbok Variabellista Manusversioner etc. Dataset Bearbetade datafiler Frågeformulär samt annan viktig information relaterad till datainsamlingen/ registerdata/ labbanalyser etc. Filer från statistikprogram som leder fram till forsknings-resultat i den statistiska analysen etc. Resultat från programfilerna, figurer, tabeller, grafer etc. README En textfil med övergripande information om projektet och beskrivning av mappstrukturen. Denna är till för att läsaren ska få en överblick och kunna orientera sig i materialet.
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Vad krävs för att hantera data säkert och strukturerat? - Kostnad för personal - för att dokumentera materialet - för databearbetning - för datahantering - Lagring - Hårdvara och mjukvara
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Planera för hur data och material ska lagras och bevaras på sikt. - Vad ska arkiveras enligt Arkivlagen? - Lämpliga filformat för långtidsbevarande? - Bevara vid ett dataarkiv?
Administrativa uppgifter Juridik och etik Insamling/produktion av data Dokumentation och metadata Datahantering under projektet Kostnader Långtidsbevarande och arkivering Tillgängliggörande av data Planera för tillgängliggörande av datamaterialet - Var, när och hur? - Arkiv, universitetet, forskargruppen själv? - Hela/delar av materialet? - Citering? - PID?
New possibilities and demands Possibilities to obtain citations research impact Demands from scientific journals to provide access to data avoid research fraud, gain richer results Demands from funders to provide data management plans and access to data Swedish researchers being competitive
Current challenges to qualify for research funding and paper publishing Build awareness through policies and doctoral programme syllabi. Support systems for the researchers. Electronic infrastructures for safe and efficient data curation, long-term preservation and access. Legal advisory capacity (laws, ethics, commercial rights).
Swedish Research Data System building scalable distributed capacity for the future The suggested system consists of four modules: Module 1: Swedish Research Data Repository Module 2: Swedish Research Data Portal Module 3: The National Knowledge Centre Module 4: Research Data Collaboration