Svensk nationell datatjänst, SND BAS Online

Relevanta dokument
Pass 4: Metadatastandarder

Pass 2: Datahantering och datahanteringsplaner

Svensk nationell datatjänst, SND BAS Online

Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online

Engelska åk 5 höstterminen 2013

- Kan skriva grundläggande information utifrån sig själv t.ex. personnummer, adress, telefonnummer etc.

Att söka information (med betoning på Internet)

Programmera och hitta buggarna. Se video

Korp. Övningar Språkbankens höstworkshop oktober 2016

Pass 2: Datahantering och datahanteringsplaner

Svensk nationell datatjänst en infrastruktur för forskningsdata inom samhällsvetenskap, humaniora och medicin

Vetenskapsrådets syn på Forskningsdata

BLOCK 1. 1A. Att komma igång

Språkbanken: lite historia. Språkbanken och Korp: Mot en språkteknologibaserad forskningsinfrastruktur. Språkbanken vad, för vem, till vad?

Sovra i materialet. Vad är viktigt? Vad kan tas bort? Korta ner långa texter.

Öppen tillgång Nationella riktlinjer

Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

SVENSKA FÖR INVANDRARE

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Användarhandledning DORUM

Anvisningar till rapporter i psykologi på B-nivå

Handledning och checklista för klarspråk

Snabbguide till Cinahl

Förskolans kommunikationsmiljö

Förslag den 25 september Engelska

Projektplan. Digitalisering av Kattresan

SND-forum 14 nov Transfers of research data to National Archives and use of our data for research. Magnus Geber

Svensk Nationell Datatjänst

Lektion 3. Anteckningar

Språk, datorer och textbehandling

Söka, värdera, referera

Marie Gustafsson. Böcker. Böcker. Tidningar och. Utskrifter

version 2.5 CONTENTO SVENSKA AB Introduktion till Kursbyggarverktyg

KN - Seminarium. (Litteratursökning)

Matris för engelska, åk 7-9

Söka artiklar i CSA-databaser Handledning

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar

Karp. Övningar Språkbankens höstworkshop oktober 2016

TFYY51 Informationssökning

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt

Sö ka litteratur i ERIC

Samhällsvetenskapliga tankebegrepp

Välkommen att träna skriva!

Skrivträning som fördjupar den naturvetenskapliga förståelsen Pelger, Susanne

Övergripande principer för dokumentation. SND Svensk nationell datatjänst

Kursbeskrivning med litteraturlista HT-13

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013

5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk.

Högskolan Kristianstad Kristianstad Tfn Fax

Skriv bättre i jobbet. En liten guide till hur du får fram ditt budskap bättre.

Språk, datorer och textbehandling

Seminarieuppgift 2 appar Utvärderings modell

Kvalitativa metoder II

Pass 5: Dokumentation av forskningsdata

Bibliotekets kurser i informationssökning för studenter och doktorander

Vad kan man förbereda inför e-arkivering

V I G Å R I G E N O M...

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

Dokumentation från nätverksträffen Boosta LF 2 december 2016

PRESENTATIONSSTÖD. Ledarnas syn på lön

Varför behöver man vara källkritisk?

Fakta om robotar VAD HANDLAR BOKEN OM? LGR 11 CENTRALT INNEHÅLL SOM TRÄNAS ELEVERNA TRÄNAR FÖLJANDE FÖRMÅGOR. Lärarmaterial EVA MOSEGAARD AMDISEN

KLARSPRÅK PÅ WEBBEN riktlinjer för webbskribenter

Lär dig engelska med bilder Mappia AB Facebook.se/mappia Twitter/mappiaab

Språkteknologi (SV2122) Föreläsning 3: Programmering i Python

Språk, datorer och textbehandling

Teoritillämpning i historisk forskning. En nätbaserad doktorandkurs i historia HT 2019

Evaluation Summary - CT3380 Grundläggande webbdesign HT05 Dan Levin

Lokal pedagogisk planering för tyska år 9

HUMANISTISKA FAKULTETSNÄMNDEN. Avancerad nivå/second Cycle

För det första. Att tänka på när man skriver en rapport. Vem är läsaren? För det andra:

Unos países hispanohablantes

FTEA21:3 Spr akfilosofi F orel asning I Martin J onsson

Unos países hispanohablantes

Open access.se underlag för styrgrupp den 16 september

Sammanställning av tillvägagångssätt och erfarenheter vid litteratursökning på uppdrag av Nationellt kompetenscentrum Anhöriga, januari 08-maj 08.

Lgr 11 Centralt innehåll och förmågor som tränas:

FORSKNINGSPLAN 4IK024 Vetenskapsmetod och teori

Titel Mall för Examensarbeten (Arial 28/30 point size, bold)

Prövning i grundläggande Engelska

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson

AEC 7 Ch av 10. Detta ska du kunna (= konkretisering)

Samverkan och nätverk inom ABM-området. Infrastruktur i samverkan. 11 november Gunnar Sahlin.

Pass 2: Datahantering och datahanteringsplaner

KN - Seminarium. Konkreta krav. Kort om kursen. Grov tidtabell HT Kurskod: 6511 Ämnesstudier, 3 sv (5 sp)

Att skriva för webbplatsen. Stöd för webbredaktörer

SPRÅKTEKNOLOGIPROGRAMMET (STP)

MÅL OCH BETYGSKRITERIER I SVENSKA

Matris i engelska, åk 7-9

Corpus methods in linguistics and NLP: Introduktion till sökverktyget Korp

Kursinformation med litteraturförteckning. Praktisk retorik 15 högskolepoäng

Skriva, presentera och opponera uppsats på läkarprogrammet Examensarbete termin 10

Vad är Svensk nationell datatjänst och hur kan det bistå dig kring forskningsdata och datahantering?

Kvalitativa metoder II. 4.

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

Engelska, år Studieplan och bedömningsgrunder i Engelska för år 7 Moment Mål innehåll Bedömningsgrund Läsa

Sök artiklar i databaser för Vård- och hälsovetenskap

Kurs-PM. Mediernas utveckling och förändring VT Tobias Olsson och Lowe Hedman

Introduktion till galaxer och kosmologi (AS 3001)

Transkript:

Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata är för något och tar upp några olika definitioner som finns. Det är inte meningen att du ska kunna alla detaljer, utan att du ska kunna visa på poängen med metadata för forskningsdata och kunna prata om det här med forskare. Jag kommer också visa lite på vilka skillnader som finns mellan data, metadata och dokumentation. Vad tänker du på när du hör ordet metadata? Du kanske har egna erfarenheter av att arbeta med metadata i någon form, och tänker på katalogisering av publikationer, arkivering av handlingar, eller kanske något helt annat. För att kunna säga något om vad metadata är, kan det vara en god idé att först titta på vad forskningsdata egentligen är. Vi har redan tagit upp det i tidigare i kursen, men här kommer ändå en liten uppfräschning av minnet. Synen på vad som är forskningsdata skiljer sig åt mellan olika institutioner och ämnesområden, men också mellan olika myndigheter och organisationer. Forskningsdata är det material som samlats in under forskningsprocessen för att tjäna som underlag till olika vetenskapliga analyser. Det kan exempelvis vara i form av siffror, databaser och text i olika former, men materialet kan också bestå av biologiska prover, fysiska samlingar, programkod, geodata och mycket, mycket mer. Som du nu vet finns det många olika typer av forskningsdata. Ibland förekommer de i fysisk form, till exempel som pappersenkäter, men ofta digitaliseras de för att underlätta hantering och förvaring. En enkel och sammanfattande definition av forskningsdata som vi använder vid SND är att forskningsdata är något som analyseras i ett vetenskapligt syfte för att besvara en vetenskaplig frågeställning. Vilka typer av data som det handlar om kan därför variera kraftigt. 1

Metadata Så om vi återgår till det här med metadata. Vad är det för något? Det mest banala svaret är att metadata är ett ord med 8 bokstäver. Antalet bokstäver är då metadata om själva ordet metadata. Metadata kan definieras på olika sätt. I boken Metadata av Jeffrey Pomerantz som du hittar i kursens litteraturlista så definieras metadata som a statement about a potentially informative object 1. I det här sammanhanget motsvarar det potentiellt informativa objektet forskningsdata. Metadata är alltså nånting som säger nånting om forskningsdata. En något mer rättfram definition kommer från National Information Standards Organization i USA. De säger att metadata är structured information that describes, explains, locates, or Widder, Oliver (2010) otherwise represents something else 2. I det här fallet är something else lika med forskningsdata. Ytterligare en definition som ibland används är att metadata är the sum total of what one can say at a given moment about any information object at any level of aggregation 3. Det här är en definition som fångar in allt som beskriver objektet i fråga och på alla nivåer. Ett mer klatschigt sätt att sammanfatta de här ganska krångliga definitionerna är att säga att metadata är data om data. Det är också den vanligaste och enklaste definitionen man stöter på. Vi ska nu titta på begreppen data och metadata i förhållande till vad som är vad. När man pratar med forskare är det viktigt att tänka på att vi, beroende på tidigare erfarenheter, kan ha olika föreställningar om vad som är det ena och vad som är det andra. Vid en första anblick kan det verka som att det är 1 Pomerantz, Jeffrey. (2015) 2 National Information Standards Organization (U.S) (2004) 3 Gilliland, Anne J. (2014) 2

ganska lätt att hålla isär vad som är data och vad som är metadata. Det ena är ju det material som samlas in och analyseras av en forskare och det andra är information om det insamlade materialet. Fast om man tänker på uppdraget att tillgängliggöra forskningsdata för ny forskning, så kan ju data som samlats in för ett syfte återanvändas av en annan forskare för ett nytt syfte. Det innebär att det som är data för den ene mycket väl kan vara metadata för den andre. Vad som är vad beror på forskningsfrågan och vad man har definierat som analysenhet för sin forskning. Ett exempel på det här är Språkbanken. Språkbanken är en forskningsinfrastruktur som samlar in enorma mängder text till såkallade korpusar, som de publicerar på sin webbplats. I Språkbankens korpussökverktyg, kan man göra ganska avancerade språkvetenskapliga sökningar. Till exempel går det att söka på alla förekomster av ett visst substantiv i bestämd form. I det här exemplet tittar vi på ordet skolan. I en mening från tidningen Åbo Underrättelser 2012 kan man läsa: skolan renoveras, personal anställs men den slutar kort därefter eftersom lönen aldrig betalas ut. Språkbanken ger oss exempel på var det här förekommer i olika tidningar och andra texter som de har hämtat från internet och diverse andra källor. De här sökningarna bygger på att det finns information om att det är bestämd form på ett visst ställe. Så alla de här texterna har blivit uppmärkta med information om varje ord som talar om att just det här ordet, skolan i det här fallet, är ett substantiv, det är bestämd form, det är singularis och det har en viss funktion i meningen, till exempel är det ett subjekt. Det finns också länkar till ett lexikon som säger att ordformen i fråga hör till ett visst uppslagsord. I lexikonet finns det mycket information om varenda ord i de här textmängderna. All den här uppmärkningen som berättar allt runt omkring ordet kan tyckas vara typisk metadata eftersom det säger något om det här ordet, som i sig utgör data. Så är fallet för någon som forskar om byggnadsvård och från den här meningen kan få reda på att en viss skola har renoverats. Så är också fallet för någon som forskar om personalen eller personalpolitiken på skolan i fråga. 3

MEN för en forskare som är intresserad av grammatik är kanske själva ordet tämligen ointressant och det är informationen om att det är ett substantiv i singularis som är subjekt till ett passivt verb som är det intressanta och som är data. Så vad som är data och metadata beror liksom på. Är man intresserad av innehållet i texterna är uppmärkningen metadata. Men om man är intresserad av formen är det snarare uppmärkningen som faktiskt är data. Av det här exempel förstår vi att vad begreppen data och metadata betyder beror på vilken forskning som bedrivs och att det är viktigt att vara medveten om vad som är vad för att undvika missförstånd och för att ha en gemensam terminologi när man pratar metadata med forskare. Dokumentation Ett annat begrepp som kan vara bra att reflektera över är dokumentation. I många fall används metadata och dokumentation som synonyma begrepp. Fast det finns faktiskt vissa skillnader. För en forskare kan dokumentation ofta vara ett mer lättförståeligt begrepp än metadata, för man har kanske hört betydligt mindre om metadata. I den mån det ändå finns en skillnad mellan dokumentation och metadata kan man säga att metadata är strukturerade för att kunna läsas av både människor och datorer. Ett sätt att göra det på är att använda XML-scheman som består av standardiserade termer. Dokumentation behöver däremot inte vara maskinläsbar och har inte alls samma krav på struktur. Exempel på dokumentation kan vara exempelvis forskningsrapporter, artiklar och metodbeskrivningar. Sammanfattning I den här presentationen har jag börjat med att introducera begreppet metadata. Vi har gått igenom olika exempel på definitioner, där det enklaste sättet är att säga att metadata är data om data. Vi har också problematiserat gränsdragningen mellan vad som är data, vad som är metadata och vad som är dokumentation och att man behöver känna till att det som är metadata för någon kanske är data för en annan, och kanske dokumentation för en tredje. 4

Referenser Widder, Oliver (2010) Meta. Geek & Poke: http://geek-andpoke.com/geekandpoke/2010/4/17/meta.html (Hämtad 2018-03-01) Pomerantz, Jeffrey. (2015). Metadata. Cambridge, MA: MIT Press. s.26 National Information Standards Organization (U.S) (2004) Understanding Metadata: https://www.lter.uaf.edu/metadata_files/understandingmetadata.pdf (Hämtad 2018-03-01) Gilliland, Anne J. [2014]. Setting the stage, in Introduction to Metadata. Los Angeles: Getty Research Institute. www.getty.edu/publications/intrometadata/setting-the-stage/ (Hämtad 2018-03-01) 5