METADATA ENLIGT DUBLIN CORE

Relevanta dokument
F R O R D. Stockholm i december Katja KerŠnen. E-post: katja.keranen@swipnet.se

Personuppgifter pœ Internet. Undantag frœn fšrbudet i 33 personuppgiftslagen

Lšneadministration Handbok

F RMEDLARANSVAR INTERNET

Utbildning via Internet

TESAURUSKONSTRUKTION I ÄMNET LANDSKAPSPLANERING

Mobilister och nallar i forskningens tjšnst Jan Einarsson

Auktioner pœ Internet

not notismœl NUTEK NŠrings- och teknikutvecklingsverket prop proposition ref referat

MILJ BALKENS EFTERBEHANDLINGSANSVAR FASTIGHETS GARE

Barnets ršttigheter utifrœn barnets rštt att komma till tals

EgenmŠktighet med barn

Samband mellan resurser och resultat

R 1998 ref 58 I-III ršrande finansiell leasing Ð en analys och kommentar ur inkomstskatteršttsligt perspektiv

ELEKTRONISKA MNESGUIDER

Friskrivningsklausuler En jšmfšrelse av svensk och italiensk rštt

Finansiella rådgivares ansvar

WIPO:s tvistlšsningssystem fšr tvister gšllande

dess fšrhœllande till konkurrensrštten

Social kompetens/všrdegrund

DatortillŠmpningar. Det har hšnt nœgot!

Entreprenšrens kvalitetssškringsansvar

Störningsupplevelse av buller i klassrum

UtvŠrdering av North Swedens verksamhet Œren

BESITTNINGSBEGREPPET

1 Inledning 2 2 Aktieboken 3

Jan Einarsson, Barns sprœk i klassamhšlle denna version 2000, Studentlitteratur och fšrfattaren. Barns sprœk i klassamhšlle Jan Einarsson

Alternativa vœrdformer

Enkšping-HŒbo TrŠdgŒrdssŠllskap Hšsten 2013 PROGRAM H STEN Enkšping-HŒbo TrŠdgŒrdssŠllskap

1 INLEDNING BAKGRUND SYFTE PROBLEMFORMULERING METOD OCH MATERIAL INKOMSTSKATTELAGEN DISPOSITION...

Konkursbos ansvar fšr konkursgšldenšrens miljšfarliga verksamhet

kylskåp BRUKSANVISNING ERM

Stiftelsernas skattskyldighet

i fœmansbolag - en jšmfšrelse av ršttslšget beskattningsœren 1999 och 2000 med anledning av stopplagstiftningens avskaffande

- Sjuklšneproblematiken fšr smœ fšretag - 1 INLEDNING Bakgrund Problemanalys Problempresentation Problemformulering 5

George Blecher Thorstein Veblen och en kavaj av bšsta tweed

Kan man lita pœ fšrvaltningsbeslut?

I vems intresse? Programmet fšr Juris kandidat-examen/ Fšretags- och Fšrvaltningsjuridisk linje. TillŠmpade studier 10 p.

HISNANDE HISTORIER: FRÅN BELLMAN TILL BATMAN.

Jan Einarsson, Gud och attityd. Ett perspektiv pœ sprœk och kšn denna version 2000, Studentlitteratur och fšrfattaren.

UTL MNANDE AV UPPGIFTER UTAN PATIENTENS SAMTYCKE

Betalningar med e-pengar

Informationshantering och -spridning på Axis Communications AB

JŠmfšrelse av reglerna om uppehœllstillstœnd och avvisning fšr EU/EES- och tredjelandsmedborgare

Informationsförsörjning för nya högskolor

SYSTEMUTVECKLING. - en jšmfšrelse mellan teoretiska modeller och ett praktikfall

VILKEN ROLL SPELAR L SNING F R PATIENTER P SJUKHUS?

MervŠrdesbeskattning av všrdepappersbolags tjšnster

Bolagsordningen i fšrsvaret mot

StrategifšrŠndring vid en bšrsintroduktion

Jan Einarsson, Offentlig privathet i nšrradion denna version 2000, Studentlitteratur och fšrfattaren. Offentlig privathet i nšrradion Jan Einarsson

Maj Sofia Kolmodin

Den nya bibliotekariens kompetens

Lšnekostnader i fœmansfšretag

Lennart Carlssons svenska šversšttning av. Material fšr arbetsseminariet i Stockholm samt

GrŠnsdragningen mellan ršnta och kapitalvinst Mot bakgrund av R 1995 ref 71 och R 1997 ref 44 Per-Arvid Gustafsson

Fakturering Kund & Leverantšrsreskontra. Handbok

Newtons metod i en och flera variabler

GrŠnsšverskridande konkurser och utlšndska tilllgœngars betydelse vid insolvensbedšmningen

Fšreningsstyrelsens ansvar

SKADEST ND ENLIGT LAG OM OFFENTLIG UPPHANDLING

ISBN Artikelnr

Informationsregler pœ Stockholms, Kšpenhamns och Oslos Fondbšrs

Hinder och ŒtgŠrder fšr kvinnans tillgœng till ršttssystemet

a. didoner b. ellipstecken c. gif d. kapitšler e. pica f. rastertšthet g. serif h. spšrra i. stycketecken

Berit Funke Henrik Strandberg

Liv & hälsa. en undersökning om hälsa,levnadsvanor och livsvillkor

Revisorns funktion och ansvar vid revision i aktiebolag

Temadag på CID Användarcentrerad systemutveckling och kravhantering

Beskattning av derivatinstrument inom aktiebolagssektorn

Malmš stadsbiblioteks nya informationsdiskar

Aktiebolagens kapitalvinstbeskattning - sšrskilt om begreppet verklig fšrlust

Öka säkerheten med hjälp av olycksfall

Kabel-TV-distributionen i Sverige ur ett yttrandefrihetsperspektiv InnehŒllsfšrteckning

SWEBU. Svensk byggforskning pœ World Wide Web (Swedish Building Research on the World Wide Web) "De globala nštverkens mšjligheter i byggforskningen"

2 GLOBALISERINGSPROJEKT...

Vad tyckte du om grundutbildningen?

SERFIN 2. Per Christiansson Gustav Dahlstršm Bengt Eresund Hans Nilsson Fredrik Stjernfeldt , slutrapport

Agenda 21 en exempelsamling

För ett offensivt miljöarbete i Halland

OK 611:3. Kollektiv olycksfallsförsäkring

Kan EG-rŠttens spšrrverkan hindras?

Vem bär skulden? Förhållande mellan U-hjälp och skuldåterbetalning till IMF: Genomsnitt i de fattigaste länderna: 2,77 ggr (1998)

VerksamhetsberŠttelse

KUNSKAPSHUS ELLER OFFENTLIGT VARDAGSRUM?

TEKNISK BAKSYN RIGHETER ATT F RUTSE FRAMTIDEN

Tillverkningshemligheter och

Implementeringen av artikel 11, om bestšllning, i e-handelsdirektivet till svensk rštt.

EN R TTVISANDE BILD AV BIBLIOTEKEN?

Unga mäns och kvinnors arbetssituation

Goda exempel pœ landsbygdstrafik i Europa

El- och bildskärmsöverkänslighet en tvärvetenskaplig studie

Varfšr ett profilprogram?

Logikprogrammering. KŠnnetecken. Exempel pœ relation. Relationer. Varianter. KŠnnetecken och fšrutsšttningar Prolog

1. Inledning. 1 Jag kommer att i de flesta fall omtala partiet som (v), namnbytena till trots.

HushŒllens finansiella tillgœngar, skulder, nettofšrmšgenhet och nysparande. Det bundna sparandets (fšrsškringssparande) andel av sparportfšljen

Teknik - och forskningsparker Industriell förnyelse

Tendenser i vänsterpartiets manifestvokabulär Jämförande studier av lexikala förändringar

Principskiss av vingbalk

ISO/IEC Riktlinje 22 och EN Owa 3-chome, Suwa-shi, Nagano-ken 392- Japan

Transkript:

METADATA ENLIGT DUBLIN CORE Tillämpningar och konsekvenser i de svenska kvalitetssöktjänsterna SAFARI, Svenska miljönätet och Svesök. Marita Fagerlind Gunilla Gisselqvist Examensarbete (20 poäng) för magisterexamen i Biblioteks- och informationsvetenskap vid Lunds universitet. Handledare: Birgitta Olander, Jörgen Eriksson, Colm Doyle BIVILs skriftserie 1999:11 ISSN 1401-2375 Lunds universitet. Biblioteks- och informationsvetenskap 1999

ABSTRACT This study investigates the individual usage of the Dublin Core metadata format in three Swedish Subject-Based-Information-Gateways, SAFARI, Svenska miljšnštet and Svesšk. The authors also present the reader with an overview of the metadata concept and explains in particular the Dublin Core Element Set. The approach to the study is investigation of Dublin Core application from the viewpoint of three major issues, user friendliness, interoperability and quality control. The study includes an in-depth comparison of the three different metadata templates, as well as interviews with people in charge of the metadata production at the respective SBIGs and users of the respective SBIGs«templates. The study shows that the three SBIGs are more similar than they are different. They have all succeeded in designing their templates in a user-friendly way. The relatively minor differences between the three will most likely not interfere with their mutual interoperability. In conclusion, the authors find that a quality controlled web environment appears imperative to ensure the success of the Dublin Core metadata format. In an environment of this kind, the Dublin Core format, with its general appeal of simple yet adequate resource description, may very well change the structure of Internet resources for the better. 1

F RORD Vi vill inleda med att tacka de personer som hjšlpt oss i arbetet med uppsatsen. Fšrst och fršmst vœr handledare Birgitta Olander fšr det stšd och den inspiration hon gett oss. Ett stort tack ocksœ till Jšrgen Eriksson och Colm Doyle pœ LUB NetLab, utan vars kunskaper vi hade haft svœrt att sštta oss in i Šmnet DC-metadata. Vi vill ocksœ tacka ansvariga fšr de sšktjšnster vi samarbetat med under arbetets gœng. Martin Sparr pœ SAFARI, Annica Moshiri pœ Svenska miljšnštet och Lotta Jansson, Anette Svensson och Christina Tšrnqvist-Westin pœ Svesšk. Det har varit en glšdje att arbeta tillsammans med personer som varit sœ tillmštesgœende och positivt instšllda till vœrt arbete. Slutligen tackar vi de metadataproducenter och alla andra inblandade som stšllt upp och svarat pœ vœra e-postfrœgor. Lund 1999-06-29 Marita Fagerlind och Gunilla Gisselqvist 2

INNEHÅLLSFÖRTECKNING 1. INLEDNING... 5 2. SYFTE OCH FRÅGESTÄLLNINGAR... 7 3. METOD OCH AVGRÄNSNINGAR... 9 4. LITTERATURGENOMGÅNG...12 4.1 METADATA...12 4.2 THE DUBLIN CORE ELEMENT SET...15 4.2.1 Qualifiers...19 4.2.2 RDF och The Warwick Framework...21 4.2.3 Dublin Core Workshops...21 4.3 SAMORDNINGSFÖRSÖK...25 4.4 Z39.50...25 4.5 DUBLIN CORE I FRAMTIDEN...27 5. PRESENTATION AV SÖKTJÄNSTERNA...28 5.1 SAFARI...28 5.1.1 Innehåll och målsättning...28 5.1.2 Kvalitetskriterier...29 5.1.3 Inmatningsformulär...29 5.2 SVENSKA MILJÖNÄTET...31 5.2.1 Innehåll och målsättning...31 5.2.2 Kvalitetskriterier...32 5.2.3 Inmatningsformulär...33 5.3 SVESÖK...34 5.3.1 Innehåll och målsättning...34 5.3.2 Kvalitetskriterier...35 5.3.3 Inmatningsformulär...36 6. RESULTATREDOVISNING...38 6.1 SAMORDNINGSFÖRSÖK...38 6.1.1 Val av metadataformat...38 6.1.2 Lokala varianter och språkbruk...39 6.1.3 Inställning till interoperabilitet...52 6.1.4 Sökmöjligheter...52 6.1.5 Granularitet...54 6.2 ANVÄNDARVÄNLIGHET...54 6.2.1 Formulärens utformning...54 6.2.2 Dialog med användarna...56 6.2.3 Hjälpfunktioner och användarutbildning...56 6.2.4 Användarnas upplevelser...56 6.2.5 Webbproducentens insatser vad beträffar inmatning av metadata...58 6.3 KVALITETSKONTROLL...59 6.3.1 Kontroll av innehåll och metadata...59 7. ANALYS OCH DISKUSSION...60 7.1 SAMORDNINGSFÖRSÖK...60 7.2 ANVÄNDARVÄNLIGHET...64 7.3 KVALITETSKONTROLL...67 8. SLUTSATSER...69 3

ORDLISTA OCH FÖRKORTNINGAR...71 KÄLLFÖRTECKNING...74 BILAGOR Bilaga 1: SAFARI:s inmatningsformulär Bilaga 2: Svenska miljönätets inmatningsformulär Bilaga 3: Svesöks inmatningsformulär Bilaga 4: Metadata om uppsatsen 4

1. INLEDNING Orsaken till valet av uppsatsšmne Šr vœrt relativt nyvšckta intresse fšr elektronisk informationsutveckling. Vi Šr bœda flitiga InternetanvŠndare och fascineras av de mšjligheter detta medium erbjuder. Samtidigt har vi, liksom mœnga andra, reagerat šver den brist pœ struktur som rœder pœ nštet och som i sin tur leder till irritation, tidsspillan och stšndiga missfšrstœnd. Detta mšrks inte minst nšr man fšrsšker hitta information genom de mœnga sšktjšnster som finns pœ nštet. Med sškningarna tillkommer en ansenlig mšngd brus samt onšdiga upprepningar av olika sidor inom samma sajt i tršfflistorna. Vi tyckte Martin Sparr i sšktjšnsten SAFARI uttryckte oordningen pœ Internet pœ ett mœlande sštt: ÒOrdning pœ Internet, behšvs det? TŠnk om ett bibliotek tillšt alla všrldens fšrfattare att stšlla in sina egna bšcker pœ vilken hylla som helst och dessutom Šndra i innehœllet lite dœ och dœ och stšlla bšckerna pœ olika hyllor frœn ett Œr till ett annat. Vilken ršra det skulle bli! Det Šr dšrfšr lite konstigt att vi tillœter detta pœ Internet.Ó 1 Blivande bibliotekarier och informationsvetare som vi Šr, bestšmde vi oss fšr att undersška nœgot som skulle kunna bringa ordning i detta kaos. Det skulle alltsœ vara šnskvšrt med nœgon sorts ordning pœ Internet motsvarande den som finns pœ bibliotek. PŒ bibliotek katalogiseras varje bok och annat medium av en bibliotekarie. Det Šr dock omšjligt att gšra samma sak pœ Internet. Inget bibliotek eller annan institution har tillršckliga resurser fšr att ta itu med denna oerhšrt omfattande marknad av information. I vœra efterforskningar kom vi dock i kontakt med uttrycket metadata och insœg att detta fenomen hade stora fšrvšntningar pœ sig att uppfylla just det vi, och mœnga med oss, funderat šver. Vi bestšmde oss fšr att fšrdjupa oss i Šmnet och valde det format som kallas Dublin Core, eftersom det Šr sœ nšra en standard man kan komma idag. Metadata gœr i korta drag ut pœ att katalogisera elektroniska dokument pœ Internet och idžn med Dublin Core handlar om att alla som skapar ett elektroniskt dokument ocksœ ska kunna mšrka det med metadata och pœ sœ vis ordna sjšlv med katalogiseringen. Detta tjšnar alla parter pœ. Informationssškaren hittar de dokument som intresserar honom/henne och dokumentproducenten nœr fram med den information han/hon vill fšrmedla. Bruset kommer att avta avsevšrt. Det tog oss en ansenlig tid att sštta oss in i Šmnet, som vi till en bšrjan fann svœrgenomtršngligt. Vi har stštt pœ en stor mšngd ord och uttryck vi inte tidigare var bekanta med och som vi i vœr tur haft vissa besvšr med att Œterge i begripliga termer fšr icke insatta i Šmnet. Det Šr vœr fšrhoppning att bœde specialintresserade och mindre bevandrade inom omrœdet ska kunna ta till sig innehœllet i uppsatsen. Vi har i mšjligaste mœn fšrsškt fšrmedla Šmnet pœ ett enkelt och lšttfattligt sštt. Det finns enligt vœra erfarenheter en djup klyfta mellan professionella inom Šmnet och lekmšn. Eftersom syftet med DC-formatet Šr 1 Sparr, Martin. SAFARI. <URL: http://www.hsv.se/verksamhet/utredningar/safari/metadata.html> 981130 5

att gemene man ska kunna lšra sig att mšrka sina dokument med metadata, tycker vi det Šr av všrde att fšrmedla kunskap om Šmnet och sœ lœngt det Šr mšjligt avmystifiera det. Det finns fler metadataformat Šn Dublin Core. Vi kommer dock inte beskriva dessa p.g.a. tidsbrist. De intresserade kan lšsa om dem i Nordiska metadataprojektet 2. Vi vill fšrtydliga att vi i uppsatsen synonymt anvšnder oss av uttrycken Internet, nštet, www och webben. Vi Šr dock medvetna om skillnaden i betydelse mellan begreppen. Den har vi redogjort fšr i ordlistan. Dublin Core Šr ett metadataformat anpassat fšr internationella fšrhœllanden, varfšr s.k. elementnamn, qualifiers m.m. Šr pœ engelska. Det finns i dagslšget ingen vedertagen svensk šversšttning av DC-termer. De projekt vi undersškt i uppsatsen har i vissa fall šversatt termerna till svenska. Detta har resulterat i flera varianter av šversšttningar. Vi har dšrfšr valt att sœ konsekvent som mšjligt anvšnda de vedertagna engelska uttrycken i vœra diskussioner. NŠmnvŠrt Šr att Svenska miljšnštets inmatningsformulšr 3 Šndrades i slutskedet av uppsatsskrivandet. Utskrifter av de tre sšktjšnsternas inmatningsformulšr, sœsom de sœg ut HT 98, Œterfinns dšrfšr som bilagor. 2 Hakala, Juha. Medfšrfattare: Hansen, Preben. Husby, Ole. Koch, Traugott och Thorborg, Susanne. The Nordic metadata project Final report. 1998. Kapitel 1.2.1 Evaluation of existing metadata formats. <URL: http://linnea.helsinki.fi/ meta/nmfinal.htm> 981130 3 Se ordlistan. 6

2. SYFTE OCH FRÅGESTÄLLNINGAR Metadata ršner idag stort intresse, bœde i Sverige och utomlands. Formatet har dock Šnnu inte nœtt nœgon avsevšrd utbredning, utan tillšmpas idag mestadels i mindre projekt. Tanken och fšrhoppningen inom branschen Šr dock att metadata ska fungera i ett stšrre sammanhang pœ Internet sœ smœningom. Fšr att detta ska vara ekonomiskt och praktiskt genomfšrbart kršvs att webbproducenten sjšlv mšrker sina dokument med metadata. Detta innebšr en stor frihet. Webbproducenten kan i princip anvšnda vilka Šmnesord som helst fšr att beskriva sin resurs. Missbruk av metadata resulterar i att tršffarna fortfarande inte blir logiska och brusfaktorn i princip riskerar att bli densamma som utan metadata. Risk fšr missfšrstœnd fšreligger ocksœ. NŠr man fšrsta gœngen anvšnder sig av ett inmatningsformulšršr det inte sjšlvklart hur man korrekt ska fylla i det. Fšr att undvika missbruk och missfšrstœnd kršvs nœgon form av kvalitetskontroll. Med denna diskussion som bakgrund har vi i uppsatsen studerat tre svenska kvalitetssšktjšnster. Syftet med undersškningen har varit att fšrsška ta reda pœ hur sšktjšnsterna fšrhœller sig till dessa tre aspekter: Samordningsfšrsšk (interoperabilitet 4 ) DC stršvar efter att bli en standard och sjšlva meningen med en standard Šr att den ska kunna fungera i ett stšrre sammanhang, alltsœ att den ska kunna appliceras i flera sšktjšnster samtidigt. Skulle det vara mšjligt att samsška i de tre sšktjšnsterna idag och vad gšrs fšr att detta ska bli en realitet? AnvŠndarvŠnlighet (anvšndare = de som matar in metadata) Om metadata ska fungera i ett stšrre sammanhang pœ nštet kršvs att webbproducenten sjšlv mšrker sina dokument med metadata. Vilka Šr fšrdelarna respektive nackdelarna med detta? Vad har sšktjšnsterna gjort fšr att underlštta fšr anvšndarna? Kvalitetskontroll (bœde vad betršffar innehœll och metadatamšrkning) Syftet med metadata Šr att informationssškaren ska fœ relevanta tršffar pœ sina sškfrœgor, alltsœ Šr kvalitetskontroll av bœde innehœll och metadatamšrkning av yttersta vikt. Det gšller att undvika missbruk och missfšrstœnd. Har sšktjšnsterna mšjligheter att lšgga ner resurser pœ kontroll av innehœll och metadatamšrkning och i sœ fall i vilken utstršckning? FrŒgestŠllningarna lyder som fšljer: Hur har de undersškta sšktjšnsterna valt att utforma sina inmatningsformulšr? Vad har detta fœtt fšr konsekvenser vad betršffar samsškningar? Hur anvšndarvšnligt Šr inmatningsformulšren utformade? Existerar nœgon form av kvalitetskontroll inom sšktjšnsterna? 4 Se ordlistan. 7

Hur skulle DC-metadata kunna fungera i ett stšrre sammanhang pœ Internet? VŒrt syfte har ocksœ varit att lšttfattligt men likvšl relativt ingœende fšrklara begreppen metadata och Dublin Core. Detta i ett fšrsšk att ge den oinvigde en bakgrund i Šmnet samt att ge en inblick i den aktuella diskussionen. 8

3. METOD OCH AVGRÄNSNINGAR Begreppet metadata var oss inte helt obekant nšr vi valde uppsatsšmne. VŒra kunskaper var dock hšgst begršnsade, varfšr vi fick lšgga ner mycket tid pœ att sštta oss in i Šmnet och pœ att hitta lšmpliga resurser, som dessutom innefattade ett sprœk som vi kunde ta till oss. Det mesta vi lšst har varit pœ engelska och skrivet pœ ett sprœk som innefattat fackuttryck som vi haft svœrt att šversštta till motsvarande svenska termer. MŒnga resurser om metadata Šr dessutom skrivna pœ ett tekniskt komplicerat sštt och eftersom vi Šr humanister hade vi vissa svœrigheter att sštta oss in i denna nya begreppsvšrld. Det som intresserade oss var metadata som informationsstruktur, men ofelbart stršvade den utvalda litteraturen mot beskrivning av tekniken bakom, dšr vi till en bšrjan kšnde oss bortkomna. Allt eftersom uppsatsen tog form har vi dock lyckats tillskansa oss vissa tekniska kunskaper. Vi har sedermera anstršngt oss att Œterge dessa pœ en nivœ som Šven den tekniskt oinvigde ska kunna ta till sig. Vi har dessvšrre sett oss nšdgade att begršnsa den tekniska beskrivningen nœgot. De vanligast fšrekommande fšreteelserna har vi satt oss in i och lagt vikt vid att beskriva, men fšrsškt att inte gœ fšr djupt in pœ detaljer, som i sin tur ofelbart skulle lett till ytterligare krav pœ teknisk beskrivning. mnet metadata Šr under utveckling, varfšr vi huvudsakligen koncentrerade oss pœ att hitta litteratur pœ Internet. Tryckt litteratur innebšr ofta att Šmnet redan Šr pœ všg in i nšsta utvecklingsfas, dœ man efter tryckning och utgivning slutligen lšser verket. Vi startade alltsœ med att grundligt lšsa om metadata i allmšnhet och DC-metadata i synnerhet med hjšlp av Internetresurser. Det har varit intressant att lšsa om Šmnet pœ Internet av den anledningen att informationen har varit ny eller nyligen uppdaterad. Vi har verkligen kšnt att vi befunnit oss mitt i en utvecklingsprocess och mšrkt hur innehœllet Šndrat karaktšr, ibland bara šver en natt. Detta har samtidigt vœllat oss visst huvudbry, dœ vi kšnt oss manade att hela tiden ha den snabba utvecklingen under uppsikt. Ett annat problem med att švervšgande lšsa Internetresurser var att lšsupplevelsen ofta blev splittrad, dœ nštet hela tiden erbjuder referenser hit och dit, vilka vi kšnde oss manade att fšlja upp och undersška. Det hšnde att vi gick vilse bland lšnkarna och inte hittade tillbaka till utgœngsresursen. Vi anser detta till trots att Internetresurserna varit ovšrderliga och valt att fokusera mest pœ dem. Vi har Šven till viss del lšst bšcker och tidskriftsartiklar. Problemet med snabb utveckling kontra dœlig uppdatering gjorde sig dock allt som oftast pœmint. I litteraturgenomgœngen har vi inte refererat till alla kšllor vi lšst inom omrœdet, dœ mycket av informationen Œterkommit gœng pœ gœng. Vi har valt att basera innehœllet pœ nœgra fœ men omfattande och informativa kšllor. Orsaken till att vi koncentrerat oss pœ formatet Dublin Core Šr att vi genom vœra studier uppfattat att detta Šr sœ nšra en standard man kan komma idag. DC Šr det mest utbredda av metadataformaten och i dagslšget har ganska mœnga projekt runt om i všrlden bšrjat tillšmpa det fšr katalogisering av elektroniska resurser. Eftersom vi samarbetade med NetLab 5, som Šr engagerade i DC:s utveckling, fšll ocksœ valet naturligt pœ detta format. DC Šr ocksœ sšrskilt utbrett i Norden, vilket var ytterligare en bidragande orsak till vœrt val. 5 Se ordlistan. 9

Vi hade klart fšr oss att vi ville undersška hur DC fungerar i praktiken och bestšmde oss sœlunda fšr att nšrmare studera ett antal projekt som valt att tillšmpa formatet. Genom resurslistor pœ Internet lyckades vi hitta ett trettiotal internationella metadata-databaser, som vi systematiskt gick igenom fšr att hitta lšmpliga studieobjekt. Anledningen till att vi valde bort flertalet av dessa beror pœ flera faktorer. Projekten var uppbyggda pœ vitt skilda sštt. Vissa anvšnde sig av nœgot annat metadataformat Šn DC. Flera projekt var uppbyggda pœ ett sštt som vi upplevde som svœrtillgšngligt och komplicerat. Vidare innehšll vissa varken nœgon sšktjšnst eller lšnksamling, varfšr vi hade svœrt att fšrstœ syftet med projekten. Somliga var dessutom sœ pass nystartade och befann sig pœ ett utvecklingsstadium, som gav ett ostrukturerat och ibland kaotiskt intryck och i fšrlšngningen skulle gšra en undersškning komplicerad. Vidare fanns det de projekt som anvšnde sig av DC:s grundidž utan nœgon egen variant alls, varfšr hela pošngen med vœr undersškning fšrfelades, dœ syftet med den var att gšra en jšmfšrande studie mellan olika lokala varianter av DC-tillŠmpning. I vissa fall lyckades vi inte ens ta reda pœ vilket inmatningsformulšr som tillšmpades. NŒgra projekt anvšnde sig visserligen av DC, men kombinerade detta med ett eller flera andra metadataformat, vilket gav ett mycket omfattande material att bearbeta och som av den anledningen avskršckte oss. Efter denna fšrsta utrensning kvarstod ett antal svenska, europeiska och australiensiska projekt. Dessa gick vi igenom relativt detaljerat. De utlšndska projekten var: Ariadne 6 EdNA 7 Mathnet 8 NewsAgent for Libraries 9 SSG-FI 10 Medical Metadata Projekt 11 Dessa projekt var samtliga intressanta ur metadatasynpunkt. De var dock utformade sœ pass olika samt att vissa innehšll DC-metadata som skilde sig en hel del frœn den standard vi studerat. Ur detta perspektiv fann vi det svœrt att nšrmare analysera projekten. Vi skickade dock e-post till ansvariga fšr vissa av projekten med intressefšrfrœgningar, men fick ingen respons, varfšr vi valde bort Šven dessa. Vi koncentrerade oss istšllet pœ Sverige och detaljstuderade ett antal projektbeskrivningar pœ Internet och blev glatt šverraskade šver deras všlstrukturerade samlingar samt relevanta tillšmpning av DC-elementen. Vi bestšmde oss slutligen fšr att koncentrera oss pœ dessa tre svenska kvalitetssšktjšnster: SAFARI 12. Spridning av forskningsinformation till allmšnheten šver Internet. Svenska resurser. 6 <URL: http://ariadne.unil.ch/> 981030 7 <URL: :http://www.otfe.vic.gov.au/edna/dc5edna.htm> 981030 8 <URL: http://www.math-net.de/> 981030 9 <URL: http://www.sbu.ac.uk/litc/newsagent/> 981030 10 <URL: http://www.sub.uni-goettingen.de/ssgfi/> 981030 11 <URL: http://medir.ohsu.edu/~maletg/medmetadata.htm> 981030 (dšd lšnk 990121) 12 <URL: http://www.hsv.se/verksamhet/utredningar/safari/index.html> 981230 10

Svenska miljšnštet 13. Miljšdata, miljšstatistik och miljšinformation med relevans fšr miljšarbetet i Sverige. Svesšk 14. KB:s rikstšckande sšktjšnst som fršmst všnder sig till biblioteken. Vi kontaktade ansvariga fšr respektive projekt med fšrfrœgan om intresse fšr deltagande i vœr undersškning samt intervjuer fanns, och fick omedelbar och positiv respons frœn samtliga. PŒ ett tidigt stadium hyste vi fšrhoppningar om att arbeta med och jšmfšra ett tiotal projekt. Allt eftersom undersškningen av de potentiella studieobjekten fortlšpte, insœg vi det orealistiska i att ta pœ oss ett allt fšr stort antal. Resultatet riskerade att bli splittrat och endast en ytlig undersškning av varje projekt skulle kunna komma till stœnd. Valet av de tre svenska všlstrukturerade och genomtšnkta sšktjšnsterna gav oss en mšjlighet att i detalj fšrkovra oss i respektive projekt. Undersškningen fortlšpte sedan pœ fšljande sštt; dels detaljstuderade vi projektens inbšrdes sšktjšnster, lšnksamlingar, metadataformulšr samt lšste deras projektbeskrivningar pœ Internet, dels utformade vi e-postintervjuer till respektive sšktjšnst. Dessa formulerades delvis olika, dœ projektbeskrivningarna pœ Internet gav oss olika mycket information, vilket resulterade i att vi fick frœga om de luckor i informationen som uppstod vid studierna av projektbeskrivningarna. Intervjuerna Šr alltsœ ett led i vœr faktainsamling. E-postintervjuerna fick vi omedelbar respons pœ och har funnit samtliga tre projekt mycket givande att arbeta med. De tre utvalda projekten lšmpade sig všl fšr en undersškning, dœ de var relativt stora och etablerade. Visserligen ganska nystartade, men ŠndŒ med tillršckligt mycket resurser fšr att fungera i ett analyserande perspektiv. Alla tre hade dessutom utformat sina egna varianter av metadataformulšr, vilket gjorde en jšmfšrelse dem emellan intressant. Vi fšrdjupade oss i hur anvšndarvšnligt inmatningsformulšren hade utformats i respektive sšktjšnst, genom att bl.a. genomfšra en anvšndarundersškning. Vi nšjde oss med att skicka ut en kortare e-postenkšt till nœgra av dem som har anvšnt sig av sšktjšnsternas inmatningsformulšr. Av svaren valde vi att bearbeta fyra enkšter inom varje projekt. Det hade varit všrdefullt med en mer omfattande undersškning vad betršffar anvšndarvšnlighet, eftersom det Šr av stšrsta vikt att inmatningsformulšren anpassas fšr anvšndarnas ŠndamŒl, men p.g.a. tidsbrist och ett redan ganska omfattande material, var vi tvungna att begršnsa undersškningen. nskvšrt hade ocksœ varit att gšra en omfattande undersškning om hur všl tršffarna stšmmer šverens med sškfrœgorna. Av ovan nšmnda orsak har vi Šven hšr valt att gšra en avgršnsning. 13 <URL: http://smn.environ.se/> 981230 14 <URL: http://www.svesok.kb.se/> 981230 11

4. LITTERATURGENOMGÅNG 4.1 METADATA Som alla som har provat vet, Šr det svœrt att hitta relevanta dokument i en sškning pœ nštet. Webben Šr stor och det finns ingen ÓhylluppstŠllningÓ, inga kataloger och ingen uppenbar ordning. Paul Miller skriver i artikeln ÓMetadata for the massesó om hur sškningarna pœ Internet blir fel dœ man inte kan kategorisera sškorden, d.v.s. kunna bestšmma om ordet man sšker pœ Šr t.ex. ett personnamn, en ort eller en tidskrift 15. Om man t.ex. vill hitta en avhandling, och allt man vet Šr att fšrfattaren heter Lund i efternamn, och sšker pœ ÓLundÓ i AltaVista fœr man 380863 tršffar som handlar om allt frœn tiderna fšr Flygbussarna Malmš-Lund till vad de tror pœ i Pingstkyrkan i Lund. Sškmotorerna lyckas producera massor av resultat pœ en sškfrœga, men det Šr dšremot svœrt att fœ relevanta tršffar. Och fšr att fœ just relevanta tršffar mœste man kunna kategoribestšmma sškningarna d.v.s. Ótala omó fšr sšktjšnsten att det Šr just ett personnamn man letar efter. Fšr att kunna gšra denna urskiljning i sškningarna mœste det finnas motsvarande urskiljningar i beskrivningarna av dokumenten som sškmotorn letar bland, annars blir det ingen tršff. Hur gšr man dœ en sœdan dokumentbeskrivning? Jo, med hjšlp av metadata. Ordet ÓmetaÓ betyder diskussion kring den egna formen. Metadata betyder sœledes data om data. Man kan kalla det en form av katalogisering. Metadata har dock kommit att handla om data om elektronisk data, d.v.s. katalogisering av webbresurser. Det finns ingen standardiserad definition av ordet. Roy Tennant beskriver det i en artikel som strukturerad information om information 16, medlemmar i UKOLN Metadata Group kallar det data som beskriver resursens egenskaper eller utmšrkande drag 17, Tim Berners-Lee definierar det som maskinbegriplig information om webbresurser och annat 18 och Priscilla Caplan anser att det helt enkelt Šr ett annat ord fšr katalogisering 19. En sak kan man dock konstatera, metadata och katalogisering Šr inte riktigt synonyma begrepp. Katalogisering Šr ett ord som hšr hemma speciellt i bibliotekskretsar och innefattar tryckt eller Œtminstone fysiskt material, medan metadata Šr resursbeskrivning av elektroniska objekt, fšretršdesvis pœ Internet. Metadata har dšremot ingenting med metasškverktyg eller metasšktjšnst att gšra, dœ dessa Šr sškverktyg eller sšktjšnster vars sškrobotar sšker i flera databaser Šn en. Meningen med metadata, hur man Šn definierar ordet, Šr informationsbeskrivning och informationsœtervinning, d.v.s. att beskriva ett objekt pœ ett sœdant sštt att det sœ lštt som mšjligt gœr att Œterfinna, precis som med traditionell katalogisering. Ett resultat av metadata, och den huvudsakliga anledningen till att det finns metadata, Šr alltsœ att fšrbšttra sškbarheten fšr innehœllet pœ Internet. Man kan sšga att metadata Šr ett sštt att gšra data pœ webben till information. Dock kan man inte enbart hšnvisa till den ordning som 15 Miller, Paul. Metadata for the masses. 1996. <URL: http://www.ariadne.ac.uk/issue5/metadata-masses/> 981030 16 Tennant, Roy.Ó21st Century CatalogingÓ. Library Journal. 123(7) 15 april 1998, s.30. 17 UKOLN (UK Office of Library Networking) Metadata Group. An Overview of Resource Description Issues. 1998. <URL: http://www.ukoln.ac.uk/metadata/desire/overview/rev_01.htm> 981030 18 Berners-Lee, Tim. Metadata Architecture. 1998. <URL: http://www.w3.org/designissues/metadata.html>981030 19 Caplan, Priscilla. ÓYou call it corn, we call it syntax-independent metadata for document-like objectsó. The Public-Access Computer Systems Review 6. 1995(4). <URL: http://info.lib.uh.edu/pr/v6/n4/capl6n4.html> 981030 12

rœder pœ ett bibliotek nšr man refererar till den oordning som rœder pœ Internet. Internet Šr ju faktiskt inte ett enda stort virtuellt bibliotek, vilket Šr ganska lštt att uppfatta det som. En av de stora skillnaderna Šr att Internet inte Šr centralstyrt. SŒ som bibliotekarier sedan lšnge katalogiserat nyinkomna bšcker, sœ kan ingen katalogisera nya dokument pœ Internet. Dock behšvs bibliotekariers kunskap i sammanhanget. Clifford Lynch skriver i sin artikel ÓSearching the InternetÓ att Internet Šr en kaotisk blandning av allt mšjligt som gœr att lšgga ut pœ nštet, fšrutom textdokument, bilder, rapporter, menyer, reklam o.s.v. FortsŠtter det att všxa och frodas som ett nytt kommunikationsmedel, pœpekar han vidare, sœ kommer det traditionella bibliotekets kunskaper om hur man organiserar information behšvas. Men Šven om sœ Šr fallet kommer nštet dock inte att likna ett traditionellt bibliotek eftersom innehœllet Šr mer vidgœende Šn en standardiserad bibliotekssamling. DŠrfšr, menar Lynch, behšvs bœde bibliotekarier och tekniker i samarbete kring utvecklingen av Internet 20. Ó... Consequently, the librarian«s classification and selection skills must be complemented by the computer scientist«s ability to automate the task of indexing and storing information. Only a synthesis of the different perspectives brought by both professions will allow this new medium to remain viable.ó 21 I dagslšget saknas en faststšlld standard fšr metadataformat fšr webbresurser. Och hur skulle en sœdan standard se ut? Hur bšr metadata produceras och vad Šr viktigt att ha med i en webbresursbeskrivning? Hur specifik och detaljrik kontrasterat enkel och lšttfattlig bšr den vara? I biblioteksvšrlden finns MARC-katalogisering vilken Šr sig ganska lik všrlden šver men nœgot sœdant finns inte pœ Internet, fšrutom helt generellt att metadatabeskrivningar ska klistras in under namnet ÓMETA NAMEÓ mellan <HEAD> och </HEAD> i ett dokuments HTMLkod 22. Paul Miller skriver att mœnga av de metadataformat som finns idag Šr sœ specialiserade och komplicerade att de inte passar som beskrivning av allmšnna resurser 23. Dublin Core Šr dšremot en modell av metadata som kan beskriva just majoriteten av resurserna pœ Internet. DŠrfšr har ocksœ Dublin Core vunnit gehšr internationellt och Šr pœ god všg att bli en standard. Martin Sparr pœ SAFARI spœr att Dublin Core Ó...blir sannolikt standard inom en snar framtid, vilket kommer att ška anvšndningen ytterligare.ó 24 En anledning kan vara att Dublin Core har uppstœtt just kring samarbete mellan bl.a. bibliotekarier och tekniker. Men kanske framfšr allt fšr att det Šr anvšndbart fšr att beskriva sœ mœnga olika typer av objekt. Alla s.k. Ódokument-liknande objektó 25 kan beskrivas med Dublin Core-metadata, d.v.s. inte endast textdokument, utan ocksœ bilder, musikfiler m.m. Speciellt bibliotek och museer har visat stort intresse fšr Dublin Core. Metadata Šr alltsœ inte enbart en biblioteksfrœga. Att t.ex. objekten pœ ett museum Šr kopplade till en textbeskrivning Šr ganska angelšget eftersom alla sšktjšnster Šr textbaserade. 20 Lynch, Clifford. ÓSearching the Internet, Combining the skills of the librarian and the computer scientist may help organize the anarchy of the Internet.Ó Scientific American. 1997. <URL: http://www.sciam.com/0397issue/0397lynch.html> 981030 21 Ibid. 22 Se ordlistan. 23 <URL: http://www.ariadne.ac.uk/issue5/metadata-masses/> 981030 24 <URL: http://www.hsv.se/verksamhet/utredningar/safari/metadata.html> 981230 25 FrŒn engelskans Ódocument-like objectsó. 13

UKOLN Metadata Group upp en annan och tšmligen ny aspekt av metadata, en mšjlighet att ha metadata om mšnniskor, om kurser, om olika forskningsinstitutioner och andra ÓobjektÓ 26. Detta fšr att sšktjšnster ska kunna leta efter resurser som matchar en speciell anvšndarprofil, eller sška efter personer med ett speciellt forskningsintresse etc. Ett problem med metadata Šr hur den ska produceras och av vem. Det finns c:a 300 miljoner Óadresserbara objektó 27 pœ Internet idag, och antalet všxer hela tiden vilket gšr det ganska orimligt att nœgon organisation eller bibliotek skulle ta sig an det omfattande arbete det innebšr att beskriva alla dokument. Det fšrefaller dšrfšr rimligt att anta att den som producerar ett webbdokument bšr vara den som beskriver det, d.v.s. lšgger in metadata om det. Det ligger trots allt i dessa s.k. dokumentproducenters intressen att deras resurser blir lšttare Œtersškta och dšrmed mer lšttœtkomliga. Dock riskerar man eventuellt en viss kvalitetssšnkning av metadata nšr man lœter nœgon som inte Šr insatt i begreppet katalogisering sjšlva katalogisera. Juha Hakala, Ole Husby och Traugott Koch skriver i en artikel att Šven om dokumentproducenterna i stor utstršckning lšgger in metadata pœ sina dokument, p.g.a. det stora antalet dokument, kommer specialistkatalogisatšrer troligtvis att fortsštta katalogisera kvalitetsdokument med lœng livslšngd. Men, pœpekar de, vem som Šn lšgger in metadata Šr det viktigt att den šverhuvudtaget skapas och att den Šr interoperabel 28 : Ó...a richer metadata provision is the most important step needed to improve the quality and precision in automatic resource discovery and retrieval tools.ó 29 Med automatisk indexering menas alltsœ att det Šr en sškmotor som všljer ut resultaten av en sškning. I motsats till detta kan man stšlla mšnsklig indexering, d.v.s. nšr en katalogisatšr gšr motsvarande urskiljning ur ett material. Eftersom materialet att sortera ur, d.v.s. dokumenten pœ Internet, Šr sœ omfattande Šr det automatisk indexering som rœder just nu, eftersom mšnskliga insatser Šr kostbara i jšmfšrelse. Det Šr alltsœ teknologin som styr hur informationen Šr organiserad, skriver Lynch. Men en sškmotor saknar vœr mšnskliga urskiljningsfšrmœga, varfšr tekniken aldrig kan garantera kvalitet av sjšlva innehœllet i dokumenten. Metadata Šr alltsœ ett sštt att fšrsška fšrbšttra kvaliteten pœ automatgenererad indexering. Metadata kan dock aldrig ersštta mšnskliga utvšrderingar dœ dessa handlar om att gšra kvalitetsurval. I hur stor utstršckning mšnskliga indexeringsfšrmœgor eller automatisk indexering behšvs i framtiden kommer att bero pœ vem som anvšnder Internet, fortsštter Lynch. Fšr akademiker och forskare Šr modellen av en organiserad lšnksamling, d.v.s. ett digitalt bibliotek, relevant. Fšr andra grupper Šr ett oorganiserat medium det bšsta sšttet att sprida och Œtervinna information; mšnniskor som av en eller annan anledning inte vill ha data som Šr ÓfiltreradÓ 30. 26 <URL: http://www.ukoln.ac.uk/ metadata/desire/overview/ rev_01.htm> 981030 27 FrŒn engelskans Óadressable objectsó, se Šven ordlistan. Weibel, Stuart. Using Web Metadata: The Dublin Core. 1998. <URL: http://purl.oclc.org/~emiller/talks/www7/tutorial/part1/index.htm> 981030 28 Hakala, Juha, Husby, Ole och Koch, Traugott. Warwick Framework and Dublin core set provide a comprehensive infrastructure for network resource description Report from the Metadata Workshop II, Warwick, UK, April 1-3, 1996. <URL: http://wwwub2.lu.se/tk/warwick.html> 981030 29 Ibid. 30 <URL: http://www.sciam.com/0397issue/0397lynch.html> 981030 14

4.2 THE DUBLIN CORE ELEMENT SET Dublin Core Šr ett metadataformat som har utvecklats med tyngdpunkterna pœ att dokumentproducenten Šr den som sjšlv ska lšgga in metadata pœ de egna resurserna samt att utformningen Šr gjord att passa resursbeskrivningar fšr majoriteten av resurserna pœ Internet. Dublin Core všnder sig till den stora massan av dokumentproducenter och Šr tšnkt att vara lšttanvšnt och lšttillgšngligt. Den inbyggda flexibiliteten Šr ocksœ viktig eftersom olika behov frœn anvšndarnas sida av antingen enkla eller utfšrliga resursbeskrivningar ska kunna tillmštesgœs inom de gemensamma ramarna. Dublin Core uppstod 1995 pœ en workshop i Dublin, Ohio USA, genom samarbete mellan bl.a. bibliotekarier, nštverkstekniker och databasspecialister. Systemet Šr alltsœ fortfarande ganska nytt och under utveckling. I Nordiska metadataprojektet beršttas det dock att mellan Œren 1996 och 1998 har Dublin Core stabiliserats och blivit všlkšnt 31. Stuart Weibel pœ OCLC 32 Šr den som ses som DC:s drivande kraft och grundare. 1998 blev OCLC officiellt styrelse 33 fšr Dublin Core vilket betyder att OCLC officiellt stœr fšr underhœllet av Dublin Core. Dublin Core har uppkommit ur ett behov av en allmšn standard fšr elektronisk resursbeskrivning och som en kompromiss mellan alltfšr enkla automatiska resursbeskrivningar och manuella tidskršvande mšnskliga katalogiseringsinsatser. Hakala, Husby och Koch sšger vad betršffar bakgrunden till varfšr idžn om Dublin Core uppstod att: ÓAutomatically generated records often contain too little information to be useful, while manually generated records are too costly to create and maintain for the large number of electronic documents currently available on the Internet. Records created from the Dublin Core are intended to mediate these extremes, affording a simple structured record that may be enhanced or mapped to more complex records as called for, either by direct extension or by link to a more elaborate record.ó 34 Dublin Core Šr tšnkt att vara ett generellt och allmšnt metadataformat i motsats till de komplicerade och specialiserade format som redan existerar. OCLC har skapat en hemsida fšr Dublin Core dšr det informeras om DC:s uppkomst och utveckling, olika DC-publikationer och projekt som anvšnder sig av DC etc. Bl.a. stœr att lšsa fšljande om mœlsšttningen: Ósimplicity of creation and maintenance commonly understood semantics international scope and applicability extensibility 31 <URL: http://linnea.helsinki.fi/ meta/nmfinal.htm> 981130 32 Se ordlistan. 33 FrŒn engelskans ÓDublin Core DirectorateÓ. 34 <URL: http://wwwub2.lu.se/tk/warwick.html> 981030 15

interoperability among collections and indexing systems.ó 35 ven om Dublin Core syftar till att vara sœ enkelt att i princip vem som helst ska kunna anvšnda det, mœste det, eftersom Dublin Core Šr nœgot som bibliotek och museer intresserar sig fšr, Šven finnas utrymme fšr att sœ exakt och utfšrligt som mšjligt kunna beskriva dokumentobjekten. Den katalogisering som Dublin Core utgšr ska ocksœ gœ att fšrena med den katalogisering som redan existerar inom dessa organisationer. T.ex. finns det program som kan mappa 36 DC-metadata till MARC-katalogisering och tvšrtom. Dublin Core bestœr av femton beskrivningselement eller kšrnelement (core element) sœsom Subject, Creator, Publisher etc. Elementen Šr upprepningsbara, d.v.s. man kan t.ex. lšgga in antingen ett eller fem Subject-fŠlt. Inom dessa femton element finns sedan tre s.k. qualifiers (ung. bestšmningsord). Med hjšlp av dessa kan man specificera informationen i ett element. PŒ sœ sštt finns det bœde en enkelhet i utformningen samtidigt som det finns utrymme fšr specialisering. Dock finns det en konflikt mellan dessa begrepp; hur enkelt eller hur specialiserat det bšr vara. Juha Hakala beskriver hur det inom DC-kretsar finns en viss spšnning mellan s.k. minimalister och strukturalister 37. Minimalisterna vill inte ha nœgra qualifiers alls - allt fšr att det ska vara sœ enkelt som mšjligt - medan strukturalisterna vill ha mšjlighet att kunna gšra utfšrligare resursbeskrivningar och vill dšrmed ha qualifiers vilka ger stšrre finfšrdelning och precision inom respektive element. Projekt som arbetar med elektronisk publicering kan utifrœn sina behov skapa egna varianter av dessa element. De kan ta bort element de tycker Šr onšdiga, skapa egna qualifiers o.s.v. PŒ sœ sštt Šr DC ett flexibelt system. Det fšreligger dock en viss risk med detta fšrfarande. Om varianterna blir alltfšr individuellt utformade faller tanken pœ DC-formatet som standard. Program och sškrobotar kan dœ fœ problem med att hantera metadata-informationen korrekt. Vissa DC-element har tillhšrande kontrollerade vokabulšrer som visar vad man kan všlja att lšgga in i elementen, t.ex. vilka sorters dokumenttyper man kan všlja att lšgga in i Typeelementet. Detta dels fšr att fšrhindra att metadataproducenterna lšgger in ord och begrepp som ingen annan Šn de sjšlva begriper, men framfšrallt fšr att underlštta fšr programvaran i sšktjšnsterna som ska avlšsa metadatan. Den inlagda metadatan ska fungera i olika samlingar och programsystem, tvšrs šver programgršnserna. Flera kontrollerade vokabulšrer finns redan och andra Šr under utveckling. Ansvariga fšr DC:s utveckling rekommenderar att man anvšnder befintliga vokabulšrer. Nedan fšljer en sammanfattande redogšrelse fšr de femton DC-elementen. Vissa av dem Šr fortfarande under utveckling och det Šr inte helt klart hur de i framtiden kommer att anvšndas 38. 1. Title (Label: titel): Det namn fšrfattaren/fšrfattarna eller utgivaren všljer Œt dokumentet. 35 Dublin Core Metadata Initiative. <URL: http://purl.oclc.org/metadata/dublin_core/main.html> 981130 36 Se ordlistan. 37 Hakala, Juha. Dublin Core in 1997 a report from Dublin Core metadata workshops 4 & 5. <URL: http://linnea.helsinki.fi/meta/dcnord.html> 981030 38 Fšr mer information om elementen se <URL: http://purl.org/dc/about/element_set.htm> 16

2. Author or Creator (Label: Creator): Person eller organisation som ansvarar fšr skapandet av resursens intellektuella innehœll. Fšrfattare nšr det gšller skrivna dokument, fotograf nšr det gšller bild etc. 3. Subject and Keywords (Label: Subject): Kontrollerade vokabulšrer sœvšl som fria nyckelord vilka beskriver resursens Šmne eller innehœll. Detta element Šr oftast mycket utfšrligt med tillhšrande kontrollerade vokabulšrer och Šmnessystem ur vilka man všljer beskrivningsord. Det Šr viktigt att man inte anvšnder ord slumpmšssigt. mnesordslistorna gšr att resursbeskrivningarna blir sœ enhetliga som mšjligt. Man kan Šven anvšnda fria nyckelord som man tycker bšst beskriver dokumentets innehœll och med sœdana ord man tror sškes pœ. 4. Description (Label: Description): En kortare beskrivning av resursens innehœll, ofta en sammanfattning eller en abstract. 5. Publisher (Label: Publisher): Enheten som ansvarar fšr att sidan ges ut, t.ex. ett fšrlag, universitet eller fšretag. 6. Other Contributor (Label: Contributor): NŒgon som i relativt hšg grad medverkat till resursens intellektuella innehœll, men ej i lika hšg grad som fšrfattaren, t.ex. medfšrfattare, illustratšr eller handledare. 7. Date (Label: Date): Tidsangivelse fšr diverse fšreteelser: Oftast Ósidans skapandeó, ÓtillgŠngliggšrandeÓ eller ÓbŠst-fšre-datumÓ. 8. Resource Type (Label: Type): Vilken kategori resursen kan ršknas till, t.ex. hemsida, roman, essš, teknisk rapport, uppslagsverk etc. Detta element Šr fortfarande under utveckling. 9. Format (Label: Format): Fšr att kunna identifiera resursens dataformat, mjukvarans och eventuellt ocksœ hœrdvarans, i syfte att kunna anvšnda resursen. Detta element Šr fortfarande under utveckling. 10. Resource Identifier (Label: Identifier): Ett sštt att identifiera resursen, att tala om var resursen kan Œterfinnas, t.ex. URL, URN eller ISBN. Det Šr ofta meningen att man ska anvšnda URL. 11. Source (Label: Source): Information om kšllan bakom resursen, oftast en URL. 12. Language (Label: Language): SprŒket pœ resursens intellektuella innehœll. 13. Relation (Label: Relation): HŠr kan man lšnka till ÒbeslŠktadeÓ resurser, eller visa att det Šr en del av en serie t.ex. Detta element Šr fortfarande under utveckling. 14. Coverage (Label: Coverage): Resursens geografiska eller tidsmšssiga tšckning, d.v.s. vilken plats eller tidsperiod som Šr aktuell. 17

15. Rights Management (Label: Rights): RŠttigheter, oftast copywright. Detta element Šr fortfarande under utveckling. Fšr skapande av DC-metadata finns vissa hjšlpfunktioner sœsom inmatningsformulšr, anvšndarguider, stšdfunktioner etc. som ska gšra det enkelt fšr alla anvšndare att lšgga in korrekt metadata i sina dokument. Den kanske viktigaste av dessa hjšlpfunktioner Šr inmatningsformulšret. Detta genererar DC-metadata. I ett sœdant nštbaserat formulšr ligger alla elementen som fšlt, vilka dokumentproducenten fyller i med uppgifter om sitt dokument. Uppgifterna omvandlas sedan till HTML-kodade metataggar 39, vilka man klistrar in i det aktuella dokumentet, mellan <HEAD> och </HEAD>. DŒ har s.k. inbšddad metadata blivit skapad, d.v.s. metadata som rent fysiskt hamnar i det dokument som beskrivs. En metatagg kan se ut sœ hšr: <META NAME=DC.SubjectÓ CONTENT=ÓlšvgrodorÓ> Denna tagg beskriver ett dokument som innehœller Šmnet ÓlšvgrodorÓ. SjŠlva ÓMETA NAMEÓ i HTML-koden Šr standard vad gšller metadata i allmšnhet. Vad som visar att det Šr just DCmetadata i den hšr taggen Šr bokstšverna ÓDCÓ framfšr ÓSubjectÓ. Fšr att fœ en uppfattning om hur ett formulšr ser ut, kan man nšrmare studera ÓNordic DC metadata creatoró 40. Detta formulšr, skapat inom ramarna fšr Nordiska metadataprojektet, Šr det formulšr vi anvšnt i vœr jšmfšrelse p.g.a. dess generalitet. Man kan ocksœ fšrvara metadata pœ ett annat sštt, nšmligen som separat katalogpost. Metadatauppgifterna existerar dœ utanfšr dokumentet och blir ungefšr som ett elektroniskt katalogkort, och kan fšrvaras i metadata-databaser, sœsom t.ex. Nordiskt Web Index 41, fšr nšrvarande det enda helt ÓmetadatakŠnsligaÓ indexet. I en sœdan metadata-databas gšrs sškningarna enbart i metadata-informationen dšr en URL pekar mot det aktuella dokumentet. PŒ sœ sštt ligger dokumenten kvar pœ de servrar 42 dšr dokumentproducenterna har placerat dem, och sškmotorn behšver inte hšmta hela dokumenten, eller ens sška i dem fšr att kunna referera till dem. Det innebšr ocksœ att man kan skapa en metadatapost om ett dokument utan att ha tillgœng till den server dšr dokumentet ligger. I rapporten frœn Nordiska metadataprojektet beskriver Hakala m.fl. projektets syfte att utveckla olika DC-verktyg 43. Inblandade i projektet var metadata-intressenter frœn de skandinaviska lšnderna, bl.a. NetLab. Projektet var frœn bšrjan finansierat av NORDINFO 44. Fšrfattarna konstaterar att liksom sjšlva Dublin Core har nu (juli 1998) DC-verktygen en solid struktur som inte kommer att fšršndras sœ radikalt. Verktygen Šr allmšnt ganska kšnda och anvšnds av t.ex. Nordiskt Web Index och SAFARI. Andra verktyg, som hšr endast nšmns, Šr omformaren av 39 Se ordlistan. 40 <URL: http://www.lub.lu.se/cgi-bin/nmdc.pl> 990410 41 <URL: http://nwi.ub2.lu.se/?lang=sv> 990410 42 Se ordlistan. 43 <URL: http://linnea.helsinki.fi/ meta/nmfinal.htm> 981130 44 Se ordlistan. 18

Dublin Core till MARC-format 45, ett metadata insamlar- och indexeringsprogram 46 och en URN-generator (fšr mer information om dessa, se Nordiska metadataprojektet 47 ). Hakala gšr uppskattningen att det kanske tar tvœ Œr innan DC Šr helt stabilt och innan dess blir det antagligen nšdvšndigt att revidera ÓverktygslŒdanÓ 48. Vad betršffar anvšndningen av Dublin Core Šr formatet fortfarande inte utbrett i de stora sšktjšnsterna. DC anvšnds mest i speciella ŠmneslŠnksamlingar eller kvalitetssšktjšnster sœsom de vi undersškt. Vissa av de stora sšktjšnsterna, t.ex. AltaVista Šr kšnsliga fšr metadata i allmšnhet (inte bara DC) men anvšnder sig bara av Keywords och Description. PŒ DC:s hemsida finns beskrivet ett 30-tal projekt som anvšnder sig av Dublin Core. Projekt frœn Skandinavien, Europa, USA och Australien, varav de flesta Šr baserade i Europa. Ett projekt všrt att nšmnas i sammanhanget Šr BIBLINK, ett EU-projekt inom bl.a. UKOLN, vilket syftar till att skapa ett samarbete mellan nationella bibliotek och fšrlšggare av elektroniskt material. BIBLINK har skapat en DC-variant, den s.k. BIBLINK Core, som gšr det mšjligt fšr fšrlšggare av elektroniskt material att skicka in resursbeskrivningar som Šr tillršckliga fšr den nationella katalogiseringen 49. Detta visar Œterigen hur flexibelt DC Šr. Det kan anvšndas frœn en enkel webbdokumentbeskrivning av Svea Svenssons hemsida till att skapa en avancerad nationell bibliografisk post som beskriver Svea Svenssons avhandling om lšvgrodors matvanor och allmšnna leverne. Speciellt i Skandinavien Šr Dublin Core ganska utbrett. I Danmark och Finland har Dublin Core blivit valt till det metadata-format som ska anvšndas fšr resursbeskrivning av officiella elektroniska dokument frœn statliga och kommunala organ. Vad betršffar reglerna gšllande inmatning av DC-metadata, pœpekar Hakala att det inte finns nœgra utarbetade katalogiseringsregler. I viss mœn fungerar anvšndarguiderna som sœdana, men dessa Šr inte tillršckliga fšr allas behov. DŠrfšr bšr varje serišst DC-projekt utforma sina egna anvšndarguider som dock inte bšr variera allt fšr mycket frœn den generella guiden. 4.2.1 Qualifiers Fšrutom de femton elementen finns det ytterligare utrymme att specificera en resursbeskrivning med s.k. qualifiers. Man kan inte lšgga till fler element Šn de redan existerande, men man kan specificera ett element genom att lšgga till en qualifier i elementet. Vad en qualifier gšr Šr att den ÓsnŠvar neró innehœllet i elementet pœ ett standardiserat vis. Kontrollerade vokabulšrer Œterfinns som qualifiers, och fler sœdana Šr under utveckling. Det finns tre qualifiers; Type, Language och Scheme, varav Type och Scheme Šr vanligast fšrekommande. 45 FrŒn engelskans ÓDublin Core to MARC converteró. 46 FrŒn engelskans Ómetadata harvesting and indexing applicationó. 47 The Nordic metadata project Final report. Kapitel 2 ÓThe metadata toolbox.ó <URL: http://linnea.helsinki.fi/ meta/nmfinal.htm> 981130 48 Ibid. 49 <URL: http://hosted.ukoln.ac.uk/biblink/> 981030 19

Type Šr tšnkt att begršnsa det sprœkliga innehœllet i elementet, d.v.s. ta ett steg ner i ÓbetydelsehierarkinÓ. DŠrfšr kallas ocksœ type-qualifiern ÓsubelementÓ eftersom det handlar om ett underelement (fungerar ungefšr som i SAB-klassningen, dšr t.ex. avdelning Ughf Šr en underavdelning till Ug). Som exempel tar vi Svea Svenssons avhandling om lšvgrodor. Exempel pœ metatagg i Title-elementet: <META NAME=ÓDC.TitleÓ CONTENT=ÓLšvgrodors matvanor och allmšnna leverne.ó> Exempel pœ metatagg i Creator-elementet: <META NAME=ÓDC.Creator.PersonalNameÓCONTENT=ÓSvensson, SveaÓ> I det senare exemplet finns en type-qualifier; ÓPersonalNameÓ. Det specificerar kšrnelementet ÓCreatorÓ. I nšmnda exempel beskrivs dokumentet dšr upphovsmannens namn Šr Svea Svensson. Det kan finnas andra variationer av Creator Šn ett personligt namn, om en organisation eller en fšrening Šr upphovet till ett dokument. DŒ blir type-qualifiern ÓCorporateNameÓ. Exempel: <META NAME=ÓDC.Creator.CorporateNameÓCONTENT=ÓSvenska LšvgrodefšreningenÓ> Om fšreningen har en e-postadress kan detta ocksœ ligga som en type-qualifier i Creator. Exempel: <META NAME=ÓDC.Creator.CorporateName.AdressÓCONTENT= Ósv_lov@telia.com Ó> Language specificerar sprœket i elementinnehœllet. Om ett dokument Šr skrivet pœ engelska visas det i elementet Language, men med en language-qualifier kan man specificera vilket sprœk som anvšnds i taggarna. T.ex. om det finns ord pœ engelska i Subject (och det i švrigt Šr ett svenskt dokument) kan man specificera detta genom att lšgga in en language qualifier. Exempel: <META NAME=ÓDC.SubjectÓLANG=ÓengÓCONTENT=ÓfrogsÓ> Scheme Šr ett bestšmningsord som pœvisar en kodstandard eller dylikt t.ex. SAB eller UDK 50. Exempel: <META NAME=ÓDC.SubjectÓSCHEME=ÓSABÓCONTENT=UghfÓ Ett annat exempel Šr Date-elementet dšr man mœste všlja ett scheme som visar hur datum ska skrivas. Standarden Šr ÓISO8601Ó d.v.s. datum skrivs ut sœ hšr: 1999-02-10 fšr 10 februari 1999. Exempel: <META NAME=ÓDC.DateÓSCHEME=ÓISO8601ÓCONTENT=Ó1999-02-10Ó> 50 Se ordlistan. 20

4.2.2 RDF och The Warwick Framework RDF, Resource Description Framework, och Warwick Framework Šr termer som Œterkommer i mœnga artiklar om metadata och Dublin Core. Termerna hšr hemma i resonemanget om hur metadata rent tekniskt fungerar vad betršffar programvaror etc. Ett kortfattat sštt att fšrklara RDF Šr att kalla det en typ av sprœk fšr metadata: ÓA language for expressing metadata which is simple to process by machine.ó 51 RDF všxte fram ur ett behov av en generell kodning av metadata. RDF, som fortfarande Šr under utveckling, har utarbetats genom ett samarbete mellan olika metadatagrupper och W3C Metadata Project 52 i syfte att stšdja nyttjandet av metadata pœ webben. DŠrfšr rekommenderar W3C RDF som en standard fšr hur man bšr koda metadata sœ att den blir ÓmaskinbegripligÓ. RDF Šr en sorts ram inom vilken olika metadataformat fungerar ihop. Dublin Core Šr ett av dessa format. Just nu pœgœr granskning av varje element i Dublin Core i syfte att dessa ska passa in i RDF-standarden. Om c:a ett Œr kommer Dublin Core att rekommendera RDF. Vad gšller Warwick Framework Šr det ett fšrsšk till strukturering av s.k. metadata-behœllare vilka gšr det mšjligt fšr separat metadata att existera utanfšr dokumentet. Dublin Core Šr ett av de olika metadataformat som anvšnder sig av Warwick Framework. MARC-formatet Šr exempel pœ ett annat format. Om detta skriver Rasmus Bruun i sin magisteruppsats ÓEr lykken gjort?...ó dšr han fšrklarar Warwick Framework sœlunda 53 : ÓMed en container Œbnes der muligheter for at et dokuments metadata ikke befinder sig i selve dokumentet, men i et separat dokument med en angivelse av det beskrevne dokuments URL... Denne struktur g r det muligt at tildele et dokument metadata i overensstemmelse med flere forskellige metadataformater pœ en overskuelig mœde.ó 54 4.2.3 Dublin Core Workshops Dublin Core-formatet har utvecklats under ett antal workshops. Deltagarna Šr speciellt inbjudna och kommer frœn skilda om Šn beslšktade yrkeskategorier sœsom systemutvecklare, bibliotekarier, databasexperter, katalogisatšrer, museipersonal, arkivarier m.fl. Mellan femtio och Œttio personer har deltagit varje gœng. HŠr fšljer en kortfattad genomgœng av dessa workshops. 51 Swick, Ralph.W3C Technology and Society domain, Metadata Activity. 1998. <URL: http:www.w3.org/metadata/activity.html> 981130 52 W3C Metadata Home Page: <URL: http://www.w3.org/metadata>981130. Fšrklaring av W3C, se ordlistan. 53 Bruun, Rasmus. Er lykken gjort? - om metadata som indekseringsgrundlag ved bibliografisk kontrol af webdokumenter. Danmarks Biblioteksskole. 1997. <URL: http://www.db.dk/student/k96/4/rb/opgaver/2semopg%5ftekst.html>981130 54 Ibid. 21