Indexering av skönlitteratur Bella och AIS

Relevanta dokument
Ämnesordsåtervinning av skönlitteratur En intervjuundersökning av bibliotekariers erfarenheter

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

KN - Seminarium. (Litteratursökning)

Sök artiklar i databaser för Vård- och hälsovetenskap

Snabbguide till Cinahl

SÄRSKILD PRÖVNING I SVENSKA B

Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande:

Till BIBSAM. Indexering av skönlitteratur och barn- och ung- domslitteratur projektrapport

MODERSMÅL. Ämnets syfte. Undervisningen i ämnet modersmål ska ge eleverna förutsättningar att utveckla följande: Kurser i ämnet

Svensk övergång till DDC. Underlag Nationella referensgruppens möte Version

Hur fungerar indexering av skönlitteratur? En konsistensundersökning

SÄRSKILD PRÖVNING I SVENSKA A

Att söka information (med betoning på Internet)

ENGELSKA. Ämnets syfte. Kurser i ämnet

Svensk nationell datatjänst, SND BAS Online

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Ämne - Engelska. Ämnets syfte

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Indexering av skönlitteratur Om beskrivning av romaner utifrån recensioner och Svensk Biblioteksförenings ämnesordslista Att indexera skönlitteratur

ENGELSKA FÖR DÖVA. Ämnets syfte

Lässtrategier för att förstå, tolka och analysera texter från olika medier.

Genrekoden svarar mot kursplanen i svenska i Lgr 11

Kursplan ENGELSKA. Ämnets syfte. Mål. Innehåll. Insikt med utsikt

GYMNASIEARBETET - ATT SKRIVA VETENSKAPLIGT

PubMed (Medline) Fritextsökning

Sö ka litteratur i ERIC

Genre/form - en lägesrapport

Indexering av skönlitteratur En undersökning av folkbibliotek som inte köper indexerade poster från Bibliotekstjänst

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar.

SVENSKA. Ämnets syfte

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar

Biblioteken, Futurum 2017

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Söka artiklar i CSA-databaser Handledning

Informatik C, VT 2014 Informationssökning och referenshantering. Therese Nilsson

Riktlinjer för bedömning av examensarbeten

Skriv! Hur du enkelt skriver din uppsats

Centralt innehåll årskurs 7-9

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek

Undervisningen i ämnet engelska ska ge eleverna förutsättningar att utveckla följande:

Förslag den 25 september Engelska

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund

Söka, värdera, referera

Konsistens vid indexering av skönlitteratur för barn och ungdom

Kvalitetsgranskning av examensarbeten referenser i examensarbeten på sjuksköterske- och lärarutbildningen

Dags för Dewey? Vad skulle en övergång betyda för oss i Sverige? Presentation vid konferensen Mr Dewey och Ms SAB, Stockholm 27oktober 2006

Dewey i Sverige. Möte Sverigebiblioteket 5 mars 2009 Magdalena Svanberg.

Svenska Läsa

Cinahl Headings. Sökguide. Sökning med kontrollerade ämnesord

Engelska 7, ENGENG07, 100 p

Centralt innehåll. I årskurs 1 3

INFÖR NATIONELLA PROVEN I SVENSKA. Olika typer av texter

Slutrapport. Utbildningsforskning och reformpolitik under 50 år speglad i Torsten Huséns arbetsbibliotek

Skönlitteraturen och användarna En användarstudie av indexering, informationsåtervinning och skönlitteratur ur ett Sense-Makingperspektiv

Lärarhandledning till Stig Dagermans novell Att döda ett barn

Evidensbaserad informationssökning

KOMMUNIKATIVT LEDARSKAP

RÖDA TRÅDEN SVENSKA F-KLASS ÅK

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013

Handledning till att läsa och lyssna på skönlitteratur

Sökning, källkritik och referenshantering EITA LINA AHLGREN & OLA HEDBÄCK

Kurs 1. Informationsförmedlingens vetenskapliga och sociala sammanhang, 30.0 hp

Checklista. Hur du enkelt skriver din uppsats

MTM. Intervjuer med låntagare och bibliotekarier om annotationer och ämnesord Maj 2016

Lärobok och litteratur: McKay/Brodin/Clayton/Webster, Blueprint C, ISBN:

Dewey Decimal Classification (DDC)

elib Bas Bibliotekssystem för e-böcker

elib 2.0 Bibliotekssystem för e-böcker

Titel Mall för Examensarbeten (Arial 28/30 point size, bold)

Instruktion/råd för rapportskrivning

Material från

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Vi arbetar i medborgarnas tjänst

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

Rutiner för opposition

Medieplan. beskrivning, bestånd & bevarande för högskolebiblioteket, sjukhusbiblioteket och Gävle bibliotek (stadsbiblioteket med filialbibliotek)

Business research methods, Bryman & Bell 2007

Anvisningar till rapporter i psykologi på B-nivå

Lärarguide till textkommentering

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

3.18 Svenska som andraspråk

SPAK01, spanska, kandidatkurs

Om uppsatsmallen vid GIH

Bibliotekets resurser för filosofistudenter vt Catrin Andersson Umeå universitetsbibliotek

Fråga bibliotekarien. Länkbiblioteket. Sökslussen. Metasökprogrammet Frank och Söksam. biblioteken.fi >

En fråga som då och så uppkommer är Finns det några bevis för att akupunktur hjälper mot spänningshuvudvärk

Cinahl sökguide. Enkel sökning. Ämnesordsökning

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek

OBS! Inga lexikon eller liknande hjälpmedel är tillåtna..

Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online

I CINAHL hittar du referenser till artiklar inom omvårdnad och hälsa. Även en del böcker och avhandlingar finns med.

Lathund i informationssökning

Att skriva vetenskapligt - uppsatsintroduktion

Religionsvetenskap II Delkurs 2: Teori och metod

Titel: Undertitel: Författarens namn och e-postadress. Framsidans utseende kan variera mellan olika institutioner

Rockhammars skola Lokal pedagogisk planering (LPP)

Material från

Terminsplanering i Svenska årskurs 9 Ärentunaskolan

Sök artiklar i PubMed: handledning

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

Transkript:

MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2006:77 ISSN 1404-0891 Indexering av skönlitteratur Bella och AIS MARIA SELIN Maria Selin Mångfaldigande och spridande av innehållet i denna uppsats helt eller delvis är förbjudet utan medgivande.

Svensk titel: Engelsk titel: Författare: Indexering av skönlitteratur: Bella och AIS Fiction Indexing: Bella and AIS Maria Selin Kollegium: 2 Färdigställt: 2006 Handledare: Abstract: Kasimir Zdanowski The aim of this thesis is to make a comparative study of the indexing by means of the Swedish subject heading list Att indexera skönlitteratur and the Finnish thesaurus Bella: specialtesaurus för fiktivt material. Eight librarians were given the task of indexing two novels by using the subject heading list and the thesaurus. Half of the librarians had Finnish background. The Jaccard index was used to measure the outcome of the indexing. The result of the indexing was also analysed from a number of aspects, such as semantic relations, specificity, precoordination and choice of words. The results revealed that indexing by means of Att indexera skönlitteratur was more specific and hierarchical than indexing with Bella. Most of the librarians thought that Att indexera skönlitteratur was easier to use because of its clear and well-arranged structure. Many of the indexers thought that Bella was more difficult to use mainly because of its size but also because of its language. The main conclusion from the study is that Bella is not suitable for use in Swedish public libraries and that it is better to have separate lists for different types of fictional material, such as literature and film. Nyckelord: Indexering, skönlitteratur, tesaurus, ämnesordslista

Innehållsförteckning 1. Inledning... 3 1.1 Bakgrund... 3 1.2 Problemformulering... 4 1.3 Syfte och frågeställningar... 5 1.4 Problemavgränsning... 5 1.5 Informationssökning... 5 1.6 Ordförklaringar... 6 1.7 Disposition... 7 2. Tidigare forskning... 8 2.1 Världen... 8 2.2 Sverige... 10 2.3 Analysis and Mediation of Publications... 11 3. Metod... 12 3.1 Urval... 12 3.2 Jaccards index... 13 3.2.1 Termbedömning... 13 3.3 Termernas fördelning i fasetter... 14 3.4 Instruktioner för uppgiften... 14 4. Kontrollerad vokabulär... 16 4.1 Fasettanalys... 17 4.2 Tesaurus... 18 4.2.1 Ekvivalenta relationer... 19 4.2.2 Hierarkiska relationer... 19 4.2.3 Associativa relationer... 19 4.2.4 Utvärdering av en tesaurus... 20 4.3 Ämnesordslista... 20 4.4 Skillnader mellan ämnesordslista och tesaurus... 20 5. Presentation av AIS och Bella... 22 5.1 AIS... 22 5.1.2 Den systematiska delen... 22

5.1.3 Den alfabetiska delen... 23 5.2 Bella... 23 5.2.1 Den systematiska delen... 23 5.2.2 Den alfabetiska delen... 25 5.3 Strukturen i Bella och AIS... 25 6. Resultat och analys... 27 6.1 Indexerarnas kommentarer... 27 6.1.2 Övriga synpunkter... 28 6.2 Jaccards index... 29 6.3 Semantiska relationer... 31 6.3.1 Ekvivalenta relationer... 31 6.3.2 Hierarkiska relationer... 31 6.3.4 Associativa relationer... 32 6.4 Specificitet... 32 6.5 Prekoordinering... 32 6.6 Ordval... 33 6.7 Termernas fördelning i fasetter... 34 7. Slutsatser... 35 7.1 Frågeställningarnas besvarande... 35 7.2 Diskussion... 36 7.3 Förslag till vidare forskning... 37 8. Sammanfattning... 38 9. Källförteckning... 40 10. Bilagor... 43 10.1 Indexerare A... 43 10.2 Indexerare B... 44 10.3 Indexerare C... 45 10.4 Indexerare D... 46 10.5 Indexerare E... 47 10.6 Indexerare F... 48 10.7 Indexerare G... 50 10.8 Indexerare H... 51

1. Inledning 1.1 Bakgrund Skönlitteratur har traditionellt organiserats utifrån formella kriterier såsom författare, språk och litterär form snarare än efter dess innehåll. Facklitteratur har genom tiderna ansetts ha högre status på grund av dess kunskapsförmedlande syfte och därför har man utvecklat metoder främst för indexering och återvinning av facklitteratur. Några av dessa indexeringssystem för facklitteratur har sedan tillämpats på skönlitteratur vilket inte alltid varit oproblematiskt (Pejtersen & Austin, 1983, s.230-233). Senare forskning har visat att skönlitteratur inte låter sig beskrivas på samma sätt som facklitteratur och att det därför behövs speciella system för att beskriva den. Skönlitteraturen är ofta mer komplex med inslag av tolkning. Medan en faktabok som är indexerad med ämnesordet båtar verkligen ger kunskap om båtar kan det i skönlitteraturens fall vara så att handlingen utspelas på en båt. Även om skönlitteraturens primära syfte är att underhålla och inspirera kan den även förmedla kunskap. Skönlitteratur utgör en stor del av utlåningen på folkbibliotek. Som bibliotekarie får man många olika slags frågor om skönlitteratur och det är inte alltid som sökningar i bibliotekskatalogen förenat med bibliotekariens egna kunskaper kan ge svar på en komplex fråga. Genom att utveckla bra indexeringssystem för skönlitteratur får biblioteken bättre sök-och-återvinningsmöjligheter för såväl bibliotekarier som användare. I Sverige har man fram till nu saknat verktyg och riktlinjer för indexering av skönlitteratur på nationell nivå. Sedan 1991 har Bibliotekstjänst (BTJ) lagt till ämnesord för skönlitteratur för vuxna utifrån en tesaurus som två studenter vid Bibliotekshögskolan i Borås gjorde som specialarbete 1987 och som sedan köptes och omarbetades av BTJ (Bibliotekstjänst, 2004, s.4). Indexeringen utifrån den har fått mycket kritik bl.a. för att den inte är användarvänlig och att den är mer anpassad att användas för indexering av facklitteratur (Andersson & Holst, 1996, s.80-81). I Sverige finns det sedan en längre tid tillbaka indexeringssystem utvecklade för facklitteratur. Stockholms stadsbibliotek har sedan 1982 indexerat facklitteratur utifrån ett eget auktoritetsregister. Inte förrän år 1999 började de indexera skönlitteratur. Kungliga biblioteket har sedan 1999 databasen Svenska ämnesord. Svenska ämnesord är en allmän ämnesordslista främst avsedd för indexering av facklitteratur. År 2001 började en specialgrupp inom Svensk Biblioteksförening arbetet med att skapa en nationell och systemoberoende ämnesordslista för indexering av skönlitteratur. Resultatet blev två ämnesordslistor: en för vuxenlitteratur och en för barn- och ungdomslitteratur. De testades som provupplagor år 2003 för att ett år senare publiceras offentligt. Sedan januari i år använder BTJ Svensk Biblioteksförenings ämnesordslista för vuxenlitteratur vid indexering. I Finland har man en längre erfarenhet av indexering av skönlitteratur. Sedan 1987 finns det i Finland en allmän finsk tesaurus som täcker in alla ämnesområden, YSA (Yleinen suomalainen asiasanasto) samt en svensk översättning av den, ALLÄRS (Allmän 3

tesaurus på svenska). Från början användes YSA både för indexering av fack- och skönlitteratur men det visade sig snart att YSA saknade lämpliga termer för att indexera skönlitteratur. Behovet av ett centraliserat indexeringssystem uppstod. Eftersom det saknades riktlinjer och verktyg i form av en tesaurus eller ämnesordslista anpassat för skönlitteratur bestämde Helsingfors universitetsbibliotek tillsammans med BTJ att starta ett projekt med målet att skapa en specialtesaurus för skönlitteratur. Projektet startade 1993 och en redaktionsgrupp utsågs med Jarmo Saarti som redaktör. YSA skulle ligga som grund vid utvecklandet av tesaurusen för skönlitteratur och denna skulle utformas till en specialtesaurus på samma sätt som tesaurusen för musik MUSA (Saarti, 1999, s.89). Resultatet blev specialtesaurusen Kaunokki som publicerades 1996. Kaunokki har också blivit översatt till svenska under titeln Bella: specialtesaurus för fiktivt material (1997). Svenska utgör sedan 1922 ett av de officiella språken i Finland. Eftersom den svensktalande minoriteten har samma språkliga rättigheter som de finsktalande måste även informationssökningen vara tvåspråkig. Därför har man i Finland en svensk variant av Kaunokki, Bella: specialtesaurus för fiktivt material och inom musik tesaurusarna Musa och Cilla. Sedan 1998 har Finland även en centraliserad indexering av skönlitteratur som utförs av finska BTJ. Alla BTJ: s katalogposter för skönlitteratur är försedda med ämnesord från Kaunokki. Majoriteten av folkbiblioteken använder sig av dessa i sina kataloger. Bella ingår inte i BTJ:s indexering men används på folkbibliotek i finlandssvenska och tvåspråkiga kommuner som lägger till egna ämnesord utifrån tesaurusen. Valet av uppsatsämne baseras på ett stort intresse för skönlitteratur men också nyfikenhet hur olika indexeringssystem för skönlitteratur ser ut. Idén till mitt uppsatsämne väcktes när jag gick på föreläsningen Indexera mera som hölls av Lena Lundgren hösten 2004. Hon berättade om tidigare indexeringsmodeller för skönlitteratur och utvecklingen av dessa. Jag blev intresserad av den finska tesaurusen Bella som sedan 1997 används på finska bibliotek och jag kom på tanken att jämföra den med den då nyutkomna svenska ämnesordlistan Att indexera skönlitteratur. Vuxenlitteratur. 1.2 Problemformulering Tesaurusen och ämnesordslistans uppgift är att skapa ett gemensamt språk för indexeraren och användaren genom att kontrollera vokabulärens termer. Detta sker bland annat genom att begränsa antalet synonymer, särskilja homografer men även att visa termernas inbördes relationer. Trots att olika typer av kontrollerade vokabulärer bygger på samma koncept kan de skilja sig mycket från varandra. Lancaster menar dock att det inte är typen av kontrollerad vokabulär (ämnesordslista, tesaurus, klassifikationssystem) som är den viktigaste faktorn vid indexering, snarare vokabulärens omfång och specificitet (Lancaster, 1991, s.17-18). Aitchison, Gilchrist och Bawden ger exempel på ett antal punkter som brukar skilja sig i olika vokabulärer bl.a. semantiska relationer, specificitet, post- eller prekoordinering (2000, s.173). 4

För att kunna förbättra och vidareutveckla indexeringssystem för skönlitteratur är det viktigt att se hur de existerande verktygen fungerar och ta erfarenhet från andra länder. Eftersom Svensk Biblioteksförenings ämnesordslista är relativt nyutkommen är det intressant att se hur indexeringen utifrån den ser ut jämfört med ett annat indexeringssystem. 1.3 Syfte och frågeställningar Uppsatsens syfte är att jämföra resultatet av indexering utifrån tesaurusen Bella:specialtesaurus för fiktivt material och ämnesordslistan Att indexera skönlitteratur.vuxenlitteratur. Syftet kan beskrivas med följande frågeställningar. Vilka ämnesord hamnar i ämnesordsfältet vid indexering utifrån Bella och Att indexera skönlitteratur. Vuxenlitteratur och på vilket sätt skiljer de sig åt? Hur skiljer sig indexeringen med hjälp av Att indexera skönlitteratur. Vuxenlitteratur och Bella utifrån ett antal fasetter? Hur uppfattar bibliotekarierna Att indexera skönlitteratur.vuxenlitteratur jämfört med Bella som hjälpmedel vid indexering? 1.4 Problemavgränsning För att avgränsa ämnet har jag valt att skriva om indexering av skönlitteratur för vuxna. Detta för att Bella är mer inriktad mot vuxenlitteratur trots att den innehåller termer för barn-och-ungdomslitteratur. Därför skulle en jämförelse mellan dessa ämnesord och Svensk Biblioteksförenings ämnesordslista för Barn-och-ungdomslitteratur kanske inte ge en lika rättvisande bild. Jag har begränsat undersökningen till att handla om skönlitterära romaner och därför finns varken lyrik, dramatik eller noveller med i undersökningen. Uppsatsen handlar om manuell indexering för skapande av bibliografiska poster. Automatisk indexering behandlas inte eftersom jag vill undersöka hur indexerarna uppfattar de kontrollerade vokabulärerna och hur deras indexering ser ut vid användning av dessa. 1.5 Informationssökning För att finna litteratur till min uppsats har jag sökt i Library Literature & Information Science, LISA, Nordiskt BDI-index och Libris. Genom referenslistor från artiklar inom ämnet har jag även fått tips på material. Jag har även haft stor nytta av www.google.se vid sökning efter relevant material. Värdefull information har jag även fått via mailkontakter med berörda personer. Mina källor består av tidskriftsartiklar, några magisteruppsatser och böcker. 5

1.6 Ordförklaringar För att underlätta för läsaren har jag valt att redogöra för viktiga termer som förekommer i uppsatsen samt i vilken betydelse dessa används. Ordförklaringarna är inspirerade av ODLIS. Kontrollerad vokabulär: En etablerad lista av tillåtna termer från vilken indexeraren måste välja ämnesord/deskriptorer ifrån vid indexering av en bibliografisk post. Semantisk struktur: Betydelsesamband mellan två eller fler begrepp och mellan termerna som används för att representera dem i ett indexeringsspråk. Exempel på semantiska relationer är hierarkiska och synonyma samband. Tesaurus : En förteckning av godkända indexeringstermer med tillhörande uppslagstermer, ordnad både alfabetiskt och/eller systematiskt. En tesaurus visar termernas inbördes relationer i form av bredare, smalare och relaterade termer. Ämnesordslista: En traditionell ämnesordslista är en alfabetisk förteckning över ämnesord som är godkända för användning vid indexering. Ämnesordslistor innehåller två typer av hänvisningar: se-hänvisningar och se även-hänvisningar. Postkoordinering: termerna utgörs av enkla oberoende ämnesord som kan kombineras av användaren vid söktillfället. De flesta moderna indexeringssystem är postkoordinerade. Prekoordinering: innebär att termerna kombineras av indexerarna vid indexeringstillfället till en sammansatt term eller sträng. Manuella indexeringssystem är ofta prekoordinerade. Kedjeindexering: en typ av prekoordinerad indexering där man representerar kedjan av begrepp som utgör ett ämne. Exempel på en ämnesordssträng från Bella är alkohol:smuggling. 6

1.7 Disposition Kapitel 1 ger en bakgrund och kort historik över ämnet. Här presenteras också uppsatsens problemformulering, syfte och frågeställningar, problemavgränsning, informationssökning, ordförklaringar samt denna disposition. Kapitel 2 behandlar tidigare forskning som är av intresse för uppsatsens ämne. Det sista avsnittet presenterar Pejtersens indexeringssystem AMP. Kapitel 3 beskriver den metod som ligger till grund för uppsatsen. Här beskrivs urvalet av informanter samt vilka analysmetoder som används. I sista avsnittet beskrivs de instruktioner som informanterna fick inför indexeringen av de två romanerna. Kapitel 4 förklarar innebörden av en kontrollerad vokabulär samt dess olika typer: tesaurus och ämnesordslista. I slutet av kapitlet finns en redogörelse för skillnaderna mellan en tesaurus och en ämnesordslista. Kapitel 5 ger en beskrivning av ämnesordslistan AIS och tesaurusen Bella, deras struktur och användning. I slutet görs en kort jämförelse mellan Bella och AIS. Kapitel 6 redovisar resultat och analys av min empiriska undersökning där åtta bibliotekarier indexerade två romaner utifrån Bella och AIS. Här kan du läsa indexerarnas kommentarer kring indexeringen. Resultatet av indexeringen analyseras sedan efter ett antal punkter. Kapitel 7 presenterar slutsatserna jag har kommit fram till samt för en diskussion kring dem och deras tillförlitlighet. Det sista avsnittet ger tips på fortsatt forskning inom ämnet. Kapitel 8 är en sammanfattning av hela uppsatsen. Kapitel 9 är källförteckningen. Kapitel 10 innehåller uppsatsens bilagor som utgörs av informanternas indexeringar utifrån AIS och Bella. 7

2. Tidigare forskning 2.1 Världen Det går att urskilja två olika inriktningar inom forskningen om indexering av skönlitteratur, dels studier av indexeringen och dess grunder på ett allmänt plan dels forskning rörande konstruktion av bokindex (Saarti, 1999, s.86). Jag kommer i min forskningsöversikt behandla forskning av det första slaget. Båda inriktningarna härrör från de angloamerikanska länderna men har även bedrivits i andra länder. I de nordiska länderna har forskning om indexering på ett allmänt plan bedrivits speciellt i Danmark där Annelise Mark Pejtersen är en förgrundsfigur (ibid., s.86). Forskningen om indexering av skönlitteratur har dominerats av en diskussion om vilka aspekter som är värda att indexeras i ett skönlitterärt verk (ibid., s.86). Man kan säga att det finns två olika åsikter i frågan: de som tycker att skönlitteraturen enbart ska beskrivas med objektiva fakta och de som tycker att de subjektiva aspekterna måste finnas med. De två forskarna som tydligast kontrasterar varandra i frågan är den kanadensiska forskaren Clare Beghtol och Annelise Mark Pejtersen. Pejtersen är den som har stått för den mer användarvänliga forskningen och har influerat senare Skandinaviska försök till att förbättra återvinning av skönlitteratur. Mellan 1973-1974 genomförde hon en studie där 160 samtal mellan bibliotekarie och låntagare observerades på danska folkbibliotek. Resultatet från den bekräftades av en likadan undersökning som hon gjorde 1976 där underlaget bestod av 134 samtal mellan bibliotekarier och låntagare (Pejtersen, 1978, s.7-8). Utifrån låntagarnas frågor kom hon fram till att användarna karaktäriserade böckerna på en mängd olika sätt och utifrån många olika vinklar vilket ledde till slutsatsen att skönlitteratur behöver beskrivas på ett mångfasetterat sätt. Utifrån användarnas frågor kunde hon identifiera fyra dimensioner: Ämne, Ram, Författarens avsikt och Tillgänglighet. Det resulterade i ett klassifikationssystem, Analysis and Mediation of Publications (AMP) vilket också ligger tillgrund för databasen Bokhuset (Pejtersen et al, 1996, s.21). Pejtersen menar att subjektivitet inverkar både vid själva analysen och indexeringen av ett dokument till användarens formulering av en sökfråga. Pejtersen skriver I den här situationen är det inte tillräckligt att fråga Vad kan vi göra åt det?, vi måste först fråga Ska någonting göras åt det? Pejtersen är av den åsikten att man inte ska bortse från de subjektiva aspekterna vid indexering. I sin undersökning där hon kartlade låntagarnas vanligaste frågor vid sökning av skönlitteratur kunde hon dra slutsatsen att låntagarna bl.a. önskade en upplevelse som resultat av läsningen. Begrepp som är öppna för olika tolkningar, såsom känslomässiga tillstånd är viktiga element i romaner och också i användarnas frågor. Ibland utgörs det av det enda sökkriteriet t.ex. Jag vill ha en rolig bok (Pejtersen & Austin, 1984, s. 26). Clare Beghtol, professor och forskare vid Universitet i Toronto och den som står för den mest teoretiska forskningen menar att det är de objektiva fakta vi ska beskriva. Hon menar att man måste minska subjektiviteten genom att bara beskriva vad verket 8

innehåller men inte dess mening eller budskap. Beghtol har utvecklat en indexeringsmodell kallad EFAS, Experimental Fiction Analysis system. Systemet är uppbyggt kring fem fasetter nämligen: Karaktärer, Händelser, Platser, Tid och Annat (Dahlqvist & Palm, 2004, s. 39-40). Hans Jørn Nielsen, docent vid Danmarks Biblioteksskola i Ålborg förespråkar i sin artikel The nature of fiction and its significance for classification and indexing vikten av att använda teorier och metoder från litteraturvetenskapen vid indexering av skönlitteratur. Han kritiserar Beghtols förhållningssätt och menar att skönlitteraturen inte går att beskrivas med några få objektiva data (Nielsen, 1997, s.176). Nielsen menar att man vid indexering av ett skönlitterärt verk kan utgå från fem viktiga frågefasetter, nämligen vem, vad, var, när och hur. I sin artikel skriver Nielsen att vi måste uppmärksamma hurfasetten (aspekter som genre, narrativ struktur och berättarperspektiv) i större utsträckning vid indexering av skönlitteratur. Det skulle leda till bättre sökmöjligheter för användarna genom att de skulle kunna särskilja dokument som har samma innehåll och tema men som är skrivna på olika sätt. Nielsen frågar sig varför så många indexeringssystem för skönlitteratur inte använder hur-aspekten i större utsträckning och konstaterar att det kan bero på att indexering av facklitteratur endast utgår från fasetterna vem, vad, var och när (Nielsen, 1997, s.177). Enligt Nielsen bör också indexering av skönlitteratur innehålla uppgifter om litteraturhistoria i form av litterär period, litterära rörelser och influenser (ibid., s. 180-181). Jarmo Saarti, bibliotekschef på universitetsbiblioteket i Kuopio i Finland och även Kaunokkis redaktör har skrivit mycket inom ämnet indexering av skönlitteratur under senare år. Han framhåller det speciella med skönlitteraturen och menar att inte bara indexering av skönlitteratur utan även återvinningssystemen (bibliotekskataloger och index) bör bli mångfunktionella för att kunna möta användarnas behov (Saarti, 2000, s.6-9). Han ansluter sig till Pejtersens och Nielsens uppfattning att de subjektiva aspekterna ska ingå vid indexering. Saarti menar dock att det är svårt, nästintill omöjligt att ta reda på författaren avsikt men är ändå av den åsikten att den borde finnas med. Han säger att när det subjektiva i ett verk utelämnas missas en av de viktigaste aspekterna. Användarna verkar vilja ha någon slags bedömning av böckerna. Det kan ses på bokmarknaden där t.ex. recensioner och bokpriser som bidrar till ökad försäljning (Saarti, 1999, s. 87). Vid konstruktion av Kaunokki och Bella kunde Saarti konstatera att sammanhanget tesaurusen ska användas i spelar en avgörande roll vid valet av lämpliga termer och indexeringsdjup. Som exempel nämner han ämnesord för barn-och-ungdomslitteratur som togs med i Kaunokki, trots att de kunde ha publicerats i en egen specialtesaurus. Miljön som tesaurusen ska användas i är en annan viktig faktor att ta hänsyn till vid utformningen av en tesaurus. Kaunokki riktar sig främst till folkbiblioteken och därför tog man först inte med litteraturvetenskapliga termer i tesaurusen. Saarti skriver vidare att vissa litteraturvetenskapliga termer kan vara användbara även för folkbibliotek och hänvisar till Nielsens forskning. Därför lades vissa litteraturvetenskapliga termer till i andra upplagan av Kaunokki som publicerades år 2000 (Saarti, 1999, s.90). Den största förändringen i Kaunokki och Bella har varit att de utvecklats att bli heltäckande tesaurusar för fiktivt material. Kaunokki och Bella innehåller därför termer både för litteratur och film (Saarti, 2002a, s. 5). 9

2.2 Sverige Den första stora tesaurusen för skönlitteratur i Sverige publicerades 1987 av två studenter, Eiler Jansson och Bo Södervall, vid Bibliotekshögskolan i Borås ( Tesaurus för indexering av skönlitteratur ). Deras tesaurus är uppbyggd kring tre huvudfasetter: Ram, Person och ämne. Ram motsvaras av underfasetterna Tid och Rum. Person beskriver huvudpersonen i verket och är indelad efter yrke, utveckling och sociala relationer. Huvudfasetten Ämne beskriver de ämnen eller teman handlingen är uppbyggd kring (Jansson & Södervall, 1987). 1994 skrev en annan student vid Bibliotekshögskolan, Majvor Wahlfrid ett arbete där hon också skapade en tesaurus för skönlitteratur ( Skattkammaren: tesaurus för romaner och noveller ). Målgruppen för hennes tesaurus var gymnasieelever och hon utgick från Pejtersens klassifikationssystem AMP. Vid konstruktionen av tesaurusen jämförde hon sina val av indexeringstermer mot ämnesorden i Jansson och Södervalls Tesaurus för indexering av skönlitteratur. Hon kom fram till att Tesaurus för indexering av skönlitteratur inte var användarvänlig och att det saknades termer för att beskriva skönlitteratur t.ex. förekommer inga ämnesord för genre och form. Dessutom kritiserar hon den för att vara enbart objektorienterad och stereotyp i valet av termer och struktur (Wahlfrid, 1994, s. 13). På senare tid har det i Sverige skrivits ett flertal magisteruppsatser inom ämnet indexering av skönlitteratur. Claes Dahlqvist och Mattias Palm har i sin magisteruppsats Återvinning av skönlitteratur: återvinningsverktygens anpassning efter användares sökbeteende: en fallstudie på Trelleborgs bibliotek gjort en undersökning av användarnas sökbeteende med målet att utveckla användarvänliga återvinningsverktyg för skönlitteratur. De utgick bland annat från Pejtersens användarundersökning vid utformningen av deras egen undersökning. Genom intervjuer med bibliotekarier samt en större enkätundersökning bland biblioteksbesökare kom de fram till liknande resultat som Pejtersen dvs. att klassifikations- och indexeringssystem bör motsvara användarnas mångfasetterade behov och innehålla subjektiva inslag (Dahlqvist & Palm, 2004, s. 92-94). I magisteruppsatsen Konsistens vid indexering av skönlitteratur för barn och ungdom studerar Cecilia Karlsson och Svante Kristensson hur konsistensen förändras när tio bibliotekarier indexerar ett antal barnböcker med hjälp av Att indexera skönlitteratur. Barn respektive utan den. De kommer fram till att konsistensen blir högre vid användning av ämnesordslistan. Resultatet av undersökningen visade att bibliotekarierna tyckte ämnesordslistan innehöll för många likartade termer samt saknade förklaringar hur vissa termer skulle användas t.ex. Rasism och Främlingsfientlighet. I sina slutsatser konstaterar författarna att om Att indexera skönlitteratur. Barn hade haft en tesauruskonstruktion liknande den i Bella hade det underlättat för indexerarna vid valet av ämnesord. De tillägger dock att det skulle medföra svårigheter för barn som söker eftersom en tesaurus är mer komplex än en ämnesordslista (Karlsson & Kristensson, 2003, s.66). I min uppsats kommer jag att bygga vidare på deras slutsats genom att undersöka hur indexeringen utifrån tesaurusen Bella jämfört med Att indexera skönlitteratur. Vuxenlitteratur ser ut. 10

2.3 Analysis and Mediation of Publications Eftersom Pejtersens system AMP har influerat fler indexeringssystem i Skandinavien, både Bella och AIS tänkte jag beskriva systemet lite mer ingående. Pejtersen påpekar att AMP inte är ett klassifikationssystem i traditionell mening eftersom det saknar notation och är icke-exklusivt. Inte heller kan man säga att det är ett indexeringssystem eftersom termerna inte är i alfabetisk ordning utan uppdelade i meningsfulla grupper. AMP är snarare en hybrid eftersom principer från klassifikation och indexering kombinerats (Pejtersen & Austin, 1983, s. 235). Fördelen med ett klassifikationssystem som är icke-exklusivt är att en roman kan beskrivas på flera olika sätt t.ex. en roman som är både en kärlekshistoria och en historisk roman klassas efter båda aspekterna. Det är ingen logisk ordning i de etablerade klasserna och det förekommer ingen hierarki. Detta för att skönlitteraturen ofta måste beskrivas genom en kombination av funktioner och aspekter (Pejtersen, 1978, s.10). AMP är till för att användas i bibliotekens kataloger och index dock inte för hylluppställning. En användares fråga kan innefatta enbart en av dimensionerna men innehåller oftast en kombination av flera dimensioner (Pejtersen & Austin,1983, s. 234-235) Dimension 1: Ämne a) aktivitet och händelseförlopp b) psykologiskt utvecklingsförlopp/ beskrivningar c) sociala relationer Ämnet i romanen: Vad det handlar om Dimension 2: Ram a) tid: dåtid, nutid, framtid b) plats: geografisk, social miljö, yrke Den tid och plats författaren valt att förlägga sitt verk till Dimension 3: Författarens avsikt a) känslomässig upplevelse b) insikt och information Författarens attityd mot ämnet. De idéer och känslor författaren vill förmedla till sina läsare. Dimension 4: Tillgänglighet a) läsbarhet b) bokens fysiska egenskaper c) litterär form d) huvudpersoner e) huvudpersonernas ålder Vid konstruktionen av Bella valde man att ta med en fasett som motsvarar Pejtersens dimension Tillgänglighet och innehåller ämnesord för aspekter såsom läsbarhet, målgrupp och typografi, vilka ofta efterfrågas i bibliotek (Saarti, 1999, s. 90). Motsvarande fasett i AIS innehåller endast ämnesord för litterär form. 11

3. Metod För att besvara frågeställningarna kommer jag att använda mig av en kvalitativ metod med kvantitativa inslag och göra fallstudier. 8 bibliotekarier kommer att få indexera två romaner utifrån Bella och Att indexera skönlitteratur. Vuxenlitteratur. Fortsättningsvis kallar jag Att indexera skönlitteratur.vuxenlitteratur för AIS. I anslutning till detta ska de även svara på några frågor angående deras användning av vokabulärerna. I analysen kommer jag att tillämpa en statistisk metod som heter Jaccards index för att räkna ut likheten mellan indexeringarna utifrån AIS och Bella. Indexeringarna kommer också att jämföras avseende: semantiska relationer, specificitet, prekoordinering samt ordval. Jag kommer också att jämföra vilka fasetter som används vid indexeringen utifrån Att indexera skönlitteratur. Vuxenlitteratur och Bella för att se om någon används i större utsträckning. 3.1 Urval Kriterier för indexerarna är att de ska ha utbildning inom Biblioteks-ochinformationsvetenskap och arbeta som bibliotekarier. Ett annat krav är att skönlitteratur ska ingå i bibliotekariernas dagliga arbete. Däremot ställde jag inga krav på tidigare vana av indexering av skönlitteratur eftersom de flesta folkbibliotek inte indexerar själva utan importerar poster från BTJ. Eftersom den ena av de kontrollerade vokabulärerna är en finsk tesaurus vill jag att hälften av bibliotekarierna ska ha finsk bakgrund dvs. vara födda och uppväxta i Finland. Detta för att språkkunskaper och den kulturella bakgrunden kan ha någon inverkan vid användningen av vokabulärerna och kanske påverkar resultatet av indexeringen. Romanerna som ska indexeras är en finsk roman, Arto Paasilinnas Harens år och en svensk roman, Jan Guillous Ondskan. Valet av romanerna grundar sig på att jag ville ha två författare som var kända både i Sverige och Finland. Målet var att få tag på åtta bibliotekarier som kunde ingå i undersökningen. I november 2005 började jag kontakta bibliotek för att hitta personer som kunde tänka sig att delta i min undersökning. Jag insåg snabbt att det inte skulle vara möjligt att skicka materialet till deltagarna eftersom det rör sig om hundratals sidor och jag ville att bibliotekarierna skulle ha hela materialet och inte utvalda delar. Dessutom finns tesaurusen Bella inte heller att få tag på i Sverige, själv beställde jag den från BTJ i Finland. Därför bestämde jag mig för att kontakta bibliotek i min närhet för att på så sätt möjliggöra ett personligt möte. Urvalet är alltså inte helt slumpmässigt. Jag kontaktade olika folkbibliotek både via mail och telefon. Det var svårare att få tag i bibliotekarier med finsk bakgrund men efter kontakt med ordförande i föreningen Finska biblioteksanställda i Sverige fick jag kontakt med två finska bibliotekarier som ville delta i min undersökning. Gemensamt för de finska bibliotekarierna i min undersökning är att de är födda och uppväxta i Finland och har bott där mellan 22-37 år. Ett undantag är dock den fjärde finsktalande bibliotekarien som togs med i studien. Hon är född i Sverige men är finsk medborgare och har mycket goda kunskaper i finska språket och den finska kulturen. 12

Av de åtta deltagarna arbetar sex av dem på folkbibliotek, både huvud- och filialbibliotek och två arbetar på sjukhusbibliotek. Deras yrkeserfarenhet som bibliotekarier sträcker sig från 5 år upptill 33 år. Sju av deltagarna har ingen tidigare vana av indexering av skönlitteratur medan en av dem har en viss vana genom att komplimentera BTJ:s poster med egna ämnesord på folkbiblioteket. För att variera språket i uppsatsen kallar jag deltagarna omväxlande för informanter, indexerare och bibliotekarier. 3.2 Jaccards index För att kunna jämföra likheten mellan indexeringarna med AIS och Bella bestämde jag mig för att använda mig av ett likhetsmått. Ett vanligt likhetsmått inom information retrieval är Jaccards index. Indexet ger ett värde mellan 0 och 1, ju högre värde desto större likhet. Måttet mäter i detta sammanhang antalet lika termer vid indexering utifrån AIS och Bella. Antag att d 1 och d 2 är dokument. Antag vidare att a 1 är antalet termer i d 1 och a 2 antalet termer i d 2. Låt a vara antalet gemensamma termer i d 1 och d 2. Jaccards index för d 1, d 2 J(d 1, d 2 ) definieras enligt: 3.2.1 Termbedömning För att kunna använda Jaccards index som i det här fallet ger ett mått på likheten mellan indexeringarna utifrån AIS och Bella måste jag först bestämma vilka ämnesord som ska anses likvärdiga. Eftersom jag i mina instruktioner inför uppgiften skrivit att ämnesorden form eller inbördes ordning inte var något krav likställer jag ämnesord som är skrivna i singular eller pluralform t.ex. ungdomsskildringar och ungdomsskildring. I vissa fall har jag har upptäckt sådana fel och de tyder ofta på slarv från indexerarens sida men man får också ta hänsyn till att de olika listorna skiljer sig på smärre formella regler. Eftersom det är tillåtet att använda kedjeindexering i Bella men inte i AIS var jag även tvungen att bestämma hur dessa termer skulle likställas. Jag betraktar varje term i strängen som ett individuellt ämnesord. Detta för att det är svårt att rekonstruera kedjeindexeringen eftersom det krävs ett bakomliggande klassifikationssystem. I vissa fall förekommer dubbletter av ämnesorden i indexeringarna t.ex. Våld och våld: skola och då räknas ämnesordet endast en gång. Sammansatta och enkla ämnesord som har samma betydelse och liknande stavning har likställts t.ex. personlig utveckling och personlighetsutveckling. Bella innehåller ämnesord både för litteratur och film och i fasetten för Genre märks det särskilt tydligt. Det har skapat en viss förvirring hos några indexerare angående 13

vilken term som ska väljas exempelvis förekommer både utvecklingsberättelser och utvecklingsromaner i Bella. Indexeraren har i det här fallet tagit med båda ämnesorden. Vissa genrer i Bella har större omfång vilket leder till problem när de ska jämföras med AIS ämnesord. I Bella ingår ämnesordet Äventyrslitteratur medan motsvarande i AIS är Äventyrsromaner. Jag likställer endast genrer som har samma betydelse och omfång i båda listorna t.ex. djurberättelser ( Bella ) och djurskildringar ( AIS ). Eftersom utvecklingsberättelser och äventyrslitteratur inte enbart behandlar romaner och saknar motsvarighet vid indexering utifrån AIS likställs de inte med utvecklingsromaner och äventyrsromaner. I AIS finns genrebeteckningen barndomsskildringar, motsvarande i Bella är barnskildringar. Dessa genrer anser jag ha olika betydelse och har därför inte likställts. En av indexerarna hade valt ämnesordet journalist vid användning av Bella trots att det var en icke-godkänd term som hänvisade till redaktörer i tesaurusen. Bella tillåter friindexering av ett antal kategorier där bl.a. yrken ingår. Därför borde det vara tillåtet att använda ämnesordet journalister trots att det i tesaurusen är en otillåten term. 3.3 Termernas fördelning i fasetter Vid jämförelsen mellan Bella och AIS tyckte jag att det skulle vara intressant att se om någon fasett användes mer flitigt vid användningen av den ena eller andra listan. Bella och AIS innehåller i stort sätt samma fasetter men de har definierats olika och har olika innehåll. För att få en rättvisande och oberoende bild av fasetternas fördelning har jag därför skapat ett eget analysschema. Aitchison, Gilchrist och Bawden föreslår ett antal grundläggande fasetter som utvecklats efter flera år av forskning. De föreslagna fasetterna är: Föremål/Objekt, Handlingsförlopp/aktiviteter, Rum/Plats och Tid (2000, s. 70-71). Dessa fasetter är enligt min mening anpassade för facklitteratur eftersom det saknas en fasett för genre och form samt en separat fasett för person. Jag kommer istället att utgå från Nielsens frågefasetter vid skapandet av analysschemat. Nielsen menar att man vid indexering av skönlitteratur kan utgå från ett antal frågefasetter nämligen vem, vad, var, när och hur (jmf Tidigare forskning s. 9) Genre och Form- svarar på frågan hur. Person (vem) innehåller ämnesord som har att göra med personbeskrivning eller olika grupper av människor samt verkliga och fiktiva personnamn. Här ingår t.ex. yrke, kön Rum (var) geografiska platser men även andra miljöer och platser t.ex. skogar, naturen. Tid (när) Ämne (vad) innehåller ämnesord för aktiviteter (mobbning), process (självständighetsprocess) och relationer (far-sonrelationer). Jag funderade om ämnesordet harar skulle ingå i vemfasetten men bestämde att alla djur räknas till Ämne eftersom de svarar på frågan vad. 3.4 Instruktioner för uppgiften Antalet ämnesord för indexeringen bestämdes i samråd med min handledare till 8-12 stycken per indexering, ett förhållandevis högt antal men detta för att jag vill ha mycket 14

material att arbeta med. I AIS och Bella anges inga riktlinjer hur många ämnesord ett verk ska ha. AIS rekommenderar dock en viss begränsning. Ämnesorden kan beskriva genre, centrala teman och motiv, plats och miljö, tid och form. Inga krav på formella aspekter så som ordningsföljd eller ämnesordens form ställdes. I samband med indexeringen fick deltagarna ett antal frågor som skulle besvaras mot slutet. Det var frågor om indexerarnas uppfattning av vokabulärerna avseende bl.a. struktur, specificitet, ämnesord som saknades samt svårighetsgrad. Jag ställde inga krav att informanterna skulle läsa båda romanerna eftersom verksamma indexerare inte har möjlighet att läsa alla böcker de indexerar. Däremot förde jag statistik över hur många som läst böckerna vilket redovisas i anslutning till indexeringarna i uppsatsens bilagor. Informanterna fick använda sig av hjälpmedel så som recensioner, databaser, diskutera med kolleger men jag poängterade att uppgiften skulle utföras individuellt. Informanterna fick fria händer att använda AIS och Bella i vilken ordning de ville. Tiden för att göra uppgiften bestämdes till en vecka. 15

4. Kontrollerad vokabulär Indexering av skönlitteratur innebär ofta inslag av tolkning. Olika indexerare kan tolka samma dokument på olika sätt och ha olika uppfattningar om vilka aspekter som är värda att indexeras. Dessutom kan en och samma persons indexering se olika ut vid olika tidpunkter. Genom att använda sig av en kontrollerad vokabulär skapar man ett gemensamt språk för användaren och indexeraren vilket bidrar till konsistens i indexeringen. Enligt Lancaster innebär ämnesordsindexering två grundläggande steg: ämnesanalysen då man bestämmer vad dokumentet handlar om och ännu mer viktigt vem det riktar sig till och varför, samt översättningen av ämnesanalysen till termer valda från en vokabulär (Lancaster, 1986 s.147). Det finns tre typer av kontrollerade vokabulärer: klassifikationssystem, ämnesordslistor och tesaurusar. I min uppsats behandlar jag enbart ämnesordslista och tesaurus. En kontrollerad vokabulär är i grund och botten en auktoritetslista men vanligtvis har den också någon form av semantisk struktur. Den kontrollerar termernas form (singular, plural, stavningsvarianter) och betydelse genom att välja en eller flera termer som anses godkända för indexering och hänvisa från de andra icke-godkända termer till dem. En kontrollerad vokabulär måste särskilja homografer t.ex. celler (i kroppen) från celler (fängelse). En annan uppgift är att föra samman eller länka de termer vars betydelse är relaterad. Vid användningen av en kontrollerad vokabulär kan indexeraren bara tilldela ett dokument termer som förekommer i listan (Lancaster, 1991, s.13-14). Lancaster påpekar dock att det är först då indexeraren är bekant med den kontrollerade vokabulären, dess regler och hur man använder den som indexeringen faktiskt får högre konsistens. Trots att en kontrollerad vokabulär används kan det bli felaktigheter i indexeringen som oftast inte direkt beror på begränsningar i vokabulären, snarare indexerarens slarv eller brist på kunskap om ämnet. Indexeraren kan missuppfatta dokumentets handling och göra en feltolkning. Ett annat fel kan uppstå är då indexeraren förstår vad dokumentet handlar om men väljer fel termer för att uttrycka det. Här kan den kontrollerade vokabulären genom att ha tydliga ordförklaringar och lämpliga hänvisningar minska problemet för indexerarna att välja fel termer. Ett annat fel kan uppstå då indexeraren använder för generella termer i förhållande till ämnet i dokumentet trots att det finns specifika termer i vokabulären. I ett annat fall kan det vara vokabulären som inte innehåller tillräckligt specifika termer för att beskriva ämnet (Lancaster, 1986, s.148). Lancaster anser vidare att det inte är typen av kontrollerad vokabulär (ämnesordslista, tesaurus, klassifikationssystem) som är den viktigaste faktorn vid översättningsstadiet, snarare vokabulärens omfång och specificitet. Han ger ett exempel där en artikel som handlar om användningen av robotar inom industrin ska indexeras utifrån Dewey Decimal Classification, Library of Congress Subject Headings och INSPEC Thesaurus. INSPEC Thesaurus saknade begrepp och termer för att beskriva rörelseförmågan hos en robot vilket däremot kunde beskrivas utifrån Dewey och LCSH. I övrigt kunde artikeln indexeras lika fullständigt och specifikt utifrån alla tre vokabulärerna när grupper av ämnesord jämfördes. Däremot förekom skillnader på den enskilda 16

termnivån. Lancaster konstaterar vidare att om endast en term skulle kunna användas vid indexeringen av artikeln skulle LCSH och INSPEC vara bättre än DDC, eftersom de kunde särskilja industriella robotar från robotar i allmänhet (Lancaster, 1991, s.17-18). I Lancaster exempel tas inte hänsyn till användaren, inte heller finns referenser till någon studie eller annan forskning som behandlar skillnaden mellan olika kontrollerade vokabulärer vid indexeringen. Aitchison, Gilchrist och Bawden menar att det är ett problem att kontrollerade vokabulärer inom samma ämnesområde kan se så olika ut eftersom det försvårar överföringen av poster mellan olika system samt sökning i flera databaser samtidigt (2000, s. 173). Enligt författarna skiljer sig kontrollerade vokabulärer främst utifrån följande punkter: Specificitet: En kontrollerad vokabulär kan innehålla en detaljerad och precis terminologi medan en annan bara huvudsakligen består av breda termer för att beskriva samma ämnen. Uttömmandegrad: En kontrollerad vokabulär kanske utesluter delar som ingår i ämnesfältet medan en annan täcker alla aspekterna av ämnesfältet. Sammansatta termer: Ett system använder sammansatta termer (prekoordinerat system) medan ett annat system beskriver samma begrepp/ämne fast genom att kombinera separata termer (postkoordinerat system). Synonymer: valet av tillåtna synonymer och halvsynonymer kan variera. Semantiska relationer: hierarkierna i en tesaurus eller ämnesordslista kan skilja sig i struktur och tyngdpunkt. Hierarkiska nivåer kan finnas i en kontrollerad vokabulär men saknas i en annan. Relaterade termer skiljer sig också och beror på tesaurusen eller ämnesordslistans ändamål (Aitchison, Gilchrist & Bawden, 2000, s.173). I min analys kommer jag att utgå från dessa punkter vid jämförelsen mellan AIS och Bella. 4.1 Fasettanalys Det enklaste sättet att konstruera en tesaurus eller ämnesordslista är att arrangera alla deskriptorer och deras relationer i en alfabetisk sekvens. Mycket av effektiviteten i en sådan kontrollerad vokabulär förloras om den inte komplimenteras av en systematisk del. Eftersom det alfabetiska arrangemanget sprider termerna odiskriminerat får man ingen överblick över ämnet. Den vanligaste använda tekniken att ordna termerna systematiskt är fasettanalysen. Det går ut på att man utifrån olika aspekter av ämnet skapar grundläggande kategorier som kan tillämpas på alla ämnesområden (Rowley, 2000 s.153). Den indiske matematikern och grundaren av modern klassifikationsteori, Ranganathan, var först med att introducera fasettanalysen när han skapade Colon Classification på 1930-talet. Där identifierar han fem grundläggande kategorier: 17

personality, matter, energy, space, and time (PMEST) som han kallade fasetter. Matter står för material och egenskaper. Energy motsvarar processer och aktiviteter. Personality är svårast att definiera men motsvarar nyckeln i systemet. Eftersom Ranganathans system var ett klassifikationssystem är fasetterna ömsesidigt uteslutande (mutually exclusive) dvs. en term kunde bara förekomma under en av fasetterna (Aitchison, Gilchrist & Bawden, 2000, s. 70). Saarti motiverar valet av fasetterna i Bella på tidigare forskning om indexering av skönlitteratur där de fyra fasetterna händelser, aktörer, plats och tid har ansetts vara huvudkategorierna vid indexering av skönlitteratur (Saarti, 2002b, s.53). Bellas fasetter motsvaras av Ranganathans PMEST där fasetten för genre har tolkats som Personality. Saarti skriver att det verkar mest logiskt eftersom genren beskriver verkets personalitet och har avgörande betydelse för handlingen, tiden och rummet i en roman. Fasetten Tema i Bella kan motsvaras av Matter samt fasetten för Personer och aktörer motsvaras av Energy. Bella har liksom Pejterson AMP en fasett som beskriver aspekter utanför den faktiska texten såsom läsbarhet och målgrupp (Saarti, 2002a, s. 5). 4.2 Tesaurus En tesaurus är en kontrollerad vokabulär vars huvudsakliga syfte är att reglera termernas form (singular, plural och stavningsvarianter) samt termernas betydelse genom att visa relationerna mellan vokabulärens termer. Det finns tre olika relationer i en tesaurus: ekvivalenta, hierarkiska och associativa relationer och dessa kommer att beskrivas utförligare i nästa avsnitt. I anslutning till vissa termer i tesaurusen kan det finnas en Scope Note (SN) som ger en kort definition av termen. Syftet med en SN är att ge en förklaring till indexeraren hur indexeringstermen ska användas när termens betydelse eller omfattning är oklar. Ibland förekommer homografer i en tesaurus dvs. ord som stavas likadant men som har olika betydelse. I anslutning till termen kan det då förekomma en kvalifikator (qualifier) exempelvis: Celler (biologi) Celler (elektronik) Tesaurusen består alltid av en alfabetisk del men kan också innehålla en systematisk del. Tesaurusar kan se olika ut beroende på vilken del tyngdpunkten ligger. Vanligast är att den alfabetiska utgör huvuddelen men det kan också vara tvärtom. I det sistnämnda fallet fungerar den alfabetiska delen som ett index till den systematiska. Länken mellan de två delarna utgörs oftast av någon slags notation som har lagts till den systematiska delen och fungerar som referens i den alfabetiska delen (Aitchison, Gilchrist & Bawden, 2000 s.107). En tesaurus är oftast bunden till ett speciellt ämnesområde. Tesaurusens främsta användningsområde är inom information retrieval men på senare tid har den fått ytterligare en funktion som kartläggning av ett ämnesområde. Användaren kan på så sätt få en allmän överblick av ämnet. Den klassiska tesaurusen används både för indexering och sökning i en databas men det finns även tesaurusar som endast används för indexering resp. sökning men dessa tas inte upp här (Aitchison, Gilchrist & Bawden, 18

2000, s.1). Följande avsnitt beskriver de tre olika relationer som förekommer i en tesaurus. 4.2.1 Ekvivalenta relationer Den ekvivalenta relationen innebär en hänvisning mellan två eller fler termer som har samma eller likartad betydelse (synonymer, halvsynonymer, stavningsvarianter) men där endast den ena av termerna har valts ut att användas vid indexering. Den utvalda termen kallas deskriptor eller godkänd term. Även de icke-godkända termerna finns med i tesaurusen och fungerar som ingångar till tesaurusen med hänvisningar till deskriptorerna. Detta sker genom beteckningarna USE och UF (Use for), där USE anger vilken term som ska användas (deskriptorn) och UF vilket term den används istället för (icke-godkänd term). Exempel: Smink USE make up Make up UF smink 4.2.2 Hierarkiska relationer Den hierarkiska relationen är ett av de mest grundläggande kännetecknen för en tesaurus och utgör en viktig del av tesaurusens struktur. Relationen visar en hierarki av över- och underordnade termer mellan tesaurusens termer. Detta sker med hänvisningen BT (Broader term) och NT (Narrower term). Den överordnade termen representerar en klass eller helhet medan den underordnade refererar till dess medlemmar eller delar. Den hierarkiska relationen gör att användaren kan få tips på bredare och smalare termer och får genom detta även en uppfattning om termens omfång. 4.2.3 Associativa relationer Förenklat kan man säga att den associativa relationen förekommer mellan termer som är begreppsmässigt relaterade men som varken är ekvivalenta eller hierarkiska. Relationen betecknas med RT (Related term). Den associativa relationens uppgift är att ge användaren förslag på alternativa termer. Det här är den svåraste relationen att identifiera eftersom den kan se ut på olika sätt. Aitchison, Gilchrist och Bawden identifierar olika fall då relaterade termer ska användas bl.a. En disciplin eller ett studieområde och objektet eller fenomenet som studeras t.ex. Seismologi RT jordbävning, Ett yrke och yrkesutövaren t.ex. Socialt arbete RT socialarbetare, Begrepp relaterade till sina egenskaper t.ex. Ljus RT värme (2000, s.64-65). 19

4.2.4 Utvärdering av en tesaurus Soergel tar upp några frågor man bör ställa sig när man utvärderar en tesaurus. Jag kommer att utgå från dessa vid konstruktionen av de frågor indexerarna i min undersökning ska få. Innehåller tesaurusen alla begrepp som är nödvändiga för en tillfredsställande överblick av ämnesfältet? Är tesaurusen terminologiskt komplett dvs. är synonymer för varje term täckt och redovisas alla synonyma samband mellan termerna? Är tesaurusens utseende (display) tydlig och är den till hjälp för att hitta lämpliga begrepp vid indexering och informationssökning? (Soergel, 1974, s. 9) 4.3 Ämnesordslista En ämnesordslista är oftast en alfabetisk förteckning över ämnesord som är godkända för användning vid indexering. Vissa ämnesordslistor innehåller ibland även en systematisk del. Ämnesordslistor innehåller två typer av hänvisningar: se-hänvisningar och se även-hänvisningar. Se-hänvisningar är hänvisningar från termer som inte används som ämnesord till ett godkänt ämnesord t.ex. Grottmänniskor Se Urtidsmänniskor. Det kan vara hänvisningar mellan synonymer, stavningsvarianter samt akronymer t.ex. Unidentified flying objects SE Ufon. Se även-hänvisningar görs mellan två godkända ämnesord och har som syfte att hjälpa användaren att hitta det ämnesord som bäst passar för att beskriva ämnet han söker. Seäven hänvisningar kan göras dels mellan över- och underordnade termer men även mellan ämnesord som är relaterade på andra sätt. 4.4 Skillnader mellan ämnesordslista och tesaurus En del författare kontrasterar tesaurusen mot ämnesordslistan, andra pekar på likheterna. I vissa fall är gränsen mellan tesaurus och ämnesordslista flytande (Rowley, 2000, s.166). Ett exempel på det är LCSH som numera har en hierarkisk struktur och visar relationer mellan termer. Jag kommer i det här avsnittet att beskriva hur ämnesordslistan och tesaurusen har vuxit fram samt ta fasta på deras traditionella betydelse. Ämnesordslistor utvecklades från början för att skapa ingångar till bibliotekens ämneskataloger som kunde motsvara de klassificerade posterna. Ämnesordslistor har därför en speciell relation till klassifikationssystem. Genom klassifikation placerar man ämnen i en kontext av discipliner s.k. klasser. Exempelvis kan information om hästar förekomma i flera klasser; Djur (Biologi), ridning (Sport), och hästar (Husdjur). Genom utvecklandet av Ämnesrubriker (subject headings) blev det möjligt att söka på olika ämnen utanför sin disciplinära kontext t.ex. en sökning på hästar gav träffar på hästar i 20