Bibliotekariestudenter och söksträngsexpansion Ett experiment om manuell söksträngsexpansion

Relevanta dokument
Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund

Sökning, källkritik och referenshantering EITA LINA AHLGREN & OLA HEDBÄCK

Söka, värdera, referera

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek

Sök artiklar i databaser för Vård- och hälsovetenskap

Söka artiklar i CSA-databaser Handledning

INFORMATIONSSÖKNING: SJUKSKÖTERSKEPROGRAMMET T1. Medicinska biblioteket

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Snabbguide till Cinahl

PubMed (Medline) Fritextsökning

Sammanfattning av informationssökning VT19

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013

Biblioteken, Futurum 2017

Retriever Mediearkivet

So ka artiklar och annan litteratur

Cinahl sökguide. Enkel sökning. Ämnesordsökning

Om uppsatsmallen vid GIH

Evidensbaserad informationssökning

Skriv ditt sökord i sökrutan och markera rutan för att föreslå ämnesord (Suggest Subject Terms).

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar.

PubMed gratis Medline på Internet 1946-

Sö ka artiklar öch annan litteratur

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar.

Marie Gustafsson. Böcker. Böcker. Tidningar och. Utskrifter

Akademiska söktjänster - En jämförande studie av Google Scholar, MEDLINE och Web of Science

Anvisningar till rapporter i psykologi på B-nivå

Hur kan vi söka och värdera vetenskaplig information på Internet?

Sökhjälp. Sökfältet finns på samma ställe på alla sidor på webbplatsen.

Informatik C, VT 2014 Informationssökning och referenshantering. Therese Nilsson

V I G Å R I G E N O M...

Att söka information (med betoning på Internet)

Skriv! Hur du enkelt skriver din uppsats

Öppna EndNote varje gång när du vill samla referenser till ditt bibliotek.

Google Guide: Tips för sökoptimering

Migrering av applikationen AMM till molnet

Full text only låter farlig, som en återvändsgränd användarundersökning av EDS på Malmö högskola. Linda Trygg

I CINAHL hittar du referenser till artiklar inom omvårdnad och hälsa. Även en del böcker och avhandlingar finns med.

Titel Mall för Examensarbeten (Arial 28/30 point size, bold)

Sö ka litteratur i ERIC

UB:s sö ktjä nst - Söka artiklar och annan litteratur

Högskolebiblioteket vid Mälardalens högskola

Bibliotekets personalenkät 2012/13

Informationssökning inför uppsatsen

Sök artiklar i PubMed: handledning

Riktlinjer för bedömning av examensarbeten

Sam Ansari Nv3a Tensta Gymnasium

ANVÄNDARTESTNING VID LULEÅ UB Ola Andersson Luleå universitetsbibliotek

Måldriven, informationscentrerad webbdesign


Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

Hur söker noviser information? En studie av novisers tillvägagångssätt vid informationssökning

Gymnasiearbetets titel (huvudrubrik)

The Cochrane Library. Vad är The Cochrane Library? Allmänna databaser

Datainsamling Hur gör man, och varför?

Kvalitetsgranskning av examensarbeten referenser i examensarbeten på sjuksköterske- och lärarutbildningen

Användarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1

Sö ka artiklar öch annan litteratur

Det bästa är att kombinera flera olika metoder och källor. TIPS - för informationssökning på webben!

Sökmanual till MetaLib. Utbildningsmaterial framtaget av LIBRIS-avdelningen

Mötesplats inför framtiden Borås april Saga Pohjola, Susanne Stenberg Karolinska institutet Novumbiblioteket

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Olika datainsamlingsmetoder

Underlagen indikerar att studenterna visar kunskap

E-biblioteket en tjänst från sjukhusbiblioteken

PubMed (Public Medline) - sökmanual

Import av referenser från bibliotekets databaser

Li#eratur och empiriska studier kap 12, Rienecker & Jørgensson kap 8-9, 11-12, Robson STEFAN HRASTINSKI STEFANHR@KTH.SE

Sökhjälp. Snabbsök. Sökfältet finns på samma ställe på alla sidor.

Ökat personligt engagemang En studie om coachande förhållningssätt

Sö ka artiklar öch annan litteratur

Gymnasiearbete Datum. Uppsatsens rubrik. Ev. underrubrik. Ditt namn, klass Handledarens namn

INFORMATIONSSÖKNING SOM INLÄRNINGSPROCESS

GYMNASIEARBETET - ATT SKRIVA VETENSKAPLIGT

Informationssökning - att söka och finna vetenskapliga publikationer Linköpings Universitetsbibliotek

Kognitionsvetenskap C, HT-04 Mental Rotation

Källuppgifter i fysik FAFA55

Informationssökning Liberal Arts LIB40 V17

Högskolebiblioteket vid Mälardalens högskola

Query expansion med hjälp av en elektronisk tesaurus i en bibliografisk online-databas.

FÖA110 Informationssökningsövningar facit

Koppling mellan styrdokumenten på naturvetenskapsprogrammet och sju programövergripande förmågor

Innehåll. Källkritik och vetenskaplighet. Introduktion till UB

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

Gymnasiearbetet för det naturvetenskapliga programmet

About The Cochrane Collaboration (Cochrane Groups) Information om The Cochrane Collaboration och de olika forskargrupperna och kontaktpersoner.

Arbeta med Selected Works en lathund

version 2.5 CONTENTO SVENSKA AB Introduktion till Kursbyggarverktyg

Business research methods, Bryman & Bell 2007

På tal om källor. Magisteruppsats i biblioteks- och informationsvetenskap, BHS, Högskolan i Borås Ann-Louise Larsson

Bibliotekets tryckta och elektroniska resurser

Informationssökning - att söka och finna vetenskapliga publikationer Linköpings Universitetsbibliotek

PM för kurs i Vetenskapsteori

Lathund till ATLA. AND: begränsar sökningen, båda sökorden måste förekomma i samma referens, t.ex. reincarnation AND buddhism

PM för kurs i Vetenskapsteori

Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar

Vetenskapsteori och vetenskaplig forskningsmetod II SQ1361 (termin 6) Studiehandledning

Kvalitativa metoder II

Transkript:

KANDIDATUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID INSTITUTIONEN BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2012:61 Bibliotekariestudenter och söksträngsexpansion Ett experiment om manuell söksträngsexpansion KRISTOFFER KARLSSON Kristoffer Karlsson Mångfaldigande och spridande av innehållet i denna uppsats helt eller delvis är förbjudet utan medgivande.

Svensk titel: Engelsk titel: Författare: Bibliotekariestudenter och söksträngsexpansion: Ett experiment om manuell söksträngsexpansion LIS students and query expansion: An experiment on manual query expansion Kristoffer Karlsson Färdigställt: 2012 Handledare: Abstract: Nyckelord: Alen Doracic Johan Eklund The focus of the thesis is an information search technique called manual query expansion, which aims to improve the retrieval performance in a search system by adding terms to the search query. The study looks at the query expansions done by LIS students, and the eventual beneficial effects by using a search help during the search process. The empirical data have been collected through an experiment, with an experiment group as well as a control group. The conclusion is that the students need more education in query expansion in order to be able to use it correctly. There are significant differences between the groups in several aspects, for example in the use of search terms, parentheses, and truncation. The study should be seen as a pilot study and a proposal for further research. Söksträngsexpansion, Informationssökning, Informationsåtervinning,

Innehållsförteckning 1. Inledning...1 1.1 Problemformulering... 1 1.2 Syfte och frågeställning... 2 1.3 Ordlista... 2 2. Bakgrund och Tidigare forskning...4 2.1 Information Retrieval... 4 2.2 Informationssökningsprocessen... 4 2.3 Söksträngsexpansion... 6 2.3.1 Manuell söksträngsexpansion... 7 2.3.2 Interaktiv söksträngsexpansion... 7 2.3.3 Automatisk söksträngsexpansion... 7 2.4 Tidigare forskning... 8 3. Metod...10 3.1 Urval... 11 3.2 För- och nackdelar med metodvalet... 11 3.3 Generaliserbarhet... 12 3.3 Möjliga felkällor... 12 3.4 Analysguide... 13 4. Resultat...14 4.1 Enkäternas resultat... 14 4.1.1 Experimentgruppen... 14 4.1.2 Kontrollgruppen... 15 4.2 Experimentgruppens resultat... 16 4.3 Kontrollgruppens resultat... 16 4.4 Jämförelse mellan grupperna... 19 5. Analys...22 5.1 Förekomst av element... 22 5.2 Söksträngarnas struktur... 23 5.3 Expansionstermernas karaktär... 25 5.4 Problem i söksträngarna... 26 6. Avslutande diskussion...27 6.1 Slutsatser... 28 Källförteckning...29 Bilaga 1...31 Bilaga 2...35 Bilaga 3...39

1. Inledning Vid första anblick kan informationssökning verka trivialt och självklart. En uppgift man inte behöver reflektera över eller träna på att utföra. Något som alla kan göra medfött. Det kan tyckas att allt man behöver bara finns en sökning på Google bort. Att googla har mer eller mindre blivit synonymt med att söka information på Internet. Väljer man att i stället se informationssökning ur ett informationsvetenskapligt perspektiv får man en lite annan bild. Det är inte nog med att söka efter vad man behöver, utan det är också viktigt att ställa sig frågor kring sökningen och sitt sökbehov. Frågor som vilken information man behöver, varför man behöver den och var den lättast går att finna. Processen blir inte heller rak och enkel, utan ett komplext virrvarr av steg mellan vilka man avancerar och återvänder till om vartannat, även om detta inte alltid sker på ett medvetet plan. Informationssökning är ett brett fält, och det skulle vara omöjligt att ta hänsyn till och undersöka alla delar i en enda uppsats. Fokus kommer därför ligga på en begränsad del av processen - nämligen söksträngsexpansion, det vill säga aktiviteten att utveckla en söksträng med fler termer eller andra element såsom trunkeringar eller parenteser. Att man vet hur man söker information är i dag viktigt för att kunna hålla sig uppdaterad i samhället. Att då titta närmare på de olika delarna av sökprocessen för att kunna förenkla och utvärdera den är enligt min mening av stor vikt. Särskilt viktigt är det att titta på hos de som inte bara söker information för egen skull utan också för andra. Fokus ligger därför på bibliotekariestudenter, en grupp som gärna tenderar att se sig själva som (kommande) informations- och sökspecialister, men där forskningsläget är tunt. Just söksträngsexpansion är inte något som informationssökning står och faller med, men det är ett område som är mer utforskat i teori än fallstudie och praktik. Jag anser därför det är av värde att undersöka. Söksträngsexpansion är en liten del av ett större kunskapsfält - där också de små delarna måste undersökas för att skapa en helhet. 1.1 Problemformulering Att söka information kan visa sig vara en frustrerande uppgift, särskilt om man inte hittar vad man söker efter. Att känna till olika söktekniker och strategier kan förenkla sökprocessen mycket och ge både fler relevanta resultat och förkorta tiden som behöver läggas på uppgiften. Den genomsnittliga söksträngen vid sökning på internet är ett till tre ord lång. Korta söksträngar innebär ofta problem när det kommer till återvinningseffektivitet och tenderar att inverka negativt på sökresultatet på grund av för få termer. 1 Ett område som visat sig problematiskt gällande informationssökning är söksträngsexpansion. På forskningsområdet har flera modeller presenterats med syftet att underlätta för den sökande att finna termer för att hitta de dokument som innehåller informationen 1 Baeza-Yates, Ricardo & Ribeiro-Neto, Berthier (2011). Modern information retrieval. s.26 1

som eftersöks. 2 Ett vanligt förekommande problem är att de termer som sökfrågan är uppbyggd av inte finns i relevanta dokument i samlingen, och att relevanta dokument därför inte återfinns. Särskilt problematiskt kan detta vara i stora full-textdatabaser där många olika uttryck kan användas för att beskriva samma sak. 3 1.2 Syfte och frågeställning Syftet med uppsatsen är att undersöka hur bibliotekariestudenter skapar och expanderar söksträngar och se i vilken mån den sökhjälp som erbjuds med vissa databaser eller söktjänster tas till användning. Det är också av intresse att se om man kan se någon skillnad i söksträngarna om hjälpen funnits tillgänglig eller ej. Forskningsfrågor: 1. Vilka element kan identifieras i söksträngarna? 2. Vilka förändringar kan man se i de expanderade söksträngarna i relation till söksträngarna innan expansion? 3. Vilka skillnader kan man se i söksträngarna mellan användare som fått ta del av sökhjälp och användare som inte fått det? 1.3 Ordlista Allmänna termer Söksträng eller sökfråga (engelska query): Det som skrivs in i söktjänstens sökfält. Informationsbehov: Ett medvetet eller omedvetet behov som kan fyllas med information. Söksträngselement: Ett söksträngselement är i uppsatsen söktermer, booleska operatorer, trunkeringar, fraser, parenteser och subject terms. Booleska operatorer: Används för att utöka sökningar. AND används då alla termer måste finnas med i ett dokument för att det ska ses som relevant. OR kräver att båda eller åtminstone en av termerna finns närvarande. NOT utesluter termer. Trunkering: Trunkeringstecken, *, används genom att byta ut slutet av en sökterm med *, databasen söker då efter alla möjliga avslut på ordet. Exempel: söker man på comput* söker söktjänsten efter såväl computer som computing. Fraser eller frasbeteckning: Genom att använda frasbeteckning,, runt flera ord söks enbart efter den exakta frasen, och inte efter orden för sig själva. Parenteser: Parenteser användes för att kontrollera och klumpa ihop söksträngselement. Vanligtvis utförs en sökning från vänster till höger. Termer inom parenteser söks på först. Parenteser används i första hand för att binda ihop synonymer med ORoperatorn. Subject terms: Med Subject terms avses indexeringstermer. Dessa finns samlade i söktjänsten Academic Search Premier i en tesaurus. Varje dokument i databasen är indexerade med en eller flera subject terms och det går att söka enbart med sådana. Tesaurus: Tesaurus är en samling indexeringstermer som finns tillgänglig i samband med databasen. 2 Ahlgren, Per (2002). Query Expansion. Human IT s.156-157. Cui, Hang et. al. (2002). Probabilistic Query Expansion Using Query Logs. In Proceedings of the 11th international conference on World Wide Web (WWW '02) s.325 3 Voorhees, Ellen M. (1994) Query Expansion Using Lexical-Semantic Relations. Proc. 17th Int l Conf. Research and Development in Information Retrieval. s. 61-69 2

Brus: De resultat i resultatlistan som inte anses vara relevanta kallas ofta för brus. Termer gällande metodkapitlet Experimentgrupp: Den eller de grupper som utsätts för den manipulerade variabeln kallas för experimentgrupper. Kontrollgrupp: Utöver experimentgruppen används också en så kallad kontrollgrupp som inte utsätts för behandlingen och som är till för att kontrollera att resultaten påverkas något av den manipulerade variabeln. Randomisering: För att minimera risken att den som utför undersökningen medvetet eller omedvetet påverkar resultaten genom att exempelvis välja hur experiment- och kontrollgrupper är hopsatta och därmed styra utfallet bör faktorer i studien vara så randomiserade som möjligt. Detta innebär att forskaren slumpar deltagarna i de olika grupperna under urvalet. 3

2. Bakgrund och Tidigare forskning Följande avsnitt ämnar ge en kortare introduktion till ämnet Information Retrieval och en lite djupare insyn i en av modellerna för hur informationssökning kan gå till. Därefter presenteras också de tre typer av söksträngsexpansion som är mest förekommande. Några tidigare studier som berör undersökningen kommer presenteras. 2.1 Information Retrieval Information Retrieval (härefter kallat IR) kan betraktas som ett delområde inom informationsvetenskap. En central del av IR är ett så kallat IR-system, det vill säga en samling dokument och ett sätt att komma åt dem. 4 Baeza-Yates och Ribiero-Neto beskriver IR som följande: Information retrieval deals with the representation, storage, organization of, and access to information items such as documents, Web pages, online catalogs, structured and semi-structured records, multimedia objects. The representation and organization of the information items should be such as to provide the users with easy access to information of their interest. 5 Ur ett användarperspektiv handlar IR om att översätta ett informationsbehov till en söksträng av det slag som systemet förstår. 6 Därefter är det systemets uppgift att matcha sökfrågan till de dokument som finns tillgängliga och sedan presentera en träfflista för användaren. 2.2 Informationssökningsprocessen Många klassiska modeller för informationssökning beskriver processen som okomplicerad, med ett statiskt informationsbehov med målet att finna alla relevanta dokument för att på så sätt tillfredsställa informationsbehovet. 7 Ett exempel är Sutcliffe och Ennis modell som består av fyra huvudsakliga aktiviteter; identifikation av problem, konkretiserande av informationsbehovet, sökfrågeformulering och utvärdering av resultat. 8 Modellen har kritiserats bland annat för att inte ta hänsyn till ny kunskap som förvärvas under sökprocessen eller eventuella förändringar i informationsbehovet. 9 I stället har nyare och mer dynamiska modeller presenterats med målet att ge en mer realistisk bild av informationssökning. Bates försöker med sin så kallade Berrypicking-modell visa en mer icke-statisk bild av sökandet där såväl sökfrågor som informationsbehov tenderar att ändras och utvecklas under tiden. Hon menar att informationssökning inte är en rak väg man fortsätter på tills man funnit alla relevanta dokument. I stället lyfter hon fram 4 Chowdhury, Gobina G. (1999). Introduction to modern information retrieval. s.1 5 Baeza-Yates & Ribiero-Neto (2011) s.1 6 ibid s.4 7 Hearst, Marti i Baeza-Yates, Ricardo & Ribiero-Neto, Berthier (2011) Modern information retrieval. s.23 8 Sutcliffe, Alistair & Ennis, Mark (1998) Towards a cognitive theory of information retrieval. Interacting with computers. s.326-327 9 Baeza-Yates, Ribiero-Neto (2011). s.23 4

att man hämtar små bitar av information här och där hela tiden under sökningen, omformulerar sitt informationsbehov och testar nya sökfrågor. 10 Pirolli och Card tillskriver information ett tänkt värde. Ju mer användbar information är, desto högre är dess värde. Information har inget värde i sig själv, utan definieras utifrån den kontext den befinner sig i. 11 Förutom informationens värde finns också en kostnad för att nå informationen. Svåråtkomlig och svårfunnen information har hög kostnad, medan lättåtkomlig har låg. 12 Med denna syn anses användbar och lättåtkomlig information, alltså högt värde och låg kostnad, vara högt prioriterad medan oanvändbar och svåråtkomlig, lågt värde och hög kostnad, lågprioriterad. Sammanfattningsvis kan man säga att det under sökprocessen hela tiden krävs avvägningar vilken information som är värd att söka för vilken kostnad. Carol Kuhlthaus Information Seeking Process används för att se på hur informationssökare tänker och känner. Modellen behandlar tre områden under processen, nämligen det känslomässiga, det kognitiva och det fysiska. ISP är uppdelat i sex steg - Initiation, selection, exploration, formulation, collection och presentation. 13 Varje steg är sammankopplat med en känsla som upplevs - Osäkerhet när insikten om ett informationsbehov eller frånvaro av kunskap upplevs; optimism när man lyckats definiera sitt behov och inleder informationssökningen; förvirring/frustration kan infinna sig när man sökt en del information och inte hunnit sätta sig in i ämnet tillräckligt för att ha skapat sig en förståelse för det; klarhet när man börjar få ett grepp om ämnet; när man valt fokus och på ett mer koncentrerat sätt kan söka information börjar självsäkerheten öka; till sist upplever man en känsla av tillfredsställelse eller besvikelse beroende på om sökningen anses som lyckad eller ej. 14 Det kognitiva berör sökarens tankar och går från vaga och generella via ett ökat intresse för ämnet till klara och fokuserade när man lärt sig mer. 15 Det sista området som berörs är de fysiska handlingarna och vilken typ av information som söks. Till en början är det framför allt generell information om ämnet som är av intresse för att skapa sig en översiktsbild. Detta övergår senare till ett sökande efter mer fokuserad information för att till sist landa i att ha hittat ett fokus och då söka koncentrerat efter precis information. 16 Jonas Fransson beskriver Gary Marchioninis modell om informationssökning i åtta steg i sin bok Effektivare informationssökning på webben och får här fungera som exempel på en modell om informationssökning kan se ut. Om man ser tillbaka på den tidigare diskussionen om klassiska och oproblematiska modeller kan man argumentera för att också Marchioninis modell kan tolkas så, men det är det inte tal om någon enkel väg, i stället tenderar man att återgå till tidigare stadier när informationsbehovet ändras eller när ny information tvingar sökaren att tänka om ett redan besökt steg i processen. Till att börja med måste ett sökbehov identifieras och bedömas tillräckligt viktigt för att det ska vara värt besväret att försöka fylla. Fransson kallar detta första steg för Upp- 10 Bates (1989) s.4 11 Pirolli, Peter & Card, Stuart (1999). Information Foraging. Psychological Review. s.645 12 ibid. 13 Kuhlthau (1991) s.367 14 Ibid. s.366-368 15 Ibid. s.367 16 Ibid. s.366-368 5

täcka och acceptera. Innan man sätter igång med själva sökandet är det viktigt att formulera ett problem eller fråga om vad man faktiskt är ute efter. Problemdefinitionen är ett steg som ofta förbises, trots att det i ett senare skede av sökprocessen kan visa sig vara ett steg som inte bara är viktigt för att man ska veta vad man söker efter, utan också ett sätt att spara tid på om man hamnar på fel spår. Ett antal frågor som kan vara bra att tänka över kommer också att presenteras, till exempel vad informationen ska användas till, hur aktuell informationen måste vara, vilka förkunskaper den som söker har, om det krävs vetenskapligt material och hur mycket man är redo att lägga på sökningen. Tredje steget går ut på att välja söksystem. Det är inte alltid som internet är rätt plats för att hitta den information man behöver. Ibland kanske bibliotekets samlingar är bättre om en äldre tidskrift som inte finns digitalt är av intresse, eller be om hjälp från kolleger. Om databaser används kan det vara värt att ha i åtanke huruvida en generell eller mer specialiserad databas är mest lämplig, eller om en söktjänst som Google eller Yahoo! är mer värdefull för den aktuella frågan. När söktjänsten är vald är det dags att börja formulera sökfrågan. Genom att förbereda sin sökfråga ordentligt kan man kraftigt reducera antalet irrelevanta träffar i resultatlistan - så kallat brus. Detta kan göras bland annat genom att söka på för området centrala nyckelord, använda sig av synonymer, alternativa stavningar och akronymer. Därefter är det dags att utföra sökningen. Fransson ger exemplen att trycka på sök-knappen i Google, ringa en professor för hjälp eller leta i böcker som handlingar under den här fasen. Efter att själva sökningen är gjord bör man utvärdera resultatet. Är frågan besvarad eller behövs det ytterligare sökningar? Behöver sökfrågan omformuleras eller modifieras? Anses informationsbehovet inte som uppfyllt kan ett byte av sökstrategi vara av intresse. Fransson ger följande exempel på hur sökstrategin kan ändras: - Bredda sökningen - Snäva in sökningen - Byta söktjänst - Leta efter annan typ av material - Gå off-line, exempelvis bibliotekets fysiska samlingar eller fråga en specialist. Utvinningen av information kan ses som sökprocessens mål. Insamlingen görs oftast lite här och där under hela processens gång, framför allt då på webben. Till sist bör man reflektera och avsluta processen och tänka igenom hur det har gått, vad man har lärt sig och vad man kan göra bättre till nästa gång. 17 2.3 Söksträngsexpansion Söksträngsexpansion går ut på att lägga till nya termer till den ursprungliga sökfrågan med målet att öka återvinningseffektiviteten av relevanta dokument - det vill säga få fler relevanta dokument samtidigt som man minskar det så kallade bruset, alltså irrelevanta dokument, i resultatlistan. 18 17 Fransson, Jonas (2007). Effektivare informationssökning på webben: Handbok i konsten att söka information. s.66-68 18 Cui, Hang (2003). Query Expansion by Mining User Logs. Knowledge and Data Engineering, IEEE Transactions on. s.829 6

Det finns tre typer av söksträngsexpansion. 19 Även om det endast är manuell söksträngsexpansion som är av direkt intresse för den här uppsatsen kan det vara av värde att kort beskriva också de andra typerna. 2.3.1 Manuell söksträngsexpansion Manuell söksträngsexpansion kräver att användaren själv sköter expansionen av termer vid behov. Per Ahlgren beskriver två olika versioner av hur manuell expansion kan gå till. Den första sökstrategin är uppdelad i fyra steg. (1) Till att börja med identifierar man ett antal koncept som förväntas finnas vara närvarande i de relevanta dokumenten. (2) Därefter görs en lista med synonymer eller termer som nästan är synonymer till varje koncept. (3) Kombinera termerna i varje lista med OR-operatorn. (4) Till sist binder man samman de olika listorna med AND-operatorer. I första steget skapas en ursprunglig söksträng som i steg tre expanderas med ytterligare termer. 20 En annan strategi är att kombinera ett antal termer med AND-operatorn och göra en sökning i dokumentsamlingen. Från de återvunna dokumenten plockas fler termer ut och läggs till i söksträngen. 21 2.3.2 Interaktiv söksträngsexpansion Interaktiv söksträngsexpansion är när användaren efter en inledande sökning presenteras en lista med söktermer bland vilka denne får markera de som anses vara mest relevanta för att utöka söksträngen. Systemet gör därefter en ny sökning med den nya söksträngen i hopp om att få bättre resultat. 22 2.3.3 Automatisk söksträngsexpansion Automatisk söksträngsexpansion innebär att systemet utan användarens insyn eller influens själv letar rätt på fler söktermer och expanderar söksträngen. Inom automatisk söksträngsexpansion finns två metoder för att bygga upp en tesaurus som termer sedan hämtas från. Den första bygger på hela dokumentsamlingen och systemet bygger utifrån termfrekvenser upp en tesaurus från vilken termer hämtas för att bygga ut söksträngen. Detta görs utan sökarens inverkan. 23 Den andra versionen bygger på antagandet att de n första dokumentet i träfflistan är relevanta. Från dessa dokument hämtas sedan termer för att utöka söksträngen. En annan version är också att sökaren får välja vilka dokument som anses relevanta, och systemet använder dessa för att finna nya termer. 24 19 Ahlgren (2002) s.158 20 Ibid. s.162 21 Ibid. s.163 22 Ibid. s.172 23 Cui, Hang et al. (2003) s.829 24 Ibid. 7

2.4 Tidigare forskning Det finns mycket forskning gjort om söksträngsexpansion, framför allt då inriktad på automatisk expansion ur ett systemperspektiv. Forskning ur ett användarperspektiv eller om manuell söksträngsexpansion är svårare att komma över. I följande kapitel kommer 2 studier att presenteras. Studierna överlappar inte ämnesmässigt den undersökning som uppsatsen bygger på, men har vissa gemensamma beröringspunkter som kan vara värda att lyfta fram. Efthimis N. Efthimiadis 25 undersöker interaktiv söksträngsexpansion och relevance feedback utifrån ett användarperspektiv. Studien tar sin utgångspunkt i en efterfrågan efter fler undersökningar med användarperspektiv. Efthimiadis undersöker effektiviteten hos interaktiv söksträngsexpansion med riktiga informationsbehov och användare. Allt som allt gjordes 25 fria sökningar. Data samlades in genom enkäter, dataloggar och utskrifter av sökresultaten. De 12 första sökningarna skrevs in på ett sådant sätt att de förutsattes gynna sökningen i största möjliga grad, det vill säga med bland annat fraser, enskilda termer, trunkeringar, synonymer och booleska operatorer. Termer att utöka söksträngen med presenterades i en lista varifrån deltagarna fick välja vilka termer de ansåg vara mest passande för att utöka söksträngen. De valda termerna skrevs också in på ett sådant sätt som ansågs göra mest nytta för sökningen. I de 13 efterkommande sökningarna skrevs samtliga söktermer in som enskilda termer utan några försök att få en så bra söksträng som möjligt. Därefter valdes de högst rankade termerna från en lista ut och lades till i söksträngen som enskilda termer. Deltagarna fick sedan välja vilken relation de ansåg termerna som användes för att utöka söksträngen hade jämfört med de ursprungliga. Här fick de möjlighet att välja upp till fyra alternativ till varje term, varför den sammanlagda summan inte blir 100%. Resultatet visar att 88% av de valda termerna ansågs vara relaterade eller alternativa till termerna i första söksträngen. 68% ansågs vara synonymer. Bara 4% valdes för att det inte fanns några andra termer som passade bättre. Författaren lyfter särskilt fram att hela 44% valdes för att de ansågs som en ny idé. Förhållandena mellan termerna var 46% snävare än ursprungstermen, 3% bredare och 17% relaterade. Den första sökningen gav i genomsnitt tre relevanta träffar, medan de expanderade gav i genomsnitt nio. 26 Carol C. Kuhlthau 27 undersöker användarnas perspektiv på informationssökning gällande tankar, känslor och handlingar. Hon presenterar i en artikel från 1991 en modell vid namn Information Seeking Process, eller ISP, som legat till grund för mycket av den efterkommande forskningen på samma område. Undersökningen visade att studenter i början av en söksession ofta uppvisar osäkerhet, frustration och vaga, oklara tankar kring ämnet i fråga. I och med att deltagarnas kun- 25 Efthimiadis, Efthimis N. (2000) Interactive Query Expansion: A User-based Evaluation in a Relevance Feedback Environment. 26 ibid. s.993-998 27 Kuhlthau, C. Carol (1991). Inside the Search Process: Information Seeking from the User s Perspective. Journal of the American Society for Information Science 8

skap om ämnet ökar blir också deras tankar klarare och mer fokuserade. En känsla av säkerhet kunde också iakttas. Studierna jämförde tre typer av biblioteksanvändare - användare av folkbibliotek, användare av högstadiebibliotek samt användare av högskolebibliotek. Grupperna rapporterade i olika delar av processen olika hög grad av osäkerhet. Folkbiblioteksanvändare var i början de som kände sig mest bekväma i sökningsprocessen. Högstadie- och högskolestudenterna visade till en början ungefär samma låga säkerhet, men mot slutet av processen uppvisade högskolestudenterna en klart högre grad av självsäkerhet. 28 Studien visar på att intresset av ett ämne ökar allt eftersom man lär sig mer om det, informationsbehovet och fokus förändras under tiden information samlas in, samt att ett centralt tema tenderar att utvecklas under insamlandet av information. 29 28 Ibid. s.368 29 Ibid. 9

3. Metod Kommande avsnitt inleds med en diskussion om experiment och experimentdesign. Därefter kommer uppsatsens metod presenteras och diskuteras. Egentliga experiment är sällsynt förekommande inom samhällsvetenskapen. 30 Barbara Wildemuth beskriver ett experiment som att man tar kontroll över en situation och manipulerar vissa parametrar, variabler, för att ta reda på vilken inverkan de har på situationen. Det finns två typer av variabler, de som manipuleras och de som påverkas. Den första typen är den som är av primärt intresse för experimentet, då det är den man ändrar för att få reda på vilken effekt det har. 31 Vill man exempelvis, som i Sara Larssons magisteruppsats, 32 testa hur olika sökgränssnitt påverkar sökningen kan man ge olika grupper olika gränssnitt och jämföra resultaten. Vilket sökgränssnitt som används är då den primära variabeln som är mest intressant för att se hur sökresultaten påverkas. Syftet med experimentet i den här studien är att se hur bibliotekariestudenter skapar söksträngar, hur de sedan expanderar dem och i vilken mån bibliotekariestudenterna har hjälp om sökhjälp erbjuds eller ej. Två grupper om 4 respektive 5 deltagare fick genomföra sex stycken sökningar i EBSCOhosts databas Academic Search Premier. Flera anledningar ligger till grund för valet av databas. Till att börja med är EBSCOhost en stor aktör på marknaden och har databaser inom ett flertal områden, exempel medicin, biblioteks- och informationsvetenskap och pedagogik. På så sätt är det viktigt att bibliotekariestudenterna har koll på hur söktjänsten fungerar. Dessutom har det i utbildningen ingått undervisning och sökuppgifter i en av databaserna som EBSCOhost erbjuder, nämligen MEDLINE. På så sätt har deltagarna i studien redan viss koll på hur databasen fungerar, och behöver inte sätta sig in i ett nytt gränssnitt vilket skulle kunna förvirra och påverka resultaten negativt. Första gruppen, experimentgruppen, fick i början av söksessionen en utskriven version av den sökhjälp som erbjuds i databasen (se bilaga 3). Den andra gruppen fungerade som kontrollgrupp och fick söka samma uppgifter fast utan tillgång till sökhjälpen. Fem av sökuppgifterna hämtades från Cecilia Andersson och Marie Pilbrants magisteruppsats från 2005. 33 En uppgift konstruerade jag själv. Uppgifterna är av varierande karaktär och finns tillgängliga i bilaga 1 och 2. Samtliga deltagare fick göra två sökningar på varje uppgift, en så kallad baselinesökning och en expanderad. Med baseline menas den första sökningen som görs. Ordböcker, tesaurus och dylikt fick användas, men sökaren har ingen resultatlista med dokument att utgå från. I den andra sökningen, den expanderade, utökas sökfrågan med fler termer såsom synonymer och liknande termer med målet att öka antalet relevanta träffar, även om resultatet i sig inte är av intresse för den här studien. Efter varje sökning skrevs sök- 30 Bryman, Alan (2002). Samhällsvetenskapliga metoder. s.46 31 Wildemuth, Barbara (2009) Applications of social research methods to questions in information and library science. s.105 32 Larsson, Sara (2003). Gränssnitt, användbarhet och sökmotorer. 33 Andersson, Cecilia & Pilbrant, Marie (2005) Google Scholar eller Scirus för vetenskapligt material på webben? : En utvärdering och jämförelse av återvinningseffektivitet. 10

strängarna av till en elektronisk enkät. När alla sex uppgifter var gjorda öppnades ytterligare en sida av enkäten med gruppoberoende frågor blandade med gruppspecifika. De gruppoberoende bestod av frågor rörande bland annat hur länge deltagarna studerat vid högskola, vilket år på programmet de läser, om de fått utbildning i informationssökning utöver den som ingår i utbildningen, och hur de gick tillväga för att hitta termer att använda för att expandera sökfrågan. Till experimentgruppen ställdes frågor om vad de ansåg om sökhjälpen, vad de tyckte fattades i den, om de ansåg de fått någon hjälp av den och hur mycket den användes. Kontrollgruppen fick i stället frågor kring om de trodde att de skulle haft någon användning av en sökhjälp och i så fall vad de skulle önskat att den innehöll. När de var färdiga med enkäten skickades den in anonymt och de kunde lämna salen om så önskades. Experimenten utfördes under två dagar, där experimentgruppen fick genomföra sökningarna vid första tillfället och kontrollgruppen dagen efter. Vid första tillfället delades sökhjälpen ut när deltagarna tagit plats vid en dator. Därefter instruerades de om hur experimentet skulle gå till. Kontrollgruppen fick direkt efter att de tagit plats ta del av instruktionerna. Enkäten skickades ut till deltagarna via mejl när de satt sig vid datorn. De experiment som inte fullt följer den klassiska experimentdesignen kallas ibland för kvasiexperiment. 34 Det kan handla om faktorer som att urvalet inte är randomiserat eller att experimentet utförs i en mer naturlig miljö där alla faktorer inte kan kontrolleras. 35 Man kan därför argumentera att det här utförda experimentet snarare lutar åt kvasiexperiment än äkta experiment, då urvalet dels inte var helt randomiserat och det inte var möjligt att kontrollera samtliga faktorer i experimentsalen. Däremot har flertalet åtgärder tagits för att efterlikna ett äkta experiment i största möjliga mån. Deltagarna har i stor utsträckning slumpats till vilken grupp de fick tillhöra. Också gruppernas funktion (experiment- eller kontrollgrupp) slumpades. Under bearbetningen och analysen av resultaten var det inte möjligt för mig att avgöra vilka enkätsvar som hörde till vilken deltagare. Detta gjorde också att eventuell bias från min sida inte spelade in i analys av resultaten. 3.1 Urval Deltagarna till studien söktes via fyra olika vägar. Till att börja med sattes affischer upp runtom i skolbyggnaden som efterfrågade intresserade. En sida på facebook skapades för att informera och ta in intresseanmälningar. Samma information som gavs via affischer och facebook skickades också ut till alla bibliotekariestudenter i årskurserna ett och två via utbildningens lärplattform. Till sist spred jag också ut information muntligt till kontakter i urvalsgruppen. 13 personer tackade ja till att delta i undersökningen, men bara 9 dök upp till experimentet, varav 8 gav data som var möjliga att använda i undersökningen. 3.2 För- och nackdelar med metodvalet Det finns vissa uppenbara problem med metodvalet, såsom bristen på kontroll över deltagarnas interna kommunikation i rummet och risken att enkäten inte ger tillräckligt utförliga svar. Kanske hade en kompletterande intervju med deltagarna i samband med 34 Bryman (2002). s.49 35 Wildemuth (2009) s.93 11

experimentet varit säkrare för att ta del av hur de tänkt under söksträngskonstruktionen. Nu i efterhand kan det tyckas vara ett bättre alternativ än enkäter, dock också ett mer omfattande alternativ. En mer utförlig variant av experimentet med intervjuer uppmuntras utföras i framtiden för att kunna täcka in området som inte var rimliga att ta hänsyn till i denna uppsats. Situationen som uppstår under ett experiment som detta kan inte sägas vara naturlig eller särskilt verklighetstrogen, och risken att sökningarna inte går till som de gjort i en mer vardaglig situation är överhängande. Undersökningen bör i den kontexten ses som en pilotstudie och ett första försök till hur en studie om manuell söksträngsexpansion kan vara uppbyggd. 3.3 Generaliserbarhet Med det lilla urval som studien undersöker är det inte möjligt att kunna applicera resultatet på en bredare population. Däremot är det möjligt att göra ett hypotestest för att se om resultatet skulle anses vara giltigt givet en större testgrupp. För att göra detta används här Mann-Whitney U-testet, som används för att mäta skillnader två oberoende observationsgruppers resultat. På så sätt är det möjligt att, åtminstone rent hypotetiskt sätt, se om resultatet skulle varit signifikant om testgruppen varit större. 3.3 Möjliga felkällor Bortfall Det blev ett bortfall på sammanlagt fem personer. Av de 13 som tackat ja till att medverka fanns endast 9 stycken på plats då experimentet genomfördes. En person följde inte instruktionerna och dennes söksträngar bedömdes vara oanvändbara med den analysmodell som används och plockades bort. Med tanke på att urvalet redan från början inte var representativt och det faktum att studien inte gör några anspråk på att kunna generalisera sina resultat kan det argumenteras att bortfall inte är något särskilt stort problem i sammanhanget mer än att det resulterar i färre data att arbeta med. Instruktioner En snabb översikt över inkomna resultat gjordes redan innan andra gruppen utförde sitt experiment, och på grund av bortfallet med de användbara söksträngarna gavs något tydligare instruktioner till andra gruppen. Samma sedan tidigare förberedd instruktionsmall användes, men med vissa förtydliganden gällande att det endast är sökfältet som är av intresse och att andra inställningar inte är prioriterade. Kommunikation För att inte sätta någon press på testdeltagarna befann sig ingen annan person i rummet än de som gjorde testet. Det kan därför ha förekommit att de kommunicerat sinsemellan och på så sätt påverkat varandras söksträngar. Egenfunnen sökhjälp Det var inte möjligt att kontrollera huruvida kontrollgruppen själv letade upp och använde sig av sökhjälp antingen via databasens egna hjälpfunktion eller annanstans på internet. 12

Kommunikation mellan grupper Det var inte möjligt att kontrollera om deltagarna i experimentgruppen som gjorde sökningarna vid första tillfället pratade med deltagare i kontrollgruppen innan de genomförde experimentet. 3.4 Analysguide Analysen av resultaten kommer att vara mestadels kvalitativ, men utgå från kvantitativa resultat. Således kommer rent kvantitativa data användas för att se skillnader och likheter mellan och inom grupperna, från vilka en kvalitativ analys kommer göras. Syftet med den kvalitativa analysen är att titta närmare på ett antal söksträngar och försöka utröna vad som kan ligga till grund för hur de är utformade samt hur söksträngselementen används. De element i söksträngarna som kommer tittas på i resultat och analys och hur de räknas presenteras nedan. Antal termer Varje ord i söksträngen som inte är en operator räknas som en term. Om flera ord står inom frasbeteckning räknas varje ord som en term (exempelvis cell phone räknas som två termer). Om Subject Terms används räknas också där varje enskilt ord som en term. Trunkering Varje trunkering * räknas. Parentes Samtliga parenteser ( ) räknas. Även ofullständiga parenteser räknas. Fraser Varje frasbeteckning som inte är kring Subject Terms räknas. Även ofullständiga frasbeteckningar räknas. Booleska operatorer Operatorerna AND och OR räknas vid varje förekomst. 13

4. Resultat Resultatkapitlet är uppdelat i fyra större delar och inleds med en sammanfattning av enkäten som respondenterna fyllde i efter sökningarna. Frågorna i enkäten är av två typer. Den första typen är frågor som handlar deltagarens bakgrund och förklaras närmare i avsnitt 6.1.1. Den andra typen är frågor mer specifikt kring sökuppgifterna och presenteras också de i avsnitt 6.1.1, fast då i löpande text. Därefter presenteras experimentoch kontrollgruppens resultat i var sitt avsnitt. Avslutningsvis följer en jämförelse mellan grupperna. 4.1 Enkäternas resultat I följande avsnitt redovisas svaren i de enkäter som respondenterna fick fylla i efter de var färdiga med sökuppgifterna. Först kommer experimentgruppens resultat redovisas och därefter kontrollgruppens. Citat från enkäten står i kursivt omgivna av citationstecken. Fullständiga enkäter med svar finns i bilaga 1 och 2. 4.1.1 Experimentgruppen Tabell 1 sammanfattar enkäterna från experimentgruppen och behandlar hur länge respondenterna läst på högskola eller universitet, vilket år på utbildningen de går, om de tagit del av informationssökningsutbildningar utöver de som ingår i programmet, om de tyckte det var svårt att komma på expansionstermer, i vilken utsträckning de använde sig av sökhjälpen och om de tycker det saknas något i sökhjälpen. Tabell 1. Sammanfattning av experimentgruppens enkätsvar 14 Svårighet att hitta exp.termer År på Högskola År på utbildningen Tidigare infosökutb. Användning av sökhjälp 1A 3-5 år 2 Nej Nej Inte alls Nej 1B 1-2 år 2 Ja Nej Lite Nej 1C 3-5 år 1 Nej Nej Lite Nej 1D 1-2 år 1 Nej Ja Lite Nej Saknas något i sökhjälp I enkäten ombads deltagarna också att kort beskriva hur de kom fram till de expansionstermer de använde sig av, samt om de tyckte det var svårt att hitta termer att expandera med. Dessutom gavs utrymme för övriga kommentarer eller tankar. Nedan presenteras svaren från den delen av enkäten. Deltagare 1A hittade expansionstermer i resultatlistan. Det framkommer inte om posterna öppnades eller om termer hämtades från den korta sammanfattning som ges i träfflistan. Hen tyckte inte det var svårt att hitta expansionstermer och rapporterade tidigare kunskap och tidigare sökningar som källor för nya termer. Sökhjälpen användes inte alls. 1B använde Subject Terms för att hitta nya termer och beskriver det som att det är enkelt att hitta nya termer, det svåra är att skilja på nyanser. 1B kommenterade att det

var jobbigt att sätta sig in i såpass skilda ämnen på så kort tid, och då särskilt uppgifterna rörande naturvetenskap. I sökhjälpen skummades bara rubrikerna, men ingen djupare användning rapporterades. Deltagare 1C beskriver expansionsprocessen som att hen utvecklade termerna som redan användes, försökte täcka in alla former av en term som bedömdes relevant, titta på Subject Terms och titta på relevanta poster samt använde synonymer till termerna som hittades. Dessutom användes Google för att söka på termer som hen inte förstod. 1C tyckte inte att det var några problem att leta upp synonymer till de som förekom i själva sökuppgiften eller fått genom första sökningen. Google nämns igen som källa för att hitta nya termer. Sökhjälpen tittades igenom då det var ett tag sen vi arbetade med sökning i databaser. 1D använde sig främst av Google för att hitta synonymer. Tesaurus (troligtvis åsyftas här Subject Terms) användes för att hitta nyckelord som tilldelats potentiellt relevanta dokument. 1D var den enda i gruppen som fann det svårt att hitta eller komma på expansionstermer och menar att det var komplicerat om hen inte hade någon kunskap i ämnena. Att hitta ämnestermer som skulle kunna användas i databasen kändes alltid som ett hinder i början. Om första träfflistan gav poster med relevanta dokument plockades termer därifrån. 4.1.2 Kontrollgruppen Tabell 2 sammanfattar enkäterna från kontrollgruppen och behandlar hur länge respondenterna läst på högskola eller universitet, vilket år på utbildningen de går, om de tagit del av informationssökningsutbildningar utöver de som ingår i programmet, om de tyckte det var svårt att komma på expansionstermer och om de tror de skulle haft någon hjälp i formulerandet av söksträngarna om de haft någon slags sökhjälp till hands. Tabell 2. Sammanfattning av kontrollgruppens enkätsvar. Svårighet att hitta exp.termer Tror sig ha användning av sökhjälp År på Högskola År på utbildningen Tidigare infosökutb. 2A < 1 år 1 Nej Nej Osäker 2B 1-2 år 1 Nej Nej Ja 2C < 1 år 1 Nej Ja Ja 2D 1-2 år 2 Nej Nej Osäker 2A beskrev valet av expansionstermer som att hen [v]alde relevanta termer som skulle avgränsa sökningarna till ett mer överskådligt antal poster. Inga problem med att hitta expansionstermer rapporterades. 2A rapporterade osäkerhet om huruvida en sökhjälp hade varit till hjälp eller ej. 2B tittade på vilka ordförslag som kom upp när söktermerna skrevs in. Hen sökte mer allmänt först, sorterade efter relevans och skummade igenom posterna efter söktermer som ansågs passande att expandera med. Vissa svårigheter med att hitta på bättre definitioner till andra sökningen rapporterades. 2B tror att en sökhjälp skulle kunna vara till hjälp. 15

2C försökte använda övergripande termer, men går inte in mer på det än så. Hen kände att bristen på ord kan vara ett problem, och tror att en sökhjälp skulle kunna vara till hjälp. 2D använde sig av Subject Terms för att hitta nya termer och tyckte det var svårt att komma på termer att söka med. Däremot uppfattades det lätt att hitta termer via Subject Terms att använda. Hen är osäker på huruvida sökhjälp skulle vara till hjälp eller inte. 4.2 Experimentgruppens resultat I tabell 3 redovisas den sammanlagda mängden element i söksträngarna för varje uppgift tillsammans med skillnaden mellan baselinesökningen och den expanderade. Som synes tenderar det att variera rätt mycket mellan sökfrågorna i fråga om framför allt antal termer, med uppgift 1 som lägsta skillnad (0) och uppgift 6 som största (11). I inget fall har antalet termer sjunkit i den expanderade söksträngen. De övriga elementet är mer oberäkneliga och tenderar att pendla mer i förekomsten mellan baseline och expansion. Tabell 4 sammanfattar i vilken mån elementen i sökfrågorna expanderas, minskas eller håller sig oförändrade. Det som särskilt sticker ut är dels i hur hög grad parenteser läggs till i expansionen, samt att antalet trunkeringar minskar i fem av sex sökuppgifter. I alla utom en sökuppgift adderas nya termer. I tabellen är det inte möjligt att utläsa om element flyttats runt i sökfrågan eller om termer bytts ut. Inte heller är det möjligt att utläsa någonting om enskilda söksträngar, tabellen visar bara sammanfattning för sökuppgifterna i stort. 4.3 Kontrollgruppens resultat Avsnittet för kontrollgruppen är upplagt på samma sätt som för experimentgruppen med tabell 5 med sammanfattning av mängden element och skillnaden mellan baseline och expanderad söksträng. I första sökningen används bortsett från AND-operatorn väldigt få element. Söksträngens längd i termer räknat ligger i genomsnitt på strax över tre ord. Särskilt intressant är kanske bristen på parenteser, som i baselinesökningen är helt frånvarande. Liksom tabell 4 visar tabell 6 i hur många av sökuppgifterna som element läggs till, tas bort eller håller sig oförändrade under expansionen. Som synes är det framför allt parenteser som läggs till. I samtliga uppgifter finns söksträngar som utökats med parenteser. Precis som tidigare säger inte tabellen någonting om hur många av söksträngarna som har expanderats med ett element, bara att åtminstone en söksträng i uppgiften har gjort det. Antalet uppgifter som fått element borttagna är tämligen få. 16

Tabell 3. Experimentgruppens sammanlagda söksträngselement för varje sökuppgift. Uppgift 1 Baseline Expanderad Skillnad Antal termer 21 21 0 Trunkering 7 3-4 Parentes 2 3 +1 Citation 6 7 +1 AND 5 7 +2 OR 9 7-2 Uppgift 2 Antal termer 24 34 +10 Trunkering 5 4-1 Parentes 2 4 +2 Citation 5 3-2 AND 6 6 0 OR 3 6 +3 Uppgift 3 Antal termer 23 24 +1 Trunkering 4 1-3 Parentes 4 7 +3 Citation 9 8-1 AND 5 6 +1 OR 5 5 0 Uppgift 4 Antal termer 17 19 +2 Trunkering 1 0-1 Parentes 2 5 +3 Citation 4 4 0 AND 4 4 0 OR 4 5 +1 Uppgift 5 Antal termer 24 29 +5 Trunkering 9 9 0 Parentes 5 9 +4 Citation 0 0 0 AND 9 8-1 OR 11 13 +2 Uppgift 6 Antal termer 14 25 +11 Trunkering 7 4-3 Parentes 3 7 +4 Citation 1 3 +2 AND 5 6 +1 OR 3 7 +4 Tabell 4. Sammanfattning av om söksträngselement läggs till, tas bort eller är oförändrade i expanderad söksträng gentemot baseline, sett till sökuppgifter. Expanderad Förminskad Oförändrad Termer 5 0 1 Trunkering 0 5 1 Parentes 6 0 0 Fras 2 2 2 AND 3 1 2 OR 4 1 0 17

Tabell 5. Kontrollgruppens sammanlagda söksträngselement för varje sökuppgift. Uppgift 1 Baseline Expanderad Skillnad Antal termer 15 18 +3 Trunkering 6 3-3 Parantes 0 1 +1 Citation 0 0 0 AND 7 7 0 OR 4 1-3 Uppgift 2 Antal termer 17 17 0 Trunkering 4 4 0 Parantes 0 2 +2 Citation 1 1 0 AND 8 6-2 OR 0 0 0 Uppgift 3 Antal termer 12 14 +2 Trunkering 0 2 +2 Parantes 0 2 +2 Citation 1 1 0 AND 4 6 +2 OR 0 0 0 Uppgift 4 Antal termer 13 15 +2 Trunkering 1 2 +1 Parantes 0 2 +2 Citation 1 1 0 AND 4 5 +1 OR 0 0 0 Uppgift 5 Antal termer 11 15 +4 Trunkering 0 3 +3 Parantes 0 2 +2 Citation 1 1 0 AND 6 6 0 OR 0 0 0 Uppgift 6 Antal termer 10 14 +4 Trunkering 2 3 +1 Parantes 0 3 +3 Citation 0 0 0 AND 5 8 +3 OR 0 0 0 Tabell 6. Sammanfattning av om söksträngselement läggs till, tas bort eller är oförändrade i expanderad söksträng gentemot baseline, sett till sökuppgifter. Grupp 2 Expanderad Förminskad Oförändrad Termer 5 0 1 Trunkering 4 1 1 Parentes 6 0 0 Citation 0 0 6 AND 3 1 2 OR 0 1 5 18

4.4 Jämförelse mellan grupperna Nedan presenteras en jämförelse mellan grupperna. Diagram 1 visar det totala antalet element för båda grupperna och visar både skillnaden i antalet termer mellan baseline och expansion såväl som mellan grupperna. Tabell 7 är en sammanslagning av tabell 3 och 5 och syftar till att ge en överskådlig bild på skillnaderna uppgift för uppgift. Diagram 1. Det totala antalet söksträngselement i båda grupperna. 160 140 120 100 80 60 40 Experiment Baseline Experiment Expanderad Kontroll Baseline Kontroll Expanderad 20 0 19

Tabell 7. Experimentgruppens och kontrollgruppens sammanlagda resultat sida vid sida. Experimentgr Kontrollgr Experimentgr Kontrollgr Uppgift 1 Baseline Baseline Expanderad Expanderad Antal termer 21 15 21 18 Trunkering 7 6 3 3 Parentes 2 0 3 1 Fras 6 0 7 0 AND 5 7 7 7 OR 9 4 7 1 Uppgift 2 Antal termer 24 17 34 17 Trunkering 5 4 4 4 Parentes 2 0 4 2 Fras 5 1 3 1 AND 6 8 6 6 OR 3 0 6 0 Uppgift 3 Antal termer 23 12 24 14 Trunkering 4 0 1 2 Parentes 4 0 7 2 Fras 9 1 7 1 AND 5 4 6 6 OR 5 0 5 0 Uppgift 4 Antal termer 17 13 19 15 Trunkering 1 1 0 2 Parentes 2 0 5 2 Fras 4 1 4 1 AND 4 4 4 5 OR 4 0 5 0 Uppgift 5 Antal termer 24 11 29 15 Trunkering 9 0 9 3 Parentes 5 0 9 2 Fras 0 1 0 1 AND 9 6 8 6 OR 11 0 13 0 Uppgift 6 Antal termer 14 10 25 14 Trunkering 7 2 4 3 Parentes 3 0 7 3 Fras 1 0 3 0 AND 5 5 6 8 OR 3 0 7 0 I tabell 8 redovisas resultaten från Mann-Whitney U-testet och vilka skillnader mellan grupperna som är signifikanta. I baselinesökningen ser vi att det finns en signifikant skillnad mellan termanvändning, parenteser och OR-operatorn. Trunkeringar ligger 20

strax över signifikansnivån. Intressant att lyfta fram är att AND-operatorn är det enda elementet som används lika många gånger i båda grupperna. I samtliga andra fall är förekomsten av element mer frekvent i experimentgruppen än kontrollgruppen. Efter att expansion har skett har avståndet mellan grupperna ökat i samtliga fall utom vid trunkeringar, där signifikansnivån sjönk från 0.65 till 0.699, och parenteserna som ligger stadigt på 0.002. Tabell 8. Resultat från Mann-Whitney U-test för förändringar mellan grupperna. Signifikansnivån ligger på 5%, det vill säga 0.05. Baseline Expanderad Antal termer.009 sig..002 sig. Trunkering.065.699 Parentes.002 sig..002 sig. Fras.093.042 sig. AND 1.000.699 OR.009 sig..002 sig. 21

5. Analys I den här delen kommer jag att tolka resultaten och jämföra grupperna emellan ur flera aspekter. Kapitlet inleds med att diskutera skillnader mellan grupperna och vad som kan ligga bakom. Därefter kommer en mer djupgående analys av själva söksträngarna. Man kan se en tydlig skillnad mellan grupperna i hur många element som används. Experimentgruppen använder, med undantag från AND-operatorn, samtliga element i högre utsträckning än kontrollgruppen. Nedan följer kommentarer kring varje typ av identifierat element. Därefter diskuteras de olika elementen tillsammans och hur de kan ha påverkat varandra. 5.1 Förekomst av element Experimentgruppen använde sig redan under baselinesökningen av fler termer än vad kontrollgruppen gjorde i den expanderade sökningen. Den genomsnittliga söksträngen för experimentgruppen i baseline ligger på strax över 5 termer, medan den för kontrollgruppen ligger strax över 3. Experimentgruppen ligger således över genomsnittet i söksträngslängd, medan kontrollgruppen rör sig i gränslandet eller strax över. 36 Sökhjälpen som experimentgruppen fick ta del av berör inte någonting kring längden på söksträngen. Trunkeringar är det enda elementet som totalt sett minskar i frekvens hos experimentgruppen. Baselinesökningarna innehåller 33 trunkeringar, medan de expanderade innehåller 21 stycken. Detta skulle kunna förklaras delvis med att en av deltagarna (1B) expanderade söksträngarna genom att byta ut termerna i baselinesökningen mot Subject Terms, i och med det bytet försvann många trunkeringar, medan fraser och parenteser ökade då Subject Terms i regel är omgivna av de båda. I kontrollgruppen sker en mindre ökning från 13 i baseline till 17 i expanderad. En av deltagarna i kontrollgruppen (2B) använde sig av Subject Terms på samma sätt som personen i experimentgruppen, men antalet trunkeringar som gick förlorade i processen var färre. Trunkeringar beskrivs i sökhjälpen, och att antalet sjunker i första gruppen skulle kunna bero på att deltagarna testade dem i första sökningen men fann inte resultatet tillfredsställande nog för att motivera till fortsatt användning. Antalet parenteser ökade från 18 till 35 i experimentgruppen. Också här kan den ökade användningen av Subject Term ligga som förklaring till ökningen, men också fler synonymer har lagts till under expansionen och omges då av parenteser. Detsamma kan sägas om kontrollgruppen som ökade från 0 till 12 parenteser. Hade parenteser kring Subject Terms inte räknats med i analysen hade bara en enda parentes använts i de expanderade söksträngarna. Deltagare 2A använde en parentes i första sökuppgiften. Att inga fler utnyttjades i senare uppgifter kan bero på att resultatet inte ansågs tillfredsställande. 36 Baeza-Yates & Ribiero-Neto (2011). s.23 22