Dokumentrekommendationssystem och intranät

Storlek: px
Starta visningen från sidan:

Download "Dokumentrekommendationssystem och intranät"

Transkript

1 Dokumentrekommendationssystem och intranät Anders Gabrielsson Examensarbete 20p Språkteknologiprogrammet Institutionen för lingvistik Uppsala universitet Handledare: Lars Borin och Henrik Fagrell 21 januari 2000

2

3 Sammanfattning Dokumentrekommendation är en del av informationsfiltrering, ett område som främst handlar om att tillfredsställa långsiktiga informationsbehov, i motsats till informationssökning (information retrieval, IR) där man sällan tar hänsyn till användarens intressen eller tidigare beteende. Inom informationsfiltrering gör man detta genom att skapa en modell för det som användaren är intresserad av som sedan används för att välja ut relevanta informationskällor, vanligtvis textdokument. Jag ger här en översikt över de vanligaste metoderna för informationsfiltrering. Jag jämför innehållsbaserad filtrering, där man ser till dokumentens innehåll, med social filtrering, där man i stället utnyttjar andra användares omdömen om dem, och explicita användarmodeller, sådana som konstrueras av användarna själva, med implicita, som skapas av systemet utifrån observationer av användarnas beteende. Här finns en mer detaljerad beskrivning av LSI, Latent Semantic Indexing, en matematisk metod för att hitta likheter mellan dokument. Jag beskriver också det system för dokumentrekommendation på ett företags intranät som jag arbetat på för Viktoriainstitutets räkning. Systemet använder sig av LSI och explicita användarprofiler.

4

5 Innehåll 1 Inledning Informationsfiltrering Informationsfiltrering och intranät Uppgift Informationsfiltrering Introduktion och terminologi Kort historik Metoder för textfiltrering Innehållsbaserad filtrering Social filtrering Betygsmodeller Användarmodeller Explicita och implicita modeller Exempel på system SIFT InfoScope Tapestry URN GroupLens TREC Intressanta utvecklingsriktningar LSI SVD För- och nackdelar samt jämförelser med andra system Implementation Klienten Funktionalitet

6 3.1.2 Teknikaliteter Servern Indexering: översikt Indexering: detaljer Datafiler Filter Profil Diskussion Tankar kring indexering Sammanfattning 27 Referenser 29 A Appendix 30 A.1 Synonymiregler A.2 Profil- och filterexempel

7 Kapitel 1 Inledning Mer och mer information finns i elektronisk form, vilket gör det enkelt att göra den tillgänglig för många människor. Detta används bland annat inom företag som använder sig av sina intranät för att distribuera information i elektronisk form. Det kan dock vara svårt för de anställda att tillgodogöra sig informationen på ett effektivt sätt, eftersom det kan krävas stora insatser av tid och arbete för att hitta det som är relevant för den enskilde. 1.1 Informationsfiltrering Informationsfiltrering är ett område där man främst koncentrerar sig på långsiktiga informationsbehov, det vill säga när en användare vill bli kontinuerligt hjälpt med att få fram information om ett visst ämne. Oftast handlar det om att förmedla intressanta textdokument till användaren, men det kan också röra sig om film, musik och så vidare. Många använder sig näst intill dagligen av informationsfiltrering i form av bok- och filmrecensioner, sökmotorer på väven 1 och så vidare. Många existerande system kräver dock en relativt stor insats av tid och arbete innan de ger någon utdelning (Fagrell 1999, s.1), delvis för att de främst är konstruerade för att tillfredsställa kortsiktiga informationsbehov. 1.2 Informationsfiltrering och intranät Intranät har blivit ett vanligt sätt för företag att sprida information till sina anställda. (Fagrell 1999, s. 1) Det kan dock vara problematiskt att hitta relevant information 1 Denna term har av SICS lanserats som ett alternativ till webben. Jag har valt att använda detta ord eftersom jag anser det mer lämpligt att hitta svenska alternativ till engelska ord än att anpassa dem till svenska böjningsmönster. 1

8 även på ett sådant nät, eftersom den nya informationen lätt kan försvinna i mängden av mindre aktuella dokument, och eftersom alla anställda inte är intresserade av all ny information som görs tillgänglig. Ett exempel på den omfattning som ett stort intranät kan ha är Volvos, som i maj 1999 hade användare och 250 servrar med dokument. Vissa servrar registrerade då strax över 3000 sessioner per arbetsdag, där en session definieras som en serie förfrågningar med uppehåll på mindre än 30 minuter. (Fagrell 1999, s. 3) 1.3 Uppgift Min uppgift har varit att som mitt examensarbete på språkteknologiprogrammet undersöka området informationsfiltrering samt att fortsätta utvecklingen av ett system för informationsfiltrering som skapats vid Viktoriainstitutet i Göteborg för användning på Volvos intranät. 2

9 Kapitel 2 Informationsfiltrering 2.1 Introduktion och terminologi Med informationsfiltrering menas här en typ av informationssökning där användaren försöker tillfredsställa ett långsiktigt informationsbehov genom att genomsöka en stor mängd dynamiskt genererad information. Denna definition är i stort sett densamma som den som används i Oard (1997), varifrån större delen av innehållet i den här delen har hämtats. Ett informationsfiltreringssystem är ett automatiskt system som konstruerats för att hjälpa användare att hitta de informationsenheter som bäst tillfredsställer deras informationsbehov. Informationssökning används här i vid mening, omfattande alla typer av aktiviteter som företas i avsikt att tillfredsställa ett informationsbehov. Det innefattar såväl att slå upp telefonnummer i en telefonkatalog eller tågtider i en tågtidtabell som databassökningar eller användning av sökmotorer på nätet. Med informationsenhet menas en enhet som innehåller information i en form som kan tolkas av användaren. Det kan röra sig om texter, men också bilder, ljud eller något annat. Informationsenheter som innehåller text kallas vanligen dokument, och filtrering av dessa brukar kallas textfiltrering. Det är denna gren av området som kommer att stå i fokus här. Med dynamiskt genererad information menas att det ständigt tillkommer ny information som användaren kan vara intresserad av. Den representation av användarens informationsbehov som systemet använder kallas profil eller användarmodell. Det senare begreppet kan även användas om en grupp användare. Det är i praktiken knappast möjligt att skapa en perfekt representation av användarens informationsbehov, men man bör sträva efter att göra en så god approximation som möjligt, inom de ramar som sätts av det system man använder. (Alla som någon gång har använt en sökmotor vet hur svårt det kan vara att ens för sig själv formulera exakt vad det egentligen är man letar efter.) 3

10 Det som skiljer informationsfiltrering, IF, från information retrieval, IR, är just att inom IF antas användarens informationsbehov vara relativt stabilt och specifikt jämfört med hur snabbt ny information görs tillgänglig. Ett typiskt exempel på IR är användning av sökmotorer på nätet. Här kan användarens informationsbehov inte antas vara detsamma från en sökning till en annan, snarare tvärt om - användarens behov ändras snabbt och kan variera mycket. Ett filter som ska ta bort så kallad spam (oönskade, vanligtvis kommersiella, massutskick) från användarens e-post är dock ett exempel på IF, eftersom samma, eller mycket liknande, urvalskriterier används hela tiden, medan det ständigt tillkommer nya informationsenheter, i det här fallet e-brev. Ett informationsfiltreringssystem kan antingen bygga på att den som tar emot och den som sänder informationen samarbetar genom att avsändaren gör något slags markeringar för att underlätta sortering, eller på att mottagaren själv får sköta filtreringen. Eftersom samarbete kräver någon form av samordning, och eftersom det finns stora mängder redan existerande dokument som skulle behöva förses med sådana markeringar, är system där mottagaren själv får göra allt antagligen dem som är mest intressanta i nuläget. Det finns dock undantag, till exempel när det gäller e-postlistor, mailing lists. Här är det vanligt att en speciell teckensekvens automatiskt läggs till i rubriken på alla meddelanden, för att det ska vara lätt att se varifrån de kommer. Detta gör det möjligt för mottagaren att sortera upp meddelanden från olika listor i olika mappar, eller att själv välja i vilken ordning man ska läsa sina meddelanden. Här kommer jag dock att koncentrera mig på system som enbart bygger på att mottagaren själv filtrerar utan någon särskild hjälp från avsändaren. Det är ibland möjligt att använda ett IR-system för att utföra uppgifter som ligger närmare IF till sin natur. Man kan till exempel utföra samma sökning i en sökmotor varje dag för att hitta alla nya sidor som rör det ämne man är intresserad av. Även det omvända kan i vissa fall gå att genomföra. Till exempel kan användaren ändra den profil som används för att filtrera de nya informationsenheterna så fort han vill söka efter något nytt, men detta är inte alltid möjligt, och antagligen mycket sällan värt besväret. Namnet informationsfiltrering antyder att det enbart rör sig om att sortera bort de informationsenheter som bedöms vara mindre intressanta för användaren, men det stämmer inte riktigt. Det gäller snarare att arrangera om den information som finns så att det blir lätt att hitta det man är ute efter. Ett program som till exempel ordnar inkommande e-post efter hur brådskande den antas vara är ett informationsfiltreringssystem, även om ingen post faktiskt kastas bort. Möjligen kunde ett namn som informationssortering, informationsseparering eller informationsstrukturering vara mer rättvisande, men jag har valt att här ansluta mig till den existerande terminologin. 4

11 2.1.1 Kort historik IF har sitt ursprung i vad Luhn kallade selective dissemination of information, SDI, när han 1958 presenterade tanken om ett Business Intelligence System (Oard 1997, s. 9). Tanken var att användare skulle ha profiler hos bibliotek där listor av nya dokument som skulle kunna intressera dem skulle sammanställas och skickas ut, varefter användarna skulle kunna beställa det som intresserade dem. Luhns tidiga arbeten identifierade alla aspekter av modern IF, även om detaljerna i tillämpningen naturligtvis ändrats med teknikens utveckling. Houseman fann i en undersökning 1969 sextio fungerande system för SDI inom the Special Interest Group for SDI (Houseman 1969). Den information som distribuerades var främst abstracts för vetenskapliga artiklar på magnetband. Termen informationsfiltrering skapades 1982 i Communications of the ACM (Association for Computing Machinery) där man såg behovet av att skapa någon typ av filter för elektronisk post, till exempel ett som baserade sig på e-brevens innehåll introducerads tanken på social filtrering, där informationsenheter sorteras efter markeringar gjorda av användare snarare än efter sitt innehåll. 2.2 Metoder för textfiltrering Här ges en översikt över de vanligaste metoderna för textfiltrering Innehållsbaserad filtrering Innehållsbaserad filtrering innebär att man ser till dokumentens innehåll när man sorterar dem. Detta kan göras på flera olika sätt. Den grundläggande metoden är dock att på något sätt extrahera olika egenskaper ur dokumentet och omvandla dem till ett format som gör det möjligt att jämföra dem med en användares profil. Exempel på manuell innehållsbaserad filtrering är när en artikel förses med abstract eller nyckelord. Man har då valt ut delar av dokumentets innehåll som anses representativa och sedan omvandlat dem till ett format som gör det möjligt för en potentiell läsare att snabbt bilda sig en uppfattning om det är intressant för honom. De egenskaper som används vid automatiserad filtrering baseras oftast på termförekomster i dokumentet. Den enklaste typen av sådan filtrering är att användarens profil består av ett antal termer och att dokument som innehåller något av dessa termer väljs ut för presentation medan alla andra ignoreras. Med en inte alltför grov generalisering kan man säga att alla andra typer av innehållsbaserad filtrering är förfiningar avsedda att komma tillrätta med de problem som denna enkla metod medför. 5

12 Exakt matchning kontra rangordning Den metod för filtrering som beskrevs ovan, när systemet endast gör en rent binär bedömning av om ett dokument ska visas eller ej, kallas för exakt matchning ( exact match ). En förbättring av detta är att rangordna dokumenten i stället ( ranked output ). 1 Dokumentet ges då ett betyg som är avsett att beskriva hur likt det är det som användaren vill ha. Det finns ett flertal olika metoder för att få fram detta betyg, men grundtanken är densamma. Se avsnittet om betygsmodeller nedan. Det man vinner på att rangordna dokumenten i stället för att låta maskinen själv plocka bort det som anses ointressant är att man får tillgång till de kunskaper användaren har som inte fångats upp av systemet. Det kan röra sig om avancerade omvärldskunskaper eller semantisk förståelse som är alltför svåra eller kostsamma att implementera, men som en människa kan använda utan någon ansträngning. Detta gör att dokument som inte passar in på den profil systemet har men som användaren ändå anser vara intressanta kan hittas. Dessutom kan användaren själv avgöra när han ska sluta söka längre ner i listan över dokument, och kan på så vis själv bestämma den gräns då dokument ska sluta visas. Den största nackdelen är att systemet blir mer komplicerat, eftersom det inte längre räcker med ett binärt värde för varje dokument. För att rangordningen ska vara meningsfull måste den också på ett ungefär motsvara användarens förväntningar, annars kommer den antagligen att uppfattas som meningslös eller irriterande. Att enstaka dokument får en något felaktig placering är förstås oundvikligt och bör inte ses som något stort problem, men om användaren inte kan lita på att systemet gjort en någorlunda rimlig grovsortering är det antagligen bättre att presentera dokumenten med någon annan metod, som i bokstavsordning eller efter någon slags innehållsklassificering. Det går naturligtvis att kombinera båda typerna av filter. Till exempel kan ett e-post-filter rensa bort meddelanden vars rubriker innehåller vissa ord eller fraser (som MAKE MONEY FAST ) medan de övriga sorteras enligt någon slags betygsskala. Synonymi och polysemi Ett stort problem med att använda listor av termer som sökkriterier är att olika personer kan använda många olika termer för att beskriva samma sak. Detta gör att man kanske bara hittar en bråkdel av de dokument som rör det område man är 1 Många av dagens sökmotorer använder exakt matchning för att välja ut vilka dokument som ska presenteras för användaren som relevanta för hans sökning, ibland kombinerat med någon slags betygssättning. Så länge man inte betygssätter alla dokument och presenterar dem som uppnår ett visst betyg så rör det sig ändå om en variant av exakt matchning. 6

13 intresserad av, eftersom de termer man använder helt enkelt inte förekommer i de övriga dokumenten. Med andra ord leder synonymi till försämrad recall. Relaterade problem är att samma term kan användas för att beteckna olika saker, polysemi, samt att böjningsformer av olika ord kan sammanfalla, homografi. Detta gör att man kan få upp fullständigt irrelevanta dokument, det vill säga att precisionen sjunker. I viss mån kan detta åtgärdas genom att använda fler sökord och endast välja ut de dokument som innehåller alla, men detta leder återigen till försämrad recall, eftersom det inte är säkert att alla de dokument man vill ha innehåller alla de sökta termerna. Ett sätt att försöka komma åt problemet med synonymi är att använda sig av så kallad query expansion med hjälp av ett synonymlexikon. Detta kan göras manuellt eller automatiskt. Problemet med att göra det manuellt är förstås att det kräver extra arbete. Automatisk frågeexpansion är inte heller problemfri. Man får visserligen sannolikt bättre recall, eftersom fler termer används vid sökningen, men precisionen kommer antagligen också att sjunka, eftersom vissa av de nya orden antagligen har en något annorlunda betydelse, och eftersom de i sin tur kan vara polysema eller ha homografer, så att helt felaktiga betydelser läggs till. En annan metod som delvis kan lösa detta problem är att använda sig av mer avancerad syntaktisk information. Nackdelen med detta är att det oftast kräver domänspecifika kunskaper vilket gör systemet mindre portabelt. Ett system som enbart använder sig av till exempel ordfrekvenser är enkelt att tillämpa på flera olika domäner, antagligen också på flera olika språk, medan ett som använder sig av stora lexikon och avancerad syntaktisk och semantisk parsning kräver mycket arbete innan det kan flyttas. Här gäller förstås att det är en gradvis övergång från mycket generella system till mycket specifika - så länge man håller sig inom samma språk kan till exempel viss syntaktisk information alltid användas, men ju mer man förlitar sig på systemets kunskaper om specifka ord eller konstruktioner, desto mer domänspecifikt blir det Social filtrering Inom innehållsfiltrering antas systemets användare agera oberoende av varandra. När man använder sig av social filtrering ( social filtering, collaborative filtering ) utnyttjar man i stället andra användares kunskaper om de informationsenheter man ska söka bland. Olika typer av manuell social filtrering är mycket vanligt förekommande i de allra flesta människors vardag. Vi frågar våra vänner om tips på bra böcker, filmer eller restauranger, läser recensioner i tidningen och så vidare. En viktig aspekt att ta hänsyn till här är de kunskaper vi har om andra människors smak. Att be en främling rekommendera en bok ger sällan något, eftersom man inte vet något om 7

14 hur hans intressen förhåller sig till ens egna. Detta är ett av de problem man måste hantera om man vill försöka automatisera den här processen. En vanlig metod är att användaren får sätta betyg på ett antal informationsenheter som han redan känner till, varpå systemet försöker hitta andra användare som givit liknande betyg åt dessa enheter. Man kan sedan utnyttja dessa användares betyg på för den nya användaren okända enheter för att rekommendera sådana som borde passa honom och varna honom för sådana som de andra givit låga betyg Betygsmodeller Målet med ett betygssystem är att de dokument som bäst fyller användarens informationsbehov ska ges ett högt betyg. Här beskrivs några sätt att avgöra hur nära användarens intresse ett visst dokument befinner sig. Det enklaste sättet är att konstruera en användarprofil som består av ett antal termer och sedan visa upp de dokument som innehåller något av termerna, som beskrevs ovan. Stamning 2 av termerna kan vara lämpligt, så att man hittar olika former av termerna i profilen. Ett mer förfinat sätt att sätta betyg på dokument är att uppskatta sannolikheten för att det uppfyller användarens informationsbehov. Man använder sig av viktad information om termers frekvenser i enskilda dokument och i hela dokumentsamlingen för att försöka uppskatta hur sannolikt det är att ett visst dokument tillfredsställer användarens informationsbehov. Här betraktar man dokument och användarprofiler som vektorer i ett rum med en dimension för varje term, med termernas frekvenser (eller någon funktion 3 av dessa) som koordinater. Man kan sedan använda vinkeln mellan dokument och profiler eller avståndet mellan ändpunkterna hos deras vektorer för att på så sätt få ett mått på hur nära profilen ett dokument ligger. Ofta används cosinusvärdet av vinkeln för att få fram ett lätthanterligt mått. En vidareutveckling av vektormodellen som kallas latent semantic indexing, LSI, beskrivs närmare nedan. 2.3 Användarmodeller För att ett informationsfiltreringssystem ska fungera måste man kunna skapa en bra modell över användarens informationsbehov. Denna modell kallas alltså an- 2 Jag har valt att översätta den engelska termen stemming med stamning, för att komma så nära det ursprungliga ordet som möjligt. Alternativa översättningar skulle kunna vara stamavskiljning eller stamreduktion. 3 Flera olika typer av funktioner har använts för att modifiera den rena frekvensen, till exempel olika typer av logaritmer och rent binära funktioner. 8

15 vändarens profil. I detta avsnitt beskrivs kort några olika sätt att bygga upp en sådan. Som nämndes i inledningen är det långt ifrån självklart att den modell som byggs upp matchar det informationsbehov som användaren faktiskt har Explicita och implicita modeller Det finns två olika sätt att bygga upp en profil över användaren, explicit och implicit. Vid explicit profilskapande ger användaren själv direkt den information som används för att bygga upp profilen. Vid textfiltrering rör det sig oftast om antingen en lista av intressanta ord eller ett antal typdokument. Ett system som skapar användarprofilen implicit studerar självt användaren och drar slutsatser utifrån hur han hanterar de olika dokumenten. Vanliga exempel på observationer är hur lång tid han spenderar på att läsa ett visst dokument och om det sparas för framtida bruk eller kastas bort efter läsning. Det har visat sig att detta ofta ger i någon mening bättre information om vilka dokument som ska rekommenderas, men å andra sidan är det svårare att implementera en sådan metod. Det går naturligtvis att kombinera dessa två modeller, till exempel genom att an- vändaren först anger en lista av ord som senare modifieras beroende på hans beteende. 2.4 Exempel på system SIFT SIFT var ett enkelt innehållsbaserat filtreringssystem för USENET News-artiklar som var avsett att användas för att testa effektiviteten hos olika algoritmer. Användarprofilerna skapades manuellt i form av listor av ord att söka efter och ord att undvika. Systemet valde varje dag ut tjugo artiklar och presenterade dem i rangordning. Det fanns möjlighet att modifiera sin profil interaktivt med hjälp av en nätbläddrare. (Oard 1997, s ) InfoScope SIFT betraktade alla news-artiklar som likvärdiga och tog ingen hänsyn till ämne, författare eller vilken nyhetsgrupp de kom ifrån. Detta gjorde däremot InfoScope. På grund av de begränsningar som sattes av kraften hos dåtidens (1991) datorer så var detta den enda information som kunde hanteras. Systemet använde sig av regelbaserad exakt matchning. (Oard 1997, s ) 9

16 2.4.3 Tapestry Textfiltreringssystemet Tapestry var det första som använde sig av social filtrering. Det var avsett för filtrering av elektronisk post, news-artiklar och nyhetsartiklar. Systemet tog hänsyn både till innehållet och till de betyg som det givits av andra läsare. Även Tapestry hade regler för att välja ut när ett dokument skulle presenteras, men här hade användaren möjlighet att vikta reglerna. Systemet var uppdelat i klient och server, där servern använde en uppsättning enkla regler för att avgöra om dokumentet skulle visas för användaren, och klienten sedan använde de mer sofistikerade viktade reglerna för att rangordna de dokument som skulle visas. (Oard 1997, s ) URN URN var ett system för filtrering av news-artiklar. Här hade användarna möjlighet att dels göra explicita, binära bedömningar av dokumenten, dels att justera de nyckolord som användes för att beskriva dem. Användarna kunde både lägga till och stryka ord för att skapa en enligt deras mening bättre bild av dokumentets innehåll. (Oard 1997, s ) GroupLens GroupLens är ett forskningsprojekt vid University of Minnesota som leds av John Riedl och Joseph Konstan där man bland annat studerar social filtrering. Ett projekt som fortfarande är aktivt är MovieLens, ett rekommendationssystem för film 4. (GroupLens 1999) Användaren sätter betyg på ett antal filmer på en femgradig skala, och systemet försöker sedan hitta andra användare som satt liknande betyg på samma filmer. Denna grupp används sedan för att sätta betyg på filmer som användaren inte sett själv, men som andra i gruppen har betygsatt hade man över användare. (Good 1999, s. 4) TREC TREC (Text REtrieval Conference) är en sedan 1992 årlig konferens där man bland annat testar olika textfiltreringssystem under kontrollerade former, vilket är viktigt när man vill undersöka systemets effektivitet eller jämföra det med andra system. (Text REtrieval Conference 1999) Ett problem är att man gjort ganska starka antaganden om vad som menas med relevans, bland annat att det kan uttryckas som 4 MovieLens finns tillgängligt på 10

17 ett rent binärt värde samt att åsikter om relevans är konstanta över användare och tid. (Oard 1997, s. 15) Intressanta utvecklingsriktningar Den stora utmaningen för informationshanteringssystem av alla typer just nu är väven, där det finns miljontals dokument med väldigt olika innehåll av varierande typ - text, ljud, rörliga bilder, stillbilder och program. För tillfället är mängden information alltför omfattande i förhållande till den datorkraft och det lagringsutrymme som man rimligtvis kan ha tillgång till för att ett rent rekommendationssystem ska kunna upprättas. De sökmotorer som för tillfället finns bygger i de flesta fall på ren innehållsbaserad filtrering, även om det ofta finns möjlighet till ungefärliga matchningar. Det finns dock undantag, till exempel Google 5 som använder sig av en typ av social filtrering när de olika alternativen betygsätts. Sidor som hänvisas till av många andra sidor ges ett högre betyg, där sidor som redan fått ett högt betyg väger tyngre. Eftersom det är människor som skapar de flesta hemsidor tar man alltså hjälp av vad författarna själva anser vara viktiga eller intressanta sidor. (Why Use Google? 1999) Även för informationsfiltrering är det intressant att kombinera innehålls- baserad och social filtrering. Hur långt man kan komma med innehållsbaserad filtrering beror på hur avancerad analys man kan göra av informationsenheternas innehåll, vilket i sin tur begränsas dels av datorresurser och dels av hur avancerade lingvistiska modeller man kan skapa - semantik är ju ett notoriskt problematiskt område inom datorlingvistiken. Människor är å andra sidan bra på att hitta innehållsmässiga likheter mellan dokument som kan ha stora skillnader om man bara ser till ytan, vilket gör att social filtrering kan ge ett viktigt tillskott till ett rent innehållsbaserat system, men för att social filtrering ska fungera krävs att antalet användare är tillräckligt stort. Hur man konstruerar användarprofilen för ett filtreringssystem är också ett område där vidare utveckling behövs. Betygssättning är komplicerat och därför otillförlitligt. Är till exempel ett dokument som innehåller all den information man vill ha men även mycket som är ovidkommande bättre eller sämre än ett som är fokuserat på rätt område men inte innehåller lika mycket? Det har visat sig att man ofta får bättre resultat av att se till hur användaren hanterar olika dokument, till exempel hur länge han läser dem, än om man bara använder sig av explicit betygsättning, men det är inte alltid så lätt att extrahera sådan information på ett bra sätt, och olika personer kan bete sig på olika sätt. En person med svenska som 5 Sökmotorn Google finns tillgänglig på 11

18 modersmål kanske spenderar längre tid med att läsa meddelanden på engelska helt enkelt för att de är mer svårbegripliga snarare än för att de är mer intressanta. Flerspråkiga system är över huvud taget problematiska, men också väldigt intressanta. 2.5 LSI Latent semantisk indexering, LSI, är en metod som bygger på vektormodellen. Det man framförallt ville komma till rätta med när man skapade metoden var problemen med synonymi och polysemi. Grundtanken är ganska enkel: man försöker gruppera dokument som har stora mängder gemensamma ord tillsammans, så att det ska gå lätt att hitta alla dokument med liknande innehåll även om man inte använt sig av exakt de termer som förekommer i dokumentet vid sökningen. Det finns flera sätt att uppnå detta. I den artikel där metoden presenteras (Deerwester 1990) använder man sig av singular value decomposition, SVD, en matematisk metod för att projicera mångdimensionella data till ett lägre antal dimensioner. När man gör detta kommer vissa vektorer helt naturligt att klumpas samman eftersom vissa av skillnaderna som fanns i de ursprungliga data kommer att minska eller helt försvinna. Om man väljer de nya basvektorerna på ett lämpligt sätt så kan man se till att de stora skillnaderna bevaras medan de mindre suddas ut något, och detta är ju precis vad man var ute efter SVD Single value decomposition (SVD) är ett av många namn på liknande metoder för att projicera mångdimensionella data till ett mindre antal dimensioner. Metoden är nära besläktad med bland annat egenanalys och spektralanalys. Grundtanken är att hitta ett antal ortogonala basvektorer för det rum som beskrivs av termdokumentmatrisen, varpå man väljer bort de basvektorer som ansvarar för de minsta skillnaderna mellan dokumenten. Inom SVD är detta mycket enkelt att göra eftersom man som en konsekvens av analysen får ett mått på variationen i de olika basvektorernas riktningar. Det går att visa att om man behåller de n basvektorer som ansvarar för de största variationerna i de ursprungliga data så får man den bästa möjliga projektionen till ett n-dimensionellt rum. Hur många basvektorer man vill ha beror på vilken anledning man har att minska antalet dimensioner. Om det är för att man vill få en visuell uppfattning om hur data är fördelade kan man av naturliga skäl inte ta mer än två eller tre. För informationsfiltrering verkar etthundra till några hundra vara lagom. Om man tar för få dimensioner blir indelningen alltför grov, och tar man för många förlorar man den sammanklumpning som man faktiskt vill ha. 12

19 Tekniska detaljer Målet är att approximera en m n-matris med, där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. En godtycklig m n-matris kan sönderdelas i en produkt av tre andra matriser:, r So r Do m A = m To r n n r sådana att och har ortonormala kolumner och är diagonal. Detta kallas matrisens SVD, Singular Value Decomposition. är en m r-matris, en r r- matris och en n r-matris, där r är :s rang min(m,n). Om elementen i är ordnade i fallande storlek så kan man sätta de r-k minsta till 0 och få en projektion till k dimensioner,. x x So 0 0 xrr x x xkk So Det går att visa att om man nu multiplicerar ihop,, och så är den resulterande matrisen den matris av rang k som ligger närmast i minsta kvadrathänseende. Man kan nu stryka de rader och kolumner i som enbart innehåller nollor 13

20 för att få en ny diagonal matris av rang k, samt stryka motsvarande kolumner i respektive. Detta resulterar i att och för att få, r So r Do m A = m To r n n r där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. Detta är precis vad vi vill ha För- och nackdelar samt jämförelser med andra system Fördelen med att representera dokumenten på detta sätt är, som nämnts ovan, att vi i viss mån kan sudda ut skillnaderna mellan närliggande ord, både synonymer och sådana som mycket ofta förekommer tillsammans. Detta gör att en profil som innehåller vissa ord även kan ge högt betyg åt dokument som innehåller ord som i någon mening ligger betydelsemässigt nära de angivna, även om just de orden inte förekommer. Man kommer alltså i viss mån ifrån problemet att det är lätt att missa intressanta dokument på grund av skillnader i ordval. Detta är även den stora fördelen med exakt matchning, som ju ofta missar relevanta dokument och fångar upp irrelevanta. Där har man ju inte heller någon hjälp av den betygssättning som ett vektorbaserat system kan ge med att åtminstone grovt sortera dokumenten. Den stora nackdelen med detta system är att det är mer resurskrävande än den vanliga vektormodellen, både för beräkningar och för lagring. Det krävs en hel del arbete för att göra den matrisuppdelning som behövs, och de resulterande matriserna T och D är i motsats till den ursprungliga matrisen A inte glesa, vilket gör att de kräver mer lagringsutrymme än om man använder sig av den vanliga vektormodellen. Under förutsättning att man har tillgång till kraftfulla datorer och gott om lagringsutrymme är detta dock inget större problem. Jag anser därför att LSI är en mycket lämplig metod för system som är tänkta att användas där sådana resurser finns, som till exempel större företag. LSI är i sig en helt innehållsbaserad metod, och lämpar sig därför främst för 14

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Sökanalys för intranät

Sökanalys för intranät Sökanalys för intranät 2014-12-03 Henrik Gelius OSLO STOCKHOLM Agenda Henrik Gelius, sökkonsult www.comperiosearch.com Idag tittar vi på detta: 1. Affärsnytta - sök på intranät 2. Sökanalys & nyckeltal

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk.

5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk. b2 Nivå B2 Level B2 Språk: Kan mycket bra Kan bra Kan ganska bra Kan inte så bra Lyssna Markera med pilar för varje alternativ. Om 3/4 av pilarna pekar eller i en färdighet har du nått upp till denna nivå.

Läs mer

Internets historia Tillämpningar

Internets historia Tillämpningar 1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle

Läs mer

En liten introduktion till www.sli.se/avkarlstad

En liten introduktion till www.sli.se/avkarlstad Sida 1(9) Mediecenter Värmland Lena Bengtsson, 054-7011062 lena.bengtsson@regionvarmland.se Datum 2015-05-07 En liten introduktion till www.sli.se/avkarlstad Region Värmland - kommunalförbund Postadress

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 4: Metadatastandarder Mer om metadatastandarder Välkommen till presentation 3 i pass 4. Den här presentationen handlar om några olika teman som har att göra med metadatastandarder. Jag kommer att

Läs mer

En introduktion till SLI.SE. April 2015

En introduktion till SLI.SE. April 2015 En introduktion till SLI.SE April 2015 Registrera konto Om du inte ser den här bilden, klicka på hänglåset uppe till höger och välj menyalternativet "Skapa konto". När du fyller i skola, får du en lista

Läs mer

E-biblioteket en tjänst från sjukhusbiblioteken

E-biblioteket en tjänst från sjukhusbiblioteken E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.

Läs mer

Användarhandbok StepStones Recruiters Space

Användarhandbok StepStones Recruiters Space Användarhandbok StepStones Recruiters Space CV-Sökningar I denna del av Recruiters Space kan du söka efter passande kandidater i StepStones CV-databas. Du kan också registrera CV-agenter som automatiskt

Läs mer

Klustring av svenska tidningsartiklar

Klustring av svenska tidningsartiklar Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier

Läs mer

Ersätta text, specialtecken och formatering

Ersätta text, specialtecken och formatering 11 Ersätta text, specialtecken och formatering Möjligheten att söka igenom dokumentet och byta ut tecken, ord, textstycken, formatering, specialtecken (t.ex. sidbrytning) och annat är faktiskt mycket mer

Läs mer

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare Fibonacci / översättning från engelska IBSE Ett självreflekterande(självkritiskt) verktyg för lärare Riktlinjer för lärare Vad är det? Detta verktyg för självutvärdering sätter upp kriterier som gör det

Läs mer

Vad säger lagen om cookies och andra frågor och svar

Vad säger lagen om cookies och andra frågor och svar Vad säger lagen om cookies och andra frågor och svar Vad är en cookie? En cookie är en liten textfil som webbplatsen du besöker begär att spara på din dator. Cookies används på många webbplatser för att

Läs mer

WEBB365.SE. Hur skriver man sökmotoroptimerade texter

WEBB365.SE. Hur skriver man sökmotoroptimerade texter Hur skriver man sökmotoroptimerade texter Introduktion Det finns mycket man kan göra för att lyckas på nätet och att skriva sökmotoroptimerade texter är definitivt en av de viktigare. I korta ordalag kan

Läs mer

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. sli.se/gr

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. sli.se/gr INTRODUKTION till WEBBTJÄNSTEN GR-SLI sli.se/gr Skapa konto Klicka på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i kommun och skola, får du en lista på "träffar"

Läs mer

Manual HSB Webb brf 2004 03 23

Manual HSB Webb brf 2004 03 23 TERMINOLOGI I Polopoly används ett antal grundläggande begrepp för publicering och hantering av information, eller innehåll som det också benämns. Nedan följer en kort genomgång av denna grundläggande

Läs mer

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring Kategorisering och klustring Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Skillnaden mellan kategorisering och klustring? Kategori är förutbestämt av någon Kluster är

Läs mer

Random Indexing för vektorbaserad semantisk analys

Random Indexing för vektorbaserad semantisk analys Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk

Läs mer

Att ladda ner från legimus.se

Att ladda ner från legimus.se Att ladda ner från legimus.se 1 Innehåll Logga in... 2 Första gången du loggar in... 2 Problem att logga in?... 2 Sök efter böcker... 3 Utökad sökning... 3 Träfflistan... 3 Sortera listan... 3 Ladda ner

Läs mer

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1 Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut

Läs mer

Mångdubbla din försäljning med målsökande marknadsföring

Mångdubbla din försäljning med målsökande marknadsföring Mångdubbla din försäljning med målsökande marknadsföring Av alla besökare i en webbutik är det statistiskt sett bara en liten andel som handlar något. Tänk om du kunde återengagera den stora andelen potentiella

Läs mer

Colloborative filtering ett rekommendationssystem

Colloborative filtering ett rekommendationssystem Colloborative filtering ett rekommendationssystem 1 Innehållsförteckning 2 1. Inledning Dagens samhälle är idag uppbyggt till stor del av internet. Vi kan i princip sköta det mesta av våra liv via nätet.

Läs mer

Biblioteken, Futurum 2017

Biblioteken, Futurum 2017 Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken

Läs mer

En liten introduktion till Mediakatalogen

En liten introduktion till Mediakatalogen En liten introduktion till Mediakatalogen Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du

Läs mer

YAHOO! SEARCH MARKETING Tips för att öka trafiken

YAHOO! SEARCH MARKETING Tips för att öka trafiken YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova

Läs mer

Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten

Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten 2008 Bakgrund Från 2003 har socialförvaltningen i Tingsryd påbörjat ett arbete med s.k. Balanserad styrning. Det innebär att vi arbetar

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek INNEHÅLL: ATT BÖRJA SÖKA:... 2 DATABASER MM:... 2-5 NE BIBLIOTEKSKATALOGEN LIBRA.SE ARTIKELSÖK MEDIEARKIVET/RETRIVER ALEX

Läs mer

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)

Läs mer

So ka artiklar och annan litteratur

So ka artiklar och annan litteratur 1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom

Läs mer

Snabbguide till GlobalTwitcher (Juni 2012)

Snabbguide till GlobalTwitcher (Juni 2012) Snabbguide till GlobalTwitcher (Juni 2012) Denna snabbguide är avsedd att hjälpa nya medlemmer att komma igång med huvudfunktionerna på GlobalTwitcher (GT). Siten innehåller dock ett stort antal funktioner

Läs mer

UB:s sö ktjä nst - Söka artiklar och annan litteratur

UB:s sö ktjä nst - Söka artiklar och annan litteratur 1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,

Läs mer

Att skriva inlägg i Spelmansgillets bloggar hos Blogspot/Google

Att skriva inlägg i Spelmansgillets bloggar hos Blogspot/Google Att skriva inlägg i Spelmansgillets bloggar hos Blogspot/Google Läsare vem som helst eller utvald krets Bloggen kan konfigureras så att inlägg kan läsas av vem som helst på nätet. Den kan även konfigureras

Läs mer

ViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument

ViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument ViTex snabbguide 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument 2. Uppläsning i ViTex Ikoner för uppläsning Läs upp enstaka

Läs mer

Att söka information (med betoning på Internet)

Att söka information (med betoning på Internet) Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning

Läs mer

Kravspecifikation Fredrik Berntsson Version 1.3

Kravspecifikation Fredrik Berntsson Version 1.3 Kravspecifikation Fredrik Berntsson Version 1.3 Status Granskad FB 2017-01-27 Godkänd FB 2017-01-27 Dokumenthistorik Version Datum Utförda ändringar Utförda av Granskad 1.0 2014-01-15 Första versionen

Läs mer

En introduktion till SLI.SE

En introduktion till SLI.SE En introduktion till SLI.SE Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i skola,

Läs mer

Dina surfvanor kartläggs och lämnas ut

Dina surfvanor kartläggs och lämnas ut Dina surfvanor kartläggs och lämnas ut måndag 28 mars 2016 Utländska bolag kartlägger besökare på svenska sjukhus och myndigheters webbplatser. När du läser om till exempel sexuell läggning rapporteras

Läs mer

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. grkom.se/gr-sli

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. grkom.se/gr-sli INTRODUKTION till WEBBTJÄNSTEN GR-SLI grkom.se/gr-sli 2 3 Innehåll Skapa konto... 4 Startsidan... 4 Att söka med sökord... 5 Sök... 5 Filtrering - vad vill du se för träffar?... 6 Spara filter, lägga till

Läs mer

TDDD92 Artificiell intelligens -- projekt

TDDD92 Artificiell intelligens -- projekt jonas.kvarnstrom@liu.se 2018 TDDD92 Artificiell intelligens -- projekt Individuella uppgifter UPG2: Individuell skriftlig rapport 2 Vad? Läsa och förstå vetenskaplig litteratur Varför? Framtiden: Inte

Läs mer

Nätsäkerhetsverktyg utöver kryptobaserade metoder

Nätsäkerhetsverktyg utöver kryptobaserade metoder Nätsäkerhetsverktyg utöver kryptobaserade metoder Brandväggar Innehållsfiltrering IDS Honungsnät Krävd kunskap i kursen: Att dessa skyddsmetoder finns, vilka grundvillkor man kan/ska ha vid uppsättningen

Läs mer

ALEPH ver. 16 Sökning

ALEPH ver. 16 Sökning Fujitsu, Westmansgatan 47, 582 16 Linköping INNEHÅLLSFÖRTECKNING 1. INLEDNING... 1 2. SÖK... 1 2.1 Avancerad sökning... 2 2.2 CCL flera databaser... 2 2.3 Flera fält... 3 2.4 Regler för sökning... 4 2.5

Läs mer

Elements, säkerhetskopiering och dina bilder

Elements, säkerhetskopiering och dina bilder Elements, säkerhetskopiering och dina bilder Mattias Karlsson Sjöberg, december 2011. Moderskeppet.se Lär dig tänka rätt och använda rätt verktyg för att säkerhetskopiering, datorbyte och hårdiskbyte.

Läs mer

NYHETER I KARNOV. Senast uppdaterad: 2012-03-16

NYHETER I KARNOV. Senast uppdaterad: 2012-03-16 NYHETER I KARNOV Senast uppdaterad: 2012-03-16 INNEHÅLL 1. Sök Sök i allt på alla sidor... 3 Rättsområde Nytt filter i sökresultatet... 4 Kombinera flera filter i sökresultatet... 5 Nya sökoperatorer...

Läs mer

KN - Seminarium. (Litteratursökning)

KN - Seminarium. (Litteratursökning) KN - Seminarium (Litteratursökning) Elektroniska medier Åbo Akademis bibliotek http://www.abo.fi/library/dbs Virtuellt bibliotek / länksamling för sökning på internet Referensdatabaser, som innehåller

Läs mer

Om ämnet Engelska. Bakgrund och motiv

Om ämnet Engelska. Bakgrund och motiv Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

Nya funktioner i Insättningsuppgift via Internet

Nya funktioner i Insättningsuppgift via Internet Nya funktioner i Insättningsuppgift via Internet September 2018 Postadress: 105 19 Stockholm Besöksadress: Mejerivägen 1 www.bankgirot.se Bankgironr: 160-9908 Styrelsens säte: Stockholm Växel: 08-725 60

Läs mer

SPF/MiRiaM Manual avancerad sökning

SPF/MiRiaM Manual avancerad sökning SPF/MiRiaM Manual avancerad sökning 2016-09-15 Skapat av: Fältström Ingrid 1 (31) Innehållsförteckning 1. Inledning... 3 1.1 Begreppsförklaringar... 3 1.1.1 Kolumn... 3 1.1.2 Lista... 3 1.1.3 Posttyp...

Läs mer

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Litteraturstudie Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Vad är en litteraturstudie? Till skillnad från empiriska studier söker man i litteraturstudier svar på syftet

Läs mer

Mobil streckkodsavläsare

Mobil streckkodsavläsare Avdelningen för datavetenskap Martin Persson Jan Eriksson Mobil streckkodsavläsare Oppositionsrapport, D-nivå 2005:xx 1 Generell utvärdering av projektet Projektet gick ut på att undersöka hur bra olika

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer

Inlämning i Studentportalen

Inlämning i Studentportalen Guide Inlämning i Studentportalen Via en inlämning kan studenter ladda upp filer som lärare kan bedöma. Det kan vara en individuell inlämning eller en gruppinlämning. Här kan även lärare och studenter

Läs mer

Restaurang Example. (http://www.example.se) Analys av nuvarande hemsida. Av Kharma Concept

Restaurang Example. (http://www.example.se) Analys av nuvarande hemsida. Av Kharma Concept Restaurang Example (http://www.example.se) Analys av nuvarande hemsida Av Kharma Concept 1.Översikt: Restaurang XXX har en kreativ hemsida med modern design. Navigering till de olika delarna av hemsidan

Läs mer

Sökexempel Arbetsterapeuter T3

Sökexempel Arbetsterapeuter T3 Sökexempel Arbetsterapeuter T3 En repetition om hur man söker i olika databaser och hur man (i bästa fall) kan få ut den aktuella artikeln i fulltext. Som exempel har vi valt en sökning om arbetsterapi

Läs mer

Användarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1

Användarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1 Användarmanualen Visma Enterprise Content Search Standard Version 2.0 for Platina Version 1.1 Innehållsförteckning 1 Ändringshistorik... 4 2 Introduktion... 5 2.1 Ikoner... 5 2.1.1 Allmänt... 5 2.1.2 Sökresultat...

Läs mer

Mälardalens högskola

Mälardalens högskola Teknisk rapportskrivning - en kortfattad handledning (Version 1.2) Mälardalens högskola Institutionen för datateknik (IDt) Thomas Larsson 10 september 1998 Västerås Sammanfattning En mycket viktig del

Läs mer

Om uppsatsmallen vid GIH

Om uppsatsmallen vid GIH Om uppsatsmallen vid GIH Här kan du läsa om och se exempel på hur din uppsats vid GIH ska se ut. Uppsatsmallen (.dotxfil) som du kan spara ner och skriva i finns på www.gih.se/uppsats. Huvudrubrik, dvs

Läs mer

Google Guide: Tips för sökoptimering

Google Guide: Tips för sökoptimering Google Guide: Tips för sökoptimering Google Guide Digital publikation www.intankt.se, Intankt Författare: Adam Ahlgren Typsnitt: Calibri, 11 punkter Formgivning: Intankt Omslagsfoto: Google Stockholm,

Läs mer

I dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning.

I dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning. Avancerad sökning Innehåll Avancerad sökning...1 1. Avancerad sökning...1 1.1 Allmänt...1 1.2 Begreppsförklaringar... 2 1.2.1 Posttyp... 2 1.2.2 Kolumn... 2 1.2.3 Lista... 2 1.2.4 Rad... 3 1.2.5 Vy...

Läs mer

Vara kommun. Fritidsgårdar Våren 2014

Vara kommun. Fritidsgårdar Våren 2014 Vara kommun Fritidsgårdar Våren 24 Presentation Om undersökningen Sammanfattning Resultat NFI (Nöjd Fritidsgård Index) Per fråga Om undersökningen Undersökningen riktades till personer som besöker Vara

Läs mer

Grunder. Grafiktyper. Vektorgrafik

Grunder. Grafiktyper. Vektorgrafik 2 Grunder All vår början bliver svår eller hur det nu brukar heta, och detta är något som gäller även Flash. För den som är ovan vid Flash gäller det säkert extra mycket, då det kan vara knepigt att förstå

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:

Läs mer

När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på

När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på Surfa på nätet När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på går det naturligtvis inte gå tillbaka till

Läs mer

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek

Läs mer

Söka artiklar i CSA-databaser Handledning

Söka artiklar i CSA-databaser Handledning På Malmö högskola har vi flera databaser via CSA, bl.a. Sociological Abstracts, Social Services Abstracts, ERIC och PsychInfo, det betyder att gränssnittet för dessa databaser ser likadana ut. Om du har

Läs mer

Genetiska Algoritmer i Adaptiva Rekommendationssystem

Genetiska Algoritmer i Adaptiva Rekommendationssystem Genetiska Algoritmer i Adaptiva Rekommendationssystem av Anders Gustafson och Henrik Högberg Institutionen för Informatik Handelshögskolan vid Göteborgs Universitet {s94asg s94paul}@student.informatik.gu.se

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

Tillämpad programmering CASE 1: HTML. Ditt namn

Tillämpad programmering CASE 1: HTML. Ditt namn Tillämpad programmering CASE 1: HTML Ditt namn 18 [HTML] Din handledare vill se din skicklighet i att använda HTML-koden. Du ska utveckla en webbplats om ditt intresse, inriktning eller gymnasiearbete.

Läs mer

Digitalkunskap år 1-6

Digitalkunskap år 1-6 Skönsmons skola Östra radiogatan 6 854 61 Sundsvall Digitalkunskap år 1-6 www.skonsmonsskola.se Digitalkunskap Skönsmons skola 2014/15 Kunskap om Digitalkunskap har en avgörande betydelse för oss människor.

Läs mer

Användarmanual konsult

Användarmanual konsult Användarmanual konsult Innehållsförteckning 1. Registrera konto 2. Logga in 3. Fylla i kontouppgifter och prenumerationstyp 4. Byta lösenord 5. Inaktivera konto 6. Radera konto 7. Skapa profil 8. Editera

Läs mer

INTRODUKTION AV RCI WEEKS FÖRBÄTTRINGAR

INTRODUKTION AV RCI WEEKS FÖRBÄTTRINGAR INTRODUKTION AV RCI WEEKS FÖRBÄTTRINGAR För mer än 35 år sedan uppfann RCI semesterbytet. I dag ÅTERUPPFINNER RCI det genom att bygga upp och utöka dina förmåner som RCI-medlem och vi ger dig det du har

Läs mer

Analys av BI-system och utveckling av BIapplikationer

Analys av BI-system och utveckling av BIapplikationer Computer Science Fredrik Nilsson, Jonas Wånggren Daniel Strömberg Analys av BI-system och utveckling av BIapplikationer Opposition Report, C/D-level 2005:xx 1 Sammanfattat omdöme av examensarbetet Vi tycker

Läs mer

Intervjuformulär. Datum: Namn: Sökt tjänst: Intervjuare:

Intervjuformulär. Datum: Namn: Sökt tjänst: Intervjuare: Intervjuformulär Datum: Namn: Sökt tjänst: Intervjuare: Introduktion För att en rekryteringsintervju ska bli så meningsfull som möjligt är det viktigt att samtalet hjälper dig att matcha varje kandidat

Läs mer

Fråga: Vi ska skapa en omvärldsbevakningsgrupp och undrar hur ska man tänka när man skapar bevakningar för att plocka upp trender inom ett ämne?

Fråga: Vi ska skapa en omvärldsbevakningsgrupp och undrar hur ska man tänka när man skapar bevakningar för att plocka upp trender inom ett ämne? FAQ Fråga: Vi ska skapa en omvärldsbevakningsgrupp och undrar hur ska man tänka när man skapar bevakningar för att plocka upp trender inom ett ämne? Först och främst måste ni bestämma vilka mål ni har

Läs mer

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning

Kristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och

Läs mer

Slutrapport Projekt Internet i Sverige

Slutrapport Projekt Internet i Sverige Slutrapport Projekt Internet i Sverige 1. Inledning Wikimedia Sverige är en förening som verkar för att göra kunskap tillgänglig för människor, särskilt genom att stödja Wikimedia Foundations projekt,

Läs mer

Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto

Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto Välkommen till automatiseringens värld Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto Version 2.4 Vi har lösningar för 100 % av era resebehov. American Express Business

Läs mer

Vart försvann tanken om att lära sig något, att fördjupa sitt tänkande och komma

Vart försvann tanken om att lära sig något, att fördjupa sitt tänkande och komma Prat om produktivitet Vart försvann tanken om att lära sig något, att fördjupa sitt tänkande och komma till insikt? Försvann den mellan kunskapsmaskineriets kugghjul? Camilla Kronqvist synar produktivitetspratet.

Läs mer

Sänk kostnaderna genom a/ ställa rä/ krav och testa effektivt

Sänk kostnaderna genom a/ ställa rä/ krav och testa effektivt Sänk kostnaderna genom a/ ställa rä/ krav och testa effektivt Kravhantering / Testprocess - Agenda AGENDA Grundläggande kravhanteringsprocess. Insamling, dokumentation, prioritering, Test och förvaltning

Läs mer

svenska kurskod: sgrsve7 50

svenska kurskod: sgrsve7 50 Svenska Kurskod: SGRSVE7 Språk är människans främsta redskap för att tänka, kommunicera och lära. Ämnet handlar om hur språket är uppbyggt och fungerar samt hur det kan användas. Kärnan i ämnet är språk

Läs mer

Köpguide för mobila växlar. Modern telefoni till företaget är långt ifrån vad det var för bara några år sedan.

Köpguide för mobila växlar. Modern telefoni till företaget är långt ifrån vad det var för bara några år sedan. Köpguide för mobila växlar Modern telefoni till företaget är långt ifrån vad det var för bara några år sedan. Tänk om din nya telefonilösning kunde förenkla din vardag och hjälpa dina medarbetare att arbeta

Läs mer

1. Enkel sökning Globalsökning Avancerad sökning Historik Söka via klassificeringsstruktur 14

1. Enkel sökning Globalsökning Avancerad sökning Historik Söka via klassificeringsstruktur 14 Ledningskansliet, Juridik och dokumentation Patrik Spånning Westerlund MANUAL 2017-11-16 SLU ID: SLU.ua.2017.2.1.1.IA-9 Manual Sökningar i Public 360 Manual Sökningar i Public 360 Dokumentägare: LK/Dokumentationsenheten/

Läs mer

7 Microsofts grupphanteringsmodell i Windows NT-domäner

7 Microsofts grupphanteringsmodell i Windows NT-domäner 7 Microsofts grupphanteringsmodell i Windows NT-domäner Microsofts modell för grupphantering i Windows NT-domäner Om du redan läst en del om Windows NT Server och Windows NT-domäner kanske du hajar till

Läs mer

Introduktion till MySQL

Introduktion till MySQL Introduktion till MySQL Vad är MySQL? MySQL är ett programmerings- och frågespråk för databaser. Med programmeringsspråk menas att du kan skapa och administrera databaser med hjälp av MySQL, och med frågespråk

Läs mer

Manual - Inläsningstjänsts App (ios för iphone och ipad)

Manual - Inläsningstjänsts App (ios för iphone och ipad) Sidan 1 av 7 App-release: 1.0 Manual - Inläsningstjänsts App (ios för iphone och ipad) Innehållsförteckning 1 Kort om appen... 2 Funktionaliteten i grova drag... 2 Kända begränsningar i denna version...

Läs mer

Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen

Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen Man ska vara positiv för att skapa något gott. Ryttare är mycket känslosamma med hänsyn till resultatet. Går ridningen inte bra, faller

Läs mer

3. Nyanserad och framåtriktad respons

3. Nyanserad och framåtriktad respons 3. Nyanserad och framåtriktad respons Respons är ett centralt begrepp inom bedömning för lärande. I den engelska forskningslitteraturen, och i viss mån även i Sverige, går den under namnet feedback. Det

Läs mer

Operatörer och användargränssnitt vid processtyrning

Operatörer och användargränssnitt vid processtyrning Operatörer och användargränssnitt vid processtyrning Normativa och beskrivande analyser Uppsala universitet @ 2003 Anders Jansson Sammanfattning kap. 1 Sociotekniska system Många olika grupper av användare

Läs mer

Word-guide Introduktion

Word-guide Introduktion Word-guide Introduktion På det kognitionsvetenskapliga programmet kommer du läsa kurser inom flera olika vetenskapsområden och för varje vetenskapsområde finns ett speciellt sätt att utforma rapporter.

Läs mer

Kommunikation. En aptitretare från VisVires AB

Kommunikation. En aptitretare från VisVires AB Kommunikation En aptitretare från VisVires AB Inledning Vi använder ofta ganska slarvigt begreppet kommunikation, vi säger t.ex. ofta att ett beslut skall kommuniceras ut i organisationen och sedan skickar

Läs mer

Tentafrågor 1. Grupp. B

Tentafrågor 1. Grupp. B Tentafrågor 1 Grupp. B Sebastian Buks (ic05sb3@student.lth.se) Andreas Edmundsson (ic05ae6@student.lth.se) Birger Hedberg-Olsson (ic05bh3@student.lth.se) Omar Khan (ic05ok5@student.lth.se) Victor Lindell

Läs mer

Realism och anti-realism och andra problem

Realism och anti-realism och andra problem Realism och anti-realism och andra problem Vetenskap och verkligheten Vetenskapen bör beskriva verkligheten. Men vad är verkligheten? Är det vi tycker oss se av verkligheten verkligen vad verkligheten

Läs mer

ANVÄNDARGUIDE. ViTex

ANVÄNDARGUIDE. ViTex ANVÄNDARGUIDE ViTex ViTex snabbguide 1. Inläsning till ViTex från inskannat dokument via kopiatorn 2. Uppläsning i ViTex 3. Navigation & Zoner 4. Ändra inställningar 5. Kontakt och Support 1. Inläsning

Läs mer

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide Använda Internet med hjälp av Internet Explorer Nybörjarguide Av Carl Ewnert 1 Innehåll: 1. Introduktion 3 2. Utseendet 4 3. Verktygsfältet 4 4. Börja Surfa. 5 5. Att söka på Internet 5 6. Spara en sida

Läs mer

Skötselråd för datoransvarig Windows XP, Vista, 7

Skötselråd för datoransvarig Windows XP, Vista, 7 Sidan 1 av 8 En gång per vecka:... 2 Uppdatera antivirusprogrammet... 2 Efter ett långt uppehåll... 2 Varannan vecka:... 2 Microsoft Windows Update... 2 En gång per månad:... 2 Defragmentera hårddisken...

Läs mer

Söka, värdera, referera

Söka, värdera, referera KTH ROYAL INSTITUTE OF TECHNOLOGY Söka, värdera, referera Ika Jorum, jorum@kth.se Definiera Vad behöver jag veta? Kommunicera Citera och argumentera korrekt Hitta Var och hur kan jag hitta information?

Läs mer

Introduktion till frågespråket SQL (v0.91)

Introduktion till frågespråket SQL (v0.91) DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför

Läs mer