Dokumentrekommendationssystem och intranät

Storlek: px
Starta visningen från sidan:

Download "Dokumentrekommendationssystem och intranät"

Transkript

1 Dokumentrekommendationssystem och intranät Anders Gabrielsson Examensarbete 20p Språkteknologiprogrammet Institutionen för lingvistik Uppsala universitet Handledare: Lars Borin och Henrik Fagrell 21 januari 2000

2

3 Sammanfattning Dokumentrekommendation är en del av informationsfiltrering, ett område som främst handlar om att tillfredsställa långsiktiga informationsbehov, i motsats till informationssökning (information retrieval, IR) där man sällan tar hänsyn till användarens intressen eller tidigare beteende. Inom informationsfiltrering gör man detta genom att skapa en modell för det som användaren är intresserad av som sedan används för att välja ut relevanta informationskällor, vanligtvis textdokument. Jag ger här en översikt över de vanligaste metoderna för informationsfiltrering. Jag jämför innehållsbaserad filtrering, där man ser till dokumentens innehåll, med social filtrering, där man i stället utnyttjar andra användares omdömen om dem, och explicita användarmodeller, sådana som konstrueras av användarna själva, med implicita, som skapas av systemet utifrån observationer av användarnas beteende. Här finns en mer detaljerad beskrivning av LSI, Latent Semantic Indexing, en matematisk metod för att hitta likheter mellan dokument. Jag beskriver också det system för dokumentrekommendation på ett företags intranät som jag arbetat på för Viktoriainstitutets räkning. Systemet använder sig av LSI och explicita användarprofiler.

4

5 Innehåll 1 Inledning Informationsfiltrering Informationsfiltrering och intranät Uppgift Informationsfiltrering Introduktion och terminologi Kort historik Metoder för textfiltrering Innehållsbaserad filtrering Social filtrering Betygsmodeller Användarmodeller Explicita och implicita modeller Exempel på system SIFT InfoScope Tapestry URN GroupLens TREC Intressanta utvecklingsriktningar LSI SVD För- och nackdelar samt jämförelser med andra system Implementation Klienten Funktionalitet

6 3.1.2 Teknikaliteter Servern Indexering: översikt Indexering: detaljer Datafiler Filter Profil Diskussion Tankar kring indexering Sammanfattning 27 Referenser 29 A Appendix 30 A.1 Synonymiregler A.2 Profil- och filterexempel

7 Kapitel 1 Inledning Mer och mer information finns i elektronisk form, vilket gör det enkelt att göra den tillgänglig för många människor. Detta används bland annat inom företag som använder sig av sina intranät för att distribuera information i elektronisk form. Det kan dock vara svårt för de anställda att tillgodogöra sig informationen på ett effektivt sätt, eftersom det kan krävas stora insatser av tid och arbete för att hitta det som är relevant för den enskilde. 1.1 Informationsfiltrering Informationsfiltrering är ett område där man främst koncentrerar sig på långsiktiga informationsbehov, det vill säga när en användare vill bli kontinuerligt hjälpt med att få fram information om ett visst ämne. Oftast handlar det om att förmedla intressanta textdokument till användaren, men det kan också röra sig om film, musik och så vidare. Många använder sig näst intill dagligen av informationsfiltrering i form av bok- och filmrecensioner, sökmotorer på väven 1 och så vidare. Många existerande system kräver dock en relativt stor insats av tid och arbete innan de ger någon utdelning (Fagrell 1999, s.1), delvis för att de främst är konstruerade för att tillfredsställa kortsiktiga informationsbehov. 1.2 Informationsfiltrering och intranät Intranät har blivit ett vanligt sätt för företag att sprida information till sina anställda. (Fagrell 1999, s. 1) Det kan dock vara problematiskt att hitta relevant information 1 Denna term har av SICS lanserats som ett alternativ till webben. Jag har valt att använda detta ord eftersom jag anser det mer lämpligt att hitta svenska alternativ till engelska ord än att anpassa dem till svenska böjningsmönster. 1

8 även på ett sådant nät, eftersom den nya informationen lätt kan försvinna i mängden av mindre aktuella dokument, och eftersom alla anställda inte är intresserade av all ny information som görs tillgänglig. Ett exempel på den omfattning som ett stort intranät kan ha är Volvos, som i maj 1999 hade användare och 250 servrar med dokument. Vissa servrar registrerade då strax över 3000 sessioner per arbetsdag, där en session definieras som en serie förfrågningar med uppehåll på mindre än 30 minuter. (Fagrell 1999, s. 3) 1.3 Uppgift Min uppgift har varit att som mitt examensarbete på språkteknologiprogrammet undersöka området informationsfiltrering samt att fortsätta utvecklingen av ett system för informationsfiltrering som skapats vid Viktoriainstitutet i Göteborg för användning på Volvos intranät. 2

9 Kapitel 2 Informationsfiltrering 2.1 Introduktion och terminologi Med informationsfiltrering menas här en typ av informationssökning där användaren försöker tillfredsställa ett långsiktigt informationsbehov genom att genomsöka en stor mängd dynamiskt genererad information. Denna definition är i stort sett densamma som den som används i Oard (1997), varifrån större delen av innehållet i den här delen har hämtats. Ett informationsfiltreringssystem är ett automatiskt system som konstruerats för att hjälpa användare att hitta de informationsenheter som bäst tillfredsställer deras informationsbehov. Informationssökning används här i vid mening, omfattande alla typer av aktiviteter som företas i avsikt att tillfredsställa ett informationsbehov. Det innefattar såväl att slå upp telefonnummer i en telefonkatalog eller tågtider i en tågtidtabell som databassökningar eller användning av sökmotorer på nätet. Med informationsenhet menas en enhet som innehåller information i en form som kan tolkas av användaren. Det kan röra sig om texter, men också bilder, ljud eller något annat. Informationsenheter som innehåller text kallas vanligen dokument, och filtrering av dessa brukar kallas textfiltrering. Det är denna gren av området som kommer att stå i fokus här. Med dynamiskt genererad information menas att det ständigt tillkommer ny information som användaren kan vara intresserad av. Den representation av användarens informationsbehov som systemet använder kallas profil eller användarmodell. Det senare begreppet kan även användas om en grupp användare. Det är i praktiken knappast möjligt att skapa en perfekt representation av användarens informationsbehov, men man bör sträva efter att göra en så god approximation som möjligt, inom de ramar som sätts av det system man använder. (Alla som någon gång har använt en sökmotor vet hur svårt det kan vara att ens för sig själv formulera exakt vad det egentligen är man letar efter.) 3

10 Det som skiljer informationsfiltrering, IF, från information retrieval, IR, är just att inom IF antas användarens informationsbehov vara relativt stabilt och specifikt jämfört med hur snabbt ny information görs tillgänglig. Ett typiskt exempel på IR är användning av sökmotorer på nätet. Här kan användarens informationsbehov inte antas vara detsamma från en sökning till en annan, snarare tvärt om - användarens behov ändras snabbt och kan variera mycket. Ett filter som ska ta bort så kallad spam (oönskade, vanligtvis kommersiella, massutskick) från användarens e-post är dock ett exempel på IF, eftersom samma, eller mycket liknande, urvalskriterier används hela tiden, medan det ständigt tillkommer nya informationsenheter, i det här fallet e-brev. Ett informationsfiltreringssystem kan antingen bygga på att den som tar emot och den som sänder informationen samarbetar genom att avsändaren gör något slags markeringar för att underlätta sortering, eller på att mottagaren själv får sköta filtreringen. Eftersom samarbete kräver någon form av samordning, och eftersom det finns stora mängder redan existerande dokument som skulle behöva förses med sådana markeringar, är system där mottagaren själv får göra allt antagligen dem som är mest intressanta i nuläget. Det finns dock undantag, till exempel när det gäller e-postlistor, mailing lists. Här är det vanligt att en speciell teckensekvens automatiskt läggs till i rubriken på alla meddelanden, för att det ska vara lätt att se varifrån de kommer. Detta gör det möjligt för mottagaren att sortera upp meddelanden från olika listor i olika mappar, eller att själv välja i vilken ordning man ska läsa sina meddelanden. Här kommer jag dock att koncentrera mig på system som enbart bygger på att mottagaren själv filtrerar utan någon särskild hjälp från avsändaren. Det är ibland möjligt att använda ett IR-system för att utföra uppgifter som ligger närmare IF till sin natur. Man kan till exempel utföra samma sökning i en sökmotor varje dag för att hitta alla nya sidor som rör det ämne man är intresserad av. Även det omvända kan i vissa fall gå att genomföra. Till exempel kan användaren ändra den profil som används för att filtrera de nya informationsenheterna så fort han vill söka efter något nytt, men detta är inte alltid möjligt, och antagligen mycket sällan värt besväret. Namnet informationsfiltrering antyder att det enbart rör sig om att sortera bort de informationsenheter som bedöms vara mindre intressanta för användaren, men det stämmer inte riktigt. Det gäller snarare att arrangera om den information som finns så att det blir lätt att hitta det man är ute efter. Ett program som till exempel ordnar inkommande e-post efter hur brådskande den antas vara är ett informationsfiltreringssystem, även om ingen post faktiskt kastas bort. Möjligen kunde ett namn som informationssortering, informationsseparering eller informationsstrukturering vara mer rättvisande, men jag har valt att här ansluta mig till den existerande terminologin. 4

11 2.1.1 Kort historik IF har sitt ursprung i vad Luhn kallade selective dissemination of information, SDI, när han 1958 presenterade tanken om ett Business Intelligence System (Oard 1997, s. 9). Tanken var att användare skulle ha profiler hos bibliotek där listor av nya dokument som skulle kunna intressera dem skulle sammanställas och skickas ut, varefter användarna skulle kunna beställa det som intresserade dem. Luhns tidiga arbeten identifierade alla aspekter av modern IF, även om detaljerna i tillämpningen naturligtvis ändrats med teknikens utveckling. Houseman fann i en undersökning 1969 sextio fungerande system för SDI inom the Special Interest Group for SDI (Houseman 1969). Den information som distribuerades var främst abstracts för vetenskapliga artiklar på magnetband. Termen informationsfiltrering skapades 1982 i Communications of the ACM (Association for Computing Machinery) där man såg behovet av att skapa någon typ av filter för elektronisk post, till exempel ett som baserade sig på e-brevens innehåll introducerads tanken på social filtrering, där informationsenheter sorteras efter markeringar gjorda av användare snarare än efter sitt innehåll. 2.2 Metoder för textfiltrering Här ges en översikt över de vanligaste metoderna för textfiltrering Innehållsbaserad filtrering Innehållsbaserad filtrering innebär att man ser till dokumentens innehåll när man sorterar dem. Detta kan göras på flera olika sätt. Den grundläggande metoden är dock att på något sätt extrahera olika egenskaper ur dokumentet och omvandla dem till ett format som gör det möjligt att jämföra dem med en användares profil. Exempel på manuell innehållsbaserad filtrering är när en artikel förses med abstract eller nyckelord. Man har då valt ut delar av dokumentets innehåll som anses representativa och sedan omvandlat dem till ett format som gör det möjligt för en potentiell läsare att snabbt bilda sig en uppfattning om det är intressant för honom. De egenskaper som används vid automatiserad filtrering baseras oftast på termförekomster i dokumentet. Den enklaste typen av sådan filtrering är att användarens profil består av ett antal termer och att dokument som innehåller något av dessa termer väljs ut för presentation medan alla andra ignoreras. Med en inte alltför grov generalisering kan man säga att alla andra typer av innehållsbaserad filtrering är förfiningar avsedda att komma tillrätta med de problem som denna enkla metod medför. 5

12 Exakt matchning kontra rangordning Den metod för filtrering som beskrevs ovan, när systemet endast gör en rent binär bedömning av om ett dokument ska visas eller ej, kallas för exakt matchning ( exact match ). En förbättring av detta är att rangordna dokumenten i stället ( ranked output ). 1 Dokumentet ges då ett betyg som är avsett att beskriva hur likt det är det som användaren vill ha. Det finns ett flertal olika metoder för att få fram detta betyg, men grundtanken är densamma. Se avsnittet om betygsmodeller nedan. Det man vinner på att rangordna dokumenten i stället för att låta maskinen själv plocka bort det som anses ointressant är att man får tillgång till de kunskaper användaren har som inte fångats upp av systemet. Det kan röra sig om avancerade omvärldskunskaper eller semantisk förståelse som är alltför svåra eller kostsamma att implementera, men som en människa kan använda utan någon ansträngning. Detta gör att dokument som inte passar in på den profil systemet har men som användaren ändå anser vara intressanta kan hittas. Dessutom kan användaren själv avgöra när han ska sluta söka längre ner i listan över dokument, och kan på så vis själv bestämma den gräns då dokument ska sluta visas. Den största nackdelen är att systemet blir mer komplicerat, eftersom det inte längre räcker med ett binärt värde för varje dokument. För att rangordningen ska vara meningsfull måste den också på ett ungefär motsvara användarens förväntningar, annars kommer den antagligen att uppfattas som meningslös eller irriterande. Att enstaka dokument får en något felaktig placering är förstås oundvikligt och bör inte ses som något stort problem, men om användaren inte kan lita på att systemet gjort en någorlunda rimlig grovsortering är det antagligen bättre att presentera dokumenten med någon annan metod, som i bokstavsordning eller efter någon slags innehållsklassificering. Det går naturligtvis att kombinera båda typerna av filter. Till exempel kan ett e-post-filter rensa bort meddelanden vars rubriker innehåller vissa ord eller fraser (som MAKE MONEY FAST ) medan de övriga sorteras enligt någon slags betygsskala. Synonymi och polysemi Ett stort problem med att använda listor av termer som sökkriterier är att olika personer kan använda många olika termer för att beskriva samma sak. Detta gör att man kanske bara hittar en bråkdel av de dokument som rör det område man är 1 Många av dagens sökmotorer använder exakt matchning för att välja ut vilka dokument som ska presenteras för användaren som relevanta för hans sökning, ibland kombinerat med någon slags betygssättning. Så länge man inte betygssätter alla dokument och presenterar dem som uppnår ett visst betyg så rör det sig ändå om en variant av exakt matchning. 6

13 intresserad av, eftersom de termer man använder helt enkelt inte förekommer i de övriga dokumenten. Med andra ord leder synonymi till försämrad recall. Relaterade problem är att samma term kan användas för att beteckna olika saker, polysemi, samt att böjningsformer av olika ord kan sammanfalla, homografi. Detta gör att man kan få upp fullständigt irrelevanta dokument, det vill säga att precisionen sjunker. I viss mån kan detta åtgärdas genom att använda fler sökord och endast välja ut de dokument som innehåller alla, men detta leder återigen till försämrad recall, eftersom det inte är säkert att alla de dokument man vill ha innehåller alla de sökta termerna. Ett sätt att försöka komma åt problemet med synonymi är att använda sig av så kallad query expansion med hjälp av ett synonymlexikon. Detta kan göras manuellt eller automatiskt. Problemet med att göra det manuellt är förstås att det kräver extra arbete. Automatisk frågeexpansion är inte heller problemfri. Man får visserligen sannolikt bättre recall, eftersom fler termer används vid sökningen, men precisionen kommer antagligen också att sjunka, eftersom vissa av de nya orden antagligen har en något annorlunda betydelse, och eftersom de i sin tur kan vara polysema eller ha homografer, så att helt felaktiga betydelser läggs till. En annan metod som delvis kan lösa detta problem är att använda sig av mer avancerad syntaktisk information. Nackdelen med detta är att det oftast kräver domänspecifika kunskaper vilket gör systemet mindre portabelt. Ett system som enbart använder sig av till exempel ordfrekvenser är enkelt att tillämpa på flera olika domäner, antagligen också på flera olika språk, medan ett som använder sig av stora lexikon och avancerad syntaktisk och semantisk parsning kräver mycket arbete innan det kan flyttas. Här gäller förstås att det är en gradvis övergång från mycket generella system till mycket specifika - så länge man håller sig inom samma språk kan till exempel viss syntaktisk information alltid användas, men ju mer man förlitar sig på systemets kunskaper om specifka ord eller konstruktioner, desto mer domänspecifikt blir det Social filtrering Inom innehållsfiltrering antas systemets användare agera oberoende av varandra. När man använder sig av social filtrering ( social filtering, collaborative filtering ) utnyttjar man i stället andra användares kunskaper om de informationsenheter man ska söka bland. Olika typer av manuell social filtrering är mycket vanligt förekommande i de allra flesta människors vardag. Vi frågar våra vänner om tips på bra böcker, filmer eller restauranger, läser recensioner i tidningen och så vidare. En viktig aspekt att ta hänsyn till här är de kunskaper vi har om andra människors smak. Att be en främling rekommendera en bok ger sällan något, eftersom man inte vet något om 7

14 hur hans intressen förhåller sig till ens egna. Detta är ett av de problem man måste hantera om man vill försöka automatisera den här processen. En vanlig metod är att användaren får sätta betyg på ett antal informationsenheter som han redan känner till, varpå systemet försöker hitta andra användare som givit liknande betyg åt dessa enheter. Man kan sedan utnyttja dessa användares betyg på för den nya användaren okända enheter för att rekommendera sådana som borde passa honom och varna honom för sådana som de andra givit låga betyg Betygsmodeller Målet med ett betygssystem är att de dokument som bäst fyller användarens informationsbehov ska ges ett högt betyg. Här beskrivs några sätt att avgöra hur nära användarens intresse ett visst dokument befinner sig. Det enklaste sättet är att konstruera en användarprofil som består av ett antal termer och sedan visa upp de dokument som innehåller något av termerna, som beskrevs ovan. Stamning 2 av termerna kan vara lämpligt, så att man hittar olika former av termerna i profilen. Ett mer förfinat sätt att sätta betyg på dokument är att uppskatta sannolikheten för att det uppfyller användarens informationsbehov. Man använder sig av viktad information om termers frekvenser i enskilda dokument och i hela dokumentsamlingen för att försöka uppskatta hur sannolikt det är att ett visst dokument tillfredsställer användarens informationsbehov. Här betraktar man dokument och användarprofiler som vektorer i ett rum med en dimension för varje term, med termernas frekvenser (eller någon funktion 3 av dessa) som koordinater. Man kan sedan använda vinkeln mellan dokument och profiler eller avståndet mellan ändpunkterna hos deras vektorer för att på så sätt få ett mått på hur nära profilen ett dokument ligger. Ofta används cosinusvärdet av vinkeln för att få fram ett lätthanterligt mått. En vidareutveckling av vektormodellen som kallas latent semantic indexing, LSI, beskrivs närmare nedan. 2.3 Användarmodeller För att ett informationsfiltreringssystem ska fungera måste man kunna skapa en bra modell över användarens informationsbehov. Denna modell kallas alltså an- 2 Jag har valt att översätta den engelska termen stemming med stamning, för att komma så nära det ursprungliga ordet som möjligt. Alternativa översättningar skulle kunna vara stamavskiljning eller stamreduktion. 3 Flera olika typer av funktioner har använts för att modifiera den rena frekvensen, till exempel olika typer av logaritmer och rent binära funktioner. 8

15 vändarens profil. I detta avsnitt beskrivs kort några olika sätt att bygga upp en sådan. Som nämndes i inledningen är det långt ifrån självklart att den modell som byggs upp matchar det informationsbehov som användaren faktiskt har Explicita och implicita modeller Det finns två olika sätt att bygga upp en profil över användaren, explicit och implicit. Vid explicit profilskapande ger användaren själv direkt den information som används för att bygga upp profilen. Vid textfiltrering rör det sig oftast om antingen en lista av intressanta ord eller ett antal typdokument. Ett system som skapar användarprofilen implicit studerar självt användaren och drar slutsatser utifrån hur han hanterar de olika dokumenten. Vanliga exempel på observationer är hur lång tid han spenderar på att läsa ett visst dokument och om det sparas för framtida bruk eller kastas bort efter läsning. Det har visat sig att detta ofta ger i någon mening bättre information om vilka dokument som ska rekommenderas, men å andra sidan är det svårare att implementera en sådan metod. Det går naturligtvis att kombinera dessa två modeller, till exempel genom att an- vändaren först anger en lista av ord som senare modifieras beroende på hans beteende. 2.4 Exempel på system SIFT SIFT var ett enkelt innehållsbaserat filtreringssystem för USENET News-artiklar som var avsett att användas för att testa effektiviteten hos olika algoritmer. Användarprofilerna skapades manuellt i form av listor av ord att söka efter och ord att undvika. Systemet valde varje dag ut tjugo artiklar och presenterade dem i rangordning. Det fanns möjlighet att modifiera sin profil interaktivt med hjälp av en nätbläddrare. (Oard 1997, s ) InfoScope SIFT betraktade alla news-artiklar som likvärdiga och tog ingen hänsyn till ämne, författare eller vilken nyhetsgrupp de kom ifrån. Detta gjorde däremot InfoScope. På grund av de begränsningar som sattes av kraften hos dåtidens (1991) datorer så var detta den enda information som kunde hanteras. Systemet använde sig av regelbaserad exakt matchning. (Oard 1997, s ) 9

16 2.4.3 Tapestry Textfiltreringssystemet Tapestry var det första som använde sig av social filtrering. Det var avsett för filtrering av elektronisk post, news-artiklar och nyhetsartiklar. Systemet tog hänsyn både till innehållet och till de betyg som det givits av andra läsare. Även Tapestry hade regler för att välja ut när ett dokument skulle presenteras, men här hade användaren möjlighet att vikta reglerna. Systemet var uppdelat i klient och server, där servern använde en uppsättning enkla regler för att avgöra om dokumentet skulle visas för användaren, och klienten sedan använde de mer sofistikerade viktade reglerna för att rangordna de dokument som skulle visas. (Oard 1997, s ) URN URN var ett system för filtrering av news-artiklar. Här hade användarna möjlighet att dels göra explicita, binära bedömningar av dokumenten, dels att justera de nyckolord som användes för att beskriva dem. Användarna kunde både lägga till och stryka ord för att skapa en enligt deras mening bättre bild av dokumentets innehåll. (Oard 1997, s ) GroupLens GroupLens är ett forskningsprojekt vid University of Minnesota som leds av John Riedl och Joseph Konstan där man bland annat studerar social filtrering. Ett projekt som fortfarande är aktivt är MovieLens, ett rekommendationssystem för film 4. (GroupLens 1999) Användaren sätter betyg på ett antal filmer på en femgradig skala, och systemet försöker sedan hitta andra användare som satt liknande betyg på samma filmer. Denna grupp används sedan för att sätta betyg på filmer som användaren inte sett själv, men som andra i gruppen har betygsatt hade man över användare. (Good 1999, s. 4) TREC TREC (Text REtrieval Conference) är en sedan 1992 årlig konferens där man bland annat testar olika textfiltreringssystem under kontrollerade former, vilket är viktigt när man vill undersöka systemets effektivitet eller jämföra det med andra system. (Text REtrieval Conference 1999) Ett problem är att man gjort ganska starka antaganden om vad som menas med relevans, bland annat att det kan uttryckas som 4 MovieLens finns tillgängligt på 10

17 ett rent binärt värde samt att åsikter om relevans är konstanta över användare och tid. (Oard 1997, s. 15) Intressanta utvecklingsriktningar Den stora utmaningen för informationshanteringssystem av alla typer just nu är väven, där det finns miljontals dokument med väldigt olika innehåll av varierande typ - text, ljud, rörliga bilder, stillbilder och program. För tillfället är mängden information alltför omfattande i förhållande till den datorkraft och det lagringsutrymme som man rimligtvis kan ha tillgång till för att ett rent rekommendationssystem ska kunna upprättas. De sökmotorer som för tillfället finns bygger i de flesta fall på ren innehållsbaserad filtrering, även om det ofta finns möjlighet till ungefärliga matchningar. Det finns dock undantag, till exempel Google 5 som använder sig av en typ av social filtrering när de olika alternativen betygsätts. Sidor som hänvisas till av många andra sidor ges ett högre betyg, där sidor som redan fått ett högt betyg väger tyngre. Eftersom det är människor som skapar de flesta hemsidor tar man alltså hjälp av vad författarna själva anser vara viktiga eller intressanta sidor. (Why Use Google? 1999) Även för informationsfiltrering är det intressant att kombinera innehålls- baserad och social filtrering. Hur långt man kan komma med innehållsbaserad filtrering beror på hur avancerad analys man kan göra av informationsenheternas innehåll, vilket i sin tur begränsas dels av datorresurser och dels av hur avancerade lingvistiska modeller man kan skapa - semantik är ju ett notoriskt problematiskt område inom datorlingvistiken. Människor är å andra sidan bra på att hitta innehållsmässiga likheter mellan dokument som kan ha stora skillnader om man bara ser till ytan, vilket gör att social filtrering kan ge ett viktigt tillskott till ett rent innehållsbaserat system, men för att social filtrering ska fungera krävs att antalet användare är tillräckligt stort. Hur man konstruerar användarprofilen för ett filtreringssystem är också ett område där vidare utveckling behövs. Betygssättning är komplicerat och därför otillförlitligt. Är till exempel ett dokument som innehåller all den information man vill ha men även mycket som är ovidkommande bättre eller sämre än ett som är fokuserat på rätt område men inte innehåller lika mycket? Det har visat sig att man ofta får bättre resultat av att se till hur användaren hanterar olika dokument, till exempel hur länge han läser dem, än om man bara använder sig av explicit betygsättning, men det är inte alltid så lätt att extrahera sådan information på ett bra sätt, och olika personer kan bete sig på olika sätt. En person med svenska som 5 Sökmotorn Google finns tillgänglig på 11

18 modersmål kanske spenderar längre tid med att läsa meddelanden på engelska helt enkelt för att de är mer svårbegripliga snarare än för att de är mer intressanta. Flerspråkiga system är över huvud taget problematiska, men också väldigt intressanta. 2.5 LSI Latent semantisk indexering, LSI, är en metod som bygger på vektormodellen. Det man framförallt ville komma till rätta med när man skapade metoden var problemen med synonymi och polysemi. Grundtanken är ganska enkel: man försöker gruppera dokument som har stora mängder gemensamma ord tillsammans, så att det ska gå lätt att hitta alla dokument med liknande innehåll även om man inte använt sig av exakt de termer som förekommer i dokumentet vid sökningen. Det finns flera sätt att uppnå detta. I den artikel där metoden presenteras (Deerwester 1990) använder man sig av singular value decomposition, SVD, en matematisk metod för att projicera mångdimensionella data till ett lägre antal dimensioner. När man gör detta kommer vissa vektorer helt naturligt att klumpas samman eftersom vissa av skillnaderna som fanns i de ursprungliga data kommer att minska eller helt försvinna. Om man väljer de nya basvektorerna på ett lämpligt sätt så kan man se till att de stora skillnaderna bevaras medan de mindre suddas ut något, och detta är ju precis vad man var ute efter SVD Single value decomposition (SVD) är ett av många namn på liknande metoder för att projicera mångdimensionella data till ett mindre antal dimensioner. Metoden är nära besläktad med bland annat egenanalys och spektralanalys. Grundtanken är att hitta ett antal ortogonala basvektorer för det rum som beskrivs av termdokumentmatrisen, varpå man väljer bort de basvektorer som ansvarar för de minsta skillnaderna mellan dokumenten. Inom SVD är detta mycket enkelt att göra eftersom man som en konsekvens av analysen får ett mått på variationen i de olika basvektorernas riktningar. Det går att visa att om man behåller de n basvektorer som ansvarar för de största variationerna i de ursprungliga data så får man den bästa möjliga projektionen till ett n-dimensionellt rum. Hur många basvektorer man vill ha beror på vilken anledning man har att minska antalet dimensioner. Om det är för att man vill få en visuell uppfattning om hur data är fördelade kan man av naturliga skäl inte ta mer än två eller tre. För informationsfiltrering verkar etthundra till några hundra vara lagom. Om man tar för få dimensioner blir indelningen alltför grov, och tar man för många förlorar man den sammanklumpning som man faktiskt vill ha. 12

19 Tekniska detaljer Målet är att approximera en m n-matris med, där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. En godtycklig m n-matris kan sönderdelas i en produkt av tre andra matriser:, r So r Do m A = m To r n n r sådana att och har ortonormala kolumner och är diagonal. Detta kallas matrisens SVD, Singular Value Decomposition. är en m r-matris, en r r- matris och en n r-matris, där r är :s rang min(m,n). Om elementen i är ordnade i fallande storlek så kan man sätta de r-k minsta till 0 och få en projektion till k dimensioner,. x x So 0 0 xrr x x xkk So Det går att visa att om man nu multiplicerar ihop,, och så är den resulterande matrisen den matris av rang k som ligger närmast i minsta kvadrathänseende. Man kan nu stryka de rader och kolumner i som enbart innehåller nollor 13

20 för att få en ny diagonal matris av rang k, samt stryka motsvarande kolumner i respektive. Detta resulterar i att och för att få, r So r Do m A = m To r n n r där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. Detta är precis vad vi vill ha För- och nackdelar samt jämförelser med andra system Fördelen med att representera dokumenten på detta sätt är, som nämnts ovan, att vi i viss mån kan sudda ut skillnaderna mellan närliggande ord, både synonymer och sådana som mycket ofta förekommer tillsammans. Detta gör att en profil som innehåller vissa ord även kan ge högt betyg åt dokument som innehåller ord som i någon mening ligger betydelsemässigt nära de angivna, även om just de orden inte förekommer. Man kommer alltså i viss mån ifrån problemet att det är lätt att missa intressanta dokument på grund av skillnader i ordval. Detta är även den stora fördelen med exakt matchning, som ju ofta missar relevanta dokument och fångar upp irrelevanta. Där har man ju inte heller någon hjälp av den betygssättning som ett vektorbaserat system kan ge med att åtminstone grovt sortera dokumenten. Den stora nackdelen med detta system är att det är mer resurskrävande än den vanliga vektormodellen, både för beräkningar och för lagring. Det krävs en hel del arbete för att göra den matrisuppdelning som behövs, och de resulterande matriserna T och D är i motsats till den ursprungliga matrisen A inte glesa, vilket gör att de kräver mer lagringsutrymme än om man använder sig av den vanliga vektormodellen. Under förutsättning att man har tillgång till kraftfulla datorer och gott om lagringsutrymme är detta dock inget större problem. Jag anser därför att LSI är en mycket lämplig metod för system som är tänkta att användas där sådana resurser finns, som till exempel större företag. LSI är i sig en helt innehållsbaserad metod, och lämpar sig därför främst för 14

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

Sökanalys för intranät

Sökanalys för intranät Sökanalys för intranät 2014-12-03 Henrik Gelius OSLO STOCKHOLM Agenda Henrik Gelius, sökkonsult www.comperiosearch.com Idag tittar vi på detta: 1. Affärsnytta - sök på intranät 2. Sökanalys & nyckeltal

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

Klustring av svenska tidningsartiklar

Klustring av svenska tidningsartiklar Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier

Läs mer

5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk.

5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk. b2 Nivå B2 Level B2 Språk: Kan mycket bra Kan bra Kan ganska bra Kan inte så bra Lyssna Markera med pilar för varje alternativ. Om 3/4 av pilarna pekar eller i en färdighet har du nått upp till denna nivå.

Läs mer

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare

IBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare Fibonacci / översättning från engelska IBSE Ett självreflekterande(självkritiskt) verktyg för lärare Riktlinjer för lärare Vad är det? Detta verktyg för självutvärdering sätter upp kriterier som gör det

Läs mer

Internets historia Tillämpningar

Internets historia Tillämpningar 1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer

En liten introduktion till www.sli.se/avkarlstad

En liten introduktion till www.sli.se/avkarlstad Sida 1(9) Mediecenter Värmland Lena Bengtsson, 054-7011062 lena.bengtsson@regionvarmland.se Datum 2015-05-07 En liten introduktion till www.sli.se/avkarlstad Region Värmland - kommunalförbund Postadress

Läs mer

Colloborative filtering ett rekommendationssystem

Colloborative filtering ett rekommendationssystem Colloborative filtering ett rekommendationssystem 1 Innehållsförteckning 2 1. Inledning Dagens samhälle är idag uppbyggt till stor del av internet. Vi kan i princip sköta det mesta av våra liv via nätet.

Läs mer

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering

Dagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)

Läs mer

WEBB365.SE. Hur skriver man sökmotoroptimerade texter

WEBB365.SE. Hur skriver man sökmotoroptimerade texter Hur skriver man sökmotoroptimerade texter Introduktion Det finns mycket man kan göra för att lyckas på nätet och att skriva sökmotoroptimerade texter är definitivt en av de viktigare. I korta ordalag kan

Läs mer

En introduktion till SLI.SE. April 2015

En introduktion till SLI.SE. April 2015 En introduktion till SLI.SE April 2015 Registrera konto Om du inte ser den här bilden, klicka på hänglåset uppe till höger och välj menyalternativet "Skapa konto". När du fyller i skola, får du en lista

Läs mer

E-biblioteket en tjänst från sjukhusbiblioteken

E-biblioteket en tjänst från sjukhusbiblioteken E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.

Läs mer

Mångdubbla din försäljning med målsökande marknadsföring

Mångdubbla din försäljning med målsökande marknadsföring Mångdubbla din försäljning med målsökande marknadsföring Av alla besökare i en webbutik är det statistiskt sett bara en liten andel som handlar något. Tänk om du kunde återengagera den stora andelen potentiella

Läs mer

Ersätta text, specialtecken och formatering

Ersätta text, specialtecken och formatering 11 Ersätta text, specialtecken och formatering Möjligheten att söka igenom dokumentet och byta ut tecken, ord, textstycken, formatering, specialtecken (t.ex. sidbrytning) och annat är faktiskt mycket mer

Läs mer

Kravspecifikation Fredrik Berntsson Version 1.3

Kravspecifikation Fredrik Berntsson Version 1.3 Kravspecifikation Fredrik Berntsson Version 1.3 Status Granskad FB 2017-01-27 Godkänd FB 2017-01-27 Dokumenthistorik Version Datum Utförda ändringar Utförda av Granskad 1.0 2014-01-15 Första versionen

Läs mer

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring Kategorisering och klustring Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Skillnaden mellan kategorisering och klustring? Kategori är förutbestämt av någon Kluster är

Läs mer

YAHOO! SEARCH MARKETING Tips för att öka trafiken

YAHOO! SEARCH MARKETING Tips för att öka trafiken YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova

Läs mer

Om ämnet Engelska. Bakgrund och motiv

Om ämnet Engelska. Bakgrund och motiv Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,

Läs mer

Att söka information (med betoning på Internet)

Att söka information (med betoning på Internet) Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning

Läs mer

So ka artiklar och annan litteratur

So ka artiklar och annan litteratur 1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom

Läs mer

En introduktion till SLI.SE

En introduktion till SLI.SE En introduktion till SLI.SE Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i skola,

Läs mer

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek INNEHÅLL: ATT BÖRJA SÖKA:... 2 DATABASER MM:... 2-5 NE BIBLIOTEKSKATALOGEN LIBRA.SE ARTIKELSÖK MEDIEARKIVET/RETRIVER ALEX

Läs mer

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. grkom.se/gr-sli

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. grkom.se/gr-sli INTRODUKTION till WEBBTJÄNSTEN GR-SLI grkom.se/gr-sli 2 3 Innehåll Skapa konto... 4 Startsidan... 4 Att söka med sökord... 5 Sök... 5 Filtrering - vad vill du se för träffar?... 6 Spara filter, lägga till

Läs mer

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. sli.se/gr

INTRODUKTION. till WEBBTJÄNSTEN GR-SLI. sli.se/gr INTRODUKTION till WEBBTJÄNSTEN GR-SLI sli.se/gr Skapa konto Klicka på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i kommun och skola, får du en lista på "träffar"

Läs mer

Elements, säkerhetskopiering och dina bilder

Elements, säkerhetskopiering och dina bilder Elements, säkerhetskopiering och dina bilder Mattias Karlsson Sjöberg, december 2011. Moderskeppet.se Lär dig tänka rätt och använda rätt verktyg för att säkerhetskopiering, datorbyte och hårdiskbyte.

Läs mer

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1 Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut

Läs mer

Manual HSB Webb brf 2004 03 23

Manual HSB Webb brf 2004 03 23 TERMINOLOGI I Polopoly används ett antal grundläggande begrepp för publicering och hantering av information, eller innehåll som det också benämns. Nedan följer en kort genomgång av denna grundläggande

Läs mer

Snabbguide till GlobalTwitcher (Juni 2012)

Snabbguide till GlobalTwitcher (Juni 2012) Snabbguide till GlobalTwitcher (Juni 2012) Denna snabbguide är avsedd att hjälpa nya medlemmer att komma igång med huvudfunktionerna på GlobalTwitcher (GT). Siten innehåller dock ett stort antal funktioner

Läs mer

Användarhandbok StepStones Recruiters Space

Användarhandbok StepStones Recruiters Space Användarhandbok StepStones Recruiters Space CV-Sökningar I denna del av Recruiters Space kan du söka efter passande kandidater i StepStones CV-databas. Du kan också registrera CV-agenter som automatiskt

Läs mer

ViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument

ViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument ViTex snabbguide 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument 2. Uppläsning i ViTex Ikoner för uppläsning Läs upp enstaka

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer

Vad säger lagen om cookies och andra frågor och svar

Vad säger lagen om cookies och andra frågor och svar Vad säger lagen om cookies och andra frågor och svar Vad är en cookie? En cookie är en liten textfil som webbplatsen du besöker begär att spara på din dator. Cookies används på många webbplatser för att

Läs mer

En liten introduktion till Mediakatalogen

En liten introduktion till Mediakatalogen En liten introduktion till Mediakatalogen Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du

Läs mer

Analys av BI-system och utveckling av BIapplikationer

Analys av BI-system och utveckling av BIapplikationer Computer Science Fredrik Nilsson, Jonas Wånggren Daniel Strömberg Analys av BI-system och utveckling av BIapplikationer Opposition Report, C/D-level 2005:xx 1 Sammanfattat omdöme av examensarbetet Vi tycker

Läs mer

Vad är Internet? Innehåll: Inledning Vad är Internet? Om du kan Internetadressen Söka på Internet Länklistor Övningar Repetition

Vad är Internet? Innehåll: Inledning Vad är Internet? Om du kan Internetadressen Söka på Internet Länklistor Övningar Repetition Vad är Internet? Innehåll: Inledning 1 Vad är Internet? 2 Om du kan Internetadressen 3 Söka på Internet 6 Länklistor 9 Övningar 10 Repetition 11 Kortfattad repetition 9 6 Inledning Välkommen till Nyfiken

Läs mer

Elevernas uppfattningar om alltmer digitaliserad undervisning

Elevernas uppfattningar om alltmer digitaliserad undervisning Resultat Elevernas uppfattningar om alltmer digitaliserad undervisning Fråga 1 Mycket inspirerande (6) till mycket tråkigt (1) att arbeta med etologisidan Uppfattas som mycket inspirerande eller inspirerande

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:

Läs mer

Innehåll. Informationssökning språkteknologiska hjälpmedel

Innehåll. Informationssökning språkteknologiska hjälpmedel Informationssökning språkteknologiska hjälpmedel Hercules Dalianis NADA-KTH Email: hercules@kth.se Tel: 08-790 91 05 http://www.nada.kth.se/~hercules Hercules Dalianis sid 1 Innehåll Sökmotor Stemming,

Läs mer

Din manual MCAFEE TOTAL PROTECTION 2009 http://sv.yourpdfguides.com/dref/3816852

Din manual MCAFEE TOTAL PROTECTION 2009 http://sv.yourpdfguides.com/dref/3816852 Du kan läsa rekommendationerna i instruktionsboken, den tekniska specifikationen eller installationsanvisningarna för MCAFEE TOTAL PROTECTION 2009. Du hittar svar på alla dina frågor i instruktionsbok

Läs mer

Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten

Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten 2008 Bakgrund Från 2003 har socialförvaltningen i Tingsryd påbörjat ett arbete med s.k. Balanserad styrning. Det innebär att vi arbetar

Läs mer

Nätsäkerhetsverktyg utöver kryptobaserade metoder

Nätsäkerhetsverktyg utöver kryptobaserade metoder Nätsäkerhetsverktyg utöver kryptobaserade metoder Brandväggar Innehållsfiltrering IDS Honungsnät Krävd kunskap i kursen: Att dessa skyddsmetoder finns, vilka grundvillkor man kan/ska ha vid uppsättningen

Läs mer

Styrelsebloggens bruksanvisning

Styrelsebloggens bruksanvisning Styrelsebloggens bruksanvisning sidan 1 av 11 Styrelsebloggens bruksanvisning 1. Inledning Skattkammarvägens samfällighetsförening i Lindsdal, Kalmar består av 85 friliggande hus fördelat på gatorna: Skattkammarvägen

Läs mer

"Distributed Watchdog System"

Distributed Watchdog System Datavetenskap Emma Henriksson Ola Ekelund Oppositionsrapport på uppsatsen "Distributed Watchdog System" Oppositionsrapport, C-nivå 2005 1 Sammanfattande omdöme på exjobbet Projektet tycks ha varit av

Läs mer

Version:

Version: Version: 2015-04-27 1 Logga in Gå till sli.se/medioteket och klicka på hänglåset uppe till höger. Logga in om du redan har ett konto eller skapa konto. Skapa konto / Bli medlem När du fyller i skola, får

Läs mer

svenska kurskod: sgrsve7 50

svenska kurskod: sgrsve7 50 Svenska Kurskod: SGRSVE7 Språk är människans främsta redskap för att tänka, kommunicera och lära. Ämnet handlar om hur språket är uppbyggt och fungerar samt hur det kan användas. Kärnan i ämnet är språk

Läs mer

Vanliga frågor för VoiceXpress

Vanliga frågor för VoiceXpress Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur

Läs mer

Word-guide Introduktion

Word-guide Introduktion Word-guide Introduktion På det kognitionsvetenskapliga programmet kommer du läsa kurser inom flera olika vetenskapsområden och för varje vetenskapsområde finns ett speciellt sätt att utforma rapporter.

Läs mer

Dina surfvanor kartläggs och lämnas ut

Dina surfvanor kartläggs och lämnas ut Dina surfvanor kartläggs och lämnas ut måndag 28 mars 2016 Utländska bolag kartlägger besökare på svenska sjukhus och myndigheters webbplatser. När du läser om till exempel sexuell läggning rapporteras

Läs mer

Nya EU-förordningar. Manual om hur man använder EUR-Lex avancerade sökfunktion

Nya EU-förordningar. Manual om hur man använder EUR-Lex avancerade sökfunktion Nya EU-förordningar Manual om hur man använder EUR-Lex avancerade sökfunktion Kom igång Gå till EUR-Lex webbplats: http://eur-lex.europa.eu/homepage.html?locale=sv. Gå till sökrutan i mitten av sidan på

Läs mer

SÄRSKILD PRÖVNING I SVENSKA A

SÄRSKILD PRÖVNING I SVENSKA A SÄRSKILD PRÖVNING I SVENSKA A Följande färdigheter ska du uppvisa under prövningen för att få ett godkänt betyg på kursen: SKRIVANDE: Du ska kunna producera olika typer av texter som är anpassade till

Läs mer

SPF/MiRiaM Manual avancerad sökning

SPF/MiRiaM Manual avancerad sökning SPF/MiRiaM Manual avancerad sökning 2016-09-15 Skapat av: Fältström Ingrid 1 (31) Innehållsförteckning 1. Inledning... 3 1.1 Begreppsförklaringar... 3 1.1.1 Kolumn... 3 1.1.2 Lista... 3 1.1.3 Posttyp...

Läs mer

TiVo ett rekommendationssystem. TiVo ett rekommendationssystem

TiVo ett rekommendationssystem. TiVo ett rekommendationssystem Sammanfattning I dagens informationssamhälle kan det ibland vara svårt att sortera ut relevant information från mängden. Vi får då förlita oss till rekommendationer och omdömen från andra i allt från vilken

Läs mer

Utvecklingen av ett tidregistrerings- och faktureringssystem

Utvecklingen av ett tidregistrerings- och faktureringssystem Datavetenskap Opponenter: Anders Heimer & Jonas Seffel Respondenter: Daniel Jansson & Mikael Jansson Utvecklingen av ett tidregistrerings- och faktureringssystem Oppositionsrapport, C-nivå 2006:10 1 Sammanfattat

Läs mer

Manual - Inläsningstjänsts App (ios för iphone och ipad)

Manual - Inläsningstjänsts App (ios för iphone och ipad) Sidan 1 av 7 App-release: 1.0 Manual - Inläsningstjänsts App (ios för iphone och ipad) Innehållsförteckning 1 Kort om appen... 2 Funktionaliteten i grova drag... 2 Kända begränsningar i denna version...

Läs mer

Att skriva uppsats. Uppsatsens delar

Att skriva uppsats. Uppsatsens delar Att skriva uppsats Det finns många olika sätt att skriva uppsats på. I den här handledningen beskrivs en modell som, i lite olika varianter, är vanlig i språkvetenskapliga uppsatser. Uppsatsens delar Du

Läs mer

Objekt-orienterad utveckling. Objektorienterad analys och design. Objekt-orienterad programutveckling. Objekt-orienterad analys och design: Litteratur

Objekt-orienterad utveckling. Objektorienterad analys och design. Objekt-orienterad programutveckling. Objekt-orienterad analys och design: Litteratur Objekt-orienterad utveckling Saker man vill uppnå: Objektorienterad analys och design Sven-Olof Nyström Uppsala Universitet 16 mars 2005 en systematisk metod för att gå från problembeskrivning till färdigt

Läs mer

Söka artiklar i CSA-databaser Handledning

Söka artiklar i CSA-databaser Handledning På Malmö högskola har vi flera databaser via CSA, bl.a. Sociological Abstracts, Social Services Abstracts, ERIC och PsychInfo, det betyder att gränssnittet för dessa databaser ser likadana ut. Om du har

Läs mer

Handledning till FC 12 på webben

Handledning till FC 12 på webben Handledning till FC 12 på webben Detta är en kortfattad handledning där vi går igenom de viktigaste funktionerna i nya FirstClass. Förändringen av FirstClass är kanske den största under de snart 25 år

Läs mer

Mobil streckkodsavläsare

Mobil streckkodsavläsare Avdelningen för datavetenskap Martin Persson Jan Eriksson Mobil streckkodsavläsare Oppositionsrapport, D-nivå 2005:xx 1 Generell utvärdering av projektet Projektet gick ut på att undersöka hur bra olika

Läs mer

KN - Seminarium. (Litteratursökning)

KN - Seminarium. (Litteratursökning) KN - Seminarium (Litteratursökning) Elektroniska medier Åbo Akademis bibliotek http://www.abo.fi/library/dbs Virtuellt bibliotek / länksamling för sökning på internet Referensdatabaser, som innehåller

Läs mer

FirstClass Hur du använder FirstClass.

FirstClass Hur du använder FirstClass. OPEN TEXT FirstClass Hur du använder FirstClass. Mars 2008 Peter Gustafsson, Skf Logga in på FirstClass För att starta FirstClass, dubbelklicka på FirstClass ikonen på skrivbordet eller på start-menyn.

Läs mer

DIGITAL KOMMUNIKATION

DIGITAL KOMMUNIKATION EN KOR SAMMANFANING AV EORIN INOM DIGIAL KOMMUNIKAION Linjär kod En binär linjär kod kännetecknas av att summan av två kodord också är ett kodord. Ett specialfall är summan av ett kodord med sig själv

Läs mer

Användarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1

Användarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1 Användarmanualen Visma Enterprise Content Search Standard Version 2.0 for Platina Version 1.1 Innehållsförteckning 1 Ändringshistorik... 4 2 Introduktion... 5 2.1 Ikoner... 5 2.1.1 Allmänt... 5 2.1.2 Sökresultat...

Läs mer

STUDIETEKNIK. Till eleven

STUDIETEKNIK. Till eleven STUDIETEKNIK Till eleven Tro på dig själv! För att du ska lyckas riktigt bra med dina studier, måste du tro på din egen förmåga. Försök tänka på något som du är bra på, för då stärker du ditt självförtroende

Läs mer

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1

Lexikal semantik. Lingvistik 1. Hanna Seppälä Uppsala universitet 1 Lexikal semantik Lingvistik 1 Uppsala universitet 1 Nyckelord idag Semantiska egenskaper Komponentanalys Prototypteori Relationer mellan ord Kognitiv lexikal semantik Uppsala universitet 2 Semantiska egenskaper

Läs mer

Inlämning i Studentportalen

Inlämning i Studentportalen Guide Inlämning i Studentportalen Via en inlämning kan studenter ladda upp filer som lärare kan bedöma. Det kan vara en individuell inlämning eller en gruppinlämning. Här kan även lärare och studenter

Läs mer

Skrivprocessen. Skrivprocessen och retoriken. Skrivprocessen Retoriken Förklaringar

Skrivprocessen. Skrivprocessen och retoriken. Skrivprocessen Retoriken Förklaringar Skrivprocessen Att skriva är ett hantverk något som du kan lära dig. För att bli en bra hantverkare krävs övning. Skrivprocessen liknar i många avseenden den så kallade retoriska arbetsprocessen som vi

Läs mer

Rekommendationer på nätet

Rekommendationer på nätet Linköpings universitet Rekommendationer på nätet Kollaborativa rekommendationssystem Cornelia Böhm 2017-01-12 Abstrakt Rekommendationssystem är algoritmer som används för att filtrera ut de produkter som

Läs mer

Få styr på kampanjerna!

Få styr på kampanjerna! Whitepaper 2.2.2012 1 / 7 Få styr på kampanjerna! Författare: Johanna Småros Direktör, Skandinavien, D.Sc. (Tech.) För företag som jobbar med konsumtionsvaror, utgör kampanjerna en ständigt återkommande

Läs mer

Frågor och svar om reservantagning

Frågor och svar om reservantagning Frågor och svar om reservantagning 1. Frågor om tekniska problem (att saker inte syns eller att man inte kommer åt vissa funktioner). 1 2. Frågor som gäller strykningar och återbud... 2 3. Frågor som gäller

Läs mer

Rekommendationssystem. med fördjupning på collaborative filtering

Rekommendationssystem. med fördjupning på collaborative filtering Rekommendationssystem med fördjupning på collaborative filtering, majsc331 870325-1929 729G11 Artificiell Intelligens II Linköpings Universitet HT 2009 Innehållsförteckning Inledning... 1 Bakgrund...

Läs mer

Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson

Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som

Läs mer

Google Guide: Tips för sökoptimering

Google Guide: Tips för sökoptimering Google Guide: Tips för sökoptimering Google Guide Digital publikation www.intankt.se, Intankt Författare: Adam Ahlgren Typsnitt: Calibri, 11 punkter Formgivning: Intankt Omslagsfoto: Google Stockholm,

Läs mer

Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto

Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto Välkommen till automatiseringens värld Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto Version 2.4 Vi har lösningar för 100 % av era resebehov. American Express Business

Läs mer

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 1 1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta

Läs mer

Microsoft Windows 10 Grunder

Microsoft Windows 10 Grunder WINDOWS 10 Grunder INLEDNING Mål och förkunskaper...5 Pedagogiken...5 Hämta övningsfiler...6 1 INTRODUKTION TILL WINDOWS Grundläggande om operativsystem...7 Starta och avsluta Windows 10...8 Välja kommandon...10

Läs mer

Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7.

Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Progressionsuttryck i kunskapskraven Kommentarerna till progressionsuttrycken i kunskapskraven gäller för engelska språk 5 7. Eleverna ska ges möjlighet att utveckla de förmågor som uttrycks i målen genom

Läs mer

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide Använda Internet med hjälp av Internet Explorer Nybörjarguide Av Carl Ewnert 1 Innehåll: 1. Introduktion 3 2. Utseendet 4 3. Verktygsfältet 4 4. Börja Surfa. 5 5. Att söka på Internet 5 6. Spara en sida

Läs mer

När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på

När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på Surfa på nätet När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på går det naturligtvis inte gå tillbaka till

Läs mer

EAs krav vid ackreditering av flexibel omfattning

EAs krav vid ackreditering av flexibel omfattning SWEDAC DOC 12:1 2012-05-10 Utgåva 1 Inofficiell översättning av EA 2/15 M:2008 EAs krav vid ackreditering av flexibel omfattning Swedac, Styrelsen för ackreditering och teknisk kontroll, Box 878, 501 15

Läs mer

Slumpförsök för åk 1-3

Slumpförsök för åk 1-3 Modul: Sannolikhet och statistik Del 3: Att utmana elevers resonemang om slump Slumpförsök för åk 1-3 Cecilia Kilhamn, Göteborgs Universitet Andreas Eckert, Linnéuniversitetet I följande text beskrivs

Läs mer

Grunder. Grafiktyper. Vektorgrafik

Grunder. Grafiktyper. Vektorgrafik 2 Grunder All vår början bliver svår eller hur det nu brukar heta, och detta är något som gäller även Flash. För den som är ovan vid Flash gäller det säkert extra mycket, då det kan vara knepigt att förstå

Läs mer

Skötselråd för datoransvarig Windows XP, Vista, 7

Skötselråd för datoransvarig Windows XP, Vista, 7 Sidan 1 av 8 En gång per vecka:... 2 Uppdatera antivirusprogrammet... 2 Efter ett långt uppehåll... 2 Varannan vecka:... 2 Microsoft Windows Update... 2 En gång per månad:... 2 Defragmentera hårddisken...

Läs mer

Hur man hjälper besökare hitta på en webbplats

Hur man hjälper besökare hitta på en webbplats Forskare vid Stockholms Universitet ger råd Hur man hjälper besökare hitta på en webbplats Av: Jacob Palme Filnamn:URL: http://dsv.su.se/jpalme/web-structure/hitta-webben.pdf Senast ändrad: 04-02-19 11.43

Läs mer

7 Microsofts grupphanteringsmodell i Windows NT-domäner

7 Microsofts grupphanteringsmodell i Windows NT-domäner 7 Microsofts grupphanteringsmodell i Windows NT-domäner Microsofts modell för grupphantering i Windows NT-domäner Om du redan läst en del om Windows NT Server och Windows NT-domäner kanske du hajar till

Läs mer

Använda SYV-spindeln

Använda SYV-spindeln 2015-02-19 Använda SYV-spindeln Instruktioner för att komma igång! 1 av 11 Komma igång! 1. Registrera en användare och logga in För att börja använda SYV-spindeln är det första du måste göra att registrera

Läs mer

Kommunikation. En aptitretare från VisVires AB

Kommunikation. En aptitretare från VisVires AB Kommunikation En aptitretare från VisVires AB Inledning Vi använder ofta ganska slarvigt begreppet kommunikation, vi säger t.ex. ofta att ett beslut skall kommuniceras ut i organisationen och sedan skickar

Läs mer

Användarmanual konsult

Användarmanual konsult Användarmanual konsult Innehållsförteckning 1. Registrera konto 2. Logga in 3. Fylla i kontouppgifter och prenumerationstyp 4. Byta lösenord 5. Inaktivera konto 6. Radera konto 7. Skapa profil 8. Editera

Läs mer

Guide Studieteknik. Tips för lättare studier!

Guide Studieteknik. Tips för lättare studier! Guide Studieteknik Tips för lättare studier! 1 Läs- och anteckningsteknik Att läsa och att anteckna Det finns goda skäl till att göra anteckningar när du läser en text, lyssnar på en föreläsning, förbereder

Läs mer

ALEPH ver. 16 Sökning

ALEPH ver. 16 Sökning Fujitsu, Westmansgatan 47, 582 16 Linköping INNEHÅLLSFÖRTECKNING 1. INLEDNING... 1 2. SÖK... 1 2.1 Avancerad sökning... 2 2.2 CCL flera databaser... 2 2.3 Flera fält... 3 2.4 Regler för sökning... 4 2.5

Läs mer

Handledare: Elisabet Banemark

Handledare: Elisabet Banemark Ett ITiS-arbete utfört av: Lydia Hallengren Brita Lavesson Nils-George Olsson Stefan Rydberg Magdalena Åkesson Handledare: Elisabet Banemark Innehållsförteckning Bakgrund -------------------------------------------------------------------------------------------3

Läs mer

FTEA21:3 Spr akfilosofi F orel asning III Martin J onsson

FTEA21:3 Spr akfilosofi F orel asning III Martin J onsson FTEA21:3 Språkfilosofi Föreläsning III Martin Jönsson Att lära Fyra argument mot tanken att mening är någonting mentalt. En semantisk princip (principen att mening fixerar referens) En ny filosofisk fråga

Läs mer

Tal i bråkform. Kapitlet behandlar. Att förstå tal

Tal i bråkform. Kapitlet behandlar. Att förstå tal Tal i bråkform Kapitlet behandlar Test Användning av hälften och fjärdedel 2 Representation i bråkform av del av antal och av del av helhet 3, Bråkform i vardagssituationer Stambråk, bråkuttryck med 1

Läs mer

Peter Hellström. PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi

Peter Hellström. PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi Peter Hellström PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi Internet, trender och Google sökmotor Sökmotoroptimering = SEO, Search Engine Optimization Sökmotormarknadsföring

Läs mer

Lär dig skriva för webben

Lär dig skriva för webben Lär dig skriva för webben Start Academy Martin Johansson, Copywriter på StartCommunication martin.johansson@startcommunication.com Lär dig skriva för webben Tack vare internet och en uppsjö av digitala

Läs mer

Laborationer i kursmomentet Datoranvändning E1. Laboration nr 5: Mer om FrameMaker

Laborationer i kursmomentet Datoranvändning E1. Laboration nr 5: Mer om FrameMaker Sid 1 Laborationer i kursmomentet Datoranvändning E1 http://www.etek.chalmers.se/~hallgren/eda/ : Mer om FrameMaker 1996, 1997 Magnus Bondesson 1998 och 99-09-22 Thomas Hallgren 1 Introduktion I Laboration

Läs mer

Statistik från webbplatser

Statistik från webbplatser Statistik från webbplatser problem och möjligheter Ulf Kronman Föredragets huvuddelar Frågorna och motfrågorna Vilka frågor ställer chefen, BIBSAM och ISO? Varför ställer webmastern krångliga motfrågor?

Läs mer