Dokumentrekommendationssystem och intranät
|
|
- Filip Andreasson
- för 8 år sedan
- Visningar:
Transkript
1 Dokumentrekommendationssystem och intranät Anders Gabrielsson Examensarbete 20p Språkteknologiprogrammet Institutionen för lingvistik Uppsala universitet Handledare: Lars Borin och Henrik Fagrell 21 januari 2000
2
3 Sammanfattning Dokumentrekommendation är en del av informationsfiltrering, ett område som främst handlar om att tillfredsställa långsiktiga informationsbehov, i motsats till informationssökning (information retrieval, IR) där man sällan tar hänsyn till användarens intressen eller tidigare beteende. Inom informationsfiltrering gör man detta genom att skapa en modell för det som användaren är intresserad av som sedan används för att välja ut relevanta informationskällor, vanligtvis textdokument. Jag ger här en översikt över de vanligaste metoderna för informationsfiltrering. Jag jämför innehållsbaserad filtrering, där man ser till dokumentens innehåll, med social filtrering, där man i stället utnyttjar andra användares omdömen om dem, och explicita användarmodeller, sådana som konstrueras av användarna själva, med implicita, som skapas av systemet utifrån observationer av användarnas beteende. Här finns en mer detaljerad beskrivning av LSI, Latent Semantic Indexing, en matematisk metod för att hitta likheter mellan dokument. Jag beskriver också det system för dokumentrekommendation på ett företags intranät som jag arbetat på för Viktoriainstitutets räkning. Systemet använder sig av LSI och explicita användarprofiler.
4
5 Innehåll 1 Inledning Informationsfiltrering Informationsfiltrering och intranät Uppgift Informationsfiltrering Introduktion och terminologi Kort historik Metoder för textfiltrering Innehållsbaserad filtrering Social filtrering Betygsmodeller Användarmodeller Explicita och implicita modeller Exempel på system SIFT InfoScope Tapestry URN GroupLens TREC Intressanta utvecklingsriktningar LSI SVD För- och nackdelar samt jämförelser med andra system Implementation Klienten Funktionalitet
6 3.1.2 Teknikaliteter Servern Indexering: översikt Indexering: detaljer Datafiler Filter Profil Diskussion Tankar kring indexering Sammanfattning 27 Referenser 29 A Appendix 30 A.1 Synonymiregler A.2 Profil- och filterexempel
7 Kapitel 1 Inledning Mer och mer information finns i elektronisk form, vilket gör det enkelt att göra den tillgänglig för många människor. Detta används bland annat inom företag som använder sig av sina intranät för att distribuera information i elektronisk form. Det kan dock vara svårt för de anställda att tillgodogöra sig informationen på ett effektivt sätt, eftersom det kan krävas stora insatser av tid och arbete för att hitta det som är relevant för den enskilde. 1.1 Informationsfiltrering Informationsfiltrering är ett område där man främst koncentrerar sig på långsiktiga informationsbehov, det vill säga när en användare vill bli kontinuerligt hjälpt med att få fram information om ett visst ämne. Oftast handlar det om att förmedla intressanta textdokument till användaren, men det kan också röra sig om film, musik och så vidare. Många använder sig näst intill dagligen av informationsfiltrering i form av bok- och filmrecensioner, sökmotorer på väven 1 och så vidare. Många existerande system kräver dock en relativt stor insats av tid och arbete innan de ger någon utdelning (Fagrell 1999, s.1), delvis för att de främst är konstruerade för att tillfredsställa kortsiktiga informationsbehov. 1.2 Informationsfiltrering och intranät Intranät har blivit ett vanligt sätt för företag att sprida information till sina anställda. (Fagrell 1999, s. 1) Det kan dock vara problematiskt att hitta relevant information 1 Denna term har av SICS lanserats som ett alternativ till webben. Jag har valt att använda detta ord eftersom jag anser det mer lämpligt att hitta svenska alternativ till engelska ord än att anpassa dem till svenska böjningsmönster. 1
8 även på ett sådant nät, eftersom den nya informationen lätt kan försvinna i mängden av mindre aktuella dokument, och eftersom alla anställda inte är intresserade av all ny information som görs tillgänglig. Ett exempel på den omfattning som ett stort intranät kan ha är Volvos, som i maj 1999 hade användare och 250 servrar med dokument. Vissa servrar registrerade då strax över 3000 sessioner per arbetsdag, där en session definieras som en serie förfrågningar med uppehåll på mindre än 30 minuter. (Fagrell 1999, s. 3) 1.3 Uppgift Min uppgift har varit att som mitt examensarbete på språkteknologiprogrammet undersöka området informationsfiltrering samt att fortsätta utvecklingen av ett system för informationsfiltrering som skapats vid Viktoriainstitutet i Göteborg för användning på Volvos intranät. 2
9 Kapitel 2 Informationsfiltrering 2.1 Introduktion och terminologi Med informationsfiltrering menas här en typ av informationssökning där användaren försöker tillfredsställa ett långsiktigt informationsbehov genom att genomsöka en stor mängd dynamiskt genererad information. Denna definition är i stort sett densamma som den som används i Oard (1997), varifrån större delen av innehållet i den här delen har hämtats. Ett informationsfiltreringssystem är ett automatiskt system som konstruerats för att hjälpa användare att hitta de informationsenheter som bäst tillfredsställer deras informationsbehov. Informationssökning används här i vid mening, omfattande alla typer av aktiviteter som företas i avsikt att tillfredsställa ett informationsbehov. Det innefattar såväl att slå upp telefonnummer i en telefonkatalog eller tågtider i en tågtidtabell som databassökningar eller användning av sökmotorer på nätet. Med informationsenhet menas en enhet som innehåller information i en form som kan tolkas av användaren. Det kan röra sig om texter, men också bilder, ljud eller något annat. Informationsenheter som innehåller text kallas vanligen dokument, och filtrering av dessa brukar kallas textfiltrering. Det är denna gren av området som kommer att stå i fokus här. Med dynamiskt genererad information menas att det ständigt tillkommer ny information som användaren kan vara intresserad av. Den representation av användarens informationsbehov som systemet använder kallas profil eller användarmodell. Det senare begreppet kan även användas om en grupp användare. Det är i praktiken knappast möjligt att skapa en perfekt representation av användarens informationsbehov, men man bör sträva efter att göra en så god approximation som möjligt, inom de ramar som sätts av det system man använder. (Alla som någon gång har använt en sökmotor vet hur svårt det kan vara att ens för sig själv formulera exakt vad det egentligen är man letar efter.) 3
10 Det som skiljer informationsfiltrering, IF, från information retrieval, IR, är just att inom IF antas användarens informationsbehov vara relativt stabilt och specifikt jämfört med hur snabbt ny information görs tillgänglig. Ett typiskt exempel på IR är användning av sökmotorer på nätet. Här kan användarens informationsbehov inte antas vara detsamma från en sökning till en annan, snarare tvärt om - användarens behov ändras snabbt och kan variera mycket. Ett filter som ska ta bort så kallad spam (oönskade, vanligtvis kommersiella, massutskick) från användarens e-post är dock ett exempel på IF, eftersom samma, eller mycket liknande, urvalskriterier används hela tiden, medan det ständigt tillkommer nya informationsenheter, i det här fallet e-brev. Ett informationsfiltreringssystem kan antingen bygga på att den som tar emot och den som sänder informationen samarbetar genom att avsändaren gör något slags markeringar för att underlätta sortering, eller på att mottagaren själv får sköta filtreringen. Eftersom samarbete kräver någon form av samordning, och eftersom det finns stora mängder redan existerande dokument som skulle behöva förses med sådana markeringar, är system där mottagaren själv får göra allt antagligen dem som är mest intressanta i nuläget. Det finns dock undantag, till exempel när det gäller e-postlistor, mailing lists. Här är det vanligt att en speciell teckensekvens automatiskt läggs till i rubriken på alla meddelanden, för att det ska vara lätt att se varifrån de kommer. Detta gör det möjligt för mottagaren att sortera upp meddelanden från olika listor i olika mappar, eller att själv välja i vilken ordning man ska läsa sina meddelanden. Här kommer jag dock att koncentrera mig på system som enbart bygger på att mottagaren själv filtrerar utan någon särskild hjälp från avsändaren. Det är ibland möjligt att använda ett IR-system för att utföra uppgifter som ligger närmare IF till sin natur. Man kan till exempel utföra samma sökning i en sökmotor varje dag för att hitta alla nya sidor som rör det ämne man är intresserad av. Även det omvända kan i vissa fall gå att genomföra. Till exempel kan användaren ändra den profil som används för att filtrera de nya informationsenheterna så fort han vill söka efter något nytt, men detta är inte alltid möjligt, och antagligen mycket sällan värt besväret. Namnet informationsfiltrering antyder att det enbart rör sig om att sortera bort de informationsenheter som bedöms vara mindre intressanta för användaren, men det stämmer inte riktigt. Det gäller snarare att arrangera om den information som finns så att det blir lätt att hitta det man är ute efter. Ett program som till exempel ordnar inkommande e-post efter hur brådskande den antas vara är ett informationsfiltreringssystem, även om ingen post faktiskt kastas bort. Möjligen kunde ett namn som informationssortering, informationsseparering eller informationsstrukturering vara mer rättvisande, men jag har valt att här ansluta mig till den existerande terminologin. 4
11 2.1.1 Kort historik IF har sitt ursprung i vad Luhn kallade selective dissemination of information, SDI, när han 1958 presenterade tanken om ett Business Intelligence System (Oard 1997, s. 9). Tanken var att användare skulle ha profiler hos bibliotek där listor av nya dokument som skulle kunna intressera dem skulle sammanställas och skickas ut, varefter användarna skulle kunna beställa det som intresserade dem. Luhns tidiga arbeten identifierade alla aspekter av modern IF, även om detaljerna i tillämpningen naturligtvis ändrats med teknikens utveckling. Houseman fann i en undersökning 1969 sextio fungerande system för SDI inom the Special Interest Group for SDI (Houseman 1969). Den information som distribuerades var främst abstracts för vetenskapliga artiklar på magnetband. Termen informationsfiltrering skapades 1982 i Communications of the ACM (Association for Computing Machinery) där man såg behovet av att skapa någon typ av filter för elektronisk post, till exempel ett som baserade sig på e-brevens innehåll introducerads tanken på social filtrering, där informationsenheter sorteras efter markeringar gjorda av användare snarare än efter sitt innehåll. 2.2 Metoder för textfiltrering Här ges en översikt över de vanligaste metoderna för textfiltrering Innehållsbaserad filtrering Innehållsbaserad filtrering innebär att man ser till dokumentens innehåll när man sorterar dem. Detta kan göras på flera olika sätt. Den grundläggande metoden är dock att på något sätt extrahera olika egenskaper ur dokumentet och omvandla dem till ett format som gör det möjligt att jämföra dem med en användares profil. Exempel på manuell innehållsbaserad filtrering är när en artikel förses med abstract eller nyckelord. Man har då valt ut delar av dokumentets innehåll som anses representativa och sedan omvandlat dem till ett format som gör det möjligt för en potentiell läsare att snabbt bilda sig en uppfattning om det är intressant för honom. De egenskaper som används vid automatiserad filtrering baseras oftast på termförekomster i dokumentet. Den enklaste typen av sådan filtrering är att användarens profil består av ett antal termer och att dokument som innehåller något av dessa termer väljs ut för presentation medan alla andra ignoreras. Med en inte alltför grov generalisering kan man säga att alla andra typer av innehållsbaserad filtrering är förfiningar avsedda att komma tillrätta med de problem som denna enkla metod medför. 5
12 Exakt matchning kontra rangordning Den metod för filtrering som beskrevs ovan, när systemet endast gör en rent binär bedömning av om ett dokument ska visas eller ej, kallas för exakt matchning ( exact match ). En förbättring av detta är att rangordna dokumenten i stället ( ranked output ). 1 Dokumentet ges då ett betyg som är avsett att beskriva hur likt det är det som användaren vill ha. Det finns ett flertal olika metoder för att få fram detta betyg, men grundtanken är densamma. Se avsnittet om betygsmodeller nedan. Det man vinner på att rangordna dokumenten i stället för att låta maskinen själv plocka bort det som anses ointressant är att man får tillgång till de kunskaper användaren har som inte fångats upp av systemet. Det kan röra sig om avancerade omvärldskunskaper eller semantisk förståelse som är alltför svåra eller kostsamma att implementera, men som en människa kan använda utan någon ansträngning. Detta gör att dokument som inte passar in på den profil systemet har men som användaren ändå anser vara intressanta kan hittas. Dessutom kan användaren själv avgöra när han ska sluta söka längre ner i listan över dokument, och kan på så vis själv bestämma den gräns då dokument ska sluta visas. Den största nackdelen är att systemet blir mer komplicerat, eftersom det inte längre räcker med ett binärt värde för varje dokument. För att rangordningen ska vara meningsfull måste den också på ett ungefär motsvara användarens förväntningar, annars kommer den antagligen att uppfattas som meningslös eller irriterande. Att enstaka dokument får en något felaktig placering är förstås oundvikligt och bör inte ses som något stort problem, men om användaren inte kan lita på att systemet gjort en någorlunda rimlig grovsortering är det antagligen bättre att presentera dokumenten med någon annan metod, som i bokstavsordning eller efter någon slags innehållsklassificering. Det går naturligtvis att kombinera båda typerna av filter. Till exempel kan ett e-post-filter rensa bort meddelanden vars rubriker innehåller vissa ord eller fraser (som MAKE MONEY FAST ) medan de övriga sorteras enligt någon slags betygsskala. Synonymi och polysemi Ett stort problem med att använda listor av termer som sökkriterier är att olika personer kan använda många olika termer för att beskriva samma sak. Detta gör att man kanske bara hittar en bråkdel av de dokument som rör det område man är 1 Många av dagens sökmotorer använder exakt matchning för att välja ut vilka dokument som ska presenteras för användaren som relevanta för hans sökning, ibland kombinerat med någon slags betygssättning. Så länge man inte betygssätter alla dokument och presenterar dem som uppnår ett visst betyg så rör det sig ändå om en variant av exakt matchning. 6
13 intresserad av, eftersom de termer man använder helt enkelt inte förekommer i de övriga dokumenten. Med andra ord leder synonymi till försämrad recall. Relaterade problem är att samma term kan användas för att beteckna olika saker, polysemi, samt att böjningsformer av olika ord kan sammanfalla, homografi. Detta gör att man kan få upp fullständigt irrelevanta dokument, det vill säga att precisionen sjunker. I viss mån kan detta åtgärdas genom att använda fler sökord och endast välja ut de dokument som innehåller alla, men detta leder återigen till försämrad recall, eftersom det inte är säkert att alla de dokument man vill ha innehåller alla de sökta termerna. Ett sätt att försöka komma åt problemet med synonymi är att använda sig av så kallad query expansion med hjälp av ett synonymlexikon. Detta kan göras manuellt eller automatiskt. Problemet med att göra det manuellt är förstås att det kräver extra arbete. Automatisk frågeexpansion är inte heller problemfri. Man får visserligen sannolikt bättre recall, eftersom fler termer används vid sökningen, men precisionen kommer antagligen också att sjunka, eftersom vissa av de nya orden antagligen har en något annorlunda betydelse, och eftersom de i sin tur kan vara polysema eller ha homografer, så att helt felaktiga betydelser läggs till. En annan metod som delvis kan lösa detta problem är att använda sig av mer avancerad syntaktisk information. Nackdelen med detta är att det oftast kräver domänspecifika kunskaper vilket gör systemet mindre portabelt. Ett system som enbart använder sig av till exempel ordfrekvenser är enkelt att tillämpa på flera olika domäner, antagligen också på flera olika språk, medan ett som använder sig av stora lexikon och avancerad syntaktisk och semantisk parsning kräver mycket arbete innan det kan flyttas. Här gäller förstås att det är en gradvis övergång från mycket generella system till mycket specifika - så länge man håller sig inom samma språk kan till exempel viss syntaktisk information alltid användas, men ju mer man förlitar sig på systemets kunskaper om specifka ord eller konstruktioner, desto mer domänspecifikt blir det Social filtrering Inom innehållsfiltrering antas systemets användare agera oberoende av varandra. När man använder sig av social filtrering ( social filtering, collaborative filtering ) utnyttjar man i stället andra användares kunskaper om de informationsenheter man ska söka bland. Olika typer av manuell social filtrering är mycket vanligt förekommande i de allra flesta människors vardag. Vi frågar våra vänner om tips på bra böcker, filmer eller restauranger, läser recensioner i tidningen och så vidare. En viktig aspekt att ta hänsyn till här är de kunskaper vi har om andra människors smak. Att be en främling rekommendera en bok ger sällan något, eftersom man inte vet något om 7
14 hur hans intressen förhåller sig till ens egna. Detta är ett av de problem man måste hantera om man vill försöka automatisera den här processen. En vanlig metod är att användaren får sätta betyg på ett antal informationsenheter som han redan känner till, varpå systemet försöker hitta andra användare som givit liknande betyg åt dessa enheter. Man kan sedan utnyttja dessa användares betyg på för den nya användaren okända enheter för att rekommendera sådana som borde passa honom och varna honom för sådana som de andra givit låga betyg Betygsmodeller Målet med ett betygssystem är att de dokument som bäst fyller användarens informationsbehov ska ges ett högt betyg. Här beskrivs några sätt att avgöra hur nära användarens intresse ett visst dokument befinner sig. Det enklaste sättet är att konstruera en användarprofil som består av ett antal termer och sedan visa upp de dokument som innehåller något av termerna, som beskrevs ovan. Stamning 2 av termerna kan vara lämpligt, så att man hittar olika former av termerna i profilen. Ett mer förfinat sätt att sätta betyg på dokument är att uppskatta sannolikheten för att det uppfyller användarens informationsbehov. Man använder sig av viktad information om termers frekvenser i enskilda dokument och i hela dokumentsamlingen för att försöka uppskatta hur sannolikt det är att ett visst dokument tillfredsställer användarens informationsbehov. Här betraktar man dokument och användarprofiler som vektorer i ett rum med en dimension för varje term, med termernas frekvenser (eller någon funktion 3 av dessa) som koordinater. Man kan sedan använda vinkeln mellan dokument och profiler eller avståndet mellan ändpunkterna hos deras vektorer för att på så sätt få ett mått på hur nära profilen ett dokument ligger. Ofta används cosinusvärdet av vinkeln för att få fram ett lätthanterligt mått. En vidareutveckling av vektormodellen som kallas latent semantic indexing, LSI, beskrivs närmare nedan. 2.3 Användarmodeller För att ett informationsfiltreringssystem ska fungera måste man kunna skapa en bra modell över användarens informationsbehov. Denna modell kallas alltså an- 2 Jag har valt att översätta den engelska termen stemming med stamning, för att komma så nära det ursprungliga ordet som möjligt. Alternativa översättningar skulle kunna vara stamavskiljning eller stamreduktion. 3 Flera olika typer av funktioner har använts för att modifiera den rena frekvensen, till exempel olika typer av logaritmer och rent binära funktioner. 8
15 vändarens profil. I detta avsnitt beskrivs kort några olika sätt att bygga upp en sådan. Som nämndes i inledningen är det långt ifrån självklart att den modell som byggs upp matchar det informationsbehov som användaren faktiskt har Explicita och implicita modeller Det finns två olika sätt att bygga upp en profil över användaren, explicit och implicit. Vid explicit profilskapande ger användaren själv direkt den information som används för att bygga upp profilen. Vid textfiltrering rör det sig oftast om antingen en lista av intressanta ord eller ett antal typdokument. Ett system som skapar användarprofilen implicit studerar självt användaren och drar slutsatser utifrån hur han hanterar de olika dokumenten. Vanliga exempel på observationer är hur lång tid han spenderar på att läsa ett visst dokument och om det sparas för framtida bruk eller kastas bort efter läsning. Det har visat sig att detta ofta ger i någon mening bättre information om vilka dokument som ska rekommenderas, men å andra sidan är det svårare att implementera en sådan metod. Det går naturligtvis att kombinera dessa två modeller, till exempel genom att an- vändaren först anger en lista av ord som senare modifieras beroende på hans beteende. 2.4 Exempel på system SIFT SIFT var ett enkelt innehållsbaserat filtreringssystem för USENET News-artiklar som var avsett att användas för att testa effektiviteten hos olika algoritmer. Användarprofilerna skapades manuellt i form av listor av ord att söka efter och ord att undvika. Systemet valde varje dag ut tjugo artiklar och presenterade dem i rangordning. Det fanns möjlighet att modifiera sin profil interaktivt med hjälp av en nätbläddrare. (Oard 1997, s ) InfoScope SIFT betraktade alla news-artiklar som likvärdiga och tog ingen hänsyn till ämne, författare eller vilken nyhetsgrupp de kom ifrån. Detta gjorde däremot InfoScope. På grund av de begränsningar som sattes av kraften hos dåtidens (1991) datorer så var detta den enda information som kunde hanteras. Systemet använde sig av regelbaserad exakt matchning. (Oard 1997, s ) 9
16 2.4.3 Tapestry Textfiltreringssystemet Tapestry var det första som använde sig av social filtrering. Det var avsett för filtrering av elektronisk post, news-artiklar och nyhetsartiklar. Systemet tog hänsyn både till innehållet och till de betyg som det givits av andra läsare. Även Tapestry hade regler för att välja ut när ett dokument skulle presenteras, men här hade användaren möjlighet att vikta reglerna. Systemet var uppdelat i klient och server, där servern använde en uppsättning enkla regler för att avgöra om dokumentet skulle visas för användaren, och klienten sedan använde de mer sofistikerade viktade reglerna för att rangordna de dokument som skulle visas. (Oard 1997, s ) URN URN var ett system för filtrering av news-artiklar. Här hade användarna möjlighet att dels göra explicita, binära bedömningar av dokumenten, dels att justera de nyckolord som användes för att beskriva dem. Användarna kunde både lägga till och stryka ord för att skapa en enligt deras mening bättre bild av dokumentets innehåll. (Oard 1997, s ) GroupLens GroupLens är ett forskningsprojekt vid University of Minnesota som leds av John Riedl och Joseph Konstan där man bland annat studerar social filtrering. Ett projekt som fortfarande är aktivt är MovieLens, ett rekommendationssystem för film 4. (GroupLens 1999) Användaren sätter betyg på ett antal filmer på en femgradig skala, och systemet försöker sedan hitta andra användare som satt liknande betyg på samma filmer. Denna grupp används sedan för att sätta betyg på filmer som användaren inte sett själv, men som andra i gruppen har betygsatt hade man över användare. (Good 1999, s. 4) TREC TREC (Text REtrieval Conference) är en sedan 1992 årlig konferens där man bland annat testar olika textfiltreringssystem under kontrollerade former, vilket är viktigt när man vill undersöka systemets effektivitet eller jämföra det med andra system. (Text REtrieval Conference 1999) Ett problem är att man gjort ganska starka antaganden om vad som menas med relevans, bland annat att det kan uttryckas som 4 MovieLens finns tillgängligt på 10
17 ett rent binärt värde samt att åsikter om relevans är konstanta över användare och tid. (Oard 1997, s. 15) Intressanta utvecklingsriktningar Den stora utmaningen för informationshanteringssystem av alla typer just nu är väven, där det finns miljontals dokument med väldigt olika innehåll av varierande typ - text, ljud, rörliga bilder, stillbilder och program. För tillfället är mängden information alltför omfattande i förhållande till den datorkraft och det lagringsutrymme som man rimligtvis kan ha tillgång till för att ett rent rekommendationssystem ska kunna upprättas. De sökmotorer som för tillfället finns bygger i de flesta fall på ren innehållsbaserad filtrering, även om det ofta finns möjlighet till ungefärliga matchningar. Det finns dock undantag, till exempel Google 5 som använder sig av en typ av social filtrering när de olika alternativen betygsätts. Sidor som hänvisas till av många andra sidor ges ett högre betyg, där sidor som redan fått ett högt betyg väger tyngre. Eftersom det är människor som skapar de flesta hemsidor tar man alltså hjälp av vad författarna själva anser vara viktiga eller intressanta sidor. (Why Use Google? 1999) Även för informationsfiltrering är det intressant att kombinera innehålls- baserad och social filtrering. Hur långt man kan komma med innehållsbaserad filtrering beror på hur avancerad analys man kan göra av informationsenheternas innehåll, vilket i sin tur begränsas dels av datorresurser och dels av hur avancerade lingvistiska modeller man kan skapa - semantik är ju ett notoriskt problematiskt område inom datorlingvistiken. Människor är å andra sidan bra på att hitta innehållsmässiga likheter mellan dokument som kan ha stora skillnader om man bara ser till ytan, vilket gör att social filtrering kan ge ett viktigt tillskott till ett rent innehållsbaserat system, men för att social filtrering ska fungera krävs att antalet användare är tillräckligt stort. Hur man konstruerar användarprofilen för ett filtreringssystem är också ett område där vidare utveckling behövs. Betygssättning är komplicerat och därför otillförlitligt. Är till exempel ett dokument som innehåller all den information man vill ha men även mycket som är ovidkommande bättre eller sämre än ett som är fokuserat på rätt område men inte innehåller lika mycket? Det har visat sig att man ofta får bättre resultat av att se till hur användaren hanterar olika dokument, till exempel hur länge han läser dem, än om man bara använder sig av explicit betygsättning, men det är inte alltid så lätt att extrahera sådan information på ett bra sätt, och olika personer kan bete sig på olika sätt. En person med svenska som 5 Sökmotorn Google finns tillgänglig på 11
18 modersmål kanske spenderar längre tid med att läsa meddelanden på engelska helt enkelt för att de är mer svårbegripliga snarare än för att de är mer intressanta. Flerspråkiga system är över huvud taget problematiska, men också väldigt intressanta. 2.5 LSI Latent semantisk indexering, LSI, är en metod som bygger på vektormodellen. Det man framförallt ville komma till rätta med när man skapade metoden var problemen med synonymi och polysemi. Grundtanken är ganska enkel: man försöker gruppera dokument som har stora mängder gemensamma ord tillsammans, så att det ska gå lätt att hitta alla dokument med liknande innehåll även om man inte använt sig av exakt de termer som förekommer i dokumentet vid sökningen. Det finns flera sätt att uppnå detta. I den artikel där metoden presenteras (Deerwester 1990) använder man sig av singular value decomposition, SVD, en matematisk metod för att projicera mångdimensionella data till ett lägre antal dimensioner. När man gör detta kommer vissa vektorer helt naturligt att klumpas samman eftersom vissa av skillnaderna som fanns i de ursprungliga data kommer att minska eller helt försvinna. Om man väljer de nya basvektorerna på ett lämpligt sätt så kan man se till att de stora skillnaderna bevaras medan de mindre suddas ut något, och detta är ju precis vad man var ute efter SVD Single value decomposition (SVD) är ett av många namn på liknande metoder för att projicera mångdimensionella data till ett mindre antal dimensioner. Metoden är nära besläktad med bland annat egenanalys och spektralanalys. Grundtanken är att hitta ett antal ortogonala basvektorer för det rum som beskrivs av termdokumentmatrisen, varpå man väljer bort de basvektorer som ansvarar för de minsta skillnaderna mellan dokumenten. Inom SVD är detta mycket enkelt att göra eftersom man som en konsekvens av analysen får ett mått på variationen i de olika basvektorernas riktningar. Det går att visa att om man behåller de n basvektorer som ansvarar för de största variationerna i de ursprungliga data så får man den bästa möjliga projektionen till ett n-dimensionellt rum. Hur många basvektorer man vill ha beror på vilken anledning man har att minska antalet dimensioner. Om det är för att man vill få en visuell uppfattning om hur data är fördelade kan man av naturliga skäl inte ta mer än två eller tre. För informationsfiltrering verkar etthundra till några hundra vara lagom. Om man tar för få dimensioner blir indelningen alltför grov, och tar man för många förlorar man den sammanklumpning som man faktiskt vill ha. 12
19 Tekniska detaljer Målet är att approximera en m n-matris med, där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. En godtycklig m n-matris kan sönderdelas i en produkt av tre andra matriser:, r So r Do m A = m To r n n r sådana att och har ortonormala kolumner och är diagonal. Detta kallas matrisens SVD, Singular Value Decomposition. är en m r-matris, en r r- matris och en n r-matris, där r är :s rang min(m,n). Om elementen i är ordnade i fallande storlek så kan man sätta de r-k minsta till 0 och få en projektion till k dimensioner,. x x So 0 0 xrr x x xkk So Det går att visa att om man nu multiplicerar ihop,, och så är den resulterande matrisen den matris av rang k som ligger närmast i minsta kvadrathänseende. Man kan nu stryka de rader och kolumner i som enbart innehåller nollor 13
20 för att få en ny diagonal matris av rang k, samt stryka motsvarande kolumner i respektive. Detta resulterar i att och för att få, r So r Do m A = m To r n n r där är en m k-matris, är en diagonal k k-matris, och är en n k-matris. Detta är precis vad vi vill ha För- och nackdelar samt jämförelser med andra system Fördelen med att representera dokumenten på detta sätt är, som nämnts ovan, att vi i viss mån kan sudda ut skillnaderna mellan närliggande ord, både synonymer och sådana som mycket ofta förekommer tillsammans. Detta gör att en profil som innehåller vissa ord även kan ge högt betyg åt dokument som innehåller ord som i någon mening ligger betydelsemässigt nära de angivna, även om just de orden inte förekommer. Man kommer alltså i viss mån ifrån problemet att det är lätt att missa intressanta dokument på grund av skillnader i ordval. Detta är även den stora fördelen med exakt matchning, som ju ofta missar relevanta dokument och fångar upp irrelevanta. Där har man ju inte heller någon hjälp av den betygssättning som ett vektorbaserat system kan ge med att åtminstone grovt sortera dokumenten. Den stora nackdelen med detta system är att det är mer resurskrävande än den vanliga vektormodellen, både för beräkningar och för lagring. Det krävs en hel del arbete för att göra den matrisuppdelning som behövs, och de resulterande matriserna T och D är i motsats till den ursprungliga matrisen A inte glesa, vilket gör att de kräver mer lagringsutrymme än om man använder sig av den vanliga vektormodellen. Under förutsättning att man har tillgång till kraftfulla datorer och gott om lagringsutrymme är detta dock inget större problem. Jag anser därför att LSI är en mycket lämplig metod för system som är tänkta att användas där sådana resurser finns, som till exempel större företag. LSI är i sig en helt innehållsbaserad metod, och lämpar sig därför främst för 14
http://www.sm.luth.se/~andreas/info/howtosearch/index.html
& ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merSökanalys för intranät
Sökanalys för intranät 2014-12-03 Henrik Gelius OSLO STOCKHOLM Agenda Henrik Gelius, sökkonsult www.comperiosearch.com Idag tittar vi på detta: 1. Affärsnytta - sök på intranät 2. Sökanalys & nyckeltal
Läs merSnabbguide till Cinahl
Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin
Läs mer5. Vad jag kan / What I can do. CHECKLISTA Nivå B2 Level B2. 1. Jag kan i detalj förstå vad man säger till mig på normalt samtalsspråk.
b2 Nivå B2 Level B2 Språk: Kan mycket bra Kan bra Kan ganska bra Kan inte så bra Lyssna Markera med pilar för varje alternativ. Om 3/4 av pilarna pekar eller i en färdighet har du nått upp till denna nivå.
Läs merInternets historia Tillämpningar
1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle
Läs merEn liten introduktion till www.sli.se/avkarlstad
Sida 1(9) Mediecenter Värmland Lena Bengtsson, 054-7011062 lena.bengtsson@regionvarmland.se Datum 2015-05-07 En liten introduktion till www.sli.se/avkarlstad Region Värmland - kommunalförbund Postadress
Läs merSvensk nationell datatjänst, SND BAS Online
Pass 4: Metadatastandarder Mer om metadatastandarder Välkommen till presentation 3 i pass 4. Den här presentationen handlar om några olika teman som har att göra med metadatastandarder. Jag kommer att
Läs merEn introduktion till SLI.SE. April 2015
En introduktion till SLI.SE April 2015 Registrera konto Om du inte ser den här bilden, klicka på hänglåset uppe till höger och välj menyalternativet "Skapa konto". När du fyller i skola, får du en lista
Läs merE-biblioteket en tjänst från sjukhusbiblioteken
E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.
Läs merAnvändarhandbok StepStones Recruiters Space
Användarhandbok StepStones Recruiters Space CV-Sökningar I denna del av Recruiters Space kan du söka efter passande kandidater i StepStones CV-databas. Du kan också registrera CV-agenter som automatiskt
Läs merKlustring av svenska tidningsartiklar
Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier
Läs merErsätta text, specialtecken och formatering
11 Ersätta text, specialtecken och formatering Möjligheten att söka igenom dokumentet och byta ut tecken, ord, textstycken, formatering, specialtecken (t.ex. sidbrytning) och annat är faktiskt mycket mer
Läs merIBSE Ett självreflekterande(självkritiskt) verktyg för lärare. Riktlinjer för lärare
Fibonacci / översättning från engelska IBSE Ett självreflekterande(självkritiskt) verktyg för lärare Riktlinjer för lärare Vad är det? Detta verktyg för självutvärdering sätter upp kriterier som gör det
Läs merVad säger lagen om cookies och andra frågor och svar
Vad säger lagen om cookies och andra frågor och svar Vad är en cookie? En cookie är en liten textfil som webbplatsen du besöker begär att spara på din dator. Cookies används på många webbplatser för att
Läs merWEBB365.SE. Hur skriver man sökmotoroptimerade texter
Hur skriver man sökmotoroptimerade texter Introduktion Det finns mycket man kan göra för att lyckas på nätet och att skriva sökmotoroptimerade texter är definitivt en av de viktigare. I korta ordalag kan
Läs merINTRODUKTION. till WEBBTJÄNSTEN GR-SLI. sli.se/gr
INTRODUKTION till WEBBTJÄNSTEN GR-SLI sli.se/gr Skapa konto Klicka på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i kommun och skola, får du en lista på "träffar"
Läs merManual HSB Webb brf 2004 03 23
TERMINOLOGI I Polopoly används ett antal grundläggande begrepp för publicering och hantering av information, eller innehåll som det också benämns. Nedan följer en kort genomgång av denna grundläggande
Läs merKategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring
Kategorisering och klustring Hercules Dalianis DSV-SU-KTH e-post:hercules@kth.se 070-568 13 59 / 08-674 75 47 Skillnaden mellan kategorisering och klustring? Kategori är förutbestämt av någon Kluster är
Läs merRandom Indexing för vektorbaserad semantisk analys
Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk
Läs merAtt ladda ner från legimus.se
Att ladda ner från legimus.se 1 Innehåll Logga in... 2 Första gången du loggar in... 2 Problem att logga in?... 2 Sök efter böcker... 3 Utökad sökning... 3 Träfflistan... 3 Sortera listan... 3 Ladda ner
Läs merBakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1
Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut
Läs merMångdubbla din försäljning med målsökande marknadsföring
Mångdubbla din försäljning med målsökande marknadsföring Av alla besökare i en webbutik är det statistiskt sett bara en liten andel som handlar något. Tänk om du kunde återengagera den stora andelen potentiella
Läs merColloborative filtering ett rekommendationssystem
Colloborative filtering ett rekommendationssystem 1 Innehållsförteckning 2 1. Inledning Dagens samhälle är idag uppbyggt till stor del av internet. Vi kan i princip sköta det mesta av våra liv via nätet.
Läs merBiblioteken, Futurum 2017
Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken
Läs merEn liten introduktion till Mediakatalogen
En liten introduktion till Mediakatalogen Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du
Läs merYAHOO! SEARCH MARKETING Tips för att öka trafiken
YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova
Läs merBrukarundersökning Individ- och familjeomsorgen Introduktionsenheten
Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten 2008 Bakgrund Från 2003 har socialförvaltningen i Tingsryd påbörjat ett arbete med s.k. Balanserad styrning. Det innebär att vi arbetar
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merInformationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek
Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek INNEHÅLL: ATT BÖRJA SÖKA:... 2 DATABASER MM:... 2-5 NE BIBLIOTEKSKATALOGEN LIBRA.SE ARTIKELSÖK MEDIEARKIVET/RETRIVER ALEX
Läs merDagens lektion. Mina forskningsintressen. Min bakgrund. Information Retrieval. Varför IR & disambiguering
Information retrieval & ordbetydelsedisambiguering Leif Grönqvist (leifg@ling.gu.se) Växjö universitet (Matematiska och systemtekniska institutionen) GSLT (Sveriges nationella forskarskola i språkteknologi)
Läs merSo ka artiklar och annan litteratur
1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom
Läs merSnabbguide till GlobalTwitcher (Juni 2012)
Snabbguide till GlobalTwitcher (Juni 2012) Denna snabbguide är avsedd att hjälpa nya medlemmer att komma igång med huvudfunktionerna på GlobalTwitcher (GT). Siten innehåller dock ett stort antal funktioner
Läs merUB:s sö ktjä nst - Söka artiklar och annan litteratur
1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,
Läs merAtt skriva inlägg i Spelmansgillets bloggar hos Blogspot/Google
Att skriva inlägg i Spelmansgillets bloggar hos Blogspot/Google Läsare vem som helst eller utvald krets Bloggen kan konfigureras så att inlägg kan läsas av vem som helst på nätet. Den kan även konfigureras
Läs merViTex snabbguide. 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument
ViTex snabbguide 1. Inläsning till ViTex från scanner eller PDF Läs in text via scanner Läs in text från en JPEG-bild eller ett PDF-dokument 2. Uppläsning i ViTex Ikoner för uppläsning Läs upp enstaka
Läs merAtt söka information (med betoning på Internet)
Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning
Läs merKravspecifikation Fredrik Berntsson Version 1.3
Kravspecifikation Fredrik Berntsson Version 1.3 Status Granskad FB 2017-01-27 Godkänd FB 2017-01-27 Dokumenthistorik Version Datum Utförda ändringar Utförda av Granskad 1.0 2014-01-15 Första versionen
Läs merEn introduktion till SLI.SE
En introduktion till SLI.SE Registrera konto Om du inte ser bilden till höger när du besöker SLI.SE, klicka då på hänglåset uppe till höger, och välj menyalternativet "Skapa konto". När du fyller i skola,
Läs merDina surfvanor kartläggs och lämnas ut
Dina surfvanor kartläggs och lämnas ut måndag 28 mars 2016 Utländska bolag kartlägger besökare på svenska sjukhus och myndigheters webbplatser. När du läser om till exempel sexuell läggning rapporteras
Läs merINTRODUKTION. till WEBBTJÄNSTEN GR-SLI. grkom.se/gr-sli
INTRODUKTION till WEBBTJÄNSTEN GR-SLI grkom.se/gr-sli 2 3 Innehåll Skapa konto... 4 Startsidan... 4 Att söka med sökord... 5 Sök... 5 Filtrering - vad vill du se för träffar?... 6 Spara filter, lägga till
Läs merTDDD92 Artificiell intelligens -- projekt
jonas.kvarnstrom@liu.se 2018 TDDD92 Artificiell intelligens -- projekt Individuella uppgifter UPG2: Individuell skriftlig rapport 2 Vad? Läsa och förstå vetenskaplig litteratur Varför? Framtiden: Inte
Läs merNätsäkerhetsverktyg utöver kryptobaserade metoder
Nätsäkerhetsverktyg utöver kryptobaserade metoder Brandväggar Innehållsfiltrering IDS Honungsnät Krävd kunskap i kursen: Att dessa skyddsmetoder finns, vilka grundvillkor man kan/ska ha vid uppsättningen
Läs merALEPH ver. 16 Sökning
Fujitsu, Westmansgatan 47, 582 16 Linköping INNEHÅLLSFÖRTECKNING 1. INLEDNING... 1 2. SÖK... 1 2.1 Avancerad sökning... 2 2.2 CCL flera databaser... 2 2.3 Flera fält... 3 2.4 Regler för sökning... 4 2.5
Läs merElements, säkerhetskopiering och dina bilder
Elements, säkerhetskopiering och dina bilder Mattias Karlsson Sjöberg, december 2011. Moderskeppet.se Lär dig tänka rätt och använda rätt verktyg för att säkerhetskopiering, datorbyte och hårdiskbyte.
Läs merNYHETER I KARNOV. Senast uppdaterad: 2012-03-16
NYHETER I KARNOV Senast uppdaterad: 2012-03-16 INNEHÅLL 1. Sök Sök i allt på alla sidor... 3 Rättsområde Nytt filter i sökresultatet... 4 Kombinera flera filter i sökresultatet... 5 Nya sökoperatorer...
Läs merKN - Seminarium. (Litteratursökning)
KN - Seminarium (Litteratursökning) Elektroniska medier Åbo Akademis bibliotek http://www.abo.fi/library/dbs Virtuellt bibliotek / länksamling för sökning på internet Referensdatabaser, som innehåller
Läs merOm ämnet Engelska. Bakgrund och motiv
Om ämnet Engelska Bakgrund och motiv Ämnet engelska har gemensam uppbyggnad och struktur med ämnena moderna språk och svenskt teckenspråk för hörande. Dessa ämnen är strukturerade i ett system av språkfärdighetsnivåer,
Läs merVanliga frågor för VoiceXpress
Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur
Läs merNya funktioner i Insättningsuppgift via Internet
Nya funktioner i Insättningsuppgift via Internet September 2018 Postadress: 105 19 Stockholm Besöksadress: Mejerivägen 1 www.bankgirot.se Bankgironr: 160-9908 Styrelsens säte: Stockholm Växel: 08-725 60
Läs merSPF/MiRiaM Manual avancerad sökning
SPF/MiRiaM Manual avancerad sökning 2016-09-15 Skapat av: Fältström Ingrid 1 (31) Innehållsförteckning 1. Inledning... 3 1.1 Begreppsförklaringar... 3 1.1.1 Kolumn... 3 1.1.2 Lista... 3 1.1.3 Posttyp...
Läs merLitteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund
Litteraturstudie Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Vad är en litteraturstudie? Till skillnad från empiriska studier söker man i litteraturstudier svar på syftet
Läs merMobil streckkodsavläsare
Avdelningen för datavetenskap Martin Persson Jan Eriksson Mobil streckkodsavläsare Oppositionsrapport, D-nivå 2005:xx 1 Generell utvärdering av projektet Projektet gick ut på att undersöka hur bra olika
Läs merUtveckling av ett grafiskt användargränssnitt
Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat
Läs merInlämning i Studentportalen
Guide Inlämning i Studentportalen Via en inlämning kan studenter ladda upp filer som lärare kan bedöma. Det kan vara en individuell inlämning eller en gruppinlämning. Här kan även lärare och studenter
Läs merRestaurang Example. (http://www.example.se) Analys av nuvarande hemsida. Av Kharma Concept
Restaurang Example (http://www.example.se) Analys av nuvarande hemsida Av Kharma Concept 1.Översikt: Restaurang XXX har en kreativ hemsida med modern design. Navigering till de olika delarna av hemsidan
Läs merSökexempel Arbetsterapeuter T3
Sökexempel Arbetsterapeuter T3 En repetition om hur man söker i olika databaser och hur man (i bästa fall) kan få ut den aktuella artikeln i fulltext. Som exempel har vi valt en sökning om arbetsterapi
Läs merAnvändarmanualen. Visma Enterprise Content Search. Standard Version 2.0 for Platina. Version 1.1
Användarmanualen Visma Enterprise Content Search Standard Version 2.0 for Platina Version 1.1 Innehållsförteckning 1 Ändringshistorik... 4 2 Introduktion... 5 2.1 Ikoner... 5 2.1.1 Allmänt... 5 2.1.2 Sökresultat...
Läs merMälardalens högskola
Teknisk rapportskrivning - en kortfattad handledning (Version 1.2) Mälardalens högskola Institutionen för datateknik (IDt) Thomas Larsson 10 september 1998 Västerås Sammanfattning En mycket viktig del
Läs merOm uppsatsmallen vid GIH
Om uppsatsmallen vid GIH Här kan du läsa om och se exempel på hur din uppsats vid GIH ska se ut. Uppsatsmallen (.dotxfil) som du kan spara ner och skriva i finns på www.gih.se/uppsats. Huvudrubrik, dvs
Läs merGoogle Guide: Tips för sökoptimering
Google Guide: Tips för sökoptimering Google Guide Digital publikation www.intankt.se, Intankt Författare: Adam Ahlgren Typsnitt: Calibri, 11 punkter Formgivning: Intankt Omslagsfoto: Google Stockholm,
Läs merI dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning.
Avancerad sökning Innehåll Avancerad sökning...1 1. Avancerad sökning...1 1.1 Allmänt...1 1.2 Begreppsförklaringar... 2 1.2.1 Posttyp... 2 1.2.2 Kolumn... 2 1.2.3 Lista... 2 1.2.4 Rad... 3 1.2.5 Vy...
Läs merVara kommun. Fritidsgårdar Våren 2014
Vara kommun Fritidsgårdar Våren 24 Presentation Om undersökningen Sammanfattning Resultat NFI (Nöjd Fritidsgård Index) Per fråga Om undersökningen Undersökningen riktades till personer som besöker Vara
Läs merGrunder. Grafiktyper. Vektorgrafik
2 Grunder All vår början bliver svår eller hur det nu brukar heta, och detta är något som gäller även Flash. För den som är ovan vid Flash gäller det säkert extra mycket, då det kan vara knepigt att förstå
Läs merUmeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I
HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:
Läs merNär man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på
Surfa på nätet När man är ute och surfar på nätet kan det hända att man ibland vill gå tillbaka till en sida man varit på tidigare. Är det första sidan man är på går det naturligtvis inte gå tillbaka till
Läs merSlutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008
Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek
Läs merSöka artiklar i CSA-databaser Handledning
På Malmö högskola har vi flera databaser via CSA, bl.a. Sociological Abstracts, Social Services Abstracts, ERIC och PsychInfo, det betyder att gränssnittet för dessa databaser ser likadana ut. Om du har
Läs merGenetiska Algoritmer i Adaptiva Rekommendationssystem
Genetiska Algoritmer i Adaptiva Rekommendationssystem av Anders Gustafson och Henrik Högberg Institutionen för Informatik Handelshögskolan vid Göteborgs Universitet {s94asg s94paul}@student.informatik.gu.se
Läs merBeräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Läs merTillämpad programmering CASE 1: HTML. Ditt namn
Tillämpad programmering CASE 1: HTML Ditt namn 18 [HTML] Din handledare vill se din skicklighet i att använda HTML-koden. Du ska utveckla en webbplats om ditt intresse, inriktning eller gymnasiearbete.
Läs merDigitalkunskap år 1-6
Skönsmons skola Östra radiogatan 6 854 61 Sundsvall Digitalkunskap år 1-6 www.skonsmonsskola.se Digitalkunskap Skönsmons skola 2014/15 Kunskap om Digitalkunskap har en avgörande betydelse för oss människor.
Läs merAnvändarmanual konsult
Användarmanual konsult Innehållsförteckning 1. Registrera konto 2. Logga in 3. Fylla i kontouppgifter och prenumerationstyp 4. Byta lösenord 5. Inaktivera konto 6. Radera konto 7. Skapa profil 8. Editera
Läs merINTRODUKTION AV RCI WEEKS FÖRBÄTTRINGAR
INTRODUKTION AV RCI WEEKS FÖRBÄTTRINGAR För mer än 35 år sedan uppfann RCI semesterbytet. I dag ÅTERUPPFINNER RCI det genom att bygga upp och utöka dina förmåner som RCI-medlem och vi ger dig det du har
Läs merAnalys av BI-system och utveckling av BIapplikationer
Computer Science Fredrik Nilsson, Jonas Wånggren Daniel Strömberg Analys av BI-system och utveckling av BIapplikationer Opposition Report, C/D-level 2005:xx 1 Sammanfattat omdöme av examensarbetet Vi tycker
Läs merIntervjuformulär. Datum: Namn: Sökt tjänst: Intervjuare:
Intervjuformulär Datum: Namn: Sökt tjänst: Intervjuare: Introduktion För att en rekryteringsintervju ska bli så meningsfull som möjligt är det viktigt att samtalet hjälper dig att matcha varje kandidat
Läs merFråga: Vi ska skapa en omvärldsbevakningsgrupp och undrar hur ska man tänka när man skapar bevakningar för att plocka upp trender inom ett ämne?
FAQ Fråga: Vi ska skapa en omvärldsbevakningsgrupp och undrar hur ska man tänka när man skapar bevakningar för att plocka upp trender inom ett ämne? Först och främst måste ni bestämma vilka mål ni har
Läs merKristian Almgren Artificiell Intelligens Linköpings Universitet 2011. Talstyrning
Talstyrning Abstrakt Talstyrning är en teknik som gör det möjligt för oss människor att mer eller mindre verbalt kommunicera med en dator eller ett system. Det här är ett tillvägagångssätt inom AI och
Läs merSlutrapport Projekt Internet i Sverige
Slutrapport Projekt Internet i Sverige 1. Inledning Wikimedia Sverige är en förening som verkar för att göra kunskap tillgänglig för människor, särskilt genom att stödja Wikimedia Foundations projekt,
Läs merElektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto
Välkommen till automatiseringens värld Elektronisk följesedel Användarmanual för Toppanvändare centraliserat resekonto Version 2.4 Vi har lösningar för 100 % av era resebehov. American Express Business
Läs merVart försvann tanken om att lära sig något, att fördjupa sitt tänkande och komma
Prat om produktivitet Vart försvann tanken om att lära sig något, att fördjupa sitt tänkande och komma till insikt? Försvann den mellan kunskapsmaskineriets kugghjul? Camilla Kronqvist synar produktivitetspratet.
Läs merSänk kostnaderna genom a/ ställa rä/ krav och testa effektivt
Sänk kostnaderna genom a/ ställa rä/ krav och testa effektivt Kravhantering / Testprocess - Agenda AGENDA Grundläggande kravhanteringsprocess. Insamling, dokumentation, prioritering, Test och förvaltning
Läs mersvenska kurskod: sgrsve7 50
Svenska Kurskod: SGRSVE7 Språk är människans främsta redskap för att tänka, kommunicera och lära. Ämnet handlar om hur språket är uppbyggt och fungerar samt hur det kan användas. Kärnan i ämnet är språk
Läs merKöpguide för mobila växlar. Modern telefoni till företaget är långt ifrån vad det var för bara några år sedan.
Köpguide för mobila växlar Modern telefoni till företaget är långt ifrån vad det var för bara några år sedan. Tänk om din nya telefonilösning kunde förenkla din vardag och hjälpa dina medarbetare att arbeta
Läs mer1. Enkel sökning Globalsökning Avancerad sökning Historik Söka via klassificeringsstruktur 14
Ledningskansliet, Juridik och dokumentation Patrik Spånning Westerlund MANUAL 2017-11-16 SLU ID: SLU.ua.2017.2.1.1.IA-9 Manual Sökningar i Public 360 Manual Sökningar i Public 360 Dokumentägare: LK/Dokumentationsenheten/
Läs mer7 Microsofts grupphanteringsmodell i Windows NT-domäner
7 Microsofts grupphanteringsmodell i Windows NT-domäner Microsofts modell för grupphantering i Windows NT-domäner Om du redan läst en del om Windows NT Server och Windows NT-domäner kanske du hajar till
Läs merIntroduktion till MySQL
Introduktion till MySQL Vad är MySQL? MySQL är ett programmerings- och frågespråk för databaser. Med programmeringsspråk menas att du kan skapa och administrera databaser med hjälp av MySQL, och med frågespråk
Läs merManual - Inläsningstjänsts App (ios för iphone och ipad)
Sidan 1 av 7 App-release: 1.0 Manual - Inläsningstjänsts App (ios för iphone och ipad) Innehållsförteckning 1 Kort om appen... 2 Funktionaliteten i grova drag... 2 Kända begränsningar i denna version...
Läs merPositiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen
Positiv Ridning Systemet Negativ eller positiv? Av Henrik Johansen Man ska vara positiv för att skapa något gott. Ryttare är mycket känslosamma med hänsyn till resultatet. Går ridningen inte bra, faller
Läs mer3. Nyanserad och framåtriktad respons
3. Nyanserad och framåtriktad respons Respons är ett centralt begrepp inom bedömning för lärande. I den engelska forskningslitteraturen, och i viss mån även i Sverige, går den under namnet feedback. Det
Läs merOperatörer och användargränssnitt vid processtyrning
Operatörer och användargränssnitt vid processtyrning Normativa och beskrivande analyser Uppsala universitet @ 2003 Anders Jansson Sammanfattning kap. 1 Sociotekniska system Många olika grupper av användare
Läs merWord-guide Introduktion
Word-guide Introduktion På det kognitionsvetenskapliga programmet kommer du läsa kurser inom flera olika vetenskapsområden och för varje vetenskapsområde finns ett speciellt sätt att utforma rapporter.
Läs merKommunikation. En aptitretare från VisVires AB
Kommunikation En aptitretare från VisVires AB Inledning Vi använder ofta ganska slarvigt begreppet kommunikation, vi säger t.ex. ofta att ett beslut skall kommuniceras ut i organisationen och sedan skickar
Läs merTentafrågor 1. Grupp. B
Tentafrågor 1 Grupp. B Sebastian Buks (ic05sb3@student.lth.se) Andreas Edmundsson (ic05ae6@student.lth.se) Birger Hedberg-Olsson (ic05bh3@student.lth.se) Omar Khan (ic05ok5@student.lth.se) Victor Lindell
Läs merRealism och anti-realism och andra problem
Realism och anti-realism och andra problem Vetenskap och verkligheten Vetenskapen bör beskriva verkligheten. Men vad är verkligheten? Är det vi tycker oss se av verkligheten verkligen vad verkligheten
Läs merANVÄNDARGUIDE. ViTex
ANVÄNDARGUIDE ViTex ViTex snabbguide 1. Inläsning till ViTex från inskannat dokument via kopiatorn 2. Uppläsning i ViTex 3. Navigation & Zoner 4. Ändra inställningar 5. Kontakt och Support 1. Inläsning
Läs merAnvända Internet. med hjälp av Internet Explorer. Nybörjarguide
Använda Internet med hjälp av Internet Explorer Nybörjarguide Av Carl Ewnert 1 Innehåll: 1. Introduktion 3 2. Utseendet 4 3. Verktygsfältet 4 4. Börja Surfa. 5 5. Att söka på Internet 5 6. Spara en sida
Läs merSkötselråd för datoransvarig Windows XP, Vista, 7
Sidan 1 av 8 En gång per vecka:... 2 Uppdatera antivirusprogrammet... 2 Efter ett långt uppehåll... 2 Varannan vecka:... 2 Microsoft Windows Update... 2 En gång per månad:... 2 Defragmentera hårddisken...
Läs merSöka, värdera, referera
KTH ROYAL INSTITUTE OF TECHNOLOGY Söka, värdera, referera Ika Jorum, jorum@kth.se Definiera Vad behöver jag veta? Kommunicera Citera och argumentera korrekt Hitta Var och hur kan jag hitta information?
Läs merIntroduktion till frågespråket SQL (v0.91)
DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför
Läs mer