Att utnyttja semantiska länkstrukturer vid sökning i hyperlänkade dokumentmängder

Storlek: px
Starta visningen från sidan:

Download "Att utnyttja semantiska länkstrukturer vid sökning i hyperlänkade dokumentmängder"

Transkript

1 Att utnyttja semantiska länkstrukturer vid sökning i hyperlänkade dokumentmängder Adam Blomberg d98-abl@d.kth.se Abstract Genom att analysera inte enbart individuella dokument och dess textinnehåll utan även sambanden mellan dokumenten i form av länkar, kan informationssökningsmetoderna för sökning i hyperlänkade dokumentmängder förbättras. Denna rapport studerar ett par befintliga strategier för detta, och föreslår också en utvidgning som kan förbättra vissa typer av utsökningar, framförallt i mindre dokumentmängder. Introduktion Denna rapport kommer att sammanfatta och granska en rad olika metoder för att på olika sätt förbättra utbytet av informationssökning i hyperlänkade dokumentsamlingar. Ingen större vikt kommer dock att läggas vid implementationstekniska problem eller optimeringar i denna rapport. Inom informationssökning finns två grundläggande och ofta motstående begrepp, täckning och precision. Bättre täckning innebär att fler matchande (i någon betydelse) dokument ges av en specifik utsökning, och bättre precision innebär att de matchande dokumenten är av högre relevans för frågan. I denna rapport skall vi uppehålla oss vid sökning i hyperlänkade dokumentmängder såsom Internet, men vi skall inte uteslutande behandla Internet i stort. Intressant är även att titta på sökningar i betydligt mindre dokumentmängder, vilka dock delar många av de egenskaper som särskiljer Internet från exempelvis bibliotekskataloger, databaser över forskningsresultat eller någon annan välordnad samling. När man talar om sökmotorer för Internet är ett centralt koncept rankning, ett begrepp som beskriver hur de returnerade dokumenten ordnas efter en utsökning. Detta är i många avseenden liktydigt med precision, dock utan något tröskelvärde för när ett dokument skall bedömas som icke-relevant för en sökfråga. Framledes kommer i allmänhet begreppet rankning att användas. Modeller för informationssökning En allmänt spridd och vedertagen modell för informationssökning är den s.k. vector space-modellen. I korthet beskrivs varje dokument av en vektor, med en längd av antalet distinkta termer i den samlade dokumentmängden. Varje element i ett dokuments vektor har ett icke-negativt värde som indikerar huruvida termen ifråga finns i dokumentet. Detta värde kan antingen vara 0 eller 1, för att indikera existens av termen, eller ett heltal som anger antalet förekomster av termen i dokumentet. En utsökning görs genom att en sökfråga matas in, varpå en vektor skapas som beskriver frågan. Därefter jämförs denna vektor med vektorerna i dokumentmängden, och de dokument vars vektorer är mest överensstämmande med

2 frågevektorn returneras som ett svar på sökfrågan. Notera här att sökfrågan i analysen likställs med dokumenten, ett tillvägagångssätt som intuitivt verkar något märkligt. Det har också visat sig att denna metod inte fungerar speciellt väl i praktiken (Brin och Page, 1998), då användare i allmänhet endast anger ett fåtal frågeord. Detta tenderar att premiera mycket korta dokument som innehåller i princip endast innehåller själva frågetermerna. En annan modell för informationssökning är boolesk sökning, där sökfrågan betraktas som ett booleskt uttryck av termer som alla, eller var för sig (beroende på antagen/angiven logisk operator), måste finnas med i varje matchande dokument. Dagens kommersiellt tillgängliga sökmotorer använder ofta en kombination av ovanstående två modeller, i praktiken en boolesk sökning där rankningen avgörs av termfrekvenser/inversa dokumentfrekvenser (härefter kallat TF/IDF) samt andra, ofta heuristiska, regler för att vikta en terms betydelse i ett dokument. TF/IDF syftar till att poängsätta varje term i ett dokument, där termer som är vanligt förekommande i det specifika dokumentet samtidigt som de är relativt ovanliga i den övriga dokumentsamlingen ges högst poäng då de antas beskriva dokumentet speciellt bra. Gemensamt för både TF/IDF-beräkning och heuristiska regler för rankning är att de varken analyserar en texts semantiska innehåll eller sätter dokumenten i den kontext i vilka de förekommer. En hyperlänkad dokumentsamling innehåller dock mycket metadata, som kan utnyttjas för att analysera såväl semantiskt innehåll som kontext. Egenskaper hos hyperlänkade dokumentsamlingar En hyperlänkad dokumentsamling uppvisar vissa egenskaper som inte återfinns hos en plan dokumentsamling. En naturlig egenskap är förekomsten av länkar, som kan vara av två typer. Dels förekommer länkar som rena navigationsverktyg, av karaktären tillbaka till förstasidan, nästa sida, osv., och dels finns länkar som beskriver ett semantiskt samband mellan olika dokument. (Frei och Steiger, 1992) Det som gör dessa intressanta ur ett informationssökningsperspektiv är både själva länken i sig, som påvisar en relation mellan två dokument, och den ankartext som ofta utgörs en ytterst kortfattad beskrivning av måldokumentet. En s.k. semantisk länk mellan två dokument kan vara en av flera typer. Låt oss till att börja med anta att vi har två dokument, p och q. I q finns en länk till p, och vi säger att p är det länkade dokumentet och q är det länkande dokumentet. Innehållet i p kan då vara en fördjupning av innehållet i q, dvs. en specialisering. Innehållet i p kan också beskriva ett bredare ämnesområde än q, dvs. vara en generalisering. De båda dokumenten kan också ligga på samma nivå. Slutligen finns ytterligare en typ av relation som är tämligen unik för webben, liksom vanligt förekommande där. Detta är en relation mellan en länksamling och sida som innehåller en traditionell diskurs. Länksamlingar, om än fattiga på information sedda i ett textmässigt perspektiv, kan var mycket rika på semantisk länkinformation då de ofta samlar flera dokument inom samma ämnesområde som av dokumentförfattaren utsetts som speciellt bra dokument i någon bemärkelse. Vi skall se senare att denna speciella typ av sidor kan utnyttjas i en sökning, och att det har visat sig i praktiska experiment att resultatet blir mycket gott. Förbättring av precision Som jag har nämnt tidigare skall jag i denna rapport anse begreppen precision och rankning som två sidor av samma mynt, i det att en god rankning i praktiken är liktydigt med god precision när man gör utsökningar på vidare begrepp som resulterar i stora matchande dokumentmängder. När vi istället rör oss om mer

3 specialiserade sökfrågor som returnerar små dokumentmängder är dessa begrepp inte längre liktydiga, så en klar distinktion måste göras mellan dess fall. Forskningen inom detta specifika område har under senare år ofta inriktat sig på att förbättra resultat av sökningar på ett fåtal, tämligen breda termer, där det finns mycket information att tillgå. Det kan handla om sökfrågor av typen katter, bilar eller kanske sökmotor. Alla dessa sökfrågor ger stora svarsmängder (framförallt om frågorna ställs på engelska), och utan någon form av semantisk analys är det mycket svårt att rangordna dokumenten på ett sätt så att de första dokumenten också är de som är mest relevanta. PageRank PageRank är Googles metod för att hitta de mest relevanta dokumenten vid sökning på vida begrepp. Denna metod går ut på att varje dokument vid indexeringen tilldelas en rankning (detta är en rankning i hela dokumentmängden, och inte i en speciell utsökning), som avgörs av hur många dokument som länkar till detta dokument, samt vilken rankning dessa dokument i sin tur har. (Brin och Page, 1998, Brin, Page, Motwani, Winograd, 1998) PageRank kan ses som en markov-modell där en användare antas slumpmässigt klicka sig igenom webben, och där varje dokuments rankning anger sannolikheten för att just det dokumentet skall väljas. Varje dokuments rankning kan beskrivas av formeln PR(A) = (1-d) + d (PR(T1)/C(T1) PR(Tn)/C(Tn)), där PR(X) är sidan X:s rankning, T1 Tn är sidor som länkar till A, C(X) är antal länkar som lämnar sidan X, och d är en dämpningsfaktor. Anledningen till att varje länkande sidas rankning delas med antalet länkar från densamma sidan är naturligtvis för att kompensera för sidor som har många alternativt få länkar ut. Finns endast ett fåtal länkar ut från en sida kan man anta att dessa visar på en starkare relation till de länkade sidorna, än en sida med hundratals ut-länkar Dämpningsfaktorn d, ett tal mellan 0 och 1, bestäms heuristiskt, och kan ses som den genomsnittliga tiden en besökare stannar på en sida. Ett lämpligt värde på denna har av Brin och Page satts till 0,85. Alla dokuments sammanlagda PageRank-värden blir som synes 1, och varje dokuments PageRank-värde anger sannolikheten för att den slumpmässiga besökaren skall befinna sig på den aktuella sidan i ett givet ögonblick. Om man tittar på PageRank-modellen inser man att den värderar populära sidor som länkas till av andra poulära sidor högt. Att använda enbart denna teknik kan dock vara problematiskt. Som Kleinberg (Kleinberg, 1999) påpekar väger denna rankning inte alls in de aktuella frågetermerna. Populära sidor som Yahoo!, Netscape eller liknande riskerar att värderas högt givet att de innehåller frågetermer, endast på grundval av deras popularitet. Att det sedan finns mindre populära men mer relevanta sidor tas ingen hänsyn till. Kleinberg föreslår en alternativ metod med hubbar och auktoriteter, som beskrivs härnäst. Hubbar och auktoriteter Kleinberg (1999) beskriver en modell, som liksom PageRank har målet att förbättra rankningen av dokument vid vida sökfrågor. Till skillnad från PageRank kan den även öka täckningen och returnera dokument som inte innehåller de faktiska söktermerna, men som istället sägs beskrivas av dessa. (Här bör man dock ha i åtanke att PageRank i praktiken används i förening med ankartextindexering, och på detta sätt kan prestera betydligt bättre än som enda metod.) Jag skall i korthet beskriva hur Kleinbergs modell ser ut, då den bjuder på ett antal intressanta lösningar.

4 Efter att en sökfråga har tagits emot görs en vanlig textsökning på dessa termer, exempelvis i en av de kommersiella sökmotorerna. För att få en hanterbar dokumentmängd används sedan runt 200 av de först returnerade dokumenten, och analysen startar därifrån. De dokument som vi nu har bildar en mängd, låt oss kalla den R. Dokumenten i R är alla tämligen relevanta för sökningen, då vi fortfarande gör antagandet att sökningen gäller ett brett ämnesområde. Dokumenten i R parsas för att hitta dels länkar som pekar mot dokument utanför R, dels länkar som pekar från dokument utanför R och in. Varje dokument i R får bidra med maximalt d antal sidor, d väljs runt 50. Vi har nu en ny mängd S som består av alla dokument i R, liksom de dokument utanför R som är länkade till dokument i R, med ovan nämnda restriktion. Antalet dokument i S brukar ligga mellan 1000 och 5000, med parametrar valda enligt ovan. S innehåller nu samling dokument, som alla kan antas beröra det sökta ämnet. Nästa steg är att analysera länkstrukturen. Målet är att identifiera auktoriteter och hubbar, dvs. dokument som innehåller information som är populär respektive dokument av typen länksamlingar, som innehåller länkar till många auktoriteter. En auktoritet klassificeras som sådan genom att många hubbar länkar till denna. Sidor som har många in-länkar, men vars länkande dokument inte är s.k. hubbar, anses inte vara auktoriteter. Vi kan exemplifiera detta genom att anta att vi har sökt på bilar. Troligen återfinns då en eller flera mycket populära s.k. portalsidor i mängden S, trots att dessa inte specifikt handlar om bilar. Det är också möjligt att dessa dokument har många inlänkar från övriga dokument i mängden. Det som gör att vi ändå kan filtrera bort portalsidor som bidrar med lite information är att de länkande sidorna inte är några hubbar, vilka i detta fall skulle vara länksamlingar som handlar om bilar. Det man i praktiken plockar ut är de mest koncentrerade nätverken av hubbar och auktoriteter. Det är också detta som gör att denna modell fungerar bra, trots att vi efter den inledande utsökningen inte granskar dokumentens textinnehåll. En fördel med denna metod är, förutom att rankningen tar hänsyn till själva sökfrågan, att dokument som inte innehåller söktermerna men likväl är mycket relevanta kan fångas upp. Vid sökningar på breda begrepp som t.ex. sökmotor är det inte speciellt sannolikt att de största sökmotorerna returneras om bara sidornas textuella innehåll granskas, trots att dessa uppenbarligen vore de bästa träffarna. (Man kan naturligtvis ha invändningar mot detta, men exempelvis Googles förstasida innehåller inte frasen search engine.) Anledningen till att man ändå kan få t.ex. Google rankad först är dels utvidgningssteget, där man utökar S med sidor direkt länkade från den ursprungliga sidmängden, och dels det faktum att många av hubbarna länkar till Google och sidan av denna anledning betraktas som en auktoritet. Nackdelar Denna metod har ett par nackdelar, främst av vilka är uppmjukningen av sökfrågan mot en högre abstraktionsnivå. Metoden tenderar att premiera det/de mest generella (eller vanligt förekommande) av de begrepp sökningen gäller, och på så sätt returnera dokument som är mindre specifika än vad användaren kanske avsåg. Å andra sidan är de returnerade dokumenten i allmänhet av sådan kvalitet att det är lätt att borra sig ned, och finna dokument som behandlar den specialisering användaren avsåg. En egenskap hos både denna metod och PageRank, som i vissa fall är en avsevärd nackdel, är att de fungerar bäst när man söker på vida begrepp, med de stora matchande dokumentmängder man då har att undersöka. Om det hyperlänkade nätverket inte är tillräckligt stort är det svårt att finna auktoriteter och hubbar, och

5 variationerna i PageRank-värde torde vara tämligen små. Båda metoderna blir också känsligare för fel, då man inte skall glömma att många av länkar är av mindre god kvalitet i det att de inte fungerar som det semantiska verktyg man önskar. Hit hör t.ex. länkar i annonser, rena navigationslänkar liksom länkar till copyrighttexter, webbyråer och andra typer av länkar som inte har med dokumentets egentliga innehåll att göra. Sammanfattningsvis skall man komma ihåg syftet med dessa båda metoder, nämligen att förbättra rankningen, precisionen, i en utsökning då täckningen är god. Den externa kontexten Kleinbergs metod erbjöd ett sätt att med hjälp av kontexten i dokumentmängden, här kallat den externa kontexten (till skillnad från kontext inom ett dokument), skilja ut vissa dokument som bättre matchningar än andra dokument. Detta kan dock göras på andra sätt, och mer explicit. Vi skall först granska indexering av ankartexter, som tillsammans med PageRank-modellen ger mycket goda resultat. Därefter skall vi titta på en utvidgning av denna indexering som inte endast inbegriper ankartexter, utan även den lokala kontext dessa återfinns i. Den senare metoden har med framgång använts tillsammans med Kleinbergs metod, vilket vi också skall se. Slutligen skall jag diskutera ytterligare en utvidgning av kontextindexeringen, som kombinerar en PageRank-liknande metod med indexering av nyckelord från hela länkande dokument. Samtliga dessa metoder syftar till att både förbättra täckningen och att öka precisionen, och bör fungera tämligen väl även vid utsökningar på mer specialiserade begrepp. Indexering av ankartexter Det finns flera anledningar till att det kan vara önskvärt att indexera inte endast de termer som förekommer i ett dokument, utan även termer som förekommer i ankartexterna som länkar till detta dokument. Ankartexter används på webben för att i endast ett fåtal ord beskriva ett dokument, och i allmänhet ge en relativt god beskrivning. (Amitay, 1997) Att indexera även ankartexter är inte en ny idé, utan implementerades redan 1994 i World Wide Web Worm, en mycket tidig sökmotor som indexerade runt dokument (McBryan, 1994). Denna teknik används också tillsammans med PageRank i Google (Brin och Page, 1998), och ger där mycket bra resultat. Anledningen till att ankartexter ger goda resultat både vad gäller täckning och precision är flera. Ett relativt stort problem vid sökning av dokument på webben är s.k. sökmotorspamming, vilket innebär att en sidas upphovsmakare genom att i ett dokument ange stora mängder av nyckelord som inte är beskrivande för dokumentets innehåll, för att på detta sätt lura sökmotorer att ranka dokumentet i fråga högt även i sökningar som inte alls relaterar till dess innehåll. Detta problem finns dock i regel inte om den aktuella sökrymden är kontrollerad på något sätt, exempelvis då man söker på ett specifikt företags eller institutions webbplats, eller vid sökning på intranät. Indexering av ankartexter gör sökningen mindre känslig för spamming, eftersom ankartexter i allmänhet är en utomstående betraktares uppfattning om ett dokuments innehåll. Även i helt legitima dokument kan det vara svårt att med säkerhet bestämma värdet av enskilda termer, och även här kan ankartexter ge en bättre bild av dokumentet ifråga. Således är det möjligt att med hjälp av ankartexter öka precisionen. Denna typ av indexering av ankartexter kan även öka täckningen, i det att ord söktermerna inte behöver förekomma i ett dokument för att det skall anses som en träff, utan det

6 räcker att det förekommer i ankartexterna. Detta är en stor fördel vid sökning både på vidare begrepp och vid sökning på mycket ovanliga ord. Här kan man givetvis fråga sig om kvaliteten på ankartexterna är så pass hög att dessa i sig själv räcker som kontextinstrument. Det har visat sig att kvaliteten är relativt god (Amitay, 1997), och att framförallt länksamlingar av olika slag uppvisar ett språkbruk som är specifikt för webben, men som fungerar väl för indexeringsbehov. Exempelvis är satserna ofta förenklade och saknar t.ex. verb och determinerare, men fokuserar istället på substantiv med ett högt informationsinnehåll, ord som i regel lämpar sig väl som nyckelord för det måldokumentet. Indexering av ankarkontext Vi har sett att ankartexter ofta innehåller goda beskrivningar av dokument, men det kan finnas anledning att ytterligare utvidga indexeringen till att även inbegripa den kontext i vilken ankaret återfinns. Det är inte ovanligt att ord förknippade med det länkade dokumentet inte finns inom själva ankartaggen, utan i dess närhet. I en experimentell undersökning utförd av Chakrabarti et al (1998) granskade man länkar till Yahoo!, och fann att termen Yahoo oftast fanns inom ett fönster på 50 tecken från ankaret. Omkring 20% av förekomster av termen Yahoo fanns inte inom ankartaggen, vilket visar på att det kan finnas ett behov av att indexera även ankarkontexten. Chakrabarti använde sig av Kleinbergs modell med hubbar och auktoriteter för själva indexeringen, med ankarkontexten som tillägg och kunde på detta sätt generera länklistor av den typen som återfinns på bl.a. Yahoo! och OpenDirectory, men utan manuell intervention. Dessa maskinellt genererade listor upplevdes av de försökspersoner man använde sig av som nästan lika bra som de manuellt genererade listorna, och i vissa fall upplevdes till och med de automatgenererade listorna något förvånande som bättre. I detta experiment gjordes sökningar på vida termer, som cykling, ost och arkitektur. Indexering av externa nyckelord Det är ett välkänt faktum att många termer som förekommer i ett dokument är specialiseringar av vidare termer, och det har visat sig att det kan vara svårt att finna dessa dokument då de ofta inte innehåller någon indikation i sig själva på vilket begrepp specialiseringen gäller. Som vi har sett tidigare tenderar metoder som endast förlitar sig till analysering av länkstrukturer att premiera populära dokument, som i allmänhet beskriver eller behandlar begrepp på en generell nivå. Speciellt problematiskt kan det bli om användaren i sin sökfråga använder en blandning av generella och specialiserade begrepp, framförallt i en begränsad dokumentmängd. Gör användaren en utsökning på husdjur och sphynx 1 förväntas att dokument som handlar om katter av rasen sphynx returneras. Det förefaller inte osannolikt att sådana dokument saknar termen husdjur, då det för en besökare torde framgå relativt tydligt av sidan är det handlar om en typ av husdjur, nämligen just katter av rasen sphynx. Det är vidare inte bra att i sökfrågan utelämna termen husdjur, då en sökning på termen sphynx riskerar att returnera dokument från ett helt annat ämnesområde. (Detta är också fallet, en sökning på Google returnerar först ett antal träffar på olika företag med detta namn.) Det är inte heller osannolikt att ankartexten eller dess närmaste kontext inte heller innehåller ordet husdjur. 1 Sphynx är en kattras som speciellt kännetecknas av avsaknaden av päls, katterna är i princip hårlösa.

7 Här skulle man alltså önska att det utifrån termen sphynx liksom andra termer i det specifika dokumentet skulle vara möjligt att avgöra att detta sorterar under kategorin husdjur. Försök med automatisk kategorisering av dokument har gjorts, men det har visat sig att dessa tekniker fungerar mindre väl (för att inte säga dåligt) på heterogena dokumentsamlingar av den typ man finner på webben. (Chakrabarti, Dom, Indyk, 1998) Att finna generaliseringar av specifika termer är alltså önskvärt, men undantaget försök inom forskningen 2 finns ingen väl fungerande metod för detta. Givet att vi således inte försöker använda någon form av semantisk analys av varje dokument kan en metod för att göra en approximation av det semantiska innehållet i ett dokument vara att undersöka gemensamma drag i andra dokument som länkar till detta dokument. Metoden Metoden går i korthet ut på att alla dokument som länkar till ett dokument analyseras för nyckelord (vilka i sin tur kan utvinnas med TF/IDF-metoden), och likheter bland dessa nyckelord undersöks. Om termen husdjur är signifikant för merparten av de länkande dokumenten kan man dra slutsatsen att också det länkade dokumentet bör handla om eller ha någon relation till begreppet husdjur, även om detta alltså inte går att utläsa vid en analys av dokumentets text. Låt oss kalla de gemensamma nyckelord funna i den länkande dokumentmängden för externa nyckelord för det länkade dokumentet. Det finns dock ett par problem med denna metod. För det första finns en överhängande risk för brus. Det handlar om en approximation av ett dokuments semantiska innehåll, det vill säga i praktiken en gissning. Till skillnad från analys av ankartexter är sambandet mellan ett dokument och dess externa nyckelord inte lika starkt. Naturligtvis kan det vara så att en mängd sidor om husdjur länkar till en sida som inte alls är relaterad till detta ämne, i vilket fall denna sida kommer att få ett inkorrekt externt nyckelord. För att minimera negativa effekter till följd av denna osäkerhet bör man vikta de externa nyckelorden omsorgsfullt, och i deras värdering lägga stor vikt dels vid hur många länkande dokument som har funnits och hur stor del av dessa som delar respektive externa nyckelord. Diskussion Således kan man fråga sig om det inte, som vi har nämnt tidigare, räcker att titta på ankartexterna? Att endast titta på ankartexterna är i och för sig inte en dålig lösning, men vi kan i en ankartext troligen inte finna den generalisering vi söker. Många ankartexter är dessutom korta och föga informationsrika, av typen klicka här eller bilder utan titlar som utan resurskrävande textigenkänning inte kan behandlas. Det finns också en klar skillnad mellan dessa två metoder. Då man tittar på ankartexterna handlar det om att bättre försöka beskriva det länkade dokumentets innehåll på samma begreppsnivå. För att använda oss av en variant av det tidigare exemplet; i länkar till ett dokument om siameser kan man förvänta sig att finna just denna term, då det inte finns någon anledning att ankartexterna skall vara mer generella än dokumentet i sig. Då man istället tittar på hela (eller delar av) de länkande dokumenten, försöker man inte bara ta reda på vad det länkade dokumentet handlar om utan även vad de länkande dokumenten handlar om, för att på denna sätt finna en generalisering av det koncept som det länkade dokumentet behandlar. Betänk också att det kan gå åt motsatt håll, dvs. att man finner en 2 Om än fungerande är WordNet sådan forskningsresurs. WordNet är ett lexikalt referenssystem där man bland annat kan söka sig uppåt från specifik termer till mer generella sådana. WordNet finns på

8 specialisering av det aktuella konceptet, även om sannolikheten för detta torde vara lägre. Det är på denna grund man kan dra slutsatsen att det verkar vara intressant att analysera ett större segment av det länkande dokumentet än endast länktexten. Vi har sett att man då kan analysera kontexten länken finns i. Beroende på dokumentets karaktär kan detta göras med mer eller mindre gott resultat, men det löser i allmänhet inte vårt generaliseringsproblem. För mycket långa dokument finns naturligtvis andra problem, i det att olika stycken av dokumentet kan skilja sig inte bara i innehåll utan även ämnesområde. I dessa fall kan det vara lämpligt att segmentera texten på något sätt. Textsegmentering i bl.a. informationssökningssyfte är ett område inom vilket en hel del forskning har bedrivits, och dessa resultat är naturligtvis intressanta att undersöka vidare, även om detta faller utanför området för denna rapport. Textsegmentering kan alltså vara intressant, men detta medför givetvis en ökning av komplexiteten. Av praktiska skäl kan det vara lämpligt att analysera hela dokumentet, då denna analys ändå måste göras för att indexera detta dokument. Här börjar vi också närma oss en annan fråga, nämligen om externa nyckelord skall betraktas som en del av ett dokuments egna termmängd eller inte, och på vilket sätt detta påverkar indexerbarheten och användbarheten av denna metod. Utan praktiska försök är det svårt att säga huruvida rekursiviteten som ett inkluderande av externa nyckelord innebär utgör ett hinder i implementationen, men då denna till stor del liknar PageRank-modellen torde det inte vara några större problem. Slutligen kan antas att denna metod fungerar bäst i mindre dokumentsamlingar och framför allt vid utsökningar på mindre vanliga ord och begrepp kombinerat med generella termer. Använd tillsammans med PageRank eller hubb- och auktoritetmodellen kan den även vara användbar på godtyckligt stora dokumentmängder. Slutsatser Man kan dra slutsatsen att det är möjligt att dra långtgående slutsatser ur den semantiska strukturen en hyperlänkad dokumentmängd uppvisar. Det finns idag flera exempel där dessa modeller utnyttjas i praktiken, med gott resultat. Jag har gått igenom ett antal metoder för att på olika sätt utnyttja denna struktur, och kan konstatera att det detta är ett mycket aktivt forskningsområde (vilket också är naturligt med tanke på att hyperlänkade dokumentmängder i den skala webben representerar är ett relativt nytt fenomen). Idéen att försöka dra slutsatser om ett dokuments ämnesområde utifrån dess omgivning, som vi tack vare den hyperlänkade strukturen lätt kan finna, påminner om försök som har gjorts med dokumentkategorisering och dokumentklustring. Omsatta i praktiken har dock dessa metoder givit varierande resultat, varför en bedömning av en metods lämplighet endast kan göras efter omfattande tester. I detta sammanhang kan det slutligen vara värt att nämna att metoderna för evaluering, tidigare speciellt omnämnda som mycket goda, i dagsläget verkar mindre idealiska. Ofta har sökmotorer jämförts på väl avgränsade dokumentmängder med ett homogent innehåll, vilka ställer helt andra (och möjligen lägre) krav på en sökmotor än vad den betydligt mer vildvuxna webben gör.

9 Litteraturhänvisningar E. Amitay Hypertext: The importance of being different. MSc thesis. Centre for Cognitive Science, The University of Edinburgh, Scotland. S. Brin och L. Page The anatomy of a large-scale hypertextual Web search engine. I Ashman and Thistlewaite, sidor Brisbane, Australia. S. Brin, L. Page, R. Motwani, T. Winograd The PageRank citation ranking: Bringing order to the Web. Insänd för publicering. S. Chakrabarti B. Dom, P. Indyk "Enhanced hypertext categorization using hyperlinks". SIGMOD 1998, sidor S. Chakrabarti, B. Dom, P. Raghavan, S. Rajagopalan, D. Gibson, J. Kleinberg Automatic resource compilation by analyzing hyperlink structure and associated text. Proceedings of the 7th International World Wide Web Conference. H. P. Frei och D. Steiger Making use of hypertext links when retrieving information. Proceedings of the 4th ACM Conference on Hypertext ECHT 92, sidor ACM Press, New York. J. Kleinberg Authoritative sources in a hyperlinked environment. Journal of the ACM, Vol. 46, Nr. 5, September 1999, sidor O. A. McBryan GENVL and WWWW: Tools for taiming the web. International Conference on the World Wide Web. CERN, Geneva.

Checklista. 10 saker du behöver ha på plats för SEO 2019

Checklista. 10 saker du behöver ha på plats för SEO 2019 Checklista 10 saker du behöver ha på plats för SEO 2019 2/9 Rom byggdes inte på en dag, och det gör heller inte din hemsidas synlighet i sökmotorer. För detta krävs det sökmotoroptimering (Search Engine

Läs mer

GRATIS SEO, SÖK- OPTIMERING? JA, DETTA KAN DU GÖRA SJÄLV!

GRATIS SEO, SÖK- OPTIMERING? JA, DETTA KAN DU GÖRA SJÄLV! GRATIS SEO, SÖK- OPTIMERING? JA, DETTA KAN DU GÖRA SJÄLV! GRATIS SEO, SÖKOPTIMERING? JA, DETTA KAN DU GÖRA SJÄLV! INNEHÅLL Introduktion 3 Varför det är nödvändigt att tänka på SEO 4 SEO-tips för planering

Läs mer

2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING. Av Erik Lindgren 810110-8218 soft@kth.se

2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING. Av Erik Lindgren 810110-8218 soft@kth.se 2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING Av Erik Lindgren 810110-8218 soft@kth.se SAMMANFATTNING Föreliggande uppsats behandlar ämnet sökmotoroptimering.

Läs mer

SEO Sökmotoroptimering

SEO Sökmotoroptimering SEO Sökmotoroptimering Aaron Axelsson Presentation Head of SEO på Brath sedan 3 år Tidigare flera byråer i Sverige Head of SEO inom gambling Började som pokerskribent 2007 SEO sedan 2010 Sökmotoroptimering

Läs mer

Introduktion till språkteknologi

Introduktion till språkteknologi Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.

Läs mer

Googles sidrankning - linjär algebra värt en förmögenhet

Googles sidrankning - linjär algebra värt en förmögenhet Googles sidrankning - linjär algebra värt en förmögenhet Outline 1 Sökmotorer 2 Grafteori Linjär algebra 3 Målet Utifrån användarens sökord lista de mest relevanta webbsidorna. Dessutom i en ordning som

Läs mer

http://www.youtube.com/watch?v=jpenfwiqdx8

http://www.youtube.com/watch?v=jpenfwiqdx8 http://www.youtube.com/watch?v=jpenfwiqdx8 1 Sökmotoroptimering SEO En introduktion för webbredaktörer 2 Agenda Var är vi på väg? Hur fungerar sökmotorer? Hur går det till när jag söker? Hur hänger det

Läs mer

Sök artiklar i databaser för Vård- och hälsovetenskap

Sök artiklar i databaser för Vård- och hälsovetenskap Sök artiklar i databaser för Vård- och hälsovetenskap Bibliografiska databaser eller referensdatabaser ger hänvisningar (referenser) till artiklar och/eller rapporter och böcker. Ibland innehåller referensen

Läs mer

Sammanfattning av informationssökning VT19

Sammanfattning av informationssökning VT19 729G19 Tillämpad kognitionsvetenskap Sammanfattning av informationssökning VT19 För godkänt projekt på kursen 729G19 skall man haft ett handledningstillfälle i informationssökning och sammanfattning av

Läs mer

Hur man hjälper besökare hitta på en webbplats

Hur man hjälper besökare hitta på en webbplats Forskare vid Stockholms Universitet ger råd Hur man hjälper besökare hitta på en webbplats Av: Jacob Palme Filnamn:URL: http://dsv.su.se/jpalme/web-structure/hitta-webben.pdf Senast ändrad: 04-02-19 11.43

Läs mer

Googles besöksfrekvens & uppdatering av cache

Googles besöksfrekvens & uppdatering av cache Googles besöksfrekvens & uppdatering av cache Besöker och cachar Google sidor oftare om sidan uppdateras/förändras oftare? av Ulf Liljankoski http://www.liljankoski.se 2007-03-16 INTRODUKTION Vad går undersökningen

Läs mer

Biblioteken, Futurum 2017

Biblioteken, Futurum 2017 Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken

Läs mer

http://www.sm.luth.se/~andreas/info/howtosearch/index.html

http://www.sm.luth.se/~andreas/info/howtosearch/index.html & ' ( ( ) * +, ', -. / ' 0! 1 " 2 # 3 / /! 1 $ 4, % 5 # 3, http://www.sm.luth.se/~andreas/info/howtosearch/index.html Andreas Tips och trix till sökningar i Cyberrymnden Här försöker jag att gå igenom

Läs mer

Optimering av webbsidor

Optimering av webbsidor 1ME323 Webbteknik 3 Lektion 7 Optimering av webbsidor Rune Körnefors Medieteknik 1 2019 Rune Körnefors rune.kornefors@lnu.se Agenda Optimering SEO (Search Engine Optimization) Sökmotor: index, sökrobot

Läs mer

Sovra i materialet. Vad är viktigt? Vad kan tas bort? Korta ner långa texter.

Sovra i materialet. Vad är viktigt? Vad kan tas bort? Korta ner långa texter. Sid 1 (6) Skriva för webb Att skriva för webben handlar om att skriva kort och enkelt för att fånga läsaren. Relevant innehåll Fundera över vad läsaren vill veta. Skriv för målgruppen. Sovra i materialet.

Läs mer

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se Tänk kreativt! Informationssökning Ha ett kritiskt förhållningssätt! Informationssökning steg för steg Innan du börjar behöver du formulera en fråga. Vad vill du hitta information om? Att utgå från: -

Läs mer

Sökmotoroptimering. Per Svanström SMM. Online Communication Manager. Web Intelligence. /persvanstrom /in/persvanstrom /profiles/per.

Sökmotoroptimering. Per Svanström SMM. Online Communication Manager. Web Intelligence. /persvanstrom /in/persvanstrom /profiles/per. Sökmotoroptimering SEO SEM Per Svanström Online Communication Manager SMM Web Intelligence /persvanstrom /in/persvanstrom /profiles/per.svanstrom www.knowit.se Copyright 2011 294 miljarder epost skickas

Läs mer

Att söka information (med betoning på Internet)

Att söka information (med betoning på Internet) Att söka information (med betoning på Internet) - en sökguide för distansstuderande 1. Var finns informationen? 2. Hur söker man? Sökstrategier 3. Olika informationskällor, hjälpmedel vid informationssökning

Läs mer

Sökmotormarknadsföring

Sökmotormarknadsföring Sökmotormarknadsföring Kenth Johansson kejo@tomegroup.se Bakgrund Sökmotorer Sökmotoroptimering Hitta rätt nyckelord Hur får jag fler klick på min sida i sökresultatet? Genomgång av några verktyg Sökmotorannonsering

Läs mer

Söka artiklar i CSA-databaser Handledning

Söka artiklar i CSA-databaser Handledning På Malmö högskola har vi flera databaser via CSA, bl.a. Sociological Abstracts, Social Services Abstracts, ERIC och PsychInfo, det betyder att gränssnittet för dessa databaser ser likadana ut. Om du har

Läs mer

Euroling SiteSeeker. Sökning som en tjänst för webbplatser, intranät och e-handel.

Euroling SiteSeeker. Sökning som en tjänst för webbplatser, intranät och e-handel. Euroling SiteSeeker Sökning som en tjänst för webbplatser, intranät och e-handel. Euroling and SiteSeeker SiteSeeker högpresterande sökplattform Webbplatser, intranät och e-handel som en Appliance eller

Läs mer

FEM ENKLA KNEP SOM HJÄLPER DIG SYNAS BÄTTRE PÅ GOOGLE

FEM ENKLA KNEP SOM HJÄLPER DIG SYNAS BÄTTRE PÅ GOOGLE SÖKMOTOROPTIMERING FEM ENKLA KNEP SOM HJÄLPER DIG SYNAS BÄTTRE PÅ GOOGLE INLEDNING De flesta som har en webb-sida funderar då och då på hur de ska få sidan att komma så högt som möjligt i Google och andra

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Etiska regler för sökmarknadsföring via sökmotoroptiering

Etiska regler för sökmarknadsföring via sökmotoroptiering Etiska regler för sökmarknadsföring via sökmotoroptiering Innehåll Etiska regler för sökmarknadsföring via sökmotoroptimering 2 1. Syfte och tillämplighet 3 2. Definitioner 3 3. Allmänna bestämmelser 3

Läs mer

Internets historia Tillämpningar

Internets historia Tillämpningar 1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle

Läs mer

Sökmotoroptimering. Hur gör jag min sida sökmotorvänlig?

Sökmotoroptimering. Hur gör jag min sida sökmotorvänlig? Sökmotoroptimering Hur gör jag min sida sökmotorvänlig? Hur gör jag min sida sökmotorvänlig?...2 Vad är Metataggar?...2 Metataggarnas betydelse...2 Metataggar i Jetshop...2 Title...2 Meta description...3

Läs mer

Socialtjänstbiblioteket

Socialtjänstbiblioteket Socialtjänstbiblioteket www.inera.se/socialtjanstbiblioteket 2012-12-05 Eira och Inera EiRA ett landstingssamarbete sedan 2001 med syftet att förhandla fram prisvärda avtal på e-resurser för vårdens personal.

Läs mer

Peter Hellström. PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi

Peter Hellström. PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi Peter Hellström PH-Digital Marketing peter.hellstrom@digitalmarketing.fi www.digitalmarketing.fi Internet, trender och Google sökmotor Sökmotoroptimering = SEO, Search Engine Optimization Sökmotormarknadsföring

Läs mer

Sökmotoroptimering av en webbshop och sökordsrelevans för försäljningen. Ulf Liljankoski, januari 2007 www.liljankoski.se

Sökmotoroptimering av en webbshop och sökordsrelevans för försäljningen. Ulf Liljankoski, januari 2007 www.liljankoski.se Sökmotoroptimering av en webbshop och sökordsrelevans för försäljningen Ulf Liljankoski, januari 2007 www.liljankoski.se INTRODUKTION Vid en sökmotoroptimering av en webbshop väljer många SEO-företag ut

Läs mer

SEMSEO sökmotoroptimering SEO

SEMSEO sökmotoroptimering SEO SEMSEO sökmotoroptimering SEO Google SEO sökmotoroptimering Seminarier 2010 Upplägg Presentation SEMSEO Internetmarknadsföring - SEO Begrepp - Grunder Planering Analys Exempel SEO verktyg - Tips Målsättning:

Läs mer

Business research methods, Bryman & Bell 2007

Business research methods, Bryman & Bell 2007 Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data

Läs mer

Mångdubbla din försäljning med målsökande marknadsföring

Mångdubbla din försäljning med målsökande marknadsföring Mångdubbla din försäljning med målsökande marknadsföring Av alla besökare i en webbutik är det statistiskt sett bara en liten andel som handlar något. Tänk om du kunde återengagera den stora andelen potentiella

Läs mer

INFORMATIONSSÖKNING: SJUKSKÖTERSKEPROGRAMMET T1. Medicinska biblioteket

INFORMATIONSSÖKNING: SJUKSKÖTERSKEPROGRAMMET T1. Medicinska biblioteket INFORMATIONSSÖKNING: SJUKSKÖTERSKEPROGRAMMET T1 Medicinska biblioteket www.ub.umu.se IDAG SKA VI TITTA PÅ: Förberedelser för att söka vetenskaplig artikel: o Formulera en sökfråga o Välja ut bra sökord

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket. PubMed lathund 2016-02-04 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på För att få se vad som har hänt bakom kulissen, titta på Search details.

Läs mer

Bra hemsidor, trender och Google sökmotor

Bra hemsidor, trender och Google sökmotor Bra hemsidor, trender och Google sökmotor Sökmotoroptimering = SEO, Search Engine Optimization Sökmotormarknadsföring = SEM, Search Engine Marketing Internet användare 06/2012 ca.2,4 miljarder Internetanvändare

Läs mer

Sökoptimering - Innehåll

Sökoptimering - Innehåll Sökoptimering - Innehåll Introduktion Del 1 - Lokal Sökoptimering Del 2 - Onsite Optimering Del 3 - Offsite Optimering Sökoptimering (SEO): Sökoptimering är grunden för din synlighet på nätet. Ca 97% av

Läs mer

Att köpa webb En guide till en värld i daglig förändring.

Att köpa webb En guide till en värld i daglig förändring. Att köpa webb En guide till en värld i daglig förändring. Denna guide vänder sig till dig som kommer köpa kompetens inom webbområdet. Guiden är främst tänkt som en hjälp till dig. Med denna hjälp kan du

Läs mer

FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång

FriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång FriendlyReader Språkteknologi för sammanfattningar och ökad läsbarhet Mål:! Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information

Läs mer

Sök och SEO i den nya världen - Hur du kan arbeta effektivt med mobilt, socialt och klassiskt sök!

Sök och SEO i den nya världen - Hur du kan arbeta effektivt med mobilt, socialt och klassiskt sök! Sök och SEO i den nya världen - Hur du kan arbeta effektivt med mobilt, socialt och klassiskt sök! Vem är den här Simon? Arbetade med HTML i 14 år. Arbetat med internetmarknadsföring i 8 år facebook.com/joinsimon

Läs mer

WEBB365.SE. Hur skriver man sökmotoroptimerade texter

WEBB365.SE. Hur skriver man sökmotoroptimerade texter Hur skriver man sökmotoroptimerade texter Introduktion Det finns mycket man kan göra för att lyckas på nätet och att skriva sökmotoroptimerade texter är definitivt en av de viktigare. I korta ordalag kan

Läs mer

WEBBKLUSTRING SLUTRAPPORT

WEBBKLUSTRING SLUTRAPPORT Arne Jönsson 2014-01-09 WEBBKLUSTRING SLUTRAPPORT 1. Inledning Inom projektet har vi utvecklat teknik som gör det möjligt att identifiera webbsidors innehåll och därefter klustra (gruppera) dem så att

Läs mer

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek

Läs mer

TILLGÄNGLIGHET PÅ WEBBEN KOMMUNIKATIONSENHETEN

TILLGÄNGLIGHET PÅ WEBBEN KOMMUNIKATIONSENHETEN TILLGÄNGLIGHET PÅ WEBBEN KOMMUNIKATIONSENHETEN 2016-04-08 Vad är tillgänglighet? Tillgänglighet på webben handlar i grunden om att alla ska kunna tillgodogöra sig innehållet på en webbplats. En tillgänglig

Läs mer

Information Retrieval. Information Retrieval (IR)

Information Retrieval. Information Retrieval (IR) Information Retrieval Johan Boye, KTH Information Retrieval (IR) Att hitta relevantinformation i en stor mängd texter (och/eller bilder, audio, video, programkod, biomedicinsk data, ) Användaren ger en

Läs mer

SEO & SEM ESSENTIALS 2015-10-13

SEO & SEM ESSENTIALS 2015-10-13 SEO & SEM ESSENTIALS 2015-10-13 Beatrice Lindholm SEO Consultant Katarina Sonnenberg SEM Consultant AGENDA SEO Introduktion till SEO 5 viktiga saker som Google förstår/gillar Länkar SEM Vad är Google AdWords?

Läs mer

SEMSEO sökmotoroptimering SEO "Google Top 10. Google SEO sökmotoroptimering Seminarier 2011

SEMSEO sökmotoroptimering SEO Google Top 10. Google SEO sökmotoroptimering Seminarier 2011 SEMSEO sökmotoroptimering SEO "Google Top 10 Google SEO sökmotoroptimering Seminarier 2011 Upplägg Presentation SEMSEO Internetmarknadsföring - SEO Begrepp - Grunder Planering Analys Exempel SEO verktyg

Läs mer

Internet. En enkel introduktion. Innehåll:

Internet. En enkel introduktion. Innehåll: Internet En enkel introduktion Innehåll: Datorns olika delar Starta datorn Så gör du om du kan webbadressen Så gör du om du inte kan webbadressen Kortfattad repetition Alingsås bibliotek, 2012 2 3 4 6

Läs mer

SEO-rapport. Innehållsförteckning. Introduktion EkoLekos sökord.. 3. Rapport från Semrusch som visar EkoLekos Organic Search Summary,...

SEO-rapport. Innehållsförteckning. Introduktion EkoLekos sökord.. 3. Rapport från Semrusch som visar EkoLekos Organic Search Summary,... SEO-rapport Innehållsförteckning Introduktion EkoLekos sökord.. 3 Rapport från Semrusch som visar EkoLekos Organic Search Summary,...4 Organic SearchTop Keywords..5 Utvecklingen på EkoLekos viktigaste

Läs mer

Web Crawlers. TDTS09, Datornät och internetprotokoll. Denis Golubovic Fredrik Salin Linköpings universitet Linköping 2011-02-23

Web Crawlers. TDTS09, Datornät och internetprotokoll. Denis Golubovic Fredrik Salin Linköpings universitet Linköping 2011-02-23 Web Crawlers TDTS09, Datornät och internetprotokoll Denis Golubovic Fredrik Salin Linköpings universitet Linköping 2011-02-23 Omslagsbild: Spider robot Google 3d model Källa: turbosquid.com Sammanfattning

Läs mer

Statligt stöd för miljö- och sociala frågor till små och medelstora företag - en jämförande studie mellan Sverige och Storbritannien

Statligt stöd för miljö- och sociala frågor till små och medelstora företag - en jämförande studie mellan Sverige och Storbritannien I ett examensarbete från Sveriges Lantbruksuniversitet (SLU) av Katarina Buhr och Anna Hermansson i samverkan med Nutek, jämförs det statliga stödet till små och medelstora företags arbete med miljöoch

Läs mer

Nya sundbyberg.se. Webbkoncept. v1.0, Sundbyberg där staden är som bäst

Nya sundbyberg.se. Webbkoncept. v1.0, Sundbyberg där staden är som bäst Nya sundbyberg.se Webbkoncept v1.0, 2012-04-04 Innehåll 1. Introduktion 2. Webbstrategi 3. Prioriteringar 4. Innehåll startsida 5. Tonalitet 6. Form 7. Interaktivitet och dialog 8. Sociala medier 9. Sökfunktion

Läs mer

17. DEN OSYNLIGA FRIA WEBBEN EXEMPEL

17. DEN OSYNLIGA FRIA WEBBEN EXEMPEL Del 2 RESURSERNA 13. Kartan, kompassen och verkligheten... 58 14. Den färska webben exempel... 63 15. Den försvunna webben exempel... 69 16. Den fria synliga webben exempel... 72 17. Den osynliga fria

Läs mer

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas

Läs mer

Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001

Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, , 15 oktober 2001 Taggning av räkneord som årtal eller andra räkneord, Språkteknologi 2D1418, HT 01 Jonas Sjöbergh, 761029-0178, jsh@nada.kth.se 15 oktober 2001 1 Bakgrund 1.1 Kort om taggning Taggning innebär att man ger

Läs mer

Vad är SEO? Topp 10 SEO handlar om att förenkla för sökmotorerna att förstå vad din webbplats handlar om

Vad är SEO? Topp 10 SEO handlar om att förenkla för sökmotorerna att förstå vad din webbplats handlar om SEO en stilguide Vad är SEO? Har du sprungit på begreppet SEO? Kanske har någon försökt förklara vad det är utan att lyckas fullt ut. Du har förstått att din webbplats behöver SEO för att bli bra, men

Läs mer

PubMed (Medline) Fritextsökning

PubMed (Medline) Fritextsökning PubMed (Medline) PubMed är den största medicinska databasen och innehåller idag omkring 19 miljoner referenser till tidskriftsartiklar i ca 5 000 internationella tidskrifter. I vissa fall får man fram

Läs mer

Guide. 10 steg till en lyckad dwords annonsering

Guide. 10 steg till en lyckad dwords annonsering Guide 10 steg till en lyckad dwords annonsering HUR HAMNAR MAN HÖGT PÅ GOOGLE? Det är en vanlig fråga bland många företag idag. Med tanke på att 96% av svenskar använder sig av Google i första hand när

Läs mer

LINKÖPINS UNIVERSITET. SimSum. En studie om automatisk sammanfattning och omskrivning av texter. Sammanfattning

LINKÖPINS UNIVERSITET. SimSum. En studie om automatisk sammanfattning och omskrivning av texter. Sammanfattning LINKÖPINS UNIVERSITET SimSum En studie om automatisk sammanfattning och omskrivning av texter Sammanfattning Anton Jeppsson Samuel Johnson Erik Karlsson Christofer Malmberg Victor Sjölin Åsa Svensson 2012-05-31

Läs mer

Lathund till PsycINFO (OVID)

Lathund till PsycINFO (OVID) Lathund till PsycINFO (OVID) PsycINFO innehåller referenser till artiklar inom psykologi och angränsande ämnesområden, som medicin, psykiatri, sociologi m.m. Databasen indexerar tidskrifter från 1806 och

Läs mer

PubMed gratis Medline på Internet 1946-

PubMed gratis Medline på Internet 1946- Klicka på 1. SÖK i E-biblioteket 2. Flik Databaser 3. PubMed PubMed gratis Medline på Internet 1946- www.ebiblioteket.vgregion.se Fritextsökning Skriv in de ord du vill söka på (AND läggs automatiskt in

Läs mer

Sociala medier och Flickr som marknadsföring Essä i kursen Digitala Distributionsformer Högskolan Väst Av: Nicklas Johansson

Sociala medier och Flickr som marknadsföring Essä i kursen Digitala Distributionsformer Högskolan Väst Av: Nicklas Johansson Sociala medier och Flickr som marknadsföring Essä i kursen Digitala Distributionsformer Högskolan Väst Av: Nicklas Johansson Innehåll Sammanfattning..s.1 Inledning.s.2 Beskrivning.s.2,3 Diskussion...s.4,5

Läs mer

Nya EU-förordningar. Manual om hur man använder EUR-Lex avancerade sökfunktion

Nya EU-förordningar. Manual om hur man använder EUR-Lex avancerade sökfunktion Nya EU-förordningar Manual om hur man använder EUR-Lex avancerade sökfunktion Kom igång Gå till EUR-Lex webbplats: http://eur-lex.europa.eu/homepage.html?locale=sv. Gå till sökrutan i mitten av sidan på

Läs mer

WEBBLÄTTLÄST SLUTRAPPORT

WEBBLÄTTLÄST SLUTRAPPORT Arne Jönsson 2012-07-23 WEBBLÄTTLÄST SLUTRAPPORT 1. Inledning Inom projektet WebbLättLäst har vi utvecklat teknik för att automatiskt rangordna svenska webbsidor efter hur läsbara de är. Detta gör att

Läs mer

Komma igång med det nya AdWords-gränssnittet En guide till ändringar av kampanjhanteringen

Komma igång med det nya AdWords-gränssnittet En guide till ändringar av kampanjhanteringen Komma igång med det nya AdWords-gränssnittet En guide till ändringar av kampanjhanteringen Inledning och översikt Tack vare er användare har AdWords växt. Sedan 2005 har vi lagt till över 20 verktyg och

Läs mer

Kort om World Wide Web (webben)

Kort om World Wide Web (webben) KAPITEL 1 Grunder I det här kapitlet ska jag gå igenom allmänt om vad Internet är och vad som krävs för att skapa en hemsida. Plus lite annat smått och gott som är bra att känna till innan vi kör igång.

Läs mer

Arbeta med Selected Works en lathund

Arbeta med Selected Works en lathund Arbeta med Selected Works en lathund Att redigera din egen Selected Works-sida Ta fram din sida och logga in via My Account längts ner på sidan. Klicka på Edit My Site för att redigera sidan. Gå nu vidare

Läs mer

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek Informationssökning - att söka och finna vetenskapliga artiklar! Mikael.Rosell@liu.se 013-282248 Linköpings Universitetsbibliotek 2 FEM saker ni SKA ta med er härifrån! Välja ut och använda relevanta databaser

Läs mer

YAHOO! SEARCH MARKETING Tips för att öka trafiken

YAHOO! SEARCH MARKETING Tips för att öka trafiken YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova

Läs mer

Cinahl sökguide. Enkel sökning. Ämnesordsökning

Cinahl sökguide. Enkel sökning. Ämnesordsökning Medicinska fakultetens bibliotek, Lund. Monica Landén. 2014-02-20 Cinahl sökguide Enkel sökning Select a Field (optional) sökningen görs som keyword i titel, abstract och subject heading (ämnesord). Genom

Läs mer

AI inom Ämnesinriktad Webcrawling

AI inom Ämnesinriktad Webcrawling AI inom Ämnesinriktad Webcrawling Anders Österholm Kogvet 2 Linköpings Universitet andos561@student.liu.se Abstract En förutsättning för Internets användbarhet är att det går att söka efter information

Läs mer

Synliggör din forskning! Luleå universitetsbibliotek

Synliggör din forskning! Luleå universitetsbibliotek Synliggör din forskning! Luleå universitetsbibliotek Varför denna guide? Att maximera forskningens synlighet och genomslag blir allt viktigare inom akademin där allt tuffare konkurrens råder och där forskare

Läs mer

Sök artiklar i PubMed: handledning

Sök artiklar i PubMed: handledning Sök artiklar i PubMed: handledning 1) Börja med att utifrån ditt ämne identifiera lämpliga söktermer. Ex. Du vill hitta artiklar om riskfaktorer i relation till rökning och lungcancer. 2) Eftersom PubMed

Läs mer

Vad innebär det att vara datadriven?

Vad innebär det att vara datadriven? TIPS OCH VERKTYG FÖR DATADRIVEN E-HANDEL Vad innebär det att vara datadriven? Ett datadrivet företag mäter hela tiden och följer upp resultatet inte bara ekonomiskt utan även utifrån KPI:er som anses viktiga

Läs mer

DIGITAL MARKNADSFÖRING. SEO - SEA - Google AdWords - Google Analytics

DIGITAL MARKNADSFÖRING. SEO - SEA - Google AdWords - Google Analytics DIGITAL MARKNADSFÖRING SEO - SEA - Google AdWords - Google Analytics Uppstartsmöte 1 Tillsammans tar vi en diskussion kring din webbplats och vilka mål ni har med er digitala marknadsföring. Dessa mål

Läs mer

ARBETSMATERIAL. Intern webbsök på Göteborgs universitet

ARBETSMATERIAL. Intern webbsök på Göteborgs universitet Intern webbsök på Göteborgs universitet Webbprojektet - Ny webb Nytt webbverktyg (Drupal) Ny söktjänst (Elasticsearch) Ny externwebb Ny kurs- och programkatalog (PIM) Ny webborganisation m.m Ny Personal-

Läs mer

Webbplats analys cite4me.org

Webbplats analys cite4me.org Webbplats analys cite4me.org Genereras på Maj 03 2019 15:50 PM Ställningen är 36/100 SEO Innehåll Titel Reference Maker and Citation Machine - Generator: Amazing Tool for Effortless Referencing Längd :

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:

Läs mer

tidskrift för politisk filosofi nr årgång 9

tidskrift för politisk filosofi nr årgång 9 tidskrift för politisk filosofi nr 1 2005 årgång 9 Bokförlaget thales om den personliga egalitarismen om den personliga egalitarismen replik till rabinowicz Jonas Gren, Niklas Juth och Ragnar Francén i

Läs mer

ATT SKRIVA FÖR WEBBEN

ATT SKRIVA FÖR WEBBEN ATT SKRIVA FÖR WEBBEN Det kan vara svårt att skriva en text till en hemsida. Här följer en guide som kan hjälpa dig att få till texten. Vi börjar med att skapa en bastext som sedan ligger till grund för

Läs mer

Akademiska söktjänster - En jämförande studie av Google Scholar, MEDLINE och Web of Science

Akademiska söktjänster - En jämförande studie av Google Scholar, MEDLINE och Web of Science KANDIDATUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID INSTITUTIONEN BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2012:32 Akademiska söktjänster - En jämförande studie av Google Scholar,

Läs mer

Avtalsform Ramavtal & enstaka köp Namn Söktjänst

Avtalsform Ramavtal & enstaka köp Namn Söktjänst Sveriges Radio AB Utvärdering Ekonomiskt mest fördelaktigt Helt anbud Avtalsform Ramavtal & enstaka köp Namn Söktjänst Diarie SR 1332 Ansvarig upphandlare Catherine Finér Detta dokument är en kopia på

Läs mer

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data 5HVLVWHQVWDEHOO Tack för att du valde programmet 5HVLVWHQVWDEHOO! Vi hoppas att programmet ska vara till stor hjälp i ditt arbete. Har du synpunkter på programmet är du mycket välkommen att höra av dig

Läs mer

Lathund för Lifos-systemet

Lathund för Lifos-systemet BFD12 080926 1 (10) 2012-02-03 Lathund för Lifos-systemet Beskrivning av förändringar i det nya systemet som lanserades i september 2011 Innehåll Informationsinnehållet... 2 Behörighet... 2 Ny struktur...

Läs mer

BLOGG PETER WALTONEN @ DPI.FI

BLOGG PETER WALTONEN @ DPI.FI BLOGG PETER WALTONEN @ DPI.FI WordPress är en väldigt användbar nätportal, som kan användas både som blogg men även för att bygga upp din hemsida på nätet. Verktygen är lätta att använda och det erbjuds

Läs mer

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket. PubMed lathund 2018-07-19 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på Du kan välja hur träffarna ska sorteras. T ex efter Best Match eller

Läs mer

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb.

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb. Att söka information Marie Gustafsson marie.gustafsson@hb.se Dagens föreläsning: Att söka vetenskaplig litteratur Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga

Läs mer

Pass 2: Datahantering och datahanteringsplaner

Pass 2: Datahantering och datahanteringsplaner Pass 2: Datahantering och datahanteringsplaner Checklista för datahanteringsplaner Att utveckla en datahanteringsplan för ett projekt är inte alltid en enkel uppgift. Det finns många detaljer som man åtminstone

Läs mer

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10 Källkritik - om att kritiskt granska och värdera information Ted Gunnarsson 2014-04-10 Källkritik - Innehåll Vad är källkritik? Varför källkritik? De källkritiska kriterierna Exempel på källkritiska frågor

Läs mer

Synkronisering av kalenderdata

Synkronisering av kalenderdata Datavetenskap Jonas Lindelöw, Richard Löfberg Sten Hansson Bjerke, Anders Friberg Synkronisering av kalenderdata Oppositionsrapport, C/D-nivå 2006:07 1 Sammanfattat omdöme av examensarbetet Vi tycker att

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata

Läs mer

SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer

SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer SU publikationer och ESI klasser: citeringsgrad och andel högt citerade publikationer Per Ahlgren, avd. för e-resurser, Stockholms universitetsbibliotek 1 Inledning I föreliggande rapport redogörs för

Läs mer

Tentamen 2016-01-13. Marco Kuhlmann

Tentamen 2016-01-13. Marco Kuhlmann TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga

Läs mer

» RSS - Bygg din egen RSS!

» RSS - Bygg din egen RSS! 1 of 5 29.4.2006 18:46» RSS - Bygg din egen RSS! Sett en orange liten skylt med vita bokstäver som antingen sagt XML eller RSS nyligen utan att direkt koppla varför den finns där? Du är antagligen inte

Läs mer

Uppdaterad / EM. The Cochrane Library

Uppdaterad / EM. The Cochrane Library The Cochrane Library Vad är The Cochrane Library? En samling databaser med syfte att samla och kvalitetsvärdera kliniska studier om effekterna av olika behandlingar. Cochrane består av två databaser Cochrane

Läs mer

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4 Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa

Läs mer

Vad är Internet? Innehåll: Inledning Vad är Internet? Om du kan Internetadressen Söka på Internet Länklistor Övningar Repetition

Vad är Internet? Innehåll: Inledning Vad är Internet? Om du kan Internetadressen Söka på Internet Länklistor Övningar Repetition Vad är Internet? Innehåll: Inledning 1 Vad är Internet? 2 Om du kan Internetadressen 3 Söka på Internet 6 Länklistor 9 Övningar 10 Repetition 11 Kortfattad repetition 9 6 Inledning Välkommen till Nyfiken

Läs mer

Manual HSB Webb brf 2004 03 23

Manual HSB Webb brf 2004 03 23 TERMINOLOGI I Polopoly används ett antal grundläggande begrepp för publicering och hantering av information, eller innehåll som det också benämns. Nedan följer en kort genomgång av denna grundläggande

Läs mer

Algoritmer: Från kaos till ordning? Bild från Pixabay

Algoritmer: Från kaos till ordning? Bild från Pixabay Algoritmer: Från kaos till ordning? Bild från Pixabay Centralt innehåll i SO, årskurs 7-9 Lektionen kommer beröra följande centrala innehåll: Olika slags medier, deras uppbyggnad och innehåll, till exempel

Läs mer

Automatisk textsammanfattning

Automatisk textsammanfattning Språkteknologi 2001-10-14 Nada Kungliga Tekniska högskolan Automatisk textsammanfattning Per Karefelt (d98-pka) Marcus Hjelm (d98-mhj) Sammanfattning (manuell) Denna rapport belyser en del av de problem

Läs mer