Automatisk synonymgenerering med Word2Vec för query expansion inom e-handel

Storlek: px
Starta visningen från sidan:

Download "Automatisk synonymgenerering med Word2Vec för query expansion inom e-handel"

Transkript

1 Teknik och samhälle Datavetenskap och medieteknik Examensarbete 15 högskolepoäng, grundnivå Automatisk synonymgenerering med Word2Vec för query expansion inom e-handel Automatic synonym generation with Word2Vec for query expansion within E-Commerce Kemal Kojic Emil Petersson Examen: kandidatexamen 180 hp Huvudområde: datavetenskap Program: systemutvecklare Datum för slutseminarium: Handledare: Bengt Nilsson Examinator: Jesper Larsson

2

3 Sammanfattning I detta arbete undersöks hur väl automatisk synonymgenerering genom maskininlärningsmetoden Word2Vec, som tränats över en datamängd från Google News på hundra miljarder ord, lämpar sig för query expansion inom ehandel. Detta görs genom användning av produkt- och eventdata från ett välkänt modebolag där synonymer genereras utifrån söksträngar som loggats i eventdata genom olika metoder som i sin tur bildar synonymböcker som används i framtida sökningar med hjälp av query expansion. För att kunna besvara studiens forskningsfrågor utförs först en kvantitativ analys. Denna analys utförs på data som matchade köp, produktträffar, no-hits och söktid. Information om denna data genereras utifrån en söksimulator som simulerar loggade händelser från användarsessioner i ett ehandelssystem. Därefter filtreras de genererade synonymböckerna genom att ta bort synonymer som är kopplade till de söksträngar som producerat ett sämre resultat i simuleringen med synonymer, än utan. För att validera vårt resultat från den kvantitativa analysen utförs även en kvalitativ analys på skillnaden i sökresultatet som de olika metoderna tar fram, där vi undersöker vad det är för produkter som tas fram med hjälp av synonymerna, för att undersöka dess relevans. Våra tester uppvisar att ett lägre tröskelvärde leder till fler produkträffar och minskar antalet no-hits. Antalet produktträffar ökades med mellan 4%-10%, no-hits reducerades med mellan 11%-22%. I de fall där söksträngen har tilldelats bra synonymer påverkas relevansen av produkterna positivt då fler relevanta produkter dyker upp i sökresultatet. I de fall där söksträngen har tilldelats mindre bra synonymer påverkas relevansen av produkterna negativt då vissa irrelevanta produkter dyker upp i sökresultatet som användaren antagligen inte vill se i sitt sökresultat. I alla fall där de automatiskt genererade synonymerna används så befinner sig majoriteten av alla köpta produkter i den första halvan av sökresultatet, däremot minskar antalet köpta produkter på den första platsen i sökresultatet i alla fallen.

4

5 Abstract In this thesis, we examine automatic synonym generation through the use of the machine learning algorithm Word2Vec that has been trained using a Google News data set containing a hundred million words to find out if it is suitable for query expansions in e-commerce. This is examined through the use of product- and event data from a wellknown fashion company where synonyms are generated from search-queries that have been logged in the event data through different methods, resulting in thesaurus that are used in future searches with the use of query expansions. In order to answer the thesis research question, a quantitative analysis is performed. This analysis is performed on data such as matched payments, product matches, no-hits and search time. Information about this data is generated through a search simulator that simulates logged events from user sessions in a e-commerce system. The generated thesaurus are later filtered through the removal of synonyms that are connected to search queries whose results have produced worse results than the results without synonyms. In order to validate our results from the quantitative analysis a qualitative analysis is also performed on the difference of the search result that the different methods produce. In this qualitative analysis we research what type of products that the added synonyms produce in order to understand the relevance of the search query. Our tests show that the lower the threshold is, the higher the number of product hits and the lower the number of no-hits. Our tests shows that the number of product hits was increased by between 4%-10%, the number of no-hits was reduced by 11%-22%. In all of the tests using automatically generated synonyms, the results show that the majority of the purchased products are presented in the first half of the search result, however, in all of the tests using automatically generated synonyms the number of purchases in the first position of the search result was reduced.

6

7 Innehåll 1 Inledning Mål och Syfte Frågeställning Avgränsningar Tidigare forskning Query Expansion Text mining och synonymgenerering Word2Vec 4 4 Metod Systematisk litteraturstudie Produkt- och eventdata Dataformatering Synonymgenerering Söksimulator Filtrering av de genererade synonymböckerna Implementation Metoddiskussion Resultat Utan synonymer Manuella synonymer Automatiska synonymer med 0.63 i cosine similarity Automatiska synonymer med 0.68 i cosine similarity Automatiska synonymer med 0.70 i cosine similarity Filtrerade synonymer Jämförelser mellan resultat Analys och diskussion Matchade Köp Produktträffar No-hits Genomsnittlig söktid Distribution av matchade köp Kvalitativ dataanalys Den filtrerade synonymboken Uppdagade problem och förslag på förbättring Slutsatser och vidare forskning 30 8 Bilagor Ordlista

8

9 1 Inledning I dagens internetsamhälle finns all världens information tillgänglig genom användandet av datorer, smartphones etc. På daglig basis används sökmotorer som t.ex. Google för att hitta olika typer av information, men även sökmotorer på hemsidor för att söka efter produkter eller tjänster. För att dessa sökmotorer skall producera ett resultat som tillfredsställer en användares informationsbehov används bland annat metoder för att utvinna kärnfull information ur större textmängder, till exempel för att associera textkällor till specika kategorier. Anledningen till detta är för att spara tid på att inte manuellt behöva läsa igenom stora samlingar text. Sådana metoder kan även användas för att utvinna synonymer utifrån textkällorna. Att använda automatiskt genererade synonymer för att utöka söksträngar har visats sig producera ett mer relevant sökresultat för förslag på dokument eller hemsidor som en användare kan tänkas leta efter [1, 2, 3]. Att formulera en söksträng som tar fram relevant information kan vara svårt. En användare är inte alltid helt hemtam i de domäner som informationsbehovet tillhör, och det kan därför ibland bli svårt att få ett system till att rekommendera det man faktiskt är ute efter. Domänkunskap kan tänkas vara viktigt för att söka efter information, eftersom valet av sökfras som ställs till systemet kan variera beroende på hur mycket kunskap man har inom domänen. Ett exempel på detta kan vara att en användare väljer att söka efter sökfraserna köksluckor och fronter där dessa två termer är synonymer i den domän de befinner sig i. Det kan därför tänkas att en användare vill få samma resultat oavsett vilken sökfras som söks efter då båda orden i detta fallet hör till samma produkt. Här ser vi möjligheten att undersöka hur en välanvänd metod för automatisk synonymgenerering påverkar sökresultatet inom e-handel. 1.1 Mål och Syfte Målet med denna studie är att utvärdera metoden Word2Vec för att se hur metodens synonymgenerering lämpar sig för att utöka söksfraser inom e-handel. Syftet med denna studien är att försöka förbättra processen för informationshämtning inom e-handel med hjälp av Word2Vec. Studien kommer alltså bidra till möjligtvis förbättrade sökmetoder som kommer att kunna användas av olika tjänster inom e-handel. 1.2 Frågeställning Vår studie ämnar att undersöka hur sökresultat inom e-handel påverkas av query expansion med hjälp av automatisk synonymgenerering genom Word2Vec, och utifrån detta har följande forskningsfrågor utformats: F1. Hur påverkas antalet träffar? F2. Hur påverkas no-hits? F3. Hur påverkas distributionen av tidigare köpta produkter i sökresultatet? F4. Hur påverkas relevansen av produkterna i sökresultatet? 1

10 1.3 Avgränsningar Vi har valt att avgränsa oss till att enbart använda oss utav engelska datamängder för synonymgenerering i form av Google News och eventdata. Detta har vi gjort eftersom datamängderna innehåller betydligt mycket mer data än de svenska motsvarigheterna och enligt Mikolov m. fl. [4] så förbättras synonymgenereringen av större datamängder. Dessutom är söksträngarna som används i arbetets tester enbart på engelska. För val av metod för synonymgenerering har vi valt att avgränsa oss till att endast använda Word2Vec som metod för synonymgenerering för att arbetet inte ska bli för stort. Vi valde en färdig implementation då vi inte fokuserar på att förbättra algoritmen utan vill istället se hur den lämpar sig för e-handelsdomänen. Vi har valt att avgränsa oss till att endast undersöka hur Word2Vec lämpar sig för query expansion inom mode. Motiveringen till detta är att den produkt- och eventdata som används för studien kommer från ett stort företag inom e-handelsindustrin som enbart säljer kläder, skor, accessoarer, smink etc. 2 Tidigare forskning Ett flertal problem har uppmärksammats inom effektivitet och resultat av sökningar efter olika typer av information. De problem som uppstår med de nuvarande metoderna är att de är begränsade i sina möjligheter till att hitta relevant information [1, 2, 5, 6]. Detta kan exempelvis bero på att ett söksystem utökar en söksträng med irrelevanta synonymer p.g.a. att systemet inte förstår en söksträngs kontext [7], möjligheterna att söka efter relevant information kan kräva en viss domänkunskap som t.ex. språk eller teknisk nivå [1, 6] eller att nuvarande metoder har begränsningar i sina möjligheter att modellera olika typer av associationer mellan ord [8, 9]. Att modellera både paradigmatiska- och syntagmatiska associationer kan vara viktigt för att fylla en användares behov, eftersom att ett visst ord har en specifik betydelse när en användare formulerar en söksträng [9]. Syntagmatiska relationer är ord som ofta dyker upp i en viss sekvens och tillsammans skapar en viss innebörd, medan paradigmatiska relationer är sådana ord som kan ersätta varandra utan att meningens innebörd ändras. Ett exempel på en syntagmatisk relation skulle kunna vara alla ord som bidrar till kontexten i meningen En hund ramlade ned från en stol. En paradigmatisk relation i denna mening hade kunnat vara att man bytte ut ordet hund mot katt eller stol mot säng som hade bidragit till meningen En katt ramlade ned från en säng. 2.1 Query Expansion Flera angreppssätt har tagits fram i tidigare forskning för att automatiskt försöka lösa bland annat problemen som nämnts ovan. Det som det rådande forskningsläget har gemensamt är att man i samtliga fall försöker utöka söksträngar för att på så sätt kunna förbättra och effektivisera sökresultat genom att utöka räckvidden för sökning men också att enbart ta fram ett sökresultat som faktiskt är relevant, och på så sätt få en bättre precision [7, 5, 10, 6, 1, 2, 11]. Precision innebär antalet relevanta resultat som returnerats genom det totala antalet returnerade resultatet [5]. Räckvidden i detta fallet innebär antalet relevanta resultat som returnerats genom totala antalet relevanta information som 2

11 finns i datamängden och kallas ofta recall i tidigare forskning [5]. Ett flertal studier menar att en viktig del av utökningen är den förbehandling man gör med den ursprungliga söksträngen [7, 2, 8, 3]. Denna förbehandling brukar utföras för att sålla ut sådan text som inte anses vara relevant för den datamängd man ska använda. Denna irrelevanta text kan bestå av speciella tecken som exempelvis används i XML- och JSONfiler, vanligt förekommande ord som tas bort med hjälp av metoder så som TFIDF och stop-word removal och filtrering av olika typer av ordklasser med hjälp av part of speech tagging och stemming. På detta sätt förhindrar man att ord som exempelvis en och ett som förekommer extremt många gånger i texter läggs till i utökningen av söksträngen. 2.2 Text mining och synonymgenerering För att skapa förutsättningar för att hitta ord eller termer som är relevanta för en söksträng, kan automatisk text mining utföras på stora källor av text för att skapa en synonymordbok. Dessa källor kan vara stora delar av Wikipedia [3], Google News [10, 11], Microsoft Research Paraphrase Corpus [8], Yelp betyg [8], hemsidor som har blivit förbehandlade så att de endast innehåller ren text [2], läkarjournaler [6], religiösa skrifter [1] m. fl. Den framtagna synonymordboken används i de flesta fallen för att förlänga söksträngar med länkade ord eller fraser med förhoppningen av att förbättra relevansen och räckvidden för sökresultatet [7, 5, 10, 6, 1, 2, 11], men även för att jämföras med manuellt skapade synonymer utifrån olika texter [3]. Att skapa förutsättningen för att kunna beräkna likheten mellan ord utifrån dessa enorma källor av text kan göras genom olika tillvägagångssätt. Det som generellt sätt görs är att man undersöker hur ofta olika ord dyker upp tillsammans i texterna som analyseras [1, 2, 3, 6]. Att generera synonymerna för att förlänga söksträngar kan göras på olika sätt. POST (Part of Speech tagging) använder sig av kontexten för att kunna tagga olika ordklasser i en text. Detta görs eftersom samma ord kan ha olika betydelser i olika kontexter, som exempelvis building som både kan vara ett verb och ett substantiv, och vikten läggs på hur ett ord används, snarare än vad ordet betyder [7]. Topic modeling används för att gruppera ord och tilldela dem kategorier som de tillhör för att lättare hitta liknande information [6]. Kluster av synonymer används även för query expansion. Sådana kluster kan genereras från lexikala synonymdatabaser som WordNet och kan innehålla flera nivåer av synonymer [2]. Metoder för Vector Space Model(VSM) är populära inom den tidigare forskningen. Dessa metoder genererar någon form av datastruktur som består av vektorer som representerar olika ord [3, 10, 1, 11]. Genom VSM delas texterna upp i matriser innehållandes olika ord, och genom att stega igenom dessa matriserna kan man beräkna hur ofta olika ord tenderar att uppstå tillsammans. Några av de metoder som är värda att nämna är Word2Vec och Latent Dirichlet Allocation (LDA). LDA är en typ av topic model-metod som används för att förklara varför vissa delar av den data man arbetar med är lika. Exempelvis kan en bit av en text som handlar om katter hamna under katt relaterat och kan på så vis användas för att sedan visa denna text som resultat när en användare söker efter kattrelaterade sökfraser [1, 6]. Word2Vec är en samling av modeller som genom neurala nätverk omvandlar text till vektorer. Vektorerna tränas genom att metoden försöker beräkna sannolikheten för att ett visst ord skall dyka upp baserat på orden runt 3

12 om kring, och detta görs genom hela texten som analyseras [11]. För att sedan beräkna hur lika, eller olika orden är, så utförs ytterligare beräkningar för att utifrån dessa vektorer dra slutsatser om vilket eller vilka ord som verkar vara mest lika det ord eller de termer som söktermen ursprungligen bestod av [3]. Ett flertal studier använder även vanliga synonymordböcker i sin process. WordNet, som är en lexikal databas och bland annat används för synonymer, är den källa som använts mest i den tidigare forskningen som undersökts. Synonymerna från WordNet används oftast i kombination med en metod för text mining, dels för query expansion men även för att beräkna likheten mellan meningar [5, 2, 8]. Med hjälp av text mining och query expansion uppvisar de framtagna metoderna ett bättre sökresultat i precision och recall [3, 5, 6, 1, 2]. Resultatet påverkas av kvalitén på synonymordboken som genereras, och det är därför viktigt att lägga fokus på metoden för synonymgenering [1]. Den tidigare forskningen visar ett forskningsgap av automatisk synonymgenerering för query expansion inom e-handel, men baserat på det uppvisade resultatet i den tidigare forskningen kan det tänkas att dessa metoder även bör uppvisa ett bättre sökresultat inom e-handel. 3 Word2Vec Distribuerade representationer av ord innebär att ord representeras som vektorer innehållandes reela tal. Många metoder använder sig utav en sådan representation av ord eftersom det har hjälpt träningsalgoritmer att uppnå bättre resultat genom att gruppera liknande ord [4]. Två av de mer kända metoderna som även har setts användas i tidigare forskning är Latent Semantic Analysis (LSA) och Latent Dirichlet Allocation(LDA). Tomas Mikolov m. fl. menar att tidigare forskning har bevisat att framtagningen av distribuerade representationer av ord genom neurala nätverk bidrar till en bättre prestation än tidigare nämnda metoderna [12]. Med bättre prestation menar de att neurala nätverk ger bättre resultat än LSA överlag och behöver inte använda lika mycket datorkraft på större datamängder till skillnad från LDA. Deras förslag på en ny implementation genom neurala nätverk är vad de kallar Word2Vec och är även den metod som kommer att användas i denna studie. Word2Vec kan användas för att mäta semantiska och syntaktiska likheter mellan ord. Exempel på semantiska likheter mellan ord skulle kunna vara likheten mellan Sverige och Stockholm jämfört med Danmark och Köpenhamn eller Sverige och Krona jämfört med Storbritannien och Pund. Word2Vec kan alltså dra slutsatser om semantiska likheter genom algebraiska operationer så som vektor( man ) - vektor( kung ) + vektor( kvinna ) som ska resultera i vektor( drottning ) om dessa ord förekommit tillräckligt ofta när man har tränat sin datamängd. Syntaktiska likheter är likheter mellan ord så som superlativ, plural, motsatser osv. Alltså exempelvis bred och bredast, mus och möss och bra och dålig. Dessa likheter beräknas genom att identifiera hur långt avstånd det är mellan de två olika vektorernas vinklar, något som kallas cosine similarity. Word2Vec erbjuder två olika arkitekturer för inlärning av distribuerade representationer av ord. Continuous Bag-of-Words Model(CBOW) och Continous Skip-gram Model [12]. CBOW försöker att förutspå vilket ord som borde sättas in i en specifik kontext. Exempelvis kan man befinna sig i kontexten Det är väder idag och CBOW försöker 4

13 då förutspå vilket ord det är vi letar efter. Har vi tränat tillräckligt mycket data kan vi få ett resultat som varmt eftersom att det ordet har förekommit flest gånger inom liknande kontexter. Continous Skip-gram tar emot ett ord som indata och försöker placera ut detta ord i en kontext. Ett exempel på detta skulle vara att man får ordet varmt som inmatning och då försöker förutspå den mest lämpliga kontexten för detta ord. Detta skulle kunna vara Det är väder idag. CBOW är snabbare än Skip-Gram men Skip- Gram presterar bättre när man arbetar med ord som inte förekommer väldigt ofta. I båda arkitekturerna används context-window som en parameter för hur många ord man ska hålla reda på innan och efter det ord man arbetar med. Mikolov m.fl. [4] menar att 5 ord innan och efter det ordet man arbetar med är ett bra värde på context-window när man ska träna sin datamängd. En visualisering på de två olika arkitekturerna kan hittas i figur 1. Figur 1: Jämförelse av CBOW och Continous Skip-gram För att träna sin data med hjälp av Word2Vec så används antingen Hierarchical Softmax eller Negative Sampling. Negative Sampling väljer ut ett ord ifrån ett specificerat antal ord som kontext och försöker hitta ett annat ord som ofta dyker upp tillsammans med det ordet man arbetar mot. När en sådan matchning har hittats så bildar dessa två orden ett par med värdet 1. Därefter tar man slumpmässigt fram k ord ifrån datamängden och bildar par med det ord vi arbetar mot där k representerar antalet slumpmässigt utvalda ord man väljer att ta fram. Dessa paren sätts sedan till 0. Enligt Mikolov m.fl. [4] är 5-20 slumpmässigt utvalda ord är bra värde för mindre datamängder medan större datamängder inte behöver mer än 2-4 stycken slumpmässigt utvalda ord. Om man exempelvis hade arbetat med meningen Jag gillar att äta flingor till frukost. med fokus på ordet äta och k hade satts till 3 så hade resultatet av negative sampling kunnat se ut som i följande tabell. 5

14 Tabell 1: Exempel på Negative Sampling för Jag gillar att äta flingor till frukost. Kontext Ord Mål Äta Flingor 1 Äta Kung 0 Äta Hund 0 Äta Att 0 Hierarchical Softmax använder sig av ett binärt träd där löven representerar alla ord som finns i den datamängd man arbetar i och alla inre noder representerar sannolikhet. Med hjälp av detta binära träd kan man sedan beräkna sannolikheten av att ett ord förekommer i liknande kontexter som ett annat. I Word2Vec använder sig Hierarchical Softmax av ett binärt huffmanträd för att dessa tilldelar korta koder för frekventa ord som resulterar i snabbare träning av datamängden [4]. Ett problem med stora datamängder av text är att de mest frekventa orden som dyker upp ofta är ord som inte är lika viktiga som andra ord. Dessa ord kan dyka upp flera miljontals gånger. Detta kan exempelvis bidra till att kopplingar som hund och valp inte får lika bra likhetsbedömning som exempelvis hund och en. För att förhindra att ord som dessa ska vinna över ord som vi anser vara mer intressanta så använder vi oss av subsampling i Word2Vec. Detta innebär att vi inte hanterar dessa högt förekommande orden på samma sätt som de mer intressanta orden och därför löser vi dessa problem. Mikolov m.fl. [4] menar att ett sumbsampling värde på runt 10 5 är ett bra värde att använda för träningen av datamängden. 4 Metod 4.1 Systematisk litteraturstudie För att samla data och information om det rådande forskningsläget som kommer att stå till grund för denna studie har en systematisk litteraturstudie utförts. Denna systematiska litteraturstudie utförs för att vi ska hitta relevant information inom forskningsområdet och inte bara välja ut artiklar som passar oss. Söksträngen som använts i sökningsprocessen av artiklar delades in i två sektioner, med de boolska operatorerna AND mellan de två sektionerna och OR mellan var ord i sektionerna då vi ser att antingen eller kan ta fram relevant information, där den ena sektionen representerade text- och/eller data mining och den andra sektionen representerade synonymgenerering. Sökningarna utfördes i databaserna IEEE och ACM då dessa anses vara relevanta inom området datavetenskap och således relevanta för denna studie. För att säkerhetsställa att forskningen som står till grund för arbetet är aktuell filtrerades resultatet till att enbart visa artiklar från 2011 och framåt, samt endast konferens- och journalartiklar. Söksträngen som användes i litteraturstudien såg ut som följande: (( text mining OR data mining ) AND (synonym* OR thesaurus OR syntagmatic OR paradigmatic )). 4.2 Produkt- och eventdata Den data som används för denna studien kommer från ett välkänt företag inom mode och e-handel. Anledningen till att denna data används är för att datamängden innehåller 6

15 mycket information och för att företaget som äger den har gett godkännande om att den får användas inom forskningssyfte. Den består huvudsakligen av en produktkatalog och eventloggar. Två olika datamängder används av event loggade på separata dagar. Eventloggarna består av event som innehåller information som exempelvis söksträngar, antal sökträffar, information om köp som exempelvis hur många produkter som köpts och vilka positioner i sökresultatet som de köpta produkterna har befunnit sig i. Av alla event som finns i datamängderna så innehåller den första datamängden event som är sökningar, och den andra Sökfraserna från den första datamängden kommer att användas för synonymgenerering. Produktkatalogen innehåller alla produkter, och data om produkterna, som fanns till salu under den dagen som eventen loggades. Produktdatan innehåller information som exempelvis titel, produktbeskrivning, produktgrupp, storlekstyper m.m. 4.3 Dataformatering För att förbereda datan för simulatorn som används för att utvärdera metoden i ett senare steg så tranformeras datamängden innehållande all produktinformation då produktkatalogen är anpassad för en äldre version av simulatorn. Produktkatalogen representeras i form av en XML-fil som behöver läsas in och struktureras om fullständigt innan data kan skrivas till en ny fil. Detta görs genom en Java-implementation eftersom att simulatorn som används är sedan tidigare implementerad i Java, och blir därför lättare att integrera med. Java-implementationen skapar upp den nya filstrukturen som sedan fyller noderna med data från den tidigare produktkatalogen. All produktinformation bevaras under processen och endast strukturen förändras. 4.4 Synonymgenerering Synonymerna som används för att utvärdera metoden och besvara forskningsfrågorna genereras utifrån loggad eventdata. För framtagandet av synonymerna till denna eventdata används färdigtränade vektorer som tränats genom Word2Vec utav skaparna till metoden. Vektorerna har tränats på en datamängd från Google News innehållandes 100 miljarder ord, och resulterade i 300 vektordimensioner som representerar 3 miljoner unika ord och fraser. Dessa vektorer tränades med hjälp av CBOW-arkitekturen med 300 vektordimensioner, en context window på 5, sample size på 10 5 och med hjälp av träningsalgoritmen negative sampling. Som tidigare nämnts i detta arbete så anses de valda värdena för parametrarna vara optimala för datamängdens storlek [4]. Träningen resulterar i de färdigtränade vektorerna som består av 3 miljoner ord och fraser kopplade till ord med semantiska likheter. Eftersom att Mikolov m.fl. anser att stora datamängder med många dimensioner presterar bättre valdes denna färdigtränade datamängd då det var den största vi kunde hitta [12]. Söksträngarna från eventdatan används för att ta fram synonymerna som används för studiens experiment. För att göra detta bearbetas söksträngarna på två olika sätt. I det första skedet delas söksträngen upp ord för ord, och i det andra skedet delas orden i söksträngen upp parvis enligt ordningen de uppstår. Anledningen till att vi delade upp det på detta viset är för att det engelska språket har många särskrivna ord. Ett exempel på detta hade varit det svenska ordet fotbollsskor som i engelskan istället hade hetat football shoes. Tabellerna nedan illustrerar exempel på hur söksträngar bearbetas: 7

16 Tabell 2: Bearbetning av söksträngen Black Leather Jacket Black Leather Jacket Ord Fraser Black Black Leather Leather Leather Jacket Jacket Tabell 3: Bearbetning av söksträngen Men Sporting Sweatshirt Men Sporting Sweatshirt Ord Fras Men Men Sporting Sporting Sporting Sweatshirt Sweatshirt När söksträngen har behandlats påbörjas synonymgenereringen. För varje ord och/eller fras genereras nio olika synonymfiler med respektive tröskelvärde på 0.63, 0.68 och 0.70 i cosine similarity. För varje tröskelvärde sparas de 5, 10 och 100 närmsta synonymerna i separata filer. Motiveringen till att olika antal synonymer väljs är för att undersöka huruvida man kan tjäna på att hämta ett färre antal synonymer för ett lägre tröskelvärde, alternativt att hämta ett större antal synonymer för ett högre tröskelvärde. När synonymerna genereras så hämtas max det specificerade antalet, oavsett om det finns fler synonymer som matchar kriteriet för tröskelvärde. I vissa fall händer det att vissa ord vars kopplade synonymer som har låg cosine similarity faktiskt kan anses vara bra synonymer trots deras låga cosine similarity. I fall som dessa vill man inte gå miste om dessa synonymerna då vi förlorar värdefull information på detta vis. På samma sätt kan vissa ord ha flertalet synonymer som anses vara bra och därför har synonymer genererats utifrån olika tröskelvärden och olika antal synonymer. Risken med ett lägre tröskelvärde är däremot att få med synonymer som inte är relevanta för sökningen, detta försöks minimeras genom att endast hämta ett fåtal synonymer per ord, exempelvis 5. Respektive tröskelvärden och framtagning av antal synonymer valdes ut efter manuell granskning av automatiskt generade synonymer och representerar låg, medium och hög cosine similarity. De hämtade synonymerna skrivs sedan ut till en synonymbok för respektive tröskelvärde och antal hämtade synonymer. Synonymboken representeras av en XML-fil för att kunna användas i söksimularorn. Tabell 4: Antalet synonymer som genereras från Google News datamängd för respektive tröskelvärde Cosine Similarity Topp Topp Topp Manuellt framtagna synonymer används också för studiens experiment för att jämföra 8

17 hur mycket bättre eller sämre det blir att försöka generera synonymer automatiskt jämtemot manuellt. Dessa synonymerna är en del av e-handelsplattformen som studien baseras på och är framtagna utifrån produktkatalogen och e-handelstjänsten som används för studiens experiment. Eftersom synonymerna tillhör e-handelsplattformen är datamängden inte tillgänglig för allmänheten. Processen för att ta fram de manuella synonymerna har skett före detta arbete och är ingenting som har gjorts under studiens gång utan används endast för jämförelser. De manuella synonymerna tas fram utifrån produktdatan och är strukturerade så att de oftast går till en relevant produktkategori, snarare ett liknande ord. Ett exempel på detta är exempelfrasen Baseball Jacket som är kopplad med synonymen Outerwear. De manuella synonymerna är alltså subjektivt framtagna utifrån vad som anses vara lämpliga synonymer för produkterna i produktkatalogen. Processen för att manuellt ta fram synonymer är tidskrävande eftersom man måste ha personal som spenderar tid på att skriva ned ett stort antal synonymer istället för att ha det som en automatiserad process. Ett diagram på hur processen ser ut för metoden till experimentet finns att se i figur 2. Figur 2: Processen som körs från början till slutet av simuleringen. 4.5 Söksimulator Simulatorn som används för studiens experiment är utvecklad utifrån den e-handelsplattform som den produkt- och eventdata som används för studien kommer ifrån, och är utvecklad i forskningssyfte av företaget som äger e-handelsplattformen. E-handelsplattformen är en produkt som utvecklas och säljs av ett företag och eftersom att simulatorn är en del av plattformen så kommer simulatorn enbart att beskrivas övergripande i följande avsnitt. Simulatorn är sessionsbaserad och simulerar de loggade eventen för att ta reda på skillnader efter att exempelvis synonymer tillagts. Simulatorn använder riktiga sökningar som utförts av en användare och returnerar bland annat antalet produktträffar och köp 9

18 som användare gjort efter sökningen. Genom att tillsätta synonymer kommer resultatet för sökningarna troligtvis att förändras och förflytta sig. Ett exempel på detta kan vara att en kund sökt efter black leather jacket och köpt produkten på den 6e platsen i sökresultatet. När synonymerna sedan tillsätts utförs samma sökning i simulatorn och så utvärderar den om köpen som tillhör sökningen flyttats framåt eller bakåt i sökresultatet. Sökningarna som utförs returnerar relaterade produkter till sökord eller fraser från produktkatalogen. Simulatorn utför även automatisk korrigering av stavning eller pluralisering för sökningar, ett exempel på detta är att vid en sökning på ordet hoop utförs även sökningar för ordet hoops, samma princip används vid uppslag av synonymer. Synonymerna utnyttjas genom att simulatorn använder sig utav den booleska operatorn OR för att utföra sökningen med olika kombinationer av synonymer för originalsökfrasen och returnerar ett resultat för alla kombinationer. För att ta fram köprelaterade resultat använder sig simulatorn av händelser som är sammanhängande i sessioner. Simulatorn går igenom alla sökningarna som har lett till ett köp i en session och ökar Köpnivå när den hittar hittar ett köp av en produkt som befinner sig inom de första tjugo produkterna i sökresultatet. Anledningen till att en gräns dras efter de tjugo första platserna i sökresultatet är för att det generellt sett är den mängden produkter som visas upp per sida i sökresultatet, och att det är önskvärt att förbättra det sökresultat som användaren bemöts av direkt vid sökning. För att en användare skall kunna se de produkter som kommer efter de tjugo första platserna skulle exempelvis kunna kräva att användaren manuellt klickar sig vidare till nästa sida i sökresultatet, vilket är något som e-handelsplattformen vill minimera då det kan antyda att produkterna som befinner sig i toppen av sökresultatet är irrelevanta. I testerna som använder sig av synonymer förändras dessa värden när följande inträffar: En användare har exempelvis i en session använt söksträngen hoops men inte köpt en produkt från sökresultatet, därefter söker användaren med söksträngen basketball och köper en produkt från sökresultatet. Simulatorn observerar sedan om basketball finns som synonym till hoops, och om synonymerna matchar ökar matchade köp om produkten fanns bland de tjugo första produkterna i sökresultatet. 4.6 Filtrering av de genererade synonymböckerna För varje simulerad sökning producerar simulatorn även ett numeriskt värde, som representerar vilken effekt söksträngen har. Detta värde beräknas enligt följande formel: Figur 3: Formel för att beräkna hur bra en söksträng är. För att försöka förbättra synonymerna som genereras så används värdet som nämns ovan för att ta bort synonymer till söksträngar. Detta görs genom att jämföra effekten för en söksträng med synomer och utan synonymer, om söksträngens effekt är lägre med synonymer än utan, tas alla synonymer bort enligt samma sätt som de genererats. Detta utförs på synonymböckerna som leder till minst respektive flest matchade betalningar i söksimulatorn. De filtrerade synonymböckerna används sedan i söksimulatorn. Anledning- 10

19 en till att vi har valt att utföra förbättringen på de synonymböcker med minst respektive flest matchade betalningar är för att vi vill undersöka hur stor skillnad det kan bli på resultatet som visar minst respektive mest relevanta produkter. Testmängden som används för att utvärdera de filtrerade synonymböckerna är loggad dagen efter träningsmängden. En visuell kvalitativ analys kommer även att utföras på filer som innehåller visuella skillnader för sökningarna som görs i simuleringarna. Dessa filer visar skillnader i sökresultatet för med- och utan användning av synonymer. Sökresultatet i filerna består av bilder på produkterna som returnerats, samt vilka synonymer som använts för söksträngen. Detta resultat visar alltså vilka extra produkter som hämtas genom användandet av synonymer. 4.7 Implementation För att utföra våra tester utvecklas en Maven-modul i programmeringsspråket Java. Anledningen till detta är för att den simulator som integreras med modulen också är byggd i Java. DeepLearning4j är ett java-bibliotek som används för att kunna arbeta med datamängden av vektorer som genereras av Word2Vec och som i sin tur används för att beräkna likheter mellan olika ord som tas fram från eventdatan och dess synonymer. Anledningen till att DeepLearning4j valdes är för att detta bibliotek är rekommenderat för javautvecklare på Google-Codes sida om Word2Vec [13]. Synonymerna till söksträngarna från eventdatan skrivs ut i XML-format för att kunna läsas av simulatorn. 4.8 Metoddiskussion Experiment anses vara lämpligast för denna studie då den datagenerering som görs består av observationer i form av event från e-handelsplattformen som sedan kan analyseras enligt en kvantitativ dataanalys. Eftersom att den eventdata som används bygger på observationer från ett riktigt e-handelssystem i produktion där användare har skrivit in söksträngar så bidrar detta till att datan blir mer trovärdig att användas i ett experiment. Användarna har alltså inte varit medvetna om att datan kommer att användas för testerna och således sökt i normala omständigheter. Enligt Oates har det bevisats att data som är framtagen av människor som vet om att deras data kommer att användas i experiment kan leda till att datan blir missvisande [14, pp ]. Detta för att människor i vissa fall väljer att utföra val som de vanligtvis inte hade gjort. För att kunna validera resultatet av de filtrerade synonymordböckerna har vi annan testdata än träningsdata. Testdatan som används under simuleringen är hämtat från samma system som träningsdatan, fast från dagen därpå. Av föregående anledningar anser vi att vi uppfyller intern validitet i den datan vi har valt att utföra våra experiment på. För att kunna generalisera resultatet för studien har vi valt att träna Word2Vec på en datamängd från Google News. Datamängden innehåller 100 miljarder ord hämtade från nyheter för en rad olika kategorier som exempelvis handel, världen, hälsa, politik, teknologi, sport, vetenskap, underhållning m.fl [15]. Synonymerna genereras alltså inte utifrån enbart domänspecifik data inom mode och det kan därför tänkas att resultatet är representativt för andra områden inom e-handel. Den data som genereras från testerna och som står till grund för att kunna besvara F. 1-3 är kvantitativ data eftersom den representerar exempelvis antal sökträffar, antal sök som lett till köp och så vidare. En kvantitativ dataanalys är därför lämplig som metod [14, p. 172]. 11

20 För att besvara F. 4 och ytterliggare kunna validera och förstå relevansen av resultatet från den kvantitativa analysen kommer vi även att utföra en visuell kvalitativ analys av skillnaden mellan de produkter som hämtats för söksträngar med- och utan synonymer för de filtrerade synonymböckerna. Genom att undersöka skillnaderna i sökresultaten kan vi avgöra huruvida de extra produkterna som hämtats med hjälp av synonymer är relevanta eller inte. 12

21 5 Resultat För att utvärdera huruvida de framtagna synonymerna påverkar resultatet av sökningarna kommer experimentet använda sig av samma grupp, eventdatan, med för- och eftertest. Simulatorn körs ett antal gånger, där den första körningen körs utan användning av synonymer och resterande körningar använder sig av olika typer av genererade synonymer. För att ge en tydligare bild av resultatet körs även simulatorn med synonymer som skapas manuellt utifrån produktkatalogen. Resultatet av testerna jämförs för att besvara forskningsfrågorna. Testerna genererar följande data: Sessioner = Antalet session som har loggats i eventdatan. Köpta Produkter = Totala antalet köpta produkter i de loggade eventen. Sessioner med köp = Antalet sessioner som innehåller köp. Sessioner med köp efter sök = Antalet sessioner med köp efter att en sökning gjorts. Sökningar = Antalet event som är sökningar. Köp = Totala antalet köp i eventdatan. Matchade köp = Antalet köpta produkter som visas på de tjugo första platserna i sökresultatet. Distribution av matchade köp = Tabellen representerar antalet matchade köp för varje position i sökresultatet. Första positionen representerar alltså hur många av de köpta produkterna som varit först i sökresultatet. Sista positionen representerar hur många av de köpta produkterna som legat på tjugonde platsen i sökresultatet. Det som eftersträvas är att matcha så många köp som möjligt som möjligt så tidigt som möjligt i sökresultet. Antal sökningar = Antalet event som är sökningar. Produktträffar = Antalet produkter som sökningarna returnerat. Genomsnittlig söktid (ms) = Genomsnittlig söktid i millisekunder. Topp 5, 10, 100 = Maxantalet synonymer som hämtas för ett ord eller en fras. Filtrerad = För denna kolumnen har vi använt oss av synonymboken från kolumnen Topp 100, men tagit bort alla synonymer till söksträngar som fått försämrad effekt enligt Figur 3, därefter har vi kört om simuleringen med den nya synonymboken. Tabell 5: Eventdata Sessioner Köpta Produkter Sessioner med köp Sessioner med köp efter sök 2573 Sökningar Köp Tabellen ovan innehåller övergripande information som finns i den eventdata som används för testerna i simulatorn. 13

22 5.1 Utan synonymer Tabell 6: Simulatorresultat del 1 utan synonymer Antal sökningar Matchade köp 3192 Produktträffar No-hits 2327 Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs utan användning av synonymer. Utan några synonymer hittas 3192 köpta produkter inom de tjugo första produkterna i sökresultatet sökningar genererar 0 produktträffar och totalt når alla sökningarna till produkter. Genomsnittlig söktid för simulatorn att utföra sökningarna är 84.78ms. Tabell 7: Simulatorresultat del 2 utan synomer Position Köpnivå Tabellen ovan visar distributionen av de matchade köpen för testerna som körs utan användning av synonymer. 14

23 5.2 Manuella synonymer Tabell 8: Simulatorresultat del 1 för manuella synonymer Antal sökningar Matchade köp 3265 Produktträffar No-hits 2106 Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av manuellt skapade synonymer. Med de manuellt framtagna synonymerna hittas 3265 köpta produkter inom de tjugo första produkterna i sökresultatet sökningar genererar 0 produktträffar och totalt når alla sökningarna till produkter. Genomsnittlig söktid för simulatorn att utföra sökningarna är 99.15ms. Tabell 9: Simulatorresultat del 2 för manuella synonymer Position Köpnivå Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av manuellt genererade synonymer. 15

24 5.3 Automatiska synonymer med 0.63 i cosine similarity Tabell 10: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.63 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.63 i cosine similarity. Tabell 11: Simulatorresultat del 2 för automatiska synonymer med 0.63 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet

25 5.4 Automatiska synonymer med 0.68 i cosine similarity Tabell 12: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.68 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.68 i cosine similarity. Tabell 13: Simulatorresultat del 2 för automatiska synonymer med 0.68 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet

26 5.5 Automatiska synonymer med 0.70 i cosine similarity Tabell 14: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.70 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.70 i cosine similarity. Tabell 15: Simulatorresultat del 2 för automatiska synonymer med 0.70 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet

27 5.6 Filtrerade synonymer För utvärdering över hur de filtrerade synonymerna påverkar sökningar i systemet har vi använt oss av eventdata insamlad en dag efter den eventdata som använts i tidigare experiment. Tabell 16: Eventdata Sessioner Köpta Produkter Sessioner med köp Sessioner med köp efter sök 2133 Sökningar 8378 Köp Tabell 17: Simulatorresultat och jämförelser för filtrerad synonymbok med 0.63 cosine similarity Utan Synonymer 0.63 Ofiltrerad 0.63 Filtrerad Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av den filtrerade synonymboken med tröskelvärdet

28 Tabell 18: Simulatorresultat del 2 för filtrerad synonymbok med 0.63 cosine similarity Köpnivå Position Utan Synonymer 0.63 Ofiltrerad 0.63 Filtrerad Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av den filtrerade synonymboken med tröskelvärdet Tabell 19: Simulatorresultat del 1 för filtrerad synonymbok med 0.70 cosine similarity Utan synonymer 0.70 ofiltrerad 0.70 filtrerad Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av den filtrerade synonymboken med tröskelvärdet

29 Tabell 20: Simulatorresultat del 2 för filtrerad synonymbok med 0.70 cosine similarity Köpnivå Position Utan Synonymer 0.70 ofiltrerad 0.70 filtrerad Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av den filtrerade synonymboken med tröskelvärdet Jämförelser mellan resultat Resultaten av antalet no-hits, antalet produktträffar, antalet matchade köp och den genomsnittliga söktiden ifrån de olika sökmetoderna som har tagits fram jämförs i kommande diagram med det resultat som framtagits utan synonymer och ställs mot varandra genom att observera den procentuella skillnaden mellan dessa. 21

30 Figur 4: Jämförelse mellan antalet matchade köp i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av antalet matchade köp för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. Resultatet visar att den filtrerade synonymboken från tröskelvärdet 0.70 matchar flest köp med en ökning av matchade köp på 2.33%. Alla automatiskt genererade synonymer, förutom de som genereras över tröskelvärdet 0.70, matchar färre köpta produkter än testet som inte använder synonymer. För att den automatiserade versionen av genererade synonymer ska anses som användbar krävs det att den procentuella skillnaden ska vara positiv. Figur 5: Jämförelse mellan antalet produktträffar i de olika sökmetoderna som använts i söksimulatorn. 22

31 Diagrammet ovan visar den procentuella skillnaden av antalet produktträffar för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. De automatiskt genererade synonymerna bidrar till fler produktträffar i alla tester i jämförelse med de manuellt genererade synonymerna eller inga synonymer alls. De automatiskt genererade synonymerna som framtagits från de 100 första synonymerna i tröskelvärdet 0.63 visar att det sker en ökning på 10.23% i produktträffar. Detta bidrar till att ytterligare produkter dyker upp i användares sökresultat i jämförelse med det fall då inga synonmer används alls. Resultatet visar att ju fler synonymer som genereras och används, desto fler produktträffar får sökningarna. Figur 6: Jämförelse mellan antalet no-hits i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av antalet no-hits för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. De automatiskt genererade synonymerna bidrar till färre no-hits i alla tester i jämförelse med de manuellt genererade synonymerna. Ju färre no-hits desto bättre. 23

32 Figur 7: Jämförelse mellan den genomsnittliga söktiden i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av den genomsnittliga söktiden för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. För att den automatiserade processen av synonymgenereringen ska anses vara användbar så ska den genomsnittliga söktiden vara så låg som möjligt. Resultatet visar att ju fler synonymer som genereras och används, desto längre blir den genomsnittliga söktiden. Ju lägre söktid desto bättre. 6 Analys och diskussion I den första delen av analysen utför vi en kvantitativ analys på den data som genererats från söksimulatorn, därefter utför vi en kvalitativ analys för att få en bättre förståelse för relevansen av resultatet. 6.1 Matchade Köp För det lägre tröskelvärdet 0.63, vilket även är det tröskelvärde som gett lägst matchade betalningar, förlorar simuleringen mellan (3.5%-5.8%) betalningar jämfört med simuleringen utan synonymer. En förlust av matchade betalningar inträffar även för tröskelvärdet 0.68, där (1.6%-2.6%) betalningar försvinner i jämförelse med simuleringen utan synonymer. Detta indikerar att de extra synonymer som genereras utifrån tröskelvärdna på 0.63 och 0.68 leder till produktträffar som orsakar ett brus av irrelevanta produkter i sökresultatet och förflyttar de relevanta produkterna som köpts för söksträngarna längre bak i resultatet. I alla fallen av simuleringarna med synonymer som genererats utifrån tröskelvärdet 0.70 leder till en förbättring på 17 (0.5%) fler matchade köp än simuleringen utan synonymer. Denna siffran är inte särskilt hög, därför är det viktigt att titta på skillnaden i antalet produktträffar och no-hits. En liten ökning på matchade köp kan tillsammans med en stor ökning av produktträffar och minskning av no-hits 24

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Word2Vec. Högkvalitativa vektorrepresentationer av ord tränat på stora mängder data. Innehåll LINKÖPINGS UNIVERSITET. 1. Inledning...

Word2Vec. Högkvalitativa vektorrepresentationer av ord tränat på stora mängder data. Innehåll LINKÖPINGS UNIVERSITET. 1. Inledning... LINKÖPINGS UNIVERSITET Innehåll 1. Inledning... 2 2. Terminologi... 3 3. Allmänt om Word2Vec... 3 4. Continous Skip-gram model... 4 Word2Vec Högkvalitativa vektorrepresentationer av ord tränat på stora

Läs mer

Google Guide: Tips för sökoptimering

Google Guide: Tips för sökoptimering Google Guide: Tips för sökoptimering Google Guide Digital publikation www.intankt.se, Intankt Författare: Adam Ahlgren Typsnitt: Calibri, 11 punkter Formgivning: Intankt Omslagsfoto: Google Stockholm,

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

Sökanalys för intranät

Sökanalys för intranät Sökanalys för intranät 2014-12-03 Henrik Gelius OSLO STOCKHOLM Agenda Henrik Gelius, sökkonsult www.comperiosearch.com Idag tittar vi på detta: 1. Affärsnytta - sök på intranät 2. Sökanalys & nyckeltal

Läs mer

PubMed (Medline) Fritextsökning

PubMed (Medline) Fritextsökning PubMed (Medline) PubMed är den största medicinska databasen och innehåller idag omkring 19 miljoner referenser till tidskriftsartiklar i ca 5 000 internationella tidskrifter. I vissa fall får man fram

Läs mer

En rapport om hur sökningar runt försäkringar ser ut. vad folk söker. vad de hittar

En rapport om hur sökningar runt försäkringar ser ut. vad folk söker. vad de hittar En rapport om hur sökningar runt försäkringar ser ut vad folk söker vad de hittar Innehåll Introduktion... 3 Om rapporten... 3 Searcher Intent Modelling och Carretera... 3 Termer... 4 Nyckelpåverkare...

Läs mer

Googles sidrankning - linjär algebra värt en förmögenhet

Googles sidrankning - linjär algebra värt en förmögenhet Googles sidrankning - linjär algebra värt en förmögenhet Outline 1 Sökmotorer 2 Grafteori Linjär algebra 3 Målet Utifrån användarens sökord lista de mest relevanta webbsidorna. Dessutom i en ordning som

Läs mer

V I G Å R I G E N O M...

V I G Å R I G E N O M... I N F O R M A T I O N S S Ö K N I N G V I G Å R I G E N O M... Booleska operatorer Trunkering Frassökning Wildcards Blocksökning Tips B O O L E S K A O P E R A T O R E R AND När du vill att ditt resultat

Läs mer

Biblioteken, Futurum 2017

Biblioteken, Futurum 2017 Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:

Läs mer

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek Informationssökning - att söka och finna vetenskapliga artiklar! Mikael.Rosell@liu.se 013-282248 Linköpings Universitetsbibliotek 2 FEM saker ni SKA ta med er härifrån! Välja ut och använda relevanta databaser

Läs mer

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek

Läs mer

PubMed gratis Medline på Internet 1946-

PubMed gratis Medline på Internet 1946- Klicka på 1. SÖK i E-biblioteket 2. Flik Databaser 3. PubMed PubMed gratis Medline på Internet 1946- www.ebiblioteket.vgregion.se Fritextsökning Skriv in de ord du vill söka på (AND läggs automatiskt in

Läs mer

Om uppsatsmallen vid GIH

Om uppsatsmallen vid GIH Om uppsatsmallen vid GIH Här kan du läsa om och se exempel på hur din uppsats vid GIH ska se ut. Uppsatsmallen (.dotxfil) som du kan spara ner och skriva i finns på www.gih.se/uppsats. Huvudrubrik, dvs

Läs mer

Patientutbildning om diabetes En systematisk litteraturstudie

Patientutbildning om diabetes En systematisk litteraturstudie Institutionen Hälsa och samhälle Sjuksköterskeprogrammet 120 p Vårdvetenskap C 51-60 p Ht 2005 Patientutbildning om diabetes En systematisk litteraturstudie Författare: Jenny Berglund Laila Janérs Handledare:

Läs mer

Sö ka artiklar öch annan litteratur

Sö ka artiklar öch annan litteratur 1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och

Läs mer

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)

1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p) UMEÅ UNIVERSITY Department of Mathematics and Mathematical Statistics Pre-exam in mathematics Linear algebra 2012-02-07 1. Compute the following matrix: (2 p 3 1 2 3 2 2 7 ( 4 3 5 2 2. Compute the determinant

Läs mer

Läget, läget, läget. Sök, sök, sök. mars 2018/Ted Durdel

Läget, läget, läget. Sök, sök, sök. mars 2018/Ted Durdel Läget, läget, läget Sök, sök, sök mars 2018/Ted Durdel Episerver Find is a powerful, scalable query platform that can index and query large amounts of structured or unstructured data of any type, create

Läs mer

UB:s sö ktjä nst - Söka artiklar och annan litteratur

UB:s sö ktjä nst - Söka artiklar och annan litteratur 1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,

Läs mer

Språkteknologi och Open Source

Språkteknologi och Open Source Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.

Läs mer

Business research methods, Bryman & Bell 2007

Business research methods, Bryman & Bell 2007 Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data

Läs mer

So ka artiklar och annan litteratur

So ka artiklar och annan litteratur 1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom

Läs mer

LARS. Ett e-bokningssystem för skoldatorer.

LARS. Ett e-bokningssystem för skoldatorer. LARS Ett e-bokningssystem för skoldatorer. Därför behöver vi LARS Boka dator i förväg. Underlätta för studenter att hitta ledig dator. Rapportera datorer som är sönder. Samordna med schemaläggarnas system,

Läs mer

Institutionen för datavetenskap, DAT060, Laboration 2 2 För denna enkla simulerings skull kommer handen att representeras som ett par tal μ värdet på

Institutionen för datavetenskap, DAT060, Laboration 2 2 För denna enkla simulerings skull kommer handen att representeras som ett par tal μ värdet på DAT 060 Laboration 2 I Malmös kasino Institutionen för datavetenskap 17 juni 2002 Per tänkte dryga ut sitt magra studielån genom att jobba som labbassistent på sommarkursen. Tyvärr fanns det redan tillräckligt

Läs mer

specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet

specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet www.sprakenshus.se https://larportalen.skolverket.se/#/modul/4- specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet Faktorer av betydelse för en flerspråkig utveckling Sociala faktorer

Läs mer

Ökat personligt engagemang En studie om coachande förhållningssätt

Ökat personligt engagemang En studie om coachande förhållningssätt Lärarutbildningen Fakulteten för lärande och samhälle Individ och samhälle Uppsats 7,5 högskolepoäng Ökat personligt engagemang En studie om coachande förhållningssätt Increased personal involvement A

Läs mer

2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.

2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit. 2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen

Läs mer

Datastrukturer och Algoritmer D0041D

Datastrukturer och Algoritmer D0041D Luleå Tekniska Universitet 19 mars 2014 Laborationsrapport Laboration 3 Datastrukturer och Algoritmer D0041D Primms Algoritm Namn E-mail Magnus Björk magbjr-3@ltu.student.se Handledare Felix Hansson Primms

Läs mer

Structured Query Language (SQL)

Structured Query Language (SQL) Structured Query Language (SQL) Christer Stuxberg christer.stuxberg@im.uu.se Institutionen för Informatik och Media Översikt Introduktion Enkla frågor (queries) Hämta en specifik kolumn Sök Sammanfattning

Läs mer

Sö ka litteratur i ERIC

Sö ka litteratur i ERIC 1 Sö ka litteratur i ERIC Det finns två ingångar om man vill söka i databasen ERIC: Via webben gratis version från the Education Resources Information Center: Denna version kan vara bra att känna till

Läs mer

Hur du använder My easyfairs. En guide för utställare

Hur du använder My easyfairs. En guide för utställare Hur du använder My easyfairs En guide för utställare My easyfairs En guide för utställare Page 2 Innehåll Hur du använder My easyfairs... 1 Hur du loggar in... 3 Hur du anger namn på din monter och läger

Läs mer

Introduktion till frågespråket SQL (v0.91)

Introduktion till frågespråket SQL (v0.91) DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför

Läs mer

Random Indexing för vektorbaserad semantisk analys

Random Indexing för vektorbaserad semantisk analys Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk

Läs mer

Evidensbaserad informationssökning

Evidensbaserad informationssökning Vetenskapligt förhållningssätt Evidensbaserad informationssökning Anna Wilner, NU-biblioteket www.nusjukvarden.se/nubiblioteket Mail: biblioteket.nu@vgregion.se Tel: 010-435 69 40 Jessica Thorn, Biblioteket

Läs mer

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap Syns du, finns du? - En studie över användningen av SEO, PPC och sociala medier som strategiska kommunikationsverktyg i svenska företag

Läs mer

Sö ka artiklar öch annan litteratur

Sö ka artiklar öch annan litteratur 1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och

Läs mer

Maskinöversättning 2008

Maskinöversättning 2008 Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE

Läs mer

The Cochrane Library. Vad är The Cochrane Library? Allmänna databaser

The Cochrane Library. Vad är The Cochrane Library? Allmänna databaser The Cochrane Library Vad är The Cochrane Library? En databas med syftet att samla och kvalitetsvärdera kliniska studier om effekterna av olika behandlingar. Cochrane-biblioteket består av sju databaser,

Läs mer

Kunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt.

Kunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt. Kunskapsgraf Fredrik Åkerberg j.f.akerberg@gmail.com Tommy Kvant tommy.kvant@gmail.com 1 Introduktion Målet med projektet var att undersöka huruvida DBpedia.org, kan användas för att besvara frågor på

Läs mer

Kritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin.

Kritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin. Examensarbete Magisterprogrammet Digital Affärsutveckling, kurs uppgift 3 teori-reflektion. Kritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin. Författare: Magnus

Läs mer

1 Översikt...2. 1.1 Vad är kontokoder?...2 1.2 Konto/Mapp uppbyggnad...2 1.3 Tillgång till Kontokoder...2. 2 Område Kontokoder...5

1 Översikt...2. 1.1 Vad är kontokoder?...2 1.2 Konto/Mapp uppbyggnad...2 1.3 Tillgång till Kontokoder...2. 2 Område Kontokoder...5 Manual för Kontokod 1 Översikt...2 1.1 Vad är kontokoder?...2 1.2 Konto/Mapp uppbyggnad...2 1.3 Tillgång till Kontokoder...2 2 Område Kontokoder...5 2.1 Mapputforskare...5 2.2 Verktygsfält...6 2.3 Hitta

Läs mer

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk

Läs mer

Mål med lektionen! Repetera och befästa kunskaperna.

Mål med lektionen! Repetera och befästa kunskaperna. Entity Framework Mål med lektionen! Repetera och befästa kunskaperna. Vad lektionen omfattar Repetera och gå igenom kursen lite snabbt. Vilka problem vill vi lösa? Vi arbetar med Webbapplikationer Vi kommer

Läs mer

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket. PubMed lathund 2016-02-04 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på För att få se vad som har hänt bakom kulissen, titta på Search details.

Läs mer

NKRR. Regelskrivning i praktiken

NKRR. Regelskrivning i praktiken Sida: 1 (13) NKRR Regelskrivning i praktiken Innehåll Sida: 2 (13) 1 Inledning... 3 1.1 Förkortningar och begrepp... 3 2 Ändringshistorik för dokumentet... 4 3 Bakgrund... 5 3.1 Regler i NKRR... 5 3.2

Läs mer

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund

Litteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Litteraturstudie Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Vad är en litteraturstudie? Till skillnad från empiriska studier söker man i litteraturstudier svar på syftet

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013 Campus Örnsköldsvik Söka artiklar, kursen Människans livsvillkor, 22 januari 2013 Under Söka och skriva på http://ovik.u b.umu.se/ finns länkar till lexikon, Sökhjälp och guider, Medicin och Skriva uppsats,

Läs mer

Word- sense disambiguation

Word- sense disambiguation KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,

Läs mer

HÖGSKOLAN FÖR SCEN OCH MUSIK

HÖGSKOLAN FÖR SCEN OCH MUSIK HÖGSKOLAN FÖR SCEN OCH MUSIK MVK941 Forskarutbildningsförberedande kurs i musikpedagogik, 30 högskolepoäng Preparatory Research Education Course in Music Education, 30 higher education credits Fastställande

Läs mer

Vetenskapsmetod och teori. Kursintroduktion

Vetenskapsmetod och teori. Kursintroduktion Vetenskapsmetod och teori Kursintroduktion Creswell Exempel Vetenskapsideal Worldview Positivism Konstruktivism/Tolkningslära Kritiskt (Samhällskritiskt/ Deltagande) Pragmatism (problemorienterat) Ansats

Läs mer

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum: Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer

Läs mer

Klustring av svenska tidningsartiklar

Klustring av svenska tidningsartiklar Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier

Läs mer

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR

DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR STICKPROVSMEDELVÄRDEN I denna datorövning ska du använda Minitab för att slumpmässigt dra ett mindre antal observationer från ett större antal, och studera hur

Läs mer

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens

Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning

Läs mer

WEBBKLUSTRING SLUTRAPPORT

WEBBKLUSTRING SLUTRAPPORT Arne Jönsson 2014-01-09 WEBBKLUSTRING SLUTRAPPORT 1. Inledning Inom projektet har vi utvecklat teknik som gör det möjligt att identifiera webbsidors innehåll och därefter klustra (gruppera) dem så att

Läs mer

Detta exjobb handlar om att skapa felträd utifrån specificerade rutiner i reparationshandböckerna för samtliga av Hägglunds fordon.

Detta exjobb handlar om att skapa felträd utifrån specificerade rutiner i reparationshandböckerna för samtliga av Hägglunds fordon. Rubrik: Maintenance - Felträd för mekaniska fel Arbetsuppgifter: Skapa felträd för mekanik utifrån reparationshandböcker. I våra fordonssystem använder vi oss av en interaktiv felsökning som går ut på

Läs mer

Sö ka artiklar öch annan litteratur

Sö ka artiklar öch annan litteratur 1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och

Läs mer

Föreläsning 12 Inspektionsmetoder. Rogers et al. Kapitel 15

Föreläsning 12 Inspektionsmetoder. Rogers et al. Kapitel 15 Föreläsning 12 Inspektionsmetoder Rogers et al. Kapitel 15 Inspektionsmetoder Metoder som genomförs utan användare En eller helst flera experter utför en inspektion eller granskning Man utgår ifrån vedertagna

Läs mer

Titel Mall för Examensarbeten (Arial 28/30 point size, bold)

Titel Mall för Examensarbeten (Arial 28/30 point size, bold) Titel Mall för Examensarbeten (Arial 28/30 point size, bold) SUBTITLE - Arial 16 / 19 pt FÖRFATTARE FÖRNAMN OCH EFTERNAMN - Arial 16 / 19 pt KTH ROYAL INSTITUTE OF TECHNOLOGY ELEKTROTEKNIK OCH DATAVETENSKAP

Läs mer

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data 5HVLVWHQVWDEHOO Tack för att du valde programmet 5HVLVWHQVWDEHOO! Vi hoppas att programmet ska vara till stor hjälp i ditt arbete. Har du synpunkter på programmet är du mycket välkommen att höra av dig

Läs mer

PRÖVNINGSANVISNINGAR

PRÖVNINGSANVISNINGAR Prövning i Kemi 2 PRÖVNINGSANVISNINGAR Kurskod KEMKEM02 Gymnasiepoäng 100 Läromedel Prov Teoretiskt prov (240 min) Muntligt prov Kemi B, Andersson, Sonesson m.fl, Liber. Kap. 2-4 och 7-14 Ett skriftligt

Läs mer

Sökmotoroptimering. Per Svanström SMM. Online Communication Manager. Web Intelligence. /persvanstrom /in/persvanstrom /profiles/per.

Sökmotoroptimering. Per Svanström SMM. Online Communication Manager. Web Intelligence. /persvanstrom /in/persvanstrom /profiles/per. Sökmotoroptimering SEO SEM Per Svanström Online Communication Manager SMM Web Intelligence /persvanstrom /in/persvanstrom /profiles/per.svanstrom www.knowit.se Copyright 2011 294 miljarder epost skickas

Läs mer

Grafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions:

Grafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions: IMCDP Grafisk teknik The impact of the placed dot is fed back to the original image by a filter Original Image Binary Image Sasan Gooran (HT 2006) The next dot is placed where the modified image has its

Läs mer

Att hitta projekt. Björn Victor. måndag 19 mars 12

Att hitta projekt. Björn Victor. måndag 19 mars 12 Att hitta projekt Björn Victor Övning: projektbeskrivning Till måndag: skriv en (1) sida som beskriver projektet på Distribuerade system med projekt Övning: inte obligatorisk, men nyttig! 1. vad var planen/avsikten/syftet/målet

Läs mer

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. Högskoleförordningen) Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen") 1 1. Mål för doktorsexamen 1. Goals for doctoral exam Kunskap och förståelse visa brett

Läs mer

Calculate check digits according to the modulus-11 method

Calculate check digits according to the modulus-11 method 2016-12-01 Beräkning av kontrollsiffra 11-modulen Calculate check digits according to the modulus-11 method Postadress: 105 19 Stockholm Besöksadress: Palmfeltsvägen 5 www.bankgirot.se Bankgironr: 160-9908

Läs mer

Obemannade flygplan. Namn: Hampus Hägg. Datum: 2015-03-02. Klass: TE14B. Gruppmedlemmar: Gustav, Emilia, Henric och Didrik

Obemannade flygplan. Namn: Hampus Hägg. Datum: 2015-03-02. Klass: TE14B. Gruppmedlemmar: Gustav, Emilia, Henric och Didrik Namn: Hampus Hägg Obemannade flygplan Datum: 2015-03-02 Klass: TE14B Gruppmedlemmar: Gustav, Emilia, Henric och Didrik Handledare: David, Björn och Jimmy Abstract In this task I ve been focusing on unmanned

Läs mer

E-biblioteket en tjänst från sjukhusbiblioteken

E-biblioteket en tjänst från sjukhusbiblioteken E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.

Läs mer

Linköpings universitet

Linköpings universitet Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga

Läs mer

Uppdaterad / EM. The Cochrane Library

Uppdaterad / EM. The Cochrane Library The Cochrane Library Vad är The Cochrane Library? En samling databaser med syfte att samla och kvalitetsvärdera kliniska studier om effekterna av olika behandlingar. Cochrane består av två databaser Cochrane

Läs mer

Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson

Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som

Läs mer

Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6

Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6 Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6? DAGENS AGENDA Komplexitet Ordobegreppet Komplexitetsklasser Loopar Datastrukturer Några nyttiga regler OBS! Idag jobbar

Läs mer

Gränssnitt för FakeGranska. Lars Mattsson

Gränssnitt för FakeGranska. Lars Mattsson Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken

Läs mer

Manual för ehp och HP:s digitala arkiv

Manual för ehp och HP:s digitala arkiv Manual för ehp och HP:s digitala arkiv På www.hallandsposten.se/kundservice kan du hitta svar på många frågor gällande din prenumeration och hur du gör att aktivera ditt digitala konto och mycket mera.

Läs mer

Arbeta med databas. Översikt. Lektion 1: Arbeta med Entity Data Models. Arbeta med Entity Data Models. LINQ (Language Integrated Query).

Arbeta med databas. Översikt. Lektion 1: Arbeta med Entity Data Models. Arbeta med Entity Data Models. LINQ (Language Integrated Query). Arbeta med databas Översikt Arbeta med Entity Data Models. LINQ (Language Integrated Query). Lektion 1: Arbeta med Entity Data Models Introduktion till ADO.NET Entity Framework. Stöd i ADO.NET Entity Framework.

Läs mer

Sök artiklar i databaser för Vård- och hälsovetenskap

Sök artiklar i databaser för Vård- och hälsovetenskap Sök artiklar i databaser för Vård- och hälsovetenskap Bibliografiska databaser eller referensdatabaser ger hänvisningar (referenser) till artiklar och/eller rapporter och böcker. Ibland innehåller referensen

Läs mer

Hur du använder My easyfairs. En guide för utställare

Hur du använder My easyfairs. En guide för utställare Hur du använder My easyfairs En guide för utställare My easyfairs En guide för utställare Page 2 Innehåll Hur du loggar in... 3 Hur du anger namn på din monter och läger till en logotyp... 4 Hur du anger

Läs mer

Sociala medier för företag

Sociala medier för företag Sociala medier för företag Utbildningen ingår i projektet Helikoopter vilket är ett kompetensutvecklingsprojekt som finansieras av Europeiska socialfonden och genomförs i Coompanion Norr och Västerbottens

Läs mer

Deadline 3. Grupp A.4 Kathrin Dahlberg Elin Gardshol Lina Johansson Petter Liedberg Pernilla Lydén

Deadline 3. Grupp A.4 Kathrin Dahlberg Elin Gardshol Lina Johansson Petter Liedberg Pernilla Lydén Deadline 3 Grupp A.4 Kathrin Dahlberg Elin Gardshol Lina Johansson Petter Liedberg Pernilla Lydén 1 3. Kartlägg kundens röst För att få en klar bild av kundens nuvarande och kommande behov definieras marknaden

Läs mer

Sociala medieströmmar metoder för analys och samarbete via nya medieformat. Pelle Snickars, Umeå universitet & Lars Degerstedt, Södertörns högskola

Sociala medieströmmar metoder för analys och samarbete via nya medieformat. Pelle Snickars, Umeå universitet & Lars Degerstedt, Södertörns högskola Sociala medieströmmar metoder för analys och samarbete via nya medieformat Pelle Snickars, Umeå universitet & Lars Degerstedt, Södertörns högskola från text som omvärldsinformation till andra typer

Läs mer

Kriminologi AV, Magisterkurs i kriminologi, 30 hp

Kriminologi AV, Magisterkurs i kriminologi, 30 hp 1 (5) Kursplan för: Kriminologi AV, Magisterkurs i kriminologi, 30 hp Criminology MA, Master Degree Course in Criminology, 30 Credits Allmänna data om kursen Kurskod Ämne/huvudområde Nivå Inriktning (namn)

Läs mer

Visualisering av samverkan

Visualisering av samverkan Visualisering av samverkan 18 december 2017 En viktig aspekt i samverkan är att inte bara ha koll på vilka andra aktörer du själv samverkar med, utan även veta om vilka aktörer du inte samverkar med, men

Läs mer

MESI i Intel Core 2 Duo

MESI i Intel Core 2 Duo MESI i Intel Core 2 Duo Sammanfattning Denna rapport beskriver en processor (Intel Core 2 Duo) vars cache coherence protokoll är MESI. Rapporten beskriver hur processorn är uppbyggd, hur många kärnor den

Läs mer

Cinahl sökguide. Enkel sökning. Ämnesordsökning

Cinahl sökguide. Enkel sökning. Ämnesordsökning Medicinska fakultetens bibliotek, Lund. Monica Landén. 2014-02-20 Cinahl sökguide Enkel sökning Select a Field (optional) sökningen görs som keyword i titel, abstract och subject heading (ämnesord). Genom

Läs mer

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter. En kort introduktion till Fronter 19 Välkommen till en ny Fronter-upplevelse. Den här guiden kommer att ta upp skillnader mellan den nuvarande Fronter-plattformen och Fronter 19, och de förändrade arbetsprocesserna.

Läs mer

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas

Läs mer

GUIDE TILL ANVÄNDARHANTERINGEN

GUIDE TILL ANVÄNDARHANTERINGEN Sida 1 av 9 Version: 1 (EL) GUIDE TILL ANVÄNDARHANTERINGEN Användarhanteringen sker i ett verktyg som heter Användaradmin och man kan också göra en del saker direkt på intranätet. I användarhanteringen

Läs mer

Styrteknik: Binära tal, talsystem och koder D3:1

Styrteknik: Binära tal, talsystem och koder D3:1 Styrteknik: Binära tal, talsystem och koder D3:1 Digitala kursmoment D1 Boolesk algebra D2 Grundläggande logiska funktioner D3 Binära tal, talsystem och koder Styrteknik :Binära tal, talsystem och koder

Läs mer

Tentamen på kursen Webbdesign, 7,5 hp

Tentamen på kursen Webbdesign, 7,5 hp Högskolan i Borås Institutionen för data- och affärsvetenskap Malin Nilsson Tentamen Tentamen på kursen Webbdesign, 7,5 hp Tentamenstid: 2012-05-28, kl. 9-13 Hjälpmedel: Inga hjälpmedel tillåtna Betyg:

Läs mer

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se Tänk kreativt! Informationssökning Ha ett kritiskt förhållningssätt! Informationssökning steg för steg Innan du börjar behöver du formulera en fråga. Vad vill du hitta information om? Att utgå från: -

Läs mer

1 Find the area of the triangle with vertices A = (0,0,1), B = (1,1,0) and C = (2,2,2). (6p)

1 Find the area of the triangle with vertices A = (0,0,1), B = (1,1,0) and C = (2,2,2). (6p) Divsion of Mathematics Examination Vector algebra and applied mathematics MAA150 - TEN2 Mälardalen University Date: 2015-11-06 Examiner: Mats Bodin Exam aids: not any All solutions should be presented

Läs mer

Excel-guide. Introduktion

Excel-guide. Introduktion Excel-guide Introduktion I denna laboration kommer ni få använda några grundfunktioner i Microsoft Excel. Laborationen utgår ifrån Excel 2010, men om ni vill använda ett annat program för att lösa uppgifterna

Läs mer

Grafisk teknik IMCDP. Sasan Gooran (HT 2006) Assumptions:

Grafisk teknik IMCDP. Sasan Gooran (HT 2006) Assumptions: Grafisk teknik Sasan Gooran (HT 2006) Iterative Method Controlling Dot Placement (IMCDP) Assumptions: The original continuous-tone image is scaled between 0 and 1 0 and 1 represent white and black respectively

Läs mer

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb.

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb. Att söka information Marie Gustafsson marie.gustafsson@hb.se Dagens föreläsning: Att söka vetenskaplig litteratur Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga

Läs mer

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692

Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692 Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...

Läs mer

SEO-rapport. Innehållsförteckning. Introduktion EkoLekos sökord.. 3. Rapport från Semrusch som visar EkoLekos Organic Search Summary,...

SEO-rapport. Innehållsförteckning. Introduktion EkoLekos sökord.. 3. Rapport från Semrusch som visar EkoLekos Organic Search Summary,... SEO-rapport Innehållsförteckning Introduktion EkoLekos sökord.. 3 Rapport från Semrusch som visar EkoLekos Organic Search Summary,...4 Organic SearchTop Keywords..5 Utvecklingen på EkoLekos viktigaste

Läs mer

Collaborative Product Development:

Collaborative Product Development: Collaborative Product Development: a Purchasing Strategy for Small Industrialized House-building Companies Opponent: Erik Sandberg, LiU Institutionen för ekonomisk och industriell utveckling Vad är egentligen

Läs mer

YAHOO! SEARCH MARKETING Tips för att öka trafiken

YAHOO! SEARCH MARKETING Tips för att öka trafiken YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova

Läs mer

Föreläsning 13. Träd

Föreläsning 13. Träd Föreläsning 13 Träd Träd Ett träd är en datastruktur som tillåter oss att modellera sådant som vi inte kan modellera med linjära datastrukturer. Ett datavetenskapligt träd består av noder med pilar emellan.

Läs mer