Automatisk synonymgenerering med Word2Vec för query expansion inom e-handel
|
|
- Karin Ek
- för 4 år sedan
- Visningar:
Transkript
1 Teknik och samhälle Datavetenskap och medieteknik Examensarbete 15 högskolepoäng, grundnivå Automatisk synonymgenerering med Word2Vec för query expansion inom e-handel Automatic synonym generation with Word2Vec for query expansion within E-Commerce Kemal Kojic Emil Petersson Examen: kandidatexamen 180 hp Huvudområde: datavetenskap Program: systemutvecklare Datum för slutseminarium: Handledare: Bengt Nilsson Examinator: Jesper Larsson
2
3 Sammanfattning I detta arbete undersöks hur väl automatisk synonymgenerering genom maskininlärningsmetoden Word2Vec, som tränats över en datamängd från Google News på hundra miljarder ord, lämpar sig för query expansion inom ehandel. Detta görs genom användning av produkt- och eventdata från ett välkänt modebolag där synonymer genereras utifrån söksträngar som loggats i eventdata genom olika metoder som i sin tur bildar synonymböcker som används i framtida sökningar med hjälp av query expansion. För att kunna besvara studiens forskningsfrågor utförs först en kvantitativ analys. Denna analys utförs på data som matchade köp, produktträffar, no-hits och söktid. Information om denna data genereras utifrån en söksimulator som simulerar loggade händelser från användarsessioner i ett ehandelssystem. Därefter filtreras de genererade synonymböckerna genom att ta bort synonymer som är kopplade till de söksträngar som producerat ett sämre resultat i simuleringen med synonymer, än utan. För att validera vårt resultat från den kvantitativa analysen utförs även en kvalitativ analys på skillnaden i sökresultatet som de olika metoderna tar fram, där vi undersöker vad det är för produkter som tas fram med hjälp av synonymerna, för att undersöka dess relevans. Våra tester uppvisar att ett lägre tröskelvärde leder till fler produkträffar och minskar antalet no-hits. Antalet produktträffar ökades med mellan 4%-10%, no-hits reducerades med mellan 11%-22%. I de fall där söksträngen har tilldelats bra synonymer påverkas relevansen av produkterna positivt då fler relevanta produkter dyker upp i sökresultatet. I de fall där söksträngen har tilldelats mindre bra synonymer påverkas relevansen av produkterna negativt då vissa irrelevanta produkter dyker upp i sökresultatet som användaren antagligen inte vill se i sitt sökresultat. I alla fall där de automatiskt genererade synonymerna används så befinner sig majoriteten av alla köpta produkter i den första halvan av sökresultatet, däremot minskar antalet köpta produkter på den första platsen i sökresultatet i alla fallen.
4
5 Abstract In this thesis, we examine automatic synonym generation through the use of the machine learning algorithm Word2Vec that has been trained using a Google News data set containing a hundred million words to find out if it is suitable for query expansions in e-commerce. This is examined through the use of product- and event data from a wellknown fashion company where synonyms are generated from search-queries that have been logged in the event data through different methods, resulting in thesaurus that are used in future searches with the use of query expansions. In order to answer the thesis research question, a quantitative analysis is performed. This analysis is performed on data such as matched payments, product matches, no-hits and search time. Information about this data is generated through a search simulator that simulates logged events from user sessions in a e-commerce system. The generated thesaurus are later filtered through the removal of synonyms that are connected to search queries whose results have produced worse results than the results without synonyms. In order to validate our results from the quantitative analysis a qualitative analysis is also performed on the difference of the search result that the different methods produce. In this qualitative analysis we research what type of products that the added synonyms produce in order to understand the relevance of the search query. Our tests show that the lower the threshold is, the higher the number of product hits and the lower the number of no-hits. Our tests shows that the number of product hits was increased by between 4%-10%, the number of no-hits was reduced by 11%-22%. In all of the tests using automatically generated synonyms, the results show that the majority of the purchased products are presented in the first half of the search result, however, in all of the tests using automatically generated synonyms the number of purchases in the first position of the search result was reduced.
6
7 Innehåll 1 Inledning Mål och Syfte Frågeställning Avgränsningar Tidigare forskning Query Expansion Text mining och synonymgenerering Word2Vec 4 4 Metod Systematisk litteraturstudie Produkt- och eventdata Dataformatering Synonymgenerering Söksimulator Filtrering av de genererade synonymböckerna Implementation Metoddiskussion Resultat Utan synonymer Manuella synonymer Automatiska synonymer med 0.63 i cosine similarity Automatiska synonymer med 0.68 i cosine similarity Automatiska synonymer med 0.70 i cosine similarity Filtrerade synonymer Jämförelser mellan resultat Analys och diskussion Matchade Köp Produktträffar No-hits Genomsnittlig söktid Distribution av matchade köp Kvalitativ dataanalys Den filtrerade synonymboken Uppdagade problem och förslag på förbättring Slutsatser och vidare forskning 30 8 Bilagor Ordlista
8
9 1 Inledning I dagens internetsamhälle finns all världens information tillgänglig genom användandet av datorer, smartphones etc. På daglig basis används sökmotorer som t.ex. Google för att hitta olika typer av information, men även sökmotorer på hemsidor för att söka efter produkter eller tjänster. För att dessa sökmotorer skall producera ett resultat som tillfredsställer en användares informationsbehov används bland annat metoder för att utvinna kärnfull information ur större textmängder, till exempel för att associera textkällor till specika kategorier. Anledningen till detta är för att spara tid på att inte manuellt behöva läsa igenom stora samlingar text. Sådana metoder kan även användas för att utvinna synonymer utifrån textkällorna. Att använda automatiskt genererade synonymer för att utöka söksträngar har visats sig producera ett mer relevant sökresultat för förslag på dokument eller hemsidor som en användare kan tänkas leta efter [1, 2, 3]. Att formulera en söksträng som tar fram relevant information kan vara svårt. En användare är inte alltid helt hemtam i de domäner som informationsbehovet tillhör, och det kan därför ibland bli svårt att få ett system till att rekommendera det man faktiskt är ute efter. Domänkunskap kan tänkas vara viktigt för att söka efter information, eftersom valet av sökfras som ställs till systemet kan variera beroende på hur mycket kunskap man har inom domänen. Ett exempel på detta kan vara att en användare väljer att söka efter sökfraserna köksluckor och fronter där dessa två termer är synonymer i den domän de befinner sig i. Det kan därför tänkas att en användare vill få samma resultat oavsett vilken sökfras som söks efter då båda orden i detta fallet hör till samma produkt. Här ser vi möjligheten att undersöka hur en välanvänd metod för automatisk synonymgenerering påverkar sökresultatet inom e-handel. 1.1 Mål och Syfte Målet med denna studie är att utvärdera metoden Word2Vec för att se hur metodens synonymgenerering lämpar sig för att utöka söksfraser inom e-handel. Syftet med denna studien är att försöka förbättra processen för informationshämtning inom e-handel med hjälp av Word2Vec. Studien kommer alltså bidra till möjligtvis förbättrade sökmetoder som kommer att kunna användas av olika tjänster inom e-handel. 1.2 Frågeställning Vår studie ämnar att undersöka hur sökresultat inom e-handel påverkas av query expansion med hjälp av automatisk synonymgenerering genom Word2Vec, och utifrån detta har följande forskningsfrågor utformats: F1. Hur påverkas antalet träffar? F2. Hur påverkas no-hits? F3. Hur påverkas distributionen av tidigare köpta produkter i sökresultatet? F4. Hur påverkas relevansen av produkterna i sökresultatet? 1
10 1.3 Avgränsningar Vi har valt att avgränsa oss till att enbart använda oss utav engelska datamängder för synonymgenerering i form av Google News och eventdata. Detta har vi gjort eftersom datamängderna innehåller betydligt mycket mer data än de svenska motsvarigheterna och enligt Mikolov m. fl. [4] så förbättras synonymgenereringen av större datamängder. Dessutom är söksträngarna som används i arbetets tester enbart på engelska. För val av metod för synonymgenerering har vi valt att avgränsa oss till att endast använda Word2Vec som metod för synonymgenerering för att arbetet inte ska bli för stort. Vi valde en färdig implementation då vi inte fokuserar på att förbättra algoritmen utan vill istället se hur den lämpar sig för e-handelsdomänen. Vi har valt att avgränsa oss till att endast undersöka hur Word2Vec lämpar sig för query expansion inom mode. Motiveringen till detta är att den produkt- och eventdata som används för studien kommer från ett stort företag inom e-handelsindustrin som enbart säljer kläder, skor, accessoarer, smink etc. 2 Tidigare forskning Ett flertal problem har uppmärksammats inom effektivitet och resultat av sökningar efter olika typer av information. De problem som uppstår med de nuvarande metoderna är att de är begränsade i sina möjligheter till att hitta relevant information [1, 2, 5, 6]. Detta kan exempelvis bero på att ett söksystem utökar en söksträng med irrelevanta synonymer p.g.a. att systemet inte förstår en söksträngs kontext [7], möjligheterna att söka efter relevant information kan kräva en viss domänkunskap som t.ex. språk eller teknisk nivå [1, 6] eller att nuvarande metoder har begränsningar i sina möjligheter att modellera olika typer av associationer mellan ord [8, 9]. Att modellera både paradigmatiska- och syntagmatiska associationer kan vara viktigt för att fylla en användares behov, eftersom att ett visst ord har en specifik betydelse när en användare formulerar en söksträng [9]. Syntagmatiska relationer är ord som ofta dyker upp i en viss sekvens och tillsammans skapar en viss innebörd, medan paradigmatiska relationer är sådana ord som kan ersätta varandra utan att meningens innebörd ändras. Ett exempel på en syntagmatisk relation skulle kunna vara alla ord som bidrar till kontexten i meningen En hund ramlade ned från en stol. En paradigmatisk relation i denna mening hade kunnat vara att man bytte ut ordet hund mot katt eller stol mot säng som hade bidragit till meningen En katt ramlade ned från en säng. 2.1 Query Expansion Flera angreppssätt har tagits fram i tidigare forskning för att automatiskt försöka lösa bland annat problemen som nämnts ovan. Det som det rådande forskningsläget har gemensamt är att man i samtliga fall försöker utöka söksträngar för att på så sätt kunna förbättra och effektivisera sökresultat genom att utöka räckvidden för sökning men också att enbart ta fram ett sökresultat som faktiskt är relevant, och på så sätt få en bättre precision [7, 5, 10, 6, 1, 2, 11]. Precision innebär antalet relevanta resultat som returnerats genom det totala antalet returnerade resultatet [5]. Räckvidden i detta fallet innebär antalet relevanta resultat som returnerats genom totala antalet relevanta information som 2
11 finns i datamängden och kallas ofta recall i tidigare forskning [5]. Ett flertal studier menar att en viktig del av utökningen är den förbehandling man gör med den ursprungliga söksträngen [7, 2, 8, 3]. Denna förbehandling brukar utföras för att sålla ut sådan text som inte anses vara relevant för den datamängd man ska använda. Denna irrelevanta text kan bestå av speciella tecken som exempelvis används i XML- och JSONfiler, vanligt förekommande ord som tas bort med hjälp av metoder så som TFIDF och stop-word removal och filtrering av olika typer av ordklasser med hjälp av part of speech tagging och stemming. På detta sätt förhindrar man att ord som exempelvis en och ett som förekommer extremt många gånger i texter läggs till i utökningen av söksträngen. 2.2 Text mining och synonymgenerering För att skapa förutsättningar för att hitta ord eller termer som är relevanta för en söksträng, kan automatisk text mining utföras på stora källor av text för att skapa en synonymordbok. Dessa källor kan vara stora delar av Wikipedia [3], Google News [10, 11], Microsoft Research Paraphrase Corpus [8], Yelp betyg [8], hemsidor som har blivit förbehandlade så att de endast innehåller ren text [2], läkarjournaler [6], religiösa skrifter [1] m. fl. Den framtagna synonymordboken används i de flesta fallen för att förlänga söksträngar med länkade ord eller fraser med förhoppningen av att förbättra relevansen och räckvidden för sökresultatet [7, 5, 10, 6, 1, 2, 11], men även för att jämföras med manuellt skapade synonymer utifrån olika texter [3]. Att skapa förutsättningen för att kunna beräkna likheten mellan ord utifrån dessa enorma källor av text kan göras genom olika tillvägagångssätt. Det som generellt sätt görs är att man undersöker hur ofta olika ord dyker upp tillsammans i texterna som analyseras [1, 2, 3, 6]. Att generera synonymerna för att förlänga söksträngar kan göras på olika sätt. POST (Part of Speech tagging) använder sig av kontexten för att kunna tagga olika ordklasser i en text. Detta görs eftersom samma ord kan ha olika betydelser i olika kontexter, som exempelvis building som både kan vara ett verb och ett substantiv, och vikten läggs på hur ett ord används, snarare än vad ordet betyder [7]. Topic modeling används för att gruppera ord och tilldela dem kategorier som de tillhör för att lättare hitta liknande information [6]. Kluster av synonymer används även för query expansion. Sådana kluster kan genereras från lexikala synonymdatabaser som WordNet och kan innehålla flera nivåer av synonymer [2]. Metoder för Vector Space Model(VSM) är populära inom den tidigare forskningen. Dessa metoder genererar någon form av datastruktur som består av vektorer som representerar olika ord [3, 10, 1, 11]. Genom VSM delas texterna upp i matriser innehållandes olika ord, och genom att stega igenom dessa matriserna kan man beräkna hur ofta olika ord tenderar att uppstå tillsammans. Några av de metoder som är värda att nämna är Word2Vec och Latent Dirichlet Allocation (LDA). LDA är en typ av topic model-metod som används för att förklara varför vissa delar av den data man arbetar med är lika. Exempelvis kan en bit av en text som handlar om katter hamna under katt relaterat och kan på så vis användas för att sedan visa denna text som resultat när en användare söker efter kattrelaterade sökfraser [1, 6]. Word2Vec är en samling av modeller som genom neurala nätverk omvandlar text till vektorer. Vektorerna tränas genom att metoden försöker beräkna sannolikheten för att ett visst ord skall dyka upp baserat på orden runt 3
12 om kring, och detta görs genom hela texten som analyseras [11]. För att sedan beräkna hur lika, eller olika orden är, så utförs ytterligare beräkningar för att utifrån dessa vektorer dra slutsatser om vilket eller vilka ord som verkar vara mest lika det ord eller de termer som söktermen ursprungligen bestod av [3]. Ett flertal studier använder även vanliga synonymordböcker i sin process. WordNet, som är en lexikal databas och bland annat används för synonymer, är den källa som använts mest i den tidigare forskningen som undersökts. Synonymerna från WordNet används oftast i kombination med en metod för text mining, dels för query expansion men även för att beräkna likheten mellan meningar [5, 2, 8]. Med hjälp av text mining och query expansion uppvisar de framtagna metoderna ett bättre sökresultat i precision och recall [3, 5, 6, 1, 2]. Resultatet påverkas av kvalitén på synonymordboken som genereras, och det är därför viktigt att lägga fokus på metoden för synonymgenering [1]. Den tidigare forskningen visar ett forskningsgap av automatisk synonymgenerering för query expansion inom e-handel, men baserat på det uppvisade resultatet i den tidigare forskningen kan det tänkas att dessa metoder även bör uppvisa ett bättre sökresultat inom e-handel. 3 Word2Vec Distribuerade representationer av ord innebär att ord representeras som vektorer innehållandes reela tal. Många metoder använder sig utav en sådan representation av ord eftersom det har hjälpt träningsalgoritmer att uppnå bättre resultat genom att gruppera liknande ord [4]. Två av de mer kända metoderna som även har setts användas i tidigare forskning är Latent Semantic Analysis (LSA) och Latent Dirichlet Allocation(LDA). Tomas Mikolov m. fl. menar att tidigare forskning har bevisat att framtagningen av distribuerade representationer av ord genom neurala nätverk bidrar till en bättre prestation än tidigare nämnda metoderna [12]. Med bättre prestation menar de att neurala nätverk ger bättre resultat än LSA överlag och behöver inte använda lika mycket datorkraft på större datamängder till skillnad från LDA. Deras förslag på en ny implementation genom neurala nätverk är vad de kallar Word2Vec och är även den metod som kommer att användas i denna studie. Word2Vec kan användas för att mäta semantiska och syntaktiska likheter mellan ord. Exempel på semantiska likheter mellan ord skulle kunna vara likheten mellan Sverige och Stockholm jämfört med Danmark och Köpenhamn eller Sverige och Krona jämfört med Storbritannien och Pund. Word2Vec kan alltså dra slutsatser om semantiska likheter genom algebraiska operationer så som vektor( man ) - vektor( kung ) + vektor( kvinna ) som ska resultera i vektor( drottning ) om dessa ord förekommit tillräckligt ofta när man har tränat sin datamängd. Syntaktiska likheter är likheter mellan ord så som superlativ, plural, motsatser osv. Alltså exempelvis bred och bredast, mus och möss och bra och dålig. Dessa likheter beräknas genom att identifiera hur långt avstånd det är mellan de två olika vektorernas vinklar, något som kallas cosine similarity. Word2Vec erbjuder två olika arkitekturer för inlärning av distribuerade representationer av ord. Continuous Bag-of-Words Model(CBOW) och Continous Skip-gram Model [12]. CBOW försöker att förutspå vilket ord som borde sättas in i en specifik kontext. Exempelvis kan man befinna sig i kontexten Det är väder idag och CBOW försöker 4
13 då förutspå vilket ord det är vi letar efter. Har vi tränat tillräckligt mycket data kan vi få ett resultat som varmt eftersom att det ordet har förekommit flest gånger inom liknande kontexter. Continous Skip-gram tar emot ett ord som indata och försöker placera ut detta ord i en kontext. Ett exempel på detta skulle vara att man får ordet varmt som inmatning och då försöker förutspå den mest lämpliga kontexten för detta ord. Detta skulle kunna vara Det är väder idag. CBOW är snabbare än Skip-Gram men Skip- Gram presterar bättre när man arbetar med ord som inte förekommer väldigt ofta. I båda arkitekturerna används context-window som en parameter för hur många ord man ska hålla reda på innan och efter det ord man arbetar med. Mikolov m.fl. [4] menar att 5 ord innan och efter det ordet man arbetar med är ett bra värde på context-window när man ska träna sin datamängd. En visualisering på de två olika arkitekturerna kan hittas i figur 1. Figur 1: Jämförelse av CBOW och Continous Skip-gram För att träna sin data med hjälp av Word2Vec så används antingen Hierarchical Softmax eller Negative Sampling. Negative Sampling väljer ut ett ord ifrån ett specificerat antal ord som kontext och försöker hitta ett annat ord som ofta dyker upp tillsammans med det ordet man arbetar mot. När en sådan matchning har hittats så bildar dessa två orden ett par med värdet 1. Därefter tar man slumpmässigt fram k ord ifrån datamängden och bildar par med det ord vi arbetar mot där k representerar antalet slumpmässigt utvalda ord man väljer att ta fram. Dessa paren sätts sedan till 0. Enligt Mikolov m.fl. [4] är 5-20 slumpmässigt utvalda ord är bra värde för mindre datamängder medan större datamängder inte behöver mer än 2-4 stycken slumpmässigt utvalda ord. Om man exempelvis hade arbetat med meningen Jag gillar att äta flingor till frukost. med fokus på ordet äta och k hade satts till 3 så hade resultatet av negative sampling kunnat se ut som i följande tabell. 5
14 Tabell 1: Exempel på Negative Sampling för Jag gillar att äta flingor till frukost. Kontext Ord Mål Äta Flingor 1 Äta Kung 0 Äta Hund 0 Äta Att 0 Hierarchical Softmax använder sig av ett binärt träd där löven representerar alla ord som finns i den datamängd man arbetar i och alla inre noder representerar sannolikhet. Med hjälp av detta binära träd kan man sedan beräkna sannolikheten av att ett ord förekommer i liknande kontexter som ett annat. I Word2Vec använder sig Hierarchical Softmax av ett binärt huffmanträd för att dessa tilldelar korta koder för frekventa ord som resulterar i snabbare träning av datamängden [4]. Ett problem med stora datamängder av text är att de mest frekventa orden som dyker upp ofta är ord som inte är lika viktiga som andra ord. Dessa ord kan dyka upp flera miljontals gånger. Detta kan exempelvis bidra till att kopplingar som hund och valp inte får lika bra likhetsbedömning som exempelvis hund och en. För att förhindra att ord som dessa ska vinna över ord som vi anser vara mer intressanta så använder vi oss av subsampling i Word2Vec. Detta innebär att vi inte hanterar dessa högt förekommande orden på samma sätt som de mer intressanta orden och därför löser vi dessa problem. Mikolov m.fl. [4] menar att ett sumbsampling värde på runt 10 5 är ett bra värde att använda för träningen av datamängden. 4 Metod 4.1 Systematisk litteraturstudie För att samla data och information om det rådande forskningsläget som kommer att stå till grund för denna studie har en systematisk litteraturstudie utförts. Denna systematiska litteraturstudie utförs för att vi ska hitta relevant information inom forskningsområdet och inte bara välja ut artiklar som passar oss. Söksträngen som använts i sökningsprocessen av artiklar delades in i två sektioner, med de boolska operatorerna AND mellan de två sektionerna och OR mellan var ord i sektionerna då vi ser att antingen eller kan ta fram relevant information, där den ena sektionen representerade text- och/eller data mining och den andra sektionen representerade synonymgenerering. Sökningarna utfördes i databaserna IEEE och ACM då dessa anses vara relevanta inom området datavetenskap och således relevanta för denna studie. För att säkerhetsställa att forskningen som står till grund för arbetet är aktuell filtrerades resultatet till att enbart visa artiklar från 2011 och framåt, samt endast konferens- och journalartiklar. Söksträngen som användes i litteraturstudien såg ut som följande: (( text mining OR data mining ) AND (synonym* OR thesaurus OR syntagmatic OR paradigmatic )). 4.2 Produkt- och eventdata Den data som används för denna studien kommer från ett välkänt företag inom mode och e-handel. Anledningen till att denna data används är för att datamängden innehåller 6
15 mycket information och för att företaget som äger den har gett godkännande om att den får användas inom forskningssyfte. Den består huvudsakligen av en produktkatalog och eventloggar. Två olika datamängder används av event loggade på separata dagar. Eventloggarna består av event som innehåller information som exempelvis söksträngar, antal sökträffar, information om köp som exempelvis hur många produkter som köpts och vilka positioner i sökresultatet som de köpta produkterna har befunnit sig i. Av alla event som finns i datamängderna så innehåller den första datamängden event som är sökningar, och den andra Sökfraserna från den första datamängden kommer att användas för synonymgenerering. Produktkatalogen innehåller alla produkter, och data om produkterna, som fanns till salu under den dagen som eventen loggades. Produktdatan innehåller information som exempelvis titel, produktbeskrivning, produktgrupp, storlekstyper m.m. 4.3 Dataformatering För att förbereda datan för simulatorn som används för att utvärdera metoden i ett senare steg så tranformeras datamängden innehållande all produktinformation då produktkatalogen är anpassad för en äldre version av simulatorn. Produktkatalogen representeras i form av en XML-fil som behöver läsas in och struktureras om fullständigt innan data kan skrivas till en ny fil. Detta görs genom en Java-implementation eftersom att simulatorn som används är sedan tidigare implementerad i Java, och blir därför lättare att integrera med. Java-implementationen skapar upp den nya filstrukturen som sedan fyller noderna med data från den tidigare produktkatalogen. All produktinformation bevaras under processen och endast strukturen förändras. 4.4 Synonymgenerering Synonymerna som används för att utvärdera metoden och besvara forskningsfrågorna genereras utifrån loggad eventdata. För framtagandet av synonymerna till denna eventdata används färdigtränade vektorer som tränats genom Word2Vec utav skaparna till metoden. Vektorerna har tränats på en datamängd från Google News innehållandes 100 miljarder ord, och resulterade i 300 vektordimensioner som representerar 3 miljoner unika ord och fraser. Dessa vektorer tränades med hjälp av CBOW-arkitekturen med 300 vektordimensioner, en context window på 5, sample size på 10 5 och med hjälp av träningsalgoritmen negative sampling. Som tidigare nämnts i detta arbete så anses de valda värdena för parametrarna vara optimala för datamängdens storlek [4]. Träningen resulterar i de färdigtränade vektorerna som består av 3 miljoner ord och fraser kopplade till ord med semantiska likheter. Eftersom att Mikolov m.fl. anser att stora datamängder med många dimensioner presterar bättre valdes denna färdigtränade datamängd då det var den största vi kunde hitta [12]. Söksträngarna från eventdatan används för att ta fram synonymerna som används för studiens experiment. För att göra detta bearbetas söksträngarna på två olika sätt. I det första skedet delas söksträngen upp ord för ord, och i det andra skedet delas orden i söksträngen upp parvis enligt ordningen de uppstår. Anledningen till att vi delade upp det på detta viset är för att det engelska språket har många särskrivna ord. Ett exempel på detta hade varit det svenska ordet fotbollsskor som i engelskan istället hade hetat football shoes. Tabellerna nedan illustrerar exempel på hur söksträngar bearbetas: 7
16 Tabell 2: Bearbetning av söksträngen Black Leather Jacket Black Leather Jacket Ord Fraser Black Black Leather Leather Leather Jacket Jacket Tabell 3: Bearbetning av söksträngen Men Sporting Sweatshirt Men Sporting Sweatshirt Ord Fras Men Men Sporting Sporting Sporting Sweatshirt Sweatshirt När söksträngen har behandlats påbörjas synonymgenereringen. För varje ord och/eller fras genereras nio olika synonymfiler med respektive tröskelvärde på 0.63, 0.68 och 0.70 i cosine similarity. För varje tröskelvärde sparas de 5, 10 och 100 närmsta synonymerna i separata filer. Motiveringen till att olika antal synonymer väljs är för att undersöka huruvida man kan tjäna på att hämta ett färre antal synonymer för ett lägre tröskelvärde, alternativt att hämta ett större antal synonymer för ett högre tröskelvärde. När synonymerna genereras så hämtas max det specificerade antalet, oavsett om det finns fler synonymer som matchar kriteriet för tröskelvärde. I vissa fall händer det att vissa ord vars kopplade synonymer som har låg cosine similarity faktiskt kan anses vara bra synonymer trots deras låga cosine similarity. I fall som dessa vill man inte gå miste om dessa synonymerna då vi förlorar värdefull information på detta vis. På samma sätt kan vissa ord ha flertalet synonymer som anses vara bra och därför har synonymer genererats utifrån olika tröskelvärden och olika antal synonymer. Risken med ett lägre tröskelvärde är däremot att få med synonymer som inte är relevanta för sökningen, detta försöks minimeras genom att endast hämta ett fåtal synonymer per ord, exempelvis 5. Respektive tröskelvärden och framtagning av antal synonymer valdes ut efter manuell granskning av automatiskt generade synonymer och representerar låg, medium och hög cosine similarity. De hämtade synonymerna skrivs sedan ut till en synonymbok för respektive tröskelvärde och antal hämtade synonymer. Synonymboken representeras av en XML-fil för att kunna användas i söksimularorn. Tabell 4: Antalet synonymer som genereras från Google News datamängd för respektive tröskelvärde Cosine Similarity Topp Topp Topp Manuellt framtagna synonymer används också för studiens experiment för att jämföra 8
17 hur mycket bättre eller sämre det blir att försöka generera synonymer automatiskt jämtemot manuellt. Dessa synonymerna är en del av e-handelsplattformen som studien baseras på och är framtagna utifrån produktkatalogen och e-handelstjänsten som används för studiens experiment. Eftersom synonymerna tillhör e-handelsplattformen är datamängden inte tillgänglig för allmänheten. Processen för att ta fram de manuella synonymerna har skett före detta arbete och är ingenting som har gjorts under studiens gång utan används endast för jämförelser. De manuella synonymerna tas fram utifrån produktdatan och är strukturerade så att de oftast går till en relevant produktkategori, snarare ett liknande ord. Ett exempel på detta är exempelfrasen Baseball Jacket som är kopplad med synonymen Outerwear. De manuella synonymerna är alltså subjektivt framtagna utifrån vad som anses vara lämpliga synonymer för produkterna i produktkatalogen. Processen för att manuellt ta fram synonymer är tidskrävande eftersom man måste ha personal som spenderar tid på att skriva ned ett stort antal synonymer istället för att ha det som en automatiserad process. Ett diagram på hur processen ser ut för metoden till experimentet finns att se i figur 2. Figur 2: Processen som körs från början till slutet av simuleringen. 4.5 Söksimulator Simulatorn som används för studiens experiment är utvecklad utifrån den e-handelsplattform som den produkt- och eventdata som används för studien kommer ifrån, och är utvecklad i forskningssyfte av företaget som äger e-handelsplattformen. E-handelsplattformen är en produkt som utvecklas och säljs av ett företag och eftersom att simulatorn är en del av plattformen så kommer simulatorn enbart att beskrivas övergripande i följande avsnitt. Simulatorn är sessionsbaserad och simulerar de loggade eventen för att ta reda på skillnader efter att exempelvis synonymer tillagts. Simulatorn använder riktiga sökningar som utförts av en användare och returnerar bland annat antalet produktträffar och köp 9
18 som användare gjort efter sökningen. Genom att tillsätta synonymer kommer resultatet för sökningarna troligtvis att förändras och förflytta sig. Ett exempel på detta kan vara att en kund sökt efter black leather jacket och köpt produkten på den 6e platsen i sökresultatet. När synonymerna sedan tillsätts utförs samma sökning i simulatorn och så utvärderar den om köpen som tillhör sökningen flyttats framåt eller bakåt i sökresultatet. Sökningarna som utförs returnerar relaterade produkter till sökord eller fraser från produktkatalogen. Simulatorn utför även automatisk korrigering av stavning eller pluralisering för sökningar, ett exempel på detta är att vid en sökning på ordet hoop utförs även sökningar för ordet hoops, samma princip används vid uppslag av synonymer. Synonymerna utnyttjas genom att simulatorn använder sig utav den booleska operatorn OR för att utföra sökningen med olika kombinationer av synonymer för originalsökfrasen och returnerar ett resultat för alla kombinationer. För att ta fram köprelaterade resultat använder sig simulatorn av händelser som är sammanhängande i sessioner. Simulatorn går igenom alla sökningarna som har lett till ett köp i en session och ökar Köpnivå när den hittar hittar ett köp av en produkt som befinner sig inom de första tjugo produkterna i sökresultatet. Anledningen till att en gräns dras efter de tjugo första platserna i sökresultatet är för att det generellt sett är den mängden produkter som visas upp per sida i sökresultatet, och att det är önskvärt att förbättra det sökresultat som användaren bemöts av direkt vid sökning. För att en användare skall kunna se de produkter som kommer efter de tjugo första platserna skulle exempelvis kunna kräva att användaren manuellt klickar sig vidare till nästa sida i sökresultatet, vilket är något som e-handelsplattformen vill minimera då det kan antyda att produkterna som befinner sig i toppen av sökresultatet är irrelevanta. I testerna som använder sig av synonymer förändras dessa värden när följande inträffar: En användare har exempelvis i en session använt söksträngen hoops men inte köpt en produkt från sökresultatet, därefter söker användaren med söksträngen basketball och köper en produkt från sökresultatet. Simulatorn observerar sedan om basketball finns som synonym till hoops, och om synonymerna matchar ökar matchade köp om produkten fanns bland de tjugo första produkterna i sökresultatet. 4.6 Filtrering av de genererade synonymböckerna För varje simulerad sökning producerar simulatorn även ett numeriskt värde, som representerar vilken effekt söksträngen har. Detta värde beräknas enligt följande formel: Figur 3: Formel för att beräkna hur bra en söksträng är. För att försöka förbättra synonymerna som genereras så används värdet som nämns ovan för att ta bort synonymer till söksträngar. Detta görs genom att jämföra effekten för en söksträng med synomer och utan synonymer, om söksträngens effekt är lägre med synonymer än utan, tas alla synonymer bort enligt samma sätt som de genererats. Detta utförs på synonymböckerna som leder till minst respektive flest matchade betalningar i söksimulatorn. De filtrerade synonymböckerna används sedan i söksimulatorn. Anledning- 10
19 en till att vi har valt att utföra förbättringen på de synonymböcker med minst respektive flest matchade betalningar är för att vi vill undersöka hur stor skillnad det kan bli på resultatet som visar minst respektive mest relevanta produkter. Testmängden som används för att utvärdera de filtrerade synonymböckerna är loggad dagen efter träningsmängden. En visuell kvalitativ analys kommer även att utföras på filer som innehåller visuella skillnader för sökningarna som görs i simuleringarna. Dessa filer visar skillnader i sökresultatet för med- och utan användning av synonymer. Sökresultatet i filerna består av bilder på produkterna som returnerats, samt vilka synonymer som använts för söksträngen. Detta resultat visar alltså vilka extra produkter som hämtas genom användandet av synonymer. 4.7 Implementation För att utföra våra tester utvecklas en Maven-modul i programmeringsspråket Java. Anledningen till detta är för att den simulator som integreras med modulen också är byggd i Java. DeepLearning4j är ett java-bibliotek som används för att kunna arbeta med datamängden av vektorer som genereras av Word2Vec och som i sin tur används för att beräkna likheter mellan olika ord som tas fram från eventdatan och dess synonymer. Anledningen till att DeepLearning4j valdes är för att detta bibliotek är rekommenderat för javautvecklare på Google-Codes sida om Word2Vec [13]. Synonymerna till söksträngarna från eventdatan skrivs ut i XML-format för att kunna läsas av simulatorn. 4.8 Metoddiskussion Experiment anses vara lämpligast för denna studie då den datagenerering som görs består av observationer i form av event från e-handelsplattformen som sedan kan analyseras enligt en kvantitativ dataanalys. Eftersom att den eventdata som används bygger på observationer från ett riktigt e-handelssystem i produktion där användare har skrivit in söksträngar så bidrar detta till att datan blir mer trovärdig att användas i ett experiment. Användarna har alltså inte varit medvetna om att datan kommer att användas för testerna och således sökt i normala omständigheter. Enligt Oates har det bevisats att data som är framtagen av människor som vet om att deras data kommer att användas i experiment kan leda till att datan blir missvisande [14, pp ]. Detta för att människor i vissa fall väljer att utföra val som de vanligtvis inte hade gjort. För att kunna validera resultatet av de filtrerade synonymordböckerna har vi annan testdata än träningsdata. Testdatan som används under simuleringen är hämtat från samma system som träningsdatan, fast från dagen därpå. Av föregående anledningar anser vi att vi uppfyller intern validitet i den datan vi har valt att utföra våra experiment på. För att kunna generalisera resultatet för studien har vi valt att träna Word2Vec på en datamängd från Google News. Datamängden innehåller 100 miljarder ord hämtade från nyheter för en rad olika kategorier som exempelvis handel, världen, hälsa, politik, teknologi, sport, vetenskap, underhållning m.fl [15]. Synonymerna genereras alltså inte utifrån enbart domänspecifik data inom mode och det kan därför tänkas att resultatet är representativt för andra områden inom e-handel. Den data som genereras från testerna och som står till grund för att kunna besvara F. 1-3 är kvantitativ data eftersom den representerar exempelvis antal sökträffar, antal sök som lett till köp och så vidare. En kvantitativ dataanalys är därför lämplig som metod [14, p. 172]. 11
20 För att besvara F. 4 och ytterliggare kunna validera och förstå relevansen av resultatet från den kvantitativa analysen kommer vi även att utföra en visuell kvalitativ analys av skillnaden mellan de produkter som hämtats för söksträngar med- och utan synonymer för de filtrerade synonymböckerna. Genom att undersöka skillnaderna i sökresultaten kan vi avgöra huruvida de extra produkterna som hämtats med hjälp av synonymer är relevanta eller inte. 12
21 5 Resultat För att utvärdera huruvida de framtagna synonymerna påverkar resultatet av sökningarna kommer experimentet använda sig av samma grupp, eventdatan, med för- och eftertest. Simulatorn körs ett antal gånger, där den första körningen körs utan användning av synonymer och resterande körningar använder sig av olika typer av genererade synonymer. För att ge en tydligare bild av resultatet körs även simulatorn med synonymer som skapas manuellt utifrån produktkatalogen. Resultatet av testerna jämförs för att besvara forskningsfrågorna. Testerna genererar följande data: Sessioner = Antalet session som har loggats i eventdatan. Köpta Produkter = Totala antalet köpta produkter i de loggade eventen. Sessioner med köp = Antalet sessioner som innehåller köp. Sessioner med köp efter sök = Antalet sessioner med köp efter att en sökning gjorts. Sökningar = Antalet event som är sökningar. Köp = Totala antalet köp i eventdatan. Matchade köp = Antalet köpta produkter som visas på de tjugo första platserna i sökresultatet. Distribution av matchade köp = Tabellen representerar antalet matchade köp för varje position i sökresultatet. Första positionen representerar alltså hur många av de köpta produkterna som varit först i sökresultatet. Sista positionen representerar hur många av de köpta produkterna som legat på tjugonde platsen i sökresultatet. Det som eftersträvas är att matcha så många köp som möjligt som möjligt så tidigt som möjligt i sökresultet. Antal sökningar = Antalet event som är sökningar. Produktträffar = Antalet produkter som sökningarna returnerat. Genomsnittlig söktid (ms) = Genomsnittlig söktid i millisekunder. Topp 5, 10, 100 = Maxantalet synonymer som hämtas för ett ord eller en fras. Filtrerad = För denna kolumnen har vi använt oss av synonymboken från kolumnen Topp 100, men tagit bort alla synonymer till söksträngar som fått försämrad effekt enligt Figur 3, därefter har vi kört om simuleringen med den nya synonymboken. Tabell 5: Eventdata Sessioner Köpta Produkter Sessioner med köp Sessioner med köp efter sök 2573 Sökningar Köp Tabellen ovan innehåller övergripande information som finns i den eventdata som används för testerna i simulatorn. 13
22 5.1 Utan synonymer Tabell 6: Simulatorresultat del 1 utan synonymer Antal sökningar Matchade köp 3192 Produktträffar No-hits 2327 Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs utan användning av synonymer. Utan några synonymer hittas 3192 köpta produkter inom de tjugo första produkterna i sökresultatet sökningar genererar 0 produktträffar och totalt når alla sökningarna till produkter. Genomsnittlig söktid för simulatorn att utföra sökningarna är 84.78ms. Tabell 7: Simulatorresultat del 2 utan synomer Position Köpnivå Tabellen ovan visar distributionen av de matchade köpen för testerna som körs utan användning av synonymer. 14
23 5.2 Manuella synonymer Tabell 8: Simulatorresultat del 1 för manuella synonymer Antal sökningar Matchade köp 3265 Produktträffar No-hits 2106 Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av manuellt skapade synonymer. Med de manuellt framtagna synonymerna hittas 3265 köpta produkter inom de tjugo första produkterna i sökresultatet sökningar genererar 0 produktträffar och totalt når alla sökningarna till produkter. Genomsnittlig söktid för simulatorn att utföra sökningarna är 99.15ms. Tabell 9: Simulatorresultat del 2 för manuella synonymer Position Köpnivå Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av manuellt genererade synonymer. 15
24 5.3 Automatiska synonymer med 0.63 i cosine similarity Tabell 10: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.63 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.63 i cosine similarity. Tabell 11: Simulatorresultat del 2 för automatiska synonymer med 0.63 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet
25 5.4 Automatiska synonymer med 0.68 i cosine similarity Tabell 12: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.68 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.68 i cosine similarity. Tabell 13: Simulatorresultat del 2 för automatiska synonymer med 0.68 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet
26 5.5 Automatiska synonymer med 0.70 i cosine similarity Tabell 14: Simulatorresultat del 1 för automatiska synonymer från Google News med 0.70 i cosine similarity Topp 5 Topp 10 Topp 100 Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av automatiskt genererade synonymer utifrån vektorerna som tränats med datamängden från Google News. Synonymerna som används för resultatet ovan genereras med ett tröskelvärde på 0.70 i cosine similarity. Tabell 15: Simulatorresultat del 2 för automatiska synonymer med 0.70 i cosine similarity Köpnivå Position Topp 5 Topp 10 Topp Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av automatiskt genererade synonymer över tröskelvärdet
27 5.6 Filtrerade synonymer För utvärdering över hur de filtrerade synonymerna påverkar sökningar i systemet har vi använt oss av eventdata insamlad en dag efter den eventdata som använts i tidigare experiment. Tabell 16: Eventdata Sessioner Köpta Produkter Sessioner med köp Sessioner med köp efter sök 2133 Sökningar 8378 Köp Tabell 17: Simulatorresultat och jämförelser för filtrerad synonymbok med 0.63 cosine similarity Utan Synonymer 0.63 Ofiltrerad 0.63 Filtrerad Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av den filtrerade synonymboken med tröskelvärdet
28 Tabell 18: Simulatorresultat del 2 för filtrerad synonymbok med 0.63 cosine similarity Köpnivå Position Utan Synonymer 0.63 Ofiltrerad 0.63 Filtrerad Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av den filtrerade synonymboken med tröskelvärdet Tabell 19: Simulatorresultat del 1 för filtrerad synonymbok med 0.70 cosine similarity Utan synonymer 0.70 ofiltrerad 0.70 filtrerad Antal sökningar Matchade köp Produktträffar No-hits Genomsnittlig söktid (ms) Tabellen ovan innehåller resultatet för simulatorn som körs med användning av den filtrerade synonymboken med tröskelvärdet
29 Tabell 20: Simulatorresultat del 2 för filtrerad synonymbok med 0.70 cosine similarity Köpnivå Position Utan Synonymer 0.70 ofiltrerad 0.70 filtrerad Tabellen ovan visar distributionen av de matchade köpen för testerna som körs med användning av den filtrerade synonymboken med tröskelvärdet Jämförelser mellan resultat Resultaten av antalet no-hits, antalet produktträffar, antalet matchade köp och den genomsnittliga söktiden ifrån de olika sökmetoderna som har tagits fram jämförs i kommande diagram med det resultat som framtagits utan synonymer och ställs mot varandra genom att observera den procentuella skillnaden mellan dessa. 21
30 Figur 4: Jämförelse mellan antalet matchade köp i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av antalet matchade köp för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. Resultatet visar att den filtrerade synonymboken från tröskelvärdet 0.70 matchar flest köp med en ökning av matchade köp på 2.33%. Alla automatiskt genererade synonymer, förutom de som genereras över tröskelvärdet 0.70, matchar färre köpta produkter än testet som inte använder synonymer. För att den automatiserade versionen av genererade synonymer ska anses som användbar krävs det att den procentuella skillnaden ska vara positiv. Figur 5: Jämförelse mellan antalet produktträffar i de olika sökmetoderna som använts i söksimulatorn. 22
31 Diagrammet ovan visar den procentuella skillnaden av antalet produktträffar för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. De automatiskt genererade synonymerna bidrar till fler produktträffar i alla tester i jämförelse med de manuellt genererade synonymerna eller inga synonymer alls. De automatiskt genererade synonymerna som framtagits från de 100 första synonymerna i tröskelvärdet 0.63 visar att det sker en ökning på 10.23% i produktträffar. Detta bidrar till att ytterligare produkter dyker upp i användares sökresultat i jämförelse med det fall då inga synonmer används alls. Resultatet visar att ju fler synonymer som genereras och används, desto fler produktträffar får sökningarna. Figur 6: Jämförelse mellan antalet no-hits i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av antalet no-hits för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. De automatiskt genererade synonymerna bidrar till färre no-hits i alla tester i jämförelse med de manuellt genererade synonymerna. Ju färre no-hits desto bättre. 23
32 Figur 7: Jämförelse mellan den genomsnittliga söktiden i de olika sökmetoderna som använts i söksimulatorn. Diagrammet ovan visar den procentuella skillnaden av den genomsnittliga söktiden för alla testerna som körs jämfört med det resultat som framtagits utan några synonymer alls. För att den automatiserade processen av synonymgenereringen ska anses vara användbar så ska den genomsnittliga söktiden vara så låg som möjligt. Resultatet visar att ju fler synonymer som genereras och används, desto längre blir den genomsnittliga söktiden. Ju lägre söktid desto bättre. 6 Analys och diskussion I den första delen av analysen utför vi en kvantitativ analys på den data som genererats från söksimulatorn, därefter utför vi en kvalitativ analys för att få en bättre förståelse för relevansen av resultatet. 6.1 Matchade Köp För det lägre tröskelvärdet 0.63, vilket även är det tröskelvärde som gett lägst matchade betalningar, förlorar simuleringen mellan (3.5%-5.8%) betalningar jämfört med simuleringen utan synonymer. En förlust av matchade betalningar inträffar även för tröskelvärdet 0.68, där (1.6%-2.6%) betalningar försvinner i jämförelse med simuleringen utan synonymer. Detta indikerar att de extra synonymer som genereras utifrån tröskelvärdna på 0.63 och 0.68 leder till produktträffar som orsakar ett brus av irrelevanta produkter i sökresultatet och förflyttar de relevanta produkterna som köpts för söksträngarna längre bak i resultatet. I alla fallen av simuleringarna med synonymer som genererats utifrån tröskelvärdet 0.70 leder till en förbättring på 17 (0.5%) fler matchade köp än simuleringen utan synonymer. Denna siffran är inte särskilt hög, därför är det viktigt att titta på skillnaden i antalet produktträffar och no-hits. En liten ökning på matchade köp kan tillsammans med en stor ökning av produktträffar och minskning av no-hits 24
Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merWord2Vec. Högkvalitativa vektorrepresentationer av ord tränat på stora mängder data. Innehåll LINKÖPINGS UNIVERSITET. 1. Inledning...
LINKÖPINGS UNIVERSITET Innehåll 1. Inledning... 2 2. Terminologi... 3 3. Allmänt om Word2Vec... 3 4. Continous Skip-gram model... 4 Word2Vec Högkvalitativa vektorrepresentationer av ord tränat på stora
Läs merGoogle Guide: Tips för sökoptimering
Google Guide: Tips för sökoptimering Google Guide Digital publikation www.intankt.se, Intankt Författare: Adam Ahlgren Typsnitt: Calibri, 11 punkter Formgivning: Intankt Omslagsfoto: Google Stockholm,
Läs merSnabbguide till Cinahl
Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin
Läs merSökanalys för intranät
Sökanalys för intranät 2014-12-03 Henrik Gelius OSLO STOCKHOLM Agenda Henrik Gelius, sökkonsult www.comperiosearch.com Idag tittar vi på detta: 1. Affärsnytta - sök på intranät 2. Sökanalys & nyckeltal
Läs merPubMed (Medline) Fritextsökning
PubMed (Medline) PubMed är den största medicinska databasen och innehåller idag omkring 19 miljoner referenser till tidskriftsartiklar i ca 5 000 internationella tidskrifter. I vissa fall får man fram
Läs merEn rapport om hur sökningar runt försäkringar ser ut. vad folk söker. vad de hittar
En rapport om hur sökningar runt försäkringar ser ut vad folk söker vad de hittar Innehåll Introduktion... 3 Om rapporten... 3 Searcher Intent Modelling och Carretera... 3 Termer... 4 Nyckelpåverkare...
Läs merGoogles sidrankning - linjär algebra värt en förmögenhet
Googles sidrankning - linjär algebra värt en förmögenhet Outline 1 Sökmotorer 2 Grafteori Linjär algebra 3 Målet Utifrån användarens sökord lista de mest relevanta webbsidorna. Dessutom i en ordning som
Läs merV I G Å R I G E N O M...
I N F O R M A T I O N S S Ö K N I N G V I G Å R I G E N O M... Booleska operatorer Trunkering Frassökning Wildcards Blocksökning Tips B O O L E S K A O P E R A T O R E R AND När du vill att ditt resultat
Läs merBiblioteken, Futurum 2017
Biblioteken, Futurum 2017 Om PubMed PubMed innehåller mer än 27 miljoner referenser till tidskriftsartiklar inom biomedicin, omvårdnad, odontologi m.m. PubMed är fritt tillgänglig men om du använder länken
Läs merUmeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I
HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:
Läs merInformationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek
Informationssökning - att söka och finna vetenskapliga artiklar! Mikael.Rosell@liu.se 013-282248 Linköpings Universitetsbibliotek 2 FEM saker ni SKA ta med er härifrån! Välja ut och använda relevanta databaser
Läs merSlutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008
Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek
Läs merPubMed gratis Medline på Internet 1946-
Klicka på 1. SÖK i E-biblioteket 2. Flik Databaser 3. PubMed PubMed gratis Medline på Internet 1946- www.ebiblioteket.vgregion.se Fritextsökning Skriv in de ord du vill söka på (AND läggs automatiskt in
Läs merOm uppsatsmallen vid GIH
Om uppsatsmallen vid GIH Här kan du läsa om och se exempel på hur din uppsats vid GIH ska se ut. Uppsatsmallen (.dotxfil) som du kan spara ner och skriva i finns på www.gih.se/uppsats. Huvudrubrik, dvs
Läs merPatientutbildning om diabetes En systematisk litteraturstudie
Institutionen Hälsa och samhälle Sjuksköterskeprogrammet 120 p Vårdvetenskap C 51-60 p Ht 2005 Patientutbildning om diabetes En systematisk litteraturstudie Författare: Jenny Berglund Laila Janérs Handledare:
Läs merSö ka artiklar öch annan litteratur
1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och
Läs mer1. Compute the following matrix: (2 p) 2. Compute the determinant of the following matrix: (2 p)
UMEÅ UNIVERSITY Department of Mathematics and Mathematical Statistics Pre-exam in mathematics Linear algebra 2012-02-07 1. Compute the following matrix: (2 p 3 1 2 3 2 2 7 ( 4 3 5 2 2. Compute the determinant
Läs merLäget, läget, läget. Sök, sök, sök. mars 2018/Ted Durdel
Läget, läget, läget Sök, sök, sök mars 2018/Ted Durdel Episerver Find is a powerful, scalable query platform that can index and query large amounts of structured or unstructured data of any type, create
Läs merUB:s sö ktjä nst - Söka artiklar och annan litteratur
1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merBusiness research methods, Bryman & Bell 2007
Business research methods, Bryman & Bell 2007 Introduktion Kapitlet behandlar analys av kvalitativ data och analysen beskrivs som komplex då kvalitativ data ofta består av en stor mängd ostrukturerad data
Läs merSo ka artiklar och annan litteratur
1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom
Läs merLARS. Ett e-bokningssystem för skoldatorer.
LARS Ett e-bokningssystem för skoldatorer. Därför behöver vi LARS Boka dator i förväg. Underlätta för studenter att hitta ledig dator. Rapportera datorer som är sönder. Samordna med schemaläggarnas system,
Läs merInstitutionen för datavetenskap, DAT060, Laboration 2 2 För denna enkla simulerings skull kommer handen att representeras som ett par tal μ värdet på
DAT 060 Laboration 2 I Malmös kasino Institutionen för datavetenskap 17 juni 2002 Per tänkte dryga ut sitt magra studielån genom att jobba som labbassistent på sommarkursen. Tyvärr fanns det redan tillräckligt
Läs merspecialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet
www.sprakenshus.se https://larportalen.skolverket.se/#/modul/4- specialpedagogik/grundskola/122_inkludering_och_delaktighet_flersprakighet Faktorer av betydelse för en flerspråkig utveckling Sociala faktorer
Läs merÖkat personligt engagemang En studie om coachande förhållningssätt
Lärarutbildningen Fakulteten för lärande och samhälle Individ och samhälle Uppsats 7,5 högskolepoäng Ökat personligt engagemang En studie om coachande förhållningssätt Increased personal involvement A
Läs mer2D Potentialen i en nervcell definieras normalt som skillnaden i spänning mellan dess axon och dendrit.
2D1432 Artificiella Neuronnät och andra lärande system Lösningsförslag till Tentamen 2003-03-06 Inga hjälpmedel. Uppgift 1 Vilka av följande påståenden är sanna? Korrigera de som är fel. 1. Potentialen
Läs merDatastrukturer och Algoritmer D0041D
Luleå Tekniska Universitet 19 mars 2014 Laborationsrapport Laboration 3 Datastrukturer och Algoritmer D0041D Primms Algoritm Namn E-mail Magnus Björk magbjr-3@ltu.student.se Handledare Felix Hansson Primms
Läs merStructured Query Language (SQL)
Structured Query Language (SQL) Christer Stuxberg christer.stuxberg@im.uu.se Institutionen för Informatik och Media Översikt Introduktion Enkla frågor (queries) Hämta en specifik kolumn Sök Sammanfattning
Läs merSö ka litteratur i ERIC
1 Sö ka litteratur i ERIC Det finns två ingångar om man vill söka i databasen ERIC: Via webben gratis version från the Education Resources Information Center: Denna version kan vara bra att känna till
Läs merHur du använder My easyfairs. En guide för utställare
Hur du använder My easyfairs En guide för utställare My easyfairs En guide för utställare Page 2 Innehåll Hur du använder My easyfairs... 1 Hur du loggar in... 3 Hur du anger namn på din monter och läger
Läs merIntroduktion till frågespråket SQL (v0.91)
DD1370: Databaser och Informationssystem Hösten 2014 Petter Ögren Introduktion till frågespråket SQL (v0.91) 13:e November Disclaimer: Dessa anteckningar har producerats under viss tidspress, och kan därför
Läs merRandom Indexing för vektorbaserad semantisk analys
Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk
Läs merEvidensbaserad informationssökning
Vetenskapligt förhållningssätt Evidensbaserad informationssökning Anna Wilner, NU-biblioteket www.nusjukvarden.se/nubiblioteket Mail: biblioteket.nu@vgregion.se Tel: 010-435 69 40 Jessica Thorn, Biblioteket
Läs merSyns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap
Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap Syns du, finns du? - En studie över användningen av SEO, PPC och sociala medier som strategiska kommunikationsverktyg i svenska företag
Läs merSö ka artiklar öch annan litteratur
1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och
Läs merMaskinöversättning 2008
Maskinöversättning 2008 F4 Översättningsstrategier, forts + Återanvändning av översättning LABEL byta SOURCE =byta.vb.1 TARGET =change.vb.1 TRANSFER LABEL byta-filter SOURCE
Läs merThe Cochrane Library. Vad är The Cochrane Library? Allmänna databaser
The Cochrane Library Vad är The Cochrane Library? En databas med syftet att samla och kvalitetsvärdera kliniska studier om effekterna av olika behandlingar. Cochrane-biblioteket består av sju databaser,
Läs merKunskapsgraf. Fredrik Åkerberg j.f.akerberg@gmail.com. Tommy Kvant tommy.kvant@gmail.com. 1 Introduktion. 2 Relaterade projekt.
Kunskapsgraf Fredrik Åkerberg j.f.akerberg@gmail.com Tommy Kvant tommy.kvant@gmail.com 1 Introduktion Målet med projektet var att undersöka huruvida DBpedia.org, kan användas för att besvara frågor på
Läs merKritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin.
Examensarbete Magisterprogrammet Digital Affärsutveckling, kurs uppgift 3 teori-reflektion. Kritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin. Författare: Magnus
Läs mer1 Översikt...2. 1.1 Vad är kontokoder?...2 1.2 Konto/Mapp uppbyggnad...2 1.3 Tillgång till Kontokoder...2. 2 Område Kontokoder...5
Manual för Kontokod 1 Översikt...2 1.1 Vad är kontokoder?...2 1.2 Konto/Mapp uppbyggnad...2 1.3 Tillgång till Kontokoder...2 2 Område Kontokoder...5 2.1 Mapputforskare...5 2.2 Verktygsfält...6 2.3 Hitta
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merMål med lektionen! Repetera och befästa kunskaperna.
Entity Framework Mål med lektionen! Repetera och befästa kunskaperna. Vad lektionen omfattar Repetera och gå igenom kursen lite snabbt. Vilka problem vill vi lösa? Vi arbetar med Webbapplikationer Vi kommer
Läs merPubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.
PubMed lathund 2016-02-04 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på För att få se vad som har hänt bakom kulissen, titta på Search details.
Läs merNKRR. Regelskrivning i praktiken
Sida: 1 (13) NKRR Regelskrivning i praktiken Innehåll Sida: 2 (13) 1 Inledning... 3 1.1 Förkortningar och begrepp... 3 2 Ändringshistorik för dokumentet... 4 3 Bakgrund... 5 3.1 Regler i NKRR... 5 3.2
Läs merLitteraturstudie. Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund
Litteraturstudie Utarbetat av Johan Korhonen, Kajsa Lindström, Tanja Östman och Anna Widlund Vad är en litteraturstudie? Till skillnad från empiriska studier söker man i litteraturstudier svar på syftet
Läs merUmeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund Söka artiklar, kursen Människans livsvillkor, 22 januari 2013
Campus Örnsköldsvik Söka artiklar, kursen Människans livsvillkor, 22 januari 2013 Under Söka och skriva på http://ovik.u b.umu.se/ finns länkar till lexikon, Sökhjälp och guider, Medicin och Skriva uppsats,
Läs merWord- sense disambiguation
KTH Word- sense disambiguation Inlämningsuppgift - DD2418 - sprakt12 Mattias Uskali & Emilia Hillert 1/8/2013 Sammanfattning Denna rapport kommer att undersöka två metoder för word- sense disambiguation,
Läs merHÖGSKOLAN FÖR SCEN OCH MUSIK
HÖGSKOLAN FÖR SCEN OCH MUSIK MVK941 Forskarutbildningsförberedande kurs i musikpedagogik, 30 högskolepoäng Preparatory Research Education Course in Music Education, 30 higher education credits Fastställande
Läs merVetenskapsmetod och teori. Kursintroduktion
Vetenskapsmetod och teori Kursintroduktion Creswell Exempel Vetenskapsideal Worldview Positivism Konstruktivism/Tolkningslära Kritiskt (Samhällskritiskt/ Deltagande) Pragmatism (problemorienterat) Ansats
Läs merLunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:
Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer
Läs merKlustring av svenska tidningsartiklar
Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier
Läs merDATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR
DATORÖVNING 5: SANNOLIKHETSFÖRDELNINGAR FÖR STICKPROVSMEDELVÄRDEN I denna datorövning ska du använda Minitab för att slumpmässigt dra ett mindre antal observationer från ett större antal, och studera hur
Läs merPerceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens
Perceptron som ordklasstaggare: ett fördjupningsarbete i 729G43 -Artificiell Intelligens Niklas Blomstrand Linköpings Universitet Inledning Att veta vilken ordklass ett ord tillhör är en viktig del i bearbetning
Läs merWEBBKLUSTRING SLUTRAPPORT
Arne Jönsson 2014-01-09 WEBBKLUSTRING SLUTRAPPORT 1. Inledning Inom projektet har vi utvecklat teknik som gör det möjligt att identifiera webbsidors innehåll och därefter klustra (gruppera) dem så att
Läs merDetta exjobb handlar om att skapa felträd utifrån specificerade rutiner i reparationshandböckerna för samtliga av Hägglunds fordon.
Rubrik: Maintenance - Felträd för mekaniska fel Arbetsuppgifter: Skapa felträd för mekanik utifrån reparationshandböcker. I våra fordonssystem använder vi oss av en interaktiv felsökning som går ut på
Läs merSö ka artiklar öch annan litteratur
1 Sö ka artiklar öch annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur. Sökrutan är nästan det första du lägger märke till. Bakom denna sökruta döljer sig en databrunn och
Läs merFöreläsning 12 Inspektionsmetoder. Rogers et al. Kapitel 15
Föreläsning 12 Inspektionsmetoder Rogers et al. Kapitel 15 Inspektionsmetoder Metoder som genomförs utan användare En eller helst flera experter utför en inspektion eller granskning Man utgår ifrån vedertagna
Läs merTitel Mall för Examensarbeten (Arial 28/30 point size, bold)
Titel Mall för Examensarbeten (Arial 28/30 point size, bold) SUBTITLE - Arial 16 / 19 pt FÖRFATTARE FÖRNAMN OCH EFTERNAMN - Arial 16 / 19 pt KTH ROYAL INSTITUTE OF TECHNOLOGY ELEKTROTEKNIK OCH DATAVETENSKAP
Läs mer5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data
5HVLVWHQVWDEHOO Tack för att du valde programmet 5HVLVWHQVWDEHOO! Vi hoppas att programmet ska vara till stor hjälp i ditt arbete. Har du synpunkter på programmet är du mycket välkommen att höra av dig
Läs merPRÖVNINGSANVISNINGAR
Prövning i Kemi 2 PRÖVNINGSANVISNINGAR Kurskod KEMKEM02 Gymnasiepoäng 100 Läromedel Prov Teoretiskt prov (240 min) Muntligt prov Kemi B, Andersson, Sonesson m.fl, Liber. Kap. 2-4 och 7-14 Ett skriftligt
Läs merSökmotoroptimering. Per Svanström SMM. Online Communication Manager. Web Intelligence. /persvanstrom /in/persvanstrom /profiles/per.
Sökmotoroptimering SEO SEM Per Svanström Online Communication Manager SMM Web Intelligence /persvanstrom /in/persvanstrom /profiles/per.svanstrom www.knowit.se Copyright 2011 294 miljarder epost skickas
Läs merGrafisk teknik IMCDP IMCDP IMCDP. IMCDP(filter) Sasan Gooran (HT 2006) Assumptions:
IMCDP Grafisk teknik The impact of the placed dot is fed back to the original image by a filter Original Image Binary Image Sasan Gooran (HT 2006) The next dot is placed where the modified image has its
Läs merAtt hitta projekt. Björn Victor. måndag 19 mars 12
Att hitta projekt Björn Victor Övning: projektbeskrivning Till måndag: skriv en (1) sida som beskriver projektet på Distribuerade system med projekt Övning: inte obligatorisk, men nyttig! 1. vad var planen/avsikten/syftet/målet
Läs merGoals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")
Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen") 1 1. Mål för doktorsexamen 1. Goals for doctoral exam Kunskap och förståelse visa brett
Läs merCalculate check digits according to the modulus-11 method
2016-12-01 Beräkning av kontrollsiffra 11-modulen Calculate check digits according to the modulus-11 method Postadress: 105 19 Stockholm Besöksadress: Palmfeltsvägen 5 www.bankgirot.se Bankgironr: 160-9908
Läs merObemannade flygplan. Namn: Hampus Hägg. Datum: 2015-03-02. Klass: TE14B. Gruppmedlemmar: Gustav, Emilia, Henric och Didrik
Namn: Hampus Hägg Obemannade flygplan Datum: 2015-03-02 Klass: TE14B Gruppmedlemmar: Gustav, Emilia, Henric och Didrik Handledare: David, Björn och Jimmy Abstract In this task I ve been focusing on unmanned
Läs merE-biblioteket en tjänst från sjukhusbiblioteken
E-biblioteket en tjänst från sjukhusbiblioteken Snabbsök Innebär att du söker samtidigt i flera förvalda grupper av databaser. Snabbsök är i första hand avsett för att ge en första orientering i ämnet.
Läs merLinköpings universitet
Översikt Kognitionsvetenskaplig introduktionskurs Föreläsning 4 Informationsbearbetningsmodeller Vad är kognitionsvetenskap? Kort bakgrund/historik Representation och bearbetning av information Vetenskapliga
Läs merUppdaterad / EM. The Cochrane Library
The Cochrane Library Vad är The Cochrane Library? En samling databaser med syfte att samla och kvalitetsvärdera kliniska studier om effekterna av olika behandlingar. Cochrane består av två databaser Cochrane
Läs merLinköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson
Linköpings Universitet Artificiell Intelligens II 729G11 HT 2011 QA- system Anders Janson 861128-6918 andja338@student.liu.se Sammanfattning Inom denna uppsats tar jag upp Question Answering system, som
Läs merDatastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6
Datastrukturer, algoritmer och programkonstruktion (DVA104, VT 2015) Föreläsning 6? DAGENS AGENDA Komplexitet Ordobegreppet Komplexitetsklasser Loopar Datastrukturer Några nyttiga regler OBS! Idag jobbar
Läs merGränssnitt för FakeGranska. Lars Mattsson
Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken
Läs merManual för ehp och HP:s digitala arkiv
Manual för ehp och HP:s digitala arkiv På www.hallandsposten.se/kundservice kan du hitta svar på många frågor gällande din prenumeration och hur du gör att aktivera ditt digitala konto och mycket mera.
Läs merArbeta med databas. Översikt. Lektion 1: Arbeta med Entity Data Models. Arbeta med Entity Data Models. LINQ (Language Integrated Query).
Arbeta med databas Översikt Arbeta med Entity Data Models. LINQ (Language Integrated Query). Lektion 1: Arbeta med Entity Data Models Introduktion till ADO.NET Entity Framework. Stöd i ADO.NET Entity Framework.
Läs merSök artiklar i databaser för Vård- och hälsovetenskap
Sök artiklar i databaser för Vård- och hälsovetenskap Bibliografiska databaser eller referensdatabaser ger hänvisningar (referenser) till artiklar och/eller rapporter och böcker. Ibland innehåller referensen
Läs merHur du använder My easyfairs. En guide för utställare
Hur du använder My easyfairs En guide för utställare My easyfairs En guide för utställare Page 2 Innehåll Hur du loggar in... 3 Hur du anger namn på din monter och läger till en logotyp... 4 Hur du anger
Läs merSociala medier för företag
Sociala medier för företag Utbildningen ingår i projektet Helikoopter vilket är ett kompetensutvecklingsprojekt som finansieras av Europeiska socialfonden och genomförs i Coompanion Norr och Västerbottens
Läs merDeadline 3. Grupp A.4 Kathrin Dahlberg Elin Gardshol Lina Johansson Petter Liedberg Pernilla Lydén
Deadline 3 Grupp A.4 Kathrin Dahlberg Elin Gardshol Lina Johansson Petter Liedberg Pernilla Lydén 1 3. Kartlägg kundens röst För att få en klar bild av kundens nuvarande och kommande behov definieras marknaden
Läs merSociala medieströmmar metoder för analys och samarbete via nya medieformat. Pelle Snickars, Umeå universitet & Lars Degerstedt, Södertörns högskola
Sociala medieströmmar metoder för analys och samarbete via nya medieformat Pelle Snickars, Umeå universitet & Lars Degerstedt, Södertörns högskola från text som omvärldsinformation till andra typer
Läs merKriminologi AV, Magisterkurs i kriminologi, 30 hp
1 (5) Kursplan för: Kriminologi AV, Magisterkurs i kriminologi, 30 hp Criminology MA, Master Degree Course in Criminology, 30 Credits Allmänna data om kursen Kurskod Ämne/huvudområde Nivå Inriktning (namn)
Läs merVisualisering av samverkan
Visualisering av samverkan 18 december 2017 En viktig aspekt i samverkan är att inte bara ha koll på vilka andra aktörer du själv samverkar med, utan även veta om vilka aktörer du inte samverkar med, men
Läs merMESI i Intel Core 2 Duo
MESI i Intel Core 2 Duo Sammanfattning Denna rapport beskriver en processor (Intel Core 2 Duo) vars cache coherence protokoll är MESI. Rapporten beskriver hur processorn är uppbyggd, hur många kärnor den
Läs merCinahl sökguide. Enkel sökning. Ämnesordsökning
Medicinska fakultetens bibliotek, Lund. Monica Landén. 2014-02-20 Cinahl sökguide Enkel sökning Select a Field (optional) sökningen görs som keyword i titel, abstract och subject heading (ämnesord). Genom
Läs merFör dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.
En kort introduktion till Fronter 19 Välkommen till en ny Fronter-upplevelse. Den här guiden kommer att ta upp skillnader mellan den nuvarande Fronter-plattformen och Fronter 19, och de förändrade arbetsprocesserna.
Läs merDetta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.
Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas
Läs merGUIDE TILL ANVÄNDARHANTERINGEN
Sida 1 av 9 Version: 1 (EL) GUIDE TILL ANVÄNDARHANTERINGEN Användarhanteringen sker i ett verktyg som heter Användaradmin och man kan också göra en del saker direkt på intranätet. I användarhanteringen
Läs merStyrteknik: Binära tal, talsystem och koder D3:1
Styrteknik: Binära tal, talsystem och koder D3:1 Digitala kursmoment D1 Boolesk algebra D2 Grundläggande logiska funktioner D3 Binära tal, talsystem och koder Styrteknik :Binära tal, talsystem och koder
Läs merTentamen på kursen Webbdesign, 7,5 hp
Högskolan i Borås Institutionen för data- och affärsvetenskap Malin Nilsson Tentamen Tentamen på kursen Webbdesign, 7,5 hp Tentamenstid: 2012-05-28, kl. 9-13 Hjälpmedel: Inga hjälpmedel tillåtna Betyg:
Läs merTänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se
Tänk kreativt! Informationssökning Ha ett kritiskt förhållningssätt! Informationssökning steg för steg Innan du börjar behöver du formulera en fråga. Vad vill du hitta information om? Att utgå från: -
Läs mer1 Find the area of the triangle with vertices A = (0,0,1), B = (1,1,0) and C = (2,2,2). (6p)
Divsion of Mathematics Examination Vector algebra and applied mathematics MAA150 - TEN2 Mälardalen University Date: 2015-11-06 Examiner: Mats Bodin Exam aids: not any All solutions should be presented
Läs merExcel-guide. Introduktion
Excel-guide Introduktion I denna laboration kommer ni få använda några grundfunktioner i Microsoft Excel. Laborationen utgår ifrån Excel 2010, men om ni vill använda ett annat program för att lösa uppgifterna
Läs merGrafisk teknik IMCDP. Sasan Gooran (HT 2006) Assumptions:
Grafisk teknik Sasan Gooran (HT 2006) Iterative Method Controlling Dot Placement (IMCDP) Assumptions: The original continuous-tone image is scaled between 0 and 1 0 and 1 represent white and black respectively
Läs merMarie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar. marie.gustafsson@hb.
Att söka information Marie Gustafsson marie.gustafsson@hb.se Dagens föreläsning: Att söka vetenskaplig litteratur Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga
Läs merBeräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Läs merSEO-rapport. Innehållsförteckning. Introduktion EkoLekos sökord.. 3. Rapport från Semrusch som visar EkoLekos Organic Search Summary,...
SEO-rapport Innehållsförteckning Introduktion EkoLekos sökord.. 3 Rapport från Semrusch som visar EkoLekos Organic Search Summary,...4 Organic SearchTop Keywords..5 Utvecklingen på EkoLekos viktigaste
Läs merCollaborative Product Development:
Collaborative Product Development: a Purchasing Strategy for Small Industrialized House-building Companies Opponent: Erik Sandberg, LiU Institutionen för ekonomisk och industriell utveckling Vad är egentligen
Läs merYAHOO! SEARCH MARKETING Tips för att öka trafiken
YAHOO! SEARCH MARKETING Tips för att öka trafiken Vill du hitta fler sätt att öka trafiken till din webbplats? På de här sidorna hittar du 25 tips som hjälper dig att locka kunder till din webbplats. Prova
Läs merFöreläsning 13. Träd
Föreläsning 13 Träd Träd Ett träd är en datastruktur som tillåter oss att modellera sådant som vi inte kan modellera med linjära datastrukturer. Ett datavetenskapligt träd består av noder med pilar emellan.
Läs mer