Nyhetsbevakning och Information Retrieval. Utvärdering av nyhetsbevakningssystem. Syfte med IR-system. Vilket system är bättre?

Relevanta dokument
Svenska webbaserade nyhetssöktjänster En utvärdering av Yahoo! Nyheter och Sesams återvinningseffektivitet

En samling fårskallar

Hur man hjälper besökare hitta på en webbplats

Evaluering av återvinningseffektiviteten i Svensk Medicin och Google Scholar med medicinska frågor ur Fråga doktorn

En komparativ litteraturstudie av olika termkällor för query expansion


Globala och lokala sökmotorer: En utvärdering av Google, MSN Search och Svesök

Ämnessökningar med kontrollerad vokabulär och naturligt språk: en jämförande studie med felanalys

DEN INTERAKTIVA IR-FORSKNINGENS GENOMSLAG I SÖKTJÄNSTERNA PÅ WEBBEN

Linköpings Universitet Artificiell Intelligens II 729G11 HT QA- system. Anders Janson

Källuppgifter i fysik FAFA55

Google Scholar eller Scirus för vetenskapligt material på webben? En utvärdering och jämförelse av återvinningseffektivitet

Behöver tvärvetenskap organiseras fram?

GRATIS SEO, SÖK- OPTIMERING? JA, DETTA KAN DU GÖRA SJÄLV!

Akademiska söktjänster - En jämförande studie av Google Scholar, MEDLINE och Web of Science

Acano cospace Solution

Hur effektiva är de egentligen? en evaluering av tre webbaserade söktjänster

Söka, värdera, referera

Universitetsrankningar samt något om SU:s arbete med datainsamling till rankningarna. Per Ahlgren

Web Analytics Wednesday 24 januari

SEO Sökmotoroptimering

Peter Hellström. PH-Digital Marketing

Om uppsatsmallen vid GIH

Dokumentrekommendationssystem och intranät

Hur jag skapar en webbplats värd kr/år på 49 dagar med endast 10 timmars arbete

VETENSKAPLIG LITTERATUR

Söka artiklar i CSA-databaser Handledning

Det svenska sökbeteendet 2012

A" söka vetenskapliga ar1klar inom vård och medicin -

Falcon och QA- system generellt

Business Intelligence. Vad är r Business Intelligence? Andra termer. Övergripande faktorer. Specifika termer för BI är:

Sök artiklar i PubMed: handledning

Arkiv- och informationsvetenskap AV, Arkivsystem, 7,5 hp

Kontrollerad vokabulär eller naturligt språk? En empirisk studie

PEC: European Science Teacher: Scientific Knowledge, Linguistic Skills and Digital Media

Användningsstatistik ur ett konsortieadministrativt perspektiv. Lisa Lovén, Stockholms universitetsbibliotek CRIStin Vårmøte 21 april 2015

Syns ni på sökmotorerna?

Vetenskaplig publicering funktioner, former och mätningar

Använda Internet. med hjälp av Internet Explorer. Nybörjarguide

Testplanering, test-first, testverktyg

Att skriva för webben

LATHUND Soundmouse avsedd för Produktionsbolag

Sökmotoroptimering. Hur gör jag min sida sökmotorvänlig?

Nyhetssöktjänster på webben En utvärdering av News Index, Excite News Search och Ananova

Läget, läget, läget. Sök, sök, sök. mars 2018/Ted Durdel

Projektförslag. Datalingvistisk projektkurs VT mars 2007

WEBB365.SE. Hur skriver man sökmotoroptimerade texter

Signalflödesmodellen. Två (gamla) exempel: Kvadratera alla jämna löv.

Sökmotormarknadsföring

Rocchio, Ide, Okapi och BIM En komparativ studie av fyra metoder för relevance feedback

Utmaningar vid molnupphandlingar

TDDD02 Föreläsning 6 HT-2013

Presentationen försöker besvara dessa frågor med hjälp av Incites, framförallt med den nya versionen av Incites

Det första steget blir att titta i Svensk MeSH för att se om vi kan hitta några bra engelska termer att ha med oss på sökresan.

Query expansion med hjälp av en elektronisk tesaurus i en bibliografisk online-databas.

Utbildningens benämning (och alternativt lärarinriktningens benämning)

What is Library 2.0?

Ask.com, Web Wombat och Yahoo En studie av två globala sökmotorer och en lokal sökmotor

Informationssökning. Jörg Tiedemann. Introduktion till språkteknologi. Informationssökning. Inledning. Strukturerade data. Ostrukturerade data

Affärsmodeller och samarbete på framtidens Internet

Referenshantering med Zotero 1

Workshop$OER$program$ Vad$är$OER$(öppna$lärresurser)?$ Fördelar$för$lärare$med$OER$?$ återanvändning$

Primär eller sekundär söktjänst? - En effektivitetsstudie av söktjänsten Google och metasöktjänsten Dogpile

Query expansion med semantiskt relaterade termer

Boende nära golfbana kr! 12 månader! Medverka med ditt boende på tre hotellguider! Pris

E: 9p D: 10p C: 14p B: 18p A: 22p

Webbplatsen Europa En utvärdering av söktjänsten

All the Web, Alta Vista och Google En effektivitetsstudie av tre söktjänster på webben

Om open access och nya publiceringsvägar

Kom ihåg: Skriv transportsedel parallellt med appen i början tills du känner att den sitter, därefter hör du av dig till oss så tar vi det därifrån.

- ett statistiskt fråga-svarsystem

SF2715 Tillämpad kombinatorik, 6hp

Sök artiklar i PubMed

Att använda data och digitala kanaler för att fatta smarta beslut och nå nya kunder.

Referenshantering med Zotero Introduktion

En utvärdering av två pearl growing-metoder i ISI Web of Science

Sökmotorlösning för e-handel

KAMPANJ- VERKTYGSLÅDAN 2.0 PIMP MY CAMPAIGN

Komma igång med Adobe Presenter ver.7

Karlstads universitet Institutionen för Informationsteknologi Datavetenskap

Tänk kreativt! Informationssökning. Ha ett kritiskt förhållningssätt! regiongavleborg.se

Sälja eller låna ut, är det skillnad? En experimentell komparativ studie av återvinningseffektivitet i bibliografiska databaser.

Google, Yahoo! och Live Search: - en evaluering av tre webbsöktjänster

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Joakim Nivre och Jörg Tiedemann

A study of the performance

Our Mobile Planet: Sverige

Tillämpad programmering CASE 1: HTML. Ditt namn

KURSER I INFORMATIONSSÖKNING FÖR NYA STUDERANDE I ÅBO

Software Quality Requirements and Evaluation (SQuaRE) & Common Industry Format (CIF) for Usability snart finns det inga ursäkter längre...

Sammanställning av tillvägagångssätt och erfarenheter vid litteratursökning på uppdrag av Nationellt kompetenscentrum Anhöriga, januari 08-maj 08.

Klustring av svenska tidningsartiklar

The sexy job in the next 10 years will be statisticians, said Hal Varian, chief economist at Google. And I m not kidding.

INSPIRATIONSMATERIAL!till!Tolvskillingsoperan!

Typer av sökfrågor på webben En effektivitetsstudie

Ändringar i kontrakt och förfrågningsunderlag

Synlighet och en dröm. Karl Norrbom, 2013

PFC and EMI filtering

Sri Lanka Association for Artificial Intelligence

Söktjänster för akademiskt bruk En utvärdering av Google och Argos med frågor från en akademisk ämnesdisciplin

Transkript:

Utvärdering av nyhetsbevakningssystem Eriks Sneiders eriks@dsv.su.se 24-1-12 Nyhetsbevakning och Information Retrieval Applikationsnivå Nyhetsbevakning att hitta intressanta artiklar i flödet Tekniknivå Information Retrieval (IR) man menar Text Retrieval vanligtvis. IR-system söker inom en samling av och hämtar till en användarfråga Utvärdering av nyhetsbevakningssystem vi utvärderar IR-system E. Sneiders 2 Syfte med IR-system Vilket system är bättre? och icke- (a) (b) hämta sortera på webben E. Sneiders 3 - relevant - icke-relevant E. Sneiders 4 Vad utvärderar vi? (1) Hämtar systemet alla? (2) Hämtar systemet enbart? (3) Hämtar systemet skräp om det inte finns? (1) och (2) anses viktigast Mängder: i en samling samling E. Sneiders 5 E. Sneiders 6 1

Hämtade,, & Hämtade,, & samling & ( ) samling () () vi mäter storleken på snittet ( ) E. Sneiders 7 vi mäter storleken på snittet ( ) E. Sneiders 8 Hämtade,, & samling mäter andel av som är : samling () I P = () vi mäter storleken på snittet ( ) & ( ) E. Sneiders E. Sneiders 1 Täckning (recall) Täckning (recall) Täckning mäter andel av som blev : R = I samling () Hur vet vi hur många finns? Kontrollera manuellt samling Lita på prövade system () & ( ) & ( ) E. Sneiders 11 E. Sneiders 12 2

1% Exempel 1% täckning samling samling 1% precision & täckning samling 7 P = 64% 11 7 R = 78% 1% precision E. Sneiders 13 E. Sneiders 14 Flytta på skärlinjen Flytta på skärlinjen 5 P = 83% 6 5 R = 56% 7 P = 64% 11 7 R = 78% E. Sneiders 15 E. Sneiders 16 Flytta på skärlinjen -täckningskurva P = 53% 17 8 7 6 R = 1% % 5 4 3 2 1 1 2 3 4 5 6 7 8 1 Recall % E. Sneiders 17 E. Sneiders 18 3

Average precision-recall -täckningskurva 1% % 8% 7% Jämförelse mellan Kanoodle och Teoma En kurva beskriver andel när skärlinjen flyttas för en fråga % 6% 5% 4% 3% 2% 1% % % 1% 2% 3% 4% 5% 6% 7% 8% % 1% 1,8 Google,6 AltaVista,4,2,2,4,6,8 1 1,2 Recall Kanoodle Teoma 8 Recall % 7 Avarege Interpolated Precison Recall Graph % 6 5 4 3 2 1 1 2 3 4 5 6 7 8 1 Recall % E. Sneiders 1 1,,8 Jämförelse av sökmotorer,,7 medelkurvor,6 Google,5 Altavista (3 frågor per sökmotor),4 Lycos,3,2 Inlupp1 på *:66,1,1,2,3,4,5,6,7,8, 1 E. Sneiders Recall 2 Kvalité av IR-systemet och precision-täckningskurva viktig i webbmiljö -täckningsregioner orealistiskt system 1% täckning och precision mycket bra system viktig om man vill hitta fullständig information genomsnittssystem dåligt system Täckning E. Sneiders 21 Täckning low-recall mid-recall high-recall (engelska) E. Sneiders 22 Pooling Pooling hitta delmängd D q Föreställ att vi har 5 frågor och 5 D det skulle kräva 25 bedömningar Vi tar en delmängd D q D med de flesta och manuellt evaluerar D q Hur hittar man D q? Vi tar n texthämtningssystem, kör fråga q och tar k topp från varje system Riktiga testfall har n = 3, k = 1 eller k = 2 D q är topp k från n system Nu behöver vi max n k = 3 1 = 3 manuella bedömningar per fråga, inte 5 E. Sneiders 23 E. Sneiders 24 4

Exempel Standardtäckningsvärden medeltemperatur stockholm Google, Lycos, Kanoodle Pooling 3 precision-täckningskurvor Föreställ att vi vill jämföra två IR-system Standardtäckningsvärden är 1, 2, 1% - recall graf för google 1% 8% Q1 6% Q2 4% Q3 2% Q4 % % 2% 4% 6% 8% 1% 12% Recall Men vi har inga precisionsmått vid täckning.1, 1. Endast vid konstiga 1, 58, 82, etc. % E. Sneiders 25 E. Sneiders 26 Interpolerad precision för standardtäckningsvärden Enkelvärden - högst närmast till höger Harmonic mean (F-värde) P R F = 2 P + R E-värde där precision och täckning är olika viktiga 2 1+ b E = 2 b R + 1 P om b = 1 så får vi F-värde E. Sneiders 27 E. Sneiders 28 TREC (Text REtrieval Conferences) TREC Testbed för IR-system Sedan 12 organiserad av NIST (National Institute of Standards and Technology) Document collection, många gigabytes Example information requests (topics) Relevant Documents for Each Information Request Pooling används Tracks: ad-hoc retrieval text filtering novelty track question answering video track etc. http://trec.nist.gov/tracks.html E. Sneiders 2 E. Sneiders 3 5

Standardsamlingar CACM (computer science): 324 utdrag, 64 frågor CF (medicine): 123 utdrag, 1 frågor CISI (library science): 146 utdrag, 112 frågor Cranfield (aeronautics): 14 utdrag, 225 frågor LISA (library science): 64 utdrag, 35 frågor Time (newspaper): 423 utdrag, 83 frågor Ohsumed (medicine): 348 566 utdrag, 16 frågor http://www.cs.utk.edu/~lsi/corpa.html Internet Information Search Techniques *:66 / 2I152 / 2I417 VT5, weeks 13-21 http://www.dsv.su.se/~eriks/66/ E. Sneiders 31 E. Sneiders 32 6