Specifikation och tidsplan för examensarbete



Relevanta dokument
Ontologier. Cassandra Svensson

Kurser inom Datavetenskapligt kandidatprogram och Computer Science Master s programme våren 2010

Senaste version kan hämtas från Internet i PDF 1 format

DATA- OCH INFORMATIONSTEKNIK

Utvecklingen i Sverige och i Europa - trender, möjligheter, farhågor

LT200X Examensarbete inom teknik och lärande, avancerad nivå 30,0 hp. Stefan Stenbom

TDP023 Projekt: Agil systemutveckling

Rafel Ridha Projektdefinition

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Hash Comparison Module for OCFA

Examensarbeten på dataingenjörsprogrammet

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Riktlinjer för examensarbetare

Analys av BI-system och utveckling av BIapplikationer

MED739, Mat vid diabetes, nutritionsbehandling, 4,5 högskolepoäng Diabetes Nutrition Therapy, 4.5 higher education credits

Folkhälsovetenskap AV, Strategiskt folkhälsoarbete, 7,5 hp

Applikation för att skapa, underhålla, lagra och publicera litteraturlistor Lärare skapar och underhåller litteraturlistor Ämnesansvariga eller andra

ICA & GMC En framgångsrik CCM lösning

Söka, värdera, referera

- ett statistiskt fråga-svarsystem

UPPSATSER MR-PROGRAMMET

DATA- OCH INFORMATIONSTEKNIK

Information technology Open Document Format for Office Applications (OpenDocument) v1.0 (ISO/IEC 26300:2006, IDT) SWEDISH STANDARDS INSTITUTE

Studienämnden Data

Ämnesområden. Examensarbete inom datavetenskap (1DV41E) Martin Fredriksson

Projekt? 1DV420 Nätverksprojekt Kalmar, Lars Karlsson +46(0)

Individual written examinations at the end of each course section, plus seminars, papers and a minor scientific report. Admission requirements:

Björn Åstrand

Betygskriterier för examensarbete/självständigt arbete

Institutionen för individ och samhälle Kurskod PSK500. Fastställandedatum Utbildningsnivå Grundnivå Reviderad senast

Dnr N 2008/549. Regler och rekommendationer för examensarbeten på avancerad nivå vid naturvetenskapliga fakulteten fr.o.m

Programinformation VT 2012 för

Grundläggande textanalys. Joakim Nivre

Att hitta projekt. Björn Victor. måndag 19 mars 12

Processimulering --- I teori och i praktik

SAMVERKAN MELLAN HÖGSKOLA OCH NÄRINGSLIV I INGENJÖRSUTBILDNINGAR

INDIVIDUELL STUDIEPLAN I FORSKARUTBILDNINGEN

Studienämnden Data

INSTRUKTIONER OCH TIPS Fördjupningsarbete Receptarier (15 hp) och Apotekare (30 hp)

Examensarbete DATATEKNIK. Lunds Tekniska Högskola examensarbete

Arrowhead - Process- och energisystem- automation

1 Inledning/översikt Examensarbete... 4

LLEN10, Engelska för lärare i åk 4-6, 30,0 högskolepoäng English for teachers in years 4-6, 30.0 higher education credits

Examensarbete DATATEKNIK. Lunds Tekniska Högskola examensarbete

Utvecklingen av ett tidregistrerings- och faktureringssystem

Handläggning av Examensarbeten på Trafik och Väg

Not everything that counts can be counted, and not everything that can be counted counts. William Bruce Cameron

Vad är. Domändriven design?

Information om examensarbetet för studenter och examinatorer

Med focus på: Formell projektkommunikation. Vad är kommunikation. Media som används: Effekten

Institutionen för individ och samhälle Kurskod SOL200. Fastställandedatum Utbildningsnivå Grundnivå Reviderad senast

KURSPLAN Engelska, hp, 30 högskolepoäng

Datavetenskapligt program, N1COS

Semantic Technologies in Computational Terminology Management. Jody Foo,

PROJEKTLEDNING OCH KANDIDATARBETET APPLICERING OCH PRAKTISKA RÅD

DETALJPLAN EXAMENSARBETEN

Quality-Driven Process for Requirements Elicitation: The Case of Architecture Driving Requirements

Förskola i Bromma- Examensarbete. Henrik Westling. Supervisor. Examiner

Arbetsgång för examensarbeten vid institutionen för Ekologi, Miljö och Geovetenskap

Kandidatarbetets planeringsrapport och planeringen (Projektplanering 2)

Examensarbete DATATEKNIK. Lunds Tekniska Högskola examensarbete

Examensarbeten vid civilingenjörsutbildningen i Energisystem. Information till företaget

B. Förkunskapskrav och andra villkor för tillträde till kursen

Föreskrifter för examensarbete på civilingenjörs-, arkitekt- och masterprogram

Rosetta. Ido Peled. A Digital Preservation System. December Rosetta Product Manager

Datavetenskapligt program, N1COS

GIT L0009B GEOGRAFISK DATABASTEKNIK. Information inför kursstart

Matematiska metoder för språkvetare, 7,5 hp

Cristina Eriksson oktober 2001

Schema för Webbdesign för lärandemiljöer, TIA033, VT09

DESIGN AV UNDERVISNING MED STÖD AV IT

Förklara långsamt så fattar jag snabbt

Kursbeskrivning. Samtida forskning om tolkning, AN, 7,5 hp (TTA608) Masterprogram i tolkning, 120 hp (HTOLO) Tolk- och översättarinstitutet (TÖI)

PDA422 MATEMATIKDIDAKTIK II, 15 HÖGSKOLEPOÄNG Didactics of Mathematics II, 15 higher education credits

Civilingenjörsprogrammet i industriell ekonomi

Semantisk web i biblioteket

Europa standardiserar BIM. 25 november, 2014 ULI

STANDARDISERADE INTEGRATIONER FÖR STUDIEADMINISTRATION MED LIS SUNETDAGARNA

Word- sense disambiguation

Mis/trusting Open Access JUTTA

Teknisk-naturvetenskapliga fakultetens universitetspedagogiska råd. Examination av examensarbeten. Sammanfattning av seminariet

Elektroteknik GR (C), Examensarbete för högskoleingenjörsexamen, 15 hp

Kursrapport 32IVP1 H15-1 Verksamhetsförlagt projektarbete, 7,5 hp BMBD114h

TDDD02 Språkteknologi för informationssökning (2016) Introduktion. Marco Kuhlmann Institutionen för datavetenskap

Mönster. Ulf Cederling Växjö University Slide 1

TE2501 Examensarbete för civilingenjörer, 30 hp. Jürgen Börstler v1.0;

Introduktion till Entity Framework och LINQ. Källa och läs mer

Universitetskanslersämbetets kvalitetsutvärderingar Mall för uppföljning civilingenjörsexamen

SPELTESTNING FUZZY LOGIC. Kandidatuppsats i Informatik. Patrik Lundqvist Michael Enhörning VT 2010

LAGM01, Examensarbete, 30 högskolepoäng Graduate Thesis, 30 credits Avancerad nivå / Second Cycle

Kursplan. AB1029 Introduktion till Professionell kommunikation - mer än bara samtal. 7,5 högskolepoäng, Grundnivå 1

Examensarbete Teknisk logistik

Teoridel (svaren direkt på lydelsen)

Datalagringsmetodik och arkitektur i Java. Projektdefinition. Projektdefinition. Björn Brenander. 7 maj 2001

Informasjon som redder liv. Stefan Ohlsson Healthcare Industry leader, Nordic

Datorteknik och datornät. Case Study Topics

Kriminologi GR (A), Tillämpad kriminologi II, 15 hp

Valinfo SL2 Exjobbsinfo SL3. Stefan Engevall, SL/FTL,

UNIVERSITETSRANKNINGEN FRÅN QS 2015

Transkript:

Specifikation och tidsplan för examensarbete Anneli Lönn 19 maj 2003 1 Deltagare Anneli Lönn ska utföra projektet hos CognIT a.s i Oslo Robert Engels, handledare CognIT a.s Till Christopher Lech, handledare CognIT a.s Viggo Kann, handledare NADA, KTH Stefan Arnborg, examinator NADA, KTH 2 Problemdefinition Hur bär man sig åt för att extrahera användarspecifik information ur en textmassa som är mycket inhomogen till formen. 3 Bakgrund AmbieSense 1 är ett EU-finansierat forsknings- och utvecklingsprojekt med många aktörer inblandade. Projektet syftar till att utveckla ett system där man taggar omgivningen med små elektroniska tags som är ständigt uppkopplade mot informationsgivare, s.k. content providers. En content provider kan till exempel vara en nyhetsbyrå eller en restaurang. När en användare sedan passerar en tag med sin handhållna dator upprättas en tillfällig förbindelse med blåtandteknologi och information kan överföras. Skillnaden mellan denna och andra typer av uppkopplingar ligger i att i AmbieSense kommer information även att aktivt söka mottagaren. Användaren kommer hela tiden att placeras i olika sammanhang eller kontexter beroende på var användaren befinner sig och annan information om användaren systemet kan tänkas få. Vet till exempel systemet att användaren just har landat med ett flyg ska det kunna ge direktioner till var hämtning av bagage ska ske. Många möjligheter finns givetvis och många tjänster beror på vilka content providers som ställer information till förfogande för systemet. 1 AmbieSense (IST 2001-34244): http://www.ambiesense.com 1

4 Uppgift Uppgiften för det här examensarbetet är att undersöka och om möjligt förbereda en informationskälla till ovanstående system. Lonely Planet har en databas som är insamlad genom att resande loggar in på deras hemsida och tipsar om allehanda saker 2. Det finns förstås mängder med information att hämta där och Lonely Planet är just en av de content providers som är med och arbetar med AmbieSense. Problemet ligger i att ovan nämnda databas är mycket inhomogen och det allra mesta är inte av intresse för den resande användaren. CognIT har tidigare utvecklat komponenter som utför sökning och klassificering av intressanta dokument 3. Detta kommer förmodligen att användas för att få ner textmassan till en mer hanterlig storlek. Därefter ska texterna analyseras med lämplig teknik för att extrahera specifik information inom cirka tre domäner. Förslag på domäner är billigt boende, billig mat och saker att göra i London. Alla tre med en bakgrund att de riktar sig mot den typiske budgetresenären. Informationen ska sedan sammanfattas och presenteras överskådligt för att den ska kunna användas i vidare utvecklingsskeden. Litteratur som ska användas till inläsningsdelen finns listad under punkten Appendix. Nästan all information i databasen är på engelska så informationsextraheringen ska ske ur engelsk text. 2 The Lonely Planet Thorn Tree: http://thorntree.lonelyplanet.com 3 Robert Engels, Bernt Bremdal: Information Extraction, State-of-the-Art Report, 5th Deliverable of the OnToKnowledge Project (IST-1999-10132) http://www.ontoknowledge.org/downl/del5.pdf 2

5 Tidsplan Arbetet utgör 20 poäng i civilingenjörsexamen. Det motsvarar 20 arbetsveckor. Nedan följer en veckoplan för det fortsatta arbetet. Vecka Datum Kommentar v19 03-05-05 Specifikation, Tidsplan och Litteraturlista v20 03-05-12 Godkänna ovanstående v21 03-05-19 Inläsning/Implementation v22 03-05-26 Inläsning/Implementation v23 03-06-02 Metodkurs och Inläsning v24 03-06-09 Inläsning/Implementation v25 03-06-16 Rapportstruktur v26 03-06-23 Inläsning v27 03-06-30 Implementation v28 03-07-07 Implementation v29 03-07-14 Implementation v30 03-07-21 Implementation och Tester v31 03-07-28 Tester v32 03-08-04 Analys av resultat v33 03-08-11 Insamla projektspecifik data v34 03-08-18 Rapport v35 03-08-25 Rapport v36 03-09-01 Rapport v37 03-09-08 Förbereda presentation och opposition v38 03-09-15 Förb. och Rapport v39 03-09-22 Förb. och Rapport v40 03-09-29 Förb. och Rapport 6 Underskrifter Studenten Handledare, CognIT Handledare, NADA Examinator, NADA 3

7 Appendix Inläsningsdelen kommer att bestå av merparten av följande litteratur. Listan kan komma att ändras om nya, intressanta artiklar hittas och allteftersom konkreta, hittills oförutsedda informationsbehov uppstår. Ur Information Extraction SCIE-97 Springer-Verlag Berlin 1997 1. Grishman Ralph, Information Extraction: Techniques and Challenges 2. Boguraev B, Kennedy C, Technical Terminology for Domain Specification and Content Characterisation 3. Guarino N, Semantic Matching: Formal Ontological Distinctions for Information Organization, Extraction and Integration 4. Neri F, Saitta L, Machine Learning for Information Extraction Ur Information Extraction: towards scalable adaptable systems SCIE-99 Springer-Verlag Berlin 1999 1. Wilks Yorick, Catizone Roberta, Can we make Information Extraction More Adaptive? 2. Sowa John F. Relating Templates to Language and Logic 3. Vilain Marc, (The MITRE Corporation), Inferential Information Extraction 4. Basili Roberto, Di Nanni Massimo, Pazienza Maria Teresa, Engineering of IE-Systems: An Object-Oriented Approach Rapporter rekommenderade av uppdragsgivaren (CognIT), Fler artiklar kommer att inkluderas. 1. Pollich Juergen, Lech Till C, D2 - Reference Information Model (RIM), WP2 Modelling and design of AmbieSense Technology, The AmbieSense Consortium 2002 2. Engels Robert, Bremdal Bernt, ONTOKnowledge State-of-the-Art Report, CognIT a.s Stöd- och referenslitteratur. 1. Jurafsky Daniel, Martin James H, Speech and Language Processing, Prentice Hall Inc, 2000 2. Lischner Ray, Delphi in a nutshell, O Reilly & Associates, 2000 4

3. Dominich Sándor, Mathematical Foundations of Information Retrieval, Kluwer Academic Publishers, 2001 4. Milner Wendy L, Common Lisp A Tutorial, Prentice Hall Inc, 1988 5. Wood Derick, Yu Sheng, Automata Implementation, WIA 97 Springer- Verlag Berlin, 1998 5