Ontologier. Cassandra Svensson 2014-01-09

Relevanta dokument
Beräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens Erik Claesson

En uppsats i Språkteknologi av Niklas Vargensten e-post: d99-nva@d.kth.se

Ämnesområden. Examensarbete inom datavetenskap (1DV41E) Martin Fredriksson

Swedish adaptation of ISO TC 211 Quality principles. Erik Stenborg

Från ljusenergi till en kub som går att stå på Hur man får en dator att känna igen olika former i visuell information

Människa-Datorinteraktion

Artificiell Intelligens

Fuzzy Logic. När oskarpa definitioner blir kristallklara. Åsa Svensson. Linköpings Universitet. Linköping

Vad är Artificiell Intelligens (AI) Olika typer av AI och deras användningsområden Innovation med hjälp av AI Framtiden och etiska frågeställningar

Ökat personligt engagemang En studie om coachande förhållningssätt

Designkoncept och gränssnittsmetaforer

(Data)Modellering. nikos dimitrakas rum 2423

Att hitta projekt. Björn Victor. måndag 19 mars 12

Mer OOP. Variation i typ. Medlen repetition. Generiska klasser. Gränssnitt - Interface. Mer om klasser Några exempel UML

Taking Flight! Migrating to SAS 9.2!

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier

Sri Lanka Association for Artificial Intelligence

Stina Nyman

Kanban är inte din process. (låt mig berätta varför) #DevLin Mars 2012

Collaborative Product Development:

A metadata registry for Japanese construction field

Objektorienterad analys och design

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Urban Runoff in Denser Environments. Tom Richman, ASLA, AICP

Vad kännetecknar en god klass. Vad kännetecknar en god klass. F12 Nested & Inner Classes

Datorrepresentation av vårdriktlinjer

Introduction to the Semantic Web. Eva Blomqvist

Karlstads Universitet, Datavetenskap 1

Samverkan kring barn som far illa

Föreläsning 3 Användare, uppgift och omgivning. Kapitel 3-4 i Stone et al.

- ett statistiskt fråga-svarsystem

Shakey s värld med HTNplanering

RUP är en omfattande process, ett processramverk. RUP bör införas stegvis. RUP måste anpassas. till organisationen till projektet

Innehåll. Styrdon (ej i boken) Fitts lag (sidan ) Natural user interfaces. Kap 6.2.9, , Kap

Specifikation och tidsplan för examensarbete

Datavetenskap. Beteendevetenskap MDI. Design

Falcon och QA- system generellt

Artificiell Intelligens den nya superkraften

Syns du, finns du? Examensarbete 15 hp kandidatnivå Medie- och kommunikationsvetenskap

Fuzzy logic. Julia Birgersson, julbi

Flervariabel Analys för Civilingenjörsutbildning i datateknik

Informationsbeteende och förmedling av arkivinformation

Informationsmodellering och e-infrastrukturer

FÖRBÄTTRA DIN PREDIKTIVA MODELLERING MED MACHINE LEARNING I SAS ENTERPRISE MINER OSKAR ERIKSSON - ANALYSKONSULT

Mutability och State. Objekt-orienterad programmering och design (DIT953) Niklas Broberg / Johannes Åman Pohjola, 2018

Designmönster, introduktion. Vad är det? Varför skall man använda mönster?

Språkliga uttrycks mening

Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.

Lektion 3. Anteckningar

Teoretisk lingvistik och datalingvistik. Robin Cooper

Personas -En metod inom Participatory Design

Nationellt forum efaktura

Att utvecklas som handledare: reflektion kring litteratur, samt ett kort narrativ Pedagogiskt docenturarbete

Projekt och beskrivning

För universitetsgemensamma regler för forskarutbildning se Regler för utbildning på forskarnivå vid Göteborgs universitet Doktorandreglerna.

Sö ka litteratur i ERIC

Tangible interaction &TUI KIRSTEN RASSMUS-GRÖHN

Rönnström, Niclas (2006) Kommunikativ naturalism. HLS Förlag. Kapitel 7.

Goals for third cycle studies according to the Higher Education Ordinance of Sweden (Sw. "Högskoleförordningen")

Smart industri den digitala framtiden

Föreläsning 8 - del 2: Objektorienterad programmering - avancerat

Classes och Interfaces, Objects och References, Initialization

Vad är. Domändriven design?

Business research methods, Bryman & Bell 2007

Vad utmärker ett bra gränssnitt?

Artificiell intelligens, eller Kommer din dator att bli klokare än dig? (eller kanske är den redan det?)

Theory 1. Summer Term 2010

Tentamen etjänster och webbprogrammering Institutionen för informatik och media, informationssystem Datum 19/8 Tid

MIK i skolans styrdokument

JavaRats. Kravspecifikation. Version 1.1. Gustav Skoglund Marcus Widblom Senast ändrad: 13 / 05 / 08

Laboration 2: Designmönster

IR-teorier. Måndag 15 december 2008 Onsdag 17 december 2008

Static vs Dynamic binding Polymorfism. Objekt-orienterad programmering och design (DIT953) Niklas Broberg, 2018

Higher education meets private use of social media technologies PERNILLA

Objektorienterad programmering

Självkörande bilar. Alvin Karlsson TE14A 9/3-2015

Projekt i språkteknologi Projektförslag Johanna Karlsson joka1954

FTEA12:2 Filosofisk metod. Att värdera argumentation I

Resultat och reektioner kring mailkategorisering av användares mail till Uppsala läns landsting kring åtkomst av journaler via nätet

Datavetenskapligt program, N1COS

TDDC30. Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 2 Jonas Lindgren, Institutionen för Datavetenskap, LiU

Supplemental Instruction (SI) - An effective tool to increase student success in your course

Pass 4: Metadatastandarder

Agenda. Plats och magkänsla. Presentation. - en pedagogisk fråga?

Fuzzy Logic. Ellinor Ihs Håkansson, ellih

Boken. Kap Kap 11.3

PDP som redskap för karriärutveckling i utbildning. Ola Tostrup

Föreläsning 7: Kognition & perception

DVG C01 TENTAMEN I PROGRAMSPRÅK PROGRAMMING LANGUAGES EXAMINATION :15-13: 15

What Is Hyper-Threading and How Does It Improve Performance

Göra lika i båda leden

Protokoll Föreningsutskottet

Exjobbskritik Muntlig opponering på ett exjobb. Stina Ericsson

AURA och dess implementation i Inquire Biology

2D1418, språkteknologi. Vad är WordNet? Hans Eriksson december Datorpost personnummer:

Intellektuell )llgångsinventering En bra start på EU- projekt. Anna Aspgren & Lena Holmberg Innova)onskontor Väst

Civilingenjör Mjukvaruteknik Att designa en utbildning utifrån ACM CS Curriculum

Programinformation VT 2012 för

Transkript:

Ontologier Cassandra Svensson 2014-01-09

Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt och inspiration har jag fördjupat mig i ontologier och hur de kan användas i dialogsystem.

Innehåll Sammanfattning 1 Introduktion 3 Ontologier 4 Tre olika sorters ontologier 5 Design av ontologier 6 Enhetstyper och egenskaper 6 Taxanomins organisation 6 Ontologier i dialogsystem 8 Kraven på enhetstyper och egenskaper 8 Litteraturförteckning 9 Huvudreferens 9 Övriga referenser 9

Introduktion Målet med arbetet som presenteras i Annika Flycht-Erikssons avhandling (Flycht-Eriksson, 2004) handlar om att underlätta utvecklingen av informationsgivande dialogsystem kapabla att resonera utifrån domänkunskap med hög portabilitet, alltså att den även ska kunna gå att användas på andra system. Under sitt arbete tog Annika sig an två forskningsfrågor: Hur ontologier kan användas i dialogsystem när det gäller att ifrågasätta analys, dialogledning och domänkunskapshantering. Hur ska ontologierna utformas för att stödja dessa uppgifter. Jag har valt att enbart fördjupa mig i den första forskningsfrågan. Design Utveckling Användning Figur 2. De huvudsakliga forskningsområdena inom ontologier är design, utveckling och användning. De tjocka linjerna markerar de primära områden och samband som avhandlingen fokuserade på.

Ontologier En ontologi är något som används i många olika syften inom datavetenskap så som artificiell intelligens, kunskapsdelning och inom naturligt språkbearbetning. Att det används inom så många olika områden och på lite olika sätt gör att det är lite svårt att sätta fingret på exakt vad det är. Detta har lett till att det genom åren har gjorts många försök att definiera en ontologi. Kursbokens (Russel & Norvig, 2010) förslag är The word ontology means a particular theory of the nature of being or existence. The ontology determines what kinds of things exist, but does not determine their specific properties and interrelationships. En ontologi innehåller alltså allt som existerar i en värld men kan inte styra eller påverka dess innehåll. En lite vanligare och mer generell definition på vad en ontologi är kommer från Gruber, An ontology is an explicit specification of conceptualisation (Gruber, 1993). Men denna definition är inte så förklarande. Vi kollar istället på relationerna mellan ontologier, konceptualiseringar, kunskapsrepresentationer och domäner som är formulerade av (Valente & Breuker, 1996) så blir det lite tydligare. ONTOLOGI beskriver konceptualisering ger ontologisk åtagande för KUNSKAPSREPRESENTATION representerar domän Figur 1. Relationer mellan ontologier, konceptualiseringar, Kunskapsrepresentationer och domäner. (Valente & Breuker, 1996)

Enligt Valente och Breuker är domäner och konceptualiseringar abstrakta enheter medan kunskapsrepresentationer och ontologier är konkreta artefakter. En ontologi definierar konceptet som är fångat av konceptualiseringen och en kunskapsreprensation beskriver domänen. De två definitionerna som presenterats är båda filosofiska men det finns även pragmatiska definitioner. En av de kommer från (Mahesh & Nirenburg, 1995), A situated ontology is a world model used as a computational resource for solving a particular set of problems.. Denna definition handlar mer om artefaktnotationen från ontologierna som är konstruerad och används som ett verktyg. Detta är den definition som Annika har valt att utgå ifrån. Hon kommer alltså att se en ontologi som en beräkningsresurs. Tre olika sorters ontologier Enligt Bateman (Bateman, 1991) finns det tre olika sorters ontologier som alla relaterar till språk på olika sätt. Den första typen av ontologi, Conceptual ontologies, beskriver Bateman som abstrakta organisationer av verklig kunskap, så som sunt förnuft och liknande, som i huvudsak är icke-språkliga. Den andra typen är Interface ontologies och den fungerar som ett gränssnitt mellan dels grammatik och ordförråd och dels konceptuella ontologier. Den tredje och sista typen är mixed ontology och den beskriver Bateman som en abstrakt semantikkonceptuell representation av verkligkunskap som också fungerar som en semantik för användning av grammatik och ordförråd. Enligt Bateman (Bateman, 1991) är det vanligast inom AI är det att man använder sig av ontologier av den första typen, Conceptual ontologies.

Design av ontologier När man pratar om design av ontologier menar man dels vilken typ av kunskap som ska representeras och dels hur den kunskapen ska organiseras. Några punkter som man kan överväga är om man vill använda sig av binära relationer eller n-ary relationer. Hur man tänkt hantera default values, hur många värden ett attribut kan ha och hur man ska hantera tid och rum. Exempel på andra frågor som Annika också tog hänsyn till är vilken typ av egenskaper ska tillåtas? Vad är den generella organisationen av kategorier? och Vilken typ av axiom är tillåtet. Enhetstyper och egenskaper Tittar man på en ontologis anatomi säger (Chandrasekaran, Josephson, & Benjamins, 1999) att man hittar några generella problem. Dessa problem menar de är: Det finns objekt i världen. Objekt kan ha attribut som kan ta värden. Objekt kan existera i diverse relationer med varandra. Attribut och relationer kan ändras över tid. Det finns händelser som uppstår under olika tidsinstanser. Det finns processer där objekt deltar och som uppstår över tid. Världen och objekten i den kan befinna sig i olika tillstånd. Händelser kan orsaka andra händelser eller tillstånd som en effekt. Objekt kan ha delar. Det finns fyra olika typer av enheter att representera i ontologier, händelser och processer, objekt, attribut och till sist relationer. Man brukar skilja på de två första och de två sista typerna. Annika har i sin avhandling valt att använda sig av termen entity type för representationen av de två första typerna och termen property för de två senare typerna. När hon vill tala om alla fyra typer använder hon sig av termen concept. Taxanomins organisation Det är vanligt att man använder sig av en explicit hirarki för att beskriva objekten i en ontologi. Två strategier man kan använda sig av är a traditional tree som används i WordNet (Miller, Beckwith, Fellbaum, Gross, & Miller, 1993) och parallel dimensions som används i Dahlgrens ontologi (Dahlgren, 1995). Ett traditionellt träd fungerar som vi ser i figur 3 på så sätt att ett koncept hela tiden delas in i delkoncept. Parallella dimensioner fungerar som vi ser i figur 4 på så sätt att koncept karakteriseras längst med flera axlar.

Figur 3. WordNet s ontologi vilken är ett exempel på a traditional tree. Bilden är hämtad från (Flycht-Eriksson, 2004). Figur 4. Dahlgrens s ontologi, vilken är ett exempel på parallel dimensions. Bilden är hämtad från (Flycht-Eriksson, 2004).

Ontologier i dialogsystem I kapitel 3 visar Annikas analys att det finns många potentiella användningsområden för ontologier i dialogsystem. Till exempel så visade question answering och machine translation att ontologier kan användas för att tolka en användares yttranden. Det finns sedan tidigare ontologier som använts i dialogsystem och de har varit vad man kallar mixed. Det betyder att de är lingvistiskt orienterad kunskapsrepresentation som ger semantisk information. I kapitel 4 kopplar Annika ihop det som hon kom fram till i kapitel 2 och kapitel 3 och resultatet blev en lista med krav som en ontologi behöver uppfylla för att klara av att i ett informationsgivande dialogsystem. Figur 5. Detta är en del av den listan med krav som Annika kom fram till var nödvändiga. N betyder nödvändig, O betyder valfri, D betyder nödvändig i vissa domäner. Bilden är hämtad från (Flycht-Eriksson, 2004). Kraven på enhetstyper och egenskaper Sammanfattningsvis kom Annika fram till att egenskaperna behöver vara lokala, mångformiga, instanser och kunna ärvas. Attributen behöver begränsningar och standardvärden. Och vad det gäller relationer så räcker det med binära relationer. Vad det gäller hanteringen av tid och rum kom Annika fram till att det fungerar bäst om de representeras separat.

Litteraturförteckning Huvudreferens Flycht-Eriksson, A. (2004). Design and Use of Ontologies Information-providing Dialogue Systems. Linköping. Övriga referenser Bateman, J. A. (Oktober 1991). The Theoretical Status of Ontologies in Natural Language Processing. Proceedings of the workshop on "Text Representation and Domain Modelling Ideas from Linguistics and AI", ss. 7-11. Chandrasekaran, B., Josephson, J. R., & Benjamins, V. R. (1999). What are ontologies, and why do we need them? i IEEE Intelligent Systems (ss. 20-26). Dahlgren, K. (1995). A linguistic ontology. International Journal Human-Computer Studies 43, 809-818. Gruber, T. (1993). Towards principles for the design of ontologies used for knowledge sharing. i Technical report. California, USA: Stanford University. Mahesh, K., & Nirenburg, S. (1995). A situated ontology for practical NLP. i Proceedings of IJCAI'95 Workshops on Basic Ontological Issues in Knowledge Sharing. Montreal, Canada. Miller, G., Beckwith, R., Fellbaum, C., Gross, D., & Miller, K. (1993). Introduktion to wordnet: an on-line lexical database. Russel, S. J., & Norvig, P. (2010). i Artificial Intelligence: A modern Approach (s. 308). New Jersey: Pearson. Valente, A., & Breuker, J. (1996). Towards principled core ontologies. i Proceedings of KAW'96. Canada: Banff.