Ontologier Cassandra Svensson 2014-01-09
Sammanfattning Jag har läst Annika Flycht-Ericssons avhandling Design and Use of Ontoligies in information-providing Dialogue Systems. Med Annikas text som utgångspunkt och inspiration har jag fördjupat mig i ontologier och hur de kan användas i dialogsystem.
Innehåll Sammanfattning 1 Introduktion 3 Ontologier 4 Tre olika sorters ontologier 5 Design av ontologier 6 Enhetstyper och egenskaper 6 Taxanomins organisation 6 Ontologier i dialogsystem 8 Kraven på enhetstyper och egenskaper 8 Litteraturförteckning 9 Huvudreferens 9 Övriga referenser 9
Introduktion Målet med arbetet som presenteras i Annika Flycht-Erikssons avhandling (Flycht-Eriksson, 2004) handlar om att underlätta utvecklingen av informationsgivande dialogsystem kapabla att resonera utifrån domänkunskap med hög portabilitet, alltså att den även ska kunna gå att användas på andra system. Under sitt arbete tog Annika sig an två forskningsfrågor: Hur ontologier kan användas i dialogsystem när det gäller att ifrågasätta analys, dialogledning och domänkunskapshantering. Hur ska ontologierna utformas för att stödja dessa uppgifter. Jag har valt att enbart fördjupa mig i den första forskningsfrågan. Design Utveckling Användning Figur 2. De huvudsakliga forskningsområdena inom ontologier är design, utveckling och användning. De tjocka linjerna markerar de primära områden och samband som avhandlingen fokuserade på.
Ontologier En ontologi är något som används i många olika syften inom datavetenskap så som artificiell intelligens, kunskapsdelning och inom naturligt språkbearbetning. Att det används inom så många olika områden och på lite olika sätt gör att det är lite svårt att sätta fingret på exakt vad det är. Detta har lett till att det genom åren har gjorts många försök att definiera en ontologi. Kursbokens (Russel & Norvig, 2010) förslag är The word ontology means a particular theory of the nature of being or existence. The ontology determines what kinds of things exist, but does not determine their specific properties and interrelationships. En ontologi innehåller alltså allt som existerar i en värld men kan inte styra eller påverka dess innehåll. En lite vanligare och mer generell definition på vad en ontologi är kommer från Gruber, An ontology is an explicit specification of conceptualisation (Gruber, 1993). Men denna definition är inte så förklarande. Vi kollar istället på relationerna mellan ontologier, konceptualiseringar, kunskapsrepresentationer och domäner som är formulerade av (Valente & Breuker, 1996) så blir det lite tydligare. ONTOLOGI beskriver konceptualisering ger ontologisk åtagande för KUNSKAPSREPRESENTATION representerar domän Figur 1. Relationer mellan ontologier, konceptualiseringar, Kunskapsrepresentationer och domäner. (Valente & Breuker, 1996)
Enligt Valente och Breuker är domäner och konceptualiseringar abstrakta enheter medan kunskapsrepresentationer och ontologier är konkreta artefakter. En ontologi definierar konceptet som är fångat av konceptualiseringen och en kunskapsreprensation beskriver domänen. De två definitionerna som presenterats är båda filosofiska men det finns även pragmatiska definitioner. En av de kommer från (Mahesh & Nirenburg, 1995), A situated ontology is a world model used as a computational resource for solving a particular set of problems.. Denna definition handlar mer om artefaktnotationen från ontologierna som är konstruerad och används som ett verktyg. Detta är den definition som Annika har valt att utgå ifrån. Hon kommer alltså att se en ontologi som en beräkningsresurs. Tre olika sorters ontologier Enligt Bateman (Bateman, 1991) finns det tre olika sorters ontologier som alla relaterar till språk på olika sätt. Den första typen av ontologi, Conceptual ontologies, beskriver Bateman som abstrakta organisationer av verklig kunskap, så som sunt förnuft och liknande, som i huvudsak är icke-språkliga. Den andra typen är Interface ontologies och den fungerar som ett gränssnitt mellan dels grammatik och ordförråd och dels konceptuella ontologier. Den tredje och sista typen är mixed ontology och den beskriver Bateman som en abstrakt semantikkonceptuell representation av verkligkunskap som också fungerar som en semantik för användning av grammatik och ordförråd. Enligt Bateman (Bateman, 1991) är det vanligast inom AI är det att man använder sig av ontologier av den första typen, Conceptual ontologies.
Design av ontologier När man pratar om design av ontologier menar man dels vilken typ av kunskap som ska representeras och dels hur den kunskapen ska organiseras. Några punkter som man kan överväga är om man vill använda sig av binära relationer eller n-ary relationer. Hur man tänkt hantera default values, hur många värden ett attribut kan ha och hur man ska hantera tid och rum. Exempel på andra frågor som Annika också tog hänsyn till är vilken typ av egenskaper ska tillåtas? Vad är den generella organisationen av kategorier? och Vilken typ av axiom är tillåtet. Enhetstyper och egenskaper Tittar man på en ontologis anatomi säger (Chandrasekaran, Josephson, & Benjamins, 1999) att man hittar några generella problem. Dessa problem menar de är: Det finns objekt i världen. Objekt kan ha attribut som kan ta värden. Objekt kan existera i diverse relationer med varandra. Attribut och relationer kan ändras över tid. Det finns händelser som uppstår under olika tidsinstanser. Det finns processer där objekt deltar och som uppstår över tid. Världen och objekten i den kan befinna sig i olika tillstånd. Händelser kan orsaka andra händelser eller tillstånd som en effekt. Objekt kan ha delar. Det finns fyra olika typer av enheter att representera i ontologier, händelser och processer, objekt, attribut och till sist relationer. Man brukar skilja på de två första och de två sista typerna. Annika har i sin avhandling valt att använda sig av termen entity type för representationen av de två första typerna och termen property för de två senare typerna. När hon vill tala om alla fyra typer använder hon sig av termen concept. Taxanomins organisation Det är vanligt att man använder sig av en explicit hirarki för att beskriva objekten i en ontologi. Två strategier man kan använda sig av är a traditional tree som används i WordNet (Miller, Beckwith, Fellbaum, Gross, & Miller, 1993) och parallel dimensions som används i Dahlgrens ontologi (Dahlgren, 1995). Ett traditionellt träd fungerar som vi ser i figur 3 på så sätt att ett koncept hela tiden delas in i delkoncept. Parallella dimensioner fungerar som vi ser i figur 4 på så sätt att koncept karakteriseras längst med flera axlar.
Figur 3. WordNet s ontologi vilken är ett exempel på a traditional tree. Bilden är hämtad från (Flycht-Eriksson, 2004). Figur 4. Dahlgrens s ontologi, vilken är ett exempel på parallel dimensions. Bilden är hämtad från (Flycht-Eriksson, 2004).
Ontologier i dialogsystem I kapitel 3 visar Annikas analys att det finns många potentiella användningsområden för ontologier i dialogsystem. Till exempel så visade question answering och machine translation att ontologier kan användas för att tolka en användares yttranden. Det finns sedan tidigare ontologier som använts i dialogsystem och de har varit vad man kallar mixed. Det betyder att de är lingvistiskt orienterad kunskapsrepresentation som ger semantisk information. I kapitel 4 kopplar Annika ihop det som hon kom fram till i kapitel 2 och kapitel 3 och resultatet blev en lista med krav som en ontologi behöver uppfylla för att klara av att i ett informationsgivande dialogsystem. Figur 5. Detta är en del av den listan med krav som Annika kom fram till var nödvändiga. N betyder nödvändig, O betyder valfri, D betyder nödvändig i vissa domäner. Bilden är hämtad från (Flycht-Eriksson, 2004). Kraven på enhetstyper och egenskaper Sammanfattningsvis kom Annika fram till att egenskaperna behöver vara lokala, mångformiga, instanser och kunna ärvas. Attributen behöver begränsningar och standardvärden. Och vad det gäller relationer så räcker det med binära relationer. Vad det gäller hanteringen av tid och rum kom Annika fram till att det fungerar bäst om de representeras separat.
Litteraturförteckning Huvudreferens Flycht-Eriksson, A. (2004). Design and Use of Ontologies Information-providing Dialogue Systems. Linköping. Övriga referenser Bateman, J. A. (Oktober 1991). The Theoretical Status of Ontologies in Natural Language Processing. Proceedings of the workshop on "Text Representation and Domain Modelling Ideas from Linguistics and AI", ss. 7-11. Chandrasekaran, B., Josephson, J. R., & Benjamins, V. R. (1999). What are ontologies, and why do we need them? i IEEE Intelligent Systems (ss. 20-26). Dahlgren, K. (1995). A linguistic ontology. International Journal Human-Computer Studies 43, 809-818. Gruber, T. (1993). Towards principles for the design of ontologies used for knowledge sharing. i Technical report. California, USA: Stanford University. Mahesh, K., & Nirenburg, S. (1995). A situated ontology for practical NLP. i Proceedings of IJCAI'95 Workshops on Basic Ontological Issues in Knowledge Sharing. Montreal, Canada. Miller, G., Beckwith, R., Fellbaum, C., Gross, D., & Miller, K. (1993). Introduktion to wordnet: an on-line lexical database. Russel, S. J., & Norvig, P. (2010). i Artificial Intelligence: A modern Approach (s. 308). New Jersey: Pearson. Valente, A., & Breuker, J. (1996). Towards principled core ontologies. i Proceedings of KAW'96. Canada: Banff.