Semantiska webben och web 3.0. Kl Öppna biblioteket, FSBF:s årskonferens i Korsholm. Lars Iselid

Storlek: px
Starta visningen från sidan:

Download "Semantiska webben och web 3.0. Kl. 10.50 11.40 9-10.9 2010 Öppna biblioteket, FSBF:s årskonferens i Korsholm. Lars Iselid"

Transkript

1 Semantiska webben och web 3.0 Kl Öppna biblioteket, FSBF:s årskonferens i Korsholm. Lars Iselid

2 Min frys

3 Min frys är spontant organiserad och saknar i de flesta fall innehållsbeskrivningar, dvs. metadata

4 Min matlåda

5 Qué es esto?

6 Indisk linsgryta med kyckling

7

8 Ris, linser, aubergine, kyckling.

9 2 portioner

10 Lars Iselid

11 XML är hjärtat i begreppet semantiska webben är ett verktyg för att skapa XMLstandarder, exempelvis: RSS, MathML, XHTML etc. är utbyggbart fritt fram att skapa nya taggar

12 XML märkspråk för att skapa egna XML-tillämpningar Indisk linsgryta med kyckling Ris, linser, aubergine, kyckling. 2 portioner. Lars Iselid.

13 MaML - Matlåda Markup Language <matlådor> <maträtt> <titel>indisk linsgryta med kyckling </titel> <datum> </datum> <ingrediens>ris</ingrediens> <ingrediens>linser</ingrediens> <ingrediens> aubergine</ingrediens> <ingrediens> kyckling</ingrediens> <portioner>2</portioner> <ägare>lars Iselid</ägare> </maträtt> <maträtt>. </maträtt> </matlådor>

14 XML-attribut <ingrediens typ= tillbehör >ris</ingrediens> <ingrediens typ= huvud >linser</ingrediens> <ingrediens typ= huvud >aubergine </ingrediens> <ingrediens typ= huvud >kyckling </ingrediens> <ingrediens typ= krydda >

15 eller nya element <ingredienser> <tillbehör>ris</tillbehör> <huvudingrediens>linser</huvudingrediens> <huvudingrediens> aubergine </huvudingrediens> <huvudingrediens> kyckling </huvudingrediens> </ingredienser> Finns inga regler kring när man ska använda element respektive attribut, men element är mer praktiskt, därför undvik attribut.

16 Exempel: ID som identifierare, inte en del av maträttdatan <maträtt id= 1324 >

17 Vilket datum? När maträtten skapades? När maträtten frystes in? Bäst-före-datum?

18 XML-attribut?? <datum typ= infrysning > <datum typ= tillagat > <datum typ= bäst-före >

19 eller som element!! <infrysning> <tillagat> <bäst-före>

20 Bättre märkning <matlådor> <maträtt id= 1 > <titel>indisk linsgryta med kyckling </titel> <infrysning> </infrysning> <ingredienser> <tillbehör>ris</tillbehör> <huvudingrediens>linser</huvudingrediens> <huvudingrediens> aubergine </huvudingrediens> <huvudingrediens> kyckling </huvudingrediens> </ingredienser> <portioner>2<portioner> <ägare>lars Iselid</ägare> </maträtt> <maträtt> </maträtt> </matlådor>

21 Semantiska webben (SW) maskinläsbar information vars mening är väl definierad med standarder. Tim Berners Lee, webbens fader Mening = semantik

22 Weaving the web by Tim Berners-Lee, 1999.

23 The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation, Berners-Lee, Hendler and Lassila, 2001 i Scientific American.

24 Tim Berners-Lee Artificiell intelligens, t.ex. Natural Language Processing (NLP), försöker träna maskiner att agera som människor. Istället vill SW utveckla språk (läs:märkspråk) som människor kan använda för att uttrycka information som i sin tur är maskinläsbara. Människor skapar själva mening, inte maskiner

25 Vad är web 3.0? Vem myntade begreppet? John Markoff i NY Times 12 november 2006?

26 NY Times 12 november 2006 Their goal is to add a layer of meaning on top of the existing Web that would make it less of a catalog and more of a guide Referred to as Web 3.0, the effort is in its infancy, and the very idea has given rise to skeptics who have called it an unobtainable vision John Markoff

27 Web 3.0 ingår i artikeln om semantic web i engelska Wikipedia

28 Vad är web 3.0? People keep asking what Web 3.0 is. I think maybe when you've got an overlay of scalable vector graphics on Web 2.0 /---/ and access to a semantic Web integrated across a huge space of data, you'll have access to an unbelievable data resource. Tim Berners-Lee, International Herald Tribune 24 maj 2006.

29 Web 3.0 ingår också som del i wikipedia-artikel om web 2.0 Definitions of Web 3.0 vary greatly.

30 Den svenska artikeln i Wikipedia är bara påbörjad

31 Stubbar i Wikipedia Stubbar är artiklar på Wikipedia som är för korta för att tillfredsställande behandla ämnet, men som ändå innehåller relevant information.

32 Define: web 3.0 in Google

33 Web 3.0 synonymt med semantiska webben?? But commercial interest in Web 3.0 or the semantic Web, for the idea of adding meaning is only now emerging. John Markoff

34 Varför web 2.0 före web 3.0? Crowdsourcing användargenererat innehåll Den mer interaktiva webben i många fall ostrukturerad data på webben. Detta trots taggning (okontrollerad vokabulär) och RSS-formatet.

35 Semantiska webben (som idé inte realitet) kontra nuvarande webben Problematik med nuvarande webben: Nuvarande webben: ordmatchning, inte mening Många träffar, rankingalgoritmer styr vad som hamnar först och anses mest relevant Mycket information döljer sig av tekniska och kommersiella skäl oåtkomliga databaser Mycket information på internet kan inte delas mellan olika applikationer

36 SW kan lösa denna problematik SW handlar inte i sig om att göra saker enklare att hitta(!), enligt Berners-Lee. Utan skapa bättre möjligheter för åtkomst av data och dela denna mellan applikationer. Ej AI utan maskinläsbar data.

37 Tim Berners-Lee på Ted.com

38 Varför tror ni att kirurgen och bibliotekarien John Shaw Billings började indexera tryckta medicinska artiklar 1879?

39 Han startade Index Medicus

40 som senare blev Medline och PubMed

41 Maskinläsbar PubMed-referens i XML-format

42 The Semantic Web Stack en bild av det hierarkiska förhållandet mellan språken, där varje lager utnyttjar och använder möjligheter i underliggande lager.

43 Lagren i stacken URI för att identifiera resursen XML för att skapa strukturerad webbdokument, men skapar ingen direkt mening till innehållet RDF syntax för att beskriva data RDF Schema för att beskriva egenskaper i ovan nämnda data Ontologier (OWL) för att beskriva relationer mellan data

44 RDF och RDF Schema (RDFS) RDF triplett Resurs egenskap värde Resurs: människa, produkt, bok etc. Egenskap: ålder, pris, författad av etc. Värde: 100 år, 200 kr, Bo EK etc. Subjekt, predikat, objekt Kalle är kusin med Lisa

45 Ontologi formell beskrivning av relationer mellan koncept inom en domän

46 OWL Web Ontology Language en av de viktigaste delarna i SW språk för att skapa ontologier Beskriver: Hierarkiskt förhållande Relaterat förhållande Tvilling-relation Kontrollerade termer

47 MeSH tesaurus

48 Geopolitical ontology från FAO

49 ABM - Bibliotek och andra minnesinstitutioner (bl.a. arkiv och museer) Beskrivningen av resurserna varierar mycket: Samlingarna och dess ämne, natur, typ Specifika organisatoriska förhållningssätt till att organisera information Nivån på beskrivningen som krävs för att åtkomst av resursen Strukturen på datan och innehållet av metadata Användarna och specifika lokala behov

50 ABM arkiv, bibliotek, muséer. Detta har tvingat fram olika standarder: Dewey, SAB, UDK, NLM swemarc, MARC21 Marc AMD, ISAD(G) - arkivvärlden

51 Varför inte MARC för webbresurser? Att skapa en katalogiserad MARC-post med alla dess fält och delfält tar både mycket tid och är resurskrävande. MARC-formatet ej passande för webbresurser. Bibliografiska format dåliga på att beskriva webbresurser datum för tillkomst, revideringar, ursprung, information om åtkomst och användning etc.

52 MARCXML MARC definierad i XML Precis som HTML finns definierad i XML i form av XHTML MARCXML isn't as much XML as it is MARC; it's really MARC with a bad hairdo. Alexander Johannesen, Datavetare, Oslo. MARCXML: beast of burden shelter.nu/blog/2008/09/marcxml-beast-of-burden.html

53 Dublin Core Metadata Initiative Ett tappert försök att skapa ordning på webben : Bibliotekarier, datavetare, museifolk Två nivåer: Simple Dublin Core 15 element Qualified Dublin Core 15 + ytterligare 3 element

54 Varför slog inte DC igenom? Dublin Core: An Obituary by Jeffrey Beall in Library Hi Tech News 21(8), 2004, Brist på specifik beskrivning Creator men inte translator Icke-standardiserade dataelement Begränsade möjligheter till interoperabilitet

55 Istället MODS från Library of Congress

56 Tankarna bakom MODS Ett XML-baserat bibliografiskt beskrivningsschema utvecklat av Library of Congress. Ett försök att skapa ett enklare format än MARC och ett mer flexibelt och inte lika förenklat format som Dublin Core. Ett format som bättre än MARC kan beskriva digitala resurser. Enkelt att förstå även för icke-professionella katalogisatörer

57 ISO 2709 vs. XML MODS Taggar (ex. <title>) mer användarvänligt än MARC tresiffriga taggar (ex. 245). Taggar på engelska, sällan förkortningar t.ex. physicaldescription

58 MODS MODS MARC <title> 245 a <genre> 008 genre <publisher> 260 <titleinfo> <title>jag har ont:</title> <subtitle>i kropp som själ </subtitle> </titleinfo>

59 MODS MARC MODS 008, 256, 300, delar av 856. <physicaldescription> <physicaldescription> <form authority= marcform >Print </form> <extent> 1 score (12 p.) + 2 parts ; 31 cm. </extent> </physicaldescription>

60 RDA is here! Resource Description and Access kommer att ersätta AACR2. behov av ny standard anpassad även för digital resurser. riktlinjer och instruktioner som täcker beskrivning och tillgång till både digitala och analoga resurser.

61 RDA is here! Vem står bakom RDA? The Joint Steering Committee for Development of RDA RDA publiceras av: The American Library Association The Canadian Library Association CILIP: Chartered Institute of Library and Information Professionals

62 Library of Congress Fortfarande i testfas

63 RDAtoolkit.org

64 Det handlar i slutändan om att.. göra mina matlådor sökbara

65 och dina matlådor...

66 och de måste förstå varandra MaML

67 så att alla som vill enkelt och snabbt kan byta matlåda med varann när de kommer till jobbet!

68 Frågor?

Tillit på webben Annozilla som förtroendeingivande verktyg

Tillit på webben Annozilla som förtroendeingivande verktyg MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 006: ISSN 404-089 Tillit på webben Annozilla som förtroendeingivande verktyg ÅSA JOHNSON

Läs mer

Infrastruktur för informationshantering inom logistikdomänen

Infrastruktur för informationshantering inom logistikdomänen Martin Gülich, Martin Eklöf Infrastruktur för informationshantering inom logistikdomänen FOI-R-- 1647 --SE ISSN 1650-1942 Systemteknik Metodrapport April 2005 FOI är en huvudsakligen uppdragsfinansierad

Läs mer

Metadata för objekt- och tjänstebaserad säkerhet

Metadata för objekt- och tjänstebaserad säkerhet Metadata för objekt- och tjänstebaserad säkerhet HENRIK KARLZÉN FOI är en huvudsakligen uppdragsfinansierad myndighet under Försvarsdepartementet. Kärnverksamheten är forskning, metod- och teknikutveckling

Läs mer

Tjänsteorienterad Integration, ESB

Tjänsteorienterad Integration, ESB Avdelning för datavetenskap Martin Bood och Karl-Johan Fisk Tjänsteorienterad Integration, ESB Service Oriented Integration, ESB Examensarbete 10 poäng Datum: 07-10-12 Handledare: Examinator: Löpnummer:

Läs mer

Museum på webben -en undersökning om användbarhet och åtkomst

Museum på webben -en undersökning om användbarhet och åtkomst MAGISTERUPPSATS I BIBLIOTEKS- OCH INFORMATIONSVETENSKAP VID INSTITUTIONEN BIBLIOTEKS- OCH INFORMATIONSVETENSKAP/BIBLIOTEKSHÖGSKOLAN 2007:85 ISSN 1654-0247 Museum på webben -en undersökning om användbarhet

Läs mer

Att bygga en nyttig nationell infostruktur

Att bygga en nyttig nationell infostruktur Att bygga en nyttig nationell infostruktur Utredning gjord av Metamatrix AB i maj 2001 för Statskontoret. Pär Lannerö Johan Groth Sammanfattning

Läs mer

Sökmotorsoptimering Från nyckelord till relevant innehåll Fem företags SEO-praktik i förändring

Sökmotorsoptimering Från nyckelord till relevant innehåll Fem företags SEO-praktik i förändring Sökmotorsoptimering Från nyckelord till relevant innehåll Fem företags SEO-praktik i förändring Författare: Linda Pettersson Institutionen för Ekonomi och IT 2010-06-14 Handledare: Tomas Lindroth DEGREE

Läs mer

Effektiv dokumenthantering

Effektiv dokumenthantering Uppsala universitet Inst. för informationsvetenskap/data- och systemvetenskap Effektiv dokumenthantering Martin Berntsson & Niclas Hedman Kurs: Examensarbete Nivå: C Termin: VT-14 Datum: 140616 Sammanfattning

Läs mer

BIBLIOTEKET I FICKAN EN FALLSTUDIE OM MOBIL

BIBLIOTEKET I FICKAN EN FALLSTUDIE OM MOBIL BIBLIOTEKET I FICKAN EN FALLSTUDIE OM MOBIL BIBLIOTEKSKATALOGTJÄNST Examensarbete Systemarkitekturutbildningen Yoshiko Nordeborg VT10:2010SA03 Systemarkitekturutbildningen är en kandidatutbildning med

Läs mer

Sökmotoroptimering på Google

Sökmotoroptimering på Google Sökmotoroptimering på Google Carl Joel Määttä singerx@gmail.com Per Eriksson per@deviantspot.se 2009 Kalmar, datum C-nivå, 15 hp Examensarbete i Datorteknik Handledare: Anne Norling, Högskolan i Kalmar,

Läs mer

2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING. Av Erik Lindgren 810110-8218 soft@kth.se

2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING. Av Erik Lindgren 810110-8218 soft@kth.se 2D1418, Språkteknologi NADA, Kungliga Tekniska Högskolan 2004-10-17 SÖKMOTOROPTIMERING Av Erik Lindgren 810110-8218 soft@kth.se SAMMANFATTNING Föreliggande uppsats behandlar ämnet sökmotoroptimering.

Läs mer

MOT TILLGÄNGLIGA WEBBPLATSER WEBBPLATSER SOM FUNGERAR I ALLA WEBBLÄSARE NU OCH I FRAMTIDEN. Kandidatuppsats i informatik

MOT TILLGÄNGLIGA WEBBPLATSER WEBBPLATSER SOM FUNGERAR I ALLA WEBBLÄSARE NU OCH I FRAMTIDEN. Kandidatuppsats i informatik MOT TILLGÄNGLIGA WEBBPLATSER WEBBPLATSER SOM FUNGERAR I ALLA WEBBLÄSARE NU OCH I FRAMTIDEN Kandidatuppsats i informatik Sara Hansson S073935 Joakim Nordlund S072842 VT 2010:KI08 Svensk titel: Mot tillgängliga

Läs mer

DENNA RAPPORT, som utgör en del av examensarbetet på Kulturverkstan, är en introduktion

DENNA RAPPORT, som utgör en del av examensarbetet på Kulturverkstan, är en introduktion Rapport Kulturverkstan Lärande i Arbete IV Jan Kärrö Usability What you see is what you need Användaren i webbdesign Innehåll Introduktion... 1 Kite webbresurs för länskonstnärer... 1 Begreppet usability...

Läs mer

Mönsteridentifikation på sociala medier

Mönsteridentifikation på sociala medier Framsida Södertörns högskola Institutionen för Naturvetenskap, miljö och teknik Kandidatuppsats 15 hp Medieteknik C Höstterminen 2014 Programmet för IT, Medier och Design Mönsteridentifikation på sociala

Läs mer

Teknisk rapport. IS-projektet. Om de tekniska lösningarna

Teknisk rapport. IS-projektet. Om de tekniska lösningarna Teknisk rapport IS-projektet Om de tekniska lösningarna Bakom IS-projektet står styrgruppen för IS, i samverkan med forskning.se. Den tekniska rapporten är skriven av Anders Flodell, tekniskt ansvarig

Läs mer

Europeana Data Model vad, varför och hur

Europeana Data Model vad, varför och hur Europeana Data Model vad, varför och hur Fagdag om modellering hos Riksantikvaren 2014-03-07 Hannes Ebner hannes@metasolutions.se Innehåll 1. 2. 3. 4. 5. 6. 7. Bakgrund / Varför EDM? Nyckelegenskaper

Läs mer

Nyttan av Web 2.0 i en CRM-kontext Change impact of Web 2.0 in a CRM context

Nyttan av Web 2.0 i en CRM-kontext Change impact of Web 2.0 in a CRM context Kandidatuppsats i informatik Thesis work (Informatics) REPORT NO. 2008:043 ISSN: 1651-4769 Department of Applied Information Technology Nyttan av Web 2.0 i en CRM-kontext Change impact of Web 2.0 in a

Läs mer

The First Semantic Technology Conference - en konferensrapport 1

The First Semantic Technology Conference - en konferensrapport 1 The First Semantic Technology Conference en konferensrapport 1 The First Semantic Technology Conference - en konferensrapport 1 (2005-06-15) Stig Berild (Santa Anna IT Research Institute AB) 1 Rapport

Läs mer

Råd gällande beständiga länkar

Råd gällande beständiga länkar UTKAST Råd gällande beständiga länkar Nationellt ramverk för öppna data Peter Krantz AB Innehållsförteckning 1. Nationellt ramverk för öppna data... 2 1.1. Råd gällnade beständiga länkar... 2 1.2. Vem

Läs mer

Sökmotoroptimering - så tar du dig till en första plats!

Sökmotoroptimering - så tar du dig till en första plats! Examensarbete 15 högskolepoäng, grundnivå Sökmotoroptimering - så tar du dig till en första plats! Search engine opimization - how to get to first place Johanna Knöös Examen: Kandidatexamen 180p Huvudämne:

Läs mer

Träning och Kost. En tillämpning av Internet of Things genom sammankoppling av en Android-telefon, en matvåg och ett aktivitetsarmband

Träning och Kost. En tillämpning av Internet of Things genom sammankoppling av en Android-telefon, en matvåg och ett aktivitetsarmband Träning och Kost En tillämpning av Internet of Things genom sammankoppling av en Android-telefon, en matvåg och ett aktivitetsarmband Kandidatarbete inom Informationsteknik Emma Gustafsson Johanna Hartman

Läs mer

Hur väljer man ett språk eller ramverk för en framtida flexibel webbtjänst?

Hur väljer man ett språk eller ramverk för en framtida flexibel webbtjänst? Hur väljer man ett språk eller ramverk för en framtida flexibel webbtjänst? En fallstudie på en värdekodstjänst JAKOB RASMUSSEN Examensarbete Stockholm, Sverige 2009 Hur väljer man ett språk eller ramverk

Läs mer

Bloggarkivering - en jämförelse av insamlingstekniker för långtidsbevaring av bloggar. Emil Sandin

Bloggarkivering - en jämförelse av insamlingstekniker för långtidsbevaring av bloggar. Emil Sandin Bloggarkivering - en jämförelse av insamlingstekniker för långtidsbevaring av bloggar Emil Sandin Examensarbete Medieteknik 2011 EXAMENSARBETE Arcada Utbildningsprogram: Informations- och medieteknik Identifikationsnummer:

Läs mer

Hållbar webbdesign: en litteraturstudie

Hållbar webbdesign: en litteraturstudie Hållbar webbdesign: en litteraturstudie Examensarbete Mediakultur 2010 EXAMENSARBETE Arcada Utbildningsprogram: Identifikationsnummer: Författare: Arbetets namn: Handledare (Arcada): Mediakultur - multimedia

Läs mer

Utveckling av simulator för ärendehanteringssystem

Utveckling av simulator för ärendehanteringssystem Avdelning för datavetenskap Samiar Saldjoghi & Niclas Hanold Utveckling av simulator för ärendehanteringssystem Development of simulator for issue tracking system Datavetenskap C-uppsats 15hp Datum/Termin:

Läs mer

Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna

Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna Datavetenskap Björn Andersson Martin Meijer ASP och PHP En jämförelse mellan de båda teknikerna Examensarbete, C-nivå 10 poäng 2003:25 ASP och PHP En jämförelse mellan de båda teknikerna Björn Andersson

Läs mer

Metadata i datalager

Metadata i datalager Metadata i datalager En studie i hur organisationer hanterar metadata i datalager. 1 Institutionen för Data- och Systemvetenskap Stockholms Universitet / Kungl. Tekniska Högskolan September 2002 1 Uppsatsen

Läs mer

Louise Åberg & Veronica Holmgren

Louise Åberg & Veronica Holmgren Kandidatuppsats Flygplatsen och informationens livscykel En komparativ studie mellan Småland Airport och kandidatprogrammet i biblioteks- och informationsvetenskap vid Linnéuniversitetet Författare: Louise

Läs mer

REVEAL Course PM2 Level 2 Intermediate Topic: Project Management

REVEAL Course PM2 Level 2 Intermediate Topic: Project Management REVEAL Course PM2 Level 2 Intermediate Topic: Project Management Kurs Projektledning 2 Nivå 2 Mellan Projektledning Module 1: Projekt planen DU 1.1 Projekt planen Strukturen i en projektplan DU 1.2 Work

Läs mer

Kunskapshantering inom växande IT-bolag

Kunskapshantering inom växande IT-bolag Kunskapshantering inom växande IT-bolag En kvalitativ fallstudie på ett mindre IT-bolag Knowledge management in growing IT companies A qualitative case study at a small IT company Patrik Evertsson Jonas

Läs mer