LOD och best practices vid modellering vad är viktigt att tänka på?

Relevanta dokument
Pass 4. Exempel på metadatastandarder. SND Svensk nationell datatjänst

Europeana Data Model vad, varför och hur

Råd gällande vokabulärer för kommuners och landstings arbete med länkade öppna data

DCAT-AP. Vad är det och vad kommer härnäst

Pass 4: Metadatastandarder

Introduction to the Semantic Web. Eva Blomqvist

Övergången till RDA i Sverige Katarina Synnermark (RDA-redaktionen) Fredrik Klingwall (XL-utveckling)

DATA ÖPPNA DATA LÄNKADE DATA LÄNKADE ÖPPNA DATA

Olle Olsson. SICS ( ) W3C ( ) ) BeyondIT Page 1

METADATASTANDARDER EN ORIENTERING

E-pliktleverans via RSS-feeds

IRM som stöd för kunskapsutbyte i organisationer. Kristina Groth, KTH Pär Lannerö, Metamatrix

Råd gällande beständiga länkar

Hantera informationspaket i system för bevarande

LIBRIS. Den nationella biblioteksinfrastrukturen. Maria Hedenström, Avdelningen för Informationssystem

Format & vokabulär. Libris användardag 2017

Information och dokumentation Grundläggande metadataelement i Dublin Core (ISO 15836:2009, IDT)

Linked Data. Förstudie Linked Data. GeoTest Rapport upprättad Viktor Högberg - GeoTest

Introduktion till programmering

Semantisk web i biblioteket

Webbens grundbegrepp. Introduktion till programmering. Ytterligare exempel. Exempel på webbsida. Föreläsning 5

Öppna data Gäs öreläsning i kursen 729G44 - Gränssni sdesign Eva Blomqvist Linköpings Universitet eva.blomqvist@liu.


Prioriterade standarder, Handledning, Vägledning, Utbildning Mats Åhlin

RDA i Sverige Katarina Synnermark Olle Johansson RDA-redaktionen

Stefan Andersson SVEP. Övergripande mål - SVEP. Harmonisering av metadatabeskrivningar för elektroniskt publicerade dokument

Nya webbtjänster med XML

Alterna(va datamodeller & grafdata på webben. Gäs8öreläsning Eva Blomqvist

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Libris XL. Autoriteter i Sveriges nye biblioteksystem. KORG-dagene 2016 Harriet Aagaard Kungliga biblioteket. Illustration: Sir John Tenniel

Semantiska webben och web 3.0. Kl Öppna biblioteket, FSBF:s årskonferens i Korsholm. Lars Iselid

Ulf Bodin NORDLOD

Datahantering. Webinar 4 - Tryggt och säkert

Svensk nationell datatjänst, SND BAS Online

Öppna standarder. Olle Olsson World Wide Web Consortium - Svenska W3C-kontoret Swedish Institute of Computer Science (SICS) Ivan Herman

Swedish National Data Service

Webbteknik II. Föreläsning 5. Restless farewell. John Häggerud, 2011

Can we Trust Web-page Metadata?

Övning 1 - Abstrakta datatyper

Schematransformation SLU

Pass 3: Metadata. Svensk nationell datatjänst, SND BAS Online

SESAM - Ifbtr. Olle Olsson

Genom alternativet Utsökning kan du ta fram och exportera listor och förteckningar av publikationer i DiVA utifrån person, organisation, ämne m.m.

API:er/Mashup. Föreläsning 4 API:er och Mashups. Johan Leitet johan.leitet@lnu.se twitter.com/leitet facebook.com/leitet. Webbteknik II, 1DV449

Webbplats analys cite4me.org

Guide för Innehållsleverantörer

Under Kurser visas dina kurser som kort och om där finns nya uppgifter eller anslag visas antalet i kurskortet.

Webbplats analys akcpdistributor.de.ipaddress.com

Webbplats analys skillmd.com

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.

Webbplats analys emreemir.com

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 1 METS

WWW. Exempel på klientsidan. Överföring av en html-fil. Snyggare variant. Verkligt format. Meddelandeformat för begäran HTTP

Introduktion till databaskursen. Välkomna. till kursen. Databasteknik och informationssystem. DD1370 (kursomgång dbtinf12)

Alterna(va datamodeller & grafdata på webben. Gäs8öreläsning Robin Keskisärkkä

Webbplats analys playhousenightclub.com

Digikult 2014 Gemensam samnordisk auktoritets-hantering för kultursektorn Ulf Bodin

Informationsmodell metadata Nv kärnprofil

OneGeology-Europe gör geologiska data lättillgängliga. Tomas Lindberg & Lars Kristian Stölen Sveriges geologiska undersökning (SGU)

FHIR OCH INTEROPERABILITET I SJUKVÅRDEN OSKAR THUNMAN

Optimering av webbsidor

XML. Extensible Markup Language

RIV TA Basic Profile 2.1 med intygspropagering RIV Tekniska Anvisningar

Cinahl sökguide. Enkel sökning. Ämnesordsökning

Gemensam samnordisk terminologihantering för kultursektorn LOD-seminarium

Lathund till MEDLINE

Webbplats analys facebook.com

Geodataportalen - Metadata -Webbformulär för redigering av metadata

Den semantiska webben - en översikt

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

Lathund till Academic Search Complete

Ny skalbar och öppen OLAP-teknologi, SAS OLAP server

PunchOut-kataloger i Ariba en guide för leverantören

Webbplats analys ipchecker.us

SVENSK STANDARD SS-ISO :2018

Choose a building block. Kleos Knowledge Center. Version: 1.01 (ML) 28 maj Kleos 6.6 (Juni 2019) Nya & förbättrade funktioner

Råd för beskrivning av datamängder

Datorer och kunskap - Den semantiska webben Robert Herber

Öppna upp företagsdata

Ontologier. Cassandra Svensson

Webbplats analys akcpsensor.de.ipaddress.com

Lathund för studenter

Varför ska man lära sig sånt? Välkomna. Vad är databaser bra till? Kursansvarig. till kursen. Databasteknik och informationssystem

Stora CINAHL-lathunden

SFTI Migreringsguide från Sveorder 1.0 till CEN/BII Core Order Transaction

Webbplats analys sarajacob3216.wordpress.com

Nätverksgruppen kring EU-projekt som berör frågorna som gäller digitalisering, tillgängliggörande och bevarande av digitalt kulturarvsmaterial

Checklista: Beständiga identifierare

Kostnadskontroll genom kvalitetssäkrad Programvaruhantering

729G74 IT och programmering, grundkurs. Tema 2, Föreläsning 1 Jody Foo,

Informationsmodellering och e-infrastrukturer

Statistik över publikationer med öppen tillgång

Anvisning för Svensk Livfaktura

Figur 1. Forestand kompletterar de befintliga standarderna StanForD och papinet

Eva Hellstöm - Christina Strand

N VIVO SOM REDSKAP FÖR KVALITATIVA INNEHÅLLSANALYSER

Arv. Fundamental objekt-orienterad teknik. arv i Java modifieraren protected Lägga till och modifiera metoder med hjälp av arv Klass hierarkier

JavaScript in SharePoint and not just for Apps. Wictor Wilén

Webbplats analys villagetalkies.com

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

Transkript:

LOD och best practices vid modellering vad är viktigt att tänka på? Fagdag om modellering hos Riksantikvaren 2014-03-07 Hannes Ebner hannes@metasolutions.se

Lite om mig Hannes Ebner Bakgrund: telekommunikation, informationssystem Doktorsavhandling med fokus på samarbetsmiljöer som är baserade på semantiska teknologier och länkade data

Om MetaSolutions Importera Redigera Publicera Gränsnitt Specifika anpassningar

Innehåll 1. 2. 3. 4. 5. Stjärnor Identifierare Modellering Datahantering Övrigt

Länkade data-stjärnor gör din information tillgänglig på Webben (oberoende av format) under en öppen licens gör informationen tillgänglig som strukturerad data (t. ex., Excel format istället för en bild av en tabell) använd icke-proprietära format (t. ex., CSV istället för Excel) använd URI:er för att identifiera ting, och RDF för att uttrycka påståenden om dem länka dina data till andras data, det ger sammanhang 1. Introduktion

Fördelar fyra stjärnor Andra kan referera till dina data (URI:er) Dataintegration förenklas (Återanvändning av existerande utryck => andra har kännedom eller till och med utvecklat stöd för att förstå delar av datan) Genomtänkta uttryck pga. stå på jättars axlar RDF => existerande mjukvara och tjänster (för att skapa, validera, lagra, maskinellt bearbeta, kombinera, redigera eller utforska datan med existerande frågespråk)

Fördelar fem stjärnor Förtydliga dina data (länka till väletablerade och väl uttänkta termer/begrepp istället för att skapa egna eller skriva fritext) Omedelbar återanvändning av termer/begrepp (inga tekniska aspekter av dataintegration som import, konvertering och drift/underhåll) Möjliggör ökad dataspecialisering (fokus på data som är unika för din organisation och förlita dig på information i andra datakällor) Länkar till andra datakällor ökar förtroende och synlighet (jmf. referenser i artiklar som visar på att informationen är förankrad i ett större sammanhang)

Identifierare 1/3 Hierarkiska eller mönster-baserade Om det finns en given hierarki :collection/:item/:sub-collection/:item http://example.org/collections/10/picture/2 Utan hierarki: http://example.org/books/1 Bättre läsbarhet, förutsägbara Naturliga Befintliga unika identifierare (t.ex. ISBN) -> URI http://example.org/base/1234567890

Identifierare 2/3 Slugs Mönster för att skapa URIer av t.ex. taggar http://example.org/tags/linked-data Proxies När det saknas identifierare för externa resurser (3rd party) ISO, IANA,... Skapa en URI i sin egna namnrymd http://example.org/mime/application/pdf

Identifierare 3/3 Fragment URIer Sista optionala delen i ett URI (#) Identifierar vanligtvis (t.ex. HTML) en del av ett dokument ( fragment ) Exempel: http://www.w3.org/2004/02/skos/core#narrower Identifierar konceptet narrower i SKOS Core narrower beskrivs (med andra koncept) i RDF filen http://www.w3.org/2004/02/skos/core Hela RDF filen måste laddas för att komma åt konceptet

Modellering - beteckningar Varje resurs bör ha en beteckning rdfs:label även rdfs:preflabel om det finns flera Rule number 1 in building web software: never show the URI. If the URI does not have label, go and beat somebody up. Sir Tim Berners-Lee på LDOW 2012

Modellering - multipla värden Repeated properties Samma tillvägagångssätt för flera språk <http://example.org/bilder/semla1> dc:subject grädde @sv dc:subject fløte @no dc:subject fløyte @nn dc:subject Sahne @de dc:subject Schlagobers @de-at dc:subject semla @sv dc:subject fastlagsbulle @sv dc:subject fastelavnsbolle @dk

Blanka noder Resurs utan URI eller Literal: anonymous resource Representation av komplex data <http://example.org/bilder/semla1> dcterms:subject _:subj1 ; dcterms:subject _:subj2 ; dcterms:subject _:subj3. _:subj1 rdf:value grädde @sv ; rdf:value fløte @no. Syntax Encoding Scheme URI _:subj2 rdf:value fastlagsbulle @sv ; rdf:value fastelavnsbolle @dk. _:subj3 rdf:value någonting helt annat ^^ex:encoding.

Blanka noder rdf:value grädde @sv rdf:value fløte @no _:subj1 dcterms:subject dcterms:subject _:subj2 ex:semla1 dcterms:subject rdf:value... rdf:value _:subj3...

Modellering - indexresurser Repeated properties är inte ordnade Ordning behövs för indexering rdf:list Om indexet är permanent Innehållet är bekant vid publicering Annars: rdf:seq Alternativt, utan indexresurs naturlig ordning t.ex. sortera inlägg efter publiceringsdatum

Datahantering - named graphs Quadruple Identifierare för en mängd tripplar Standardiserade sedan RDF 1.1 Exempel i TriG: <http://example.org/graph/1> { <http://example.org/document/5> rdfs:label "Example" ; dct:format application/pdf ; dct:extent 1200000. }

Datahantering - grafannotering Information om named graphs Provenance Vem får läsa/skriva (ACL)... Relationer mellan named graphs Exempel <http://example.org/graphs/1> { <http://example.org/graph/1> dct:created "2014-03-02"^^xsd:date. }

Vokabulärer Vanliga vokabulärer DC, DC Terms FOAF Schema.org... Koncept-, vokabulär- och ontologispråk SKOS RDFS OWL

Koncept-, vokabulär- och ontologispråk SKOS, RDFS och OWL SKOS - Simple Knowledge Organisation System Concepts in ConceptSchemes Namn via preflabel, altlabel Hierarkier via narrow/broader relationer via related RDFS - RDF Vocabulary Description Language Definera klasser och properties i RDF subclassof och subpropertyof för att förfina OWL - Web Ontology Language Kraftfullare än RDFS

DCMI Terms Qualified Dublin Core Properties: abstract, accessrights, accrualmethod, accrualperiodicity, accrualpolicy, alternative, audience, available, bibliographiccitation, conformsto, contributor, coverage, created, creator, date, dateaccepted, datecopyrighted, datesubmitted, description, educationlevel, extent, format, hasformat, haspart, hasversion, identifier, instructionalmethod, isformatof, ispartof, isreferencedby, isreplacedby, isrequiredby, issued, isversionof, language, license, mediator, medium, modified, provenance, publisher, references, relation, replaces, requires, rights, rightsholder, source, spatial, subject, tableofcontents, temporal, title, type, valid Intoducerades 1995 på Workshop i Dublin Ohio av olika biblioteksorganisationer Fokus: beskriva resurser/verk av olika slag Underhålls av DCMI (Dublin Core Metadata Initiative)

FOAF - Friend Of A Friend Properties: account age based_near birthday currentproject depicts dnachecksum gender givenname holdsaccount img interest knows lastname mbox member nick openid page phone plan status surname thumbnail title topic weblog Specifikation: http://xmlns.com/foaf/spec Introducerades 2000, senast uppdaterad 2010 Bygger på Dublin Core

Schema.org Bing, Google och Yahoo Introducerade schema.org 2011 Mer än 800 typer och 600 egenskaper Används för att förbättra sökresultat

Linked Open Vocabularies http://lov.okfn.org Vokabulär RDFS OWL

Förstådd och rätt använd Hitta/anpassa den bästa standarden Hur avgränsa ett område Hur komma överens, legitimitet Använd många vokabulärer och Länkade data Kombinera existerande vokabulärer + egna Best practise växer fram, dubblera där så saknas

Interoperabilitet vs. Harmonisering En enskild standard ger interoperabilitet Maskiner kan utbyta data efter noggrann programmering Oftast punkt till punkt Länkade data ger harmonisering mellan standarder/vokabulärer Olika data kan blandas och samexistera Maskiner förstår de delar de programmerats för Ibland genom att förgrova och dra slutsatser enligt förberedda regler

Dokumentation av vokabulärer Även återanvändning av existerande vokabulärer OWL property restrictions Återdefiniera mha RDFS eller OWL Description Set Profiles (DCMI) Shape expressions (W3C, standardisering pågår) Beskriv i text på ett strukturerat sätt välj denna!!!

Follow your nose Hitta ytterligare relevant information på webben Det ska gå att följa länkar URIer måste vara dereferencable Länkade data som de ska vara!

Finn åtta fel (dålig RDF design)

Finn åtta fel (dålig RDF design) 1 2 1+3 4 1. 2. 3. 4. 5. 6. 7. 5 8. 5 7 8 6 Återanvänd properties Datatyp saknas Lowercase på properties Använd resurser för URIer Artificiell gruppering Ange språk på literal Du pekar på resurser, inte URL:er, tänk konceptuellt Properties ska utgå från rätt resurs

Bra RDF design

Frågor? Hannes Ebner hannes@metasolutions.se Kontakta mig gärna, t.ex. om ni: - har frågor om länkade data - behöver en plattform för länkade data MetaSolutions AB www.metasolutions.se

1. Länkade data Proxy / Cache - Komma runt browserbegränsningar - Erbjuda stabil/snabb åtkomst - Partitionera så delar av grafen kan laddas asynkront - Vissa delar kan cachas on-demand - Enhetligt format, tex JSON-LD för minimalt footprint

2. Ladda in några centrala dataset - Alla datakällor finns inte som LOD Ha koll på stabilitet i åtkomst Vid behov harmonisera identifierare mellan dataset Vid behov skapa aggregerad vy (tex mha EDM) Använd named graphs för att hålla koll på ursprung Man kan bygga ovanpå existerande lösningar, tex lodify.com

3. Länkade data virtuell vy av relevanta ting (*) - Lista av rekommenderade ting (givet ett ting) Resultat som ett RDF uttryck (återstår att tänka ut) Troligtvis använder man LDP containers Genereras via en SPARQL construct fråga Frågor kan skapas allteftersom Ingen nyutveckling krävs för nya frågor (*) Överkurs