Översikt. Mer om XML & TEI Kurstillfälle 2. Grundläggande principer 1. Grundläggande principer 2. Hierarkisk dokumentmodell. XML & flexibilitet

Relevanta dokument
Hantera informationspaket i system för bevarande

Konstruktion av datorspråk

Strukturering med XML och DTD

Vad är XML XML. Exempel - SMIL. Exempel - XHTML. extensible Markup Language

XML. Dagens föreläsning. Vad är XML extencible Markup Language. Exempel - XHTML

Dagens föreläsning. Vad är XML. Exempel - XHTML. extencible Markup Language

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

Heldag om FGS FGS:er och deras tekniska regelverk. Karin Bredenberg, FGS funktionen. Standarder. FGS:er och deras tekniska regelverk 1

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 4. Peter Dalenius Institutionen för datavetenskap

Uppmärkningsspråk. TDP007 Konstruktion av datorspråk Föreläsning 3. Peter Dalenius Institutionen för datavetenskap

En snabb titt på XML LEKTION 6

Delrapport DP3. FGS för paketstruktur för e-arkiv Bilaga 1 METS

HTML5 Semantic. Informationen kommer från w3schools.com. En semantisk elementet beskriver tydligt dess betydelse för både webbläsaren och utvecklaren.

Metaspråket XML Mika Suonvieri

ITK:P2 F1. Hemsidor med HTML HTML. FTP, HTTP, HTML, XML och XHTML

XML. Extensible Markup Language

<sid nr="1" av="2" /> Stackenföreläsning: XML & XSLT: Intro. XML och XSLT

Träd Hierarkiska strukturer

HTML och CSS. Eric Elfving Institutionen för datavetenskap. 18 augusti 2015

Informationsmodellering och e-infrastrukturer

24-timmarswebben. Riktlinje Förklaring Så uppfyller vi den

XML+ANT+CVS+DIARY. XML: Exempel. XML: Syntax (1) Genomgång av några av de verktyg som används på kursen. <?xml version="1.0" encoding="iso "?

JavaScript. Innehåll. Historia. Document object model DHTML. Varför Javascript?

KFF Beskrivning av KFF-handläggningsprocessen 1 (10) Gällande Mikael Andersson REGISTERKARTE-GML

Övning 1 Vi börjar med en vanlig html-fil där html används för både innehåll och utseende:

DP7 Kompletterande information

Språk för webben introduk4on 4ll HTML

WEBBUTVECKLING Kursplanering

HTML och CSS. Eric Elfving Institutionen för Datavetenskap (IDA)

Validering av XML, Svensk geoprocess Guide för validering av XML, Svensk Geoprocess

Beskrivning av xml-produkten FirmagranskningSokord(F34) version 2.00

EDA095 HTML. Per Andersson. April 26, Lund University Innehåll: HTML, CSS, DOM, JavaScript

F02 En första sida. Dagens agenda

Bilaga 3. En redogörelse kring metadata och XML. Status Slutlig. Sid 1 (7) Dokumenttyp. Versionsdatum


Övning (X)HTML 2. Sidan 1 av

FältGIS. Utfört av Patrik Fundberg. Mälardalens Högskola, IDt. Handledare John Kessler, LandFocus IS AB Christer Norström, Mälardalens Högskola

Svensk nationell datatjänst, SND BAS Online

Föreläsning 4. CSS Stilmallar för webben

Introduktion till XSLT

Systembeskrivning.

Isolda Inköp - EDI. Specifikation v 2.0

Översikt och tillämpning av XML

Referenshantering med Zotero Introduktion

F02 HTML. Föreläsning 2, HT2013 HTML. Kurser: Klientbaserad Webbutveckling 1DV435. Johan Leitet

Beskrivning av xml-produkten Dokumentleverans (D4) version 2.04

extensible Markup Language

RIV TA Domänschema 2.1

XML Lars Celander en effektiv introduktion m n skonsam E

Vad är XML Schemas. XML Schemas. Varför XML Schmas. Namespace

En grundkurs i hemsidor och hur de är uppbyggda

RIV Tekniska Anvisningar 2.1

Webbplats analys cite4me.org

XML. XML is a method for putting structured data in a text file

Pass 4: Metadatastandarder

RDA Kapitel 10. RDA 10.2 Släktens namn Kärnelement. Föredraget namn är ett kärnelement. Variantnamn är valfria.

För dig som lärare har vi placerat nya inkomna svar från elever under Följ upp uppgifter medan elev på samma ställer ser alla sina aktiva Uppgifter.

Laboration 2: Xhtml och CSS.

Affina avbildningar och vektorgrafik

Introduktion... 2 Vad är en vy? Meddelandestruktur fi2messageheader, meddelandehuvud... 5

Webbplats analys sarajacob3216.wordpress.com

RDA Kapitel 10. RDA Kapitel 10. Att identifiera familjer/släkter

Tillämpningsanvisningar

Innehåll Introduktion... 3 InteractiveScene.config... 3 Scener <scenes>... 3 Typsnitt <fonts>... 3 Övergångar <transitions>...

729G74 IT och programmering, grundkurs. Tema 2. Föreläsning 3 Jody Foo,

Xhtml och CSS.Tillämpad fysik och elektronik Per Kvarnbrink (redigering Ulf Holmgren 2011)

Anvisning för Svensk Livfaktura

DP7 FORMELL KONTROLL

Post- och telestyrelsens författningssamling

Introduktion. Byggstenar TDBA

Paketstruktur. Karin Bredenberg /

GENERELL Informationsmodell för Bild och Funktionsregistret (BFR)

TNMK30. Elektronisk publicering

Vad är XSLT XSLT extensible Stylesheet Language Transformations

Nätet. Uppgiften. Nivå

<header> </header> <footer> </footer>

Introducerande övningar i HTML

Skicka fil till CSN. - Rapportera via fil i Mina tjänster. Skicka fil till CSN komvux och folkhögskolor, v 1.0

Varför XML? En studie av XML ur ett produktivt perspektiv

Introduk+on +ll programmering i JavaScript

Om inte denna rekommendation efterföljs kan vi tyvärr inte ge några garantier för att vi kan supportera de problem som då kan uppstå.

SFTI Migreringsguide från Sveorder 1.0 till CEN/BII Core Order Transaction

Förvaltningsgemensam specifikation för leverans av enstaka publikationer till Kungliga biblioteket (FGS-PUBL)

Lathund för studenter

XSLT. Extensible Stylesheet Language Transformations

Förkunskaper: Tim Berners Lees vision webbläsarkriget W3C strukturtagg <h1> layout-tagg <font size="6">

SVENSK STANDARD SS-EN ISO 19108:2005/AC:2015

Major Release 3.1. Vad innebär Major Release 3.1 för svenska användare?

TENTAMEN I INTRODUKTION TILL MEDIEPRODUKTION, 5p

Bilder. Bilder och bildformat

Thomas Gartz

Isolda Purchase - EDI

Webbplats analys google.com

ekorren e-tjänst Teknisk målbild

Mer OOP. Variation i typ. Medlen repetition. Generiska klasser. Gränssnitt - Interface. Mer om klasser Några exempel UML

JHS 193 Unik identifierare för geografisk information Bilaga 1. Process för att bilda URI

RDA i Sverige Katarina Synnermark Olle Johansson RDA-redaktionen

729G74 IT och programmering, grundkurs. Tema 2, Föreläsning 1 Jody Foo,

Lathund till PsycINFO (OVID)

Transkript:

Mer om XML & TEI Kurstillfälle 2 Monica Langerth Zetterman Innehållsdesign av digitala resurser Kurs i masterprogrammet för digitala medier Uppsala universitet, Institutionen för utbildning, kultur och medier 2009-11-25 Översikt XML konceptet - introduktion TEI historik TEI grundläggande struktur Klasser Attribut Kärnmoduler och tilläggsmoduler DTD 2 Grundläggande principer 1 Grundläggande principer 2 Elementen kan nästlas, det vill säga inneslutas i varandra, så att en hierarkisk struktur bildas som visas i figuren nedan <starttagg> </sluttagg> märkord (element) som är inneslutna i avskiljare som markerar elementets början (<) och slut (>) För att markera att märkningen slutar (är en sluttagg) används en specifik identifierare (/) 3 4 Hierarkisk dokumentmodell elementnod textnod syskon Termen element är en kombination av taggarna och det innehåll de innesluter och inte enbart starttaggen <namn> och sluttaggen </namn> barn 5 XML & flexibilitet XML tillåter oss att definiera vilka element som helst XML är kraftfullt: SGML/XML element är semantiska lättviktare. <p> = <para> Möjligheter till överföring och utbytbarhet t (beskrivande märkning, typ av dokument, standard för att representera tecken) XML för bra för att ignorera? Programutveckling Spridning av verktyg Semantiska webben 6 1

XML termer XML dokumentets struktur Ett XML dokument kan innehålla: <Element> (med eller utan attribut) Processinstruktioner <? xml version="1.0 Kommentarer <!-- kommentar--> Entitetsreferenser & Förbestämda sektioner (CDATA, IGNORE, INCLUDE) PROLOG ROT <?xml version="1.0" encoding="utf-8 standalone= no?> <?xml:stylesheet type="text/xsl" href="file:/c:/monilang/mu/xsl/dates.xsl"?> <!--stilmall indexerar och länkar datum element--> <DOCTYPE TEI.2 SYSTEM "file:/c:/monilang/mu/filtank/teixlite.dtd"> <TEI.2> <teiheader> <filedesc> /---/</filedesc> </teiheader> <text> <front>/---/</front> <body><div type= parent ><div type= child ><head><p> ABC </p></head></div><!--parent--></div><!--child--> </body></text> </TEI.2> 7 EPILOG <!-- eventuell slutkommentar eller processinstruktion--> 8 XML dokumentets beståndsdelar XML dokumentet byggs upp genom en sorts trädstruktur En rot <TEI.2> och många noder (grenar) En nod kan bestå av: ett delträd <text> <front> <body> ett element (med/utan attribut) <name> teckensträng <name>agnes</name> Varje element tillhör en typ (Generic Identifier) Attributnamnen för ett givet element är definierade i DTD:n <name type="person"> ibland definieras även attributvärden XML förlåter inget slarv Välformad är en XML fil om. ett rotelement som innesluter hela innehållet varje delträd är nästad på rätt sätt inom rotelementet namn är alltid versalkänsliga start- och sluttaggar obligatoriska (förutom i tomma element) attributvärden anges inom citationstecken 9 10 DTD Document type declaration: formell definition av element, attribut, entiteter, notationer. Ex. <!ELEMENT entry (name, address, phone) > Document type definition: beskrivning av användning och betydelse av den formella regeluppsättningen Används för validering av XML-filer Exempel i TEI Guidelines DTD exempel <!ELEMENT anthology (poem+)> <!ELEMENT poem (title?, (stanza+ couplet+ line+) ) > <!ELEMENT title (#PCDATA) > <!ELEMENT stanza (line+) > <!ELEMENT line (#PCDATA) > Exempel från A gentle Introduction to XML <http://www.tei-c.org/p4x/sg.html#sg14> 11 12 2

TEI tar form 1987 Poughkeepsie Principles Ett format för märkning av vetenskapligt innehåll, oberoende av hård- eller mjukvara, som gör det möjligt för material att användas, återanvändas, delas, utbytas och flyttas mellan olika plattformar och användare. 13 Text Encoding Initiative 1990 TEI P1 1992-94 P2 & P 1995 TEI Lite 1999 TEI P4 XML versionen 2002 1999 bildas TEI Consortium, 4 värdinstitutioner: Brown University (Scholarly Technology Group http://www.stg.brown.edu/) Oxford University (Research Technology Service http://www.oucs.ox.ac.uk/rts/) University of Bergen University of Virginia (Electronic Text Center http://etext.lib.virginia.edu/ & the Institute for Advanced Technology in the Humanities http://www.iath.virginia.edu/) TEI P5 2004 Läs mer om TEI:s bakgrund här: <http://www.tei-c.org/p4x/ab.html#abtei> 14 TEI:s målsättningar Bättre möjligheter för integration och utbytbarhet av vetenskapligt innehåll Stöd för alla typer av texter, för alla språk, från alla perioder Vägledning för noviser - vad? (best practice) Assistans för experter - hur? Slutsats: flexibilitet, modularitet, komplexitet. 15 TEI tillhandhåller: En uppsättning rekommendationer för märkning av text av såväl texter av mer allmän karaktär som specifika områden Rekommendationer som baseras på, men inte begränsas av vetenskapliga praktiker En stor samling element definitioner representerade och kombinerade i dokumenttyp deklarationen En vy av DTD:n är TEI Lite se <http://www.tei-c.org/lite/> 16 Övergång till scheman RelaxNG övergång från DTD till RelaxNG i TEI P5. http://www.tei-c.org/release/doc/tei-p5-doc/ja/html/use.html utvecklat av OASIS http://www.oasis-open.org/ W3C schema language se http://www.w3.org/xml/schema Hjälp med migrering: http://www.teic.org/guidelines/p5/migrate.xml ODD Klasser av element: Element klassificeras genom följande principer: att de delar attribut, att de förekommer på samma ställen i innehållsmodellen, eller båda delarna Superklass underklass ärver egenskaper 17 18 3

ODD forts Generell beskrivning av av elementet inklusive de exempel som finns i TEI Guidelines attributlista, datatyper, defaaultvärden etc Till vilken TEI modul elementet tillhör Vilka klasser som elementet bidrar till Elementets content model Pizza Gör ditt eget schema med följande ingredienser: En kärna En grund Valfria toppings Användaren måste göra minst ett val <http://www.tei-c.org/pizza.html> Applikation som grundar sig på ODDfilosofin 19 20 Kärn-element TEI:s moduler TEI-Header Element för allmänna & gemensamma textstrukturer Som tex stycken, noter, sid- och radbrytningar Typografiska element <hi> Namn, datum, numrering, förkortningar Noter, referenser, bibliografier Textredigering Vers och drama Se http://www.tei-c.org/p4x/co.html 21 22 TEI:s syn på strukturen text A text may be unitary or composite a unitary text contains front matter back matter a body in a composite text, the body is a group of texts (or nested groups) Källa: http://www.tei-c.org/talks/oucs/2004-02/one/teicontents.ppt TEI basic structure Källa: http://www.teic.org/talks/oucs/2004-02/one/teicontents.ppt teiheader teiheader front front div div teicorpus.2 tei.2 TEI.2 tei.2 text group body text div body back back 4

globala attribut Available on all elements in all modules... id for unique identification n for (non-unique) name or number rend for rendition (appearance) lang for language Can be extended in some modules corresp, synch, ana for specific association types next, prev for aggregating fragmented elements TEI P5 övergång till Roma Syfte att förenkla modifieringar Bättre dokumentation Scheman uttryckta i flera språk Se http://www.tei-c.org/release/doc/teip5-doc/ja/html/use.html Roma: Källa: http://www.tei-c.org/talks/oucs/2004-02/one/tei-contents.ppt 26 27 28 29 30 5

31 32 33 34 Andra DTD:er DocBook http://www.docbook.org/ DITA 1.1 http://docs.oasis-open.org/dita/v1.1/overview/overview.html (OASIS standard) OpenDocument (ODF) http://www.oasisopen.org/committees/tc_home.php?wg_abbrev=office /t h MathML http://www.w3.org/math/ Scalable Vector Grafic (SVG) http://www.w3.org/graphics/svg/ för tvådimensionell grafik GraphML http://graphml.graphdrawing.org/ TEI header & TEI märkning TEI Header: Bilder från Oxford University Computing Services Finns vid:<http://www.tei-c.org/talks/oucs/2004-02/two/header.pdf> Introduktion och översikt av märkning med TEI Bilder från Oxford University Computing Services Finns vid: <http://www.tei-c.org/talks/oucs/2004-02/one/tei-contents.ppt> 35 36 6