Utbildningsradion och semantisk webb i praktiken ANASTASIA P SZMULIK och HANNA SKOGSMARK Examensarbete Stockholm, Sverige 2005 TRITA-NA-E05099
Numerisk analys och datalogi Department of Numerical Analysis KTH and Computer Science 100 44 Stockholm Royal Institute of Technology SE-100 44 Stockholm, Sweden Utbildningsradion och semantisk webb i praktiken ANASTASIA P SZMULIK och HANNA SKOGSMARK TRITA-NA-E05099 Examensarbete i medieteknik om 10 poäng vid Högskoleingenjörsprogrammet för medieteknik, Kungliga Tekniska Högskolan år 2005 Handledare på Nada var Vandana Kabilan Examinator var Roger Wallis
Utbildningsradion och semantisk webb i praktiken Sammanfattning Semantisk webb med alla sina möjligheter och utmaningar är ett bra exampel på en ny teknologi som idag befinner sig i en Peak of inflated expectations, enligt Gartners Hype Cycle modell. Bland dem som utlovas störst fördelar med den nya tekniken finns användare inom utbildning och medieproduktion. Målet med rapporten är att studera ett företag som använder sig utav semantiska teknologier och definiera fördelar och utmaningar med den valda semantiska strukturen. Rapporten beskriver fenomenet Semantisk Webb och en fallstudie som genomfördes på Utbildningsradions Mediebibliotek. Syftet med Mediebiblioteket är att tillgängliggöra material via Internet direkt till användarna, men också att ge möjlighet för lärare och elever att organisera utbildningsmaterialet utifrån sina egna perspektiv i lärmoduler (portföljer). Målet med fallstudien var att undersöka den semantiska webbteknikens potential för UR: vad det innebär för företagets verksamhet och hur satsningen relaterar till övrig semantisk webb ur olika perspektiv: teknisk uppbyggnad, fördelar och eventuella nackdelar med en sådan struktur, fördelar för företaget samt i deras relation med omvärlden. Det var av intresse för UR att hitta ytterligare funktioner som kan addera värde till den befintliga lösningen. Det genomfördes genom att kartlägga vilka andra företag och aktörer som använder semantisk webb framgångsrikt och som UR därmed skulle kunna samarbeta med. Följande slutsatser kunde dras: den befintliga open source plattformen är tekniskt omogen och ofullständig, samt tillgodoser inte nuvarande interna behov (sökning, prestanda etc.) till fullo. Dock är den en lösning med en utvecklingspotential för att bygga upp ett framtida samarbete och på ett bättre vis nå ut till slutanvändarna. Genom denna satsning har UR som en av få organisationer byggt upp en kompetens inom semantisk webb området och har därför möjlighet att etablera framtida semantiska samarbeten. För att komma vidare är det viktigt att UR väljer väg i två avseenden: dels vidareutveckling av den tekniska plattformen, dels hur man praktiskt tänker gå till väga med att kvalitetssäkra metadata och ta fram en plan för hur UR ska genomföra sitt beslut att stödja framtagningen av ontologier för branschen. Rapporten har också en rad rekommendationer på hur man ska nå sina slutanvändare bättre.
Swedish Educational Broadcasting Company: applying semantic web technology in practice Abstract The Semantic web with all its opportunities and challenges is a good example of a new and innovative technology that is currently in what the Gartner Hype Cycle model labels a Peak of inflated expectations. The industries that are likely to benefit most from the semantic web include Education and Media. The target for this thesis was to study an organisation that already actively uses semantic web technology in order to identify the advantages and challenges that they are confronted with. The report gives a brief summary of the current state of the Semantic Web, and focuses on a case study conducted with the Media Library of the Swedish Educational Broadcasting Company, UR. The Media Library allows users to search and preview educational material on the Internet. In addition, teachers and students can according to their own, specific needs define portfolios and collect different kinds of educational material for educational use. The goal with the case study was to investigate the potential that the semantic web offers for UR s present and future activities, including the impact on it s present business, how UR s activities in the semantic web area relates to other projects in this arena in terms of technology platform, pros and cons of present and future functionality, and in UR s relations to other organisations. UR was also interested in finding additional functions that would add value to UR present semantic web solution. We addressed this need through an Internet survey of other, related projects and organisations that appear to make successful use of semantic web technology and would be suitable for cooperation with UR. The conclusions from this thesis are: the present open source solution is immature and incomplete and does not support the full scope of UR s internal functional requirements, particularly in terms of performance and search. However, provided these identified problems are addressed, the platform does offer a considerable future potential for establishing semantic cooperation with other organisations and thereby better servicing the needs of the end-user. In addition, UR has, as one of few organisations established in-house competence in semantic web technology and its practical use, which may become a critical asset in establishing fruitful cooperation with other organisations. In order to move forward, it is important that UR - in three aspects - decides on a road-map for future activities: [A] in terms of strategy for the semantic web IT platform and [B] in terms of quality assurance of it s meta data production, and [C] in terms of concrete activities for carrying out it s decision to support rather that dominate the development of ontologies for its industry in Sweden. This thesis also presents a set of concrete recommendations for UR s future activities in this area.
Innehållsförteckning Inledning... 1 1. Introduktion till Semantisk webb... 2 1.1. Visionen...2 1.2. Är det möjligt?... 3 1.3. Tekniken...3 1.4. Olika delarna... 5 1.5. Möjliga scenarion... 12 2. Utgångspunkt för rapporten... 13 2.1. Frågeställning... 13 2.2. Metod... 13 2.3. Fallstudie... 13 2.4. Ansats...14 2.5. Målgrupp... 14 2.6. Avgränsning... 14 3. Fallstudie UR... 15 3.1. Bakgrund... 15 3.2. Mediebiblioteket... 15 3.3. Den initiala målsättningen med Mediebiblioteket... 16 3.4. Uppbyggnad av den tekniska plattformen... 16 3.5. Teknisk struktur... 17 3.6. Användning... 21 3.7. Samarbeten... 22 3.8. URs resurser för Mediebibliotekssatsningen... 23 3.9. Status på den tekniska lösningen... 23 3.10. Ämnesordsmärkning i Mediebiblioteket... 25 4. Djupintervjuer... 26 4.1. Syfte... 26 4.2. Urval... 26 4.3. Intervjuunderlag intervjuplanens utformning... 26 4.4. Datainsamlingsmetod... 27 4.5. Metoddiskussion... 27 4.6. Tillförlitlighet och användbarhet... 27 4.7. Felkällor... 27 4.8. Bortfall...27
5. Resultat... 28 5.1. Nyckelfrågeställningar som tagits fram för analysen av materialet... 28 5.2. Sammanställning av intervjuer... 29 5.3. Externa projekt... 36 6. Slutsatser och rekommendationer... 39 6.1. Slutsatser från intervjuerna... 39 6.2. Återkoppling till rapportens syfte... 41 6.3. Återkoppling till fallstudiens syfte... 42 6.4. Rekommendationer... 49 7. Diskussion... 51 Litteraturlista... 53 Bilagor... 63
Sidan 1 av 90 Inledning År 2001 publicerades en artikel i Scientific American [2] av Tom Berners-Lee, som förflyttade debatten om semantisk webb från någonting abstrakt till någonting som har fått form och mening. Semantisk webb kunde enligt artikeln innebära unexpected help and serendipitous added value from others' data." [6]. Många företag vill utforska de möjligheter och fördelar som semantiska teknologier utlovar och hur dessa kan implementeras i praktiken. År 2005 anses den semantiska webben vara en av top strategic technologies av Gartner Group [27]. Samtidigt finns det fortfarande utmaningar som behöver kartläggas för att bevisa användbarheten i praktiken för att semantiska teknologier ska slå igenom på bredare front. Semantisk webb har funnit användningsområden inom utbildningsområdet och i medieproduktion. Denna rapport har som mål att beskriva de konkreta möjligheter och utmaningar som semantiska teknologier innebär för företag som producerar utbildningsmaterial. Rapporten ger först en generell bakgrund till semantisk webb och relaterade teknologier och fokuserar sedan på de specifika frågor som framkommit i fallstudien. Resultaten från fallstudien redovisas i en objektiv form och kommenteras sedan i avsnitt slutsatser. Rapporten är organiserad på följande vis: i kapitel 1 beskrivs fenomenet semantisk webb, kapitel 2 innehåller en beskrivning av den valda undersökningsmetoden, därefter följer kapitel 3 med bakgrundsinformation för fallstudien. Kapitel 4 beskriver hur fallstudien utfördes och kapitel 5 innehåller resultat av djupintervjuer samt en undersökning av externa projekt. Slutsatser och rekommendationer finns i kapitel 6 och rapporten avslutas med en diskussion av resultaten i kapitel 7.
Sidan 2 av 90 1. Introduktion till Semantisk webb Semantisk webb är ett nytt teknikområde. Här ges en introduktion till ämnet för att belysa de grundläggande möjligheter och förutsättningar som krävs för en praktisk implementation. 1.1. Visionen Semantisk webb bygger på Tim Berners-Lee visioner. Berners-Lee är även den som utvecklat grunderna till den webb som existerar idag. [26] Semantisk webb anses av många vara nästa generations webb. Den byggs för att utgöra en förlängning av den webb vi använder oss av idag. Det pågår intensivt arbete världen över för att det ska realiseras. Standardreleaser och rekommendationer sätts av W3C, World Wide Web Consortium [97], lett av Berners-Lee. Genom en litteraturstudie finner man dock att semantisk webb kan definieras på olika sätt. I Explorer s guide to Semantic Web [26], så har författaren Thomas B. Passin gjort en indelning av de olika definitionerna. Dessa sammanfattar den splittrade meningen om definitionen av semantisk webb. Här följer ett axplock av dem: Maskinläsbar-data aspekten: The semantic web vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications. [W3C, 2003] Den intelligenta agenten aspekten The aim of the Semantic Web is to make the present Web more machine-readable, in order to allow intelligent agents to retrieve and manipulate pertinent information. [Cost et al, 2001] Den distribuerade databas aspekten The semantic Web concept is to do for data what HTML did for textual information systems: to provide sufficient flexibility to be able to represent all databases and logic rules to link them together to great added value. [W3C, 2000] Mänsklighetens betjänt aspekten The vision of the semantic Web is to let computer software relieve us of much of the burden of locating resources on the Web that are relevant to our needs and extracting, integrating and indexing the information contained within. [Cranefield, 2001] Bättre annotering aspekten The idea of the semantic Web [Berners-Lee 2001] supplies the (informal) web as we know it with annotations expressed in a machine-processable form and linked together. [Euzenat, 2001]
Sidan 3 av 90 Bättre sökningsmöjligheter aspekten Soon it will be possible to access Web resources by content rather than just keywords. [Anutariya et al, 2001] Många av dessa kan anses möjliga först om ett flertal år, men därmed inte sagt att semantisk webb teknologi är oanvändbar under tiden. Maskinläsbar -data aspekten är i stort realiserad för de företag som utnyttjar grunderna av teknologin, och medför många fördelar som kan utnyttjas redan idag. Ett flertal företag arbetar med att integrera semantisk webb teknologi i de webblösningar de utvecklar. 1.2. Är det möjligt? Det man kan tycka av att bara läsa rubrikerna i de ovanstående citaten är att det som beskrivs lutar mot en form av artificiell intelligens, men det som särskiljer dessa aspekter från ren science fiction, är att metoder för att realisera det är i full fart att standardiseras. The concept of machine-understandable documents does not imply some magical artificial intelligence which allows machines to comprehend human mumblings. It only indicates a machine s ability to solve a well-defined problem by performing well-defined operations on existing well-defined data. Instead of asking machines to understand people s language, it involves asking people to make the extra effort. [4] Vissa försök att skapa kontextuella sammanhang med hjälp av tekniska modeller har gjorts förut, så kallade Knowledge Representation Systems, KR, och de försöken skiljer sig inte helt från den modell semantisk webb representerar. De tidigare försöken har dock fallit på vitala delar som semantisk webb arbetar på att överbrygga. Many KR systems had a problem merging or interrelating two separate knowledge bases, as the model was that any concept had one and only one place in a tree of knowledge. They therefore did not scale, or pass the test of independent invention. [see evolvability]. The RDF world, by contrast is designed for this in mind, and the retrospective documentation of relationships between originally independent concepts. [4] Grundidéerna härstammar från Artificiell Intelligens, men angriper problemet på ett motsatt sätt. Istället för att skapa intelligens i systemet, så struktureras verkligheten upp i form av klassificering och relationer på det sätt vi känner till. Och genom att få tillgång till denna verklighetskarta, kan maskiner bistå människor i navigeringen efter information på webben. 1.3. Tekniken Semantisk webbteknologi är komplex. Tekniken bygger på olika delar och bygger på varandra. Det avsnittet försöker ge en mer detaljerad bild. 1.3.1. W3C s layer tower Utvecklingen av semantisk webb fortgår i steg, där varje utvecklingssteg representerar ett lager som bygger på föregående. [1 s. 16] Olika lager representerar de olika delar av teknik som Semantisk webb bygger på enligt W3C och Tim Berners-Lee. Den illustrerar huvuddelarna av semantisk webbens design och vision. En av förutsättningarna för att bygga tekniken lager för lager, är att dessa två principer följs: Kompatibilitet med lagren under. (Downward compatibility) Teknik användning inom ett lager bör kunna tolka och använda information som ingår i de lägre lagren. Till
Sidan 4 av 90 exempel mjukvaruagenter som gjort aktiva inom OWL semantik, kan utnyttja information som existerar i RDF (se avsnitt 1.4.4) och RDF schema (se avsnitt 1.4.7.1 ). Delvis förståelse för innehåll i övre lager. (Upward compatibility) Till exempel en mjukvaruagent som är tillämpad i RDF och RDFS lagrens semantik, kan delvis tolka kunskapsinnehåll som är tillämpat i OWL, med undantag för de element som inte ingår i RDF och RDFS. [1 s. 17] Följande bild representerar en förenkling av W3C s illustration av lagern med förklaringar. Trust Logic and proof Ontology RDF Schema RDF XML Schema XML Verifiering, tillförlitlighet av påståenden Etablera sanning i påståenden, dra slutsats om icke fastställda fakta Vokabulärer, gemensamma uppfattningar RDF resurs typer Meta data Datatyper och struktur Gemensam syntax Figur 1 Layer tower 1.3.2. Likheter med webben För att semantisk webb ska röna samma framgång som nuvarande webb, bör vissa förutsättningar modelleras av den existerande. De delar som i dagens webb är till stor fördel, kan på motsvarande sätt antas vara till stor fördel för den semantiska webben. I Explorers guide to Semantic Web [26] listas ett antal av dessa nyckelelement: Semantiska webben bör använda URI adressering, för att ge varje resurs unik tillkomst. Den bör inneha en uppfattning av adresserbara och icke-adresserbara resurser. (Ickeadresserbara resurser får ange sådant som ej kan åtkommas via kommunikationsnätverk, såsom till exempel en bil.) Använda protokoll med små och universellt förstådda kommando set. Kommer antagligen att innefatta det kommando set som existerar idag, då dessa är inarbetade. Helst helt tillståndslöst. Eller ange mycket lite tillståndsinformation. Vara utspritt, det vill säga decentraliserat. Fungera storskaligt. Tillåta cache-minnesallokering av data för att snabba upp åtkomsten. Kunna hantera saknande länkar och inkonsekvent information.
Sidan 5 av 90 Dessa punkter kan ses som skälen till dagens webb stora utbyggnad och frammarsch. I denna aspekt hoppas semantiska webben efterlikna sin föregångare. Många av rekommendationerna, utfärdade av W3C [97], för semantisk webb teknik kom redan slutet av 1990-talet. Den semantiska webben var tilltänkt ungefär samtida med sin enklare föregångare. Dock är tekniken fortfarande i förändring för att uppnå maximal kapacitet. 1.4. Olika delarna Som tidigare nämnts (i avsnitt 1.3.1) så delas semantisk webbteknologi in i olika lager. I dessa existerar mer eller mindre utvecklade standarder för teknik, som är rekommenderade av W3C. Vissa av dem beskrivs närmare i det avsnittet. 1.4.1. Metadata Metadata möter vi ofta i det dagliga livet, och finner det självklart. Utan metadata skulle en stor del av tiden av informationsinsamling för vardagliga aktiviteter gå åt till att refusera de informationskällor man stöter på. Processen av informationsinsamling kan då liknas vid nålen i höstacken. De flesta service ställen, så som biblioteket och videobutiken använder sig av metadata för att hålla ordning på sitt innehåll. Det anses som en självklarhet. Metadata är strukturerad data om data. [30] Metadata har länge existerat som begrepp och används inom andra sammanhang än teknik, till exempel på bibliotek, med katalogisering av böckerna som innefattas i bibliotekssamlingen. Exempel på metadata är författarens namn till en bok, eller ISBN-numret. Det finns olika sorters metadata, dels omkringliggande faktorer för en resurs, dels nyckelord för innehållet och man kan även se recensioner och annotationer som en form av metadata [26 s.114]. Metadata är en metod för att reda upp det kaos som lätt infinner sig vid stora datamängder. Konsekvent användning av metadata gör det möjligt att strukturera även mycket stora informationsmängder. Inom databranschen pågår arbete med standardisering av metadatahantering för att underlätta samarbete och effektivitet. Innehållsproducenter bör på W3C s inrådan hålla sig uppdaterade med utvecklingen av olika standards och införa lämplig metadata i deras innehåll [30]. 1.4.2. Dublin Core En standard för att hantera metadata för litteratur är Dublin Core, DC, utvecklat av Dublin Core Metadata Initiative, som arbetar med att utveckla metadata standarder för bland annat webben. [60]. Metadata delas in i olika kategorier enligt DC s element set. Den består av: Namn Title Creator Subject Description Publisher Contributor Date Type Format Definition det givna namnet på resursen en enhet som i huvudsak är ansvarig för det skapade innehållet i resursen ett ämne omnämnt resursens innehåll. en redogörelse av resursens innehåll en enhet som ansvarar för att resursen publicerats. en enhet som har bidragit till resursens innehåll. en tidsangivelse för ett moment i resursens livscykel. anger genre för resursens innehåll. anger resursens fysiska eller digitala uttryck.
Sidan 6 av 90 Identifier Source Language Relation Coverage Rights en entydig referens till resursen inom dess sammanhang. en referens till en resurs ur vilken den föreliggande är ursprungen. språket för resursens intellektuella innehåll. referens till en relaterad resurs. omfattningen för resursens innehåll. information om resursens innehållande och överhängande rättigheter. [61] Enligt det kan material märkas upp, för att närmare beskriva den publicerade resursen. Ett av de tidiga målen med den formen av uppmärkning är att sammanhanget ska förvärvas genom referens till metadatadokumentet [31]. 1.4.3. URI URI står för Uniform Resource Identifier, och är en kompakt sekvens av tecken för indentifiering av en abstrakt eller fysisk resurs. [18] URI, eller URL, används på webben för att för att länka, bokmärka, och indexera resurser. För ytterligare värde bör dessa även användas som identifierare, för resurser så att utomstående kan länka, annotera eller utföra andra åtgärder på resursen. [30] En resurs kan vara en webbsida, en film, ett fysiskt objekt eller ett ickeexisterande objekt som en idé eller ett koncept. [26 s.11]. URI: er finns även definierat för till exempel telefonnummer, ISBN-nummer och geografiska platser [1 s. 64]. Det som representeras av en URI behöver inte vara åtkomligt via nätverkskommunikation. 1.4.4. RDF Resource Description Framework, RDF, är ett ramverk för att beskriva och utväxla metadata. [7] RDF är en W3C standard sedan 1999. Grunden till RDF följer uppbyggnaden av en enkel mening uttryckt på naturligt språk, med subjekt verb (predikat) -objekt uppbyggnad [26 s. 22] så som Lars bor i Stockholm. Det tillkommer självklart komplikationer när en enkel modell ska anpassas till praktiska applikationer, men i grunden handlar det alltså om enkla påståenden som beskriver information om ett särskilt subjekt. [26 s. 22 ] Ett RDF påstående består av tre element, en så kallad trippel: ett subjekt ett predikat (eller property), och ett objekt (eller value), kan vara en resurs eller en teckensträng. subjekt predikat objekt ( person_1, namn, Krister ) trippel Figur 2 RDF trippel
Sidan 7 av 90 För att uttrycka påståenden om webbaserade resurser, där subjekt och objekt är URI: er, det vill säga maskinläsbara identifierare, till exempel om man vill uttrycka att: Dokumentet http://kmr.nada.kth.se/papers/semanticweb/cetissemweb.pdf skapades av Mikael Nilsson representeras det i trippeln: ( http://kmr.nada.kth.se/papers/semanticweb/cetissemweb.pdf skapades av, Mikael Nilsson ) Och skapades av representeras i sin tur av en URI. Den URI ingår som standard i Dublin Core vokabulären, då som http://purl.org/dc/elements/creator. Att uttrycka skapades av på det sättet utesluter möjliga flertydigheter. Uttrycket ser nu ut så här: (http://kmr.nada.kth.se/papers/semanticweb/cetissemweb.pdf, http://purl.org/dc/elements/creator, Mikael Nilsson ) [23]. Tack vare RDF: s struktur så kan påståenden lätt visas grafiskt http://kmr.nada.kth.se/papers/se manticweb/cetissemweb.pdf Skapades av http://purl.org/dc/elements/creator Mikael Nilsson" Figur 3 Illustration av ett RDF påstående Det demonstrerar de grundläggande idéerna för RDF, Resources- properties- statements. Där dessa står för: Resources (resurs): En sak vi vill tala om, som till exempel en författare, böcker, plats eller annat. Varje resurs har sin URI, som är unik för denna resurs. Properties (egenskaper ): Kan ses som en resurs som beskriver relationerna mellan resurserna. Exempelvis written by, age, title och så vidare. I ett slag ges en global, unik namngivnings metod, som ofta beskrivs som {namn, värde}[26 s. 149]. Egenskapen behöver inte tillhöra subjektet, vilket skiljer det från objektprogrammering. RDF förser en tredje -part uttrycksmöjlighet [26 s.150 ]. Statement (påstående): Påståenden hävdar resursers egenskaper. [1 s. 64] RDF används för att lagra data i databaser. För beskrivning av konventionella relationsdatabaser hänvisas till litteratur angående dessa. Faktum är att RDF baserad databas inte skiljer sig så mycket från en konventionell lösning. Istället för att innehålla ett större antal kolumner så spjälkas kolumnerna upp i flera små tabeller innehållande endast två kolumner. Dessa två kolumninnehåll, tillsammans med typen i kolumnnamnet bildar trippeln, (resurs)- (typ av fakta)- (värde), för varje rad. [26 s. 27] En RDF databas kan anses byta regelbundenhet mot flexibilitet, med fördelen av att även vara maskinläsbar. [26 s.21]
Sidan 8 av 90 1.4.5. Ontologi Ordet ontologi kommer från filosofin och betyder läran om varandet. An ontology is an explicit specification of a conceptualization. [14] I Knowledge Management och datavetenskap talar man om ontologi för att uttrycka sånt som kan talas om i ett system eller i en kontext (sammanhang). En ontologi utgör en vokabulär av termer som används inom en specifik domän. Ontologier utgör en metod för att klassificera begrepp, och tilldela dessa namn och etiketter (label) och definiera egenskaper (properties) och relationer dessa emellan. [26 s. 142] För att ge en förståelse av de begrepp som kommer användas följer nu en förklaring till de mer grundläggande termer som talas om inom klassifikation: Klassificering Två olika metoder: Via uppräkning eller definition. Klasser kan delas upp på två sätt; genom deras egenskaper eller genom uppräkning av samtliga medlemmar. Uppräkning innebär att alla som är uppräknade på listan tillhör klassen. Detta kallas för förlängningen av en klass. Å andra sidan kan särskiljning dras vid dem som uppnår kriterier för att tillhöra klassen. Det kallas dess intension. Klass (Class, även kallat koncept): Resurser samlade i en kategori kallas klasser, som kan innehålla underklasser- subclass. En undergrupp av instanser, förutom att tillhöra klassen, har även ytterligare egenskaper som särkskiljer dem. Klassen i förhållande till denna blir då superclass. En instans kan tillhöra flera klassningssystem (multiple classes). Klasser kan definieras som uppsättningar (sets). En klass kan anses innehålla ett set separata objekt som är samlade för att klassificeras. Den matematiska meningen av ett set är en samling separata objekt som är unika och oordnade. I och med användningen av set kan ontologispråk som använder set utnyttja teoretiska logikresultat [26 s. 145]. Det enklaste sättet att beskriva en ontologi är att tala om ett släktträd, där klassen över kallas parent (förälder). Dessvärre ska man ha väldig tur om det man ska beskriva, har denna enkla struktur. I verkligheten kommer strukturen vara mer nästlad. En mer verklighetstrogen beskrivning av en ontologi är att påstå att den ordnar namn och beskriver hur de relaterar med varandra. Namnen står för koncept, kategorier, klasser med mera. De namngivna sakerna har relationer med varandra, eller så har de inte det. De har även egenskaper, som också har namn. En ontologi specificerar namnen som hör till sammanhanget, deras relationer med tillhörande villkor för deras användning. [26 s. 148] Det är den stora användningen av ontologier. Att separata objekt som existerar, förankras i hur deras relationer och egenskaper definieras enligt logiska samband. Och att de separata objekten, instanserna, tilldelas unika namn för att särskilja dem sinsemellan. Även de namn som väljs för att referera till klasserna, typerna och egenskaperna (properties) ska vara unika. Här används URI: er (se avsnitt 1.4.3), eftersom ontologiramverket, som idag håller på att standardiseras, byggs ovanpå RDF [26 s. 149]. Som nämndes tidigare använder RDF (se avsnitt 1.4.4) sig av URI: er för resurser, oavsett om resursen kan mottas via nätverk. Ett par viktiga krav för en ontologis framställning är att den måste vara symbolisk, förståelig och läsbar för människor. [1 s. 214] Unika identifierare har den nackdelen att de oftast är svårtolkade för människor, som måste kunna läsa bekanta
Sidan 9 av 90 beteckningar. Av den anledningen ges en sak eller koncept ett eller flera läsbara namn. De brukar kallas etiketter (label) för att klargöra att dessa läsbara namn inte är identifierare, då ordet namn ofta används som för identifikation. En etikett kan ses som en egenskap (property) till objektet. [26 s. 149] Anledningar till att bygga ontologier är bland annat [24]: För att kunna dela gemensam uppfattning av informationsstrukturer människor emellan eller mellan mjukvaruagenter, software agents. Skapa förutsättningar för att kunna återanvända kunskap inom domänen. Göra antaganden inom domänen explicita. Skilja mellan domänkunskap och operativ kunskap. För att analysera kunskap inom domänen. Det finns ontologier som är uppbyggda, och är generella, till skillnad till från dem som byggs i de flesta fall, de är ofta domän- specifika. Dessa kallas upperlevel ontologier. Det finns två exempel på sådana som bör nämnas, Cyc, som har 60000 påståenden i 6000 koncept. Den andra är Standard Upperlevel Ontology, SUO [1 s. 210]. För uppbyggnad av den semantiska webben finns förhoppning på att standardspråk ska utvecklas för att definiera ontologier och det finns även en önskan att de ska vara väl anpassade till logik för att kunna användas. De ska vara tillgängliga på webben så att ontologierna kan delas med och användningen av dem blir utbredd. Det finns även krav på att kunna kombinera delar av olika ontologier. Klassificering ska finnas för alla möjliga koncept och resurser oavsett om de finns tillgängliga via webben eller inte. [26 s. 142] 1.4.6. Angreppssätt I arbetet med utvecklandet av ontologiers klasshierarki, taxonomi, talar man om olika angreppssätt. Top-down och bottom-up. Top-down innebär att man utgår från de generella koncepten i domänen och arbetar därifrån in de mer specifika delarna. Det vill säga man utgår från själva huvudkategorierna man vill beskriva och arbetar sig ner från klass till subklasser och så vidare ända ner till instanser. Bottom-up utgår tvärtom med att beskriva de mest specifika klasserna till att gruppera dessa i klasser i mer generella koncept genom superklasser och så vidare. [24 s. 7] Meningarna går isär om vilket angreppssätt som är mest pålitligt och effektivt [1 s. 207]. 1.4.7. Ontologispråk Det finns ett antal språk som kan användas för att skapa ontologier. Här följer en närmare beskrivning av ett par av dessa. 1.4.7.1. RDFS Resource Description Framework (RDF) Schema, RDFS, kallas numera för RDF Vocabulary Description Language, men förkortas och tilltalas fortfarande RDFS. RDFS är ett språk för att beskriva ontologier. 1999 utfärdades ett förslag till rekommendation, vilket genom reviderade versioner har uppnått rekommendationsstatus av W3C. [26 s. 155] RDFS används även i ett flertal ontologispråks projekt, åtminstone delar av det och är ett övre lager byggt ovanpå RDF. Det i förlängningen innebär att allt som kan sägas i RDFS är uttryckt i RDF, alltså RDF - påståenden. [26 s. 156] RDFS och RDF dokument definierar 13 gemensamma klasser. Dessa är uppräknade i Bilaga 2. Man skapar klasshierarkier och egenskaper, utan att vara begränsad av att dessa måste vara strikta. Och man kan deklarera ämnesdomän och spännvidd till egenskaper. [26 s. 160] För att uttrycka en ontologi i RDFS, brukar man börja med att fastställa klasserna som representerar koncepten man vill skapa påståenden om. Påståendena indelas inte i någon
Sidan 10 av 90 inbördes ordning i RDF, det är uppsättningen (sets) som spelar roll, oavsett ordning. Därefter tilldelar man egenskaper och villkor till dessa. [26 s. 158] 1.4.7.2. OWL Web Ontology Language, OWL, är en W3C rekommendation sedan februari 2004. Grunderna av OWL härstammar från tidigare ontologispråk DAML+OIL (kommer från fristående projekt Ontology Inference Layer, OIL, och DARPA Agent Markup Language, DAML). OWL s design drar fördel av flera tidigare generationer av ontologispråk. OWL har en stark teoretisk bas, och i och med att de som designat det har haft som mål att utveckla ett språk lämpligt för bruk i semantisk webb, lämpar sig OWL för det. [26 s. 168] Om maskiner ska kunna utföra användbara resonemang kring dokuments innehåll, måste ontologispråk sträcka sig längre än den grundläggande semantik som RDFS kan erhålla. Det är vad OWL är designat för att tillgodose. I förhållande till RDFS innehåller OWL större vokabulär för att beskriva egenskaper (properties) och klasser, bland annat, relationer klasser emellan (ex. disjointness), och jämförande. Ge möjlighet till mer djupgående beskrivning av egenskaper, egenskapers karaktär, och uppräknade klasser. [12] OWL finns i tre varianter: OWL Lite, OWL DL och OWL Full. OWL Full är det kompletta språket, i den mening att de två andra är begränsade. OWL Full tillåter RDF datalagring, en samling RDF påståenden, att vara komplexa till den grad att logiska resonerare får arbeta hårt. OWL DL stödjer det som kallas Description Logic, beskrivningslogik. OWL DL arbetar genom att lägga noggrant valda begränsningar för vad som kan utföras, för att uppnå beräkningsfördelar. [26 s. 161] OWL DL kan användas av dem som vill uppnå maximal uttrycksfullhet, med fullständig beräkningsförmåga bibehållet. [78] OWL Lite är en version av OWL DL med fler restriktioner. Tanken med OWL Lite är att göra det enkelt att komma igång med, och lätt att implementera rutinbehandlingen, så användare kan börja använda OWL Lite och sedan avancera till den mer komplicerade användningen [26 s. 161]. I OWL varianterna är definitionen av klass skild från hur det brukar beskrivas i grundläggande klassifikation. Istället för att en klass innehåller instanser, anses de vara associerade med dem. Denna lilla skillnad i definition tillåter ett flertal matematiska teorier att kunna bevisas, vilket annars skulle vara svår att bevisa. [26 s.147] I både OWL Lite och OWL DL måste instanser vara separata objekt, de får inte vara andra klasser, vilket är tillåtet i OWL Full och RDFS. I övrigt använder sig OWL av RDFS klasser och egenskaper (properties) och definierar ytterligare klasser [26 s. 162]. För listade OWL klasser, se Bilaga 1. En av de viktiga fördelarna med användandet av OWL framför RDFS, är möjligheten att kunna upptäcka motsägelser inom ontologin, eller inom uppsättningen (set) av instanser definierade för innehållet i ontologin [1 s. 209]. OWL anses vara ett mer avancerat ontologispråk som kan bidra med att ge mer kraftfulla ontologier. [26 s.158] 1.4.8. Bygga en ontologi Arbetsgången att utveckla en ontologi, kan utgå från följande moment: Definiera klasser i ontologin, arrangera klasserna i en hierarki (taxonomi) med relationer som subklass-superklass. Definiera placeringar (slots) och beskriv tillåtna värden för dessa. Fylla i värden i placeringarna för instanserna.[24] Själva processen av att konstruera en ontologi kan delas in i steg, dessa är hämtade från Ontology Development 101: Bestäm domänen och ontologins omfattning. Vilken domän är det ontologin kommer täcka? För vilket bruk kommer ontologin att användas?
Sidan 11 av 90 För vilka typer av frågor kommer informationen i ontologin kunna svara på? Vem kommer att använda och underhålla ontologin? För att bestämma ontologins omfång kan en lista av frågor, baserade på kunskapsbasen i ontologin, skapas och dessa bör ontologin kunna svara på. Competence Questions, har dessa kommit att kallas och pekar, i ett senare skeende, på hur väl ontologins utformning är. Exempel på svar som ges av detta är: Innehåller ontologin tillräcklig information för att svara på dessa frågor? Vilken detaljnivå kräver svaren för de olika områdena? Formal ontologies are designed. When we choose how to represent something in an ontology, we are making design decisions. To guide and evaluate our designs, we need objective criteria that are founded on the purpose of the resulting artifact, rather than based on a priori notions of naturalness or Truth [14]. Överväg återanvända existerande ontologier. Det finns bibliotek med återanvändbara ontologier på webben och i litteratur. Om man finner en som passar ens behov kan det vara lämpligt att använda sig av denna eller delar av den. Lista viktiga termer i ontologin. Ange de termer som ska kunna ges påståenden om, eller beskrivas för en användare. Definiera klasser och hierarkin dem emellan. Definiera egenskaperna (properties) för klasser och deras placering (slots). Definiera placeringarnas facetter (facets). Definiera hur många värden som kan antas. Beskriv olika typer, värdena kan ha. Några vanliga värdetyper är: String används till exempel för namn. Number beskriver numeriska värden. Kan även anges mer specifikt med float eller integer. Boolean används vid två val. (sant-falskt, på-av, ja-nej) Uppräknade. När bara ett antal angivna värden är tillåtna. Instanstypen tillåter definition för hur de olika separata objekten relaterar till varandra. Skapa instanser Detta kan ses som det sista steget, där man skapar enskilda instanser i de olika klasserna i hierarkin. I denna process finns tre moment: Välja klass till instansen skapa en instans inom klassen Fylla i värdena som kan antas. För att kunna designa en välformulerad ontologi, bör designern inneha förmågan att skapa sig en föreställning, och artikulera de underliggande meningarna, och vara skicklig på abstrakt modellering -liknande skapandeprocessen vid datamodellering. Designern bör även ha en god kunskap om syntaxen inom ontologispråk så att modellen uttrycks korrekt. Och som vid design i allmänhet har en väl utvecklad ontologi även artistiska drag. [26 s. 152] En av huvudfunktionerna av en ontologi är att definiera den uppsättning (set) klasser som tillsammans täcker domänen som den är avsedd till. Specifika ontologier bör konstrueras med välkända vokabulär och följa reglerna för konstruktion. [26 s. 151] Det finns oklara frågor angående anpassning av redan designade ontologier, som kommer att behöva utarbeta tillförlitliga metoder för att lösas.
Sidan 12 av 90 Om man vill arbeta med termer från en ontologi tillsammans med andra termer från en annan, är det möjligt att sammanfoga dessa för att täcka ens verksamhetsbehov. Går det? Det refereras till som merging eller import en ontologi importerar en annan och kan vara svårt. Om båda ontologierna är utformade i samma system (i OWL till exempel) så är det möjligt, i övriga fall är det oklart. Det beror på hur pass kompatibla de är i designprincipen. Sedan är det inte säkert att klasserna är representerade på motsvarande sätt. Om inte, kan det orsaka problem. Om man bara vill använda delar av en annan ontologi, hur mycket måste man importera? Måste alla relationer importeras? Alla regler? Tillförlitliga metoder för att hantera sådana händelser kommer att behöva utvecklas [26 s. 153 ]. 1.4.9. Exempel på existerande ontologi editor Det finns utvecklade ontologi editorer som man kan använda sig av vid konstruerandet av en ontologi. Dessa är relativt enkla att arbeta med. Ett av dessa är Protégé -2000 [81] som utvecklats av Mark Musen s utvecklargrupp på Stanford Medical Informatics. Andra editorer som existerar är Ontolingua [77] och Chimaera. [60] 1.5. Möjliga scenarion Med dessa tekniker fullt utvecklade är det ingen fråga om att webben kommer ändra skepnad. Frågan består snarare i tidsaspekten för att realisera de scenarion som nämndes tidigare och vilka av dem som är fullt ut realistiska återstår att se. Däremot kommer grupper och företag ta till sig de standarder som etableras, istället för att vänta och se vilken alternativ utveckling som är mest framgångsrik i slutändan. Det är en förutsättning för den semantiska webben, att företag och användare måste bygga verktyg, bidra med innehåll och använda det innehållet. Inte bara vänta på att den semantiska visionen blir verklighet. En uppskattning är ca tio år innan visionerna kan realiseras fullt ut [1 s. 17]. Det som även är intressant att undersöka är hur långt tillämpad semantisk webb teknik kan bistå en webbsatsning i dagsläget.
Sidan 13 av 90 2. Utgångspunkt för rapporten Semantisk webb och semantisk teknologi är en relativt ny domän. Utvecklingen gick snabbt framåt och från att vara enbart forskningsområde till att industriforsknings och branschrelaterade företag börjat utforska de fördelarna som semantisk webb erbjuder tog det inte mer än 7 år. De flesta semantiska implementeringar som existerar idag hittar man i följande områden: business-to-businees e-handel, bioinformatik, knowledge management, utbildning och medieproduktion [20]. 2.1. Frågeställning Examensarbetet söker ett svar på frågan: Vilka möjligheter och utmaningar finns idag för företag som producerar utbildningsmaterial och överväger att använda semantiska teknologier för att underlätta för sina användare? 2.2. Metod Undersökningen fokuserade initialt på en allmän litteraturstudie om semantisk webb. Under studien kontaktades ett antal företag, främst inom media för att undersöka om något av dessa var aktivt involverat i ett semantiskt arbete. Det visade sig att Utbildningsradion var det enda av de kontaktade företagen som hade en sådan satsning, Mediebiblioteket. Eftersom UR var tidiga med att implementera semantisk teknik (2002) skapades en möjlighet att göra en fallstudie på ett företag som redan har byggt upp en erfarenhetsbas från praktisk användning av den nya tekniken. Det blev därför naturligt att välja att göra en fallstudie av URs satsning. Metoden för fallstudien beskrivs i avsnitt 2.3.2. 2.3. Fallstudie Utbildningsradions Mediebibliotek använder semantiska teknologier och kombinerar utbildningsfrågorna med medieproduktion. Företaget är väldigt intressant att studera eftersom verksamheten täcker två viktiga områden som semantisk webb utlovar mest användning för. 2.3.1. Syfte med fallstudien Målet med fallstudien var att undersöka den semantiska webbteknikens potential samt hur URs satsning relaterar till övrig semantisk webb ur olika perspektiv: teknisk uppbyggnad, fördelar och eventuella nackdelar med en sådan struktur, fördelar för företaget samt i deras relation med omvärlden. I tillägg var vi intresserade av att hitta ytterligare funktioner som kan addera värde till URs befintliga lösning genom t.ex. en kartläggning av vilka andra företag och aktörer som framgångsrikt använder semantisk webb och som UR därmed skulle kunna samarbeta med.
Sidan 14 av 90 2.3.2. Fallstudiemetod Fallstudiemetoden innebär bland annat insamling av bakgrundsinformation kring specifika tekniska lösningar för UR, men en kvalitativ undersökningsansats valdes för att samla data. 2.4. Ansats Den kvalitativa undersökningsansatsen var personliga djupintervjuer med tre grupper i samband med en konceptuell beskrivning av underökningsområdet på UR. Hur djupintervjuerna utfördes beskrivs i kapitel 5. 2.5. Målgrupp Rapporten har två primära målgrupper, dels semantisk webb community generellt för feedback från praktisk användning av semantisk webb i en skarp driftmiljö, dels företag inom utbildning, medieproduktion, public service verksamhetsområden med ett intresse för att starta eller följa upp liknande projekt. 2.6. Avgränsning Rapporten behandlar inte ontologimodelleringsfrågor. URs begreppsmodell kallas för en ontologi, baserad på definitionen av KMR gruppen på KTH [89]. Under fallstudien har inte några tekniska utvärderingar eller metadatautvärderingar gjorts utan slutsatserna baseras på rapporter som redan fanns på företaget.
Sidan 15 av 90 3. Fallstudie UR Fallstudien utfördes på Utbildningsradion, UR och det semantiskt uppbyggda systemet Mediebiblioteket som utvecklades där. UR var tidiga med att börja implementera visionen om en semantisk webb och påbörjade arbetet redan år 2000, bara 3 år efter att Tim Berners-Lee hade skrivit om axiomen i webb arkitekturen [2] och 2 år efter att tanken om The Semantic Web is a web of data, in some ways like a global database [3] introducerades. URs erfarenheter är intressanta inte minst ur ett perspektiv på hur en ny teknologi kommer till användning och de utmaningar som är förknippade med processen att bygga upp och driva ett digitalt bibliotek baserat på semantisk teknik. 3.1. Bakgrund UR bedriver programverksamhet inom utbildningsområdet och är ett självständigt public serviceföretag, det vill säga ett företag i allmänhetens tjänst [53, s.18]. URs uppdrag är att producera och sända utbildningsprogram inom samtliga utbildningsområden [54]. Historia Efter att den första skolradiosändningen med en lektion i engelska och historia hade sänts 1928, tog det 50 år och televisionsgenombrott (1957) med bl.a. vuxenutbildningar i det nya mediet [53] innan UR bildades 1978. 1994 blev UR ett eget programbolag och 1995 lanserades URs egen webbplats på Internet. År 2004 var viktigt i URs historia, då Mediebiblioteket, MB och Kunskapskanalen introducerades [53]. Verksamhetsbeskrivning URs verksamhet styrs av ett antal lagar: radio- och tv-lagen [43], yttrandefrihetsgrundlagen [39] och regeringens sändningstillstånd [44] samt anslagsvillkor [42]. Produktionen ska omfatta program för förskola, ungdomsskola, högskola och vuxenutbildning inklusive folkbildning samt program som vänder sig till funktionshindrade, etniska och språkliga minoriteter. Programmens funktion ska vara förstärkande, breddande och kompletterande i samhällets utbildningsinsatser [53 s.18]. 3.2. Mediebiblioteket För att göra samtliga program mer tillgängliga för slutanvändare och samtidigt undvika att binda användningen till ett visst sändningstillfälle, satsade UR på uppbyggnaden av ett mediebibliotek, eller digitalt bibliotek, som togs i drift 2003. Mediebibliotekets syfte är att elever och pedagoger skall få ökad tillgång till URs produktioner för att inspirera till så stor användning som möjligt [53 s.22], men också att möjliggöra åtkomst till materialet för personer vars modersmål är annat än svenska samt för personer med olika funktionshinder. I Mediebiblioteket kan man sedan 2001 se eller lyssna på hela eller delar av redan sända radio och TV- program, hitta webbplatser och annat via Internet. Materialet organiseras även för att göra det mer tillgängligt för lärare och elever i s.k. lärobjekt och lärmoduler [36 s.1] som även kallas för digitala utbildningspaket [52 s. 22]. I dagsläget finns det 13 000 titlar i Mediebiblioteket. Användarna har tillgång till tre typer av sökfunktioner för att navigera i materialet.
Sidan 16 av 90 3.3. Den initiala målsättningen med Mediebiblioteket UR tog under år 2000 fram ett tiopunkters utvecklingsprogram inför en ny ansökan till sändningstillstånd med innebörden UR vill erbjuda ett flexibelt lärande och därför utveckla ett digitalt mediebibliotek [50 s.2]. Arbetet påbörjades med att skapa en kravspecifikation för det nya Mediebiblioteket genom två förstudier med intern och extern kompetens. Med fokus på tillgängligheten till URs produkter och program ställde man upp följande övergripande mål: att de som så önskar snabbt ska kunna hitta och få tillgång till URs utbud av tv- och radioprogram, webbaserade material och trycksaker. att göra allt UR gör tillgänglig för alla oavsett tid och rum att finna en fungerande lösning för samtliga de krav och önskemål som kan komma att ställas avseende en intelligent hantering av URs verksamhet [50 s.2]. Mediebiblioteket skulle bli en ny, central resurs som knyter ihop olika system och gör det möjligt att från ett användargränssnitt hitta information om alla typer av media som UR har [56 s.5] för olika kategorier av användare: vidaredistributörer, organiserade eller institutionella (skolor etc.), andra medieproducenter och enskilda personer [50 s.7] och för egen produktion och arkivering. Genom att undersöka internationella aktörer och deras mål och problem för materialarkivering drog internstudien följande slutsats: Det finns emellertid inga färdiga system för digitala mediebibliotek och det saknas fortfarande standarder [50 s.16]. Förstudierna resulterade i ett projekt med uppdraget att utveckla, undersöka, förvärva och implementera struktur för mediebibliotekets databas [38 s.1] med följande krav: skapa/förvärva en databas som hanterar olika sökresultat i form av text, bild, ljud och rörligt material och som visas genom databasgenererade webbsidor. skapa/förvärva sökverktyg. digitalisera och komprimera material som skall komplettera databasen. 3.4. Uppbyggnad av den tekniska plattformen UR formulerade en projektplan för projektet som skulle skapa/förvärva mediebiblioteket. Projektet fick namnet MB.alfa (MB punkt alfa) [21 s.69]. Ur projektplanen [38 s.2] framgår tydligt att systemet skulle byggas i form av ett öppet system som kan integreras i nuvarande databasmiljö och som är så flexibelt att det lätt kan byggas ut efterhand med nya funktioner och att det skulle underlätta att prioritera användarfallen i både det korta och långa perspektivet. Den tekniska lösningen skulle finnas i drift sommaren 2002 och bygga på öppen källkod för att dels vara kompatibel med andra e-learning aktörer som satsar på öppen källkodsutveckling, dels kunna dra fördel av de andras utvecklingsinsatser för den gemensamma infrastrukturen för e-lärande [21 s.70]. Uppdraget för att ta fram en sådan systemarkitektur bestående av en metadatabas och ett söksystem som tillgängliggör information om URs produkter via URs webbplats ur.se [21 s. 69] gick till KMR-gruppen [89] på KTH våren 2002.
Sidan 17 av 90 KMR-gruppen rekommenderade att man för att säkerställa systemets utveckling, långsiktiga hållbarhet och öppna teknikplattform skulle ta hänsyn till följande aspekter användandet av öppna, internationella teknikstandarder, arkitekturens öppenhet, flerskiktad arkitektur, skalbarhet. [21 s.70] I juni 2002 slöt UR ett avtal med Skolverket. Skolverket hade då fått Regeringens uppdrag att utforma en strategi för en mjuk infrastruktur på utbildningsområdet [21 s.34]. Syftet med detta arbete var att skapa en rationell informationshantering inom utbildningsområdet så att lärare och elever skulle kunna fungera som både producenter och konsumenter av information och utbildningsmaterial. Skolverket hade även knutit ett samarbete med Centrum för Flexibelt Lärande, CFL, och KTH och deltog i ett nationellt såväl som internationellt standardiseringsarbete för IT och lärande. I avtalet mellan Skolverket och UR betonades URs roll som den största producenten av multimediaproduktioner inom utbildningsområdet och URs ambition att göra detta material mer tillgängligt. Samarbetsprojektet syftade till att skapa en generell systemarkitektur för hantering av metainformation om digitala tillgångar, nationella nav och mäklartjänster av lärarresurser, såväl privata som offentligt producerade [21 s.34]. Arbetet skulle konkret leverera en gemensam teknisk plattform; SCAM: Standardized Content Archive Management System. Praktiskt innebar detta att URs Mediebibliotek kom att byggas på denna tekniska plattform. 3.5. Teknisk struktur Den faktiska tekniska strukturen beslutades både utifrån de krav som den nya lösningen ställde liksom URs befintliga teknikmiljö. 3.5.1. Teknisk miljö. IT-plattform UR valde efter en tid att basera den tekniska driftmiljön för Mediebiblioteket [46] på två Windows 2003 servrar, dmb.ur.se och mbedit.ur.se. Den första används för en extern kommunikation och den andra för intern användning med stöd för inmatning och editering av data. På den senare servern ligger även systemets databas med MS-SQL som databashanterare. Dessa servrar fungerar tillsammans med den webbserver som UR använder för att publicera webbplatser ww.ur.se. Serverapplikationer är: SCAM - Standardized Contextualized Access to Metadata [84], beskrivs nedan. JENA som är en samling verktyg för att skriva semantiska webbapplikationer som utvecklats av HP [70] JBoss som är en Java baserad applikationsserver Tomcat som är en Java baserad webbserver Hjälpapplikationer: Gorilla är ett verktyg för editering av metadata i databasen Lemur används för att automatiskt hämta data för presentation av sändningstablåer Makak används för att exportera och importera metadata till externa parter Klientdatorer eller redigeringsdatorer har Windows XP Professional operativsystem, Java Runtime Environment 1.4.1, Gorilla 2.1. Hjälpapplikationer utvecklades för att tillgodose URs behov av metadahantering. [46] Samspelet mellan applikationerna visas i Figur 4
Sidan 18 av 90 Figur 4. Samspel mellan applikationer 3.5.2. Teknisk Miljö. Applikationer och ramverk Som det framgår ur beskrivningen av IT-plattformen, använder sig Mediebiblioteket av en rad applikationer och ramverk. Alla applikationer bygger på öppen källkod. SCAM SCAM (Standardized Content Archive Management eller Standardized Contextualized Access to Metadata) är ett modulärt uppbyggt arkivsystem [84] som utvecklas av KMR-gruppen vid KTH. Det är en central del av Mediebiblioteket. SCAM är ett ramverk för att utveckla olika typer av användarapplikationer. Grundfunktionen i SCAM är att hantera lagring av och access till metadata och set av metadata.[25] Det inkluderar: administration, lagring och access, sökning, sammanfogning av olika resurser samt funktioner för att hantera resurser tillsammans med associerat metadata.[51] En tilläggsapplikation är SCAM Portfolio. SCAM stödjer Resource Description Framework, RDF [82] som är en W3C standard och ett språk för att beskriva relationer mellan olika resurser, t.ex. utbildningsresurser, med hjälp av vokabulärer. Genom RDF är SCAM oberoende av metadatastandard och stödjer därför idag Dublin Core (se nedan), vcard [79] och IEEE/LOM (se nedan). SCAM använder JENA (se nedan) för att hantera tripletter. Presentationslagret är webbaserat. SCAM är en kärnapplikation i URs infrastruktur och är ämnad att med hjälp av metadata lagra beskrivningar och referenser till olika digitala samlingar, bl.a. lärresurser. Tanken med SCAM är att metadata ska vara någonting levande och kan komma från olika källor. Det kan därför ha olika relevans och status i olika sammanhang [21 s. 6] och av den orsaken är semantisk webbteknologi en viktig utgångspunkt. SCAM systemet består av en databas, som har i uppgift att lagra data i RDF-form, applikationslagret, där systemets logik och funktioner ligger, i form av metadataeditering, kommunikationen med en databas, konvertering och mappning av olika metadatastandarder. För Mediebiblioteket har SCAM ett presentationslager, eller användaryta, som tar hand om
Sidan 19 av 90 interaktionen mellan användare och systemet och är synlig för användare [21 s.64]. URs användarytor i SCAM är utrustade med två metaforer en portfölj och komponentarkivsmetaforen, som har skräddarsydda utseenden. SCAM:s strukturen framgår ur Figur 3 [21]. JENA Figur 5. SCAM systemsstruktur JENA är ett Java ramverk utvecklad av HP Labs för att skriva semantiska applikationer, den s.k. RDF Application Program Interface [70], som baseras på W3C rekommendationer för RDF triplettsmodeller och använder RDQL [83] som frågespråk. JENA har stöd för OWL [78]. JENA är designad för fungera med valfri relationsdatabas och har förutsättningar för att arbeta med ontologier. SCAM använder JENA för att lagra tripletter medan SCAM självt kan hantera grupperingar av tripletter [25 s.2]. Aktuell version som används av UR är Jena 2. SHAME SHAME (Standardized Hyper Adaptable Metadata Editor) är en ramverk utvecklad av KMR gruppen vid KTH. Med hjälp av SHAME går det att skapa avancerade metadata-editorer för att hantera RDF-metadata baserat på olika metadatamodeller [34 s.7]. SHAME är grunden i URs hjälpapplikation Gorilla, som används för att editera metadata. En annan tänkbar användning av SHAME ligger i att ge externa användare möjlighet att annotera eller innehållsmärka URs material utifrån sina egna perspektiv.
Sidan 20 av 90 3.5.3. URs metadata För att märka upp sitt material och för att beskriva objekt använder UR följande standarder: RDF (Resource Description Framework) är ett ramverk för metadatastandarder, som tillåter flera metadatmodeller till ett och samma objekt. Det innebär en stor potential för användning av olika metadadefinitioner, vokabulär och taxonomier för att beskriva samma resurs ur olika kontext [51 s.2]. Man undviker därmed en central metadata auktoritet som bestämmer beskrivning, identifikation, förståelse, användning och/eller utbyte av metadata. Med RDF kan man också beskriva objekt utan att kräva alla detaljer [16]. Dublin Core är en bibliografisk metadatastandard för att beskriva en stor mängd av nätbaserade resurser [16]. De beskrivs med följande grundelement: title, creator, subject, description, publisher, contributor, date, format, type, identifier, source, language, relation, coverage och rights. IEEE/LOM en metadataspecifikation inom utbildning och lärandeområdet, består av över 70 element som är grupperade i 9 kategorier, alla kategorier är valfria och används för att beskriva lärresurser, som inte nödvändigtvis behöver vara digitala men kan användas i samband med technology supported learning [95] eller ha multimedial, mjukvaruinnehåll, mjukvaruverktyg, etc. för undervisningssyfte. Relevanta kategorier är: type of object, author, owner, terms of distribution, and format och pedagogiska attribut. IMS Metadata har sina utgångspunkter i Dublin Core och har som målsättning att vara användbar internationellt och är en implementation av IEEE-LOM. Den består av runt 100 metadata element och regler för hur element ska kombineras för att komponera hierarkiska strukturer schemas. Metadata har följande kategorier: General: resource identifier, title; characteristics: creation language, academic discipline; life cycle: versioning information; technical: format, hardware and software requirements; rights management: use conditions, price; relation: how this resource relates to other resources; meta-metadata: metadata creator, validation information [11]. IMS Metadata används i SCAM. IMS content packaging en standard för hur lärresurser kan struktureras och paketeras för en vidare distribution av data och metadata [29]. UR-specifika metadata som utgör en standard internt, använder RDF [51 s.2]. 3.5.4. Begreppsmodell Under begreppsmodelleringsarbete har UR använt sig av KMRs beskrivning av ontologi: En vokabulär är en begreppslista, en taxonomi är en begreppshierarki och en ontologi är en begreppsmodell. Moderna metadatastandarder beskrivs med hjälp av ontologier (i RDF). Ontologier är bryggan mellan syntax och semantik för datorer [21 s.22]. Nuvarande begreppsmodeller (eller ontologier) som används av UR har följande indelning: målgruppsontologi ämnesontologi programontologier, webbplatsontologier Ämnesontologin är definierad av en delmängd av de ämnen som definierats av SLI [86].
Sidan 21 av 90 3.6. Användning Mediebibliotekets tekniska struktur möjliggör i praktiken följande: lagring av metadata separat från de data den beskriver kontextsökbar metadata låta kopplingar mellan beskrivna dokument bilda relationer till standardiserade taxonomier; lagring av RDF tripplar av typen subjekt-predikat-objekt utryckta med hjälp av URI [91] lagring av flera metadatakataloger; att kombinera resurskomponenterna och kunna göra de återanvändbara och flyttbara [49]. Sökning i Mediebiblioteket Idag består sökningsgränssnitten i Mediebiblioteket av tre typer av sökningar: enkel sökning, avancerad sökning och symbolsökning. Enkel sökning består av [Bilaga 5] två fält: titel/ord i text och fritextsökning, avancerad sökning innehåller 15 fält, som är indelade i språk, ämnen, målgrupp etc. Båda sökgränssnitten är traditionellt utformade formulär. Symbolsökning innehåller tre olika sammanhang och är tänkt för att användas som ett visuellt hjälpmedel av personer med en liten datorvana och olika typer av funktionshinder. Symbolsökning är även ett bra illustrativt exampel på vad som menas med kontextsökning. [21 s. 72] Portföljer Portföljerna är en av användarytorna i SCAMs i presentationslager, Figur 3, som används av UR. Portföljer ger användare en möjlighet att spara, återanvända och kombinera resurser i sin portfölj och göra de tillgängliga för valfria användare på Internet. Eftersom SCAM har stöd för WebDAV (Distributed Authoring and Versioning) [94], en standard för att direkt författa och uppdatera webbsidor, kan auktoriserade användare av URs mediebibliotek dynamiskt gruppera olika resurser till pedagogiska paket eller lärmoduler i en portfölj för att enkelt kunna presentera utvalt material för målgruppen. En lärare skulle kunna få möjlighet att gruppera resurser efter ämne, målgrupp och t.ex. kursmoment oavsett typ av resurs. Därefter kan man välja presentationsmedium vilket gör parallellpublicering möjligt via t.ex. webbplats eller Dvd-skiva.[45]. UR har utvecklat portföljerna så att de ska kunna visas upp i ett specifikt gränssnitt, dessa portföljvyer kallar UR för lärmoduler. För närvarande har UR själv tagit fram 4 lärmoduler med ämnen demokrati, genus, juridik och matematik som finns tillgängliga på webben och kan användas i utbildningssyfte. Edutella Edutella [80] är peer-to-peer system med RDF-stöd för sökning och utbyte av metadata om lärresurser. Den utvecklades av bl.a. KTH i samarbete med universitet i Stanford, Hannover, Karlsruhe, Uppsala och inom ramen för Wallenberg Global Learning Network [48]. Edutella har följande funktioner: att distribuera annotationer, kurskompositioner, att utföra
Sidan 22 av 90 sammanhangsbaserade sökningar och gemensamma sökningar i olika arkiv. Det finns olika typer av roller man kan ha i ett Edutella-nätverk: provider, consumer och hub. Provider erbjuder en söktjänst, consumer ställer sökfrågor och hub ansvarar för att frågorna når rätt provider [21 s.51] Om många organisationer som erbjuder utbildningsmaterial skaffar motsvarande typ av lösning så blir det möjligt för en användare att söka i alla systemen samtidigt och att sammanställa sökresultaten. UR deltar i Edutella nätverket [Bilaga 3] och nästa tänkbara steg kan vara att utveckla stöd för annotationsmöjligheter i portföljerna för att användarna ska kunna dokumentera strukturerade åsikter om lärresurser inom Edutella-nätverket. 3.7. Samarbeten Skolverkets vision för ett framtida metadatasamarbete inom utbildningsområdet framgår av illustrationen i Bilaga 4. Genom ett avtal mellan Skolverket och UR finns Mediebiblioteket med i det samarbetet. Fördelarna med den här strukturen är att varje organisation [40] själv ansvarar för att märka upp sina egna informationsresurser med metadata samtidigt som var och en kan välja vilken och hur mycket av informationen som skall vara sökbar lokalt respektive globalt. Mediebibliotekets roll är att tillhandahålla utbildningsmaterial och metadata till de olika typerna av utbildningsanordnare. UR har valt den tekniska strukturen för att bland annat stödja ett metadatasamarbete mellan olika utbildningsintressenter genom att lösningen stödjer RDF och valfria metadatakataloger. Det är en nödvändig förutsättning för att delta i den typ av samarbete som Skolverket beskrivit. På Skolverkets initiativ har UR deltagit i följande samarbeten: TK450 gruppen tillsammans med Nationellt centrum för flexibelt lärande (CFL), KTH en ISO standartiseringskommittén för IT och lärande [21 s.34]. SCAM projektet utveckling av generell systemarkitektur för hantering av metadata om digitala tillgångar, nationella nav och mäklartjänster av lärresurser [21 s.34] tillsammans med KTH, Centrum för Flexibelt Lärande (CFL), Umeå universitet, Uppsala/Swedish Learning Lab. Idag finns det en rad applikationer som baseras på SCAM, bland annat NoT-navet (samarbetsprojekt mellan Skolverket och Myndigheten för Skolutveckling), Myndigheten för Skolutvecklings publikationsdatabas, Virtual Workspace Environment och SCAM Portfolio [21 s.6]. MUCS är en förkortning av projektdeltagarna: Myndigheten för Skolutveckling, MSU, UR, CFL, Skolverket. Samarbetet fokuserar på att utbyta metadata för varandras digitala samlingar. En implementering har gjorts för systemen Kursnavet, NoTnavet och Mediebiblioteket. Förhandlingar för att utöka samarbetet fördes med bland annat Museifönstret [47] och pågår med Riksutställningar [37].
Sidan 23 av 90 3.8. URs resurser för Mediebibliotekssatsningen För användarstöd, drift och vidareutveckling av Mediebiblioteket finns följande interna resurser: 1. en chef för Mediebiblioteket 2. tre redaktörer med ansvar för metadatauppläggning 3. en projektledare 4. en teknisk utvecklare För teknisk vidareutveckling av funktionaliteten i SCAM kan man dra nytta av den utveckling som sker i SCAMs open source community med totalt 14 utvecklare, de flesta på KTH. Den senaste releasen av SCAM publicerades i augusti 2004 och nästa planeras till november 2005. Hög kompetens inom området metadata krävs för att kunna dra full nytta av systemets möjligheter. 3.9. Status på den tekniska lösningen UR uppdrog 2004 till Applied [41] att genomföra en teknisk utvärdering av Mediebiblioteket. I det följande redovisas en sammanfattning av resultaten från utvärderingen. Resultatet kommenteras i kapitel Slutsatser. Målet med den tekniska utvärderingen var att undersöka om det fanns förutsättningar att uppnå Mediebibliotekets verksamhetsmål med den tekniska plattformen och om den uppfyller rimliga tekniska krav. Studien fokuserar på att analysera i vilken grad som det tekniska lösningarna kommer att uppfylla dessa mål och resulterar i följande slutsatser: Både SCAM och Jena är i ett tidigt skede utvecklingsmässigt, och kan klassificeras som omogna/halvmogna, d v s de kan vara lite riskabla. [41]. Allmänt anser man att det "grundkoncept som implementerats runt metadatamärkning och metadatautbyte är väl genomtänkt och passar URs syften väl". Man betonar att systemet är flexibelt och följer standarder. De områden som den tekniska utvärderingen koncentrerar sig på är: Postlåsning i databasen Prestanda vid sökning och uppdatering Administratörsgränssnitt Teknisk kompetens hos UR Alternativa tekniska lösningar Postlåsning i databasen Om flera användare samtidigt uppdaterar systemets metadata finns det ingen garanti för att detta sker korrekt i databasen. När användningen ökar stiger också sannolikheten att fel uppstår i praktiken och det innebär att databasen blir inkonsistent. Planer på att åtgärda problemet i
Sidan 24 av 90 SCAM saknas. Felet bedöms i den tekniska utvärderingen som svårt att åtgärda och är en potentiell "knockout faktor". Prestanda vid sökning och uppdatering Prestanda vid sökning och uppdatering är enligt den tekniska utvärderingen och användare ett problem. I studien konstaterar man att det görs försök för att förbättra situationen kortsiktigt men att det saknas strukturerade och mer genomgripande åtgärder. "Prestandaåtgärderna hittills har karaktär av "lappa och laga" ". Sedan den tekniska studien genomfördes har en ny version av Jena implementerats, Jena version 2.2. I den versionen har datamodellen gjorts om vilket ger en prestandaförbättring på bekostnad av större lagringsutrymme. "The default Jena2 database layout uses a denormalized schema in which literals and resource URIs are stored directly in statement tables. This differs from Jena1 in which all literals and resources were stored in two separate tables that were referenced by the statements table. The Jena2 layout enables faster insertion and retrieval but uses more storage than Jena1." [71]. Man säger också att det finns utrymme för fortsatt arbete med att optimera prestanda i framtida releaser. Den tekniska utvärderingen pekar på CFL's undersökning av möjligheterna att byta ut Jena mot en annan RDF implementation i syfte att förbättra prestanda. Det är idag oklart vilket resultat det har gett. Administratörsgränssnitt Arbetsinsatsen med att skapa och underhålla stabila administrationsgränsnitt mot SCAM bedömdes i den tekniska utvärderingen som "för hög". Studien påpekar att ett arbete pågår inom CFL/KTH för att "skapa ett konfigurerbart administrationsgränssnitt som skulle underlätta i framtagandet av UR-specifikt administrationsgränsnitt." Behörighetsnivåer för administratörer saknas liksom spårbarhet vid ändringar av metadata. Teknisk kompetens hos UR Studien pekar på att UR måste säkerställa "en hög egen SCAM/Jenakompetens" som man rekommenderar ska vara redundant vid t.ex. sjukdom. Man gör bedömningen att detta är en "knockout faktor". I samband med det pekar man även på risken att CFL/KTH förändrar sin inriktning och därmed minskar eller överger utvecklingen av SCAM vilket även det anses vara en "knockout faktor". Alternativa tekniska lösningar Den tekniska utvärderingen tar upp möjligheten till att UR väljer att utveckla en ny "URspecifik och specialiserad Mediebiblioteksplattform". Studien anser att UR därmed lättare skulle kunna undvika redovisade problem och kunna skapa "en mer stabil webbtjänst". För att ändå möjliggöra för UR att delta i pedagogiska samarbeten skulle UR kunna behålla den befintliga plattformen "enkom för det syftet". Man konstaterar dock att det skulle kräva ett betydande utvecklingsarbete.
Sidan 25 av 90 3.10. Ämnesordsmärkning i Mediebiblioteket Under våren 2005 genomfördes en utvärdering av URs praktiska användning av metadata för att märka upp sitt material med ämnesord. Utvärderingen Metadata i Mediebiblioteket, Nyckelord och SAB-klassning [32] är gjord utifrån ett biblioteksperspektiv och fokuserar alltså på den metod och standard som Mediebiblioteket bör använda för att URs samlingar ska bli så väl sökbara som möjligt. I rapporten påpekas att sättet att lägga upp metadata som existerar på UR idag är avsedd för en kortsiktig lösning, problemen kommer att exponeras ju större samling blir. Som rekommendation har studien följande: att katalogisera materialet enligt SAB-klassning, det vill säga enligt svensk folkbiblioteksstandard med specifika modifikationer för UR. Att överhuvudtaget använda metadata vid organisering av dokument baserar sig på grundinsikten att de ord som nämns i dokument något ironiskt inte är representativa för dokumenten. I praktiken går dock [det nuvarande] systemet för nyckelord i MB ut på att använda så många ord som möjligt för att bäst beskriva programmet: Välj ord som inte redan förekommer i serietiteln eller i den korta texten eftersom dessa är sökbara. De redan sökbara orden anses vara onödiga att använda som nyckelord, då dessa ingångar till dokumenten redan finns. Istället öppnas fler ingångar, öppna dörrar på så många ställen som möjligt för att användaren ska hitta till dokumenten. Man är rädd att dokumenten ska försvinna i den stora informationsdjungeln om de inte gör sig hörda. Den ultimata beskrivningen av ett program borde därför, om detta synsätt utnyttjas till fullo, innehålla en full transkribering av programmet i fråga. Detta ger dock som sagt inte nödvändigtvis bättre sökträffar [32 s. 14]. Rapporten avslutas med en konkret rekommendation av hur det existerande materialets metadata kan uppgraderas och nytt material katalogiseras för att fylla rimliga krav på ämnesordskvalitet.
Sidan 26 av 90 4. Djupintervjuer Som metod för att reda upp tendenser och attityder kring semantisk webb teknologi, genomfördes en serie kvalitativa djupintervjuer. Resultaten finns i avsnitt 6.2. 4.1. Syfte Syftet med djupintervjuerna var att på ett systematiskt och så objektivt vis som möjligt samla in data för att undersöka den semantiska webbteknikens potential samt hur URs satsning relaterar till övrig semantisk webb ur olika perspektiv: teknisk uppbyggnad, fördelar och eventuella nackdelar med en sådan struktur, fördelar för företaget samt i deras relation med omvärlden. Ett annat syfte var att undersöka respondenternas mer generella syn på området semantisk webb. 4.2. Urval Urvalet av respondenter gjordes utifrån tanken att få med personer som deltog i Mediebiblioteks uppbyggnad i olika roller; organisatoriskt och tekniskt. Grupperna bestod av URs Redaktion för Pedagogisk Utveckling, som äger Mediebibliotek, KMR grupp på KTH. För att få svar på mer generella frågor om semantisk webb, valdes ett antal personer som har kompetens inom semantisk webb teknologier. De generella frågorna ställdes också till KMR group på KTH eftersom det även är deras främsta forskningsområde. 4.3. Intervjuunderlag intervjuplanens utformning De olika grupperna delades i huvudsak in efter deras inblandning i Mediebiblioteket. Det ledde till en grov indelning mellan vad som kom att kallas Externa och Interna. Den externa gruppen bestod av respondenter från olika företag som arbetar med semantisk webbteknologi på diverse sätt och forskare. Den interna gruppen bestod av de respondenter som på något sätt varit eller är inblandade i Mediebibliotekets praktiska uppbyggnad. De interna delades även in i en mer specifik indelning beroende på vilken roll respondenten haft/har beträffande Mediebiblioteket. Den interna indelningen var: KMR & Mediebiblioteket teknisk avdelning: Dessa tilldelades mer teknikspecifika frågor angående Mediebiblioteket. Redaktionen chefer: Dessa ansågs kunna svara på frågeområden rörande de val som står till grund för satsningen, och hur de ser på Mediebiblioteket fortsatta arbete. Redaktionen - låg inblandning: Denna del frågor ställdes till dem som inte berördes av vare sig teknikens uppbyggnad eller av satsningens mer abstrakta delar. Varje grupp fick dels generella frågor som riktades till alla grupper, dels frågor som var utformade för att motsvara gruppens egen expertis samt en grupp av valfria/spontana frågor som togs upp av respondenten spontant. Intervjuplanen finns bifogad för granskning under Bilaga 6.
Sidan 27 av 90 4.4. Datainsamlingsmetod Intervjuerna utfördes under veckorna 18-20. DAT-bandspelare användes för att spela in intervjuer och sedan transkriberades de. Transkriberat material har skickats till 5 personer för godkännande på deras begäran. Ett antal respondenter ville vara anonyma. Sammanlagt utfördes tretton intervjuer. 4.5. Metoddiskussion Det område som skulle undersökas (Mediebiblioteket) var ganska okänt för personer utifrån och därför behövdes det en liten konceptpresentation i samband med intervjuerna: Utbildningsradion (UR) har sedan år 2000 arbetat med en publik sökfunktion som baserats på visionerna om semantisk webb och semantisk samverkan. Sökfunktionen går under namnet Mediebiblioteket och finns tillgänglig på Internet. På webbplatsen finns stora delar av URs material i form av tv-program, radioprogram, texter och webbplatser sökbara. En del material finns även direkt tillgängligt i form av t ex strömbara filer, nedladdningsbara textfiler och flashspel. Sedan UR lanserade tjänsten har diskussioner kontinuerligt förts hur man bäst utnyttjar fördelarna med semantisk webb tillsammans med forskare vid Kungliga Tekniska Högskolan 4.6. Tillförlitlighet och användbarhet Vi har valt att göra en kvalitativ undersökning kan och därför kan inte dra slutsatser för hela området. Det gick att identifiera några nyckelfaktorer och förutsättningar som skulle ha ett värde för UR, KTH och andra verksamma inom semantisk webb område som presenteras i kapitel 7. 4.7. Felkällor De felkällor som alltid finns när intervjuer utförs av icke professionella, är den egna inverkan på respondentens svar. Det har under intervjuns gång försökt undvikas. Möjliga diskussioner av mer påverkande natur har dock i vissa fall existerat efter genomförd intervju, i det syfte att förstå mer kring den teknik som arbete genomförs i. Andra möjliga felkällor är även missförstånd eller andra oklarheter som kan ha uppstått, dock har även detta undvikits till den grad det är möjligt. Vidare kan även nämnas det faktum att transkribering av inhämtad information kan leda till diverse missöden, och att analys av intervjumaterial är en konst i sig själv och kräver träning för att kunna reducera datamängden felfritt. 4.8. Bortfall Det finns inga självklara bortfall för denna studie, dock kan det konstateras att vissa av de områden som tagits upp i intervjun, inte är del i dess resultat. Detta är av naturliga skäl för att till största grad reducera det insamlade materialet för att få fram en substans som berör ämnet.
Sidan 28 av 90 5. Resultat Nedan redovisas resultat för djupintervjuer utförda under fallstudien. Djupintervjuerna hade till uppgift att klargöra ett antal övergripande frågor: Hur relaterar URs satsning till övrig semantisk webb ur olika perspektiv: teknisk uppbyggnad, fördelar och eventuella nackdelar med en sådan struktur? Vilka fördelar har UR av den befintliga lösningen, inte minst i deras relation med omvärlden? Vilka andra funktioner kan addera värde till URs nuvarande lösning? Slutligen redovisas en översikt av externa pågående och genomförda projekt inom området semantisk webb. 5.1. Nyckelfrågeställningar som tagits fram för analysen av materialet I intervjuanalysfasen valde vi att koncentrera oss på följande frågeställningar som är specifika för fallstudien och avsedda att spegla respondenternas nuvarande åsikter: Hur uppfattar respondenterna att visionen för Mediebiblioteket är formulerad och till vilken grad är den uppnådd? Hur fungerar det semantiska samarbetet idag och vad går att förbättra i initieringen av framtida samarbeten? Vilken roll ska UR ha i det? Vilka tekniska fördelar/nackdelar finns det med den nuvarande lösningen? Märker användaren av några semantiska fördelar idag? Allmänna frågor inom semantisk webb som är aktuella: Vad är semantisk webb bra till? Vilka fördelar respektive nackdelar har den semantiska tekniken? Vilka primära användningsområden har semantisk webb? Vilka tidsaspekter gäller för utveckling och tillämpning?
Sidan 29 av 90 5.2. Sammanställning av intervjuer De resultat som framkom under djupintervjuerna sammanställs i tabeller nedan. Varje tabell innehåller kortfattade dimensioner, det vill säga en systematisering av intervjusvar utifrån vilka analysen genomfördes. Slutsatser redovisas i kapitel 7. Först följer resultatet för frågor som är specifika för fallstudien och riktade till personer som är eller har varit direkt inblandade i Mediebibliotekets uppbyggnad. Av dessa är en grupp forskare och en annan grupp UR anställda. Sist redovisas resultat för frågor om semantisk webb och semantisk teknologi i allmänhet. De frågorna riktades till forskare och andra med kompetens inom området. De intervjuade inom den gruppen bestod av personer som har varit respektive inte varit involverade i uppbyggnaden av Mediebiblioteket. Valet att inte koppla namn till citat beror på flera personers önskemål att vara anonyma. Sammanställningen av intervjuer redovisas objektivt och efter datareducering som gjorde det möjligt att lyfta upp de viktigaste frågeställningarna för fallstudien. 5.2.1. Vision Hur löd visionen för Mediebiblioteket? bättre nå användare, tillgänglighet att integrera UR i det nationella e-lärandeskapet bort från broadcast - tänkandet vision 8 personer 1 person 4 personer Tabell 1. Hur löd visionen för Mediebiblioteket? Majoriteten (Tabell 1) ansåg att visionen för Mediebiblioteket ligger i en tanke att på ett bättre vis nå ut till användare och därigenom göra URs produktioner mer tillgängliga. Man ville etablera strukturen på hur digitala utbildningsresurser kan förmedlas på bästa och nya sätt, att lägga allt UR producerar på webben, att öppna upp möjligheter för användare att ha en dialog om producerat utbildningsmaterial, bland annat i form av annotationer kring det. Det har hela tiden varit stort användarfokus påstår en respondent. Samtidigt finns det även en vision att integrera UR i det nationella e-lärandelandskapet som har redovisats av en person. Fyra personer nämnde som en del av visionen möjligheten att gå bort från broadcasttänkandet och en av de tycker att Mediebiblioteket representerar en bibliotekariens hämnd på hela broadcastkulturen, där det finns mycket motsträvan. Man ville skapa en ny syn på program där de lever längre och inte är knutna till sändningsögonblicket samt stödja det med den teknologi(n) som semantisk webb erbjuder. Det tänkandet är också önskvärt att fortsätta med i framtiden enligt en respondent.
Sidan 30 av 90 Har visionen uppnåtts? I vilken grad har den uppnåtts? uppnåtts till en viss del icke vision 2 personer 7 personer Tabell 2. Har visionen uppnåtts? I vilken grad har den uppnåtts? Majoriteten (Tabell 2) av de intervjuade anser, utifrån sina egna formuleringar av visionen, att den inte har uppnåtts. Man anser också att det skulle gå att göra det bättre, trots att man inte kan lägga ut allt material som produceras på grund av upphovsrättsproblem. En respondent anser att man kanske för tidigt har bundit sig till en teknisk lösning för att uppnå det kravet på att ge användarna det användarna vill ha. En annan tycker att det är mycket mer som ska finnas på plats innan det går att uppnå visionen. En person ansåg följande: Nej, det har den inte naturligtvis. Men den har man kan säga att fröet har såtts. Den potential som detta frö har, har det för närvarande ingen chans att realiseras. Två anser att visionen har uppnåtts till en viss del: UR har en bra kontroll över sitt Mediebibliotek och visionen har uppnåtts så långt som man kan av juridiska skäl (kan) säga. 5.2.2. Samarbete Hur fungerar samarbetet? Kan man kalla det samarbetet semantiskt? samarbete fungerar bra för närvarande icke semantiskt semantiskt 2 personer 1 person samarbete fungerar inte semantiskt 3 personer Tabell 3. Hur fungerar samarbetet? Kan man kalla det samarbetet semantiskt? Enligt två intervjuade fungerar samarbetet bra för närvarande (Tabell 3). Av de två anser en respondent att UR deltar i samarbeten och har jobbat mycket med stora aktörer, sådana som Myndigheten för skolutveckling, Skolverket, CFL. Den andra tycker att samarbetet fungerar bra med t.ex. bibliotek och att man har alla nödvändiga kontakter (med bland annat Nätuniversitetet) men samarbete sker inte på den tekniska nivån, inte på visionära nivån utan det är mera praktiska. Bara en anser att samarbetet sker semantiskt och att det finns ett antal projekt som använder samma teknik som UR. Bland de företagen finns Skolverket, CFL, Nätuniversitetet och i någon mån Museifönstret som deltar i diskussioner om ett framtida samarbete: och det är lite grann det jag menar att det finns.
Sidan 31 av 90 Tre personer tyckte att samarbetet, i existerande form inte kan kallas för semantiskt: Jag menar semantisk webb bygger på att man har någon att utbyta semantisk med, och det har vi ju inte. Man kan ju säga att vi har ja en fax och vi känner inga andra som har faxar överhuvudtaget. En respondent tycker att det är svårt för att få företagen att förstå poängen med den semantiska webben, eftersom de flesta behov företagen har kan lösas med andra tekniker, även om de kostar mer pengar och det skalar inte på nåt bra sätt, det blir ingen effektivitet när man höjer ribban. En tredje person menar även att samarbetet lider av en dålig samordning mellan projekt och organisationer och av politiska skäl går det inte att göra alla stegen man skulle vilja. Ska UR vara mer aktiv i initieringen av samarbeten, ska samarbetet vara semantiskt? ja, mer aktiv roll till allmänt samarbete nej till auktoritär roll i större semantiska sammanhang ska ha stödjande roll extern utveckling aktiv roll UR 3 personer 2 personer 1 person Tabell 4. Ska UR vara mer aktiv i initieringen av samarbeten, ska samarbetet vara semantiskt? Tre personer (Tabell 4) ansåg att URs roll ska vara mer aktiv i initieringen av nya samarbeten och att det inte behöver vara ett semantiskt samarbete, utan ett mer allmänt det står ju i vårt sändningstillstånd. Det ena är att det står att vi ska samverka, det är inte en fråga om vi vill, vi ska. Den personen fortsätter med att säga att UR måste vara öppet för dem som befinner sig inom målgruppen och att UR måste vara beredd att se till helheten för att nå ut till brukare och att vara beredd att komma med sitt material till dem. Två tyckte att UR inte ska vara aktiv i en bestämmande/auktoritär roll som UR skulle kunna få i stora semantiska sammanhang (bygga en gemensam ontologi, t.ex.). UR är en innehållsleverantör enligt en respondent och kan märka upp sitt material enligt standarder, standarder som gärna andra får komma överens om. En annan person hade en åsikt om att URs roll inte ska vara ledande i större semantiska sammanhang utan UR kan komma dit med mycket content, som kan användas utan kostnad av utbildningsväsendet. Samma person tyckte att URs roll i semantiska samarbeten ska vara stödjande, inte pådrivande och att UR kan bidra till det utan stora egna initiativ. UR har varit före andra i implementationen, ska man därför se det som en investering i ett möjligt semantiskt samarbete? potential med semantik om flera ansluter sig 2 personer Tabell 5. UR har varit före andra i implementationen, ska man därför se det som en investering i ett möjligt semantiskt samarbete? En intressant vinkel som framgick ur två stycken intervjuer (Tabell 5) var att potentialen till semantiken finns, om man inte är ensam aktör. En person sade att genom användning av semantisk uppmärkning har man gjort en slags investering för framtida samverkan med andra. Den andra tyckte att UR har varit mycket föregångare och har skaffat semantisk kunskap, vilket
Sidan 32 av 90 är en fördel som kommer att behövas när man t.ex. ska samarbeta med andra public service företag i Sverige. URs samarbeten kan förbättras. Ska det ske enbart via semantiska kanaler? ska ske semantiskt inte nödvändigtvis semantiskt samarbete kan förbättras 3 personer 4 Tabell 6. URs samarbeten kan förbättras. Ska det ske enbart via semantiska kanaler? En viktig lärdom är att samarbetet måste förbättras, men det är intressant att veta om förbättringarna ska ske med hjälp av semantiken eller inte. Tre önskade att samarbetet skulle förbättras med hjälp av semantisk teknik (Tabell 6). Av de tre ansåg en att om semantik kan hjälpa UR att nå längre till de målgrupper som UR har uppdrag att nå, så ska den användas vidare. En annan av de tre tyckte att: för att samarbetet ska ske via semantiska kanaler behövs det bättre medvetenhet hos andra aktörer och det är det som tar mest tid. En person hade intryck av att det är nu som semantisk webb börjar ta fart och eftersom UR ligger förre de flesta så ser UR kanske inte riktigt fördelar(na) som de kommer att ha här framöver Fyra personer tyckte att samarbetet kan förbättras men samarbetet behöver inte nödvändigtvis ske semantiskt. Av de ansåg en att det gäller att engagera så många andra aktörer som möjligt. Det finns ett antal offentliga organisationer som producerar intressant material som UR borde vilja dela med sig av. En annan person menar att om man snävar in sig på att arbeta men enbart semantiska lösningar, så får man väldigt få samarbetspartners och därför är det viktigt för UR att vara öppen för alla som vill ha deras material, oavsett hur de vill ha det. Enligt en tredje person är man mycket intresserad av att dela med sig av metada för att vara synlig utåt men informationen behöver inte lagras semantiskt internt utan det räcker med t.ex. SQL. Om andra aktörer blir intresserade av att samarbeta, kan UR översätta till deras format och standarder. En fjärde respondent tyckte att det är viktigt att sätta samarbete i ena änden, och fokusering på de lokala problemen i den andra. 5.2.3. Semantiska fördelar och nackdelar med den nuvarande tekniska lösningen Frågan ställdes till sex personer och kommer att redogöras i tre dimensioner: fördelar, nackdelar och om den nuvarande tekniska lösningen behöver utvecklas för att bli semantisk. Dimensionerna kunde inte enkelt redovisas i en tabell, eftersom olika personer såg på respektive fråga utifrån egna perspektiv. Svaren skiljde sig tydligt mellan de personer som har ansvar för att praktiskt lösa de tekniska utmaningarna respektive de som idag har en mer rådgivande roll. Fördelar: Sammanlagt fem personer framförde sina åsikter om tekniska fördelar med den befintliga semantiska lösningen. Bland de fanns följande påståenden: strukturen är på plats och bland de tillgängliga semantiska lösningarna har man gjort ett bra tekniskt val. En person tyckte att fördelen ligger i att systemet är öppet och använder öppna standarder med en möjlighet att utökas ytterligare med hjälp av open source kodning. Man byggde systemet utifrån perspektivet där man slänger upp någonting som man tycker verkar bra i början och sedan kan man kontinuerligt förändra, utveckla verktyg(en). Designen är flexibel och den går att ändra och lägga till nya saker (även om det kanske inte är så lätt i praktiken, enligt samma person).
Sidan 33 av 90 Sökgränssnittet är också flexibelt och kommer att kunna anpassas med andra system också. Avslutningsvis, tyckte en respondent att man genom att skapa en begreppsmodellerings-process på UR så är man enablad för att arbeta med semantiska verktyg utifrån och kan delta i den semantiska världen. Nackdelar: Fyra personer kunde definiera följande nackdelar: enligt en respondent saknar man fortfarande en övergripande bild av den tekniska lösningen på företaget. En annan tycker att det är svårt att få in ny data, att man är beroende av tredjeparts-mjukvara för att få in eller få ut data. En intervjuad framhävde att prestanda är ett exempel på ett område där det finns en hel del problem. Prestanda är inte tillräckligt bra för att tillgodose kraven som URs webtjänster ställer. En person ansåg att sökningarna blir paradoxalt klumpiga att göra och att fritextsökning som människor är intresserade av att göra inte kan användas för att söka på strukturer och sammanhang. Samtidigt ger den nuvarande JENA/RDF lösningen inte en bra grund till fritextsökningarna. Man tyckte även att det var onödigt att lagra data med hjälp av en semantisk standard när det går alldeles utmärkt att lagra på traditionellt vis och översätta till valfri standard om man behöver. Beroende på antalet portföljer i systemet och hur mycket data man har, kan problem med skalbarhet uppstå, enligt en respondent. En annan person poängterade också att genom att UR har några tusen besökare per dag så måste systemet fungera skarpt i drift. Avslutningsvis tyckte samma person att användningen av systemet inte är semantisk. UR har märkt upp allt material med metadata, man har en databas på tre olika kriterier samtidigt men drar inga slutsatser på data och hur sökningarna utförs. Den tekniska lösningen behöver utvecklas för att vara semantisk För att den tekniska lösningen ska vara semantisk behöver den utvecklas, enligt flera intervjuade. Problemen ligger inom följande områden: en tyckte att det primära målet med Mediebiblioteket är ett sökgränssnitt på Internet där det går att hitta och titta på program som UR producerar. Sökgränssnittet är ganska så stelt idag. Samma person tyckte även att genom att flytta fokus till de områden där semantisk webb har sina styrkor, t.ex. i portföljer kan man öka den nuvarande semantiska kapaciteten. En annan respondent konstaterade att för att presentera de data som UR tar fram, behövs det inte någon RDF uppmärkning, men UR har börjat titta på andra behov som skulle kunna tillgodoses med hjälp av den. En intervjuad var väldigt skeptisk till URs satsning på metadatautbyte, MUCS [35] och tyckte att man skapar en osund algoritm, eftersom det sättet att utbyta metadata på är att kopiera istället för att referera. Man kopierar, man exploderar, man pratar via de här SOAP gränssnitten, man gör om allting till en lång sträng som ska packas upp och sedan parsas och packas ner och packas upp. Det blir en kombinatorisk explosion. 5.2.4. Märker användare semantiska fördelar i nuvarande sökgränssnitt? märker märker ej måste förbättras användare och semantik 0 personer 9 personer 9 personer Tabell 7. Märker användare semantiska fördelar i nuvarande sökgränssnitt? Ett viktigt delmål för URs verksamhet är att ge användare på Internet tillgång till bra sökfunktioner för att lokalisera utbildningsmaterial. Det var därför viktigt att ta reda på om användare i nuläget märker den semantiska teknikens fördelar. Nio personer svarade definitivt
Sidan 34 av 90 nej på frågan (Tabell 7) om användare märker några sådana fördelar idag och alla tyckte att sökfunktionen måste förbättras. Enligt de intervjuade finns det ett antal förslag som skulle kunna förbättra användarnas intryck. Enligt två respondenter är det första som kommer att visa semantiska fördelar utåt, ett opinionspubliceringsnätverk skapat utifrån portföljer, som ännu inte finns på plats. Där kan användare börja lägga in åsikter om URs program på ett strukturerat sätt och hitta likasinnade. En person tyckte att den visuella sökmotorn (symbolsökning) ska finnas på plats med en gång och helst bör sökningarna göras genom den. Alla funktioner som man inte vill ha klickar man bort, man klickar sig inte fram, som det är nu. En intervjuad tyckte att man antigen måste utbilda sina användare att söka på sammanhang eller också måste sökfunktionen anpassas till det allmänna sätt som folk brukar söka på. Därför är det viktigt att gå andra vägar, att t.ex. skapa ett mellanlager där första nivån är fritextsökning och den andra är kontextsorterade träffar utifrån vilka användaren får välja vidare. Forskning kring de semantiska gränssnitten görs det alldeles för lite av, enligt en person. Därför är det svårt att visa upp exempel på hur man söker. Enligt en annan är det önskvärt att sökning sker lite grand bakom kulisserna, genom skapade applikationer, där det inte ser ut som om man söker, fast man gör det. Sammanfattningsvis, tyckte en att man måste kunna nå ut bättre till användarna. Genom de förslag som distributionsutredningen förväntas komma med, kommer man att kunna underlätta (även om det sker i slutna nätverk) att öppna upp portföljer, för att kunna ge användarna möjlighet att ta de objekt de behöver och också kunna plocka material från andra aktörer i nätverket. 5.2.5 Semantisk webbteknologi I intervjuerna om semantisk webbteknologi deltog 6 personer. Vi valde att koncentrera oss på mer generella frågor som: Vilka fördelar utlovar semantisk webb? Vilka fördelar/nackdelar har semantisk teknologi? Vilka primära användningsområden riktar sig semantisk webb emot och vilka tidsaspekter finns det för ett genombrott på bred front? Resultaten redovisas även här löpande i dimensioner därför att de inte gick att sammanställa i en tabell, av den orsaken att respondenterna hade olika syn på respektive fråga och det var svårt att hitta en gemensam nämnare. Av de 6 personerna som intervjuades fanns en som förhåller sig skeptisk till semantisk webb. Hans åsikter är intressanta att redovisa, även om de inte sammanfaller med flertalet, och de presenteras i slutet av varje dimension. Vad är semantisk webb bra till? Enligt en respondent standardiserar semantisk webb annotationsprocessen och lägger därmed grunden till det globalt annoterade informationssamhället. Samma person pratar om tre nivåer i semantik. Först är det semantisk isolering, där man lever i databasen bakom portalen: kom till oss och sök i vår databas, nästa nivå är en semantisk samexistens, då databasen finns på ett peer-to-peer nätverk och nätverket känner till vilka frågor den kan svara på (men den har ingen aning om hur andra beskriver sig), den tredje nivån är den semantiska samverkan vilket är ett resultat av en mappning av data mellan databaser. Han fortsätter med att semantisk webb kan få någon slags ordning på stora mängder av lagrad information, som fördubblas vart tredje år. En intervjuad tyckte att fördelen med semantisk webb ligger i att man genom att semantiskt beskriva sin information är man beredd på oväntad samverkan och gör det möjligt för andra att samarbeta med en. En person nämnde en potential för att göra informationen på webben tillgänglig inte bara för mänskliga ögon, utan också för godtycklig programvara att ta del av. En person ansåg: Jag tror inte att det finns någonting sånt som är semantisk webb. Han förhåller sig till att det är självklart att bindningar och relationer mellan dokument eller
Sidan 35 av 90 informationselement finns men han tycker inte att det går att bygga en generell arkitektur som kan förutsäga alla tänkbara kombinationer. Vilka fördelar har semantisk teknik? De intervjuade lyfte fram ett antal fördelar som semantisk teknik har: att maskiner kan processa och skapa nya kombinationer med hjälp av semantisk uppmärkning, att man med en semantisk teknologi slipper bestämma sig så tidigt. En respondent framhöll att man inte behöver fästa sig vid en standard eller ontologi, utan man kan kombinera många. En annan respondent menade att man har tittat mycket på betydelsen i det man uttrycker och att man kan lägga mycket vikt på hur man ska jobba med innehåll på olika sätt. En tredje intervjuad tyckte att semantisk webb är ett sätt för hur man kan organisera och skapa ordning och reda och hur man genom en anpassning av olika schemas kan skapa mjuka, karakteristiska för-stunden-relationer. Det kommer att ge användaren en möjlighet att bestämma hur de två olika scheman ska kunna kombineras. En övergripande kommentar som kan sammanfatta alla fördelar är: Största fördelen idag är att man är att du är säker på ett jobb imorgon. En respondent menar att det är bra tekniker som utvecklas under paraplyet som jag inte riktigt tror är ett bra övergripande paraply. Men han anser att en möjlig fördel med en semantisk webb finns i mappningsavseende, då man har olika samlingar som är organiserade på olika sätt men kan samarbeta ändå. Vilka nackdelar har semantisk teknik? Följande nackdelar med en semantisk webb framgick ur intervjuerna: samtidigt som det är svårt att kategorisera hela världen i en standard, finns det inte någon övergripande standard som omfattar allting, det är kombinationer från olika områden som gäller. Enligt en person öppnar semantisk webb en risk för integritetskänslig databehandling. Den andra tyckte att det finns alldeles för mycket förvirring kring semantisk webb och RDF var lite av fiaskot: Det är alldeles för tungt och fluffigt språk. En respondent anser att verktygen som är skapta för OWL och RDF fortfarande är för komplicerade i användning, även om de har bra grafiska miljöer. Samma person tyckte att det fortfarande är för mycket fokus på att bygga materialet som små öar och att man istället behöver kombinera dem med strukturerna som finns utanför öarna. Det material som finns uttryckt i RDF eller OWL är självgod idag. En intervjuad hade intryck av att semantisk webb inte riktigt har slagit igenom på bred front ännu och att den fortfarande är på akademisk eller visionär nivå. Den är ganska komplicerad och samtidigt saknas det bra exampel att peka på. En respondent vänder sig mot semantisk webb eftersom det inom området oftast pratas om att hitta den riktiga och rätta strukturen och den ska bli en standard. Han tycker istället att man borde tänka på är att: det jag gör just nu och de jag hoppas ska komma och titta på. Det anser han borde räcka om strukturen är bra gjord. Vilka primära användningsområden har semantisk webb? En respondent framförde en åsikt om att semantisk webb generellt ändrar knowledge push till knowledge pull inom utbildning. Det hjälper oss att gå från teacher, doctor, bureaucrat, producer-centric tänkandet till learner, patient, citizen, consumer-centric. En tyckte att det mest lämpliga området för semantisk webb var inom effektiv dokumenthantering, eftersom det går alldeles för mycket tid åt att leta efter papper idag. En intervjuad ansåg att det inte finns någon självklar kandidat, det är enligt en undersökning som han refererade till (10 % e-handel, 10 % utbildning, kanske 10 % trodde multimedia). Personligen skulle han satsa på sökteknologi.
Sidan 36 av 90 Tidsaspekter på utveckling och tillämpning En intervjuad hade en känsla av att utvecklingen sker exponentiellt. En annan tyckte att utvecklingen sker successivt och att det är en ganska linjär kurva, om inte någon Killer Application får ett genomslag. En tredje anser att genombrott är möjligt när det går att ha semantisk webb tillsammans med verklig information. Den fjärde personen tror att eftersom det är en ny teknologi som har ett antal problem som gör att folk är rädda att satsa på den. En intervjuad anser att det under det närmaste decenniet så kommer folk att få stöta sina pannor blodiga mot olika semantiska lösningar. Sedan om tjugo år kommer man inte att märka att semantiska lösningar finns och hur de är organiserade och man kommer att veta lika lite om dem som man vet om bibliotekets organisation. 5.3. Externa projekt Ett av syftena med vår fallstudie var att kartlägga vilka andra företag och projekt i angränsande sektorer som använder semantisk webb framgångsrikt. Ett delmål med det är att närmare förstå i vilken utvecklingsfas som den semantiska webben befinner sig år 2005. Vi har inte koncentrerad oss på de samarbetspartners som UR har varit eller är i kontakt med för att initiera samarbete (det beskrivs närmare i kapitel 4), utan beskriver en rad verksamma projekt och satsningar på annat håll. Southampton university - projekt SCULPTEUR - år 2005 SCULPTEUR är ett exempel på hur ett antal likartade organisationer museer -, spridda över Europa, har lyckats göra sina samlingar sökbara och fritt tillgängliga via ett avancerat sökgränssnitt med omfattande funktioner. Användargränssnittet kan dock förbättras. SCULPTEUR har som ett mål att to develop both the technology and the expertise to help create, manipulate, manage and present these cultural archives [85]. The project, which is the first of its kind, has unlocked the digital potential of the collections of the Victoria and Albert Museum and the National Gallery in London, the Uffizi Gallery in Italy, the Centre de Recherche et de Restauration des Musees de France and the Musee de Cherbourg. SCULPTEUR has used Semantic Web technology to apply a combination of knowledge engineering, content-based analysis and digital library interoperability, which means that rich sources of information on cultural heritage can be easily found within multiple distributed collections [92] "MuseumFinland - Finnish Museums on the Semantic Web år 2004 Projektet liknar University of Southamptons initiativ, fast för museer inom ett land. Our goal is to investigate how cultural collections could be made available and semantically interoperable through WWW. In our vision, semantic web technologies provide means for integrating different databases and a basis for creating intelligent information retrieval systems for such a global data repository [76]. By semantic Web techniques, it is possible to make collections semantically interoperable and provide museum visitors with intelligent content-based search and browsing services to the global collection base. By using the MuseumFinland approach, the museums with their
Sidan 37 av 90 semantically rich and interrelated collection content can create consolidated semantic collection portals together on the Web [17]. Arkive Images of life on Earth - år 2003 Arkive existerar och är verksamt idag och ger användaren möjlighet att söka efter och använda material om jordens olika arter. Det finns en bra avancerad sökstruktur som är kontextbaserad och lätt att använda. ARKive is the Noah's Ark for the Internet era - a unique global initiative, gathering together films, photographs and audio recordings of the world's species into one centralised digital library for the benefit of today's and future generations [96]. The Arkive project aims to collect and preserve digital images and recordings of endangered species and make them available to educationalists, researchers and the public. This is an example large scale repository and content management problem where RDF could be applied for representation of the metadata. This might have advantages - easier extension, simpler processing of imported metadata, ability to export subsets of the metadata to support external user communities [9]. The core technology developed within the ARKive project is a powerful solution to this project s requirements, but is also capable of being applied to any on-line museum or information repository. The use of a semantically agnostic data store, rather than a hard-coded database structure means that the same code-base can be applied to any site with similar requirements, not just natural history [87]. Children might, therefore, search the ARKive database using a simple term, while a lecturer might use a more scientific term, thus unpacking content that is similar in subject matter, but scaled in complexity. These thesauri are not unproblematic, given that many terms are invested with strong value judgments, but they're a good starting point on the way to realising more semantic organisation of the web [28]. BRICKS project- Building resources for Integrated Cultural Knowledge Services år 2004-2007 BRICKS aims at integrating the existing digital resources into a common and shared Digital Library, a comprehensive term covering Digital Museums, Digital Archives and other kinds of the digital memory systems. The results of the Project will constitute the main assets of a Factory, which has been subsidised by the Consortium partners and the EU for the duration of the Project, but will sustain itself in the future. BRICKS activities are structured in a way to maximise the impact for the construction of a shared digital heritage, which nevertheless respects the European cultural diversity. Its "bottomup" approach, which is based on the interoperability of a dynamic community of local systems, maximises the use of existing resources and know-how, and, therefore, national investments. BRICKS will contribute in: a) tuning the mission of memory institutions in the digital era, b) developing a shared vision for the exploitation of digital cultural content and c) encouraging cultural co-operation for the construction of an interoperable, co-operation cultural capital. A project funded by the European Union: Budget: 12,2 Million Euro. The BRICKS Community is the aggregation of a large community of users, composed of content providers, art professionals, and art researchers, as well as students, citizens, tourists, etc. in order to build a consensus, sharing knowledge and service on Digital Content [57]. Projektet ska använda open source verktyg, återanvända resultat av andra projekt med semantiska teknologier, ska ha ett fokus på användaren genom att visa fyra scenarios : an objective is to build four main application scenarios to demonstrate the value-added services for
Sidan 38 av 90 the users, och har en open community "to enlarge and enforce its resources and input from researchers, scientists, art professionals and users och ska definiera the right business model and strategy to sustain in the future [59]. Projektet är öppet för nya medlemmar. ELENA - a European research initiative funded under the IST programme of the European Commission år 2002-2005 ELENA är ett bra exampel på hur man kan kopplar upp flera aktörer för att användare ska ha flera möjligheter att välja och bedöma (med annoteringar) sitt utbildningsmaterial. The interdisciplinary research team followed the vision of creating Smart Spaces for LearningTM. These are open environments that support learners in optimising their learning management [63]. In a Smart Space for Learning personalized access technology is used to retrieve learning resources from semantically connected learning repositories [10]. Projektet har resulterat i ett show-case: Human capital development suite [64], där man kunde integrera flera möjligheter: Suite allows learners to maintain their profiles, interests and goals in a centralized portal interconnected to Smart Space for Learning Network.The ranker component, currently integrated in the HCD Suite, allows for personalization of search results. A semantic annotator provides a web service that increases the semantic homogeneity of learning repositories connected by semi-automatically annotating them with a common skill ontology. The personal reader provides powerful personalisation services in order to show learners the most effective way to a pre-described set of learning materials [10]. Genom ett sökgrässnitt kan man söka bland alla dessa aktörer, bland annat kommersiella, som erbjuder utbildningsmaterial: Amazon, CLIX, EducaNext-UPM, Edutella, Executive Academy (WBZ), Knowledgebay, LASON, Metzingen VHS-Kursdatenbank, Seminarshop.com, ULI, bfivienna. Relaterade projekt Vi har inte undersökt alla digitala biblioteksprojekt som pågår idag. Inom ett europeiskt projekt Delos Network of Excellence on Digital Libraries skapades ett research cluster Knowledge Extraction & Semantic Interoperability (KESI) (WP5) med start 2004 som har till uppgift att reda ut de tekniska fördelarna för att sedan presentera det till the widest possible community of interest [74]. Sammanfattning av externa projekt Sammanfattningsvis kan man konstatera att det år 2005 finns ett antal projekt som använder eller ska använda semantiska teknologier. Vårt intryck av denna begränsade studie är att de redovisade projekten har både drivkraft och en stark övertygelse att fortsätta i det semantiska spåret. Dessa kan vara intressanta att undersöka närmare för att bilda en bas för URs framtida semantiska samarbeten.
Sidan 39 av 90 6. Slutsatser och rekommendationer I kapitel 6 redovisas slutsatser och rekommendationer. Först följer slutsatser för intervjudelen i fallstudien, sedan en återkoppling till syftet med rapporten respektive fallstudien. Kapitlet avslutas med rekommendationer för URs vidare arbete. 6.1. Slutsatser från intervjuerna 6.1.1. Visionen för Mediebiblioteket Visionen för Mediebiblioteket som den har formulerats i förstudien från 2000 [50] överensstämmer med visionen som redovisats under intervjuerna, nämligen att utöka tillgänglighet och användbarheten för URs material (8 av 9 respondenter). Att gå ifrån det traditionella tänkandet där programmen är knutna till sändningsögonblicket var också önskvärt, (4 respondenter) likaså att göra UR till en aktör på utbildningsmarknaden (1 respondent). En viktig kommentar som är värd att nämnas i sammanhanget är dock att semantisk webb och dess användningar enligt en respondent, bygger på en jämställdhet mellan olika datakällor, och det fanns ursprungligen inte i URs vision för Mediebiblioteket. Har visionen uppnåtts? I vilken grad har den uppnåtts? Sammanlagt kan man säga att visionen utifrån de intervjuades egna perspektiv inte har uppnåtts (7 av 9 respondenter) men enligt 2 av 4 som svarade finns det potential och man är på en god väg. En intervjuad tyckte att UR har kommit en bra bit på vägen och att man inom UR resonerar på ett mycket bredare sätt än man gjorde i början. En annan tycker att UR förstår alla delarna i visionen. Man har realiserat kopplingarna mellan upphovsrätts-, distributions- och produktionsfrågor samt satt dem i förhållande till tillgängligheten tillsammans med de pedagogiska och didaktiska frågorna. Den ursprungliga visionen om tillgänglighet och användning har utökats och består idag av flera delvisioner som är förankrade inom UR och kopplade till andra viktiga verksamhetsfrågor. 6.1.2. Samarbete Hur fungerar samarbetet? Kan man kalla det samarbetet semantiskt? Man kan konstatera att samarbetet finns, men om det är semantiskt det är en svårare fråga. För att nå hela vägen till ett semantiskt samarbete krävs två saker, dels att alla andra aktörer bygger semantiska plattformar och att de också blir medvetna om att det semantiska samarbetet måste genomstyra hela deras organisation. Enligt en respondent har UR insett det och hela organisationen är med i processen på ett helt annat sätt. Samma förankringsprocess måste genomföras hos alla samarbetspartner så att det verkligen ska börja fungera tillsammans. Samtidigt påstår en annan intervjuad, att det är väldigt svårt att få människor att förstå poängen med semantisk webb. En tredje intervjuad uttrycker att kärnan av värdet med den semantiska webben på följande vis: om man kopplar upp saker i ett nätverk så blir det mycket mer värt.
Sidan 40 av 90 Det är ett svårt dilemma eftersom för att få människor att samarbeta och utbyta material måste det finnas goda exampel på framgångsrik användning, helst inom företagets eget verksamhetsområde. Ska UR vara mer aktiv i initieringen av samarbeten, ska samarbetet vara semantiskt? De intervjuade tyckte olika i den frågan och eftersom samarbetet är en viktig del i URs verksamhet för att nå slutanvändare på bästa möjliga vis, sades bland annat följande: att UR är ett kunskapsföretag och ska vara en av aktörerna i utbildningssamhället. UR måste kunna samverka kring tillgänglighetsfrågorna (3 av 9 intervjuade) annars kommer man aldrig att nå användarna. Respondenternas uttalanden pekar inte nödvändigtvis på att man måste samarbeta semantiskt (4 av 9 intervjuade), utan är mer inriktat på gemensamma satsningar. Däremot är man inte lika positiv till att UR tar initiativet till semantiskt samarbete utifrån ett auktoritärt perspektiv (2 av 9 intervjuade), där UR självt bestämmer mallen efter vilken andra ska följa. Intrycket från intervjuerna är att URs mål att nå ut till användarna är det primära, tekniken för detta är sekundär. Det innebär att om den semantiska tekniken hjälper UR att nå målet så ska den användas, annars skall alternativa lösningar tas fram. Man anser också att det är troligt att det kommer att finnas krav på att UR kan delta i samarbeten baserade på olika tekniska standarder och lösningar, inte enbart semantiska sådana. UR har varit före andra i implementationen, ska man därför se det som en investering i ett möjligt semantiskt samarbete? Man ser den nuvarande tekniska lösningen som en sorts investering i framtida samarbeten som kommer att hjälpa till i tillgänglighetsfrågorna, dock används inte den semantiska funktionaliteten idag till någonting alls. Respondenterna betonar (2 intervjuade) att UR genom satsningen på semantisk webb har byggt upp viktig kompetens och har ändrat synsätt på URs framtida roll. URs samarbete kan förbättras. Ska det ske enbart via semantiska kanaler? En förbättring av samarbetet är önskvärt, men det ska inte nödvändigtvis vara semantiskt (4 av 9 respondenter), eftersom medvetandet hos andra möjliga samarbetspartners för närvarande saknas och därför ska man inte begränsa sig till samarbeten som bara kan ske via semantiska kanaler för att nå längre. Ett starkare samarbete är önskvärt men man hade ingen tydlig bild av hur det skulle gå till. 6.1.3. Semantiska fördelar och nackdelar med den nuvarande tekniska lösningen En del nackdelar har tagits upp varav många korresponderar till svagheter identifierade i den tekniska utvärderingen [41]. Bland dessa märks prestanda, skalbarhet och det faktum att några respondenter ansåg att UR idag inte använder systemet på ett semantiskt vis. I tillägg pekar den tekniska utvärderingen på ett antal systemtekniska och organisatoriska brister som allvarligt kan påverka URs praktiska möjligheter att driva systemet vidare. Inom UR finns nu en förståelse för att man initialt måste fokusera på att få de interna behoven tillgodosedda. Samtidigt definierar man en rad fördelar, så som styrka med att utveckla systemet med en öppen källkod, flexibilitet, möjligheter att påverka, förändra och anpassa till andra system i vilket stadium som helst. Dock fanns det en tveksamhet till hur lätt det är att i praktiken uppnå de här fördelarna. En annan viktig fördel är att vara enablad för semantisk samverkan: Man är future-enablad, man fasas inte ut så lätt. Många påpekade dock att för att följa det semantiska spåret behövs det en del förändringar, inte minst eftersom den semantiska teknologin har utvecklats snabbt sedan UR fattade beslut om teknisk plattform.
Sidan 41 av 90 Sammanfattningsvis upplever UR att även om den utlovade funktionaliteten finns på plats så är den inte alltid så lätt att använda i en skarp driftmiljö med tusentals användare och med alla de krav som följer av det. 6.1.4. Märker användare semantiska fördelar i nuvarande sökgränssnitt? I nuvarande lösning finns det inte någon möjlighet för att användare att uppleva utlovade semantiska fördelar (9 av 9 respondenter håller med om det), sådana som t.ex. att söka på kontext eller att kunna annotera URs program. Respondenterna hade en rad idéer på hur de problemen kan åtgärdas, bland annat: ett nytt sökningsgränssnitt, tydligt definierade kontextsökningsmöjligheter efter att användaren har gjort den första fritextsökningen och annoteringsfunktioner utifrån portföljer. Resultaten från intervjuerna överensstämde i princip med resultatet från användbarhetsstudien som har pekat på betydande svagheter med nuvarande sökgränssnitt [46]. 6.1.5. Semantisk teknologi Semantisk webb tycks vara ett medel för att vara framtidsmedveten och man pekar på följande fördelar: flexibilitet, möjlighet att strukturera på ett sätt som tidigare var omöjligt, att integrera maskiner med informationsbehandlingsprocessen på en annan nivå och att kombinera egna strukturer med andras. Nackdelarna är dock fortfarande att det saknas standarder för alla områden, att de verktyg som existerar både ligger tidigt i utvecklingsfas och att tekniska applikationer och gränssnitt saknar tydliga implementationer i praktiken. Primära användningsområden för semantisk webb anser man ligger inom utbildning och e-handel, men även informationssökning. Om tidsaspekterna på utveckling och tillämpning hade respondenterna olika åsikter. Det beror på bland annat organisatoriska aspekter inom företaget samt hur snabbt den semantiska forskningen och teknisk utveckling av verktyg sker. För UR innebär det att man är beroende av att den tekniska utvecklingen drivs vidare, att standarder etableras och accepteras, att fler organisationer upptäcker fördelarna med den semantiska teknologin och att det därigenom går att visa upp bra praktiska exempel på lösningar. Om något av de här momenten saknas riskerar hela utvecklingsområdet att stagnera. Om man jämför med andra stora teknikskiften är det troligt att det tar flera år innan semantisk teknologi är fullt accepterad bland många aktörer och användare. Under intervjuerna framkom en rad skeptiska kommentarer, som är intressanta att ha med. Man tror inte på att det går att hitta en perfekt semantisk struktur för att bygga alla tänkbara relationer mellan alla tänkbara resurser. Ur URs perspektiv borde det innebära följande: UR måste koncentrera sig på att bygga sin samling utifrån de behov och de frågor som användarna förväntar sig ett svar på. 6.2. Återkoppling till rapportens syfte Syftet med vår rapport har varit att beskriva de möjligheter och utmaningar som semantiska teknologier erbjuder för företag som producerar utbildningsmaterial. Som resultat av vår fallstudie har följande potentialer framkommit för företag som producerar utbildningsmaterial: flexibilitet i tekniska lösningar, inget behov att fästa sig vid en lösning eftersom man kan kombinera flera, en möjlighet att strukturera information på ett effektivt sätt och att kombinera egna strukturer med andras. Det finns en stark övertygelse att semantiska teknologier tillåter att vara enablad för framtiden och att man genom att investera i
Sidan 42 av 90 semantiska lösningar är på god väg att samarbeta, utbyta utbildningsmaterial och därigenom nå slutanvändare på ett bättre sätt. I praktiken är fördelarna med semantiska teknologier markant försämrade om man är ensam aktör på markanden och det framgick tydligt från intervjuerna. Metcalfe s Law om ett nätverks effektivitet kan appliceras även på semantisk webb: the usefulness, or utility, of a network equals approximately the square of the number of users of the system (n2). Lagen är enkel att illustrera med ett exempel: A single fax machine is useless, but the value of every fax machine increases with the total number of fax machines in the network, because the total number of people with whom you may send and receive documents increases. [75] Idag beskrivs Mediebibliotekets situation på följande vis: vi har en fax och vi känner inga andra som har faxar överhuvudtaget. Därför tyckte vi att det var viktigt att ta fram andra mer specifika slutsatser för UR, de redovisas nedan. 6.3. Återkoppling till fallstudiens syfte Det fanns ett antal utgångspunkter för fallstudien som kunde besvaras och kan kommenteras: 1. Att redogöra hur den befintliga semantiska lösningen på UR relaterar till övrig semantisk webb UR har koncentrerat sig på att bygga upp en infrastruktur för en semantisk lösning och det finns utrymme att utöka implementeringen och användningen av ontologier (begreppsmodeller). Det behöver undersökas mer och eftersom det framgick tydligt ur intervjuerna att URs roll inte ska vara pådrivande i en framtagning av branschspecifika ontologier så finns det endast en möjlighet - att avvakta att någon annan aktör tar initiativet och därefter stödja denna satsning. I Norge har [55] redovisat en undersökning om den vidare satsningen på utbildningsportaler. Här konstaterar man att en ontologi skall tas fram och att man skall säkerställa att alla använder den. Vem kommer i Sverige att ta motsvarande initiativ för det? Uppmärkning av material UR arbetar med att producera material som riktar sig till en relativt specifik samhällssektor i form av utbildning. De arbetar även primärt med programinnehåll, i form av uppspelningsbart material som inte är textbaserat. Det gör att UR är helt beroende av att märka upp sitt material med metadata för att göra det sökbart, oavsett om man väljer att gå vidare med semantisk webb eller ej. En viktig del för ett bra semantiskt samarbete är en god kvalité på metadata. The organization that has the best information, knows where to find it, and can utilize it the quickest, wins [8] Det finns konkreta förslag i metadatautvärderingen [32] på hur Mediebiblioteket ytterligare kan förbättra och strukturera användningen av ämnesord och därmed säkerställa att URs material blir mer effektivt sökbart. Från djupintervjuerna kan inga slutsatser dras om hur metoden för metadatauppmärkning bör vara utformad.
Sidan 43 av 90 2. Hur semantiska implementeringar bidrar till företagets utveckling Semantiska implementeringar har en stark återkoppling till ursprungliga visionen för Mediebiblioteket att de som så önskar snabbt ska kunna hitta och få tillgång till URs utbud av tv- och radioprogram, webbaserade material och trycksaker [50]. Tillgänglighet och användning som är inte knuten till sändningsögonblicket är nyckelord. 3. Vad finns det för tekniska fördelar respektive nackdelar med att använda en semantisk lösning Tekniska lösningar för semantisk webb ligger generellt tidigt i sin utvecklingsfas. Det finns få kommersiella produkter. Den befintliga open source plattformen är tekniskt omogen och ofullständig, samt tillgodoser inte nuvarande interna behov (sökning, prestanda etc.) till fullo [41]. Dock är den en lösning med en utvecklingspotential för att bygga upp ett framtida samarbete och på ett bättre vis nå ut till slutanvändarna. Genom satsningen har UR som en av få organisationer byggt upp en kompetens inom området. För att komma vidare är det viktigt att UR väljer väg i två avseenden: dels vidareutveckling av den tekniska plattformen, dels hur man praktiskt tänker gå till väga med att kvalitetssäkra användningen av ämnesord i metadata. Under sammanställningen av rapporten har framkommit att UR har beslutat stödja framtagningen av ontologier för branschen, det som några var skeptiska till under intervjuerna. Det finns tre möjliga alternativ för IT plattformens vidareutveckling: 1. att själva utveckla en applikation för intern användning och att bygga ett interface mot semantiska samarbetspartner (via t.ex. Edutella/SCAM) 2. att skaffa en etablerad open source lösning för digitala samlingar och att bygga ett interface mot semantiska samarbetspartner (via t.ex. Edutella/SCAM) 3. att köpa in en lösning för digitala samlingar och att bygga ett interface mot semantiska samarbetspartner (via t.ex. Edutella/SCAM) Fördelar 1 utveckla själva, t.ex. SQL med en bra specifikation får man precis det som saknas idag (prestanda osv.) 2 open source system för digitala samlingar har alla grundfunktionerna på plats, kan självanpassas, finns user community nackdelar dyrt, innebär största risken och UR blir ensam och har ansvar för att driva utvecklingen vidare bygga upp en egen teknisk kompetens för den valda open source lösningen 3 köpa minst riskfyllda strider mot kravet som finns på UR för Mediebiblioteket att använda öppen källkod
Sidan 44 av 90 Möjlighet 1 Enligt intervjuerna är det här det alternativ UR har beslutat sig för att genomföra under hösten 2005. Det vi kommer att bygga i höst blir det vanlig SQL, då kommer vi inte att använda JENA över huvudtaget. Och några delar är redan byggda. Så vi vet att det fungerar, som fungerar bra. Möjlighet 1, andra alternativ En undersökning av aktuella projekt på knowledge management lösningar med koppling till Jena gav bl.a. träff på en intressant programvara [73]. "The Kowari MetastoreTM is an Open Source, massively scalable, transaction-safe, purpose-built database for the storage and retrieval of metadata. Kowari stödjer RDF och har enligt samma källa ett API mot Jena. Potentiellt skulle detta kunna innebära en lösning på både prestanda och postlåsningsproblemen. En review av Kowari finns i [13] Möjlighet 2 och 3 En möjlighet som inte verkar ha utretts varken i den tekniska utvärderingen eller i förstudierna är att använda etablerade, kommersiellt tillgängliga bibliotekssystem (library management systems) t.ex. Ex Libris DigiTool[65], Innovative Interfaces[69], VTLS [93] De tre lösningarna ovan har alla möjlighet att katalogisera och hantera digitala samlingar. Det finns även tillgängliga open source alternativ [68] Ett antal sådana har specifika lösningar för "digital collections". Bland dessa märks t.ex. Fedora [67] och eprints [66]. Den senare är integrerad med ett existerande semantiskt samarbete inom den akademiska världen - Open Archive [90]. Att implementera något av systemen skulle innebära ett alternativ till att UR självt utvecklar ett motsvarande system med de risker och utmaningar som ett sådant projekt alltid innebär. Utmaningen att utåt ge ett sådant system ett Edutella -interface är det samma i båda fallen. En fördel med att utveckla ett Edutella interface för en existerande bibliotekslösning (ev. tillsammans med en existerande user community) är att detta i sig kan skapa goda förutsättningar för att bygga upp en praktisk och fungerande semantiskt samarbete där UR har en aktiv roll. En annan fördel är det användarstöd som en redan fungerande user community kan ge. 4. Vilka möjligheter finns det för att delta i semantiskt samarbete med olika intressenter? De webbsatsningarna UR har genomfört de senaste fem åren är till stor del ämnade att bistå UR i dess arbete med att nå ut till användare. Som användare räknas: Utbildningsanordnare i form av lärare och kursansvariga samt övrig personal inom utbildningssektorn. Till denna grupp är även anordnare för distansutbildningar inräknade. Studenter i de olika stadierna, förskola, låg-, mellan- och högstadiet, gymnasiet och högskola, som använder webben för att finna information inom kunskapsområden. Övriga som söker innehåll för att använda sig av i sina egna informationsframställningar. Att nå ut kan göras på flera sätt och ett effektivt sätt är att göra sig tillgänglig på webben. Det är detta som har lett fram till det som idag utgör Mediebiblioteket, ett arkiv för URs produktioner tillgängligt för användaren i informations- och distributionssyfte. Mediebiblioteket möjliggör för URs användare att söka bland material som UR producerat. Vissa produkter kan direkt
Sidan 45 av 90 användas såsom webbplatser och vissa tv och radioprogram kan ses via en streamingtjänst. Det stora flertalet produkter beskrivs dock bara i Mediebiblioteket och om man väljer att man vill använda sig av denna produktion, exempelvis som lärare för att visa upp för sina elever, så kan det hämtas på närmaste AV-central. En av de ursprungliga idéerna var att materialet ska finnas tillgängligt för distribution via webben. Detta har av ett flertal skäl inte varit möjligt att göra för samtliga produktioner hittills, idag publiceras 10-15 % av producerade program på webben. Två aspekter som är nödvändiga för både vanlig webb och semantisk webb framöver är distributionsmöjligheter och rättighetsfrågor. En fråga som kan ställas, är om Mediebiblioteket fullt ut nått upp till visionen? Dessa citat från respondenter på UR, gällande visionen, är hämtade från intervjuer med personer knutna till Mediebiblioteket ur Bilaga 7: att etablera någon slags... ett slags struktur för hur utbildningsresurser, digitala utbildningsresurser skulle kunna förmedlas på bästa möjliga sätt. tillgänglighet innefattade då att alla grupper skulle ha möjlighet att få URs material till sig att helt enkelt komma ut mer till sina användare att hitta nya vägar ut till sina användare att hitta nya vägar ut till sina användare att öppna upp de här nya perspektiven, så en av drivkrafterna har ju varit att få in användarna i en, så att säga, dialog med materialet Det har hela tiden varit stort användarfokus vi ser det som många personen kan uttrycka sig om samma resurs, att man får ett levande rymd av annotationer och påståenden kring de här programmen Men det var att göra programmen tillgängliga för i första hand skolor och institutioner då men också för allmänheten att det skulle vara bara ett arkiv men det skulle vara sökbart på ett mycket vettigare sätt, än bara fritext De uttrycker alla en önskan att nå användare. Till viss del även att nå dem på nya sätt, och vara tillgängliga. Här kan nog i dagsläget konstateras att det finns mer att göra inom detta. Mediebiblioteket som det ser ut idag når användare. Dock måste användaren först finna UR, för att finna de resurser som är tillgängliga. Det skulle kunna tänkas vara önskvärt att nå ut med material för att visa att UR finns. De satsningar som genomförts pekar UR åt rätt håll, men använder idag en liten del av dess potential. Idag möjliggörs detta genom användning av RDFS. Dagens användning når inte ända upp till visionen, men innehåller de delar som bör ligga till grund, för att nå den. Vidare arbete med strukturer skulle kunna bredda användningen, dels mellan samarbetspartner, men även för användare. En modell som finns att utgå från, för att beskriva de olika stegen man kan befinna sig i inom semantisk webb, är den Ambjörn Naeve presenterar i sin publikation The Human Semantic Web [21]:
Sidan 46 av 90 Semantic Isolation: XML (or other semantically free formats). Document-based descriptions. Closed description spaces. Fixed metadata set (tags and values). Databases with entry-portals. No joint searching (inter-search). Semantic Coexistence: RDF(S). Graph-based descriptions. Open description spaces. Freely evolving metadata (tags and values). Databases with Edutella connections. Joint searching (inter-search) with static queries. Retrieval. Semantic Collaboration: Ontology management systems. Ontology mappings. Contextualization. Controlled evolution of metadata. Joint searching (inter-search) with dynamic queries. I denna indelning kan man placera UR under Semantic Coexistance. Semantic Coexistance möjliggör samarbete till viss utsträckning, och fungerar i sammanhang där användaren är införstådd i strukturen. Edutella är exempel på sådan struktur, där är innehållsproducenterna givna, och märker upp sitt material så att det är sökbart i Edutella. Användaren måste dock hitta dit för att kunna söka upp material där. Det Semantic Collaboration kan medföra är att sammanhanget vidgas till att infatta även de användare som inte är införstådda i strukturen, i och med att den information som existerar inom domänen är beskriven i större utsträckning och kan innefatta flera producenter som märker upp sitt material, så tillåts oväntat samarbete att uppstå. Användare som inte redan känner till de olika producenterna kan hitta dem i sitt sammanhang. Att kunna existera i Semantic Collaboration är troligtvis önskvärt för UR. I och med att UR har en väl utvecklad plattform för semantisk webb bör UR delta i möjligt uppbyggande av ontologier. Detta kommer att innebära ett aktivt deltagande i det initiativa samarbetet. Att delta i uppbyggande av ontologier, som möjliggör Semantic Collaboration, innebär dock en stor arbetsinsats som bör avvägas mot de resultat som utlovas. De samarbeten som är intressanta att bygga på existerar redan idag. Det är värt att överväga att bygga ut dessa ytterligare, och stärka dem. Detta skulle kunna bidra med större användning för slutanvändare, så väl som aktörer emellan.
Sidan 47 av 90 En självklar målgrupp för UR är utbildningsanordnare. Att kunna existera i deras kontext är även något som arbetas på, och som kan finna vägar inom semantisk teknik. UR har varit tidiga i att adaptera semantisk teknik. Om detta är ett hinder eller en möjlighet återstår att se. 5. Att studera en ny teknologi i praktiken, vilka utmaningar innebär ett sådant åtagande för företaget? Enligt Gartner Groups Hype Cycle [88], en grafisk beskrivning av of the maturity, adoption and business application of specific technologies finns det 5 faser i utvecklingen: 1. "Technology Trigger" The first phase of a Hype Cycle is the "technology trigger" or breakthrough, product launch or other event that generates significant press and interest. 2. "Peak of Inflated Expectations" In the next phase, a frenzy of publicity typically generates over-enthusiasm and unrealistic expectations. There may be some successful applications of a technology, but there are typically more failures. 3. "Trough of Disillusionment" Technologies enter the "trough of disillusionment" because they fail to meet expectations and quickly become unfashionable. Consequently, the press usually abandons the topic and the technology. 4. "Slope of Enlightenment" Although the press may have stopped covering the technology, some businesses continue through the "slope of enlightenment" and experiment to understand the benefits and practical application of the technology. 5. "Plateau of Productivity" A technology reaches the "plateau of productivity" as the benefits of it become widely demonstrated and accepted. The technology becomes increasingly stable and evolves in second and third generations. The final height of the plateau varies according to whether the technology is broadly applicable or benefits only a niche market. Enligt samma källa är bedömningen att den semantiska webben år 2004 befann sig i fas 2. Peak of inflated expectations [26]. Detta stöds av att det under tiden 2001-2003 gavs ut många fackböcker inom detta område. Om denna modell är korrekt kommer intresset i media för semantisk webb att minska under 2005 och framåt. Samtidigt kommer fler projekt att fullbordas och förhoppningsvis bevisa sin användbarhet i praktiken. Om framgång nås kommer den praktiska användningen att öka samtidigt som de tekniska lösningarna mognar när verkliga användarkrav leder till en bättre funktionalitet, större stabilitet och enklare IT-drift. Något estimat för hur många år denna process kan ta ingår inte i Gartners modell. När en ny teknologi befinner sig i "The peak of inflated expectations" är det lätt att svepas med av euforin kring den och man kan lätt förledas att tro att "alla" redan imorgon kommer att använda den nya tekniken till fullt ut enligt den vision som delas av många entusiaster. Erfarenheten visar att så inte är fallet. Det tar tid för företag och organisationer att till fullo förstå hur den nya tekniken i praktiken kan göra deras verksamhet bättre. Det tar tid att i
Sidan 48 av 90 praktiken utveckla applikationer som är användbara för vanliga icke-tekniska användare. Det tar tid för användarna att förstå hur de nya applikationerna kan göra deras vardag bättre. UR har tidigt satsat på att bygga upp egen kompetens inom ett område som verkar lovande för URs framtida utveckling. Det innebär inte att det finns en garanti för att just den semantiska tekniken är den som kommer att nå ett allmänt genombrott på marknaden och det finns heller inte någon garanti för att ett sådant genombrott kommer inom de närmaste åren. Oavsett vilket så finns behoven av en effektivare sökmekanism kvar och UR har genom sin satsning skaffat sig förståelse för användarnas problem, formulerat en vision och har ett öppet förhållningssätt till val av teknik. Det gör att man idag har en större handlingsfrihet för att göra framtida teknikval och står i en starkare position än om man hade valt att avvakta den tekniska och semantiska utvecklingen innan man gjort någon satsning. Det finns konkret ett antal hinder för att semantisk webb ska tas i bruk allmänt [20]: svårigheter att i praktiken bygga relevanta ontologier som många är överens om för få aktörer med metadata i RDF format och hinder för användaren att komma åt dessa det saknas enkla verktyg för att skapa och underhålla RDF-data (jämför html editors) liten användning av annoteringar Områden som skulle dra speciellt stor nytta av lösningar baserade på semantisk webb bedöms av [20] vara: Information management Digitala bibliotek Communities och datorstött samarbete E-lärande
Sidan 49 av 90 6.4. Rekommendationer Baserad på det redovisade materialet har vi kommit fram till två olika uppsättningar med rekommendationer. Först följer det en rad konkreta rekommendationer som UR kan ta del av, sedan mer allmänna. Rekommendation 1 Baserat på resultatet av intervjuerna och slutsatserna kan man ta fram en rad konkreta rekommendationer som skulle vara till hjälp för UR. att bygga klart IT-plattformen så att funktionella krav och driftkrav tillgodoses. att genomföra rekommendationerna i utredningen om kvalitetssäkring av ämnesord i metadata [32]. att fortsätta med en strategi för hur UR ska bidra till utvecklingen av ontologier. att genomföra rekommendationerna i användbarhetsutredningen [33] att överväga utökning av sökgränssnittet som t.ex. i ARKive [57], där användare kan välja kontext utifrån först gjorda fritextsökningar. Sökgränssnittet har där även en bra visuell struktur. att marknadsföra lösningen i första hand på den egna webbplatsen. Förklara tydligt för användare vilka fördelar Mediebiblioteket har utifrån sökperspektivet. att visa upp den praktiska nyttan av att använda t.ex. annoteringar och portföljer, börja med att internt skapa entusiasm över att UR är bland de första att använda semantisk teknik i Sverige och Europa. att öka användningen av portföljer i undervisningen, genom att rekrytera flera intresserade lärare, börja först med teknikintresserade lärare, därefter det pedagogiska innovatörerna. fokusera inte bara på färdigplockade portföljer som UR själv gör, utan använd de som ett exampel på hur det kan göras och användas. skapa ett nätverk av lojala och entusiastiska lärare som kan dela med sig erfarenheter. UR ska stödja dem i den frågan. Tydliga steg för steg hjälpinstruktioner måste finnas för teknik rädda. när det finns bra exempel på lärarnas användning av portföljer och annoteringar så bör PR aktiviteter användas för att publicera artiklar i facktidskrifter plus exponering på URs hemsida. Publicera löpande success stories på URs hemsida. När det finns ett antal dokumenterade success stories så är det också en god grund för att aktivt kunna rekrytera flera samarbetspartners inom området. UR måste då vara beredda att stödja dessa med att bygga motsvarande satsning som UR.
Sidan 50 av 90 Rekommendation 2 URs satsning i semantisk webbteknik har stor potential att utvecklas, och bör av det skälet få möjlighet till detta. Det är en förutsättning för den semantiska webben, att företag och användare måste bygga verktyg, bidra med innehåll och använda det innehållet. Detta nämndes i kapitel 1.4. På motsvarande sätt innebär det en fördel för ett företag som vill satsa på en teknik man finner användbar, att börja använda sig av tekniken, för att bidra till att stärka teknikens ställning. Att tidigt adaptera teknik och använda sig av den, kan i förlängningen betyda att man vara med och påverka i dess utveckling. Detta gäller särskilt när man som företag är aktiv i samarbeten som gemensamt ämnar bygga förutsättningar för en domäns existens på webben. Ovan nämns även områden som drar speciellt stor nytta av lösningar baserade på semantisk web. Information management, Digitala bibliotek, Communities & datorstött samarbete och E- lärande. Av dessa områden kan man räkna att de två första är delar som ingår i URs verksamhet idag, och de två senare är önskvärt för UR att existera som aktör inom. Ett stort bidrag till den nödvändiga kompetensen för att implementera tekniken i Mediebiblioteket, har varit KMR gruppen och en del externa konsulter. Det har fungerat som en språngbräda in i tekniken. För att kunna tillåta att satsningen utvecklas vidare, kommer den interna kompetensen behöva höjas ytterligare, alternativt blandas upp med utomstående projektanställda som kan fungera som stöd för samtliga samarbetspartners om samarbete ska utvecklas vidare. Det kan innebära fortsatt arbete med KMR eller andra intressenter som besitter kompetens. Man kan se att delar av utbildningssektorn strävar mot att integrera mer material i form av digitala lärresurser. Det är en klar trend bland högskolor, där man även finner distansutbildningar. Följande utdrag är hämtat från förstudien Tillgång till digitala lärresurser inom högskolan, [19] utförd på uppdrag av Myndigheten för Sveriges nätuniversitet. Gemensamma generella urvalskriterier är att resurserna ska vara digitala, gärna webbaserade och i vissa fall även ha ett pedagogiskt värde eller ett pedagogiskt syfte. I ett längre perspektiv åsyftas inte bara tillhandahålla ett verktyg för att enkelt kunna söka och publicera lärresurser. En central tanke är också att främja utbyte av erfarenheter och kompetens i ett nätverk: / / a place where teaching colleagues can meet to share content, materials, and discussions about effective materials or teaching strategies [72]. Det kan anses vara eftersträvansvärt även för UR.
Sidan 51 av 90 7. Diskussion UR är ett public service bolag med en stark ställning inom produktion och distribution av utbildningsmaterial i Sverige. Man har regeringens uppdrag att samverka och samarbeta med andra för att göra sitt material så tillgängligt och användbart som möjligt inom målgruppen. Det gör att man inte kan dra direkta paralleller mellan fallstudiens resultat och kommersiella företag utan att noggrant undersöka förutsättningarna. Bland kommersiella företag ställs hårdare ekonomiska krav och utbyte av material sker på affärsvillkor genom olika försäljningskanaler. Däremot kan man se likheter med andra aktörer inom offentlig sektor som har stora digitala samlingar och som på liknande vis har i uppgift att göra sitt material tillgängligt. Rapporten saknar en finansiell uppskattning på hur mycket systemet kostar i implementation och drift och hur mycket andra resurser som projekt MB.Alfa har krävt. I ett kommersiellt sammanhang är det en avgörande faktor som måste utredas. URs Mediebibliotek är ett bra exampel på hur en ny teknologi tas i drift, vilka för- och nackdelar som finns samt hur samspelet mellan forskningsvärlden respektive den praktiska användningen fungerar. Gartners Hype Cycle modell placerar semantisk webb tidigt i sin utveckling och det kommer att ta ytterligare ett antal år innan tekniken är mogen för bredare användning. Om, och när semantisk webb får sitt genombrott kommer kommersiella aktörer att erbjuda bättre, stabilare och enklare verktyg och applikationer. Euforin kommer att lägga sig och människor kommer att ha en mer sober syn på möjligheterna respektive de problem som semantisk webb ger upphov till. De praktiska erfarenheterna från URs implementationsarbete under tiden 2002-2005 är den del av fallstudien som har bredast tillämpning. Erfarenheten är att det är krävande att försöka implementera en semantisk webb lösning med de verktyg som finns tillgängliga idag, speciellt i en driftmiljö. Plattformen saknar funktioner och stabilitet men kan trots allt fås att fungera. En fördel med det är den kompetens som byggs upp inom företaget under processen. En viktig erfarenhet från URs arbete är att det för användarna är svårt att se skillnaden mellan ett semantiskt samarbete baserat på ontologier och ett mer traditionellt samarbete byggt på utbyte av metadata, vilket fungerar praktiskt om än i en mer begränsad omfattning än visionens. Portföljer och annotationer är de funktioner som lovar störst användarnytta. Portföljer har hittills fått en begränsad användning inom målgruppen medan annotationer ännu inte implementerats. Det gör att de här två funktionerna bör utvärderas separat när det finns tillräcklig erfarenhet bland användarna för att dra praktiska erfarenheter. En annan slutsats från undersökningen av Mediebibliotekets sökgränssnitt är att det är svårt att använda och att de semantiska fördelarna inte är uppenbara för användaren. Undersökningen av externa projekt visar att sökgränssnitten behöver mer utvecklingsarbete men något enstaka bra exempel visar på möjliga utvecklingsvägar. Djupintervjuer var en bra metod för att skaffa förståelse för varför Mediebiblioteket har en semantisk struktur, vad det har resulterat i och om Mediebiblioteket är en semantisk tillämpning. Metoden har belyst utmaningar och förutsättningar i praktiken för en teknik i tidig fas. Under arbetets gång har två olika perspektiv utvecklats: dels ett som fokuserar på praktisk implementation av semantisk webb idag med utgångspunkt i URs erfarenheter. Här ligger tyngdpunkten på att få ordning på den teknikiska plattformen och sedan behålla och vidareutveckla semantiken utåt med hjälp av ett antal applikationer som finns och fungerar idag (SCAM och Edutella). Det perspektivet leder fram till ett antal konkreta rekommendationer som är praktiskt genomförbara i närtid. Det andra perspektivet är mer allmänt fokuserat på vikten av att bygga goda exempel på den nya tekniken för att säkerställa att fler organisationer bygger motsvarande satsningar samt att reda i
Sidan 52 av 90 de möjligheter som tekniken medför idag, och vad som kan vara möjligt vid vidare påbyggnad av semantisk struktur. Här är tidsperspektivet en aspekt som bör tas hänsyn till. Det är många pusselbitar som ska på plats för att nå full kapacitet av tekniken. Tidsaspekten är inget vi spekulerat i, detta är en avvägning för företag aktiva inom området. De rekommendationer som ges här försöker peka på dels de beslut som redan fattats och hur de står sig idag och visa möjliga steg att ta närmast. Vi ser det som en berikande mångfald eftersom det ger en ansats för URs planering på både kort och lång sikt.
Litteraturlista Artiklar och böcker [1] Antoniou, G & van Harmelen, F, (2004) A Semantic Web Primer, The MIT Press, USA, ISBN: 0-262-01210-3 [2] Berners-Lee, T. (1997) Metadata architecture. http://www.w3.org/designissues/metadata.html 2005-05-30 [3] Berners-Lee, T. (1998) Semantic Web Road map. http://www.w3.org/designissues/semantic.html 2005-05-30 [4] Berners-Lee, T. (1998) What the semantic web can represent. http://www.w3.org/designissues/rdfnot.html [5] Berners-Lee, T., Hendler, J., Lassila O. (2001) The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. http://www.scientificamerican.com/article.cfm?articleid=00048144-10d2-1c70-84a9809ec588ef21 [6] Bostrom, J. (2005) Berners-Lee seeks killer app for Semantic Web http://www.thestandard.com/internetnews/001301.php [7] Bray, T (1998, updated 2001) What is RDF. http://www.xml.com/lpt/a/2001/01/24/rdf.html 2005-06-03 [8] Daconta, M., Obrst, L., Smith, K.(2003) The Semantic Web : a guide to the future of XML, Web services, and knowledge management. Indianapolis, IN. Wiley Publications [9] Dingley, A.& Shabajee, P. (2001) Use of RDF for content re-purposing on the ARKive project. Advanced Learning Technologies, 2001. Proceedings. IEEE International Conference on 6-8 Aug. 2001 Page(s):199 202
[10] Editor: Brantner, S. ELENA. Creating a Smart Space for Learning. http://www.elena-project.org/images/other/d4_4.pdf [11] Editor: Gilbane, F. (1999) The Gilbane report. The IMS, Metadata, And webbased Learning Resources Vol. 7, No. 7 July/August, 1999 http://www.gilbane.com/artpdf/gr7.7.pdf [12] Editors: McGuinness, D.L & van Harmelen, (2004) F OWL Web Ontology Language Overview W3C Recommendation 10 February 2004 W3C (MIT, ERCIM, Keio) http://www.w3.org/tr/owl-features [13] Ford, P. A (2004) First Look at the Kowari Triplestore. http://www.xml.com/pub/a/2004/06/23/kowari.html [14] Gruber, T (1993) Towards Principles for the Design of Ontologies Used for Knowledge Sharing Stanford Knowledge Systems Laboratory http://tomgruber.org/writing/onto-design.pdf [15] Hendler, J. (2003) Science and the Semantic Web. Science, Vol 299, Issue 5606, 520-521, 24 January 2003 [16] Hillmann, D.(2003) Using Dublin Core. http://dublincore.org/documents/usageguide/#whatis [17] Hyvönen, E., Junnila, M., Kettula, S., Mäkelä, E., Saarela, S., Salminen, M., Syreeni,A., Arttu Valo, Viljanen, K. (2004) Finnish Museums on the Semantic Web: The user s Perspective on MuseumFinland. http://www.archimuse.com/mw2004/papers/hyvonen/hyvonen.html [18] The Internet Society (2004) Uniform Resource Identifier (URI): Generic Syntax http://gbiv.com/protocols/uri/rev-2002/draft-fielding-uri-rfc2396bis-07.html 2005-06-02 [19] Jandér, K (2005) Tillgång till digitala lärresurser inom högskolan -en förstudie Myndigheten för Sveriges nätunivesitet http://www.myndigheten.netuniversity.se/download/2514/x/f%f6rstudie_org.pdf [20] Matthews, B. (2004) Semantic Web Technologies http://www.jisc.ac.uk/uploaded_documents/jisctsw_05_02pdf.pdf
[21] Naeve, A., Knudsen, C., Nilsson,M., Palmér,M., Paulsson, F.(2002) En publik e-lärandeplattform. Byggd på kunskapsmångfalder, öppen källkod och öppna itstandarder. http://kmr.nada.kth.se/papers/semanticweb/natuniv-kmr.pdf [22] Naeve, A. (2005) The Human Semantic Web Shifting from Knowledge Push to Knowledge Pull, International Journal of Semantic Web and Information Systems (IJSWIS), Vol. 1, No. 3, pp. 1-30, July-September 2005. [23] Nilsson, M (2001) The Semantic Web: How RDF will change learning technology standards. http://kmr.nada.kth.se/papers/semanticweb/cetissemweb.pdf [24] Noy, N. F & McGuinness, D. L (2001) Ontology Development 101: A Guide to Creating Your First Ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880, March 2001. http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf [25] Palmér, M., Naeve, A., Paulsson, F.(2004) The SCAM Framework: Helping Semantic Web Applications to Store and Access Metadata http://kmr.nada.kth.se/papers/semanticweb/scam-esws.pdf [26] Passin, T. B. (2004) Explorer s guide to semantic Web, Manning Publications Co. USA, ISBN: 1-932394-20-6 [27] The Gartner Group(2004) Top 10 Strategic Technologies for 2005.Gartner Symposium ITXPO, March 28 - April 1, 2004, San Diego Convention Center, San Diego, California. [28] Williamson, B. & Miller,L. (2003). The semantic web. A touch of intelligence for the internet? http://education.guardian.co.uk/elearning/story/0,10577,981948,00.html 2005-06-07 [29] Wilson,S.,Currier,S. (2002) What is IMS Content Packaging? http://www.jiscinfonet.ac.uk/resources/external-resources/cpbrief.pdf [30] W3C (2003) 21 Metadata Recommendation 21 http://www.w3.org/tr/svg/metadata.html 2005-06-02
[31] W3C (2004) Architecture of the World Wide Web, Volume One, W3C Recommendation 15 http://www.w3.org/tr/webarch/#identification 2005-06-01 Övrigt relevant material [32] Andersson, A. (2005) Metadata i Mediebiblioteket. Nyckelord och SAB-klassning. [33] Axbom, P. (2004) Resultat från användbarhetstest. Mediebiblioteket på Utbildningsradion [34] Broady, D.(2003) Märkning av utbildningsinnehåll. Projektbeskrivning http://www.skeptron.ilu.uu.se/broady/dl/mu-plan-030919.pdf [35] Frid, J. Nässén, H. (2004-10-03) MUCS Begreppsmodell 1.0 [36] Hallén, M. (2005-05-30) Användning av visuella lärobjekt i undervisningen.ur http://www.ur.se/mb/pdf/texter/visuella_objekt.pdf 2005-05-30 [37] Hansen, S. (2005-05-23) Workshop med Utbildningsradion - utställningskurs på webben? http://www.riksutstallningar.se/templates/article 5194.aspx 2005-06-07 [38] Henriques, J. (2001-10-16) URs projektplan 2001-2002 [39] Justitiedepartementet L6.Yttrandefrihetsgrundlag (1991:1469). http://www.notisum.se/rnp/sls/fakta/a9911469.htm 2005-05-30 [40] Karlberg,P.(2003-11-21) Myndigheten för skolutveckling. Presentation http://utbytet.skolutveckling.se/mjukis/start.jsp?vp=za2zd35 [41] Karlén, M.(2004). UR Mediebibliotek Teknisk utvärdering.
[42] Kulturdepartementet (2004-12-16) Anslagsvillkor för Sveriges Utbildningsradio AB för år 2005 http://www.regeringen.se/content/1/c6/03/64/33/5fb83092.pdf 2005-05-30 [43] Kulturdepartementet.Radio- och TV-lag (1996:844). http://www.notisum.se/rnp/sls/lag/19960844.htm 2005-05-30 [44] Kulturdepartementet (2001-12-20) UR. Tillstånd att sända ljudradio och television. http://www.ur.se/ur/docs/pages/144/83/83-22_sandningstillstand2002_2005.pdf 2005-05-30 [45] Melander, O.(2005) Att bygga lärobjektstruktur med hjälp av resursarkiv. Examensarbete [46] Mediebiblioteket (2004-07-01) Dokumentation. Version 1.0. [47] Museifönstret- - en webbportal för skolan. Presentation http://mjukis.skolutveckling.se/mjukis/start.jsp?vp=za17zd102 [48] Naeve, A. (2003-06-18) Lärmiljöer på den semantiska webben. Presentation. [49] Nässén, H. (2002-08-19) Alfa.MB [50] Smedberg, C. (2000-01-31) Digitalt mediebibliotek. Förstudie och lägesrapport. [51] Thomas, F.(2003-10-19) Något om metadata, lärresurser/-objekt och URs SCAM databas. [52] UR. Historik http://www.ur.se/ur/start.php?s1=omur&s2=historik 2005-05-30 [53] UR.Verksamhetsberättelse. Årsredovisning 2004. http://www.ur.se/ur/docs/pages/144/83/83-262_verksamhetsber_04.pdf 2005-05-30
[54] UR. Uppdrag. http://www.ur.se/ur/start.php?s1=omur&s2=uppdrag 2005-06-07 [55] Utdanning-og forskningsdepartementet. Forslag til en samlet portalstrategi for utdanningssektoren 2005 2008. Rapport [56] Wirlöf, H. (2000-01-31) Rapport förstudie av Mediebiblioteket för UR. Relevanta webbplatser: [57] ARKive. Images of the world http://www.arkive.org/ 2005-06-09 [58] BRICKS Project. Building resources for Integrated Cultural Knowledge Services. http://www.brickscommunity.org/discussion_area/reports 2005-06-07 [59] BRICKS. Building Resources for Integrated Cultural Knowledge Services. Presentation http://www.brickscommunity.org/discussion_area/reports/info.zip/file_view [60] Chimaera http://www.ksl.stanford.edu/software/chimaera 2005-06-02 [61] Dublin Core http://www.dublincore.org/about 2005-06-02 [62] Dublin Core Metadata Element Set (2004) Version 1.1: Reference Description http://dublincore.org/documents/dces/ [63] ELENA- PROJECT-ORG. About the project http://www.elena-project.org/en/index.asp?p=1-1 2005-06-07
[64] The ELENA Smart Space for learning http://www.hcm-online.com/ubp 2005-06-07 [65] ExLibris.DigiTool http://www.exlibrisgroup.com/digitool.htm 2005-06-10 [66] Features of GNU EPrints http://software.eprints.org/features.php 2005-06-10 [67] Fedora http://www.fedora.info 2005-06-10 [68] Infolibrian http://www.infolibrarian.com/soft.htm 2005-06-10 [69] Innovative Interfaces.Millenium Digital collections http://www.iii.com/mill/digital.shtml 2005-06-10 [70] Jena 2 - A Semantic Web Framework. http://www.hpl.hp.com/semweb/jena2.htm 2005-05-31 [71] Jena2 Database Interface - Release Notes http://jena.sourceforge.net/db/index.html 2005-06-07 [72] JORUM http://www.jorum.ac.uk 2005-06-07
[73] Kowari Metastore http://kowari.sourceforge.net 2005-06-10 [74] Knowledge Extraction & Semantic Interoperability (KESI) (WP5). Cluster page http://www.delos.info/wp5.html 2005-06-07 [75] Metcalfe's law: Wikipedia http://en.wikipedia.org/wiki/metcalfe's_law 2005-06-08 [76] MuseoSuomi http://museosuomi.cs.helsinki.fi/ 2005-06-06 [77] Ontolingua http://www-ksl-svc.stanford.edu [78] OWL Web Ontology Language Overview. W3C Recommendation 10 February 2004 http://www.w3.org/tr/owl-features/ 2005-06-04 [79]Personal Data Interchange http://www.imc.org/pdi/ 2005-06-07 [80] Project Edutella home page. http://edutella.jxta.org/ 2005-06-04 [81]Protégé -2000 http://protege.stanford.edu 2005-06-07
[82]RDF primer. http://www.w3.org/tr/2004/rec-rdf-primer-20040210/ 2005-06-08 [83] RDQL - A Query Language for RDF. W3C Member Submission 9 January 2004 http://www.w3.org/submission/2004/subm-rdql-20040109/ 2005-06-04 [84] SCAM. Standardized Content Archive Management http://scam.sourceforge.net/ 2005-05-31 [85] SCULPTEUR.Semantic and content-based multimedia exploitation for European benefit. http://www.sculpteurweb.org/html/vision.htm 2005-06-06 [86] Svenska läromedel på Internet http://www.sli.se/ 2005-06-07 [87] SWAD-Europe: Semantic web applications - analysis and selection Appendix B - Application Survey http://www.w3.org/2001/sw/europe/reports/open_demonstrators/hp-applicationssurvey.html#arkive%20internal 2005-06-07 [88] Understanding Hype Cycles.The Gartner Group http://www.gartner.com/displaydocument?doc_cd=121844 2005-06-10 [89] The Knowledge Management Research Group http://kmr.nada.kth.se/ 2005-05-31 [90] The Open Archives Initiative. Protocol for Metadata Harvesting http://www.openarchives.org/oai/openarchivesprotocol.htm 2005-06-10
[91] Uniform Resource Identifier (URI): Generic Syntax. The Internet Society (2005) http://www.gbiv.com/protocols/uri/rfc/rfc3986.html 2005-06-04 [92] University of Southhampton. Press release. 2005-05-18 http://www.soton.ac.uk/press/pressreleases/name,6055,en.php 2005-06-06 [93] Visionary Technologies in Library Solutions http://www.vtls.com/products/ 2005-06-10 [94] WebDAV resourses http://www.webdav.org/ 2005-06-04 [95] WG12: Learning Object Metadata http://ltsc.ieee.org/wg12/ 2005-06-07 [96] Wildscreen. http://www.wildscreen.org.uk/index.html 2005-06-07 [97] World Wide Web Consortium http://www.w3.org 2005-06-02
Bilagor Bilaga 1 Denna bilaga är hämtad från Explorer s guide to semantic web [26 s.162] OWL classes and properties Detta är en lista på de klasser och egenskaper som OWL definierar. Namnen avslöjar till viss del deras användning. Namn Skrivna med fet stil innebär att dessa bara finns definierade för OWL DL och OWL Full, inte för OWL Lite. Namn skrivna med kursivt används i OWL Lite, men med samma restriktioner. Classes Properties owl:alldifferent owl:allvaluesfrom owl:class owl:backwardcompatiblewith owl:datarange owl:cardinality owl:datatypeproperty owl:complementof owl:deprecatedclass owl:differentfrom owl:deprecatedproperty owl:disjointwith owl:functionalproperty owl:distinctmembers owl:inversefunctionalproperty owl:equivalentclass owl:nothing owl:equivalentproperty owl:objectproperty owl:hasvalue owl:ontology owl:imports
owl:restriction owl:incompatiblewith owl:symmetricproperty owl:intersectionof owl:inverseof owl:maxcardinality owl:mincardinality owl:oneof owl:onproperty owl:priorversion
Bilaga 2 Denna bilaga är hämtad från Explorer s guide to semantic web [26 s.157] RDFS klasser rdfs : Resource - The Resource class rdfs: Class - The class of classes rdf: Property - The class of RDF properties rdfs:literal -The class of literal values (strings and integers) rdfs:xmlliteral -The class of XML literal values rdf: Statement - The class of RDF statements rdfs: Container -The class of Containers rdf: Bag -The class of unordered containers rdf: Seq - The class of ordered containers rdf: Alt -The class of containers of alternatives rdfs: Container -The class of RDF containers rdfs: ContainerMembershipProperty - The class of container membership properties (rdf:_l, rdf:_2, and so on) rdf: list -The class of RDF lists These classes, along with the standard properties listed below, have enough expressive power to delineate ontologies bur not enough to express many constraints or logical properties for them. RDFS also defmes certain standard properties and uses certain RDF properties, shown here: rdf: type -Gives the class of a resource rdfs: subclassof -States that a class is a subclass of another rdfs: subpropertyof -States that a property is a sub-property of another rdfs: domain -The domain of a property rdfs: range - The range of a property rdfs: label -A readable name for the subject rdfs: comment -A description of the subject rdf : member -A member of a container rdf: first -The first item in an RDF list rdf: rest-the list of all irerns in an RDF list af ter the first one rdfs: seealso -A resource that may have more information about the subject rdfs: isdefinedby -A resource that defines the subject rdf:value-assigns structured values to a subject rdf: subject- The subject of an RDF statement rdf: predicate -The predicate of an RDF statement rdf: object -The object of an RDF statement
Bilaga 3 Edutella interface Bilden är hämtad ur En publik e-lärandeplattform. Byggd på kunskapsmångfalder, öppen källkod och öppna it-standarder [21].
Bilaga 4 Bilden är hämtad ur Presentationen Myndigheten för skolutveckling [40].
Bilaga 5 Enkel sökning. Avancerad sökning. Resultat av avancerade sökning
Bilaga 6 Intervjuplan 1. Problemformuleringen Har Urs semantiska satsning en framtid? Hur relaterar den till övrig semantisk webb och andra semantiska lösningar? Finns det fördelar med denna lösning? Utnyttjas dem till fullo? Finns det problem med Urs nuvarande lösning? Hur överensstämmer MB med de behov som finns i organisationen? Vilka behov finns det för MB i Urs organisation? 2. Intervjuform Öppen riktad intervju. Syftar till att förstå meningen av sammanhang som omfrågas och fånga utvecklingsriktningar därigenom. Respondenten lämnar öppna svar. Analys: Kvalitativ. Ca 15 personer Slutsats: Utvärderingen står till grund för våra förslag och teorier om fortsatt arbete för Mediebibliotekets del och de som berörs. Via induktion (uttalar sig om en framtid, något ännu ej föreliggande) 3. Intervjuns uppläggning En vid fråga belyses med i förväg bestämda frågeområden. Öppna svar. 4. Inledning: Intervju kommer att ta ca: 1 timme, den ska dokumenteras m.h.a. bandspelare. Samtliga respondenter presenteras med utvalda frågor enligt gruppindelning. Intervjumaterialet dokumenteras under intervjuns gång. Respondenten har rätt att få uppgiften beskriven för sig och en möjlighet att överväga om hon/han vill medverka eller inte. Respondenten har rätt att avbryta intervjun när som helst före, under eller efter, också under databearbetning. Respondenten behöver ej svara på alla frågor som ställs, utan bibehåller rätten att lämna ingen kommentar. Resultat kommer att användas i en kvalitativ dataanalys och ligger till grund för en utredning/rapport av Urs existerande semantiska lösning. I rapportens text framgår det inte vem har sagt vad men respondenternas namn samt tjänst presenteras, vid godkännande, i bilaga för att klargöra giltighet och trovärdighet. Om respondenten hellre vill vara anonym presenteras enbart, kön, ålder, arbetsområde. Uppsatsen kommer att vara en offentlig handling och ska skickas till samtliga respondenter.
Presentation: Utbildningsradion (UR) har sedan år 2000 arbetat med en publik sökfunktion som baserats på visionerna om semantisk webb och semantisk samverkan. Sökfunktionen går under namnet Mediebiblioteket och finns tillgänglig på http://www.ur.se/mb På webbplatsen finns stora delar av URs material i form av Tv-program, radioprogram, texter och webbplatser sökbara. Intervjuns syfte: Att beskriva och begränsa fenomenet semantisk webb, ur Urs perspektiv (baserad på Mediebibliotekets semantiska uppbyggnad). Reda ut satsningens potential, både internt och externt. Intervju kommer att ta: ca 1 timmar Etiska aspekter: Intervjumaterialet kommer att dokumenteras med bandspelare under intervjuns gång. Är detta ok? Du har rätt att avbryta intervjun när som helst före, under eller efter, också under databearbetning. Du behöver inte svara på alla frågor som ställs, utan bibehåller rätten att lämna ingen kommentar. Materialet kommer att bearbetas av oss. Materialet kommer även att finnas tillgängligt för andra forskare i form av transskript för möjlighet till ytterligare forskning. Är detta ok? Vill du vara anonym eller får vi nämna dig vid namn i bilagan. Dit namn kommer ej kopplas till några citat. Användning av resultaten Resultaten av intervju kommer att sammanställas, kvalitativt analyseras, och presenteras i rapporten. Rapporten är offentlig. 5. Frågeområden och frågor Grunderna för semantisk webb Vad krävs för att en lösning kan kallas semantisk Vad medför semantisk webb för möjligheter för utveckling och samarbete Utredning av semantiska satsningar i praktiken. Semantiska lösningar i bruk Hur ser framtida användning ut för semantiska satsningar Är det olika syn på Mediebiblioteket från KTH och UR? Vad är Mediebibliotekets struktur lämpat för? Finns det anledning att fortsätta bygga på strukturen för Mediebibliotekets del?
Grupp 1. Forskare- företag + Ambjörn För oss är det intressant att få en inblick i hur lösningar inom semantisk webb ser ut idag och hur personer verksamma inom forskning och branschen ser på semantisk webb i praktiken och teori. 1. Bakgrundfrågor: 1. Berätta lite om dig själv (utbildning, bakgrund, intressen) 2. Vad är ditt forskningsområde/arbetsområde? 3. Hur arbetar du med semantiska frågor/semantisk webb? a) Riktade frågor a) Hur definierar du semantisk webb? b) Vad är största fördelen med semantisk Webb idag? c) Vad är största nackdelen med semantisk webb idag? d) Vad är största fördelen med semantisk Webb i framtiden? e) Vad är största nackdelen med semantisk webb i framtiden? f) När tror du semantisk webb kommer att slå igenom? g) Hur upplever du utvecklingstempot? h) För vilka användningsområden är semantisk webb mest lämpligt? (utbildning, e-handel) i) Ge oss ett exempel på en semantisk implementering som ligger nära i tiden? j) Hur kommer vi överens om uppmärkning av metadata? Kommer det att behöva regleras (som tesaurus i databaser)? Hur pass demokratiskt kommer semantisk webb att vara? k) Hur löser man det klassiska problemet med en sammanfogning av databaser? Hur vet man att en fågel är en fågel, när den beskrivs kunna flyga simma smaka gott? l) Ontologier. Är verkligheten möjlig att förenkla? m) Till vilken grad ska webben kategoriseras? n) Allt på webben (sammanfogat), eller bara utvalda områden (öar)? o) UR har problem med stor datamängd och förslöad sökning. Är det ett allmänt problem för semantisk webb? Finns det en lösning för detta problem? p) Ser du andra hinder som bör lösas innan Semantisk webb kan standardiseras? (om det är något du ser som ett hinder som inte tagits upp nu.) Sammanfatta (Ambjörn ska även medverka i KMR!!)
Grupp 2. KMR & MB teknisk avd. För oss är det intressant att få en förståelse på hur personer verksamma inom projektet ser på semantisk webb i praktiken och teori, på projektets resultat och vidareutveckling av nuvarande lösning. Bakgrundfrågor: 1. Berätta lite om dig själv (utbildning, bakgrund) 2. Vad är ditt forskningsområde/arbetsområde? 3. Hur definierar du semantisk webb? 4. Har du varit delaktig i uppbyggnaden av MB? Vad var din roll? 5. Hur löd visionen? 6. Vem formulerade visionen? (på UR sida eller KMR: s sida) 7. Hur överensstämmer den, enligt dig, med URs verksamhetsmål? 8. Tycker du att visionen har uppnåtts? Riktade frågor a) Jobbar UR med en semantisk webb idag? b) Varför valdes denna struktur på MB? Vad tror du? c) Hur överensstämmer den valda strukturen upp med visionen? d) Vilka fördelar har det medfört för verksamheten? e) Vilka tekniska fördelar ser du i nuvarande lösning? f) Vilka tekniska nackdelar ser du i nuvarande lösning? g) Användes semantiska kapaciteten för fullt? Hur skulle man kunna förbättra detta? Vilka begränsningar finns det idag? h) Hur tycker du att MB:s system hanterar datamängder idag? i) Är det optimerat för stora datamängder? j) Hur kommer större datamängd påverka systemet? k) Tror du att det skulle gå att bygga systemet med lika bra prestanda och användbarhet om man inte har satsat semantiskt? l) Om ja: Kan du vara mer specifik? (vad skulle du använda?) m) Anser du att man vinner i användbarhet då det går att söka på kontext?
Tycker du att Mediebiblioteket utnyttjar detta? n) Borde det finnas en sökningsmöjlighet, som illustrerar semantikens fördelar? (Conzilla) o) Finns det en möjlighet att utöka användning av semantiska lösningen internt förutom Portfolios? p) Finns det en möjlighet för att utöka användning av semantiska lösningen externt? q) Av vad vi förstår, är sökningarna inte baserade på ontologier. Stämmer det? Finns det någon specifik anledning till detta? r) Vad krävs för att semantiska lösningar ska slå igenom i praktiken? s) Tycker du att det går att arbeta mera med att få andra att upptäcka fördelar och ansluta sig till ett semantiskt samarbete? t) Tror du att användaren lägger märke till att Mediebiblioteket använder semantiska lösningar? u) Om ja: Hur då? v) Har KTH och UR olika syn på mediebibliotekets användning och vikt? Sammanfatta Grupp 3. Redaktionen (chefer) För oss är det intressant att få en förståelse på hur personer i ledningspositioner och som har varit verksamma inom projektet ser på semantisk webb i praktiken och teori, på projektets resultat och vidareutveckling av nuvarande lösning. Bakgrundfrågor: 1. Berätta lite om dig själv (utbildning, bakgrund) 2. Vad är dina primära arbetsuppgifter? 3. Jobbar UR med en semantisk webb? 4. Har du varit delaktig i uppbyggnaden av MB? Vilken var din roll i detta arbete? 5. Vad tycker du om projektets resultat? 6. Hur definierar du semantisk webb?
Riktade frågor a) Varför publicerar UR producerat material på nätet? (I synnerhet i form som MB) b) Vem har tagit beslut att satsa semantiskt? c) Vad var visionen? d) Tror du att den har uppnåtts? e) Vem var drivande i projektet? (projektledare, pådrivande) f) Hur tycker du att projektets resultat har mottagits av ledningsgruppen? g) På vilket sätt ser du att UR kan samarbeta semantiskt med andra företag? Tidsaspekt på detta? Hur skulle du vilja att detta sker? h) Enligt dig, vilken roll tycker du UR ska ha i att initiera samarbete? (drivande?) i) Tycker du att det går att arbeta mera med att få andra att upptäcka fördelar och ansluta sig till ett semantiskt samarbete? j) Tror du att användaren lägger märke till att Mediebiblioteket använder semantiska lösningar? Om ja: Hur då? k) Varför har inte samarbete/partners program kommit igång och tagit fart mellan möjliga intressenter (museer, t.ex.)? Vad tror du krävs? l) Varför finns det inte information på webbsidan om MB semantiska fördelar? Och intresse av möjliga samarbeten? m) Hur har satsningen tagits upp internt? n) Hur ser du utvecklingen för Mediebiblioteket om 10 år (din vision)? Sammanfatta Grupp 4. Redaktionen (låg teknisk inblandning) För oss är det intressant att få en förståelse på hur personer som har varit verksamma inom projektet ser på semantisk webb i praktiken, på projektets resultat och vidareutveckling av nuvarande lösning. Bakgrundfrågor: Berätta lite om dig själv (utbildning, bakgrund) Vad är dina primära arbetsuppgifter?
Riktade frågor Jobbar UR med en semantisk webb? Hur definierar du semantisk webb? Har du varit delaktig i uppbyggnaden av MB? Vilken var din roll i detta arbete? Vad tycker du om projektets resultat? Riktade frågor Hur har du upplevt processen? (projektets gång) Varför publicerar UR producerat material på nätet? (I synnerhet i form som MB) Vem har tagit beslut att satsa semantiskt? Vad var visionen? Tror du att den har uppnåtts? På vilket sätt ser du att UR kan samarbeta semantiskt med andra företag? Tidsaspekt på detta? Hur skulle du vilja att detta sker? Tycker du att det går att arbeta mera med att få andra att upptäcka fördelar och ansluta sig till ett semantiskt samarbete? Tror du att användaren lägger märke till att Mediebiblioteket använder semantiska lösningar? Om ja: Hur då? Varför har inte samarbete/partners program kommit igång och tagit fart mellan möjliga intressenter (museer, t.ex.)? Vad tror du krävs? Varför finns det inte information på webbsidan om MB semantiska fördelar? Och intresse av möjliga samarbeten? Hur har satsningen har tagits upp Internet? Hur ser du utvecklingen för Mediebiblioteket om 10 år? Sammanfatta
Bilaga 7 Vision Hur löd visionen för Mediebiblioteket? Majoriteten ansåg att visionen för Mediebiblioteket ligger i en tanke att på ett bättre vis nå ut till användare och därigenom göra URs produktioner mer tillgängliga: att etablera någon slags... ett slags struktur för hur utbildningsresurser, digitala utbildningsresurser skulle kunna förmedlas på bästa möjliga sätt. Vi vill lägga ut allt UR gör på webben tillgänglighet innefattade då att alla grupper skulle ha möjlighet att få URs material till sig att helt enkelt komma ut mer till sina användare att hitta nya vägar ut till sina användare att hitta nya vägar ut till sina användare att öppna upp de här nya perspektiven, så en av drivkrafterna har ju varit att få in användarna i en, så att säga, dialog med materialet Det har hela tiden varit stort användarfokus vi ser det som många personen kan uttrycka sig om samma resurs, att man får ett levande rymd av annotationer och påståenden kring de här programmen Men det var att göra programmen tillgängliga för i första hand skolor och institutioner då men också för allmänheten att det skulle vara bara ett arkiv men det skulle vara sökbart på ett mkt vettigare sätt, än bara fritext används i slutsatser: Semantisk webb och hur man ska kunna tänkas utnyttja den bygger ju mer på en jämställdhet mellan olika datakällor. Och det fanns, tror jag, inte riktigt med i URs egen vision. Visionen för att integrera UR i det nationella e-lärandelandskapet har redovisats av en person: det var att integrera UR i det internationella och nationella e-lärandelandskapet Fyra personer nämnde som en del av vision möjlighet att gå bort från broadcasttänkandet: Hela det sättet som Mediebiblioteket representerar där, bibliotekariens hämnd, på något sätt, på TV-producenten. Det är fortfarande den stora grejen, som gör att du får den här immunförsvarsreaktionen vi ville vända oss bort från den här synen på program, som nåt som avvecklades när det sändes, utan att de ska leva en längre tid och det ville vi stödja med den teknologin som semantisk webb erbjuder gå ifrån broadcasttänkandet lite grann En person pratar om att i framtiden kunna gå ifrån broadcasttänkandet De läggs ut (programmen) så fort de är klara och inte knutna till sändningsögonblicket
Har visionen uppnåtts? Vad som har uppfyllts av den? Majoriteten av intervjuade anser att visionen som det var formulerad har inte uppnåtts: Så det är jag är lite besviken: att vi inte kunde nå ut bättre så vi får inte lägga ut allting. Men dels så har tyvärr, visionen om den semantiska webben, kommit lite på skam. Dels så har inte fått till upphovsrättsavtalen, som vi hade tänkt oss. Det blev inte så fantastiskt som vi hade tänkt oss Nää, inte alls Sedan tycker jag att man kanske allt för tidigt kanske band sig till en teknisk lösning för att uppnå det kravet på att ge användarna det användarna vill ha Som visionen formulerades i det ögonblicket, så är den inte uppnådd Nej, det har den inte naturligtvis. Men den har man kan säga att fröet har såtts Den potential som detta frö har det har för närvarande ingen chans att realiseras Det är ganska mycket som ska till innan det går att uppnå Två anser att visionen har uppnåtts till en viss del: Ja, det har ju uppnåtts så långt som man kan av juridiska skäl kan man säga Jag tycker att det finns några delar som projektets resultat är väldigt bra, och det är att det har skapat kompetens på UR. De skulle jag vilja hävda har kontroll över sitt Mediebibliotek på ett sätt som jag tycker verkar vara ganska bra används i slutsatser: jag tycker att man har kommit en bra bit på vägen, och framförallt så tycker jag att man resonerar på ett helt annat sätt än vad man gjorde från början, bredare inom organisationen vi förstår alla delarna i visionen. Vi har modulerat dem, vi har också sätt kopplingarna mellan allt upphovsrätt, distribution och produktion. Men också kopplingarna mellan tillgänglighet och användning. Alltså de pedagogiska, didaktiska frågorna i förhållande till tillgängligheten. Samarbete Hur fungerar samarbete? Är samarbete semantiskt? Enligt 2 intervjuade fungerar samarbete bra för närvarande: Vi deltar ju faktiskt i det här och där har vi ju jobbat mycket med stora aktörer som, Myndigheten för skolutveckling, Skolverket, CFL - Centrum för flexibelt lärande. På vissa sätt är ju det, med bibliotek, t.ex. men det är inte alls på den nivån. Och Skolverket. Vi har ju alla de kontakterna, med Nätuniversitetet osv. Inte på den nivån, inte på den tekniska nivån, inte på visionära nivån utan det är mera praktiska nylägenheter. Men bara en anser att det sker semantiskt: Det finns ju ett flertal projekt som, NoTnavet är ju ett sånt som använder samma teknik till exempel. Det gör de ju faktiskt. Skolverket, CFL, Utbildningsradion i någon mån Nätuniversitetet, fast de inte har någon egen information egentligen, och några andra intressenter, som till exempel Museifönstret och så vidare, har varit med i diskussionen under en längre tid. Och det är lite grann det jag menar att det finns...
Tre personer tyckte att samarbete, i existerande form inte kan kallas för semantiskt: Jag menar semantisk webb bygger på att man har någon o utbyta semantisk med, o det har vi ju inte. Man kan ju säga att vi har ja en fax o vi känner inga andra som har faxar överhuvudtaget. Det är svårt att få folk att förstå poängen med semantiska webben. Därför det mesta man gör där kan man göra på ett annat sätt också. Det är bara att det kostar mycket mer och det skalar inte på nåt bra sätt, det blir ingen effektivitet när man höjer ribban Jag tycker inte att det fungerar så himla bra Alltså jag tycker att det är ganska dålig samordning mellan olika projekt och olika organisationer. Ja, det händer lite för lite. Det skulle kunna hända mer.samma person: De har inte riktigt möjlighet att ta en del av de stegen som man skulle vilja göra, av politiska skäl. används i slutsatser: Man har nog inte förstått att det här är något som måste genomsyra organisationen hela vägen upp. Jag tycker att man har förstått det mer på UR på alla sätt, för att hela organisationen har varit med på ett annat sätt på UR. Men det krävs att samma sak händer på fler ställen, så att det verkligen ska börja fungera tillsammans, vilket ändå är målet på längre sikt. Ska UR vara mer aktiv i initiering av samarbete, ska samarbete vara semantisk? Tre ansåg att URs roll ska vara mer aktiv i initiering av samarbete och det behöver inte vara semantiskt, mer allmän. Det är ju inte bara jag som anser det, det står ju i vårt sändningstillstånd. Det ena är att det står att vi ska samverka, det är inte en fråga om vi vill, vi ska. Men vi ska inte å dit med vår egen logistik eller vår egen agenda, utan vi ska utan vi ska samverka med dem som är i målgruppen. Samma personer fortsätter: Synen på att ska man nå, till dem som ska bruka det, så måste man titta över helheten. Och då måste vi lägga de här aktörerna bredvid varandra och säga: Ska vi komma dit med vårt material?. Ja, det tycker jag. Två tyckte att UR ska inte vara aktiv om den bestämmande auktoritära rollen UR får i stora semantiska sammanhang ( bygga en gemensam ontologi, t.ex): För att vi är ju innehållsleverantörer i många aspekter här och egentligen inte de som kanske behöver märka upp eller sortera information, utan vi levererar innehåll som vi har märkt upp enligt standarder som gärna andra får komma överens om. UR kan ju inte inta en ledande roll här utan vi, varför vi förekommer i de här sammanhangen är ju för att vi har mycket innehåll, mycket content, som kan användas utan kostnad av utbildningsväsendet En intervjuade tyckte att URs roll i semantisk samarbete ska vara stödjande, inte pådrivande: vår roll är ju inte primärt att arbeta med att skapa standarder, utan vi kan vara med och bidra men vi tar inga stora egna initiativ. används i slutsatser: Vi är ju ett kunskapsföretag som ska vara en utav aktörerna i utbildningssamhället. Kan vi inte samverka kring tillgänglighetsfrågorna så kommer vi aldrig att nå vår användare. UR har varit förre andra i implementation, därför är det en investering i ett möjligt semantiskt samarbete. En intressant vinkel som framgick ur två stycken intervjuer var att potentialen till semantiken finns om man är inte ensam aktör:
i och med att vi har investerat i semantisk uppmärkning, eller i semantisk webb, så har vi gjort en slags investering för framtida samverkan med andra Det då är en fördel att man har kunskap som kommer att behövas när man ska samarbeta med andra public service delar av Sverige, t.ex. Samma person: Nu har väl då UR varit väldigt mycket föregångare och de har ju på ett exemplariskt sätt tagit till sig. Slutsatser: Men det finns nog ingenting som vi använder den här till för idag. Samarbete kan förbättras. Ska det vara semantiskt? Tre tyckte att samarbete kan förbättras semantiskt: Jag tror ju att genom att UR vet att vi inte når de målgrupper som vi har uppdrag att nå, och där finns det möjligheter att komma längre med hjälp av, till exempel semantisk webb Det kräver en medvetenhet hos andra spelare och det är en av de sakerna som har tagit längre tid än vi kanske hoppades, därför att CFL aldrig riktigt klev på tåget Det är väl först nu kanske som semantisk webb börjar ta fart lite grand och det gör ju att UR ligger lite före och se kanske inte riktig fördelar som de kommer att ha här framöver, tror jag Fyra anser att samarbetet kan förbättras men inte behöver vara semantiskt: Man kan säga det gäller ju också att engagera så många andra aktörer som möjligt, det finns ju offentliga aktörer som har väldigt intressant material som man borde vilja dela med sig av Om vi snävar in oss och säger att det bara är de som arbetar med semantiska lösningar som vi ska samarbeta med, så får vi väldigt få samarbetspartner. Och därför vill vi nog vara öppen för alla som vill ha vårt material, oavsett hur de vill ha det Vi är väldigt intresserade på att dela med sig metadata, för att synas men det kommer en fråga: behöver man det tror jag inte att vi kommer att lagra det på nåt annat sätt än i SQL. Men när de vill ha data, så översätter vi till deras värde, och sedan om de vill ha det som RDF eller XML, då får de det, helt enkelt Jag skulle kunna tänka mig en skala där man sätter samarbete i ena änden, och fokusering på de lokala problemen i den andra. Jag skulle inte kalla den änden för semantisk webb, för jag ser semantisk webb som innehållande samarbetet också Semantiska fördelar och nackdelar med nuvarande tekniska lösningen Frågan ställdes till sex personer Fördelar: strukturen finns egentligen på plats jag tycker egentligen att, om man ska välja en sån här lösning så har man valt, ett bra alternativ Ett öppet system, en öppna standarder som ska kunna utökas med hjälp av open source kodning till exempel som andra kan utföra och vi sa väl här att vi bygger ett system där man, slänger upp någonting som man tycker verkar bra i början och sedan kan man kontinuerligt förändra, utveckla verktyg för att designen är ganska flexibel, det går att ändra osv. Det går lätt att lägga till nya saker till, nu säger jag lätt, nu vet jag att i praktiken kanske inte alltid är så lätt
de har ganska så flexibelt sökgränssnitt, som kommer att kunna anpassas med andra system också. att skapa en begreppsmodelleringsprocess på UR som kopplar upp via Conzilla och semantiska så att man har knowledge work management, processhantering, från ax till limpa, allt det där. Det är man enabled för. Då kan man arbeta med sådana här verktyg från utsidan. Man kan befinna sig i den semantiska världen Nackdelar: att det är svårt att få in en ny data med nuvarande lösning. Vi är helt beroende, inte helt, men i princip, av tredjeparts mjukvara, för att få in eller få ut data och sökningarna blir paradoxalt klumpiga att göra. För att man kan söka på strukturer och sammanhang men fritextsökning blir ju väldigt väldigt dålig. Och nu visar det sig att folk vill ju fritextsöka Prestanda till exempel är ett område vi har sett en hel del problem, och de tjänster som vi erbjuder på webben, där prestanda har höga krav, där har vi minskat vårt arbete med semantiska tekniker med den implementation vi har idag av JENA och RDF, så är fritextsökningarna är inte särskilt bra. Till små system skalar det till 300 samtidigtanvändare, nåt sånt. För Portföljerna då, åt andra sidan, skalar det inte alls till så många, om man har flera Portföljer i systemet, så det beror på hur mycket data man har, vilka lösningar finns det Det som brister fortfarande idag, som jag ser det, det är helhetsbild av våra tekniska lösningar Vi har vänt oss att man lagrar med standard, och det har vi aldrig förstått varför. Det har ju också visats att det går alldeles utmärkt att översätta till andra standarder när man behöver, så att man lagrar internt på ett sätt som är meningsfullt för oss att vi har några tusen besökare och vi har inte oändlig mängd av hårdvara. Så för oss handlar det om att det måste fungera i skarpt drift Problemet är att i princip att det vi använder, använder vi inte på ett semantiskt sätt. Vi har märkt upp våra data, vi har en databas, på tre olika kriterier samtidigt, jag vet inte hur pass semantiskt är det, vi drar inga slutsatser av data eller sökningar du gör Teknisk lösning behöver utvecklas för att vara semantisk Vi har ju sett att göra, det primära målet med Mediebiblioteket ett gränssnitt på webben som folk kan söka i, och titta på våra program, har av olika skäl blivit en ganska så stel lösning kan man säga. vi har försökt flytta fokus till de sidor av semantisk webb som är dess styrkor. Ja, portföljer är väl det tydligaste exemplet, där det är medlämpat Därför att man kopierar istället för att referera. Man kopierar, man exploderar, man pratar via de här SOAP gränssnitten, man gör om allting till en lång sträng som ska packas upp och sedan parsas och packas ner och packas upp, och liksom Du ska lagra mina, jag ska lagra dina. Det blir en kombinatorisk explosion. Det är den osunda algoritmen, det skalar inte i huvudtaget Jag menar det behöver ju inte RDF för att presentera de data som vi tar fram. Men där vi skulle börja det är ju att titta på vad är det för behov som man skulle kunna tillgodose. Jag tror att i mångt och mycket så skulle man, göra stora delar av Mediebiblioteket likadant idag, med liknande teknik, men jag tror att det finns nyare versioner av saker och ting som definitivt skulle kunna uppdatera till
Märker användare semantiska fördelar i nuvarande sökgransnitt? Nio personer svarade definitivt nej på frågan och alla tyckte att det måste förbättras. Här är några förslag på hur man kan förbättra nuvarande situation, enligt de intervjuade: Det första som kanske på allvar kommer att visa det utåt är det här opinionspubliceringsnätverket som finns nu då, men som vi har inte lagt upp ännu. Att jag kan börja ha åsikter på Urs program på ett strukturerat sätt. Jag kan hitta andra som tycker som jag. helst så vill man ju att sökning ska ske lite grann bakom kulisserna, att man vill kunna skapa sin applikation, att det kanske inte ser ut som att man söker, fast man gör det kommentera URs program i sitt egna portföljsystem och om man bara ser till att börja prata med URs system så kan man ju få träffar på de kommenterarna när man söker i URs system och tvärtom. Och det är då det börjar bli intressant, för det är då de här oväntade aspekterna kommer fram Ja, vi måste ju komma dit. Och här känner jag, jag hoppas ju då med distributionsutredningen, även att det då blir slutna nätverk, att vi ska kunna lägga ut öppna portföljer, ja, men att du skulle kunna få en och du skulle kunna ta de objekt du behöver och också kunna plocka från andra håll och så där När man kommer in på webben så ska sök, den visuella sökmotor ska finnas där med en gång. Det är genom den man ska helst söka. Vill man inte använda den, så klickar man bort den. Samma sak med ljudet. Det ska finnas ett ljud, där webben det läses upp. Vill man inte ha det, så klickar man bort det. Nu är det tvärtom, man måste klicka fram antingen får man försöka utbilda sina användare att jobba ur sitt kontextsökningsperspektiv eller så får man försöka anpassa sig till den allmänna sätt som folk jobbar på för att hitta information. Och det är oftast att de gör en stor sökning och sedan förfinar de sin sökning utifrån detta. Men jag tror att det går att göra den här förfiningen av den sökningen utifrån kontextperspektiv, snarare än man bara listar dem, som Google. Man kanske måste hitta på andra vägar att gå: de gör en sökning först men att träffarna sorteras i kontexter snarare och sedan får du utifrån de här kontexterna, du får själv välja mellan kontexterna. Så istället att man väljer kontext och sedan söker man inom kontexten, så gör man en allmän sökning först, fritextsökning. Och sedan sorterar systemet upp det i olika kontexter och sedan väljer man de kontexterna för att få rätt kontext Det är egentligen en gränssnittsfråga. Och hur visar man upp för människor hur man söker. Det är inte helt lätt. Det är egentligen det ena av mina käpphästar. Det görs alldeles för lite forskning kring gränssnittet i semantisk webb.
Semantisk webbteknologi I intervjuerna om semantisk webbteknologi deltog 6 personer. Vad är semantisk webb bra till? Semantiska webben standardiserar annotationsprocessen och lägger därmed grunden till det globalt annoterade informationssamhället, vilket gör oss alla till bibliotekarier det är tre nivåer, som jag brukar prata om, vad gäller semantik, dels är det semantisk isolering, det första nivån, då lever vi i databasen bakom portalen, kom till oss och sök i vår databas, www. Företag.com. Nästa steg är semantisk samexistens. Då vår databas har talat om för Edutella vad den kan det svara på för frågor. Den har ingen aning hur andra beskriver sig.det tredje steget det är semantisk samverkan, då har vi mappat. Fördubblingstiden på informationslagringen nu är tre år. Man räknar med att inom de närmaste tre åren kommer vi skapa lika mycket information som hittills i hela mänsklighetens historia. Hur ska vi hantera det? Den allra mesta delen är ju digital och online accessible. Semantiska webben handlar ju om att få någon ordning på det här. en sorts förklaring till semantisk webb, när du vill ha oväntad samverkan, alltså den här Gevalia -reklamen oväntat besök och det är där nånstans som nyckeln till att förstå det hela är. Man öppnar upp sig på ett sätt som gör det möjligt för andra att samarbeta med en, utan att man själv planerat det i förväg, tackvare att informationen är beskriven man gör en webb son inte bara är avsedd för mänskliga ögon, utan är avsedd för godtycklig programvara att ta del av. Jag tror inte att det finns någonting sånt som är SW, till att börja med. Det är självfallet så att det finns bindningar mellan dokument, eller mellan informationselement, om man ska vara generell. Men låt oss säga dokument nu, som något sorts förkortning för de enheter man arbetar med. Bindningar mellan de som är av betydelse, är bär av natur, inte så att ords Jag tror att ytterst sällan går det att göra en generell arkitektur av informationen så man kan förutsäga alla sådana tänkbara relationer Vilka fördelar har semantisk teknik? Att få maskiner då att kunna processa och skapa kombinationer av det här, det är ju RDF. Det forskars jättemycket på sånt. Och när man kommer fram till sådana verktyg, så vill man kunna koppla in de i sina system. att semantisk webb, den teknologin erbjuder någonting som gör att man behöver inte bestämma sig så tidigt. det är en av de styrkorna med semantisk webb att man måste inte ta in standard, eller ontologi, utan man kan kombinera många En viktig fördel tror jag att man har tittat på det som man kallar för semantiken, betydelsen i det man uttrycker. Största fördelen idag är att man är att du är säker på ett jobb imorgon.
Fördelen är väl egentligen är att det är ett begrepp som finns, som man kan använda för att lägga mer vikt vid hur man kan jobba med innehåll på olika sätt: hur man kan organisera och skapa ordning och reda. Det är som är bra med SW, man kan ju bygga sina olika schema och så kan man använda de tillsammans, man kan skapa relationer som kanske behöver inte att vara hårda, de kan vara mjuka, det vill säga. vi anpassar de efter stunden Det är upp till dig att bestämma på hur du vill använda de två olika scheman tillsammans Det är bra tekniker som utvecklas under paraplyet som jag inte riktigt tror är ett bra övergripande paraply Och det är det att semantisk webb är bra med: om jag har en samling och du har en samling, och du har en samling. Så är det bra att vi kan säga: nähä, jag har ingenting om det, kolla där, för att där finns en samling, den hyllan du kollade här, den motsvaras av hyllan där. Någon sorts mapping, men jag tror aldrig att vi kommer överens på hur våra hyllor ska se ut Vilka nackdelar har semantisk teknik? det finns ingen som omfattar allting, men vad vi men det finns en del man kan återanvända från olika områden och det är det vi försöker att göra Det öppnar ju för integritetskänslig databehandling. Redan idag så kan man göra en Google sökning om någon av er skulle söka jobb här då skulle jag troligtvis göra lite eftersökningar på Google för att se, vad har ni skrivit om och i vilka sammanhang är ni aktiva och så där Största nackdelen nog att det finns en alldeles för mycket förvirring kring det och om man ska ta rent teknisk, då tycker jag att RDF formatet var lite av ett fiasko. Det är alldeles för tyngt och fluffigt språk Problemet just nu är att ofta de där verktygen, speciellt OWL, eller för RDF, de är för komplicerade fortfarande, även om det finns snygga grafiska miljöer för att jobba med de här sakerna Så är det fortfarande är för pillrigt och just ett problem är att man håller på alldeles för mycket med och bygger materialet som små öar och jag tror att man behöver kombinera det med de strukturer som finns utanför de öarna, det vill säga, det strukturerade världen av material som finns inom RDF eller OWL, den är självgod idag det är väldigt svårt att försöka att kategorisera hela världen i en standard. Det är att det inte har riktigt slagit igenom på bred front. Så det är fortfarande på en ganska akademisk eller visionär nivå. Så att det är ganska komplicerat, ganska abstrakt resonemang och i och med att det inte finns så väldigt många lysande exempel att peka på, så blir det svårt att förklara. Vad jag vänder mig emot SW, det är därför jag låter så skeptisk och gnällig jag tror att när man pratar om SW så pratar man ibland om: nu ska vi hitta den riktiga och rätta strukturen och den ska bli en standard. Jag tycker att man ska titta på: det jag gör just nu och de jag hoppas ska komma och titta på. Och det ska räcka. Är det väl gjort så är det bra. Och när man gör det, ska man titta givetvis på hur de andra liknande ställen har gjort, man kanske ska ringa och prata med de och man ska kan kanske föreslå: vi har kommit på en bra lösning här, men jag tror inte att man ska säga: Nu har vi följt DC, och vi har metadata systemet på det här sättet och nu ska alla göra likadant, och gör de inte det så gör de fel.
Vilka primära användningsområden har semantisk webb? Jag har faktiskt sett en undersökning där de frågade just den frågan till en massa semantic web intresserade människor, och det var kanske ett par hundra som hade svarat på den frågan. Och det fanns inget svar som stack ut, utan folk Ja, kanske 10 % trodde E-handel, kanske 10 % trodde utbildning, kanske 10 % trodde multimedia. Det fanns ingen självklar kandidat. Jag skulle nog satsa på sökteknologi, personligen man kan säga att det generellt sett vänder på det här med knowledge-push till knowledgepull precis som det står här: shifting from knowledge-push to knowledge-pull. och det innebär inom lärandet att man kan gå från teacher-centric till learner-centric inom hälsa och medicin att man kan gå från doctor-centric till patient -centric, inom administration att man kan gå från bureaucrat -centric till citizen -centric, från government-centric till citizen - centric bara att man kan gå inom i stort sätt hela affärsverksamheten från producer -centric till consumer -centric. Allra mest lämpliga det vore och det som jag tror skulle skapa mest ekonomisk nytta och effektivisera arbete och sådana saker är det om man ska använda SW på sin arbetsplats. Om man har det för att korta ihop arbetsflöde, och sådana saker i dokumenthantering, för att de flesta ägnar alldeles för mycket tid just nu på kontoret det är att leta efter papper. Tidsaspekter på utveckling och tillämpning Det är exponentialkurvan hela tiden. Jag tror att det beror på [att det tar tid] att vi inom en ganska ny vetenskap också. Datalogin har inte funnits så länge. Det finns ett antal tåg som folk hoppat på och kört in i vägen. Och folk är väldigt rädda att de första stegen föra att de har redan hört: XML, XML XML jättelänge då att de ska använda och det här och det är bra men det löser inte all problem. För att det har sina problem också och då den här teknologin kanske täppt till en del av de problemen men det här har varit en IT-svacka också och det kan hända det har påverkat att folk inte vågar satsa riktig på nya lösningar Ja antingen om det kommer någon sån här Killer application som man brukar prata om, och det vet man aldrig när, eller om det kommer. Annars kan det nog bli så att det sker successivt, att det inte är liksom, en sån här exponentiell kurva, utan att det kanske är en ganska rak linjär kurva. När man kan ha det samman det med verklig information. under det närmaste decenniet kommer folk att få stöta sina pannor blodiga mot olika semantiska lösningar. Och sedan om 20 år eller så kommer folk att inte veta om att det finns Semantiska lösningar, de kommer att finnas: lika lite som jag vet om bibliotek. Slutsatser: Och där tror jag UR gör helt rätt när de tittar på hur semantisk webb är gjort bara att de inte tror att de ska hitta på den bästa och enda lösning eller att de tror att det finns det enda och världens bästa att ladda ner den från Princeton eller nåt liknande. Så är det inte. De måste tänka efter vilka frågor vill vi svara på? Och så bygga sin samling att man kan få svar på de här frågorna. Men jag tycker att det är dumt att stirra sig blind på att få den perfekta semantiska strukturen. Det finns ingen sånt. Jag tror att det bra att ha de här brillorna på sig när man gör nåt sådant sorts arbete, vilket är en del av det: att tänka vilka ska komma dit, vilka problem ska samlingen lösa, och inte fan det är URs problem att lösa kunskapsorganisation i världen Hur ska det göras. Det är en bra behovsanalys att göra. Det är inte viktigt att tänka efter hur ska det var en länk mellan de dokumenten. Det ska vara en konsekvens att man hela tiden tänker på : vilka behov håller vi på att lösa. Det är lätt att glömma det om man håller på och sorterar böcker.