Stadieväxling Utmaningar för en nationell terminologi(in)samling Claudia Dobrina, Henrik Nilsson, Peter Svanberg Terminologicentrum TNC Nordterm 2011
Uppläggning Rikstermbanken och dess sekretariat Rikstermbanken en ögonblicksbild Rikstermbankens tre delar i fyra perspektiv Och sen då? Mot en nationell semantisk resurs?
www.rikstermbanken.se
Milstolpar på väg mot Rikstermbanken Kortlådor och kartotek (från 1941 och framåt) Termdok, TNCs första system för datortillämpning i terminologiarbete ( från 1969) Termdok på cd-rom (1987) TISS förslag till en svensk terminologisk infrastruktur (2003) IT-propositionen, (Prop. 2004/05:175), 2005 Bästa språket (Prop. 2005/06:2), 2005 Beslut från Näringsdepartementet om Rikstermbanken 2006
Rikstermbanken i siffror 78 000 termposter 260 000 termer (uppslagstermer, synonymer, ekvivalenter) 26 språk 700 unika källor 156 leverantörer
Omdömen och synpunkter Ny webbtjänst förklarar svåra begrepp En gemensam sajt för alla som behöver hjälp med stavning och definitioner av tekniska termer. Rikstermbanken, som inte kan avfärdas lättvindligt Hej Rikstermbanken! Jag undrar en ovärderlig kunskapskälla Rikstermbanken alla nördars bank Denna termpost är fel!
Statistik, Rikstermbanksår 2 Sökningar 102 200, 280/dag, 2,6/besök Sidvisningar 200 000, 5/besök Länder/kontinenter 81/5 Andel utökad sökning 6 % Mest sökta termer hemsida, amorf gärning, koipi, dagvatten, interoperabilitet Mest visade termposter bult (154), amorf (62)
Perspektiv Aspekt Innehåll Teknik Organisation Förvaltaren (TNC) X X X Användare X X (X) Leverantörer X X (X) Finansiärer X (X)
Teknik: TNCs perspektiv Drift av servrar och Rikstermbankssystemet Bevakning Användningsstatistik
Rikstermbanken = referens (1)
Rikstermbanken = referens (2) http://www.rikstermbanken.se/rtb/visatermpost.html?id=60480
Referensproblem Länkar just nu ej permanenta tidigare systemval Att göra länkarna permanenta får konsekvenser: nytt arbetssätt för sekretariatet versionshantering krävs inget kan tas bort
Referensproblem Vad är en referens till en termpost? En hänvisning till hur en viss termpost såg ut då referensen skapades. Alltså: Alla versioner av alla termposter måste finnas kvar för alltid.
Referensproblem Referensen kan ändå bli inaktuell: Leverantören drar tillbaka materialet. Bara upplysning kan visas. Materialet blir ogiltigt, upphävt (lagar, standarder etc.). Kan den ändå vara kvar, med upplysning? Leverantören reviderar materialet. Äldre versionen finns kvar, men visas inte i träfflista utan enbart via den permanenta länken (+ upplysningar).
Teknik: användarnas perspektiv Vad vill användarna ha? Förslag vid sökning? Andra sökalternativ Kvalitetsmärkning? Samsökningsmöjligheter Annan åtkomst, t.ex. via andra medier/apparater? Gränssnitt på andra språk? Sökprofiler? Nedladdningsmöjligheter (för forskning, etc.) Integreringsmöjligheter?
Teknik: användarnas perspektiv Vill användarna bruka innehållet på nya sätt? Hur? Nedladdningsbart, strukturerat, återanvändningsbart material? Genom andra kanaler? (insticksmoduler) Som mellanhänder (förlag etc.)?
Ny åtkomst 1: TermWeb
Ny åtkomst 2: andras initiativ
Ny åtkomst 3: önskemål Jag [doktorand] få en lista Rikstermbanken, alltså inte fullständiga termposter, utan bara en lista på [alla] termer. Det jag m.fl. på institutionen för datavetenskap skulle vilja använda den till är för att utvärdera svenska termextraktionsalgoritmer....
Rikstermbanken som verifikator
Innehåll: TNCs perspektiv Uppdatering olika nivåer: felstavning helt ny definition svårupptäckt utan inrapportering; automatik? spara även äldre versioner? ontologifiering, dvs. utveckla det som redan finns? uppdateringar som försämrar? påverkar teknik
Innehåll: TNCs perspektiv Var hitta mer innehåll? kommersiella aktörer (förlag, standardiseringsorgan) digitalisering? automatisk extraktion ur text? annan utgångspunkt: inte längre Sveriges begreppsvärld (t.ex. svenskt material från Finland?) även samlingar utan svenska? Wikifiering?
Innehåll: TNCs perspektiv Kvantitet kvalitet? Allt tas inte med (kvalitetskriterier: bedömning, granskning, begreppsbeskrivningar/ ekvivalenter) teknik framför allt?
Innehåll: användarperspektiv Kvantitet kvalitet? Deltagande? mer och mer varierat innehåll! dåochdå: felanmälan sällan: förslag på ordlistor sällan: terminologiska kommentarer mer diskussion? (socialt medium) direkta bidrag? (Jfr Folkets synonymordbok )
Innehåll: användarperspektiv Mer eller mindre innehåll på sikt? Konsolidering (dubbletter, fackområdesperspektivet)? Marginell minskning av innehållet? Motivera/förklara för användarna Harmonisering inom och mellan fackområden
Innehåll: användarens perspektiv Vad vill användarna ha? mer och annat innehåll, från fler fackområden? klassifikation? terminologiskt otypiska upplysningar (etymologi etc.) annan struktur och presentation? möjlighet att lagra terminologi själva? mer innehåll, men kvalitet? kringtjänster? användarundersökning!
Innehåll: leverantörens perspektiv Vad vill leverantören ge? allt eller bara lite? Vad vill leverantören få? uppmärksamhet, reklam, renommé ersättning? strukturerat, kommenterat material? större spridning bättre presentation bli del av större helhet
Organisation: olika perspektiv TNC: Rikstermbankssekretariatet utvidgas? Med ny kompetens? Nya rutiner? Mer arbete med drift och säkerhet? Med distribuerad lösning: snarare pedagogisk än uppsökande uppgift? Rikstermbanken= TNC! Användarna: Jag skriver examensarbete och undrar hur man ska referera till TNC. Eller heter ni Rikstermbanken numera? trovärdighet?
Finansiärens perspektiv Rikstermbanken blir nav i e-förvaltningen, dvs. del av större helhet en större resurs, dvs. utvidgas för härbärgering av ontologier etc. ett verktyg för interoperabilitet term tracking : unik termidentifierare (GUI/UUID) oavsett var termen dyker upp nätverk av termer i dokument förenklad TKB (terminologisk konsekvensbedömning) OntoIOp: ontology integration and interoperability (nytt ISO-projekt) innehållet i skymundan!?
semantisk resurs Semantic Resource [ ] refers to all ontologysimilar entities, such as taxonomies, dictionaries, thesauri, etc. (Lima et al, 2010?) terminologi(in)samling större process, även automatisk extraktion ur text? (jfr Danmark) även fulltextdatabas, korpus? gemensamt sökgränssnitt (jfr onki.fi) omvänt perspektiv: varje leverantör strukturerar enligt standardformat vilket sedan hämtas in genom gemensamt gränssnitt (jfr Termportalen)
Den digitala agendan Öppen tillgång till innehåll Konsumenterna förväntar sig med all rätt att de ska kunna nå onlineinnehåll åtminstone lika effektivt som innehåll i offlinevärlden. [ ] Med hjälp av digital distribuering av kulturellt, journalistiskt och kreativt innehåll, som är billigare och snabbare, kan upphovsmän och innehållsleverantörer nå en ny och större publik. Europa måste satsa hårdare på skapande, produktion och distribution (via alla plattformar) av digitalt innehåll. [En digital agenda för Europa]