Appendix Bilaga till slutrapport: Maskininlärningsbaserad indexering av digitaliserade museiartefakter. Dnr , Riksantikvarieämbetet

Relevanta dokument
Introduktion Schenker-BTL AB, Stab IT Beskrivning över informationsintegreringmed Schenker, metodbeskrivning version 1.

Handledning till statistikdatabas Göteborg

ALEPH ver. 16 Introduktion

Lösningar till utvalda uppgifter i kapitel 1

Linjär Algebra, Föreläsning 2

Vektorgeometri för gymnasister

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

1 Duala problem vid linjär optimering

1. (Dugga 1.1) (a) Bestäm v (3v 2u) om v = . (1p) and u =

Linjära ekvationssystem

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Linjär algebra på några minuter

Arbeta i Qlikview. Grundkurs i Qlikview- enkel Exempel och beskrivning av grundläggande funktioner

Mer om analytisk geometri

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Andragradspolynom Några vektorrum P 2

1 LP-problem på standardform och Simplexmetoden

Vectorer, spannet av vektorer, lösningsmängd av ett ekvationssystem.

Beställa varor från webbutiken för provtagningsmateriel, remisser och övrigt materiel.

Tummen upp! lärarsida från sidan 32 Elevuppgifter från sidan 23 Utdrag ur bedömningsstödet, se nedan

Beställa varor från webbutiken för provtagningsmateriel, remisser och övrigt materiel.

Vektorgeometri för gymnasister

Mer om geometriska transformationer

Cactus Informationssystem - CIS. Revision 1.1

Introduktion till integrering av Schenkers e-tjänster. Version 2.0

Användarhandledning Analys & sök Version: 1.2

Användarhandledning Version 1.2

Analysverktyget Program Version:

För att logga in och få tillgång till Bildarkivet krävs att man är registrerad som Behörig Användare.

Linjära ekvationssystem

Föreläsninsanteckningar till föreläsning 3: Entropi

Matriser och linjära ekvationssystem

Stationsregistret - användarhandledning

Vektorgeometri för gymnasister

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering...

Karta över Jorden - viktigt exempel. Sfär i (x, y, z) koordinater Funktionen som beskriver detta ser ut till att vara

För att logga in och få tillgång till Bildarkivet krävs att man är registrerad som Behörig Användare.

Linjära avbildningar. Definition 1 En avbildning mellan två vektorrum, F : V U, kallas linjär om. EX. Speglingar, rotationer, projektioner i R 3.

Linjär Algebra, Föreläsning 9

Om ortonormerade baser i oändligtdimensionella rum

Dokumentation SDB:s innehåll Startsidan, börja med att logga in dig! Avser: Länsombud, uppdateringsansvariga Uppdaterad i Juni 2019

Beställa varor från webbutiken för provtagningsmateriel, remisser och övrigt materiel.

FFM234, Klassisk fysik och vektorfält - Föreläsningsanteckningar

Föreläsningsanteckningar, Introduktion till datavetenskap HT S4 Datastrukturer. Tobias Wrigstad

. (2p) 2x + 2y + z = 4 y + 2z = 2 4x + 3y = 6

TIME CARE POOL WEBB. Personlig kalender (ikon i vänsterkolumnen)

Föreläsning 11 - Automater, textsökning, tillstånd

LINJÄR ALGEBRA II LEKTION 6

Föreläsning 18 Filer och avbildningar

Geometriska transformationer

Lektionsanteckningar 11-12: Normalfördelningen

Manual 3C/Comporto. Manual 3C/Comporto

TATM79: Föreläsning 1 Notation, ekvationer, polynom och summor

Lösningsförslag till övningsuppgifter, del V

PHOCA GALLERY (v 3.2.3)

Block 2 Algebra och Diskret Matematik A. Följder, strängar och tal. Referenser. Inledning. 1. Följder

Vektorgeometri för gymnasister

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret Lektion 4

Uppdaterad RDA-praxis sammanställning

Introduktion till Word och Excel

TAMS79: Föreläsning 10 Markovkedjor

October 9, Innehållsregister

1 Positivt definita och positivt semidefinita matriser

Manual. Registrera i Kvalitetsregister PsykosR

Utskrift av karta. Skriv ut en karta. Skriv ut skärmområde

2. Välj avancerad sökning (det enda sökalternativ som fungerar ännu).

Lathund till uppföljningsrapporter i Frågor & Analys i Raindance

1ME323 Webbteknik 3 Lektion 6 API. Rune Körnefors. Medieteknik Rune Körnefors

Labora&on 8 Formulär övningar/uppgi6er

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning

Kapitel Ekvationsräkning

1 Grundläggande kalkyler med vektorer och matriser

Laboration 6 Formulär och stränghantering övningar/uppgifter

MULTIPLIKATION AV MATRISER, BASER I RUMMET SAMT FÖRSTA MÖTET MED MATRISINVERSER = = =

Användarmanual DHL ACTIVETRACING 3.5. Full Spårbarhet. Full spårbarhet av dina DHL sändningar

Att förstå hur man konstruerar modulära program Att kunna skapa nya funktioner Att förstå hur data skickas mellan funktioner

Avancerade Webbteknologier

Ersätta text, specialtecken och formatering

Informationen i detta dokument bygger på att mobiltelefonen har Android version 8 eller senare.

Arvid Nilsson Webshop Åtkomst till webshopen

Release Notes. Vad är nytt i Easy Planning Programmet nu Vistakompatibelt. Ny html hjälpfil anpassad för Vista

Krafts olikhet. En momentant avkodbar kod (prefixkod) med kodordslängderna l 1,...,l N existerar om och endast om. 2 l i. 1 i=1

Simulering med ModelSim En kort introduktion

Sö ka litteratur i ERIC

TDDC30. Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 9 Jonas Lindgren, Institutionen för Datavetenskap, LiU

Välkommen till CWT Profilverktyg & CWT Reseportal

Omtentamen i OOSU2, 21 augusti 2014

Ansiktsigenkänning med MATLAB

Introduktion till Winbas. excel till Winbas

JavaScript del 2 DocumentWrite, Prompt och ParseInt

Linjär Algebra, Föreläsning 2

Användarmanual icad Arkiv

Allmänna anvisningar för användningen av PX-Web-Statfin-tjänster

Uppgift 1 - programmet, Uppg6.m, visade jag på föreläsning 1. Luftmotståndet på ett objekt som färdas genom luft ges av formeln

Starta MySQL Query Browser

Axalon Process Navigator SP Användarhandledning

Föreläsning 6: Spelteori II

Modell fo r ä ndringshäntering äv Sämbis gemensämmä tekniskä infrästruktur Version 1.0

Handbok PRIVERA FÖR VÅRDGIVARE. Ver 1.2

Transkript:

Appendix Bilaga till slutrapport: Maskininlärningsbaserad indexering av digitaliserade museiartefakter. Dnr 353-3849-2009, Riksantikvarieämbetet A.1. MDS-diagram över deskriptorer i kategorin Korg : Material 1

A.2. MDS-diagram över deskriptorer i kategorin Sko : Material A.3. MDS-diagram över deskriptorer i kategorin Korg : Tillverkning 3

A 4

A.4. MDS-diagram över deskriptorer i kategorin Sko : Tillverkning 5

B. Dendrogram över deskriptorer i kategorin Sko : Material elfenben pärlemor lack bast renskinn tagel proteinfiber näver filt strå pigment getskinn hår fågelfjäder sämskskinn gummi tyg rishalm siden manchester tusch fiskskinn laxskinn giraff palm piggsvin pärlor glaspärlor gräs päls sälskinn plast glaspärla papper sammet ull textil glas läder skinn halm metall trä bomull silke växtfiber 6

C. Entropibaserade mått på semantiska relationer Vi ger här en formell beskrivning av de mått på semantiska relationer som har använts i denna studie. Låt X vara en slumpvariabel som kan anta n olika tillstånd. Uttryckt i kommunikationstermer kan X vara ett alfabet och de n tillstånden utgörs av dess bokstäver; ett annat exempel är att låta X vara en vokabulär och de n tillstånden motsvaras av de ord som ryms i vokabulären. Vi låter ett enskilt tillstånd betecknas x och sannolikheten för att detta tillstånd skall observeras skrivs P(x). Entropin för x har definitionen ( ) ( ) Enligt ovanstående definition följer att entropin för ett tillstånd är stor om sannolikheten för att tillståndet skall observeras är låg (och vice versa). Vi kan med andra ord säga att entropin (informationsmängden) för tillståndet står i omvänt förhållande till chansen att tillståndet observeras. På motsvarande sätt är självinformationen för två samtidiga tillstånd x och y ( ) ( ) Den gemensamma informationen (eng. mutual information) mellan x och y definieras ( ) ( ) ( ) ( ) och kvantifierar mängden information som tillstånden uttrycker om varandra. Om x och y exempelvis utgörs av observerade beskrivningsord i en databas kommer måttet ( ) ange hur stor information deskriptorerna ger om varandra. Ju större värde på måttet, desto starkare är den semantiska associationen mellan deskriptorerna. Denna typ av mått kallar vi likhetsmått eftersom det för en given händelse x maximeras då händelsen jämförs med sig själv. Formellt: ( ) ( ) för alla händelser x och y. För att generera visuella kartläggningar av deskriptorernas relationer är det däremot önskvärt att transformera ( ) till ett mått på olikhet snarare än likhet. Det är därvidlag lämpligt att skapa ett mått som uppfyller kriterierna för ett geometriskt avståndsmått (eng. metric). Ett sådant mått erhålles enkelt genom följande definition: ( ) ( ) ( ) ( ) ( ) ( ) Detta avståndsmått har använts för att visualisera semantiska relationer i 2-dimensionella kartor med hjälp av multidimensionell skalning (se beskrivning ovan). 7

D. Exempel på Haar-transformation I figuren neden ser vi ett exempel på de två första transformationstegen i Haar-transformationen av en bild. Bilden delas successivt upp i information som approximerar de ursprungliga bildpunkterna respektive information om kontrasten mellan närliggande bildpunkter (vilket syns i bilderna nedan som en mörk relief). Informationen om skillnaden mellan bildpunkter är mycket användbar för inlärning av klassificerade bildmönster. 8

E. Omarbetning av bildvektorerna Bildvektorerna är den allra största delen av datamängden och den del av webb-implementationen som har menligast inverkan på prestanda, främst inladdningstid. En särskiljande egenskap hos klientskript som JavaScript är att koden läses in som ren text. den förkompileras inte (moderna webbläsare har däremot en sk. just-in-time-kompliering). Den rena filstorleken ska skickas till klienten och kan utgöra en stor prestandabegränsning. Bildvektorerna lagras i en JavaScript-struktur, en associativ array av nyckel- och värde par där nycklarna är id för föremålet och värdet är en vektor med de 3072 värdena enligt nedan. Form för varje vektorbeskrivning i JavaScript-form: 1002920 : [ -0.5,-1.25,-1,-0.75,-1,0,-1,0,-1.25,-0.75,-0.75,-0.75,0,0.25,0,-1.25,-1.75,-2,-2.5,-2 Bildvektorerna har för det första uttryckts kortare genom säkra förändringar av mättalsnoggrannhet (icke påverkande avslutande nollor i decimaltal). Även i denna form har bildvektorerna utgjort den klart största datamängden som läses in vid sidinladdning. Flera olika sätt att minska denna storlek har övervägts. Det vore möjligt att räkna ut alla resultat av vektorjämförelser (med cosinusmåttet respektive euklidiskt avstånd) för par av föremål på förhand. Eftersom sökgränssnittet dock tillåter att ett godtyckligt antal bilder används för att formulera varje bildsökningsfråga (centroiden av dessa tas fram) blir de möjliga kombinationerna av bildvektorer mycket stort, även om det som behöver lagras enbart skulle vara rangordningen mellan föremålen i resultatet. Skalärprodukterna för parvisa jämförelser (vilka är återkommande värden i algoritmerna, se nedan) skulle kunna tas fram på förhand och laddas in. Detta innebär kortare beräkningstid för frågor och kortare inladdningstid. En omformulering av elementens datavärden i variabler, komprimering, (varje värde lagras i variabel med kort namn och slås upp vid beräkningar). För att försöka minska filstorleken för bildvektorerna, har här utvecklats en komprimeringslösning med variabler för värden. Värdena som förekommer i vektorrepresentationerna är nämligen i hög grad återkommande. I JavaScript är det skillnad mellan versaler och gemener som identifierare x1 är inte detsamma som X1 (till skillnad från i t.ex. Visual Basic). Därför blir det möjligt att skapa ett stort antal variabler enbart med bara två tecken. Lösningen innebär att ersätta vektorvärden med variabler, vilkas namn inte får förekomma på annat sätt i runtime-miljön. Att representera värdet -0,25 med t.ex. Wx innebär insparande av tre tecken för varje förekomst i bildvektorerna. Denna representation ger en klart minskad storlek för vektorrepresentationerna. Det ska nämnas att variablerna dock först ska initieras med värdena en gång först. Nedanstående kodexempel visar hur samma inledning av första bildvektorn (för ett föremål av typen korg med id 1002920). Ursprunglig form: 9

1002920:[-0.5,-1.25,-1,-0.75,-1,0,-1,0,-1.25,-0.75,-0.75,-0.75,0,0.25,0,-1.25,-1.75,-2,-2.5,-2,-0.5,- 1.25,-2.25,-1.75,-0.25,0,-0.75,-1,0,-0.5,-1,-1,-0.5,-1.5,-0.25,-0.75,-0.25,-2.25,-0.25,-1,-1.75,-1,- 0.75,0,15.75 Motsvarande representation med globala variabler: 1002920:[c,h,o,d,o,e,o,e,h,d,d,d,e,b,e,h,i,ä,q,ä,c,h,l,i,a,e,d,o,e,c,o,o,c,j,a,d,a,l,a,o,i,o,d,e,aF 10

F. Konvertering av dataformatet för textbeskrivning av föremålen De drygt 900 föremålen och deras beskrivningar har erhållits i ett XML-format, från Carlottadatabasen. Det är fråga om en detaljerad men i stycken överflödig struktur. För att kunna användas praktiskt i webb-implementationen har data omformulerats till ett platssparande JavaScript-format, ett överordnat objekt (associativ array) som i sin tur består av ett objekt (associativ array) per föremålspost. Detta förarbete gör att textdata blir enklare att behandla programtekniskt, och söka i, samt reducerar filstorleken för den textmässiga beskrivningen av föremålen till mindre en än en femtedel av ursprungsformatet (från ca 4308 kb till ca 785 kb). De nedanstående tabellerna visar representationerna av en enskild post i det ursprungliga XMLformatet samt därefter i det platsbesparande JavaScript-formatet. <object id="1002848" register="2" registername="objekt" id-term="2" visible-term="72"> <term term-id="2" spe="objidn" objspe="inventarienummer" is-id-term="true"> <objtxt>1887.08.2489</objtxt> <term term-id="72" spe="objnam" objspe="sakord"> <objtxt>sko</objtxt> <objtxt>skodon</objtxt> <objtxt>sandal</objtxt> <term term-id="116" spe="objnam" objspe="sakord engelska"> <objtxt>shoe</objtxt> <objtxt>sandal</objtxt> <term term-id="117" spe="objnam" objspe="lokalt namn"> <objtxt>geta</objtxt> <term term-id="143" spe="objcde" objspe="ocm"> <objtxt>291</objtxt> <term term-id="144" spe="objtme" objspe="tidpunkt" objasc="tillverkning"> <objtxt>1800-tal</objtxt> <term term-id="156" spe="folcde" objspe="owc" objasc="ursprung"> 11

<objtxt>ab1</objtxt> <term term-id="157" spe="geonam" objspe="världsdel"> <objtxt>asien</objtxt> <term term-id="159" spe="geonam" objspe="ort" objasc="brukare"> <objtxt>tokyo</objtxt> <term term-id="170" spe="geonam" objspe="land" objasc="ursprung"> <objtxt>japan</objtxt> <term term-id="180" spe="objtxt" objspe="förvärvsomständigheter" objasc="i fält"> <objtxt>delsamling 1887.8.2489-2867 är inköpt i Tokyo och består av sandaler, skor, handdukar, ätpinnar, symboliska svärd, många rituella och religiösa föremål och figurer, klädedräkter mm. (PH 960506)</objtxt> <term term-id="181" spe="pernam" objspe="personnamn" objasc="förvärvat från"> <objtxt>stolpe, Knut Hjalmar</objtxt> <term term-id="184" spe="objtme" objspe="datum" objasc="förvärv till museet"> <objtxt>1887</objtxt> <term term-id="187" spe="matnam" objspe="material" objasc="tillverkning"> <objtxt>lack</objtxt> <objtxt>sammet</objtxt> <objtxt>metall</objtxt> <objtxt>halm</objtxt> <objtxt>tusch</objtxt> <term term-id="189" spe="objmea" objspe="längd"> <objtxt>21,4 cm</objtxt> <term term-id="190" spe="objmea" objspe="höjd"> <objtxt>h 8,5 cm</objtxt> 12

<term term-id="191" spe="objmea" objspe="bredd"> <objtxt>10 cm</objtxt> <term term-id="211" spe="objtme" objspe="datum" objasc="dokumentation"> <objtxt>1995-04-05</objtxt> <objtxt>2003-03-04</objtxt> <term term-id="212" spe="pernam" objspe="personnamn" objasc="dokumentation"> <objtxt>holmberg, Petra</objtxt> <objtxt>svensson, Irene</objtxt> <term term-id="214" spe="objtme" objspe="datum" objasc="uppdatering"> <objtxt>2003-03-04</objtxt> <objtxt>2009-11-04</objtxt> <objtxt>2009-11-04</objtxt> <term term-id="215" spe="pernam" objspe="personnamn" objasc="uppdaterare"> <objtxt>svensson, Irene</objtxt> <objtxt>dahlström, Maria</objtxt> <objtxt>dahlström, Maria</objtxt> <term term-id="219" spe="objnam" objspe="ursprungsdatabas"> <objtxt>etno</objtxt> </object> Ursprungsformatet (XML) har omformats till nedanstående kompakta kod-format utan någon egentlig dataförlust. 1002848:{"Inventarienummer":"1887.08.2489","Sakord":"sko,skodon,sandal","Sakord engelska":"shoe,sandal","lokalt namn":"geta","ocm":"291","tidpunkt (tillverkning)":"1800-13

tal","owc (ursprung)":"ab1","världsdel":"asien","ort (brukare)":"tokyo","land (ursprung)":"japan","förvärvsomständigheter (i fält)":"delsamling 1887.8.2489-2867 är inköpt i Tokyo och består av sandaler, skor, handdukar, ätpinnar, symboliska svärd, många rituella och religiösa föremål och figurer, klädedräkter mm. (PH 960506)","Personnamn (förvärvat från)":"stolpe, Knut Hjalmar","Datum (förvärv till museet)":"1887","material (tillverkning)":"lack,sammet,metall,halm,tusch","längd":"21,4 cm","höjd":"h 8,5 cm","bredd":"10 cm","datum (dokumentation)":"1995-04-05,2003-03-04","personnamn (dokumentation)":"holmberg, Petra,Svensson, Irene","Datum (uppdatering)":"2003-03-04,2009-11-04,2009-11-04","personnamn (uppdaterare)":"svensson, Irene,Dahlström, Maria,Dahlström, Maria","Ursprungsdatabas":"Etno","id":"1002848"}, XML för databehandling har efter ett stort genomslag kring millennieskiftet ofta blivit kritiserat för sin stora luftighet och emellanåt överflödiga struktur, vilket lätt sänker prestandan. Förespråkare för XML-formatet anger ofta egenskapen human readable som en styrka och förklaring. Det finns dock många konkurrerande format (bl.a. JSON) 1 idag. 1 JSON står för JavaScript Object Notation och är relativt likt den formalism som här används. 14

G. Algoritmer för bildsökning och återkoppling De algoritmer som använts är för bildsökning Cosinus-likhet eller euklidiskt avstånd samt för återkopplingssökning (relevans-feedback) Rocchio-algoritmen vilka visas nedan. De två likhetsmåtten används vid bildsökning då en genomsnittlig vektor (sökfrågevektor) beräknas utifrån de föremål som användaren väljer. Därefter jämförs och rangordnas samtliga föremål mot denna frågevektor. Resultatet visas direkt och beräkningen och sorteringen kan ske nästan momentant. Cosinus-måttet: Låt d och q vara en dokumentvektor respektive en sökfrågevektor i ett n-dimensionellt vektorrum. Cosinusmåttet för likhet mellan dessa vektorer definieras då: Euklidiskt avstånd: Det euklidiska avståndet mellan två vektorer d och q definieras som längden hos vektorn d - q, dvs ( ) ( ) Rocchio-algoritmen för relevansfeedback: Låt q (t) vara sökfrågevektorn vid iteration t, C r centroiden för vektorerna för de kända relevanta dokumenten, samt C n centroiden för vektorerna för de kända icke-relevanta dokumenten. Den uppdaterade sökfrågevektorn q (t+1) beräknas då ( ) ( ) där α, β och γ är koefficienter som används för att finjustera anpassningen av sökfrågevektorn. 15

H. Hjälptext i webbgränssnittet Den nedanstående hjälptexten återfinns i webb-gränssnittet och är en guide för praktisk användning. Sökning med bilder Genom bildsökning (query-by-example) är det möjligt att välja en eller flera exempelbilder, och söka efter liknande bilder. De bilder som väljs utgör alltså "sökfrågan". Söka på bildlikhet Sök efter liknande bilder på följande sätt. 1. Klicka på fliken Sökning med bilder i vänsterdelen av sidan. 2. Klicka på den eller de bilder som ska vara sökfråga. 3. Välj sökalgoritm. Det är denna algoritm som avgör likhet mellan de vektorer som representerar bilderna. 4. Klicka på knappen Sök. 5. Resultatet visas i vänstervyn. Observera att samtliga bilder finns med i sökresultatet, i bildsökning. Det betyder att en sökning kan ses som en speciell sortering av bilderna. 16

Återkopplingssökning med bilder Det är möjligt att efter en sökning återupprepa sökning (relevans-feedback). Det sker genom att relevanta bilder i resultatet i mittvyn markeras. Därefter sker en återsökning och "sökfrågan" har då modifierats så att de nya markeringarna beaktas. Gör en återkopplingssökning med bilder på följande sätt. 1. Inled med att göra en vanlig bildsökning. 2. Markera de föremål som ska ses som relevanta. De får en röd ram och dyker upp i Sökfråga i vänstervyn. 3. Klicka på knappen Sök för att genomföra återkopplingssökning. Algoritmen för sökning heter Rocchio-algoritmen. Textsökning efter föremål Det är möjligt att söka efter föremål genom den textinformation som varje post har kopplad till sig. Den text som representerar varje post (hämtad från Carlotta-databasen) syns i högervyn när en post markeras. Inled en textsökning på följande sätt. Välj fliken Sökning med text i vänstervyn. Det är möjligt att söka med ett enda villkor eller genom att kombinera en sökfråga genom att ange flera villkor. Sök med ett villkor på följande sätt. 1. Fyll i en söksträng till vänster. 2. Ange vilka sökvillkor som ska gälla (om du väljer Sök i visst fält så kommer du att behöva ange fält). 3. Klicka på knappen Sök med enbart detta kriterium. 4. Resultatet visas i mittvyn. 17

Sök med flera villkor på följande sätt. 1. Ange sökvillkor genom att skriva en söksträng och ange sökalternativ. 2. Klicka på knappen Lägg till detta kriterium. 3. De poster som matchar villkoret visas i mittvyn. Nederst visas även kombinationen av kriterier som anges. Lägg om så önskas till fler sökkriterier på samma sätt. Resultatet kan slutligen visas i resultatläge genom att välja knappen Visa föremålen i resultatvy nederst i mittvyn. Resultatet visas i mittvyn. 18