Göran Lindqvist 0921-57307 2008-10-03 0.1 1 (14) Test av programvara
Göran Lindqvist 0921-57307 2008-10-03 0.1 2 (14) Inledning Denna rapport beskriver en test av programvaran DROID version 3 som jämförs mot föregående version. Vidare ges en generell beskrivning av programverktyget ENA samt hur programmet fungerar och en liten slutsats. DROID v3 Har laddat ner och testat DROID version 3 mot samma testfiler och testprotokoll som användes i CODA-FORM 1. Jag har inte sett någon skillnad på resultatet mellan version 3 och version 2 i denna test. Dock kan ju en del buggrättning gjorts och eventuellt är koden snabbare i den nya versionen. Detta har dock inte testats utan bara programvaran skicklighet att identifiera filer. Nedan visas testprotokollen från både version 3 och version 2. 1 https://ldb.project.ltu.se/main.php/coda-2007_slutrapport.pdf?fileitem=12190038
Göran Lindqvist 0921-57307 2008-10-03 0.1 3 (14) Testverktyg: DROID 3 Test(identifiering) Testprotokoll DROID 3 Id/Val (ändelse) Filformat Ja Delvis Nej Txt 8859-1 (1) Txt unicode-8 (1) Rtf v1.4 (2) Doc v2.0 Doc v6.0 Doc v8 (3) Doc v8 + ljudfil (5) Wks (3) ls v4.0s Pdf v1.2 Odt v1.0 Tif v2.2 Gif v89a Jpg v1.02 Jp2 part1 (4) Bmp v3.0 Png v1.1 Mp3 (4) Wav Mid (4) Wma v2.0 Qt v3.0 (6) Mpeg-1 (2) Mpeg-2 (2) Avi Totalt 18 7 0 Kommentar: 1: tentative, returnerar många svar 2: generisk positiv, rätt format men gav flera versioner. 3: OLE2, varnar dock för filändelse 4: rätt bestämd, varnar dock (tentative) 5: OLE2, varnar dock för filändelse. Hittade ej ljudfil 6: hittade ej version
Göran Lindqvist 0921-57307 2008-10-03 0.1 4 (14) Testverktyg: DROID 3 Test(identifiering) Id/Val (ingen ändelse) Filformat Ja Delvis Nej Txt 8859-1 Txt unicode-8 Rtf v1.4 (1) Doc v2.0 Doc v6.0 Doc v8 (2) Doc v8 + ljudfil (3) Wks (3) ls v4.0s Pdf v1.2 Odt v1.0 Tif v2.2 Gif v89a Jpg v1.02 Jp2 part1 Bmp v3.0 Png v1.1 Mp3 Wav Mid Wma v2.0 Qt v3.0 (4) Mpeg-1 (1) Mpeg-2 (1) Avi Totalt 15 5 5 Kommentar: 1: generisk positiv, rätt format men gav flera versioner. 2: OLE2, varnar dock för filändelse 3: OLE2, varnar dock för filändelse. Hittade ej ljudfil 4: hittade ej version
Göran Lindqvist 0921-57307 2008-10-03 0.1 5 (14) Testprotokoll DROID 2 Testverktyg: DROID 2 Test (identifiering/metadata) Id/ fil (ändelse) Filformat Ja Delvis Nej Txt 8859-1 (1) Txt unicode-8 (1) Rtf v1.4 (7) Doc v2.0 Doc v6.0 Doc v8 (5) Doc v8 + ljudfil (4) Wks (5) ls v4.0s Pdf v1.4 Odt v1.0 Tif v2.2 Gif v89a Jpg v1.02 Jp2 part1 (6) Bmp v3.0 Png v1.1 Mp3 (6) Wav Mid (6) Wma Qt v3.0 (2) Mpeg-1 (3) Mpeg-2 (3) Avi Totalt 18 7 0 Kommentar 1. returnerar många svar(tentative) 2. kan inte få fram versionen, dock rätt format 3. gav flera svar mpeg1/mpeg2 4. identifierade formatet men inte ljudfilen i word dokumentet 5. returnerar OLE2 compund document format, som rätt format 6. rätt bestämd, men varnar(tentative) 7. returnerar många svar(generic)
Göran Lindqvist 0921-57307 2008-10-03 0.1 6 (14) Testverktyg: DROID 2 Test (identifiering/metadata) Id/ fil (ingen ändelse) Filformat Ja Delvis Nej Txt 8859-1 Txt unicode-8 Rtf v1.4 (5) Doc v2.0 (1) Doc v6.0 (1) Doc v8 (1) Doc v8 + ljudfil (6) Wks (1) ls v4.0s (1) Pdf v1.4 (1) Odt v1.0 (1) Tif v2.2 (1) Gif v89a (1) Jpg v1.02 (1) Jp2 part1 (2) Bmp v3.0 (1) Png v1.1 (1) Mp3 (2) Wav (1) Mid (2) Wma v2.0 Qt v3.0 (3) Mpeg-1 (4) Mpeg-2 (4) Avi (1) Totalt 15 5 5 Kommentar 1. varning på filändelse. 2. kunde ej bestämma filen, gjorde det i föregående test via ändelse. 3. kan dock ej bestämma version. 4. gav flera svar mpeg1/mpeg2. 5. returnerar många svar (generic). 6. identifierade formatet men inte ljudfilen i word dokumentet
Göran Lindqvist 0921-57307 2008-10-03 0.1 7 (14) ENA Programmet har skapats i Australien och används av National Archive of Australia. ena är skrivet i Java och tillhandahåller ett API samt ett GUI (xena lite). All källkod samt dokumentation finns tillgänglig på webben 2 (licens GPL). Skall man använda det i sitt arkiv så är det lämpligt att man arbetar mot API:et. ena gör två saker: Identifierar digitala objekt Konverterar digitala objekt till ett standardbaserat öppet format Filerna kan konverteras på två olika sätt, bitstream samt normaliserad. Väljer man bitstream så skapar ena en metadata-wrapped bitström som anses som en originalkopia av det digitala objektet. Denna version innehåller all information från originalfilen, base 64 kodat. Det ena sen kan göra är att exportera (konvertera) filen tillbaka till sitt ursprungliga format. Alternativ två är skapa en normaliserad version av det digitala objektet, den filen som ena skapar är en base 64 kodad fil även innehållande metadata. Den normaliserade filen skall inte ses som original av det objekt den skapades av utan den normaliserade fil som skapas skall vara mer tidsokänslig (enligt programtillverkare) och går att exportera (återskapa) till ett antal öppna format som ML, ODF, PNG, PDF samt FLAC. Bild 1: JPEG-fil normaliserad i ena och öppnad i wordpad. 2 http://xena.sourceforge.net/
Göran Lindqvist 0921-57307 2008-10-03 0.1 8 (14) Totalt klarar i dag ena av ca 40 format; AIFF, BMP, CSS, CSV, CUR, DOC, FLAC, GIF, gzip, HTML, jar, JPEG, MP3, MacBinary, MPP, ODP, ODS, ODT, PC, PDF, PNG, PPS, PPT, PSD, RTF, sql, SVG, SC, SI, SW, SYLK, tar, tar.gz, TIFF, TSV, TT, war, WAV, WPD, WRI, BM, HTML, LS, ML, SLT, zip. Övrigt: Verktyget enas placering i OAIS-modellen blir efter Ingest då filer konverteras med programmet till ena-format och läggs in i AIP. ena behövs också vid tillgängliggörande då DIP skall förmedlas från arkivet, dvs. konvertera ena-format till ett tillgängliggörande format. Med ena som ett verktyg i ett AIS medförs att man har ett format i arkivet, det man måste hantera är att alltid kunna konvertera upp ena-formatet till ett format som kan tillgängliggöra den information som skall visas, oberoende av tid. Detta medför att vi alltid måste ha kodmoduler som kan konvertera tillbaka information. Arbete (kodning) måste göras över tiden på verktyget. Sammanfattning: Varför skall man binärkoda över filen till ena-binär fil, när man sen skall återskapa denna till exempelvis tiff för att kunna se orginalet, tiff =>ena-binärfil=>tiff. Här finns risk för informationsförlust. Varför bevarar vi inte filen som en tiff utan konvertering? Normalisering, att konvertera över fil till normaliserat ena-format för att sen konvertera vid efterfrågan till ett tillgängliggörande format. Hur känslig är ena-formatet mot bitförändringar? Dvs. liten förändring i ena-fil kan kanske ge ett större fel på en tillgängliggörande fil. Att använda ena i sitt arkiv medför att digitala objekt hanteras annorlunda, här är de digitala objekten stabila. Däremot måste allt bevarande läggas ner på att vi skall lyckas med att konvertera ena-formatet till ett tillgängliggörande format. Vi måste ha full kontroll på ena och kunna flytta programvaran genom olika tekniska plattformar över tiden samt ha färdiga formatmoduler (kodade formatmoduler) för morgondagens format.
Göran Lindqvist 0921-57307 2008-10-03 0.1 9 (14) BILAGA DROID <?xml version="1.0" encoding="utf-8"?> <FileCollection xmlns="http://www.nationalarchives.gov.uk/pronom/filecollection"> <DROIDVersion>3.0</DROIDVersion> <SignatureFileVersion>13</SignatureFileVersion> <DateCreated>2008-09-30T12:48:36</DateCreated> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Wave.wav</FilePath> <Name>Waveform Audio</Name> <PUID>fmt/6</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_OpenOffice2.odt</FilePath> <Name>OpenDocument Text Format</Name> <Version>1.0</Version> <PUID>fmt/136</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_WMA.wma</FilePath> <Name>Windows Media Audio</Name> <PUID>fmt/132</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Excel4.LS</FilePath> <Name>Binary Interchange File Format (BIFF) Worksheet</Name> <Version>4S</Version> <PUID>fmt/57</PUID> <MimeType>application/vnd.ms-excel</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_mpeg2.mpg</FilePath> <Name>MPEG-1 Video Format</Name> <PUID>x-fmt/385</PUID> <Name>MPEG-2 Video Format</Name> <PUID>x-fmt/386</PUID> <IdentificationFile IdentQuality="Tentative" > <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Jpeg2000_p1.jp2</FilePath> <Name>JPEG 2000</Name> <PUID>x-fmt/392</PUID>
Göran Lindqvist 0921-57307 2008-10-03 0.1 10 <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Word6.doc</FilePath> <Name>Microsoft Word for Windows Document</Name> <Version>6.0/95</Version> <PUID>fmt/39</PUID> <MimeType>application/msword</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_orgTiff22.TIF</FilePath> <Name>Exchangeable Image File Format (Uncompressed)</Name> <Version>2.2</Version> <PUID>x-fmt/387</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Word2003.doc</FilePath> <Name>OLE2 Compound Document Format</Name> <PUID>fmt/111</PUID> <IdentificationWarning>Possible file extension mismatch</identificationwarning> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_orgBMP93.bmp</FilePath> <Name>Windows Bitmap</Name> <Version>3.0</Version> <PUID>fmt/116</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_orgQT.MOV</FilePath> <Name>Quicktime</Name> <PUID>x-fmt/384</PUID> <MimeType>video/quicktime</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_mpeg1.mpg</FilePath> <Name>MPEG-1 Video Format</Name> <PUID>x-fmt/385</PUID> <Name>MPEG-2 Video Format</Name> <PUID>x-fmt/386</PUID> <IdentificationFile IdentQuality="Tentative" > <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_mpeg1L3.mp3</FilePath>
Göran Lindqvist 0921-57307 2008-10-03 0.1 11 <Name>MPEG 1/2 Audio Layer 3</Name> <PUID>fmt/134</PUID> <IdentificationFile IdentQuality="Tentative" > <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Mid.mid</FilePath> <Name>MIDI Audio</Name> <PUID>x-fmt/230</PUID> <IdentificationFile IdentQuality="Tentative" > <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Unicode8.txt</FilePath> <Name>Tab-Delimited Text File</Name> <PUID>x-fmt/13</PUID> <Name>Macintosh Text File</Name> <PUID>x-fmt/14</PUID> <Name>MS-DOS Text File</Name> <PUID>x-fmt/15</PUID> <Name>Unicode Text File</Name> <PUID>x-fmt/16</PUID> <Name>Fixed Width Values Text File</Name> <PUID>x-fmt/110</PUID> <Name>Plain Text File</Name> <PUID>x-fmt/111</PUID> <Name>MS-DOS Text File with line breaks</name> <PUID>x-fmt/130</PUID> <Name>IBM DisplayWrite Document</Name> <Version>2</Version> <PUID>x-fmt/288</PUID>
Göran Lindqvist 0921-57307 2008-10-03 0.1 12 <Name>IBM DisplayWrite Document</Name> <Version>3</Version> <PUID>x-fmt/289</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Works6_7.wps</FilePath> <Name>OLE2 Compound Document Format</Name> <PUID>fmt/111</PUID> <IdentificationWarning>Possible file extension mismatch</identificationwarning> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_PNG.png</FilePath> <Name>Portable Network Graphics</Name> <Version>1.1</Version> <PUID>fmt/12</PUID> <MimeType>image/png</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_RTF.rtf</FilePath> <Name>Rich Text Format</Name> <Version>1.0</Version> <PUID>fmt/45</PUID> <MimeType>text/rtf</MimeType> <Name>Rich Text Format</Name> <Version>1.1</Version> <PUID>fmt/46</PUID> <MimeType>text/rtf</MimeType> <Name>Rich Text Format</Name> <Version>1.2</Version> <PUID>fmt/47</PUID> <MimeType>text/rtf</MimeType> <Name>Rich Text Format</Name> <Version>1.3</Version> <PUID>fmt/48</PUID> <MimeType>text/rtf</MimeType> <Name>Rich Text Format</Name> <Version>1.4</Version> <PUID>fmt/49</PUID> <MimeType>text/rtf</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_InbäddatLjudWord2003.doc</FilePath>
Göran Lindqvist 0921-57307 2008-10-03 0.1 13 <Name>OLE2 Compound Document Format</Name> <PUID>fmt/111</PUID> <IdentificationWarning>Possible file extension mismatch</identificationwarning> <IdentificationFile IdentQuality="Tentative" > <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_ISO8859.txt</FilePath> <Name>Tab-Delimited Text File</Name> <PUID>x-fmt/13</PUID> <Name>Macintosh Text File</Name> <PUID>x-fmt/14</PUID> <Name>MS-DOS Text File</Name> <PUID>x-fmt/15</PUID> <Name>Unicode Text File</Name> <PUID>x-fmt/16</PUID> <Name>Fixed Width Values Text File</Name> <PUID>x-fmt/110</PUID> <Name>Plain Text File</Name> <PUID>x-fmt/111</PUID> <Name>MS-DOS Text File with line breaks</name> <PUID>x-fmt/130</PUID> <Name>IBM DisplayWrite Document</Name> <Version>2</Version> <PUID>x-fmt/288</PUID> <Name>IBM DisplayWrite Document</Name> <Version>3</Version> <PUID>x-fmt/289</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_avi.avi</FilePath>
Göran Lindqvist 0921-57307 2008-10-03 0.1 14 <Name>Audio/Video Interleaved Format</Name> <PUID>fmt/5</PUID> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Gif89a.gif</FilePath> <Name>Graphics Interchange Format</Name> <Version>1989a</Version> <PUID>fmt/4</PUID> <MimeType>image/gif</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_PDF1-2.pdf</FilePath> <Name>Portable Document Format</Name> <Version>1.2</Version> <PUID>fmt/16</PUID> <MimeType>application/pdf</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Jpeg.jpg</FilePath> <Name>JPEG File Interchange Format</Name> <Version>1.02</Version> <PUID>fmt/44</PUID> <MimeType>image/jpeg</MimeType> <FilePath>C:\Documents and Settings\Göran Lindqvist\Skrivbord\TestDROID\TESTFIL_Word2.DOC</FilePath> <Name>Microsoft Word for Windows Document</Name> <Version>2.0</Version> <PUID>fmt/38</PUID> <MimeType>application/msword</MimeType> </FileCollection>