Digital långtidslagring LÅNGTIDSLAGRING AV ADB - UPPTAGNINGAR Underlag för framtagning av kravspecifikation för leveranser av data ur ADB - system och rutiner kring långtidsbevarande Vid framtagning av underlaget användes dels gällande föreskrifter i Riksarkivets författningssamling, dels praktisk erfarenhet av bevarande av data levererad under åren 1999-2003 till Region- och Stadsarkivet Göteborg. REGION- OCH STADSARKIVET GÖTEBORG 2005
INNEHÅLLSFÖRTECKNING Sammanställning över grundkrav...5 Databärare: CD-skivor av typ CD-R (SS-ISO 10149)...5 Arkivfilformat...5 Dokumentation: systemdokumentation och förståelsedokumentation...6 Metadata för långtidsbevarande...6 ADB-system relaterade förutsättningar för bevarande...7 Kategorier av ADB-upptagning...7 Avställning av inaktiva uppgifter och avställning vid avveckling...7 Avställning och migrering till arkivdatabas...7 Handlingar och datamängder vid avställning...8 Datamängder och arkivvolymer, teknisk proveniens...8 Rutiner kring ADB-leveranser och långtidslagring...9 Kontroll av data vid leverans (bilagor 1A 1D)...9 Registrering av digitala leveranser i dataliggaren...9 Konvertering av data...9 Arkivdatabas...9 Rutiner kring ADB-leveranser: SCHEMA...10 Ett praktiskt fall: Elev och betygshistorik 1989-2001 f.d. ELIN...11 Bakgrund...11 Arkivering (långtidsbevarande)...11 Arkivdatabas ELIN...11 Bilaga 1A: Leveransexempel (mediatyp: magnetisk media)...12 Bilaga 1 B: Kontroll av arkivfilformat : exportfilen för tabellen BETYG från ELIN...13 Bilaga 1C: Kontroll av datarepresentation i en arkivfil: förekomst av styrtecken...14 Bilaga 1D: Kontroll av dataorganisation i en arkivfil : exportfilen för tabellen SKOLA från ELIN...15 Bilaga 2A: Registrering av dataleverans i leveransliggaren...16 Bilaga 2B: Registrering i dataliggaren...17 Bilaga 3A: ELIN-databaser i Göteborgs kommun, översikt...18 Bilaga 3B: Tabeller i Elin, översikt...23 Bilaga 4A: Databärare, CDR med ELIN-arkivfiler...24 Bilaga 4B: Databärare, biblioteksstruktur på ELIN-arkivcd...25 Bilaga 4C: Arkivfilexempel (arkivfil från ELIN CD)...26 Bilaga 5A: Postbeskrivning : förståelsedokumentation på arkiv-cd...27 Bilaga 5B: Transaktionsbeskrivning för arkivfiler...28 Bilaga 6A: Arkivdatabas ELIN : rekonstruktion från arkivfiler...29 Bilaga 6B: Datastruktur och relationer i arkivdatabasen ELIN...30 Bilaga 7A: Sökbilder i arkivdatabasen ELIN...31 Bilaga 7B: Elev- och betygshistorik i arkivdatabasen ELIN...32 Bilaga 7C: ELIN arkivprojekt, sammanfattning: avställning...33 Bilaga 7D: ELIN arkivprojekt, sammanfattning: arkivbildning och förteckning...34 Kravspecifikation för arkivdatafiler... 35 Något om arkivterminologin...35 Definition...35 Dataformat (filformat, teckenrepresentation, kodning av tecknens binära mönster)...35 Datastruktur och dataorganisation...36 Metadata och dokumentation...36 Kommentarer...36 Bilaga 1: Arkivfilformat för elektroniska dokument...39 Leverantörsberoende format: 39 Leverantörsoberoende: format (ISO) 39 Dokumentbildformat 40 Standardisering: referenser 40 Bilaga 2: Rekommendation för arkiv-cdr...43 Databärare för långtidsbevarande 44
Dataorganisation och namnutrymme i ADB arkivet... 45 1. Hierarkisk och flat dataorganisation...45 2. Konsekvenser vid datamigrering, mediagenerationsskifte:...45 3. I online-arkiv skikt kan en systemberoende hierarki tillämpas med fördel...45 4. Kravspecifikation och namnutrymme i ett ADB-arkiv...46 Avställning av data ur Profdocsystemet, principer... 47 Långtidsbevarande av data...47 Funktion för snabb åtkomst av avställda Profdocjournaler...48 Motivering...48 Avställning av räkenskaper... 49 Avställningsrutiner steg för steg...49 Kontroll av dataintegritet vid avställning av räkenskaper...50 Bilder:... 51 Bild 1: ADB-upptagning och ADB-system, dokument- och process schema...51 Bild 2: Datamängder och arkivvolymer vid avställning...52 Bild 3: Baskategorier av ADB-upptagning och arkivfiler vid avställning...53 Bild 4: Systemkategorier och dokumenttyper vid avställning...54 Bild 5: ORM Model för ett ADB-arkiv...55 Bild 6: Långtidslagring av ADB-upptagningar, Orsak och Verkan Diagram...56 Bild 7: Regionarkivets ADB-Arkiv...57 Bild 8: Regionarkivets arkivserver för räkenskaper...58 Bild 9: Uppbyggnad av långtidslagring, lägesbeskrivning, skiss...59 Bild 10 Schema för arkivdokumenthantering i ADB-Arkivet...60 Bild 11 Handling- och dokumentstruktur vid bevarande i ADB-arkivet...61 Ansvar vid Regionarkivet: Jerzy Misiewicz tel: 031-701 19 67(direkt) e-post: jerzy.misiewicz@arkivnamnden.goteborg.se Region- och Stadsarkivet Göteborg Box 2154, 403-13 Göteborg Web: http://www.arkivnamnden.se Dokument skapat 2005-05-12
Sammanställning över grundkrav Komplement till Regionarkivets kravspecifikation från 1999-06-09 (se sid. 35: Kravspecifikation för arkivdatafiler, se även exempel på aktuell tillämpning på sid. 36: Avställning av data ur Profdocsystemet, principer,) Databärare: CD-skivor av typ CD-R (SS-ISO 10149) - data kan bara skrivas en gång på CD-ROM / CD-R media och går ej att radera, det är viktigt att skilja mellan CD-ROM (kräver mastering och en viss upplaga) och CD-R (bränns i valfritt antal) - dataorganisation på CD-ROM och CD-R media regleras av ISO 9660 standard [SS-ISO 9660: 1988 Datadisposition - CD-ROM - Volym- och filstruktur] (bl.a. filnamn får inte vara längre än 8 tecken + 3 för filtypbeteckning och får innehålla endast tecken {A..Z, 0..9, _}, ISO Level 1) - arkivfiler bör förses med unika filnamn vid avställning och ordnas i en flat biblioteksstruktur på databäraren (motivering: se sid. 45, Dataorganisation och namnutrymme i ADB-arkivet) - CD-R som innehåller avställd data bör framställas i flera exemplar (minst två) av godkänd för långtidslagring media (aktuell rekommendation: se sid. 43) Arkivfilformat - teckenpresentation i en arkivfil är systemoberoende och regleras av ISO-8859-1 (Latin 1) standard för 8 bitars teckenuppsättning (får ej förväxlas med DOS Latin1, IBM format, utökad ASCII) - dataorganisation: sekventiell textfil där varje datarad utgör en dataenhet (post) av en viss fast bredd, som består av ett antal dataelement (fält) med fast bredd (kolumner i arkivfilen.) med undantag för dokumentdatabaser där avställning sker på dokumentnivå - styrtecken (tecken i ascii område 0-31 decimalt, 0-1F hexadecimalt) får ej förekomma i arkivfiler då dessa är systemberoende med undantag för nedstegningstecken (eller radbyte, <LF> Line Feed, ascii värde: 0A hexadecimalt, 10 decimalt) och radreturtecken (<CR>, Carriage Return, ascii värde: 0D hexadecimalt, 13 decimalt). OBS: i vissa andra arkivfiler, som t.ex. konverterade bilagor, även tecken för sidbyte <FF>, (Form Feed, ascii värde 0C hexadecimalt, 12 decimalt) - diverse länkade och inbäddade elektroniska dokument / dokumentbilagor i leverantörsberoende format, som saknar fördefinierad logisk struktur (typ DTD), såsom dokument skapade med ordbehandlare, dokumentmallar, blanketter, tabulerade dokument, kalkylblad och liknande bör i första hand konverteras till ISO 8859-1 textfiler. - för att bevara ovan nämnda dokumentens specifika egenskaper, stil, layout, överstrykningar, understrykningar, grafiska logotyper, signaturer m.m. bör dessa även konverteras till dokumentbilder vid sidan om arkivfiler i textformat vilket garanterar att dokument kan läsas i framtiden och skrivas ut i originalskick (autenticitet), och kringgår sådana problem som beskrivning av dokumentets utseende (som style sheet i XML: XLS), arkivbevarande av proprietära, licensierade typsnitt tillsammans med dokument m.m. Ett lämpligt ISO- standardformat för detta är TIFF, undergrupp TIFF group 4 (TIFF CCITT group 4, se sid. 40, Leverantörsoberoende format), ett format som används för lagring av stora volymer av inskannade dokument av standard A4 format som journaler, fakturor och liknande. 5
Dokumentation: systemdokumentation och förståelsedokumentation Ur Riksarkivets leveransbok: : (Kapitel 4.3) Annan dokumentation För ADB-upptagningar gäller att ett representativt urval av den dokumentation som har upprättats under driften av systemet eller sammanställts, och en dokumentation över framställningen av ADB-upptagningarna skall bifogas. I praktiken krävs: - systemdokumentation: från det ursprungliga ADB-systemet: pärmar, manualer, användarhandböcker med beskrivning av in- och utdata, beskrivning av rutiner för registrering- och uttag (formulär, rapporter, skärmbilder mm), sökrutiner mm - förståelsedokumentation på arkiv-cd: tabellöversikt, postbeskrivning med förklaring för varje kolumn/fält i klartext, transaktionsbeskrivning Metadata för långtidsbevarande När det gäller metadata så saknas det i leveransböcker rekommendationer på detaljnivå likvärdig den som gäller arkivhandlingar på papper och mikrofilm. Om man bortser från SGML, som är gällande standardformat för bevarande av strukturerad information, då majoriteten av befintliga ADB-system saknar implementering av datauttag i SGML-format, finns det ingen annan standard för metadata för långtidsbevarande. (XML, som är mera lätthanterlig och således kostnadsmässigt mera realistisk substandard av SGML, är inte riktigt etablerad än). Däremot finns ett antal de facto industristandarder som huvudsakligen utvecklades i praktisk databashantering och för migrering av information i samband med systemgenerationsskifte. Av dessa är SQL-standarden den mest kraftfulla men samtidigt i högt grad leverantörsberoende. (numera ISO-standard, se sid.40: Standardisering: referenser) Vad som återstår är ett antal leverantörsoberoende tekniker som utvecklades vid export och import av data mellan olika databasmiljöer (export och import i ASCII textformat). För att kunna bevara struktur, sammanhang och mening i datamängder avställda från ADBsystem till arkivfiler krävs det att kvarlevor av dessa system (arkivdata) kompletteras med någon form av metadata och förståelsedokumentation som skulle lagras digitalt tillsammans med arkivfiler på CD-R. I det första fallet handlar det om information som möjliggör maskininläsning av arkivfiler (transaktionsbeskrivning) och återskapande av information på ett strukturerad och sammanhängande sätt (datastruktur- / postbeskrivning, relationer, indexering) vilket gör i sin tur återinförande av strukturerad sökbarhet möjligt. I det andra fallet gäller det dels att ha tabell- och kolumnöversikter för alla avställda tabeller som metadata på arkiv-cd, men även att all slags yrkes- och verksamhetsorienterad kodning av information (förmodligen helt obegriplig i framtiden) kan läsas i klartext och tolkas rätt. (värdelistor /tabeller för dessa koder bör finnas i avställd datamängd som separata arkivfiler och följaktligen även tabell- och kolumnöversikter för koddelar med förklaringar i klartext). 6
ADB-system relaterade förutsättningar för bevarande Kategorier av ADB-upptagning Beroende på det ursprungliga systemets specifika egenskaper kan olika kategorier av ADB-upptagning urskiljas: - Enkelt dataregister, en helt flat struktur och ingen normalisering. Kräver ingen strukturering av information som skall arkiveras, d.v.s. bevaras i sin helhet. Avställd data ligger i en datafil med en posttyp. Exempel: Rosinante (register över utbetalad socialhjälp m.m., tidigt 1980-tal) - Hierarkiskt dataregister: hierarkisk datastruktur av typ Parent-Child (Huvudpost-Delpost). I det ursprungliga systemet binds data med fysiska pekare. Enda sättet att ställa av data är att dumpa hela strukturen i en arkivfil där huvudposter ligger sekventiellt ordnade med alla tillhörande delposter, m.a.o. arkivfilen innehåller två olika posttyper. Posttypen kan tex. urskiljas tack vare etikettmärkning (label-märkning) av huvudposter och delposter. (Exempel: Socialförvaltningens diarium Albert eller PÄR- diarium för Skaraborgs läns landsting, Mariestad) - Enkel relationsdatabas. Ett fåtal tabeller med få relationer mellan tabellerna. En sådan databas är skräddarsydd för sitt ändamål och innehåller endast relevant information, skall därför bevaras på samma sätt som enkelt dataregister, i sin helhet. (exempel: Ärendehanteringssystem ÄHSV i Vänersborg (diarium för Älvsborgs läns landsting) eller Göteborgs stads grundskoleelevregister ELIN. - Stora, komplexa (anpassningsbara) relationsdatabaser med en stor mängd (hundratals) tabeller och relationer. Dessa kräver analys och förstudier, strukturering av arkivinformation, provleveranser, och gallring av uppgifter som ej skall bevaras. Kräver kvalificerad expertis och konsulthjälp då risken för informationsförlust uppstår när urval för arkivering genomförs. (Exempel: Göteborgs stads system för studiedokumentation inom vuxenutbildning GERDA) Avställning av inaktiva uppgifter och avställning vid avveckling Vidare behöver man skilja på bevarande av information från ADB-system som tas helt ur drift (tex. nedlagda föråldrade ADB-system) och ställs av i sin helhet och datasystem som ställs av delvis genom periodiskt datauttag och under fortsatt drift. I det andra fallet måste den delen av data som tas med i avställningen vara strukturerad på ett sådant sätt att kontinuiteten av information kan bevaras mellan avställningarna och så att inga informationsförluster uppkommer. Hantering av urvalsfrågor som tas till hjälp vid en sådan avställning ligger på expertnivå och kräver konsulthjälp. En bred kunskap om relationsdatabaser krävs även hos arkivarier för att strukturera information som skall arkiveras på ett rätt sätt (kunskap om normalisering, indexering, relationer m.m.) Generellt arkivering utav äldre datasystem kan vara arbetsmässigt omfattande och tidskrävande. Datasystem som installerades på 90-talet har däremot, tack vare tex. inbyggd stöd för ODBC (Open database connectivity) bättre förutsättningar för långtidsbevarande rent tekniskt, då data kan tas ut / ställas av från en annan plattform, även via fjärruppkoppling. Således uppstår möjlighet för direkt migrering av data till en arkivdatabas. Avställning och migrering till arkivdatabas Migrering till en arkivdatabas borde ses som ett komplement till avställning och inte som ett alternativ till långtidsbevarande på ett arkivmässigt korrekt sätt, d.v.s. anpassning och långtidslagring av data i ett leverantörsoberoende arkivfilformat (ISO) och med hjälp av standardiserad och arkivbeständig media. Däremot bör åtkomsten till arkiverade datamängder alltid upprättas genom en arkivdatabas som fullständigt baserar på den ordningen som skapades vid avställning. 7
Handlingar och datamängder vid avställning När handlingar som diarieförda ärenden, betyg, journaler, räkenskaper blir bundna till ADB-teknik förvandlas dessa via systemteknisk bearbetning såsom objekt- och datamodellering, normalisering och programmering till datamängder därvid handlingen blir uppdelad i diverse dataobjekt. Ett betyg t.ex. ligger uppdelat i flertal relaterade tabeller, eftersom ämne, kurs, elev, tentamen, kursmall är olika objekt i systemet och representerar information som kan samlas och sammanställas endast av själva programmet i ett dokument som betyg eller betygskatalog. Det är en utpräglad ADB-teknisk ordning som gäller i datasamlingen i ett IT-system. I arkivhanteringen däremot ordnar man kompletta handlingar i enlighet med proveniens efter arkivbildare, serier och volymer då dessa skall sparas för alltid såsom ordnade dokument. Eftersom det är i programskiktet som handlingar återskapas från underliggande datamängder i ett ADB-system, och programskiktet går ej att långtidsbevara, måste datamängder anpassas för långtidslagring, struktureras på ett särskilt sätt, konverteras, dokumenteras o.s.v. Datamängder blir föremål för avställning, överföring till en ordning och format särskild anpassade för långtidslagring. Datamängder som ställs av skall dels bevaras i sin strukturerad form som arkiverat registerdata för att bevara ADB-tekniska informationsegenskaper, framför allt strukturerad sökbarhet och även i form av dokumentuttag (såsom vid utskrift) om det vid avställning går att genomföra ett dokumentuttag till datafiler. (Se sid.47 Avställning av data ur Profdocsystemet, principer). Således säkras både handlingarnas sökbarhet och autenticitet vid avställningen. Datamängder och arkivvolymer, teknisk proveniens Datamängder i ett ADB-system genererar arkivvolymer på liknande sätt som handlingar på papper även om de digitala volymer kan rymma flera hundra hyllmeter av papper och även om digitala volymer p.g.a. framtida förflytningar mellan databärare ej kan fixeras på samma sätt jämförelsevis. Förteckningsmässigt innehåller volymen av data avställd t.ex. från sociala tjänstens informationssystem, en årlig tömning av inaktiva uppgifter från alla ärende, som var avslutade vid tidpunkten fem år före avställningen alternativt, att inga nya handlingar har tillförts ärende under de fem år som föregått avställningen (se Bild 2. Datamängder och arkivvolymer, sid. 52) Normalt åtföljs avställningen av data från socialtjänstens informationssystem med utplockning och motsvarande avställning och leverans till arkivmyndigheten av den pappersbundna delen av socialakten som finns hos den berörda sociala myndigheten. Digitala media, t.ex. CD-R skivor, har till skillnad från papper och papperskartonger en begränsad beständighet och variabelt kapacitet (utrymme). Ett digitalt medium typ CD-R, som används idag har plats för data som för 15 år sedan krävde flera hundra 3.5 tums disketter. För att kunna hålla sig till begreppet volymer på ett arkivmässigt korrekt sätt vid förteckning av handlingar i det digitala beståndet bör man betrakta volymer i beståndsregistret såsom luftvolymer, då endast en hänvisning görs i arkivförteckningen till ett annan liggare som definierar och avgränsar de egentliga fysiska digitala volymer, förtecknar dessa, följer upp mediamigrering och annan behandling samt anger plats där media bevaras (dataliggare) (se även Bilaga 7D- ELIN-arkivprojekt, sammanfattning: arkivbildning och förteckning, sid.34). En annan viktig faktor vid den digitala arkivbildningen är teknisk proveniens. Det är ganska vanligt idag att ett IT-system omfattar data från flera olika arkivbildare och att själva systemet förvaltas och administreras av en annan myndighet, organisation eller företag (som sköter systemets drift men även kontrollerar och säkerställer den egentliga arkivbildningen). Detta återspeglas i arkivförteckningen med en hänvisning till den arkivbildande myndighetens /organisationens arkiv (arkivnummer) från samtliga berörda arkivbildare. (se bilaga 7D- ELINarkivprojekt, sid.34) Vid avställning av data från ett sådant IT-system som omfattar flera arkivbildare bör handlingar tillhörande respektive myndighet skiljas åt och datamängder som tas ut anpassas efter detta. 8
Rutiner kring ADB-leveranser och långtidslagring Kontroll av data vid leverans (bilagor 1A 1D) - kontroll av media (mediaformat och läsbarhet) - säkerhetskopiering av media (ofta levereras i ett exemplar) - kontroll av arkivfilformat, datarepresentation och dataorganisation - kontroll av förekomst av styrtecken i arkivfiler - kontroll av metadata / dokumentation Registrering av digitala leveranser i dataliggaren - för innehåll se bilaga 2A och 2B - observera att journal för bevakning av avställda ADB-upptagningar är inbyggd i dataliggaren (behandlingsjournal och omlagringshistorik) där all behandling och utlåning registreras. Konvertering av data - teckenrepresenation i 7-bitars ASCII och 8-bitars utökad ASCII format kräver konvertering av levererade filer till ISO-8859-1 och framställning av nya arkivfiler/ nya CD-R skivor i efterhand med korrekt teckenrepresentation för långtidsbevarande. Om det ursprungliga systemet saknar stöd för export i fast bredd filformat kan data först ställas av tex. som koma avgränsade poster med citationstecken för fältdata (utan transaktionsbeskrivning) och sedan läsas in på nytt (tex. i Access ) och exporteras på nytt i fast bredd format (korrekt arkivfilformat) därvid transaktionsbeskrivning skapas och sparas med på arkiv-cd-r. (se bilagor 5B, 6A) - data levererad i leverantörsberoende format (program och datafiler) p.g.a. att det ursprungliga systemet saknar helt exportfunktioner kan i vissa fall tas ut med hjälp av utskriftsrutiner (t.ex., totalutskrift) och en omdirigering av utskriftsdata till en textfil i pc-dos format, som sedan kan konverteras till en arkivfil i ISO 8859-1 format - metadata levererat såsom Microsoft Word- eller Excel-filer bör konverteras till utökad ASCII textformat ISO 8859-1 Arkivering på CD-R (cd-bränning) - media som väljs skall vara CD-R-media av känd, och väl uttestad typ (tex. Kodak gold) - filstrukturen och filnamn på arkiv-cd måste följa ISO-9660 standard för data CD-ROM - alla arkivfiler skall brännas under samma pass / CDR-session som följaktligen måste vara stängd för tillägg - minst två exemplar av arkiv-cd skall brännas (original och kopia) med helst två olika mediafabrikat, för att garantera att minst ett exemplar går att läsa i framtiden - en rutin för omlagring / duplicering av arkiv-cd skall utarbetas Arkivdatabas När det tekniska arbetet med långtidsbevarande är avslutad bör en arkivdatabas skapas för att möjliggöra snabb framtagning av data/information i samband med förfrågningar från allmänheten eller i samband med forskning. Huvudfördelen med en arkivdatabas / arkivserver är att data från många tekniskt olika plattformer rekonstrueras i en och samma systemmiljö på en arkivplattform (arkivserver) med ett likformigt gränssnitt mot användare (forskare och arkivarier) där internationellt standardiserat frågespråk (SQL.) används för sökning i olika arkivdatabaser (se skärmbilder, bilaga 7A och 7B). Då data inte längre ligger i så många tekniskt olika miljöer kan även WEB- gränssnitt implementeras. Arkivdatabaser med sekretess belagda uppgifter kan tillgängliggöras i arkivverksamheten via en terminal server. Behandlingsjournal, motsvarande den som finns i dataliggaren kopplas till samtliga arkivdatabaser såsom arkivserverlogg. 9
Rutiner kring ADB-leveranser: SCHEMA Nedan presenterad schema ger en förenklad bild av rutiner kring ADB-leveranser och dess hantering. T.ex. begreppet arkivering på CD-R omfattar alla specifika moment vid cd-arkivering, såsom duplicering av media, märkning och registrering av fysiska cd-volymer m.m. 10
Ett praktiskt fall: Elev och betygshistorik 1989-2001 f.d. ELIN (ELevINformation) Bakgrund Fram till december 1997 fanns ingen databas med uppgifter för centrallagring inom Göteborgs kommun. Alla grundskolor hade sina egna lokala Elin-databaser med säkerhetskopior (backup) på disketter som skulle bevaras i tio år (inget bevarande/gallringsbeslut fanns, det var en internt påhittad regel). 2001-10-16 levererades till regionarkivet 84 st. 3.5 tums disketter med Elin databasfiler från respektive rektorsområde med tillhörande grundskolor (sammanlagt 214 skolor från 71 rektorsområde) för åren 1989-2001 plus en IBM/PS2 PC med Elin-programmet samt 2 st. dokumentationspärmar. Arkivering (långtidsbevarande) För att kunna bevara uppgifter från Elin för framtiden återinstallerades Elin-databaser skola för skola i sin ursprungliga miljö på en IBM/PS2 med OS-2 operativsystem och samtliga 27 tabeller ställdes av i koma avgränsat textformat (med citationstecken för fältdata) till arkivfiler, 27 filer för varje rektorsområde. Bevarande av data i koma avgränsat textformat rekommenderas inte bl.a. därför att det förekommer citationstecken och komma i själva fältdata vilket orsakar att datarader kan ej tolkas entydigt (fältordningen inom dataposter bryts). Därför lästes arkivfiler för respektive rektorsområde in i en tom Access-databas, tabell för tabell enligt postbeskrivning i Elin-dokumentationen och exporterades på nytt till arkivfiler såsom flata textfiler med fastbredd både för post och datafält inom en post därvid en transaktionsbeskrivning för varje tabell avställd till arkivfil sparades i textformat såsom metadata gemensam för alla rektorsområde. Arkivdatabas ELIN En arkivdatabas i Access-format (mdb) konstruerades där uppgifter från nyckeltabeller (Elev, Klass, Lärare, Betyg, Nybetyg, Skolgång) sammanfogades och elev- och betygshistorik för hela Göteborg för åren 1989-2001 har åstadkommits med möjlighet at få fram betyg och skolgång för ca. 100 000 registrerade elever med personnummer som nyckel och klasslistor med läsår, årskurs och skolnamn som nyckel. Vidare migrerades Access-databasen med elev- och betygshistorik till en arkivserver (SQL-server) såsom skrivskyddad arkivdatabas. 11
Bilaga 1A: Leveransexempel (mediatyp: magnetisk media) OBS: media ej lämplig för långtidsbevarande Grundskoleelevregister ELIN : 3.5 tums FD-disketter (floppy disk) Dataliggare: media Socialtjänstens register över utbetalt stöd ROSINANTE: 8mm magnetband Dataliggare: media 12
Bilaga 1 B: Kontroll av arkivfilformat : exportfilen för tabellen BETYG från ELIN De ursprungliga ELIN-filer levererades såsom databasens backupfiler på disketter. Databasen för respektive rektorsområde återinstallerades på en OS/2 maskin och därefter exporterades alla tabeller såsom koma avgränsade dataposter till ascii-filer då databasen saknade stöd för export i fast bredd format, och följaktligen blev datarader i arkivfiler av olika längd. Observera att data representeras i exempelfilen med IBM dos-latin 1 och inte ISO 8859-1 13
Bilaga 1C: Kontroll av datarepresentation i en arkivfil: förekomst av styrtecken Förhandsgranskning av innehåll i exportfilen ELEV.TXT från ELIN-databasen för rektorsområde SDF-ÄLVSBORG (OS2-operativsystem, DB2 databas) Kontroll av teckenrepresentation (ASCII-text), förekomst av styrtecken: Styrtecken markerad på bilden nedan (en högerpil, hexadecimal kod 1A, decimal 26 ) betecknas som SUB (substitute) och upfattas av till exempel Windows OS som filslutmarkering. Detta orsakar trunkering (avkortning) av arkivfilen vid konvertering till ISO-format och dataförlust (arkivfilen innehåller efter konvertering endast tecken fram till styrtecknet där filen blir avkortad). Ett annat styrtecken av det här slaget är nedåtpil (hexkoden 19, decimal 25) vilket betecknas som EM (End of Medium) OBS: Programmet som används för granskning är en binär editor (redigeringsprogram för stora binära filer) 14
Bilaga 1D: Kontroll av dataorganisation i en arkivfil : exportfilen för tabellen SKOLA från ELIN 15
Bilaga 2A: Registrering av dataleverans i leveransliggaren (se Acc.nr 120/2001 och 121/2001) Leveranskvitto: 16
Bilaga 2B: Registrering i dataliggaren OBS: ett underformulär för bevakning av det digitala arkivet (registrerade arkiv-cd) är inbyggd i dataliggaren (se under fältrubrik Bevarande historik ). Detta förutsätter att det finns en teknisk rutin för omlagring av arkivskivor. 17
Bilaga 3A: ELIN-databaser i Göteborgs kommun, översikt Översikt över ELIN (ELevINformation) databaser i Göteborg Databasen kommer ifrån Skolor i databasen Elin Skolkod SCB kod Kommentar Gårdstensskolan Gårdstensskolan GÅGÅ 11305 Långmosseskolan GÅLÅ 25601 Nya Lövgärdesskolan Nya Lövgärdesskolan LÖLÖ 12901 Räveberget skola LÖRÄ 25701 Tretjärnsskolan LÖTR 25801 Rannebergen Centrumskola Rannebergen Centrumskola RCRC 13502 Rannebergen Södra RCRS 22001 Vättleskolan Gunnaredsskolan VÄGU 22101 Vättleskolan VÄV 22201 Trädgårdsgärdet VÄTG 32001 Bläseboskolan Bläseboskolan BBB 13001 Bergsgårdsskolan Bergsgårdsskolan BDB 27201 Bergums skola Bergums skola BGBS 19001 Gunnilseskolan BGG 19002 Björsaredsskolan BGBJ 19003 Eriksboskolan Eriksboskolan ERE 13002 Hammarkullsskolan Hammarkullsskolan HAH 10501 Hjällbo Gård HAHG 10502 Skoldaghemmet HASK 26702 Bredfjällsskolan HABG 26701 Hammarkullsskolan L-M HAHK 26801 Röseredsskolan HARÖ 26802 Terapiskolan HATE 26703 Hjällboskolan Hjällboskolan HJH 10601 Nytorpsskolan Nytorpsskolan NYNY 26601 Gamlestadsskolan Gamlestadsskolan H GAGH 01801 Gamlestadsskolan LM GAGA 16701 Heldagsskolan LK GALK 30901 Strändängsledet GAST 33901 Ramsdalsskolan Ramsdalsskolan KSRA 16602 Utmarksskolan Utmarksskolan K4UT 24901 Talldungeskolan Talldungeskolan TATA 03501 Lövåsskolan TALÅ 30801 Fjällboskolan Fjällboskolan UTFJ 16801 Utbynässkolan UTUT 27604 18
Bergsjöskolan Bergsjöskolan H BEB 01901 Kometskolan BEK 01903 Bergsjöskolan LM BEBS 20601 Backegårdsskolan BEBM 20801 Gärdsmosseskolan Gärdsmosseskolan GÄ1 20701 Sandeklevsskolan Sandeklevsskolan SN1 10801 Solbackeskolan Solbackeskolan SO1 11501 Kålltorpsskolan Kålltorpsskolan, L M KÅK1 01501 Parkskolan KÅRE 01509 Rosendalsskolan KÅR 31701 Fräntorpsskolan KÅÄ3 31801 Vidkärrsskolan KÅÄ4 31802 Ättehögsskolan KÅÄ 31803 Klinikskolan BUP "DUVAN" KÅD 31805 Kålltorpsskolan H KÅK2 31901 Nya Lundenskolan Nya Lundenskolan ÖRLN 01601 Gamla Lundenskolan ÖRGL 01602 Bagaregårdsskolan ÖRBA 01604 Kärralundsskolan ÖRK 01605 Skårsskolan ÖRS 01606 Ånässkolan ÖRÅ 01607 Buråsskolan Buråsskolan BSBS 00501 Guldhedsskolan Guldhedsskolan GU5 01002 Mossebergsskolan GU6 01003 Landalaskolan GU7 18001 Gustaviskolan GU8 18201 Johannebergsskolan Johannebergsskolan JOJO 17901 Nordhemsskolan Nordhemsskolan NON 01701 Gamla betygstabellen är skadad går ej att läsas in Annedalsskolan NOA 18601 Östra Hagaskolan NOÖH 18701 Västra Hagaskolan NOVH 18702 Oscar Fredriksskolan Oscar Fredriksskolan OFOF 02001 Stigbergsskolan OFST 02002 Gathenhielmsskolan OFGA 02003 Mossbergska friluftsskolan OFMF 02005 Flexgruppen OFFL 02011 Fjällskolan OFFJ 35201 Karl Johansskolan Karl Johansskolan H KJKJ 01301 Karl Johansskolan M KJKM 26101 Djurgårdsskolan M KJDJ 26102 Djurgårdsskolan L KJDL 26103 Karl Johansskolan L KJKL 26201 Småbarnsskolan KJKS 26201 Lilla Karl Johansskolan L KJLK 34201 Fyrhuset KJFY 26104 Karl Johansskolan L KJK2 26210 Karl Johansskolan L KJKK 26204 19
Kungsladugårdsskolan Kungsladugårdsskolan KUK 21501 Kungsladugårdsskolan år 0-3 KUK2 34101 Sannaskolan Chapmansskolan SACH 02403 Kennedyskolan SAK 02401 Sannaskolan år 4-9 SAS 02401 Sannaskolan år 0-3 SAS2 34001 Flatåsskolan Flatåsskolan FLF 00801 Högsboskolan FLH 28401 Kavåsskolan FLKÅ 23801 Skytteskolan FLS 24001 Västerhedsskolan FLV 23901 Särskolan Eriksboskolan GSER 21202 Klaraskolan GSGA 34701 Glöstorpsskolan, grundsär GSGG 14804 Gamlestadsskolan/H GSGH 21201 Glöstorpsskolan; träning GSGL 29202 Gamlestadsskolan/LoM GSGM 21204 Grevegårdsskolan GSGR 21101 Gustafskolan GSGU 21208 Högsboskolan GSHS 28403 Högsbogårdsskolan GSHÖ 29301 Individintegrerade elever GSII 00000 Kannebäcksskolan GSKA 24603 Kvibergsnäs GSKV 29415 Kärralundsskolan GSKÄ 29201 Lundbyskolan GSLU 14807 G.a Långedragsskolan GSLÅ 21102 Rannebergen Centrumskola GSRC 21203 Rebeckaskolan, Högsbo GSRH 29401 Rebeckaskolan/Skytte GSRM 29414 Renströmska Sjukhuset GSRS 29203 Rebeckaskolan, Torslanda GSRT 29402 Skytteskolan GSSK 24002 Spinettskolan GSSS 14801 Svartedalsskolan GSSV 14802 Toleredsskolan GSTO 14803 Trädgårdsgärdesskolan GSTR 21205 Utmarksskolan GSUT 21207 Specialpedagogik Högsboskolan, G-klass SPH1 31101 Kannebäcksskolan SPKN 29101 Kronängsskolan SPKÄ 28402 Nordhemsskolan SPNO 29102 Älvsborgs skolkontor Dalaskolan ÄLDA 02201 Fiskebäcksskolan ÄLFI 28101 G Påvelundsskolan ÄLGP 28001 Hagenskolan ÄLHA 27701 Långedragsskolorna ÄLLÅ 27801 Nya Påvelundsskolan ÄLNP 27901 Nya Varvets skola ÄLNV 28201 Järnbrottsskolan Björkåsskolan JÄB 26402 Järnbrottsskolan M H JÄJ 01201 Järnbrottsskolan L JÄJL 26401 Slottsbergsskolan JÄSL 26301 20
Askimsskolan Askimsskolan AMA 19101 Sisjöskolan AMS 19201 Trollängsskolan Hultskolan ASH 13207 Lilla Trollängsskolan 1-4 ASLT 13204 Trollängsskolan AST 13201 Nygårdsskolan Nygårdsskolan ND1 13401 Sandåsskolan ND2 19401 Skinteboskolan ND3 19501 Lindåsskolan Lindåsskolan NGLS 13802 Hovåsskolan Hovåsskolan 261 13301 Åkeredsskolan Näsetskolan ÅNN 17001 Åkeredsskolan ÅNÅ 24701 Ängåsskolan Ängåsskolan ÄNÄ 16901 Önneredsskolan L M Högenskolan Ö1HÖ 11603 Önneredsskolan L M Ö1Ö1 11602 Önneredsskolan H Önneredsskolan H Ö2Ö2 17301 Grevegårdsskolan Grevegårdsskolan 1-3 GRG4 11201 Grevegårdsskolan 4-9 GRG5 33401 Österöd Österöd ÖSÖS 29002 Tynneredsskolan Tynneredsskolan TYT1 03101 Vättnedalsskolan Kannebäcksskolan VDK 24602 Vättnedalsskolan VDVÄ 17401 Styrsöskolan Brännö skola ST1 13106 Asperö skola ST2 13104 Styrsöskolan ST4 13105 Donsö skola ST5 13102 Vrångö skola ST6 13103 Kalvhagsskolan ST7 13101 Björlandagården Björlandagården BLBL 28901 Lillebyn Lillebyn LBLN 28801 Noleredsskolan Noleredsskolan NRNR 29001 Skutehagen Skutehagen SH1 28303 Hällsviks Bycenter SH2 28302 Hjuviksgården SH3 28301 Torslandaskolan Torslandaskolan TL1 02901 Sjumilaskolan Sjumilaskolan L BISL 20103 Sjumilaskolan M BISM 20101 Landamäreskolan Landamäreskolan LALA 20201 Landamäreskolan L LALL 20201 Landamäreskolan M LALM 20202 21
Ryaskolan Ryaskolan, Profil Bild/Slöjd RYRB 02301 Ryaskolan, Idrott RYRH 02301 Ryaskolan RYRY 02301 Treröseskolan 1-6 RYTR 19803 Svartedalsskolan Jättestensskolan L SVJL 16401 Jättestensskolan M SVJM 16402 Jättestensskolan SUG SVJU 16403 Svartedalsskolan H SVSH 02601 Svartedalsskolan L SVSL 02603 Svartedalsskolan M SVSM 02602 Svartedalsskolan SUG SVSU 02604 Klarebergsskolan Klarebergsskolan KLKL 12801 Klockareskolan KLKS 25001 Kärraskolan KLKÄ 16501 Lillekärrskolan KLLK 22601 Bjurslättsskolan Bjurslättsskolan BJBJ 00201 Bräckeskolan Bräckeskolan BRBR 18501 Lerlyckeskolan Kärrdalsskolan LEK 19701 Lerlyckeskolan LEL 19601 Rambergsskolan Rambergsskolan RARA 20501 Toleredsskolan Toleredsskolan TOT 02701 Glöstorpsskolan Bärbyskolan/Humlelyckan TUBÄ 26001 Glöstorpsskolan TUGH 25901 Glöstorpsskolan TUGL 03004 Gunnestorpsskolan TUGU 03001 Tångenskolan TUTÅ 26003 Backaskolan Backaskolan BAB 01401 Brunnsboskolan Brunnsboskolan BOB 00301 Brunnsbo Musikklasser BOBM 00301 Skogomeskolan BOS 23501 Erikslundsskolan Erikslundsskolan ELE 17501 Skälltorpsskolan Skälltorpssk/Brudbergssk SKBH 17602 Brudbergets rektorsområde SKBR 17601 Bäckebols rektorsområde SKBÄ 17701 Skälltorpsskolan SKS 10701 Skälltorp/Svenska Balettskolan SKSD 10702 Framnässkolan Framnässkolan FRFR 18301 Ingen databas kom från Bräcke Östergårdsskolan Bräcke Östergårdsskolan BÖS1 18401 Elin maskinen på Bräcke Östegård gick sönder under vecka 4 2001. Ingen backup fanns av databasen. Önneredsskolan BÖÖN 18402 22
Bilaga 3B: Tabeller i Elin, översikt ELIN - Tabellöversikt Tabellnamn Kommentar Kolumnantal ------------ ---------------------------------------------------------------- AMNE Ämnestabell 6 AVIS Aviseringstabell 33 BETYG Gamla Betygtabell 16 CTLELEV Tabell för Central lagring 77 ELEV Elevtabell 76 ELEVTPL Elevens timplan 24 FASTTPL Timplan fastställd av 5 GRPTILLH Grupptillhörighetstabell 8 GRUPP Grupptabell 13 HEMSPR Hemspråkstabell 4 HSPR_ELV Hemspråk/Elev 20 KLASS Klasstabell 12 KOMMUN Kommuntabell 3 LARARE Lärartabell 4 NATION Nationstabell 3 NYBETYG Ny Betygtabell 38 PRIMOMR Primärområdestabell 3 REGKOD Registreringskodstabell 21 REKTOMR Rektorsområdestabell 11 SDN SDN-tabell 8 SKOLA Skolenhetstabell 12 SKOLGNG Skolgångstabell 12 SKOLTPL Skolans timplan 14 STDPARAM Standardparametrar 19 TPLAMNE Timplansämne LPO94 4 UOMR Upptäckningsområdestabell 20 VAL Valtabell 12 23
Bilaga 4A: Databärare, CDR med ELIN-arkivfiler (OBS: för cd-volymmärkning användes särskild märkpenna med permanent bläck. PENOL) Under senare projekt (efter ELIN) märktes alla CDR-skivor med arkivbildarnamn och arkivnummer (leveransnummer) inhämtat från dataliggaren t.ex.: Göteborgs Stad, ADB-Kontoret 27: 01 Arkiv-cd för ELIN brändes i 3 exemplar (två olika CDR fabrikat, Kodak och Fujitsu) Original ex: Kopia 24
Bilaga 4B: Databärare, biblioteksstruktur på ELIN-arkivcd (arkivfiler ligger ordnade per rektorsområde enligt nedan) Arkivfiler består av textfiler motsvarande 27 tabeller i databasen för respektive rektorsområde 25
Bilaga 4C: Arkivfilexempel (arkivfil från ELIN CD) Förhandsgranskning av innehåll i arkivfilen BETYG.TXT (tabellen BETYG i databasen ELIN) Älvsborgs rektorsområde OBS: filen är konverterad till ISO-8859-1 textformat 780310036691993/94VTBI 83 19940530 1994-05-30-2.16.41.590000 780310036691993/94VTBL 83Bild 19940530 1994-05-30-12.16.40.250000 780310036691993/94VTENA 82Engelska allmän 19940530 1994-05-30-12.16.40.650000 780310036691993/94VTFY 82 19940530 1994-05-30-12.16.41.780000 780310036691993/94VTGE 83 19940530 1994-05-30-12.16.42.150000 780310036691993/94VTHA T83Hantverk 119940530 1994-05-30-12.16.43.460000 780310036691993/94VTHI 83 19940530 1994-05-30-12.16.42.340000 780310036691993/94VTHK 82 19940530 1994-05-30-12.16.40.840000 780310036691993/94VTID 82 19940530 1994-05-30-12.16.41.210000 780310036691993/94VTMAA 82Matematik allmän kurs 19940530 1994-05-30-12.16.41.400000 780310036691993/94VTRE 82 19940530 1994-05-30-12.16.42.530000 780310036691993/94VTSH 82 19940530 1994-05-30-12.16.42.710000 780310036691993/94VTSL 83 19940530 1994-05-30-12.16.42.870000 780310036691993/94VTSV 82 19940530 1994-05-30-12.16.43.060000 780310036691993/94VTTK 82 19940530 1994-05-30-12.16.41.930000 780310036691994/95HTBI 92 19941216 1994-12-16-11.51.47.310000 780310036691994/95HTBK 9UBarnkunskap 19941216 1994-12-16-11.51.45.590007 780310036691994/95HTBL 9UBild 19941216 1994-12-16-11.51.45.810000 780310036691994/95HTENA 92Engelska allmän 19941216 1994-12-16-11.51.46.030000 780310036691994/95HTFY 91 19941216 1994-12-16-11.51.47.500000 780310036691994/95HTGE 92 19941216 1994-12-16-11.51.48.150000 780310036691994/95HTHA T93Hantverk 119941216 1994-12-16-11.51.49.650007 780310036691994/95HTHI 92 19941216 1994-12-16-11.51.48.340000 780310036691994/95HTHK 92 19941216 1994-12-16-11.51.46.250000 780310036691994/95HTID 92 19941216 1994-12-16-11.51.46.690007 780310036691994/95HTKE 91 19941216 1994-12-16-11.51.47.720000 780310036691994/95HTMAA 92Matematik allmän kurs 19941216 1994-12-16-11.51.46.900000 780310036691994/95HTMU 93 19941216 1994-12-16-11.51.47.120000 780310036691994/95HTRE 92 19941216 1994-12-16-11.51.48.560000 780310036691994/95HTSH 92 19941216 1994-12-16-11.51.48.750000 780310036691994/95HTSL 9U 19941216 1994-12-16-11.51.48.940000 780310036691994/95HTSV 92 19941216 1994-12-16-11.51.49.150000 780310036691994/95HTTK 92 19941216 1994-12-16-11.51.47.940000 780310036691994/95VTBI 92 19950531 1995-05-31-09.42.08.440000 780310036691994/95VTBK 93Barnkunskap 19950531 1995-05-31-09.42.08.100007 780310036691994/95VTBL 93Bild 19950531 1995-05-31-09.42.08.160000 780310036691994/95VTENA 92Engelska allmän 19950531 1995-05-31-09.42.08.190000 780310036691994/95VTFY 91 19950531 1995-05-31-09.42.08.500000 780310036691994/95VTGE 91 19950531 1995-05-31-09.42.08.600000 780310036691994/95VTHA T93Hantverk 119950531 1995-05-31-09.42.09.130007 780310036691994/95VTHI 91 19950531 1995-05-31-09.42.08.630000 780310036691994/95VTHK 92 19950531 1995-05-31-09.42.08.220000 780310036691994/95VTID 92 19950531 1995-05-31-09.42.08.310007 780310036691994/95VTKE 92 19950531 1995-05-31-09.42.08.530000 780310036691994/95VTMAA 92Matematik allmän kurs 19950531 1995-05-31-09.42.08.380000 780310036691994/95VTMU 93 19950531 1995-05-31-09.42.08.410000 780310036691994/95VTRE 92 19950531 1995-05-31-09.42.08.910000 780310036691994/95VTSH 92 19950531 1995-05-31-09.42.08.940000 780310036691994/95VTSL 93 19950531 1995-05-31-09.42.08.970000 780310036691994/95VTSV 92 19950531 1995-05-31-09.42.09.030000 780310036691994/95VTTK 92 19950531 1995-05-31-09.42.08.560000 780510497891993/94VTBI 83 19940530 1994-05-30-15.09.08.810000 26
Bilaga 5A: Postbeskrivning : förståelsedokumentation på arkiv-cd (tabellen BETYG i ELIN) (OBS: sparas på cd-n i leverantörsoberoende format d.v.s. en ISO-formaterad textfil) Postbeskrivningen utgör en del av metadata (se även transaktionsbeskrivning, bilaga 5B) 27
Bilaga 5B: Transaktionsbeskrivning för arkivfiler (arkivfiler BETYG.TXT och NYBETYG.TXT, export av Elin-databastabeller BETYG och NYBETYG i fastbreddformat) Tabellnamn Fältnamn Börja Bredd ---------- -------- ----- ----- BETYG PNR 1 10 SEKEL 11 1 LASAR 12 7 TERMIN 19 2 AMNESKOD 21 4 TYP 25 1 ARSKURS 26 1 BETYG 27 1 BETYGTXT 28 30 SORTFLT 58 1 REGDAT 59 10 REGSIGN 69 3 FTERMIN 72 2 FARSKURS 74 1 FBETYG 75 1 TIDSTMP 76 26 Tabellnamn Fältnamn Börja Bredd ---------- -------- ----- ----- NYBETYG PNR 1 10 SEKEL 11 1 LASAR 12 7 TERMIN 19 2 BLD 21 1 HEM 22 1 IDR 23 1 MUS 24 1 SLD 25 1 SVE 26 1 ENG 27 1 MAT 28 1 SO 29 1 GEO 30 1 HIS 31 1 REL 32 1 SAM 33 1 NO 34 1 BIO 35 1 FYS 36 1 KEM 37 1 TEK 38 1 SV2 39 1 SPR 40 1 SPRAMNESKOD 41 4 SPRAMNESTXT 45 30 CSP 75 1 CSPAMNESKOD 76 4 CSPAMNESTXT 80 30 HSP 110 1 HSPRKOD 111 3 HSPRTXT 114 20 LRENAMN1 134 36 LRENAMN2 170 36 TIDSTMP 206 26 28
Bilaga 6A: Arkivdatabas ELIN : rekonstruktion från arkivfiler Transaktionsbeskrivning för arkivfilen utgör ett underlag vid rekonstruktion: alla arkivfiler läses in i en arkivdatabas Kontroll och import av arkivfil BETYG.TXT (tabellen BETYG i databasen ELIN) Älvsborgs rektorsområde till en arkivdatabas Transaktionsbeskrivning / import specifikation: Tabellnamn Fältnamn Börja Bredd ---------- -------- ----- ----- BETYG PNR 1 10 SEKEL 11 1 LASAR 12 7 TERMIN 19 2 AMNESKOD 21 4 TYP 25 1 ARSKURS 26 1 BETYG 27 1 BETYGTXT 28 30 SORTFLT 58 1 REGDAT 59 10 REGSIGN 69 3 FTERMIN 72 2 FARSKURS 74 1 FBETYG 75 1 TIDSTMP 76 26 1 11 12 19 21 25 26 27 28 58 59 69 72 74 75 76 780310036691993/94VTBI 83 19940530 1994-05-30-2.16.41.590000 780310036691993/94VTBL 83Bild 19940530 1994-05-30-12.16.40.250000 780310036691993/94VTENA 82Engelska allmän 19940530 1994-05-30-12.16.40.650000 780310036691993/94VTFY 82 19940530 1994-05-30-12.16.41.780000 780310036691993/94VTGE 83 19940530 1994-05-30-12.16.42.150000 780310036691993/94VTHA T83Hantverk 119940530 1994-05-30-12.16.43.460000 780310036691993/94VTHI 83 19940530 1994-05-30-12.16.42.340000 780310036691993/94VTHK 82 19940530 1994-05-30-12.16.40.840000 780310036691993/94VTID 82 19940530 1994-05-30-12.16.41.210000 780310036691993/94VTMAA 82Matematik allmän kurs 19940530 1994-05-30-12.16.41.400000 780310036691993/94VTRE 82 19940530 1994-05-30-12.16.42.530000 780310036691993/94VTSH 82 19940530 1994-05-30-12.16.42.710000 780310036691993/94VTSL 83 19940530 1994-05-30-12.16.42.870000 780310036691993/94VTSV 82 19940530 1994-05-30-12.16.43.060000 780310036691993/94VTTK 82 19940530 1994-05-30-12.16.41.930000 780310036691994/95HTBI 92 19941216 1994-12-16-11.51.47.310000 780310036691994/95HTBK 9UBarnkunskap 19941216 1994-12-16-11.51.45.590007 780310036691994/95HTBL 9UBild 19941216 1994-12-16-11.51.45.810000 780310036691994/95HTENA 92Engelska allmän 19941216 1994-12-16-11.51.46.030000 780310036691994/95HTFY 91 19941216 1994-12-16-11.51.47.500000 780310036691994/95HTGE 92 19941216 1994-12-16-11.51.48.150000 780310036691994/95HTHA T93Hantverk 119941216 1994-12-16-11.51.49.650007 780310036691994/95HTHI 92 19941216 1994-12-16-11.51.48.340000 780310036691994/95HTHK 92 19941216 1994-12-16-11.51.46.250000 780310036691994/95HTID 92 19941216 1994-12-16-11.51.46.690007 780310036691994/95HTKE 91 19941216 1994-12-16-11.51.47.720000 780310036691994/95HTMAA 92Matematik allmän kurs 19941216 1994-12-16-11.51.46.900000 780310036691994/95HTMU 93 19941216 1994-12-16-11.51.47.120000 780310036691994/95HTRE 92 19941216 1994-12-16-11.51.48.560000 780310036691994/95HTSH 92 19941216 1994-12-16-11.51.48.750000 780310036691994/95HTSL 9U 19941216 1994-12-16-11.51.48.940000 780310036691994/95HTSV 92 19941216 1994-12-16-11.51.49.150000 780310036691994/95HTTK 92 19941216 1994-12-16-11.51.47.940000 780310036691994/95VTBI 92 19950531 1995-05-31-09.42.08.440000 780310036691994/95VTBK 93Barnkunskap 19950531 1995-05-31-09.42.08.100007 780310036691994/95VTBL 93Bild 19950531 1995-05-31-09.42.08.160000 780310036691994/95VTENA 92Engelska allmän 19950531 1995-05-31-09.42.08.190000 780310036691994/95VTFY 91 19950531 1995-05-31-09.42.08.500000 780310036691994/95VTGE 91 19950531 1995-05-31-09.42.08.600000 780310036691994/95VTHA T93Hantverk 119950531 1995-05-31-09.42.09.130007 780310036691994/95VTHI 91 19950531 1995-05-31-09.42.08.630000 29
Bilaga 6B: Datastruktur och relationer i arkivdatabasen ELIN Elev- och betygshistorik 1989 2001 för grundskolor inom Göteborgs kommun - Arkivdatabasen består av nyckeltabeller från Elin och vyer (hjälptabeller som skapades i arkivdatabasen med uppgifter sammansatta från flera olika Elins arkivtabeller), KLASS_vy tex innehåller uppgifter om varje klass med namn på klassföreståndare och skapades genom sammansättning av tabeller KLASS och LÄRARE från ELIN. - Relationer utgör ett skelett för ELIN- arkivdatabas, med hjälp av relationer går det att visa hela skolgången (från låg- och mellan- till högstadieskola) för en vald elev och samtliga grundskolebetyg på en och samma arkivregisterbild, bläddra och söka snabbt i arkivdatabasen. Arkivdatabasens funktionalitet kan m.a.o. endast åstadkommas genom skicklig rekonstruktion och hantering av relationer mellan arkivtabeller då det ursprungliga systemets funktioner går ej att bevara med arkivfiler (de försvann i samma ögonblick som data ställdes av). Det som man lyckas återskapa med hjälp av relationer i arkivdatabasen är sammanhang och sökbarhet i arkiverad datamängd, viket är huvuduppgift i den digitala arkiveringen förutom bevarande av själva data. I alla väl normaliserade datasystem är relationsstrukturen klar och lätt att genomskåda vilket gör arbete med långtidsbevarande betydligt lättare än i sådana fall där själva programmet stod för informationens integritet och sammanhang. 30
Bilaga 7A: Sökbilder i arkivdatabasen ELIN Sökning av klasslista med Läsår, Årskurs / Klass och Skolnamn som nyckel: 31
Bilaga 7B: Elev- och betygshistorik i arkivdatabasen ELIN (skapad från samtliga ELIN-arkivfiler, databasen omfattar åren 1989-2001.) För varje registrerad elev visas både skolgång och betyg från gamla respektive nya betygssystemet; nya betyg registrerades sedan 1997, höstterminen. Arkivserver: skrivskyddad arkivdatabas ELIN (Read Only format) 32
Bilaga 7C: ELIN arkivprojekt, sammanfattning: avställning 33
Bilaga 7D: ELIN arkivprojekt, sammanfattning: arkivbildning och förteckning 34
REGIONARKIVET Jerzy Misiewicz tfn 031-701 19 67 Kravspecifikation för arkivdatafiler Något om arkivterminologin Gallring innebär att handlingar eller uppgifter (datamängder) förstörs definitivt på ett sådant sätt att de aldrig kan återskapas. Avställning innebär att handlingar eller uppgifter (datamängder) uttages (exporteras) från t ex ett närarkiv eller från en databas för att långtidsarkiveras i t ex ett centralarkiv eller i en arkivdatabas. Om man gallrar i en databas förstör man uppgifter. Om man avställer uppgifter förstörs inte dessa utan överförs först till arkivformat och sedan till arkivmedia för långtidsbevarande. Åtkomsten till data bevaras i form av en särskild arkivdatabas som baserar på informationsurvalet genomförd vid avställning. Definition Gallring, rensning, avställning m.m. 17 arkivförordningen Med avställning menas att handlingarna överförs till en ordning (ett format) som är särskilt avpassad för slutlig långtidslagring. Först och främst är det databaser som oftast behöver avställas innan leverans. Data i en avställning består således av registerdata, metadata och / eller elektroniska dokument konverterade till ett leverantörsoberoende format (ISO -, ISO/IEC -, SS-ISO standard) Dataformat (filformat, teckenrepresentation, kodning av tecknens binära mönster) Data bör (enligt Riksarkivets rekommendationer) avställas såsom flata textfiler i 8-bitars textformat enligt ISO 8859-1 standard. I det tidigare vanliga ascii (IBM/PC-Dos) formatet för textfil kodas landspecifika (diakritiska) tecken på ett annat sätt och det är operativsystemets inställningar som avgör hur tecknen tolkas, d.v.s. först när man har deklarerat vilken utökad ASCII tabell (Code Page) som används blir tolkning av tecken entydig. ISO 8859 formatet däremot åstadkommer leverantörsoberoende och entydig teckenkodning genom att dela upp teckenuppsättningar i så kallade Latin-grupper (Latin1=8859-1, Latin2=8859-2 o.s.v.). Dos-Latin1 (Code Page 850) och ISO Latin-1 avser samma språkgrupp men behandlar olika tecken som ligger utanför 7-bitars ascii (0-127) teckenuppsättning där de landspecifika tecknen lagras. Elektroniska dokument och dokumentbilagor som lagras i ett leverantörsberoende format i sin helhet i ett IT-system (tex. Word dokument eller Excel kalkylblad) bör konverteras till ISO 8859-1 textformat (en arkivfil per dokument). Dessa dokument och bilagor bör även konverteras till dokumentbilder i TIFF format (lämpligen TIFF CCITT Group 4 undergrupp för standard A4 svart-vit dokument). 35
Datastruktur och dataorganisation Poster som avställs (registerdata) skall ligga i flata textfiler med en posttyp per arkivfil och fast postlängd, d.v.s. om databasen innehåller flera olika tabeller (relationsdatabas) bör avställning ske på tabellnivå och tabellerna lagras separat, var i sin textfil. Fältlängden inom en post i arkivfilen kan variera men de skall ha fast bredd och följaktligen blir postlängden samma för alla poster av en viss posttyp i en arkivfil. Det är transaktionsbeskrivning som bestämmer postlängden i en arkivfil. Arkivfiler skapade enligt ovan bör vid avställning överföras till en arkivbeständig digital media (i två exemplar) ordnade i en flat biblioteksstruktur med unika filnamn. Digital långtidslagring förutsätter omkopiering av media och migrering av arkivdata vilket är tekniskt lättare att genomföra med flat dataorganisation och unika filnamn (högre säkerhet vid automatisk databehandling). Transaktionsbeskrivning är en postbeskrivning av en post såsom den har lagrats i arkivfilen d.v.s. namn på alla fält inom en post, offset (relativ position i dataraden) och antal tecken (fältlängd). Transaktionsbeskrivning skiljs således från postbeskrivningen i den ursprungliga databastabellen endast i det avseende att packade (typade) fält får en annan datalängd efter konvertering till text. Metadata och dokumentation Dokumentationen bör följaktligen innehålla både fullständig postbeskrivning för alla posttyper i det ursprungliga dataregistret och en fullständig transaktionsbeskrivning för avställda poster (datarader i en arkivfil). Tabell- och kolumnöversikt med förklaring i klartext för varje kolumn (datafält) bör skapas för alla tabeller som ingår i arkivurvalet (förståelsedokumentation). Förklaringar bör ges för alla beräknade fält, koder och förkortningar. Om koder finns lagrade i det avställda systemet såsom separata tabeller eller värdelistor bör dessa obligatoriskt ingå i arkivurvalet för avställd registerdata (exempelvis i ett ekonomisystem: kontoplan med kontonummer och kontonamn eller motpartskoder med motpartsnamn, vidare på samma sätt ansvarskoder, leverantörs- och kundlistor med nummer /kontonummer och namn med värden specifika för angivet räkenskapsår). Fullständig relationsbeskrivning (relationer / länkar mellan tabeller) skall finnas i dokumentationen. Detaljnivån skall vara tillräcklig för att man skall kunna återskapa bindningar mellan tabeller lagrade i arkivfiler när de läses in i arkiv-/forskardatabas. Kommentarer I ett hierarkiskt dataregister, vanligt i äldre system, är poster länkade med pekare i en parentchildpost struktur och användning av ovan beskrivna modell för avställning innebär vissa svårigheter. Ett enkelt exempel för detta är ett diariesystem av följande typ: Parent (postlayout): ärendeid, fält2, fält3..fält-n child1 (postlayout): händelse(datum),fält2,fält3.fält-n child2 (postlayout): händelse(datum),fält2,fält3.fält-n child3 (postlayout): händelse(datum),fält2,fält3.fält-n.. child-n (postlayout):händelse(datum),fält2,fält3.fält-n I en relationsdatabas skulle det innebära att det finns två tabeller med en explicit en till många relation och att ärendeid identifierar unikt en ärendepost, samtidigt som ärendeid används i den andra tabellen för att binda samman alla händelser som hör till ett visst ärende. 36