Digitalisering av historiska dagstidningar. Framtiden för gårdagens dagstidningar

Save this PDF as:
 WORD  PNG  TXT  JPG

Storlek: px
Starta visningen från sidan:

Download "Digitalisering av historiska dagstidningar. Framtiden för gårdagens dagstidningar"

Transkript

1 Institutionen för ABM Biblioteks- & informationsvetenskap Digitalisering av historiska dagstidningar. Framtiden för gårdagens dagstidningar Ulf Persson Magisteruppsats, 30 högskolepoäng, vt 2008 Institutionen för ABM Uppsatser inom biblioteks- & informationsvetenskap, nr 442 ISSN

2 Författare Ulf Persson Svensk titel Digitalisering av historiska dagstidningar Framtiden för gårdagens dagstidningar. English title The Digitizing of historic newspaper The future for yesterday s newspaper. Handledare Gunnel Furuland. Färdigställd Nov, 2008 Abstract Ever since the establishment of the daily newspaper in the 17th century, it has had an important role as a resource of information for scholars and researchers. With the approach of modern digital technology, it is now possible to offer the historic newspaper in a more accessible way to the general public and to scholars. The papers aim is to examine the prospect for digitalizing historic newspapers. This aim includes the preparation, execution and evaluation in the work process for a digitalizing of historic newspapers. The paper will also examine the present state of historic newspaper digitalizing projects. Ämnesord Digitalisering, Dagstidningar, Digitala samlingar, Optical Character Recognition, Mikrofilm. Key words Digitizing, Newspapers, Digital collections Optical Character Recognition, Microfilm.

3 Kapitel 1 Introduktion... 3 Kapitel 2 Inledning Syfte Frågeställningar Avgränsning Uppsatsdisposition Forskningsöversikt Om digitalisering Om digitalisering av historiska dagstidningar Teoretisk utgångspunkt Källmaterial och val av metod... 9 Kapitel 3 Digitalisering Varför digitalisera? Digitalt material ökar tillgängligheten Digitalt material ger uppmärksamhet Digitalt material ger mervärde Digitalt bevarande Externt samarbete utomstående digitaliseringsaktörer Kapitel 4 Digitalisering av historiska dagstidningar Inledning Historiska dagstidningars utseende Kapitel 5 Digitalisering av historiska dagstidningar Teknik och lösningar Mikrofilm Content Management Software Open Source system - Greenstone Digital Library Software Kommersiella system - Olive Softwares Activepaper Archive Metadata Optical Character Recognition Kapitel 6 Digitalisering av historiska dagstidningar Teori och praktik Målsättning och omfattning... 28

4 6.1.1 Målsättning Omfattning Utvärdera samling och bestäm urvalet Utvärdera samlingen Bestäm urvalet Upphovsrätt Budget Kapitel 7 Digitalisering av historiska dagstidningar - Projektöversikt Urvalskriterium Riktlinjer för bedömning Icke-kommersiella projekt Finska historiska tidningsbiblioteket (FHT) Papers Past Kommersiella projekt th Century British Newspaper Library (CBNL) The Scotsman digital archive Kapitel 8. Digitalisering av historiska dagstidningar Tjänsteutbud Grundfunktioner Segmentering Zoning Kapitel 9 Digitalisering av historiska dagstidningar i Sverige Tiden Bibliotekets roll Tidningsförlagens roll Kapitel 10 Slutdiskussion och förslag inför framtiden Sammanfattning Litteraturförteckning och referenslista

5 Kapitel 1 Introduktion I föreläsningen Biblioteks- och arkivberoende en allvarlig åkomma av Jan Olsson (professor i filmvetenskap) under temadagen om förändrad vetenskaplig kommunikation inom humaniora, anordnad av Stockholms universitetsbibliotek, den 19 september 2007, skildrade Olsson de forskningsförutsättningar som existerar för en filmstudent i Sverige. Olsson beskrev en situation där forskningen tvingas bedrivas på ett ineffektivt sätt. Olssons mest kritiska röst föll på hanteringen av dagstidningar - ett av de mest primära forskningsmaterialen inom filmvetenskapen. Varför behöver forskare spilla bort onödig tid i mikrofilmsrum, när det idag finns teknologi för att presentera materialet via Internet? I utlandet bedrivs omfattande digitaliseringsprojekt av historiska dagstidningar, varför inte i Sverige? Förevarande frågeställning blev min inspiration till denna uppsats att lyfta fram den historiska dagstidningens fördelar och möjligheter som digitaliserat material. Det finns idag, vid skrivande stund, ingen omfattande databas eller webbplats för äldre svenska dagstidningar. Intresset för digitala historiska dagstidningar finns dock. Riksbibliotekarie Gunnar Sahlin säger till Dagens Nyheter våren 2005 att: Det skulle innebära väldigt mycket för både pressforskare, studenter och allmänheten om man kunde göra åtminstone delar av vårt tidningsmaterial tillgängligt på nätet [ ]. 1 Tre år senare skriver Pär Nilsson om dagtidningens möjligheter och förutsättningar att digitaliseras. Artikelförfattaren menar att den historiska dagstidningen inte bara har ett starkt kulturarvsintresse, utan även kan fungera väl inom forskning. 2 Förutom att dagstidningen är ett ypperligt forskningsmaterial, är det som lekman intressant och roande att läsa och titta i äldre dagstidningar. Vem är till exempel inte nyfiken på att läsa dagtidningar, publicerad dagen efter stora världshändelser som till exempel Titanics förlisning, skotten i Sarajevo, månlandningen, mordet på Olof Palme och så vidare? Eller som släktforskare leta efter gamla notiser och nyheter om äldre bruksorter, gamla släktförhållanden och så vidare. Med mikrofilmen som den enda befintliga metoden för bevaring av 1 Kalmteg, L. Kunskap till alla - Kungliga biblioteket vill lägga ut dagstidningar på nätet, elektronisk upplaga av Dagens Nyheter, den 10 maj [ ] 2 Nilsson, P. Dagstidningens former och framtid, elektronisk upplaga av Biblis. Nr 41, 2008, s. 48ff. 3

6 äldre dagstidningar har tillgängligheten varit dålig. Däremot går det med hjälp av digitaliseringsteknologi att göra dessa nyheter interaktivt nåbara för den breda allmänheten. Initiativ till digitaliseringsprojekt av äldre dagstidningar har tagits i många länder, oftast med lyckat resultat. Colorado Historic Newspaper Collections webbplats med 107 historiska dagstidningar, från åren mellan 1859 och 1923, utgivna i den amerikanska delstaten Colorado, hade under år ,4 miljoner besökare, varav varje besök varade i genomsnitt 23 minuter. 3 Det är en imponerande siffra, som visar det starka intresse som finns för den historiska dagstidningen. Detta skulle även kunna även ske med dagstidningar som idag ligger arkiverade. De kan med hjälp av en ny teknologi få en renässans som intressant forskningsmaterial, likväl som de kan bli högt uppskattade av allmänheten. 3 Grinstead, L. (2005), The Collaborative Digitization of Colorado's Historical Newspapers, elektroniskt publicerad seminarium på hemsidan för Olive Software. [ ] 4

7 Kapitel 2 Inledning 2.1 Syfte Det primära syftet med uppsatsen är att undersöka digitaliseringsprocessen kring historiska dagstidningar och att lyfta fram och beskriva en rad digitaliseringsprojekt rörande historiska dagstidningar ute i världen. Detta görs för att på så sätt öka intresset för och kännedomen om digitala historiska dagstidningar. Det sekundära syftet är att belysa och undersöka frågor kring övrigt digitaliseringsarbete. Uppsatsen kommer att diskutera digitaliseringens möjligheter men också dess svårigheter. Uppsatsens figurer beskriver hur resultatet av en digitalisering av historiska dagstidningar kan se ut. 2.2 Frågeställningar Uppsatsen kommer att diskutera hur arbetet kring en digitalisering kan se ut och vilka komponenter som krävs i arbetsprocessen. Största delen av våra dagstidningar finns på mikrofilm; vilka för- och nackdelar finns det med att digitalisera från mikrofilm? Jag ställer frågan om det är biblioteken som bör sköta digitaliseringen och vad tidningsförlagen kan göra. Detta är några av de frågor som besvaras: Digitalisering Allmänna frågeställningar. Vad är digitalisering? I vad ligger digitaliseringens möjligheter och svårigheter? Vem bör digitalisera och vad är alternativen? Digitalisering - Historiska dagstidningar. Hur utformas en målsättning och omfattningsplan? Hur ter sig urvalsprocessen? Hur ser möjligheter ut att digitalisera från mikrofilm? Vad kostar en tidningsdigitalisering? 5

8 Vad går att göra i Sverige? 2.3 Avgränsning I undersökningsmomentet har jag försökt undvika de generellt gällande förehavandena inom den allmänna digitaliseringen. Målet har där varit att undersöka och diskutera de riktlinjer och förehavanden som specifikt råder för digitalisering av historiska dagstidningar. Historisk dagstidning är inget vedertaget uttryck, utan vad som kan definieras som en historisk dagstidning har uppsatsen valt att definiera som dagstidningar daterade med tryckdatum före år Arkiveringstiden ska sträcka sig längre tillbaka än 20 år i tiden. Denna definition betyder att uppsatsen ej kommer att beskriva eller undersöka dagstidningar med senare tryckdatum än år Definitionen ter sig naturlig, eftersom de digitaliseringsprojekt av historiska dagstidningar som existerar följt den mallen. En bredare tillämpning skulle dessutom påverka uppsatsens mål, att ge en klar syn över den historiska dagstidningens digitalisering. Marknaden för nutida digitaliserade dagstidningar är därmed inte inkluderad. Arbetet med att följa både den nutida och den historiska dagstidningens digitalisering skulle bli en alltför stor uppgift inom ramen för denna uppsats. 2.4 Uppsatsdisposition. Efter denna inledande del följer kapitel 3: Digitalisering. Detta avsnitts fokus ligger på att förklara begreppet digitalisering. Kapitel 3 beskriver vilka fördelar det finns vid en digitalisering, samt vilka frågor som är kvar att lösa. I kapitel 4 inleds studiet av digitalisering av historiska dagstidningar med ett inledande avsnitt. I detta kapitel beskrivs dessutom den historiska dagstidningens unika utseende gentemot dagens. Kapitel 5 beskriver fyra viktiga tekniska begrepp, för ökad förståelsen av kapitel 6-10: Mikrofilm, Content Management Software, Metadata och Optical Character Recognition. Kapitel 6 undersöker arbetsprocessen vid digitalisering av historiska dagstidningar. Avsnittet studerar bland annat målsättning, hur utvärdering av en samling går till, hur urvalsprocessen ser ut, kostnaderna vid digitalisering av historiska dagstidningar och så vidare. Kapitel 7 redovisar fyra digitaliseringsprojekt rörande historiska dagstidningar. I kapitel 8 finner man en lista över tekniska tillämpningar samt två tekniska lösningar som är unika för historiska dagstidningar: Segmentering och zoning. Hur digitaliseringen av historiska dagstidningar kan tänkas se ut i Sverige 6

9 diskuteras i kapitel 9. Uppsatsen avslutas med diskussion och slutsatser i kapitel Forskningsöversikt Forskningen kring digitalisering beskrivs antingen av projektrapporter från intresseorganisationer, institutioner och bibliotek eller av rådgivningstexter som fungerar som bästa praxis för digitalisering. Här presenteras ett urval av vad som skrivits Om digitalisering. Kungliga biblioteket har utkommit med två större rapporter inom ämnet digitalisering. Under året 1999 drevs projektet plattform för bilddatabaser som utmynnade i projektrapporten Plattform för bilddatabaser. Målsättningen var att sätta standarder för urval, hantering, lagring, bevaring av digitalt material, ämnesord, klassificering, begrepp som rör digitalt material, vad som menas med ett dataobjekt, ett bildobjekt och så vidare. Projektet plattform för bilddatabaser syfte beskrevs som: Syftet med projektet har varit dels att skapa standarder och rutiner för digitalisering, fotografering och registrering, dels att skapa en gemensam struktur där olika typer av digitaliserat material (text, bild, kartor, affischer etc.) kan ingå och samverka. Tanken är att oavsett om förlagan är ett textburet eller bildburet material, skall de digitala bildfiler som produceras samlas i en gemensam bilddatabas och sökas från en gemensam plattform. 4 Digsam digitalisering och dess samordning inom Kungl. biblioteket. som lades fram 2005, är en beskrivning av hur Kungliga biblioteket kommer att bedriva det digitala arbetet. De beskriver sin modell för samlings- och urvalsprioritering i det digitala arbete och hur själva bildfångstarbetet ska gå till. Inom internationell digitaliseringsforskning är mycket av forskningen gjord av intresseorganisationer. Publikationerna riktar sig till personal inom digitaliseringsprojekt och fungerar precis som publikationstitlarna antyder att ge digitaliseringsdirektiv. The National Initiative for a Networked Cultural Heritage är ett exempel på detta. The NINCH guide to good practice in the digital representation and management of cultural heritage materials, (2001), är en av 4 Gram, M & Kjellman, U. (2000), Plattform för bilddatabaser. elektroniskt publicerad rapport från hemsidan för Kungliga. Biblioteket, Nr 27, s. 6. [ ] 7

10 deras publikationer. Council on Library and Information Resources (CLIR) och National Information Standards Organisation (NISO) är även de amerikanska intresseorganisationer som publicerat digitaliseringsrapporter Om digitalisering av historiska dagstidningar Samma sak gäller här som för övrig digitalisering. Mycket är centrerat kring institutioners projektrapporter och rådanvisningar. Edmund King, chef för British Library skriver om strategin för digitalisering av deras samling i Digitisation of newspapers at the British Library. 5 Edwin Klijn på Koninklijke Bibliotheek skriver en rapport om deras möjlighet att digitalisera historiska dagstidningar i: The Current State-of-art in Newspaper Digitization. 6 Organisationen The International Federation of Library Associations and Institutions (IFLA) arbetar mycket med frågan och har publicerat en rad publikationer inom området. År 2005 höll IFLA konferens i Oslo, Norge, med temat Newspaper Digitisation Projects, Developments in the Online Availability of older Newspapers. The National Digital Newspaper Program är ett amerikanskt initiativ från Library of Congress. På deras webbplats finner man bland annat en stor länksamling med information om forskning kring amerikansk digitalisering av historiska dagstidningar Teoretisk utgångspunkt Forskningsteorierna inom digitalisering är uppkomna ur en trial and errormetodik, som hämtar sin kunskap utifrån erfarenheter och observationer. Den insamlade informationen står sedan som kunskapsbas och styr den fortsatta utvecklingen inom ämnet. Forskningsämnet är en empirisk forskningsdisciplin. Den teoretiska modell uppsatsen har valt att använda och utforska blir således en empirisk teori inriktad på byggandet av digitala samlingar. Det är Mark Jordans teori om hur digitala samlingar byggs. Teorin är hämtad ur boken - Putting content online: A practical guide for libraries. (2006) Detta verk är valt 5 King, E. Digitisation of newspaper at the british library, elektronisk upplaga av The serials librarian, vol. 49, nr 1/2, [ ] 6 Klijn, E. The current state-of-art in newspaper digitization, elektronisk upplaga av D-lib Magazine, vol. 14, nr. 1/2, [ ] 7 The national digital newspaper program, hemsida för Library of Congress. [ ] 8

11 på grund av dess lämplighet att täcka uppsatsens syften och frågställningar. Den är skickligt skriven, välgrundad och innehållsrik. Ett annat skäl till detta val är att hans verk, med få undantag, är de enda som är skriven av en person som inte är knuten till ett redan etablerat eller initierat projekt. Jordan är således opartisk. Jordans utgångspunkt är att arbetet med det digitala projektet bör läggas upp på ett steg för steg vis. Jordan definierar det som en 10-stegs modell som han råder att man följer. De 10 stegen som Jordan använder som förklaringsmodell ser ut som följande: Definiera målsättning och omfattning Utvärdera och bestäm urvalet Upphovsrätt Definiera delmål och milstolpar Tekniska specifikationer Utarbeta arbetsflöden Utarbeta budget Genomför projektet Utvärdera genomförning av projektet Utvärdera resultatet. 2.7 Källmaterial och val av metod Den största delen av min undersökning inom digitaliseringsforskningen består av webbaserat material. Uppsatsen består av två större moment. Det första momentet är en teoretisk och praktisk genomgång av vilka beståndsdelar en digitalisering av historiska dagstidningar består av. Metoden för denna del har varit en läsning och analys av elektroniskt publicerade projektrapporter från en rad internationella digitaliseringsprojekt över historiska dagstidningar. Det andra momentet är en projektöversikt av fyra befintliga digitaliseringsprojekt. Metod för del två har varit en empirisk undersökning. Målet med metoden har varit att ta reda på den aktuella situationen och vilka beståndsdelar en webbplats för digitaliserade historiska dagstidningar består av. Forskningen rörande moment två har pågått under marsjuli

12 Kapitel 3 Digitalisering I dess enklaste betydelse innebär begreppet digitalisering: Att transformera en analog källa till binära tal. Digitalisering innefattar dock mer än att bara skapa datafiler. Begreppets fullständiga innebörd innehåller allt från förberedelser av material, materialurval, budgetering av projekt, utförande av projekt, bevarande med mera. Det som ligger nära, men som ändå inte inkluderas i begreppet, är digital media som redan från början skapats digitalt Born Digital. Till dessa hör bland annat webbsidor, e-böcker med mera. 8 Det finns två förfaringssätt för digitalisering. Det ena sättet går ut på att skapa en digital fotokopia med en bildskanner. Det andra sättet är att maskinskriva för hand den text eller källa som ska digitaliseras. Den ena metoden ger en databildskopia och den andra ger ren datatext. Databildskopian skapas snabbare, efterliknar originalet bättre men tar större datautrymme och är trögare att ladda ner och att skriva ut. 9 Digitalisering är en verksamhet som liknar den rymdkapplöpning som rådde mellan USA och Sovjetunionen under det kalla kriget. Idag är det de multinationella företagen som kämpar om herraväldet över det digitaliserade materialet. Likt kampen om rymden är digitalisering inte bara en kamp för vetenskapen och för mänskligt vetande. Det är också en kamp om prestige och marknadsandelar. Det rör sig om stora volymer av det mänskliga vetandet i form av litteratur, konst, musik, design och så vidare, som företagen nu slåss om att vara först med att digitalisera. I Sverige ser digitaliseringskartan annorlunda ut, digitaliseringen har nästan uteslutande bedrivits med offentliga medel. 8 SOU 2003:129, (2004), KB ett nav i kunskapssamhället. Kungl. biblioteket Sveriges nationalbibliotek. Verksamhet och visioner, elektroniskt publicerad rapport från hemsidan för Kungliga bibliotek, s Cohen, D J & Rosenzweig, R. (2006), Digital History - A guide to gathering, preserving, and presenting the past on the web, s

13 3.1 Varför digitalisera? Bättre tillgänglighet, en ökad uppmärksamhet, tekniska innovationer samt mindre slitage på samlingen, brukar vara de fyra huvudargumenten för att digitalisera. Digitaliserings mål är att uppnå en flexibilitet, användbarhet, stabilitet, durabilitet, funktionalitet och så vidare, som endast kan infinna sig i en digital miljö. Förutom de fördelar som vi kommer att diskutera innebär digitaliseringen även risker. De två största svårigheterna är det logistiska - att hantera en stor mängd fysiskt och digitalt material samt det konservatoriska (bevarandet av digitalt material) Digitalt material ökar tillgängligheten För många är en stor del av kulturarvet bara till för en begränsad grupp. Mestadels är det forskare som tar del av det rika material som finns hos våra svenska institutioner. Få i den bredare allmänheten tar sig den tiden, eller det modet, att botanisera i de kulturskatter vi har. Material, som säkerligen skulle uppskattas, ligger istället oanvänt. Med hjälp av den virtuella datavärlden minskar den klyftan. Ängslan över att inte vara tillräckligt kunnig eller insatt försvinner. För det krävs ingen speciell behörighet och det ställs inga krav - digitalisering demokratiserar kulturarvet. Den ökade tillgängligheten innebär att forskare, studenter, pensionärer med flera, på ett lättare och mer flexibelt sätt, kan nå och nyttja ett visst material. Restriktionen kring öppettider och personal försvinner. En användare som till exempel vill få tillgång till ett gammalt och ömtåligt dokument behöver inte färdas till det fysiska exemplaret och be ansvariga att plocka fram det. Det innebär att befolkningen utanför storstadsregioner inte på samma sätt blir påverkade av ett kulturarv, som ofta är centraliserat till storstadsområden. Fler kan forska och arbeta med samma material samtidigt oberoende av varandra. Dessutom kan böcker som inte längre finns att tillgå i tryckt format publiceras digitalt Digitalt material ger uppmärksamhet If you build it, they will come. 10 Citatet ovan beskriver en övertygelse om att allt digitalt material lockar besökare - vad det än är. En digitalisering ger det material som hamnat utanför kanon chans 10 Kellerman, S. (2006), If You Build It, They Will Come - Implementing Digital University Libraries, elektroniskt publicerad rapport från hemsidan för Olive Software [ ] 11

14 att uppmärksammas. På ett bibliotek eller i ett museum är det naturligt att de objekt som historiskt sett dragit mest uppmärksamhet premieras av den naturliga orsaken att det inte finns plats för allt. I den mycket uppmärksammade artikeln The longest tail i tidningen Wired från 2006 diskuterar Chris Anderson det digitala mediets revolution och dragningskraften kring den. Han visar med statistik att även digitalt material, som skulle anses vara obskyrt, faktiskt har en användarbas. De når visserligen inte i upp i samma siffror som det mest välbesökta materialet. Likväl räknas besökarantalet samman för de föga kända materialen, tillsammans kallad den långa svansen, blir träffantalet i liknande nivåer med det som besöks oftast. Av utrymmesskäl går det inte att satsa på allt. Oftast väljs det obskyra bort med företräde för det som är populärast. Det digitala materialet tar bort den sortens begränsningar. Det finns en rad exempel på lyckade digitaliseringar, där institutioner och dess samlingar har fått stora publiktillströmningar. Det har gett institutioner anseende, som de senare kan dra nytta av, i bland annat ökat ekonomiskt stöd. Ett exempel är Michigans Universitetsbibliotek. De startade ett projekt kallat The Making of America, som fått stor uppmärksamhet ute i världen: The Making of America collection largely draws from books from the University of Michigan s remote storage facility that had rarely been borrowed in more than thirty years. Yet researchers now access the same obscure books 40,000 times a month. 11 Ett annat exempel där de har lyckats locka en publik är i ett projekt av det amerikanska Library of Congress. Den digitaliserade samlingen bestod utav tidigt rörliga bilder skapade av vetenskapsmannen Thomas Edison. Webbplatsen för Edison Motion Pictures hade under år 2003 cirka 15 miljoner besökare. Det är fler besökare än vad lässalarna i Library of Congress har haft under bibliotekets 200- åriga historia. 12 Huruvida intresset kring digitala samlingar kommer att bestå är svårt att besvara. Men i dagsläget betyder en digitalisering ett uppsving för en samling Digitalt material ger mervärde Digital teknik förbättrar på många sätt användningen av det fysiska originalet. Det går att ha virtuella mötesplatser kring det digitala materialet, där forskare sinsemellan kan skriva noter, ge förslag, diskutera, debattera med mera. Texten till digitaliserade verk kan göras sökbar. Programvara kan läsa upp texter, förstora text, lysa upp text, skapa hjälpmedel för människor med nedsatt syn och hörsel 11 Cohen, D J & Rosenzweig, R. (2006), s Ibid. s

15 med mera. Vissa forskningsdiscipliner, som annars varit svårhanterade kan med digital teknik få en renässans, exempelvis för kartografer som undersöker kartor via databaser. Eller för tidningsforskare som kan få hela tidningsuppsättningar på sin dataskärm. Modern datateknik medför en gigantisk platsbesparing. Vi kan till exempel räkna med att den skapade datafilen av denna uppsats upptar en storlek på 300 kilobyte. På en hårddisk med ett lagringsminne på 120gigabyte kan datafilen kopieras i över kopior. En hårddisk, som inte är större än en pocketbok och inte kostar mer än kronor, räcker för detta. Detta betyder i förlängningen, att det går att digitalisera en oerhört stor mängd information, utan att det någonsin blir en utrymmesfråga. Skulle man däremot placera ut fysiska exemplar av uppsatsen bredvid varandra på en hylla, med antagandet att varje uppsats är 1 centimeter bred, skulle de tillsammans uppta 4-5 hyllkilometer. Här följer en lista över en del av de fördelar som nämnts: Ingen geografisk begränsning. Alltid öppet. Ingen begränsning av antalet användare. Ökad uppmärksamhet kring samling och institution. En kartläggning och utvärdering av material. Anslag till nya projekt. Samordna fler institutioners material på samma plats Professionalisering och ökad erfarenhet. Bygger infrastruktur för framtida initiativ. Program som avslöjar dolda, eller gömda delar av text Kan rekonstruera skada. Sökmöjligheter i text. Komparativ analys av källor och göra noter direkt i texten. Användare med handikapp kan använda program för att till exempel få texten uppläst, förstora text, göra texten upplyst och så vidare. Sparar fysiskt utrymme. 3.2 Digitalt bevarande Att tala om digitalisering som en bevarandemetod är ett tveeggat svärd. En del hävdar att digitalisering är en giltig metod för att säkerställa materials kvarlevnad. Andra menar att frågan bör tas på större allvar, att det ligger en fara i att lägga allt för stort värde i digital teknologi. De positivt inställda menar att om det genomförs en kontinuerlig kopiering av det digitaliserade materialet, då minimeras risken för dataförlust. Går datainformation förlorad, finns avancerad teknologi för att återskapa den förlorade datainformation. Detta görs för närvarande på de 13

16 hårddiskar som befann sig i World Trade Center den elfte september Detta stämmer, men det är ett oerhört krävande arbete att återställa förlorad data. Ett prisexempel från ett företag som jobbar med dataåterskapning ger att det i genomsnitt kostar kronor att rädda en obrukbar hårddisk. 14 Datarekonstruktion kräver således stora resurser i form av tid, pengar och personal. Abby Smith, som arbetar för Council on Library and Information Resources, en organisation som bland annat jobbar med bevarandefrågor av digitalt material, hävdar i publikationen: Why digitize? att en felaktig digital bevarandemetod har farliga konsekvenser: Often the medium on which digital information is recorded is itself inherently unstable. Often the medium on which digital information is recorded is itself inherently unstable. Magnetic tape is one example of a common digital medium that requires special care and handling and has been known to degrade within a decade, beyond the point where information can be recovered. Magnetic forms of analog recording, such as video and audio tape, are equally fragile and unreliable for long-term storage. In its inherent physical fragility, magnetic tape is not different in essence from the acid paper so widely produced in the last 150 years, but its life span is often dramatically shorter than that of poor quality paper. 15 Hon menar att i förlängningen är digital hantering riskfylld på grund av att det är lätt hänt att missberäkna en digital kopias levnadslängd. Hon skriver också att under en kortare tidsperiod är digital information inget problem att bevara. Sträcker sig tidsperspektivet däremot längre, över en period på 20 år och mer, blir frågan mycket mer problematisk. Inom forskningsvärlden finns det ingen exakt uppfattning i hur länge ett digitalt medium överlever, bara en rad teorier, skriver hon. Inom hanteringen av till exempel böcker och dagstidningar innebär rätt miljö och temperatur en tillräcklig hantering. I en långsam process förändras och vittrar de sönder. För digitala medier ser denna process helt annorlunda ut, det är näst intill omöjligt att upptäcka när ett digitalt medium blir obrukbart. Det är relevant att poängtera en viktig detalj och det är att digital information aldrig kan förstöras, utan det är det medium det bevaras på som förstörs. Digital information är som tidigare beskrivet binära tal, om man vill kan man rista en runa med binära tal, för att om 300 år använda de binära talen igen. Lösningen som idag finns för bevarandet är att ständigt hålla sig teknisk uppdaterad och att ständigt göra säkerhetskopior. En bredare lösning är att se till att det sker en bra utbildning bland personalen och att många bland personalen har insyn i det digitala arbetet. Ett digitalt projekt ska absolut inte förankras på ett 13 Snickars, P. Bomber biter inte på ettor och nollor elektronisk upplaga av Svenska dagbladet, den 1 juni 2008 [ ] 14 Vad kostar datarekonstruktion, hemsida för Aurora IT systems. [ ] 15 Smith, A. (1999), Why Digitize?, Clir reports pub80, elektronisk publicerad rapport från hemsidan för Council on library and information resources, s.4 [ ] 14

17 fåtal individer. Ett klart exempel på felaktig information och dålig spridning på kunskap, var i arbetet med en norsk språk- och litteraturdatabas. Denna databas blev totalt obrukbar när projektets chef dog och ingen annan kunde de två lösenord som behövdes för att logga in. Institutet tvingades att gå ut i media och be allmänheten att hacka sig in i databasen för att på så sätt återfå de borttappade lösenorden. 16 Det är viktigt att hålla sig ajour med den allmänna trenden inom maskin- och programvara. Vilka tekniska produkter och lösningar är på långvarig sikt de mest lönsamma och säkra? Saker som annars kan hända är att datafilerna inte längre är läsbara, att filformatet är utdaterat, maskinvaran är utdaterad, operativsystemet är utdaterat och så vidare. Vem har till exempel inte misslyckats med att öppna en äldre fil för att det varit i ett felaktigt eller okänt filformat? Bevarandet av digitalt material är en viktig forskningspunkt för många, tyvärr visar det sig också att det ofta nämns som en orsak till att inte digitalisera. Många är rädda för att förlora sina digitala samlingar. Det är omöjligt att veta hur framtiden för lagringsmedier ser ut, men tekniska innovationer driver möjligheterna framåt. Om år är det sannolikt att frågan om digitalt bevarande kommer att vara en allt mindre viktig fråga. Ett troligt scenario är att lagringsmedia kommer att bli så billiga och enkla att hantera att digitala samlingar kommer att kunna kopieras i princip oändligt antal gånger till flera digitala platser samtidigt. Tills dess är standardiserings- och lagringsfrågor rörande bevarandet av digitalt material kärnfrågorna inom digitalisering. 3.3 Externt samarbete utomstående digitaliseringsaktörer Kungliga biblioteket beskriver i rapporten Digsam digitalisering och dess samordning inom Kungl. biblioteket nyttan med och vilka samarbetsformer som kan tas med andra arkiv, museer och bibliotek. Utöver ABM-sektorn som Kungliga biblioteket nämner finns det utomstående digitaliseringsaktörer. Det finns idag en rad företag som sköter digitaliseringsarbetet åt institutionerna. Två av dem är företaget Paper of Record som uteslutande digitaliserar historiska dagstidningar och Innodata Isogen, ett av världens största digitaliseringsföretag. Centret för Humanities Advanced Technology and Information på Glasgow universitet i Skottland gjorde år 2001 en studie där de undersökte bredden av outsourcing av digitalt material hos 36 kulturinstitutioner. Intervjuundersökning gav resultatet att lite mer än hälften av institutionerna tagit hjälp av en 16 Tisdall, J. Language institute asks hackers for help, elektronisk upplaga av Aftonposten, den 7 juni 2002 [ ] 15

18 utomstående part. Två av dem lät hela sin digitalisering skötas av en utomstående aktör, varav resten skötte sin egen digitalisering. Varför de har valt att utföra sin digitalisering själva: Kontroll över processen, hantering, procedur och kvalitet Minimerar skador och stöldrisk på ömtåligt samt värdefullt grundmaterial. Bygger upp en teknisk infrastruktur för framtida projekt. Ökar personalens kunskap, erfarenhet samt kännedom inför framtida projekt. 17 Digital Imaging Production Services hos Harvard universitetsbibliotek i USA, ansåg att den bästa lösningen var att göra arbetet själva. Two other factors favored the development of an in-house operation. First, there was a priority to digitize special collections, including unique materials, which always present challenges for handling and security. Second, the Harvard University Library had recently initiated a five-year program, entitled Library Digital Initiative (LDI), to build a broad-based infrastructure to select, catalog, deliver, and preserve a wide range of digital collections. 18 För Harvard blev samlingens bräcklighet samt behovet av erfarenhet inom institutionen alltför viktiga faktorer för att inte göra jobbet själva. Fördelarna med att samarbeta med en utomstående aktör är att dessa oftast har lång erfarenhet av att arbeta med digitalisering. De känner till vilka problem som finns och hur man löser dem. På så sätt behövs det inte investeras pengar i att utbilda personal. Det behövs inte heller investeras i teknisk utrustning. Dataservrar, bildskannrar och så vidare kostar mycket pengar. Utomstående digitaliseringsaktörer har oftast den modernaste tekniska utrustningen, det är en del av aktörens affärsmodell. Innan en utlokalisering av ett projekt sker bör digitaliseringsföretagets arbetsmetoder och policy klarläggas. Digitaliserar de på plats eller väljer de att skicka samlingarna till låglöneländer för digitalisering där? Det är inte ovanligt att hela samlingar skickas till Kina och Indien The NINCH guide to good practice in the digital representation and management of cultural heritage materials" (2001) elektroniskt publicerad rapport från The humanities advanced technology and information institiute (HATII); The national initiative for a networked cultural heritage (NINCH), [ ] 18 Chapman, S; Comstock, W. Digital imaging production services at the Harvard college library elektronisk upplaga av RLG Diginews,, vol.4, nr.6, [ ] 19 Cohen, D J; Rosenzweig, R. (2006), s

19 Kapitel 4 Digitalisering av historiska dagstidningar 4.1 Inledning Newspapers are particularly difficult both to preserve and to access: they are large in format, prolific in output. Their creators intend them as essentially ephemeral important today, discarded tomorrow and so they print them on paper which is produced with cheapness in mind, rather than survival. There is, however, no other medium in our history that records every aspect of human life over the last 300 years on a daily basis like newspapers. 20 Det ovanstående citatet beskriver på ett utmärkt sätt dagstidningens roll och förankring i samhället. Det beskriver positiva saker som dess styrka att vara allsidig kring varje aspekt i det mänskliga samfundet vilket kvarlever in i vår tid. Citatet tar även upp dess nackdelar, som problematik kring dagtidningens bevarande, dess bulkiga format, dess ringa ekonomiska värde och så vidare. Det sägs ibland att inget är så gammalt som gårdagens nyheter. Det centrala i citatet är, trots de många svårlösta och problematiska betingelser som finns kring dagstidningen, att bevarandet av densamma måste fortsätta för det finns inget annat nyhetsmedium med denna historiska betydelse. Inget annat medium visar de rådande tidstendenserna, fördomarna och framtidsförhoppningar som dagstidningen gör. Nyhetsrapportering och omvärldskunskap är verkligen i var mans ägo. Intresset för dagstidningar är stort i Sverige och i resten av Norden. Sverige, Norge och Finland ligger topp fyra i världen i flest dagstidningsläsare per invånare. 21 Nya innovationer gör att dagstidningens distribution och format ser 20 Deegan, M & m fl. (2002), Digitizing Historic Newspapers: Progress and Prospects elektronisk upplaga av RLG Diginews, vol. 4, nr Svensk dagspress 2008 fakta om marknad och medier, elektroniskt publicerad folder från Tidningsutgivarna, s

20 annorlunda ut idag än hur det historiskt har varit där papperstidningen och mikrofilmen varit rådande. Idag har intresset istället vänt sig mer och mer till att få sin dagstidning på en datorskärm, via en webbsida, e-mejl eller skickad till sin mobiltelefon. Denna nya marknad har expanderat så dramatiskt att den rådande marknaden satts i gungning. I en artikel i The New Yorker från år 2008 skriver Eric Alterman: Few believe that newspapers in its current form will survive. Newspaper companies are losing advertisers, readers, market value, and, in some cases, their sense of mission [ ] Independent, publicly traded American newspapers have lost forty-two per cent of their market value in the past three years. 22 Ett nytänkande är av yttersta vikt för den digitala publikationen, något som blir en alltmer viktig aspekt för dagstidningsindustrins affärsmodeller. 4.2 Historiska dagstidningars utseende Figur 1: Bilden visar layouten på en engelsk dagstidning från 1800-talet. Notera det lilla mellanrummet mellan artiklarna och hur artiklarna går som stuprännor. En av tidningens främsta egenskaper är att den under århundradena knappt har förändrats något. Det finns trots allt en del skillnader som gör att det är bra att ha 22 Alterman, E. Out of print the death and life of the American newspaper elektronisk upplaga av The New Yorker, den 31 mars [ ] 18

21 en god kännedom om dagstidningshistoria och dagstidningens förändringar över tiden. Att digitalisera dagstidningar, speciellt de från mitten till slutet av talet, medför en rad komplikationer. Det som gör det mer problematiskt är den tidens komplexitet i dagstidningens utseende och i dess storlek, struktur och layout. Digitaliseras det direkt utifrån tidningsläggen blir storleken en besvärlighet, speciellt i större kvantiteter. Dagstidningens struktur och layout medför att det inte är en enhetlig typ av medium som digitaliseras. Hänsyn ska tas till att dagstidningen är uppbyggd av 100-tals småbitar av annonser, artiklar, ledarsidor, nyhetsbilder och så vidare. Småbitar kan vara spridda över flera sidor. En dagstidningsartikel från 1800-talet bestod av en längre textremsa som gick lodrätt nedåt tills artikelns slut och med en lodrätt linje som avgränsade de olika artiklarna. Artiklarna hade sällan någon rubrik. Fanns en artikelrubrik var den oftast bara en aning större än artikelns brödtext. En annan svårighet ligger i sidornas densitet. Det betyder en stor textmassa, som gör det smalt mellan textraderna och mellan artiklarna. En artikel kunde även fortsätta på en sida längre fram i tidningen. I moderna databaser skapar detta ett problem eftersom sökningen endast tar fram bilden där söktermen uppenbarat sig och inte hela artikeln. 19

22 Kapitel 5 Digitalisering av historiska dagstidningar Teknik och lösningar I kapitel fem behandlas ämnet teknik och lösningar. Avsnitt 5.1 behandlar ämnet mikrofilm, det medium för digitalisering av historiska dagstidningar som används flitigast vid bildfångst. Avsnitten tar upp teknik som kommer efter bildfångstarbetet och gör det möjligt att på olika tekniska nivåer göra de digitaliserade tidningarna åtkomliga för användaren. CMS är system för att behandla innehållet. Metadata används för att beskriva detta innehåll. OCR utnyttjas för att tolka den digitaliserade texten. Det kan till och med vara så användningen av de olika teknikerna kan förbättras om mycket digitala bilddata finns tillgängliga. Till exempel så kan OCR-läsningen förbättras om stora orddatabaser kan användas. Och dessa databaser kan OCR-läsningen själv delvis hjälpa till att bygga. OCR-läsningsprocessen ger också successivt mer och mer kunskap om hur orddatabasen används. Samma sak gäller skapandet av metadata. Ju mer data som behandlas desto mer information kan de systemansvariga få om hur effektiva metadata ska skapas. Till exempel kan rubriksättningen analyseras över vissa tidsperioder med datorhjälp. Med hjälp av den analysen kan sedan effektiva metadata kopplas till de underliggande artiklarna. Generellt kan sägas att datasystem är effektiva på att hantera stora datamängder. Datasystemen kan användas för inlärning av de data som de behandlar. Dessa system kallas adaptiva och har visat sig vara effektiva. 5.1 Mikrofilm Dagstidningar finns i två format på svenska bibliotek. Det ena är det fysiska tidningslägget och det andra är det mikrofilmade. Idag mikrofilmas för bevarandesyfte i princip alla dagstidningar som kommer in till Kungliga biblioteket. 20

23 Den kontinuerliga filmningen sker idag i takt med den årliga produktionen av dagstidningar i Sverige och uppgick år 2001 till 1877 rullar. Den retrospektiva filmningen går dock lite långsammare och hade under förra året minskat från 735 till 645 rullar, målet är 1000 rullar. 23 Att de historiska dagstidningarna finns så pass utbrett på mikrofilm, gör det möjligt att digitalisera helt utifrån mikrofilm. Det är en populär metod att använda sig av mikrofilm som grundmaterial för digitalisering av dagstidningar. Det amerikanska projektet Utah Newspaper Project har valt en annan väg. De framhäver nyttan med att digitalisera direkt från tidningsexemplaren. De menar att tidningsläggen oftast är i bättre kondition och är renare, vilket ger bättre OCRinläsning. Detta är av yttersta vikt för dem. De beräknar att OCR-resultatet förbättras med upp till 10 % gentemot mikrofilmen. 24 (se vidare kapitel 6.3) Äldre mikrofilmskopior är ökända för sin undermåliga kvalitet. I rapporten Från kameraval till slutförvaring: mikrofilmtekniken i praktiken: seminarium september 1983 i Göteborg (1984), undersöks kvaliteten på mikrofilmskopior, både på de nutida och, än viktigare, på de äldre. Sammanställningen visar bland annat att den cellulosabaserade acetatlösning som frekvent har använts, speciellt under 70-talet, medfört stor risk för skador på mikrofilmskopior med bland annat ättiksfläckar. Anledningen till att mikrofilmen ändå är en så populär vid digitalisering av dagstidningar är att hanteringen med tidningslägg är klart mer fysiskt ansträngande. I vissa fall är det dessutom totalt omöjligt att finna kompletta tidningsläggsårgångar. Den starkaste orsaken till digitalisering från mikrofilm ligger ändå i den minskade hanteringstiden. En automatiserad mikrofilmsskanner läser in upp till 240 sidor per minut, vilket är oslagbart snabbt. 25 Ett inköp av en specialiserad mikrofilmsskanner kan få ner bildfångstpriset per sida till 0.15$, enligt Utah Newspaper Project. Kvaliteten på mikrofilmskopian är oerhört viktig för hur slutresultatet kommer att bli. Den skotska The Scotsman Archive skriver på sin hemsida om deras problem med sneda, gulnande, mörknande och repade mikrofilmskopior. Här nedan följer bilder som visar vanligt förekommande orenheter och defekter på mikrofilmskopior. De demonstrerar på ett bra sätt, vilka problem sidupplägg, damm och annat kan orsaka i en digitalisering Nilsson, Anna Karin; Skoglund, Ann-Sofie. (2002), Bevarande av dagstidningar i Sverige en probleminventering, nr.76, s Arlitsch, K; Herbert, J. Microfilm, paper, and OCR:Issues in newspaper digitization, elektronisk upplaga av Microform & Imaging Review, Vol. 33, Nr. 2, [ ] 25 Flexscan, hemsida för Nextscan [ ] 26 Deegan, M & m fl. (2002), Digitizing Historic Newspapers: Progress and Prospects elektronisk upplaga av RLG Diginews, vol. 4, nr

24 Figur 2: Bilden visar problem med små korn av smuts. Figur 3: Bilden visar problem med radbrytning. Figur 4: Bilden visar problem med bokstäver som förlorat trycksvärta. Figur 5: Bilden visar problem med trycksvärta och smuts som smetat kring texten. En av de starkaste rösterna mot mikrofilmen är Nicholas Bakers bok Double fold från år Enligt Baker har det skett oförlåtliga misstag och medvetet fusk i hanteringen av historiska dagstidningar. Baker nämner bland annat den gigantiska utförsäljningen av historisk dagspress, som British Newspaper Library gjorde under 1990-talet bakom allmänhetens rygg. Dagstidningar av ovärderligt 22

25 värde, både ekonomiskt och kulturellt, såldes till bråkdelen av dess rätta värde till utländska institut men även till privata samlare. Baker menar att detta skedde på grund av ett felaktigt synsätt rörande sparandet av tidningslägg. Han skriver att det är ett fatalt misstag att göra sig av med dessa i och med att mikrofilmskopians bevarandegaranti kan betvivlas. Bibliotekspersonal missbedömer dagstidningens levnadslängd, som enligt Baker är längre än mikrofilmens. 5.2 Content Management Software Content Management Software (CMS) möjliggör att det på ett verkningsfullt sätt går att producera och presentera ett innehåll på Internet. CMS är en programvara som låter administratören bygga och distribuera digitala bibliotek. Ett CMS ska innehålla verktyg för hantering och skapande av innehåll och metadata, samt ha diverse funktioner för visning av tidningsmaterialet. Dock har ett CMS inget med själva bildfångsten att göra. Layout och visningsalternativ, det som når användaren, är helt beroende av vilket CMS projektet arbetet med. Det finns kommersiella och Open Source alternativ. Olive Softwares Activepaper och ContentDM som Online Computer Library Center (OCLC) arbetar med är två kommersiella alternativ. Greenstone Digital Library Software är ett Open Source alternativ. De flesta digitaliseringsprojekt av tidningar har valt att använda sig av ett CMS, just därför att det ger grundmaterialet ett sådant mervärde och att det underlättar själva grundprocessen i arbetet. Alla projekt använder sig dock inte av det. I det amerikanska projektet Alberta Newspaper Collection erbjuder de en enklare tjänst. Användarens möjligheter att se tidningarna inskränker sig till att klicka fram kring pdf-bilder, via tidningens utgivningsår eller dess publiceringsort, i ett webbgränssnitt. Tidningsbilderna visas med en enklare översikt över var sida. 27 Ett projekt som erbjuder ett helt annat djup i sin användartjänst är Brooklyn Daily Eagle. De använder sig av ett CMS som ger dem möjligheten att ha en mängd presentations- och sökmöjligheter. Sökning sker via ämnesord, artiklar med eller utan bild och så vidare. Resultatet kan sedan sorteras på en mängd olika sätt Open Source system - Greenstone Digital Library Software Det är utvecklat under New Zeeland Library Project på Waikato Universitet i Nya Zeeland. Detta dataprogram går att nedladda på projektets webbsida. 27 Newspapers, hemsida för The Alberta Newspaper collection [ ] 23

26 Det är inte uteslutande gjort för tidningsmarknaden utan fungerar också för en rad andra digitaliseringsområden Vill man ha projektexempel kan man hitta flera på projektets hemsida. 28 GDLS används på ett lyckat vis i Papers Past, ett projekt som presenteras i kapitel Detta visar att det går att använda sig av ett Open Source CMS och få ett gott resultat. Det finns flera omfattande hjälpdokumentationer och användarmanualer som medföljer GDLS. Det finns även ett aktivt hjälpforum där det går att ställa egna frågor. Den stora frågan som kvarstår är dock hur pass brant inlärningskurvan är och om det i slutändan ändå kan bli billigare att investera i ett kommersiellt system. Det ställs högre krav på den egna personalen när problem uppstår när ett Open Source CMS används Kommersiella system - Olive Softwares Activepaper Archive Det israeliska dataföretaget Olive Software har specialiserat sig på att tillhandahålla tekniska lösningar för digitalisering av historiska dagstidningar men även för nyutgivna dagstidningar. Activepaper Archive, som Olive Softwares produktlösning heter, stödjer hela digitaliseringsprocessen. I de flesta fall ser man tydligt att Olive Software har varit med och arbetat i projektet. Det gör att företaget har en betydande erfarenhet inom området vilket både stödjer företagets produktutveckling samt projektkvalificering hos framtida kunder. Det är framförallt enskilda tidningar som valt att arbeta med Olive Software. Förutom Brooklyn Daily Eagle har de arbetat med The Scotsman, Palestina Post och med fler tidningar. Med tanke på den expertis som medföljer i ett samarbete med en ledande leverantör kan digitaliseringen i slutändan bli billigare denna väg. 5.3 Metadata Ordet meta förklaras som: förled som anger att en verksamhet har sig själv som objekt. 29 Metadata skulle på så vis kunna definieras som data som förklarar sitt objekts data. Tillförlitliga och välgenomarbetade metadata är viktiga delar i en väl sammansatt datastruktur. Med metadata kan dataobjekt inordnas, så att de bildar en förståelig och sammansatt struktur. Utan metadata har dataobjekten, inget ursprung, ingen plats och dess användningsområde kan därigenom misstolkas och tappas bort. Metadata brukar appliceras på fyra nivåer: 28 Examples, hemsida för Greenstone digital library software. [ ] 29 Tolfte upplagan av SAOL. 24

27 Deskriptiva metadata som beskriver dataobjektets grundläggande attribut titel, upphovsman, datum för dess skapande och så vidare. Administrativa metadata som är inriktat på att ge administratören information - dataobjektets äganderätt, licensiering, information om källmaterialet och så vidare. Strukturella metadata som beskriver relationen dataobjekten emellan. Preserveringsmetadata som underlättar hanteringen av dataobjektet bevarande. 30 Det finns en rad metadatastandarder att välja ibland. Marc är standardformatet för bibliografisk information inom svenska bibliotek. Dublin Core är ett annat, med samma princip, men där detaljinformationen är reducerad. 5.4 Optical Character Recognition Figur 6: Bilden visar den Coloradobaserade Akron Weekly Pioneer Post från den 31 juli Notera att söktermen Sweden är markerat i artikeln. Optical Character Recognition (OCR) är en teknologi som funnits sedan talet. Då användes den framförallt för att läsa av bankcheckar och adress på brev. Idag är OCR en naturlig del av arbetsprocessen kring historiska dokument. Det OCR gör, baserat på en algoritm, är att tolka tecken och bokstäver i en digital bild 30 Jordan, M. (2006), s

28 och konvertera dessa till datatecken. Detta ger den klara fördelen att texten i en digital bild blir sökbar. 31 Automatisering möjliggör att det på en bråkdel av en sekund kan avläsas tusentals bilder. OCR är en allmänt omtyckt och användbar metod inom digitalisering, framförallt inom digitalisering av media med mycket text. Helt problemfri är dock inte OCR. Tekniken ifrågasätts av en del kritiker, som hävdar att felprocenten på den OCR-genererade texten är för hög. Under idealiska förhållanden, som är när databilderna innehåller nyproducerad maskinskriven text, närmar sig exaktheten 97-99,95 %. 32 En noggrannhet på över 97 % kan te sig tillräcklig, men med känsligare material som ett äldre lagtextdokument till exempel, kan fem fel per sida vara en allt för hög felprocent. Är materialet äldre, i dåligt skick och innehåller svårtydda bokstäver bidrar det till att felprocenten blir högre. Alternativet till OCR är att manuellt skriva av texten ur en digital bild. Författarna till Digital History - A guide to gathering, preserving, and presenting the past on the web hävdar att det i vissa fall går fortare och att det blir billigare att anlita arbetskraft, som utför arbetsmomentet manuellt. 33 I storskaliga projekt där mycket text ska bli sökbart är det naturligtvis lämpligare att använda sig av OCRprogramvara, speciellt om det rör sig om mindre känsligt material. Kvaliteten på OCR beror som tidigare nämnts på en rad faktorer. För historiska dagstidningar blir inläsningssäkerheten mycket låg, mellan 70-80%. Faktorer som har påvisats ha en negativ effekt på OCR-resultatet är: Highly complex layout. Radical differences in layout over time. Variable font sizes and character types (especially Gothic). Narrow space between lines. Narrow gutter between columns. Missing or misprinted text. Poor quality or deteriorated inks. Poor quality or deteriorated papers. Irregular alignment of characters in hand-set press. Annotations by hand. Graphic devices and/or elements. Mixed languages/fonts on the same page Fujisawa, H. Forty years of reseach in character and document recognition an industrial perspective, elektronisk upplaga av Pattern recognition, nr. 41, 2008, s [ ] 32 Cohen, D J; Rosenzweig. (2006), s Ibid. Sid Holley, Rose. (2007), Optical Character Recognition (OCR) on Newspapers An Overview, elektroniskt publicerad rapport från hemsidan för Australian Newspaper Digitisation Program, s. 1. [ ] 26

29 Det som gör att en felaktig OCR blir till ett problem är att ett flertal ord kan missa sökträfflistan på grund av denna felaktighet. Om OCR läser in en artikel om slottet i Versailles och orten Versailles istället blir Verseilles, Varsailes eller någonting annat felaktigt, så innebär det i en normal sökning att den artikeln inte kommer att hittas. OCR kan på så sätt utelämna en stor del intressant forskningsmaterial. En ljusning är dock att ord och namn ofta upprepas i en dagstidningsartikel. De kan stå i rubriken, i början av artikeln, i slutet eller dylikt. Missas eller felstavas Versailles första gången så finns chansen att det stavas rätt på en annan plats i artikeln. Det finns dessutom en allmänt sprid sökteknik kallad Fuzzy search. Det är en metod som tillämpar logiskt tänkande i sökningen. Vid en sökning efter artiklar om till exempel Kung Carl Gustav XVI väljer sökmotorn att visa även de träffar där OCR-texten till exempel har blivit Kong Car Gustav XVI. Det finns all anledning att tro att moderna digitala bildbehandlingteknik kommer att användas mer och mer i OCR-tillämpningar. Digital bildbehandling handlar om att läsa in en bild, genomföra ett antal analytiska operationer baserade på hela den inlästa bilden samt utgående från denna analys förbättra bilden. Det finns många tillämpningar av digital bildbehandling, till exempel militära tillämpningar, industriella tillämpningar och så vidare. Motsvarande högteknologiska OCR kan förväntas få stor betydelse för digitalisering av dagstidningar. OCR syftar till att skapa text vilket är mer väldefinierat än att skapa bilder. I ovanstående exempel med Versailles så skulle varje skapat möjligt ord kunna stämmas av mot en orddatabas vilket säkert skulle ha eliminerat de andra felaktiga tolkningarna. I detta exempel så skulle också rena adaptiva tekniker kunna användas. Förekommer ordet Versailles ofta i en artikel, vilket är rimligt att antaga om till exempel artikeln handlar om Versailles, så skulle det vara rimligt att styra tolkningen av ord som liknar Versailles mot just ordet Versailles. Skulle inte så vara fallet så skulle ordet kunna styras mot någonting annat. Kan en OCRläsning skapa flera tänkbara alternativ mot denna orddatabas så kan man genom en grammatisk analys av hela meningen eliminera flera av de felaktiga alternativen. Skulle efter alla dessa analytiska steg fortfarande flera möjliga alternativ (eller inget alternativ alls) föreligga för OCR-läsningen så kan man helt enkelt lämna över beslutet till den som övervakar OCR-processen. OCR ger mervärde till den digitaliserade dagstidningen. Framförallt minskar användarens tid i sökandet efter rätt information. En annan aspekt med OCR är att det går att få texten digitalt uppläst, vilket ger synskadade en chans att ta del av digitalt material. Med all rätt så kommer en bra tillämpning av OCR-teknik att vara avgörande för en framgångsrik digitalisering. 27

30 Kapitel 6 Digitalisering av historiska dagstidningar Teori och praktik Figur 7: Bilden visar dagstidningen Brooklyn Daily Eagle digitaliserade dagstidningsarkiv. Bilden visar framsidan från den 13 december, Den röda färgen indikerar att artiklarna är indelade i individuella bildrutor. Klickar man där kommer artikeln upp i ett nytt fönster. Bilden ger exempel på hur ett CMS kan se ut. I detta fall är det företaget Olive Softwares CMS: Activepaper Archive 6.1 Målsättning och omfattning Detta avsnitt beskriver planläggningsarbetet kring projektmålsättning och dess omfattning det första steget i processen. Dessa beslut ska sedan fungera som den mall som projektet stödjer sig på. En välformulerad målsättning och preciserad omfattning blir värdefulla tillgångar i det framtida projektarbetet. 28

31 6.1.1 Målsättning Upprättandet av en målsättning är inte bara ett klargörande över varför materialet ska digitaliseras utan det får även verka som en planering för hur projektet ska startas, verkställas samt slutföras. En bra utgångspunkt är att ta del av andra digitaliseringsprojekt och därifrån samla in erfarenhet, råd och idéer och så vidare. De problem, som kan uppstå i frågor om tekniska lösningar, budgetering och upphovsfrågor, kan lösas på ett tidigt plan om målsättningen för projektet är fast förankrad hos administrationen och personalen. Detta minskar potentiella oenigheter, som kan leda till slitningar inom gruppen, vilket i sig skulle göra de nästföljande stegen avsevärt svårare att genomföra. Efter en bra och genomarbetad målsättning kan de komponenter som är nödvändiga för projektet sättas samman. Ett förslag på hur en målsättning kan tänkas se ut: The Southeastern regional news collection contains selected issues of the County Herald and Crighton Daily newspapers published between 1900 and The collection, which will be freely available to everyone over the World Wide Web, will be of interest to local historians, to genealogists and to students seeking primary source material from the early part of the 20 th century. Access to the major articles in each issue will be aided by the addition of subject keywords. Each newspaper issue will be presented as a single Adobe Acrobat file for easy printing. 35 De har klargjort: Vem som ska digitalisera. Vilka tidningar och under vilken tidsperiod. Fri tillgänglighet över Internet. Tänkbara användare. Databasens sökbarhet. Hur artiklarna kategoriseras. Hur materialet presenteras. En tidsangivelse skulle också kunna läggas till. Denna skulle kunna innefatta när projektet tar sin början, hur lång tid digitaliseringsarbetet beräknas ta samt när det färdiga resultatet kan lanseras. Vem eller vilka är de användare som kan tänkas vara intresserade av det digitala materialet? De kan vara studenter, forskare, geneloger, reklamare, författare och så vidare. Det är en klart befogad fråga att ställa i ett tidigt stadium. Kunskap om tänkbara användare är viktigt i urvalet av dagstidningar samt för 35 Jordan, M. (2006), s

32 fastställandet av tekniska funktioner och applikationer. Dessa val kan resultera i att materialet används på ett bättre sätt. Att känna till sin målgrupp betyder inte nödvändigtvis att det krävs en specialisering för endast den användargruppen, men det leder till bättre fokusering av projektet. Vissa användargrupper kräver bättre sökbarhet, högre datahastighet, bildkvalitet med mera än andra. Är till exempel filmdoktorander den primära användargruppen bör hänsyn tas till just hur deras arbetssituation ser ut. För denna användargrupp kan extra fokus sättas på sökbarheten och att till exempel artikelbilderna kopplas till artikeltexten, vilket innebär att bilderna blir en del av textsökningen. Samt att bildupplösningen blir så pass god att det är möjligt att dra slutsatser utifrån bilderna. Är det istället de äldre i samhället, som är den primära användargruppen, bör hänsyn tas till att navigeringen och att sökmomenten är så användarvänliga och enkla som möjligt samt att läsbarheten är maximerad. Idéer på hur målgrupper kan se ut: Those looking at the effect of change over decades e.g. in gender roles in public and private life, at the adaptation to change within institutions and to the explosion of new knowledge and perceptions in the sciences and industry. Pupils working on projects such as The Victorians and Women at War ; Local historians, and the general public in their present or future communities; Family historians by disclosing not only the births, deaths and marriages Omfattning Ett projekts omfattning ger projektets tids- och ekonomiramar. Översatt till termer av digitalisering av dagstidningar skulle det innebära antal sidor, antal dagstidningar samt omfattningen av visningsalternativ av materialet. Vi ska i denna del framförallt undersöka de två första punkterna. Vad som anses vara ett skäligt antal tidningar bestäms av projektets karaktär. Det finska historiska tidningsarkivet har valt att digitalisera 44 tidningar där vissa av dessa tidningar endast utkom i ett fåtal nummer. 37 Det stora digitaliserade arkivet 19th Century 36 Readings, R; Holland, M. The Thunderer on the web The Times digital archive , elektronisk upplaga av Library + Information update, Juli [ ] 30

33 British Library Newspaper som British Library Newspaper tillhandahåller är en komplett tidningsserie av 48 tidningar, vilket i slutändan ger över 2 miljoner dagstidningssidor. 38 Ett urval med ett lägre antal tidningar kan leda till att kvaliteten blir bättre. Men på samma gång missas det goda som en stor bredd innebär. Det är ett ställningstagande som i slutändan ofta bestäms av vad budgeten tillåter. En mångsidig, välgjord och alltäckande digitalisering bör möjliggöra att användaren får tillgång till tidningens alla sidor. 6.2 Utvärdera samling och bestäm urvalet Nästa steg är att ta ställning till vilka tidningar som ska digitaliseras. Det kan tänkas att det faller sig naturligt vad som ska digitaliseras. Men det kan också tänka sig att en större del av tiden behöver läggas på utvärdering och urval av dagstidningar. Avsnittet nedan beskriver hur utvärderings- och urvalsprocessen kan underlättas Utvärdera samlingen Att utvärdera sitt material berör två faktorer: 1.) Är materialet i tillräckligt gott skick? 2.) Är materialet tillräckligt intressant för att digitaliseras? Att veta vad som saknas eller vad som har förstörts i en samling är omöjligt att veta förrän det undersöks på plats. Material, som det lagts mycket pengar och tid på att bevara, kan visa sig vara totalt obrukbart. En del av det som mikrofilmats under 1900-tal är idag tyvärr totalt obrukbart. Bildytan kan vara totalförstörd på grund av en undermålig mikrofilmsteknik. I vissa fall har tidningslägg slängts utan att det först har mikrofilmats. Det är även känt att äldre mikrofilmsteknik ibland har missat att fotografera vissa sidor. Under pilotprojektet till Australian Newspaper Digitalisation Program (ANDP) som National Library of Australia har arbetat med, fann man att det saknades 1.7% av 50,000 tidningssidor. 39 För att undvika framtida problem har det satsats mycket på att hitta lösningar för 38 Shaw, J. (2005), 10 billion words: The British Library British Newspapers Project Some guidelines for large-scale newspaper digitization, konferensrapport från World library and information congress: 71th IFLA general conference and council, s Holley, R. Dealing with missing pages, elektroniskt publicerad rapport från hemsidan för Australian Newspapers Digitisation Program s.1 [ ] 31

34 mikrofilmsbevarande. En av lösningarna är att satsa på programvara som absolut inte hoppar över tidningssidor. Den andra frågan är om materialet är tillräcklig intressant för att digitaliseras? Om materialet redan är digitaliserat av någon annan är svaret antagligen nej. Det måste alltså helst vara unikt. Med tanke på den kostnad och tid som det tar att digitalisera är detta något som helst bör undvikas, såvida det inte finns uppenbara skäl att göra det. Ett sådant skäl är till exempel att den egna samlingen är i bättre skick Bestäm urvalet Målsättnings- och omfattningsplaneringen visar sig här vara extra viktig. Om ett målsättningsbeslut till exempel har varit att påvisa kvinnorättens utveckling under 1800-talet bör urvalet naturligtvis vara inriktat på dagstidningar med just detta fokus. Blir urvalet en alltför krånglig process, till exempel därför att flera intressenter har motstridiga intressen eller därför att samlingen är stor, kan en utomstående expertpanel vara en klok idé. Panelen kan börja med att skriva samman en prioritetslista över dagstidningar som räknas som självklara att digitalisera. Expertpanelen som sattes samman för 19th Century British Newspaper Library Project hade till en början en preliminär lista på ungefär 160 dagstidningar. Expertpanelen fick ner listan till 48 dagstidningar genom att sätta samman en kravlista: To ensure that complete runs of newspapers are scanned. To have the most complete date range, , covered by the titles selected. To have the greatest UK-wide coverage as possible. To include the specialist area of Chartism (many of which are short runs). 40 To consider the coverage of the title: e.g., the London area; a large urban area; a larger regional/rural area. To consider the numbers printed a large circulation. The paper was successful in its time via sales. To consider the different editions for dailies and weeklies and their importance for article inclusion or exclusion. To consider special content, e.g., the newspaper espoused a certain political viewpoint (radical/conservative). The paper was influential via its editorials Valreformrörelse i Storbritannien åren

35 Nyckelaspekter, som British Library har iakttagit, är att säkerställa att man inte digitaliserar alltför många dagstidningar som ur tids-, politiska eller geografiska aspekter ligger för nära varandra. Dagstidningarna ska även ha varit populära och relevanta under den givna tidsperioden. En bedömningsgrund, som inte finns med i denna lista men bör finnas med, är den om användarrelevans. British Library löste detta delvis genom att utföra en användarundersökning bland de akademiska kollegerna. Undersökningen, i vilken 195 personer deltog, tydde på att det viktigaste kriteriet var att se till att få en så bra geografisk spridning som möjligt. De valda tidningarna skulle komma från hela landet samt ha en nyhetstäckning som täckte så stor geografisk del som möjligt. Lokaltidningar var på så sätt inte riktigt lika intressanta enligt användarundersökningen. 42 Ett annat problem är att en dagstidning ofta kommer ut i diverse upplagor. Det kan röra sig om en regional upplaga, en lokal upplaga, en morgonupplaga, en kvällsupplaga och så vidare. På webbplatsen William Blake Archive har man löst upplagefrågan genom att man sammanfört olika utgåvor av diktaren Blakes verk. Några universitet har åstadkommit detta genom att digitalisera sina egna exemplar för att sedan länka samman dem på en och samma plats. Det är alltså samma verk men det finns skillnader mellan utgåvorna. Besökaren kan på så sätt utföra komparativa analyser av de olika utgåvorna från en och samma webbplats. 43 Blake Archive tillhör inte samma materialtyp som historiska dagstidningar, men lösningen kan tänkas se ut på ungefär samma sätt Upphovsrätt På grund av lagar kring upphovsrätten går det inte ha ett helt fritt urval för digitalisering. Först måste en säkring av materialet göras så att ingen part fortfarande står som upphovsman. Upphovsrättsfrågor är svårare i fallet med historiska dagstidningar än med en bok eller med en målad tavla till exempel: Detta för att tidningen består av en mängd olika artiklar skrivna dels av frilansande reportrar, dels anställd personal samt insändare, reklam, fotografier och teckningar. Vad det gäller insändare så har upphovsmannen ingen rätt men det andra materialet omfattas och skyddas i olika hög grad av upphovsrättslagen, då varje bidrag utgör en självständig, intellektuell och kreativt skapad produkt. Även dagstidningen, som sammansatt verk, skyddas av lagen då den person som sammanställt de olika delarna innehar upphovsrätten till det sammansatta verket. Dessutom är tidningens layout 41 Shaw, J. (2006), s Ibid. s Tour of the archive, hemsida för The William Blake Archive. [ ] 33

36 också upphovsrättsligt skyddad. Rätten att använda verken överförs till utgivaren enligt de överenskommelser som träffats mellan denne och upphovsmännen, antingen individuellt eller kollektivt. Dock gäller denna inte rätten att föra över verken till en form som inte var känd då överenskommelsen slöts, vilket ofta är fallet med digitalisering 44 En väg de flesta undersökta projekt tagit är att bara digitalisera material med fri upphovsrätt. Materialet som digitaliseras måste juridiskt sett tillhöra den publika domänen. Därför ses sällan digitaliserade historiska dagstidningar yngre än 70 år. Oftast digitaliseras material från 1800-talet eller tidigare. Upphovsrätten ses ofta som ett hinder för informationsspridning. Det bör dock inte ses som en anledning som hindrar från kontakt med den eller dem som har upphovsrätten till skyddat material. Det går säkerligen att hitta ett samarbetsavtal som gagnar båda parter. I det avtal som Google tecknat med de universitetbiblioteken som ingår i Google Book Search får universiteten en digital kopia av varje bok som Google digitaliserar. 45 Google bekostar därmed digitalisering åt universiteten. 6.3 Budget Vi ska i detta kapitel utreda var kostnaderna ligger, samt diskutera de gömda kostnaderna. Det är dyrt att digitalisera. Den största kostnaden ligger på administration och personal. En kostnad som stiger ytterligare om det saknas erfarenhet bland personalen och speciell utbildning behövs. En bra grund för budgetering är att beräkna kostnaden per digitaliserad sida. The largest costs for a digitisation project are operations staff (staff performing permission clearance, metadata production and content creation; supervisors; project managers, etc.), hardware, software, copyright clearance fees and a CMS, whether a vendor product or open source. 46 Colorado Newspaper Project har räknat samman att varje digitaliserad dagstidningssida kostar dem $1.25. I en närmare utvärdering av vad de $1.25 går till har de kommit fram till detta resultat: $0.29 page for duplication 44 Nilsson, A K; Skoglund, A-S. (2006), s Duguid, P. Inheritance and loss? A brief survey of Google Books, elektroniskt publicerad artikel First Monday, vol. 12, nr. 8, [ ] 46 Jordan, M. (2006), s

37 $0.32 page for digitization $0.14 page for online storage $0.10 page for backup storage $0.40 page overhead (staff, server support, storage reserve funds, etc.) 47 Det bör beräknas att 1/3 går till själva bildfångsten, 1/3 går till personalutgifter och den sista 1/3 går till administrativa utgifter. Beräkning är gjord för ett projekt där det existerar befintligt infrastruktur för digitalisering. Finns inte den, i form av teknisk apparatur och utbildad personal, stiger självklart omkostnaderna. Teknik - Om det inte redan gjorts investeringar i en teknisk infrastruktur innebär det stora kostnader att köpa in ny utrustning. Är det värt att köpa in dyr teknisk utrustning, när det är okänt hur många projekt till som utrustningen kan tänkas användas till? Professionella digitaliseringsföretag har generellt sätt den senaste utrustningen och byter kontinuerligt ut den som en naturlig del av sin affärsmodell. Personal Är personalen oerfaren kommer det att krävas tid för inlärning. Det kan även tänkas kräva nyanställningar eller inhyrning av personal. Om personalens kunskap sviktar kan slutprodukten i slutändan bli lidande. Digitaliseringsföretag har å andra sidan oftast en lång erfarenhet. De kan dessutom sätta en fast budget, som minimerar risken för oförutsedda utgifter Grinstead, L. (2005), s Tennant, R. Outsourcing digitization, elektronisk upplaga av Library Journal, 15 september [ ] 35

38 Kapitel 7 Digitalisering av historiska dagstidningar - Projektöversikt I och med att vi nu har beskrivit digitaliseringsprocessens delmoment kan vi nu övergå till att lägga fram en nulägesbeskrivning över digitaliseringsprojekt av historiska dagstidningar i världen. Förra kapitlet fungerade som en inblick i den inre processen av ett digitaliseringsprojekt. Detta kapitels syfte är att undersöka och ge synpunkter på den yttre processen den bild som når användaren. Tanken med denna del är att undersöka fyra utvalda projekts fördelar och brister. 7.1 Urvalskriterium Det finns så pass många projekt att det vore omöjligt att nämna dem alla. Avsikten är istället att välja ut några av dem för att ge en uppfattning om hur nuläget ser ut, vilka funktioner som projekten använder, vilket omfång projekten har och så vidare. De utvalda projekten är kategoriserade som kommersiella eller ickekommersiella projekt. Följande projekt kommer att studeras: Icke-kommersiella Finska historiska tidningsarkivet. Finska historiska tidningsarkivet (FHT) är intressant att undersöka eftersom det ligger i ett nordiskt land. Förhållandena de nordiska länderna emellan bör te sig lika varandra. Dessutom är dagstidningar utgivna i Finland under 1800-talet nästan uteslutande på svenska, vilket gör dem än intressantare. Papers Past Archive. 36

39 Ett Nya Zeeländskt projekt som är intressant för att det är uppbyggt kring ett Open Source CMS. Intressant är att se om det finns stora skillnader mellan ett Open Source alternativ och ett kommersiellt CMS. Kommersiella 19th Century British Newspaper Library. British Newspaper Library är ett av världens främsta tidningsbibliotek. Insamlingen av dagstidningar har pågått sedan år 1820 och består idag av ungefär bundna volymer samt rullar mikrofilm. 49 Därför var det en stor nyhet när British Newspaper Library och forsknings- och utbildningsförlaget Gale Cengage Learning i ett pressmeddelande år 2004 kom ut med nyheten om att de startat ett samarbete, 19th Century British Library Newspaper Project. Samlingen består utav två tidningskollektioner 17th and 18th Century Burney Collection Newspapers och 19th Century Newspapers som tillsammans bildar en samling på 2 miljoner digitaliserade sidor och 40 miljoner artiklar. 50 The Scotsman Digital Archive. The Scotsman är en skotsk dagstidning med anor tillbaka till tidigt 1800-tal. De började digitalisera sitt tidningsarkiv rätt nyligen och erbjuder allmänheten en betaltjänst där man betalar för den tid man använder arkivet. Projektet kommer att undersökas därför att det har en intressant betalmodell för sin tjänst och för att arkivet är uppbyggt på ett kommersiellt företags CMS. Dessutom är det intressant att undersöka ett projekt med endast en digitaliserad dagstidning. 7.2 Riktlinjer för bedömning De punkter för bedömning som tittas extra noga på är hämtade från Alisons Jones: The Importance of Yesterday s News : Opportunities & Challenges in 49 British Library Newspapers Collections, hemsida för The British Library. [ ] 50 Newspapers Digitisation Project: British Newspapers , hemsida för The British Library. [ ] 37

40 Newspaper Digitization från år Hon har i sin rapport studerat skillnader mellan olika val av CMS. Dessa bedömningsgrunder är så pass välfunna att det även används i detta studium. Viewing Methods and Displaying Options. 1. Can an article be seen in the full context of the newspaper page? 2. How easy is it to navigate an individual page and between different pages of a newspaper issue? 3. How common is article or item zoning, or the ability to read and manipulate individual page objects? 4. How are search results displayed? 5. How much bibliographic information is provided? 6. How common is it to have search terms highlighted? 7. What are the various printing and ing options? 51 Vidare riktlinjer och utgångspunkter Jones tar med för bedöming är dessa: Search Options. 1. What full text search methods are available? 2. Are there any advanced search options available such as Boolean searching? 3. Can you save a list of items for later viewing? Icke-kommersiella projekt Finska historiska tidningsbiblioteket (FHT) Detta finska projekt består av fri tillgång till 165 tidningar och sidor. Med tanke på att de flesta tidningarna som gavs ut under 1800-talet i Finland skrevs på svenska är detta tidningsbibliotek även väl användbart för svenska användare. Webbsidan går att läsa på finska, på svenska och på engelska. FHT har byggt upp en ansenlig databas med en lättfattlig utformning med många funktioner för användaren. Dagstidningarna nås genom bläddring, genom enkel sökning samt genom avancerad sökning. Bilderna kan ses i TIFF eller i Gif-format med möjlighet att ladda ner bilderna i pdf-format. Söktermen blir upplyst i 51 Jones, A. (2004), The importance of yesterday s news : Opportunities & challenges in newspaper digitization, elektroniskt publicerad rapport från Technical report for IMLS project- The Richmond Daily Dispatch, s. 15 [ ] 52 Ibid. s

41 artikelbilderna vilket underlättar när användaren letar efter rätt artikel på en tidningssida. Det går skriva ut tidningsbilderna, men det går inte att mejla specifika artiklar och det går heller inte att spara artiklar. Tyvärr finns ingen bibliografisk information om dagstidningarna. Det bästa med FHT får ändå anses vara den goda kvaliteten på det digitala materialet. Upplösningen är hög och det är enkelt att läsa vad som står i artiklarna. FHTs bästa sida har dock en negativ konsekvens. Sitter användaren på en långsam Internetanslutning tar det en ansenlig tid att ladda klart en sida, i genomsnitt över 30 sekunder. Detta kan tyckas vara en bisak i sammanhanget, men sitter man och bläddrar en längre tid, blir laddningstiden en märkbar irritationsfaktor. Orsaken till den långa laddningstiden har med storleken på filerna att göra. De är ofta större än 5mb Papers Past Nationalbiblioteket på Nya Zeeland står för Papers Past som har cirka 1 miljon digitaliserade sidor från dagstidningar mellan åren 1840 och Dessa är presenterade på engelska och på maori. Databasen är uppbyggd kring tidigare nämnda GDLS och är ett lysande exempel på hur man kan använda sig av fritt tillgängliga program för att få ett lyckat resultat. Det slår användaren direkt hur stilren och funktionell lösningen är. Papers Past har funktioner som annars ofta saknas: Ett behjälpligt hjälpavsnitt och en direktlänk till fråga en bibliotekarie. Varje tidningstitel har avsnitt för bibliografisk information samt för tidningens övriga historik. Vill användaren ta reda på en tidnings historik kan vederbörande ofta söka vidare på andra ställen. Men idén att skriva samman och klargöra tidningars ursprung, upphovsmän, ståndpunkt, upphörande och så vidare inom ramen för tidningsprojektet är en utmärkt idé. Många projekt kan dra sig för detta med tanke på den tid det kan ta att samla in information. Men det ger databasen så mycket mer än om man bara tillhandahåller digitaliserade bilder på artiklar. Det projektet Papers Past har gjort på Nya Zeeland är att presentera OCR-texten för varje tidningsartikel med ett tillhörande estimerat precisionstal som visar OCRtillförlitligheten för varje artikel. Eftersom det är möjligt att rätta till felaktig OCR kan användaren på så vis vara en tillgång till projektet när vederbörande rapporterar fel. Papers Past har bytt bort termen avancerad sökning mot termen mer sökalternativ. Avancerad sökning kan lätt misstolkas som att användaren måste ha en mer avancerad kännedom om hur man söker, eller att det krävs en stor kännedom om materialet för att kunna använda sig av det. Papers Past har samma sökkriterier som de största kommersiella alternativen har. Från och till datum 39

42 sökning, fuzzy search, kategorisök (artikel, annons och så vidare) med mera. Det går att bläddra sig fram till rätt dagstidning genom att klicka och välja på en karta i regionen tidningen är utgiven i, vilket är en bra funktion. 7.4 Kommersiella projekt th Century British Newspaper Library (CBNL) CBNL är framförallt konstruerat för dem som besöker British Libraries lokaler. Utländska institutioner kan ansöka om temporär åtkomst. Som privatperson utanför Storbritannien blir det svårare att få tillträde. British Library råder privatpersoner att man tar kontakt med Gale Cengage Learning. CBNL är främst till för brittiska invånare. Framförallt på grund av att anslagen till projektet har kommit från Joint Information Systems Committee (JISC) som är en brittisk intresseorganisation för högre studier i Storbritannien, vilket kan vara en bidragande orsak. CBNL består av 48 dagstidningar, framförallt ifrån trakten runt London. Det är oftast för mycket begärt av användaren att de ska känna till de namnen på dagstidningarna som de letar efter. Därför är det en bra lösning att på så detaljerad nivå som möjligt ge namnen på dagstidningarnas utgivningsställen. I CBNL finns möjligheten att klicka på den ort man är intresserad av och där få fram de dagstidningar som har givits ut på den orten. Användaren kan på detta sätt till exempel hitta tidigare okända dagstidningar, vilket säkerligen är uppskattat. CBNL har grundmöjligheter för basic search och advanced search. Det går att spara, skriva ut och mejla artiklar. CBNL har en ganska omfattande historisk beskrivning av de historiska dagstidningar de har i sitt arkiv The Scotsman digital archive Integrerad i The Scotsmans webbsatsning finns fliken archive. Klickar man på fliken leds man till deras digitaliserade tidningsarkiv. Här finner man alla tidningsexemplar från tidningens startår 1817 till år Projektet är ett samarbete mellan dagstidningen, UK Archiving, Olive Software och en rad skotska bibliotek. För att säkerställa den bästa kvaliteten på det digitala materialet har projektdeltagarna gått igenom varje sida på de arkiv där mikrofilmerna 40

43 befunnit sig och valt ut dem som sett bäst ut. The Scotsman är ett intressant exempel på där ett tidningsförlag och flera bibliotek samarbetet. Projektet har digitaliserat sidor. Webbplatsen erbjuder inga unika tekniska funktioner men saknar å andra sidan inga funktioner heller. Det går att spara, skriva ut och mejla artiklar. Dessutom sparas den gamla söktermen. Det finns en avdelning med bra historiska fakta om dagstidningen kopplade till en skotsk tidslinje över historiska händelser. Artiklarna är precis som i de andra projekten vi studerat, OCR-lästa, segmenterade och zonade. The Scotsman har en unik betalmodell för sin tjänst. Deras affärsmodell fungerar på så sätt att de säljer tidsbundna prenumerationer. Prisexempel är: 7.95 för 24 timmar, för en vecka och för en månad Pricing, hemsida för the Scotsman archive. [ ] 41

44 Kapitel 8. Digitalisering av historiska dagstidningar Tjänsteutbud Det uppsatsen i mångt och mycket försökt påvisa är att en digitalisering är mer än bara själva bildfångsten. De tekniska funktioner som går att tillämpa är många. Den lista som följer nedan innehåller samlade reflexioner och tankar över vilka funktioner som bör tillämpas i ett digitaliseringsprojekt. Efter den presenteras två tekniska begrepp som är unika i digitalisering av historiska dagstidningar. 8.1 Grundfunktioner Möjlighet att bläddra via tidningstitel eller datum. Möjlighet att bläddra fram och tillbaka i tidningen. OCR-generade texten är synlig. Möjlighet att spara sökningar samt skriva ut. Zoomar in och ut. Bildens ram kan minskas och förstoras. Enkelt att komma till nästa nummer av tidning. Enkelt att byta till nästa tidningstitel utgiven samma dag. ar artikel. Visar tidningens bibliografiska information samt var man kan hitta den fysiska kopian, mikrofilmen Enkel samt avancerad sökning. Pedagogiskt hjälpavsnitt över sökmomentet. Sökning i endast en tidning. Tvärsökning i flera tidningar. Booleansk sökning AND, OR, NOT. Sökruta på varje sida. Trunkering. Sökning på publikationsdatum. Sökning på artikeltyp (dödsannonser, ledarsidor och så vidare) Sökning via geografisk plats eller ort. 42

45 Sökning inom ett ämnesområde/tidsera Rösträttsutvecklingen för kvinnor, olympiaden i Stockholm 1912, till exempel. Sökning endast på artiklar med bilder. Söktermen är upplyst i artikeln. Menade du? Vid felstavade ord. Fuzzy search Sparar sökning. 8.2 Segmentering En dagstidning består utav många småbitar. På samma nyhetssida blandas artiklar utan kategorisk eller innehållsmässig likhet. Delas artikeltyper in i diverse olika segment så filtreras sökningen så att onödigt material hamnar utanför. En specifik användare vill kanske åt serierutor där Winston Churchill förekommit. Med en segmentering, slipper användaren gå igenom en träfflista med nyhetsartiklar, insändarbrev, ledarsidor eller dylikt innehållande Churchill. Dessutom innebär segmentering att varje artikel blir unik. På så sätt behöver användaren inte leta upp rätt artikel på tidningssidan. Artikeln kan presenteras i en egen bildruta. Segmentering kan underlättas om dataobjekten redan är beskrivna i metadata. Segmentering går att utföra med ett CMS. Den som arbetar med segmentering i ett digitaliseringsprojekt markerar manuellt på en dataskärm vilken artikeltyp varje artikel ska tillhöra. Exempelvis kan alla annonsbilder bli gula och alla giftermålsbilder bli rosa. Tänkbara kategorier att segmentera artiklarna på är: Nyhetsartiklar Reklam Födelse och dödsannonser Giftermål/förlovning Recensioner Insändarbrev Ledarsidor Serier 43

46 8.3 Zoning Figur 8: Bilden visar en zoning av en artikel. Notera artikelns udda gång. Som det redan har nämnts var artiklarna i historiska dagstidningar lodrätt orienterade med en tunn linje som separerade artiklarna ifrån varandra. Artiklar kunde dessutom fortsätta på en annan sida. Om artikeln fortsätter på en annan del av tidningssidan eller på en annan tidningssida kan sökprogrammet inte koppla samman de två bilderna. Sökprogrammet hittar endast den bild där söktermen har uppenbarat sig. För att kunna särskilja artiklar ifrån andra artiklar används en teknik kallad zoning. Begreppet innebär att man manuellt letar upp varje artikels början och slut för att sedan indexera dem. Det liknar arbetsmomentet med att segmentera en artikel. Skillnaden är att man med zoning kan definiera en artikels proportion. Varje artikel blir på så vis unik och hela artikeln kommer med i sökningen. En indexering av artiklar gör dem även klickbara. Denna arbetsuppgift kan ett CMS utföra. 44

Digital dokumenthantering för ABM II:1

Digital dokumenthantering för ABM II:1 ABM DDH II Digital dokumenthantering för ABM II:1 Introduktion Vårens kurs Digital dokumenthantering för ABM II Undervisningen kommer att ske med föreläsningar seminarier praktiska övningar (i samarbete

Läs mer

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Sökplan TDDD39 Perspektiv på informationsteknologi Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi. Anvisningar Sökplanen påbörjas

Läs mer

Riktlinjer och mål för digitaliseringsarbete

Riktlinjer och mål för digitaliseringsarbete Riktlinjer och mål för digitaliseringsarbete Inledning I december 2011 beslutade regeringen om en Nationell strategi för arbetet med att digitalisera, digitalt bevara och digitalt tillgängliggöra kulturarvsmaterial

Läs mer

Ökat personligt engagemang En studie om coachande förhållningssätt

Ökat personligt engagemang En studie om coachande förhållningssätt Lärarutbildningen Fakulteten för lärande och samhälle Individ och samhälle Uppsats 7,5 högskolepoäng Ökat personligt engagemang En studie om coachande förhållningssätt Increased personal involvement A

Läs mer

Självkörande bilar. Alvin Karlsson TE14A 9/3-2015

Självkörande bilar. Alvin Karlsson TE14A 9/3-2015 Självkörande bilar Alvin Karlsson TE14A 9/3-2015 Abstract This report is about driverless cars and if they would make the traffic safer in the future. Google is currently working on their driverless car

Läs mer

Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek

Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek Referera rätt Christina Brage, förste bibliotekarie, Linköpings universitetsbibliotek Det hör till god vetenskaplig praxis att redovisa de källor som använts. Det måste alltid framgå av texten vem som

Läs mer

Informatik C, VT 2014 Informationssökning och referenshantering. Therese Nilsson therese.nilsson@ub.umu.se 0660-292519

Informatik C, VT 2014 Informationssökning och referenshantering. Therese Nilsson therese.nilsson@ub.umu.se 0660-292519 Informatik C, VT 2014 Informationssökning och referenshantering therese.nilsson@ub.umu.se 0660-292519 Umeå UB Datorer och nät, utskrifter, kopiering Studieplatser Böcker, avhandlingar, uppslagsverk E-resurser

Läs mer

Rolf-Allan Norrmosse. SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) Paper presenterat vid konferensen

Rolf-Allan Norrmosse. SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) Paper presenterat vid konferensen SCB:s erfarenheter av digitalisering av Bidrag till Sveriges officiella statistik (BiSOS) Rolf-Allan Norrmosse Paper presenterat vid konferensen 14-15 oktober 2009 i Borås SCB:s erfarenheter av digitalisering

Läs mer

Checklista: Beständiga identifierare

Checklista: Beständiga identifierare Checklista: Beständiga identifierare Beständiga identifierare (persistent identifiers/pid:ar) är unika kodsträngar 1 kopplade till olika poster. De är en förutsättning för att man ska kunna skapa länkar

Läs mer

Vätebränsle. Namn: Rasmus Rynell. Klass: TE14A. Datum: 2015-03-09

Vätebränsle. Namn: Rasmus Rynell. Klass: TE14A. Datum: 2015-03-09 Vätebränsle Namn: Rasmus Rynell Klass: TE14A Datum: 2015-03-09 Abstract This report is about Hydrogen as the future fuel. I chose this topic because I think that it s really interesting to look in to the

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

Open access.se underlag för styrgrupp den 16 september

Open access.se underlag för styrgrupp den 16 september Open access.se underlag för styrgrupp den 16 september Jan Hagerlid, Kungliga biblioteket, samordnare för OpenAccess.se Sidnummer 1 Mål och prioriteringar På kort sikt: Vad ska stå på webbplatsen nu? Ta

Läs mer

PROJEKT DIGIHEM. Digitaliseringen av kulturarvet. Nordisk hembygdsträff på Åland

PROJEKT DIGIHEM. Digitaliseringen av kulturarvet. Nordisk hembygdsträff på Åland PROJEKT DIGIHEM Digitaliseringen av kulturarvet Nordisk hembygdsträff på Åland 23-25.9.2016 Projektägare: Finlands svenska hembygdsförbund r.f Kartläggning av digitaliseringssituationen i Svenskfinland

Läs mer

Fortbildningsavdelningen för skolans internationalisering. Dossier 3. European Language Portfolio 16+ Europeisk språkportfolio 16+ English version

Fortbildningsavdelningen för skolans internationalisering. Dossier 3. European Language Portfolio 16+ Europeisk språkportfolio 16+ English version Fortbildningsavdelningen för skolans internationalisering Dossier 3 English version European Language Portfolio Europeisk språkportfolio Council of Europe The Council of Europe was established in 1949

Läs mer

KN - Seminarium. (Litteratursökning)

KN - Seminarium. (Litteratursökning) KN - Seminarium (Litteratursökning) Elektroniska medier Åbo Akademis bibliotek http://www.abo.fi/library/dbs Virtuellt bibliotek / länksamling för sökning på internet Referensdatabaser, som innehåller

Läs mer

GYMNASIEARBETET - ATT SKRIVA VETENSKAPLIGT

GYMNASIEARBETET - ATT SKRIVA VETENSKAPLIGT GYMNASIEARBETET - ATT SKRIVA VETENSKAPLIGT Ditt gymnasiearbete ska bygga kring den frågeställning du kommit fram till i slutet av vårterminen i årskurs 2 och du ska i ditt arbete besvara din frågeställning

Läs mer

Marie Gustafsson. Böcker. Böcker. Tidningar och. Utskrifter

Marie Gustafsson. Böcker. Böcker. Tidningar och. Utskrifter Att söka information Marie Gustafsson marie.gustafsson@hb.se Dagens innehåll: Att söka vetenskaplig litteratur Forskning och publicering Olika typer av publikationer Olika typer av informationskällor Vetenskapliga

Läs mer

Open Access i Sverige

Open Access i Sverige Open Access i Sverige Jan Hagerlid Avdelningen för Nationell samverkan, KB Samordnare för programmet OpenAccess.se SUB den 5 oktober 1 Vem gör vad? Policy för Open Access Utveckling av öppna fulltextarkiv

Läs mer

Underlag till kravspecifikation för Vårdförbundets tidningsarkiv

Underlag till kravspecifikation för Vårdförbundets tidningsarkiv Underlag till kravspecifikation för Vårdförbundets tidningsarkiv Jonas Söderström 2000 03 01 Inledning En kravspecifikation kan i princip bli hur detaljerad som helst. Detta underlag består av två delar.

Läs mer

OPEN ACCESS. den ideala formen för vetenskaplig publicering. Bibliotek- och informationsvetenskapsprogrammet Umeå 7 november 2016

OPEN ACCESS. den ideala formen för vetenskaplig publicering. Bibliotek- och informationsvetenskapsprogrammet Umeå 7 november 2016 OPEN ACCESS den ideala formen för vetenskaplig publicering Bibliotek- och informationsvetenskapsprogrammet Umeå 7 november 2016 Open access (OA) literature is digital, online, free of charge, and free

Läs mer

PROTAGE-projektet AAS-konferens 21 oktober 2010

PROTAGE-projektet AAS-konferens 21 oktober 2010 PROTAGE-projektet AAS-konferens 21 oktober 2010 Magnus Geber Riksarkivet 1 Vad är en intelligent agent? Något som har förmågan att agera oberoende i en dynamisk oförutsägbar miljö 2 Intelligenta agenter

Läs mer

Mönster. Ulf Cederling Växjö University Ulf.Cederling@msi.vxu.se http://www.msi.vxu.se/~ulfce. Slide 1

Mönster. Ulf Cederling Växjö University Ulf.Cederling@msi.vxu.se http://www.msi.vxu.se/~ulfce. Slide 1 Mönster Ulf Cederling Växjö University UlfCederling@msivxuse http://wwwmsivxuse/~ulfce Slide 1 Beskrivningsmall Beskrivningsmallen är inspirerad av den som användes på AG Communication Systems (AGCS) Linda

Läs mer

Skriv! Hur du enkelt skriver din uppsats

Skriv! Hur du enkelt skriver din uppsats Skriv! Hur du enkelt skriver din uppsats Josefine Möller och Meta Bergman 2014 Nu på gymnasiet ställs högra krav på dig när du ska skriva en rapport eller uppsats. För att du bättre ska vara förberedd

Läs mer

Cancersmärta ett folkhälsoproblem?

Cancersmärta ett folkhälsoproblem? Cancersmärta ett folkhälsoproblem? Åsa Assmundson Nordiska högskolan för folkhälsovetenskap Master of Public Health MPH 2005:31 Cancersmärta ett folkhälsoproblem? Nordiska högskolan för folkhälsovetenskap

Läs mer

Installation av F13 Bråvalla

Installation av F13 Bråvalla Website: http://www.rbdesign.se Installation av F13 Bråvalla RBDESIGN FREEWARE - ESCK Norrköping-Bråvalla 1. Ladda ner och packa upp filerna i en mapp som du har skapat på ett lättöverskådligt ställe utanför

Läs mer

Bibliotekets resurser för filosofistudenter vt Catrin Andersson Umeå universitetsbibliotek

Bibliotekets resurser för filosofistudenter vt Catrin Andersson Umeå universitetsbibliotek Bibliotekets resurser för filosofistudenter vt 2009 Catrin Andersson Umeå universitetsbibliotek Allmänt hemsidan Öppettider Kartor UB Boka grupprum Resurslabb Lånekort Urval referensböcker Filosofilexikonet

Läs mer

Patientutbildning om diabetes En systematisk litteraturstudie

Patientutbildning om diabetes En systematisk litteraturstudie Institutionen Hälsa och samhälle Sjuksköterskeprogrammet 120 p Vårdvetenskap C 51-60 p Ht 2005 Patientutbildning om diabetes En systematisk litteraturstudie Författare: Jenny Berglund Laila Janérs Handledare:

Läs mer

Val av samlingar Nationalbiblioteket Digitaliserings- och konserveringstjänsten

Val av samlingar Nationalbiblioteket Digitaliserings- och konserveringstjänsten Val av samlingar Nationalbiblioteket Digitaliserings- och konserveringstjänsten Namn Majken Bremer-Laamanen Datum 24.5.2012 Tillställning Nordiska arkivdagar 2012 Grundat 1990 Digitalisering från år 1998

Läs mer

Beijer Electronics AB 2000, MA00336A, 2000-12

Beijer Electronics AB 2000, MA00336A, 2000-12 Demonstration driver English Svenska Beijer Electronics AB 2000, MA00336A, 2000-12 Beijer Electronics AB reserves the right to change information in this manual without prior notice. All examples in this

Läs mer

Kniv, gaffel och Internet. Utgångsfråga. Efter Nätet?

Kniv, gaffel och Internet. Utgångsfråga. Efter Nätet? Kniv, gaffel och Internet Om tiden efter Nätet Nicklas Lundblad 020050228 Utgångsfråga Hittills har vi studerat hur Internet förändrar saker: hur Nätet förändrar ekonomi, samhälle, teknik och rättssystem.

Läs mer

L0009B. Moment. Introduktion till geografiska databaser: G:\L0009B\Allmänt\IntroGeoDB.pdf (F)

L0009B. Moment. Introduktion till geografiska databaser: G:\L0009B\Allmänt\IntroGeoDB.pdf (F) L0009B Moment FL 1: Kursintroduktion. Kursinformation: G:\L0009B\Allmänt\KursInformationL0009B.pdf (F) Kursplan: Se https://portal.student.ltu.se/stuka/kurs.php?kurs=l0009b&lang=swe (F) Allt som markerats

Läs mer

Trender. Trender - 5 K. Konvergens 02005-03-17. Konvergens Kollaboration Kontroll Kollaps Kreativitet

Trender. Trender - 5 K. Konvergens 02005-03-17. Konvergens Kollaboration Kontroll Kollaps Kreativitet Trender 02005-03-17 Trender - 5 K Konvergens Kollaboration Kontroll Kollaps Kreativitet Konvergens Internet, telefoni, TV och radio blir över tiden ett enda medium. 1 WebTV Internettelefoni Internetradio

Läs mer

Att göra en medieinventering för en lokal klimateffektprofil handledning version 1.0

Att göra en medieinventering för en lokal klimateffektprofil handledning version 1.0 Att göra en medieinventering för en lokal klimateffektprofil handledning En medieinventering är ett steg i att ta fram en lokal klimateffektprofil. Här gör man en genomgång av lokaltidningarna och letar

Läs mer

Arkiv- och informationsvetenskap AV, Arkivsystem, 7,5 hp

Arkiv- och informationsvetenskap AV, Arkivsystem, 7,5 hp 1 (5) Kursplan för: Arkiv- och informationsvetenskap AV, Arkivsystem, 7,5 hp Archives and Information Science MA, Archival Systems, 7,5 Credits Allmänna data om kursen Kurskod Ämne/huvudområde Nivå Inriktning

Läs mer

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I

Umeå universitetsbibliotek Campus Örnsköldsvik Eva Hägglund HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I HITTA VETENSKAPLIGA ARTIKLAR I KURSEN VETENSKAPLIG TEORI OCH METOD I 13 NOVEMBER 2012 Idag ska vi titta på: Sökprocessen: förberedelser inför sökning, sökstrategier Databaser: innehåll, struktur Sökteknik:

Läs mer

IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA

IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA IMPORTERA POSTER TILL DIVA Anvisning för export av poster från andra databassystem för import till DiVA Universitetsbiblioteket Senast ändrad: 2016-12-12 2 Innehållsförteckning Linköpings universitetsbibliotek

Läs mer

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar.

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar. Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar. 1 Bibliotekets uppdrag i samarbete med utbildningen framgår i kursplanerna. 2 Se innehållet

Läs mer

Elevernas uppfattningar om alltmer digitaliserad undervisning

Elevernas uppfattningar om alltmer digitaliserad undervisning Resultat Elevernas uppfattningar om alltmer digitaliserad undervisning Fråga 1 Mycket inspirerande (6) till mycket tråkigt (1) att arbeta med etologisidan Uppfattas som mycket inspirerande eller inspirerande

Läs mer

Inkvarteringsstatistik. Göteborg & Co

Inkvarteringsstatistik. Göteborg & Co Inkvarteringsstatistik Göteborg & Co Mars 2012 FoU/ Marknad & Försäljning Gästnätter storstadsregioner Mars 2012, hotell och vandrarhem Gästnattsutveckling storstadsregioner Mars 2012, hotell och vandrarhem

Läs mer

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10

Källkritik. - om att kritiskt granska och värdera information. Ted Gunnarsson 2014-04-10 Källkritik - om att kritiskt granska och värdera information Ted Gunnarsson 2014-04-10 Källkritik - Innehåll Vad är källkritik? Varför källkritik? De källkritiska kriterierna Exempel på källkritiska frågor

Läs mer

Kulturarvet. tillgängligt använt återanvänt. Marie Andersson

Kulturarvet. tillgängligt använt återanvänt. Marie Andersson Kulturarvet tillgängligt använt återanvänt Marie Andersson Ett samordningssekretariat för digitalisering digitalt bevarande digitalt tillgängliggörande av kulturarvet Vad är kulturarv? Prästgården, klockargården

Läs mer

Protokoll Föreningsutskottet 2013-10-22

Protokoll Föreningsutskottet 2013-10-22 Protokoll Föreningsutskottet 2013-10-22 Närvarande: Oliver Stenbom, Andreas Estmark, Henrik Almén, Ellinor Ugland, Oliver Jonstoij Berg. 1. Mötets öppnande. Ordförande Oliver Stenbom öppnade mötet. 2.

Läs mer

Måldriven, informationscentrerad webbdesign

Måldriven, informationscentrerad webbdesign Måldriven, informationscentrerad webbdesign Linus Forsell Digitala Distributionsformer vid Högskolan Väst, Trollhättan, Sverige linus.forsell@student.hv.se 1 Abstrakt I den här essän kommer måldriven och

Läs mer

Sök artiklar i databaser för Vård- och hälsovetenskap

Sök artiklar i databaser för Vård- och hälsovetenskap Sök artiklar i databaser för Vård- och hälsovetenskap Bibliografiska databaser eller referensdatabaser ger hänvisningar (referenser) till artiklar och/eller rapporter och böcker. Ibland innehåller referensen

Läs mer

Performance culture in policing. Författare: Tevfik Refik Altonchi (Ph.d)

Performance culture in policing. Författare: Tevfik Refik Altonchi (Ph.d) Performance culture in policing Författare: Tevfik Refik Altonchi (Ph.d) ResultatKultur Attityd, Beteende, Värderingar 1965 119 1990-tal Det krävs ett helt nytt sätt att tänka för att lösa de problem vi

Läs mer

Kartan i datorn berättar historien

Kartan i datorn berättar historien bengt-olof käck Kartan i datorn berättar historien Kartorna visar hur marken använts och hur byar och hemman växt fram från 1600-talet till idag. Nu skannas den nationella kartskatten, över 50 miljoner

Läs mer

Ett svenskt digitalt tidskriftsarkiv en förstudie kring de upphovsrättsliga frågorna

Ett svenskt digitalt tidskriftsarkiv en förstudie kring de upphovsrättsliga frågorna Ett svenskt digitalt sarkiv en förstudie kring de upphovsrättsliga frågorna Wilhelm Widmark Stockholms universitetsbibliotek December 2003 Internationellt har det skapats ett antal digitala sarkiv där

Läs mer

Digitalisering. enligt Kungliga biblioteket

Digitalisering. enligt Kungliga biblioteket Digitalisering enligt Kungliga biblioteket Kungliga biblioteket var en av de institutioner och myndigheter som i december 2009 fick i uppdrag av regeringen att ge ett underlag till en nationell strategi

Läs mer

Mer information om RefWorks, andra referenshanteringsprogram och hur man refererar hittar du på Linköpings universitetsbiblioteks webbsidor.

Mer information om RefWorks, andra referenshanteringsprogram och hur man refererar hittar du på Linköpings universitetsbiblioteks webbsidor. Guide till RefWorks För att förenkla hanteringen av referenser och referenslistor finns det flera olika verktyg, s.k. referenshanteringsprogram. Med dem kan du samla, organisera och presentera dina referenser.

Läs mer

Introduktion till biblioteket och informationssökning Språk och litteraturer

Introduktion till biblioteket och informationssökning Språk och litteraturer Introduktion till biblioteket och informationssökning Språk och litteraturer HT 2014 Göteborgs universitetsbibliotek Humanistiska biblioteket Böcker och tidskrifter inom humaniora Kursböcker inom de humanistiska

Läs mer

Digital arkivering i Örebro kommun - riktlinjer

Digital arkivering i Örebro kommun - riktlinjer Digital arkivering i Örebro kommun - riktlinjer Antagna av kommunstyrelsen den 5 mars 2002. Dessa riktlinjer gäller alla typer av digital information, t.ex. databaser, dokument, bilder, kartor och ritningar.

Läs mer

1IK430 Brukarorienterad design

1IK430 Brukarorienterad design 1IK430 Brukarorienterad design Projektarbete i 1IK430 Följande text är en förklaring av projektarbetet som ingår i kursen 1IK430 Brukarorienterad design, 15 högskolepoäng Enligt kursplanen, ska studenten,

Läs mer

Översättning av galleriet. Hjälp till den som vill...

Översättning av galleriet. Hjälp till den som vill... Hjälp till den som vill... $txt['aeva_title'] = 'Galleri'; $txt['aeva_admin'] = 'Admin'; $txt['aeva_add_title'] = 'Titel'; $txt['aeva_add_desc'] = 'Beskrivning'; $txt['aeva_add_file'] = 'Fil att ladda

Läs mer

Bibliometri & publiceringsstrategiska knep SOLD. Viktor Öman, bibliotekarie viktor.oman@mdh.se

Bibliometri & publiceringsstrategiska knep SOLD. Viktor Öman, bibliotekarie viktor.oman@mdh.se Bibliometri & publiceringsstrategiska knep SOLD Viktor Öman, bibliotekarie viktor.oman@mdh.se Vad är bibliometri? Bibliometri är en uppsättning kvantitativa metoder som används för att mäta publikationer.

Läs mer

Medieplan. beskrivning, bestånd & bevarande för högskolebiblioteket, sjukhusbiblioteket och Gävle bibliotek (stadsbiblioteket med filialbibliotek)

Medieplan. beskrivning, bestånd & bevarande för högskolebiblioteket, sjukhusbiblioteket och Gävle bibliotek (stadsbiblioteket med filialbibliotek) Medieplan beskrivning, bestånd & bevarande för högskolebiblioteket, sjukhusbiblioteket och Gävle bibliotek (stadsbiblioteket med filialbibliotek) Beskrivning av biblioteken: Målgrupper och tillgänglighet

Läs mer

E-PLIKT E-PLIKT FÖR GÖTEBORGS UNIVERSITET

E-PLIKT E-PLIKT FÖR GÖTEBORGS UNIVERSITET E-PLIKT FÖR GÖTEBORGS UNIVERSITET PRESENTATION FÖR KONTAKTPERSONER DISPOSITION Nätverk och kontaktpersoner Historik och bakgrund Rekvisit för e-pliktigt material Gruppdiskussion Hur gör man med e-plikt

Läs mer

Klarspråk på nätet - Webbredaktörens skrivhandbok av Karin Guldbrand & Helena Englund Hjalmarsson

Klarspråk på nätet - Webbredaktörens skrivhandbok av Karin Guldbrand & Helena Englund Hjalmarsson Klarspråk på nätet - Webbredaktörens skrivhandbok av Karin Guldbrand & Helena Englund Hjalmarsson Klarspråk på nätet är en praktisk handbok för dig som någon gång skriver text för webb, surfplattor och

Läs mer

http://marvel.com/games/play/31/create_your_own_superhero http://www.heromachine.com/

http://marvel.com/games/play/31/create_your_own_superhero http://www.heromachine.com/ Name: Year 9 w. 4-7 The leading comic book publisher, Marvel Comics, is starting a new comic, which it hopes will become as popular as its classics Spiderman, Superman and The Incredible Hulk. Your job

Läs mer

Internets historia Tillämpningar

Internets historia Tillämpningar 1 Internets historia Redan i slutet på 1960-talet utvecklade amerikanska försvaret, det program som ligger till grund för Internet. Syftet var att skapa ett decentraliserat kommunikationssystem som skulle

Läs mer

So ka artiklar och annan litteratur

So ka artiklar och annan litteratur 1 So ka artiklar och annan litteratur UB:s startsida är en bra startpunkt när du ska söka litteratur vare sig du letar efter böcker eller artiklar. Sökrutan är nästan det första du lägger märke till. Bakom

Läs mer

Exportmentorserbjudandet!

Exportmentorserbjudandet! Exportmentor - din personliga Mentor i utlandet Handelskamrarnas erbjudande till små och medelstora företag som vill utöka sin export Exportmentorserbjudandet! Du som företagare som redan har erfarenhet

Läs mer

Teknikprogrammet Klass TE14A, Norrköping. Jacob Almrot. Självstyrda bilar. Datum: 2015-03-09

Teknikprogrammet Klass TE14A, Norrköping. Jacob Almrot. Självstyrda bilar. Datum: 2015-03-09 Teknikprogrammet Klass TE14A, Norrköping. Jacob Almrot Självstyrda bilar Datum: 2015-03-09 Abstract This report is about when you could buy a self-driving car and what they would look like. I also mention

Läs mer

PROJEKTBESKRIVNING fastställd av styrgruppen 2001-11-19

PROJEKTBESKRIVNING fastställd av styrgruppen 2001-11-19 PROJEKTBESKRIVNING fastställd av styrgruppen 2001-11-19 UPPDRAGSBESKRIVNING Introduktion I dokumentet Bidragsansökan för projektet Bilddatabaser och digitalisering plattform för ABM-samverkan (2000-03-02),

Läs mer

Slutrapport Projektet OCR-tolkning för indexering av,

Slutrapport Projektet OCR-tolkning för indexering av, 2011-05-13/PB Slutrapport Projektet OCR-tolkning för indexering av, och sökning i, inskannade dokument Projektorganisation Projektarbetet har bedrivits med lokala arbetsgrupper i både Uppsala och i Umeå.

Läs mer

Titel: Undertitel: Författarens namn och e-postadress. Framsidans utseende kan variera mellan olika institutioner

Titel: Undertitel: Författarens namn och e-postadress. Framsidans utseende kan variera mellan olika institutioner Linköping Universitet, Campus Norrköping Inst/ Kurs Termin/år Titel: Undertitel: Författarens namn och e-postadress Framsidans utseende kan variera mellan olika institutioner Handledares namn Sammanfattning

Läs mer

- LATHUND MED Tips och exempel för dig som ska skriva en källförteckning

- LATHUND MED Tips och exempel för dig som ska skriva en källförteckning 1(5) - LATHUND MED Tips och exempel för dig som ska skriva en källförteckning 2(5) ALLMÄNT OM KÄLLFÖRTECKNINGAR När du skriver en uppsats eller något annat skolarbete måste du redovisa vilka källor du

Läs mer

En bild säger mer än tusen ord?

En bild säger mer än tusen ord? Faculteit Letteren en Wijsbegeerte Academiejaar 2009-2010 En bild säger mer än tusen ord? En studie om dialogen mellan illustrationer och text i Tiina Nunnallys engelska översättning av Pippi Långstrump

Läs mer

Slutrapport. Utbildningsforskning och reformpolitik under 50 år speglad i Torsten Huséns arbetsbibliotek

Slutrapport. Utbildningsforskning och reformpolitik under 50 år speglad i Torsten Huséns arbetsbibliotek Slutrapport Utbildningsforskning och reformpolitik under 50 år speglad i Torsten Huséns arbetsbibliotek Tommy Johansson, Vivika Sjöstedt, Berit Svensson 2016 Innehåll Bakgrund 3 Katalogiseringen av Husénsamlingen

Läs mer

google, biblioteken & upphovsrätten

google, biblioteken & upphovsrätten google, biblioteken & upphovsrätten pelle snickars kb think distributed google & den gåtfulla webbekonomin freemium google book search Google Book Search is the ambitious plan to digitize every book

Läs mer

Page 1. Aktuella utmaningar för ekonomistyrare. Tema: Aktuella utmaningar för ekonomistyrare. Vad är ekonomistyrning? Vilka är utmaningarna?

Page 1. Aktuella utmaningar för ekonomistyrare. Tema: Aktuella utmaningar för ekonomistyrare. Vad är ekonomistyrning? Vilka är utmaningarna? Aktuella utmaningar för ekonomistyrare Professor Fredrik Nilsson Uppsala 2010-02-12 Föreläsningens inriktning Tema: Aktuella utmaningar för ekonomistyrare Vad är ekonomistyrning? Vilka är utmaningarna?

Läs mer

Support Manual HoistLocatel Electronic Locks

Support Manual HoistLocatel Electronic Locks Support Manual HoistLocatel Electronic Locks 1. S70, Create a Terminating Card for Cards Terminating Card 2. Select the card you want to block, look among Card No. Then click on the single arrow pointing

Läs mer

Kort om World Wide Web (webben)

Kort om World Wide Web (webben) KAPITEL 1 Grunder I det här kapitlet ska jag gå igenom allmänt om vad Internet är och vad som krävs för att skapa en hemsida. Plus lite annat smått och gott som är bra att känna till innan vi kör igång.

Läs mer

EDLocal EDLocal tillgängliggör digitalt kulturarvsmaterial från lokala och regionala aktörer genom European Digital Library (EDL)

EDLocal EDLocal tillgängliggör digitalt kulturarvsmaterial från lokala och regionala aktörer genom European Digital Library (EDL) EDLocal EDLocal tillgängliggör digitalt kulturarvsmaterial från lokala och regionala aktörer genom European Digital Library (EDL) Kortfattad sammanfattning av EDLocal Under tre års projekttid siktar EDLocal

Läs mer

Teoretiska överväganden kring långsiktig lagring av elektronisk information

Teoretiska överväganden kring långsiktig lagring av elektronisk information Teoretiska överväganden kring långsiktig lagring av elektronisk information Jonas Palm, Göteborg, november 2014 Riksarkivet Digitally born Digitaliserat PARADIGMSKIFTE INOM BEVARANDE AV INFORMATION Tidigare:

Läs mer

Arkiv och bibliotek på nätet. En presentation av Katarina Renman Claesson

Arkiv och bibliotek på nätet. En presentation av Katarina Renman Claesson Arkiv och bibliotek på nätet En presentation av Katarina Renman Claesson i2010:digital Libraries (EU) EU-kommissionen har inom ramen för sitt initiativ i2010: Digital Libraries, diskuterat bl.a. möjligheterna

Läs mer

INVEST IN NORDIC CLEANTECH

INVEST IN NORDIC CLEANTECH INVEST IN NORDIC CLEANTECH Sedan 2009 En unik och oslagbar kanal i världen för att sälja och marknadsföra svensk miljöteknik utomlands och nationellt. F R O M S W E D E N A N D T H E N O R D I C S Bakgrund

Läs mer

Lilla PubMed-lathunden

Lilla PubMed-lathunden Lilla PubMed-lathunden Om databasen PubMed PubMed är en databas som produceras av National Center for Biotechnology Information (NCBI) vid National Library of Medicine (NLM) i USA. Det är den största databasen

Läs mer

6. Nu skall vi ställa in vad som skall hända när man klickar på knappen samt att markören skall ändra sig till en hand när markören är på knappen.

6. Nu skall vi ställa in vad som skall hända när man klickar på knappen samt att markören skall ändra sig till en hand när markören är på knappen. Fiskar Arbetsbeskrivning knappmeny (Mediator 8) I detta exempel kommer du att lära dig Att göra en mastersida med knappar Att använda en mastersida på andra sidor Att använd funktionen Alignment Arbetsgång

Läs mer

Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET

Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET Stiftelsen Allmänna Barnhuset KARLSTADS UNIVERSITET National Swedish parental studies using the same methodology have been performed in 1980, 2000, 2006 and 2011 (current study). In 1980 and 2000 the studies

Läs mer

Elements, säkerhetskopiering och dina bilder

Elements, säkerhetskopiering och dina bilder Elements, säkerhetskopiering och dina bilder Mattias Karlsson Sjöberg, december 2011. Moderskeppet.se Lär dig tänka rätt och använda rätt verktyg för att säkerhetskopiering, datorbyte och hårdiskbyte.

Läs mer

version 2.5 CONTENTO SVENSKA AB Introduktion till Kursbyggarverktyg

version 2.5 CONTENTO SVENSKA AB Introduktion till Kursbyggarverktyg version 2.5 CONTENTO SVENSKA AB Introduktion till Kursbyggarverktyg Introduktion till kursbyggarverktyg Contento Svenska AB Hornsgatan 103 117 28 Stocholm Table of Contents KAPITEL 1 Introduktion 2 Begrepp

Läs mer

Ett exempel på hur man kan använda Discovery. Ulrika Nilsson Viktor Öman

Ett exempel på hur man kan använda Discovery. Ulrika Nilsson Viktor Öman Ett exempel på hur man kan använda Discovery Ulrika Nilsson Viktor Öman Innan vi börjar söka väljer vi Search Options och sedan Advanced Search. Discovery Discovery Discovery är förinställt på att söka

Läs mer

Läsa artiklar i artikeldatabaser med kompensatoriska hjälpmedel

Läsa artiklar i artikeldatabaser med kompensatoriska hjälpmedel Läsa artiklar i artikeldatabaser med kompensatoriska hjälpmedel en översikt Sammanfattning Idag finns det tillgång till en uppsjö vetenskapliga artiklar i form av e-text via artikeldatabaser, insamlade

Läs mer

Typografi, text & designperspektiv

Typografi, text & designperspektiv Typografi, text & designperspektiv Serif Hårstreck Stapel Heplx x-höjd Baslinje Grundstreck Serif Underhäng Inre form I dag Lite bakgrund Övergripande grunder inom typografi Text hantering Elva Synlig

Läs mer

ESSArch vid Riksarkivet i Sverige

ESSArch vid Riksarkivet i Sverige NorDig 2014 2014-06-03 ESSArch vid i Sverige Mats Berggren / 1 ESSArch vid i Sverige s digitala bevarande - bakgrund RADAR och ESSArch Erfarenheter och planer 2 1 ESSArch vid i Sverige s digitala bevarande

Läs mer

Öppna EndNote varje gång när du vill samla referenser till ditt bibliotek.

Öppna EndNote varje gång när du vill samla referenser till ditt bibliotek. 1. Skapa ett EndNote-bibliotek Börja med att öppna EndNote och skapa ett bibliotek (Reference Library). Det gör du under File / New. Namnge ditt bibliotek och välj var på datorn du vill spara det. Nu kan

Läs mer

Lust att snacka LUST ATT SNACKA TIDNINGARNAS FÖRBUND. Bästa lärare

Lust att snacka LUST ATT SNACKA TIDNINGARNAS FÖRBUND. Bästa lärare LUST ATT SNACKA Bästa lärare Uppgifterna till finns nu i förnyad form för läraren! Materialet som ursprungligen planerades för FN:s familjeår, lämpar sig främst för undervisningen i årskurserna 7 9, men

Läs mer

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket.

PubMed lathund Örebro universitetsbibliotek Medicinska biblioteket. PubMed lathund 2016-02-04 Örebro universitetsbibliotek Medicinska biblioteket medbibl@oru.se 1 Skriv in dina söktermer och klicka på För att få se vad som har hänt bakom kulissen, titta på Search details.

Läs mer

Källkritisk metod stora lathunden

Källkritisk metod stora lathunden Källkritisk metod stora lathunden Tryckt material, t ex böcker och tidningar, granskas noga innan det publiceras. På internet kan däremot alla enkelt publicera vad de önskar. Därför är det extra viktigt

Läs mer

Dagstidningens former och framtid

Dagstidningens former och framtid pär nilsson Dagstidningens former och framtid N är en tryckt dagstidning kommer ut är den, i motsats till de flesta utgivna böcker, naturligtvis omedelbart en angelägenhet för en mycket stor grupp människor,

Läs mer

FrontPage Express. Ämne: Datorkunskap (Internet) Handledare: Thomas Granhäll

FrontPage Express. Ämne: Datorkunskap (Internet) Handledare: Thomas Granhäll FrontPage Express I programpaketet Internet Explorer 4.0 och 5.0 ingår också FrontPage Express som installeras vid en fullständig installation. Det är ett program som man kan använda för att skapa egna

Läs mer

Open access från varför till hur

Open access från varför till hur Open access från varför till hur Grönt och guld, gratis och fritt Ulf Kronman Samordnare för programmet OpenAccess.se Nationell samverkan, Kungliga biblioteket Open Access Week 2012, Stockholms universitet

Läs mer

Obemannade flygplan. Namn: Hampus Hägg. Datum: 2015-03-02. Klass: TE14B. Gruppmedlemmar: Gustav, Emilia, Henric och Didrik

Obemannade flygplan. Namn: Hampus Hägg. Datum: 2015-03-02. Klass: TE14B. Gruppmedlemmar: Gustav, Emilia, Henric och Didrik Namn: Hampus Hägg Obemannade flygplan Datum: 2015-03-02 Klass: TE14B Gruppmedlemmar: Gustav, Emilia, Henric och Didrik Handledare: David, Björn och Jimmy Abstract In this task I ve been focusing on unmanned

Läs mer

Projektarbeten i astronomi Wikipedia och andra media

Projektarbeten i astronomi Wikipedia och andra media Projektarbeten i astronomi Wikipedia och andra media Dainis Dravins Institutionen för astronomi, Lund www.astro.lu.se/~dainis Wikipedia & astronomi Wikipedia i forskning & undervisning! forskning: referenser

Läs mer

Bakgrund. Frågeställning

Bakgrund. Frågeställning Bakgrund Svenska kyrkan har under en längre tid förlorat fler och fler av sina medlemmar. Bara under förra året så gick 54 483 personer ur Svenska kyrkan. Samtidigt som antalet som aktivt väljer att gå

Läs mer

Webbregistrering pa kurs och termin

Webbregistrering pa kurs och termin Webbregistrering pa kurs och termin 1. Du loggar in på www.kth.se via den personliga menyn Under fliken Kurser och under fliken Program finns på höger sida en länk till Studieöversiktssidan. På den sidan

Läs mer

Sammanfattning av rapport 2013/14:RFR3 Kulturutskottet. En bok är en bok är en bok? En fördjupningsstudie av e-böckerna i dag

Sammanfattning av rapport 2013/14:RFR3 Kulturutskottet. En bok är en bok är en bok? En fördjupningsstudie av e-böckerna i dag Sammanfattning av rapport 2013/14:RFR3 Kulturutskottet En bok är en bok är en bok? En fördjupningsstudie av e-böckerna i dag Sammanfattning av rapport 2013/14:RFR3 3 En fördjupningsstudie av e-böcker

Läs mer

En kort introduktion till EAD. av Magnus Wåhlberg vid RFV/avd. för verksamhetsstöd/dokumentenheten magnus.wahlberg@rfv.sfa.se

En kort introduktion till EAD. av Magnus Wåhlberg vid RFV/avd. för verksamhetsstöd/dokumentenheten magnus.wahlberg@rfv.sfa.se En kort introduktion till EAD av Magnus Wåhlberg vid RFV/avd. för verksamhetsstöd/dokumentenheten magnus.wahlberg@rfv.sfa.se Bakgrund EAD och EAC Används till Används var Används hur EAD och ISAD(G) EAD

Läs mer

Kom igång med TIS-Office

Kom igång med TIS-Office Kom igång med TIS-Office Denna guide hjälper dig att komma igång med TIS-Office, mer information om hur man använder programmet finns i manualer på TIS-Office CD-skivan och i den inbyggda hjälpfunktionen

Läs mer

Allmänhet Myndighet Riksarkivet Sökning via NAD Riksarkivet och SVAR:s webbplats ARKIS Data Management RALF KRAM Myndighetsverktyg för kontroll och SIP-generering Access Dissemination Ingest Digitala Kedjan

Läs mer