Ólöf Garðarsdóttir Hagstofa Íslands Befolkningsenhet olof.gardarsdottir@hagstofa.is The North Atlantic Population Project. Harmonisering av 1800- tals och tidigt 1900-tals mikordata från fem länder USA, Kanada, Storbritannien, Norge och Island. Funderingar om principer och metoder kring skapandet och spridningen av historisk mikrodata i ett modernt perspektiv 1 Presentation på det 23:e Nordiska Statistikermötet i Åbo 18-21 Augusti, session 4, Mikrodata ur forskarperspektiv Inledning Två av presentationerna i denna session, Mikrodata ur forskarperspektiv, behandlar användning av mikrodata från användarnas (dvs forskarnas) perspektiv den föreliggande presentationen och Markus Jänttis presentation om Mikrodata i samhällsvetenskaplig forskning en användares perspektiv. Min fokus kommer framför allt att riktas mot ett historiskt befolkningsmaterial och endast i slutdelen av paperet kommer jag att framföra funderingar kring användbarheten av projektets principer för modern data. Statistiska centralbyrån, Hagstofa Íslands, har alltid visat intresse för behandling av historisk statistik. Under 1920-, 1930- och 1940-talet publicerades folkräkningen 1703 i sin helhet och bearbetning den samma publicerades 1960. 2 Senare producerades en digitaliserat version av 1703-års folkräkning hos Hagstofa. 3 Något senare investerade statistiska centralbyrån 1 Papret grundas bitvis på följande artikel: Evan Roberts, Steven Ruggles, Lisa Dillon, Ólöf Garðarsdóttir, Jan Oldervoll, Gunnar Thorvaldsen och Matthew Woollard, North Atlantic Population: An Overview, Historical Methods 36 (2) (2003), s 80-88. 2 Manntal á Íslandi árið 1703 (Reykjavík: Hagstofa Íslands, 1924-1947). Manntalið 1703. Hagskýrslur Íslands II, 21 (Reykjavík: Hagstofa Íslands,1960). 3 En preliminär version av folkräkningen 1703 finns tillgänglig på Riksarkivets hemsida: http://www.skjalasafn.is/ I samband med folkräkningen 1703 utfördes även en census över ägandet av kreatur på hushållsnivå. Arkivarie Eiríkur Guðmundsson (Riksarkivet) har nyligen lanserat ett projekt som har som målsättning diggitalisering av denna del av 1703-censusen. 1
i ett omfattande projekt som hade som huvudmålsättning att samla ihop data från 1700-talet till modern tid i en publikation Hagskinna. En stor del i Hagskinna berör befolkningsdata. 4 Jag har endast sedan två år tillbaka arbetat på befolkningsenheten på statistiska centralbyrån i Island. Tidigare har jag varit engagerat i diverse forskningsprojekt rörande befolkningsutvecklingen i Island under 1800- och tidigt 1900-tal. Mitt huvudkällmaterial hämtades således framför allt i folkräkningar och kyrkboksmaterial från denna period. Under min studietid i Umeå i Sverige var jag verksam vid Demografiska databasen där huvudfokusen ligger på longitudinell bearbetning av kyrkoboksmaterial och husförhörslängder. 5 I föreliggande paper presenteras ett forskningsprojekt, NAPP, som jag deltagit i sedan år 2000. NAPP står för The North Atlantic Population Project. Projektet startades år 2001 genom ett samarbete mellan amerikanska och europeiska forskare. Projektets huvudmål är att skapa en harmoniserad, integrerad databas med 1800- och tidigt-1900-tals censusdata från fem länder vid Nordatlanten USA, Kanada, Storbritannien, 6 Norge och Island. Projektet leds från Minnesota Population Center i Minneapolis och har delvis finanserats av Minnesota Population Center, delvis av Amerikanska forskningsrådet och delvis av forskningsråd och organisationer i deltagarländerna. I Islands fall har Riksarkivet (Þjóðskjalasafn Íslands) i samarbete med NAPP bekostat registrering av delar av 1870 och 1880-folkräkningen och hela 1901 folkräkningen. Vid projektets start fanns det i alla fem länder föreliggande digitaliserade folkräkningar (eller åtminstone delar) från alla fem länder och skrivande stund innehåller databasen runt 90 miljoner personposter. En preliminär version finns redan tillgänglig och den slutliga versionen kommer att lanseras under de kommande månaderna. 7 Projektmedlemmar har under augustimånad skickat en ny projektansökan till amerikanska forskningsrådet och sökt pengar för utveckling av projektet där en av huvuduppgifterna kommer att vara länkning av individer genom successiva folkräkningar. Detta papers huvudsyfte är att kort beskriva projektets tillkomst, en diskussion kring huvudprincipen kring harmonisering av databasen. Uttagssystemet och användbarheten av databasen (dvs. potentiella forskningsområden) kommer även att beskrivas. 4 Hagskinna. Icelandic Historical Statistics. Guðmundur Jónsson och Magnús S. Magnússon (red.) (Reykjavík: Hagstofa Íslands, 1997), s 41-200. 5 http://www.ddb.umu.se 6 Storbritannien inkluderar England, Wales och Skottland, men ej Irland. 7 http://www.nappdata.org/ 2
Bakgrund Folkräkningar inom NAPP Vid projektets slut kommer NAPP at förena datoriserade och harmoniserade censusdata från 1800-talets slut och 1900-talets början. Länderna i databasen USA, Kanada, Storbritannien, Norge och Island kännetecknades under denna period visserligen av betydande olikheter men också av framstående likheter i demografisk, ekonomisk, social och kulturell mening. Således genomgick alla dessa samhällen vid detta tillfälle ett viktigt transitionsskede med växande urbanisering och nedgång i mortalitet och fertilitet, samt förändringar i hushållsstrukturer. Dessutom var respektive länder starkt sammankopplade genom omfattande migrationsströmmar från Europa till USA och senare till Kanada. En harmoniserad databas kommer i förhoppningsvis så småningom att belysa och öka kunskapen om av dessa transitioner och ytterligare belysa likheter och olikheter inom regionen och ge möjligheter till mångfaldiga forskningsprojekt. Från projektets första början fanns det redan färdiga datafiler för Storbritannien, Kanada, samt USA. Dessa hade sammanställds av The Church of Jesus Christ of Latter-day Saints i samarbete med släktforskarföreningar. Tidigare hade Minnesota population center inom ramen av The Minnesota Historical Census Project och IPUMS (Integrated Public Use Microdata Series) skapat ett slumpmässigt urval från alla folkräkningar för perioden 1850 till 1950 och har därför en lång erfarenhet av bearbetandet av uttag för forskare. 8 Även Kanada har varit inblandat det historiska censusprojektet och båda de kanadensiska forskarna som från början deltagit i census- projektet är grundare av NAPP projektet. 9 Även de brittiska folkräkningarna har hämtads från The Church of Jesus Christ of Latter-day Saints. De brittiska deltagarna Matthew Woollard och Kevin Schürer har i många år arbetat med de brittiska folkräkningarna 1851 och 1881. I Norge finns folkräkningarna 1865 och 1900 datoriserade i sin helhet hos 8 Uttag från denna database kan beställas via IPUMS (Integrated Public Use Microdata Service). http://www.ipums.umn.edu The Minesota Historical Census Project finns beskrivit I ett temanummer av Historical Methods 28 (1) (1995). Steven Ruggles föreståndare vid Minnesota Population Center initierade The Minnesota Historical Census Projects som består av datoriserad sampel från folkräkningar från USA och Kanada. Han är även primus modus inom NAPP projektet. Andra deltagare i NAPP-projektet från Minnesota är Evan Roberts. 9 Deltagarna från Kanada, Chad Gaffield och Lisa Dillon, har också tidigare varit inblandade i The Minnesota Historical Census Projects. Dillon är för tillfället professor vid Univeristé de Montréal och Gaffield är professor vid Universitetet i Ottawa och arbetar för tillfället med The Canadian Century Research Infrastructure project där målsättningen är att skapa sampel i forskningssyfte från de kandienska folkräkningarna 1911-1950. 3
Registreringcentral for historiske data på Tromsø universitet 10 och Digitalarkivet på Universitetet i Bergen. 11 Föreståndarna vid dessa två institutioner deltar båda i NAPP projectet. Som tidigare nämnts har Statistiska centralbyrån i Reykjavík en viss erfarenhet av publicering av nominala folkräkningar. Det gäller främst folkräkningen 1703. Under 1980-talet datoriserades den publicerade versionen av folkräkningen 1703 och har nu överlämnat den filen till Riksarkivet där en preliminär version av folkräkningen finns tillgänglig på Riksarkivets hemsida. Ytterligare bearbetning av folkräkningen 1703 är nu på gång och eventuellt kommer folkräkningen 1703 så småningom att inkluderas i NAPP-databasen. Det gäller även den partiella folkräkningen i Norge från början av 1700-talet. 12 Under 1990-talet ledde den amerikanske historikern Daniel Vasey ett projekt där han också hämtade data från The Church of Jesus Christ of Latter-day Saints (isländska folkräkningar och kyrkboksmaterial). Bland dessa var folkräkningarna år 1801, 1845 och delar av 1870 års folkräkning. NAPP projektet har från första början haft tillgång till dessa filer och sedan sommaren 2002 har Riksarkivet i samarbete med NAPP deltagit i cleaning av dessa filer och nu finns hela folkräkningen 1870 färdigtställt i överensstämmelse med grundkällan. Universitetsstuderande (fram för allt antropologi och historiestudenter), har arbetat med att komplettera de redan registrerade folkräkningarna och registrerat folkräkningarna 1880 och 1901. Administration och tester på materialet utförs av undertecknad i samarbete med Riksarkivets personal. 5 Den första versionen av den harmonserade databasen kommer att innehålla de följande 9 folkräkningarna, de tre The Church of Jesus Christ of Latter-day Saints folkräkningarna från USA, Kanada och Storbritannien, samt tre censuser från Island och två från Norge. Variabler som är inkluderade i respektive folkräkningar finns beskrivna i tabell 1. 6 I fortsättningen kommer även den kompletta folkräkningen från Kanada att inkluderas, samt 1910 folkräkningen från Norge. 10 http://www.rhd.uit.no/ Gunnar Thorvaldsen föreståndare vid Registreringcentral for historiske data deltar även i NAPP projektet. Han har sedan många år tillbaka samarbetat med forskare vid Minnesota Population Center. 11 http://digitalarkivet.uib.no/ Jan Olderoll föreståndare vid Dataarkivet deltar även i NAPP. 12 http://www.skjalasafn.is/ I samband med folkräkningen 1703 utfördes även en census över ägandet av kreatur på hushållsnivå. Arkivarie Eiríkur Guðmundsson (Riksarkivet) har nyligen lanserat ett projekt som har som målsättning diggitalisering av denna census. 4
Tabell 1. Folkräkningar inom NAPP-databasen år 2004 Land Census år Regel Personposter Island 1870 de jure och de facto 70.000 Island 1880 de jure och de facto 73.000 Island 1901 de jure och de facto 78.000 Kanada 1881 de jure 4.278.000 Norge 1865 de jure och de facto 1.702.000 Norge 1900 de jure och de facto 2.240.000 Storbritanien 1881 de facto 29.000.000 USA 1880 de jure 50.155.000 Total 87.596.000 NAPP En harmoniserad databas Ett relativt omfattande material kring själva folkräkningarna, samt en omfattande kunskap inom projektet förenklar harmonisering av respektive folkräkningar över gränser. Det faktum att det redan under 1800-talet fanns ett omfattande samarbete mellan statistiska organisationer inte bara inom Europa utan också över Atlanten har inte rönt tillräcklig uppmärksamhet hos historieforskare. 13 Det samarbetet som ägde rum under den tiden gör att de föreliggande folkräkningarna mycket lika i sin struktur och är variabler i stort sätt de samma. Detta förenklar betydligt tillverkning av en harmoniserad databas. Redan i de mycket tidiga folkräkningarna var definitionerna av hushåll likartade och på ett traditionellt sätt beskriver folkräkningarna alla hushållsmedlemmar i relation till 13 Se dock: M. J. Anderson, The American census: A social history (New Haven: Yale University Press, 1988), s 46, 60. B. Curtis, On the local construction of statistical knowledge: Making up the 1861 census of the Canadas. Journal of Historical Sociology 7 (1994), s 416-434. Worton, D. A. 1998. The Dominion Bureau of Statistics: A history of Canada's Central Statistical Office and its antecedents, 1841-1972. Montreal: McGill-Queen's University Press. 5
hushållsföreståndaren. Grundvariablerna fanns i de tidiga folkräkningarna, dvs. ålder, kön, civil status, hushållsposition, yrke och födelseställe. Gällande precision av geografisk information finns det betydande skillnader mellan de olika länderna. De två nordiska länderna med sin glesa befolkning har visserligen en mycket större precision gällande geografisk tillhörighet än de tre jättarna i projektet, USA, Kanada och Storbritannien. Den minsta geografiska enheten i USA innehåller således tusentals individer medan församlingar i Island generellt inte räknade mer än 200-300 individer. Detta är skillnader som kommer att dokumenteras och diskuteras utförligt på projektets hemsida. Sammanlagt innehåller länderna kring 25.000 geografiska områden och varje (typ av enhet) geografisk enhet kommer således att dokumenteras utförligt. De allra flesta folkräkningarna utfördes de jure (se tabell 1), dvs. att individer som vid folkräkningstillfället vistades tillfälligt utanför sin vanliga bostad räknades där de var skrivna / bosatta. Här utgjorde den brittiska folkräkningen undantaget, den blev utförd de facto. Således räknades individer där de befann sig vid folkräkningstillfället. Individer som inte var hemma vid folkräkningstillfället riskerade således att inte ingå i folkräkningen. Från och med 1870 utfördes de norska och isländska folkräkningarna både de facto och de jure. Det fanns således separata blanketter i folkräkningarna där de som befann sig tillfälligt i ett hushåll vid folkräkningstillfället fördes. Dessa fördes även i sin vanliga bostad. Befintlig information om de jure och de facto befolkning har stora fördelar vad gäller det källkritiska läget och möjliggör en intressant analys av missing data. Skillnader mellan de jure och de facto folkräkningarna utgör inga betydande komparativa problem. Forskare som sysslar med migration och vissa typer av familj och hushållsforskning bör uppmärksamma dessa skillnader. I samband med skapandet av den harmoniserade databasen var det nödvändigt att fokusera på två huvuduppgifter. För det första var det viktigt att utveckla ett enhetligt kodningsystem för huvudvariablerna, dvs. ålder, kön, yrkeskategorier, geografiska enheter, familj- och hushållstatuts för att underlätta internationell jämförbarhet. För det andra var det nödvändigt att skapa konstruerade variabler för att beskriva / möjliggöra analys på hushållskomposition, familjrelationer inom hushållet, urbana och rurala områden samt andra geografiska karakteristika (se Tabell 2). 6
Tabell 2. Ursprungsvariabler och konstruerade variabler inom NAPP databasen (X=ursprungsvariabler i källan, C=konstruerade variabler) USA Kanada Storbrit. Island Norge 1880 1881 1881 1870 1880 1901 1865 1900 Geografiskt information och hushållsinformaion Län X X X X X X X X Urbana, rurala områden X X X X X X X X Provins X X X Församling X X X X X X X X Enumerations distrikt X Address X X X X X X X X Referensnummer i källan X X X X X X X X Antal rum inom hushållet X Information om bondgårdar C C X X X X X X Konstruerade hushållsvariabler Hushållssekvensnummer C C C C C C C C Antal hushållmedlemmar C C C C C C C C Urban, rural residens C C C C C C C C Storlek av område C C C C C C C C Hushållstyp (UN) C C C C C C C C Hushållstyp (Hammel-Laslett) C C C C C C C C Antal familjer inom hushåll C C C C C C C C Antal inom primärfamilj C C C C C C C C Antal barn under 18 år C C C C C C C C Antal gifta par C C C C C C C C Antal personer utanför familjen C C C C C C C C Individ information Relation till hushållsföreståndare X C X X X X X X Ålder X X X X X X X X Kön X X X C C C X X Yrke X X X X X X X X Yrkeskod C C C C C C C C Civil status X X X X X X X X Födelseställe X X X X X X X X Förälers födelseställe X Medborgarskap X X X X Etnicitet X X X X Religiös tillhörighet X X X X X X Handikapp X X X X Förnamn X X X X X X X X Efternamn X X X X X X X X Vistas utanförr hushåll vid censustillfället X X X X Identitetsnummer C C C C C C C C Sekvensnummer inom hushållet C C C C C C C C Lokalisering av make inom hushållet C C C C C C C C Lokalisering av fader inom hushållet C C C C C C C C Lokalisering av moder inom hushållet C C C C C C C C Antal egna barn C C C C C C C C Antal egna barn yngre än 5 år C C C C C C C C Ålder av äldsta barn C C C C C C C C Ålder av yngsta barn C C C C C C C C 7
Harmonisering av traditionella variabler som till exempel kön, ålder, civilstånd och religiös tillhörighet ställer inte till några problem. Andra variabler är mer komplexa. I databasen finns således mer än en million olika yrkesbetäckningar och 30.000 betäckningar för familjerelationer. Delar av arbetet var redan genomförda vid projektets början inom ramen av IPUMS. Hushållspositioner enligt projektets mål finns tabulerade i tabell 3. Inom ramen av IPUMS har det redan utvecklats ett system för att koda dessa automatiskt. Genom såkallade pointer - variabler identifieras make till varje individ inom hushållet, mödrar, fäder och barn, samt antal barn till enstaka individer inom hushållet. 14 Dessa pointer variabler möjliggör anknytning till variabler anknutna till släktingar inom hushållet (till exempel födelseställe till make eller barn, faders yrke, etc.) utan komplex programmering. Konstruerade variabler som även kommer att tilläggas är de följande: antal egna barn inom hushållet, antal egna barn under fem års åldern, äldsta barns ålder och yngsta barns ålder. Inom systemet utvecklad kring census projektet, finns det även en möjlighet att ta fram hushållsstrukturer enligt traditionella kategoriseringssystem, framför allt Laslett-Hammel hushållsstrukturer. 15 Tabell 1. Familjerelationer (till hushållsföreståndaren) NAPP 1 Hushållsföreståndare 2 Make 3 Barn 4 Make till barn 5 Förälder 6 Svärförälder 7 Syskon 8 Syskon till make 9 Barnbarn 10 Andra släkt 11 Inte släkt 12 Inom institution 14 Steven Ruggles, Family Interrelationships, Historical Methods 28 (1) (1995), 52-58. 15 Peter Laslett, Introduction: The history of the family Household and family in past time (Peter Laslett, ed.) (Cambridge: Cambridge University Press, 1972), s 1-90. Eugene A. Hammel, The zadruga as process. In Household and family in past time (Peter Laslett, ed.) (Cambridge: Cambridge University Press, 1972), s 335-73. 8
Vissa ändringar inom programmet måste utföras för att kunna möjliggöra automatisk kodning av familjrelationer för Norge och Island. Således är det nödvändigt att ta hänsyn till olika namntraditioner när programmering av familjrelationer utförs. I Island var patronymnamnskick således dominerande och delvis i Norge under denna tidsperiod. Kodning av yrken är tveklöst den mest komplexa delen i arbetet inom projektet. Denna del av arbetet kräver både kunskap av nationella och lokala förhållanden. En omfattande dokumentation för enstaka länder krävs också för att försäkra realistiska jämförande studier. Grunden i yrkeskodningen hämtas till HISCO, historisk yrkeskategorisering, som metodologiskt grundas på ISCO68. 16 Medlemmar från NAPP- projektet har lagt ner ett omfattande arbete kring yrkeskodningen 17 där vissa yrkeskategorier har rönt en särskild uppmärksamhet. Det gäller till exempel grupper sysselsatta inom fiskenäringen. Dessutom har de funnits en strävan att förenkla HISCO yrkeskategorierna och inom projektet har det skapats ett yrkeskategoriseringssystem som benämns NAPSCO. Inom databasen kommer det dock alltid att finnas en länk till HISCOsystemet. En länk finns även till andra kategoriseringssystem till exempel systemet som utnyttjades i samband med den brittiska folkräkningen 1881. En mycket enkel samhällsstruktur i Norge och Island gör att kodning av yrken i folkräkningarna 1870 och 1880 har varit rätt enkel. Det gäller i synnerhet Island med sin dominans av lantbruk och fiske som en viktig bisyssla. Samarbetet med Norge har dock varit mycket fruktbar i synnerhet gällande kodning av yrken bland egendomslösa inom växande fiskarbygder under 1800-talets slut. Yrkeskategoriseringen av den isländska folkräkningen 1901 blir betydligt mer omfattande och då blir samarbetet mellan Norge och Island ännu mer relevant. En viktig del i projektet är en utförlig dokumentering av jämförbarheten av de olika censuerna. Instruktioner (föreskrifter) till de som utförde folkräkningara blir tillgängliga för användarna av databasen både på orginalspråket (i det norska och isländska fallet) samt på engelska. Olikheter i innebörden av olika yrkekategorier på nationell och lokal nivå kommer även att finnas i databasen. På projektets hemsida kommer även att finnas utförlig beskrivning av metoder vid skapandet av den harmoniserade databasen. 16 Se: http://www.iisg.nl/research/hisco.html 17 De som har varit ansvariga för yrkeskategoriseringar är: Marianne Jarnæs Erikstad (University of Tromsø), Chad Ronnander (University of Minnesota), Matthew Woollard (University of Essex). Se: Evan Roberts, Matthew Woollard, Chad Ronnander, Lisa Dillon och Gunnar Thorvaldsen, Occupational Classification in the North Atlantic Population Project, Historical Methods 36 (2) (2003), s 80-88. 9
UTTAG ANVÄNDARE AV NAPP DATABASEN Endast mycket få forskare kommer att vara intresserade av analyser på databasen i sin helhet. Därför har det utvecklas ett uttagssystem som möjliggör en analys av valda variabler och delar av databasen. Uttagssystemet som är stort sätt det samma som tidigare har utvecklas i samband med IPUMS-International projektet. 18 Uttag från databsen är kostnadsfria och utförs av personal från Minnesota population center. På projektets hemsida finns det länkar till hemsidor till relevanta organisationer i enstaka medlemsländer. De första filerna lanserades i 2001 och förmodligen kommer den första versionen av det harmoniserade datamaterialet från alla länder att lanseras i början på 2005. 2 I nuläget har 188 användare begärt uttag från databasen (figur 1). De allra flesta har bakgrund inom historia men det finns det även ett stort antal användare inom andra ämnen i synnerhet sociologi. Figur 1. NAPP - databsen. Antal användare efter forskningsområde t.o.m. augusti 2004 60 50 40 30 20 10 0 Historia Ekonomi Sociologi Demografi Forskning annat område Administrativa enheter Företag Media Annat 18 Steven Ruggles, Miriam L. King, Deborah Levison, Robert McCaa och Matthew Sobek, IPUMS-International, Historical Methods 36 (2) (2003), s 60-65. 10
VIKTIGA FORSKNINGSOMRÅDEN NAPP-databasen ger möjligheter till forskning inom en rad forskningsområden. Nedan omtalas några av de: (1) Forskning rörande enstaka sub-grupper inom länder eller jämförande studier över gränser: Utifrån sampel-data från de tidigare databaser var dylika studier svårt genomförbara på grund av den ringa befolkningen inom enstaka subgrupper. Eftersom den nya databasen innehåller hela befolkningen från alla medlemsländer ökar möjligheten av att genomföra studier av små etniska grupper, i synnerhet i Kanada, Norge och i USA. Till exempel finns det i den kanadensiska 1881-års folkräkningen 60,000 individer som tillhör ursprungsbefolkningen. Utifrån denna folkmängd finns det en konkret möjlighet att uppskatta fertilitets och mortalitetsmönster jämfört med andra etniska grupper något som inte var möjligt när IPUMS databasen enbart bestod av ett 10% sampel. Liksom i de andra nordiska länderna var emigrationen från Island till USA och Kanada mycket omfattande från 1870 och fram till första världskriget. Även om andelen emigranter från Island under denna period var högre än i från andra nordiska länderna fanns det i den sampelbaserade databasen inte en möjlighet att utföra en demografisk studie på den isländska befolkning i USA och Kanada. Denna möjlighet finns nu. Även om den norska befolkningen i USA och Kanada var mycket större än den isländska var möjligheterna till en utförlig studie tidigare relativt ringa. Nu kommer möjligheter att göra mycket detaljerade studier på dessa befolkningar utifrån olika variabler som till exempel olika yrkeskategorier. Regionala studier: Intresset för mikrostudier i enstaka församlingar eller andra mindre geografiska enheter har växt de senaste decennier. Om möjligheterna till omfattande mikrostudier har även skapats inom ramen av NAPP. Den internationella dimensionen av databasen skapar också mycket intressanta möjligheter till jämförande studier. Man kan till exempel tänka sig intressanta studier av den norska befolkningen i Minnesota och göra en jämförande analys på regioner i Norge därifrån dessa immigranter hade sitt ursprung. 11
Longitudinella analyser: Under de senaste decennierna har intresset för longitudinella studier på individbaserat material växt enormt inom familjehistoria och demografi. 19 Den stora fördelen, men även den stora utmaningen inom NAPP-projektet, består i projektets strävan att skapa longitudinellt material där det kommer att finnas möjligheter att följa individer genom successiva folkräkningar. I nuläget är denna möjlighet mycket begränsat men en ny ansökning har nu skickats till amerikanska forskningsrådet där fler folkräkningar inkluderas, bl.a. folkräkningen från Kanada 1890 och 1901 och den amerikanska 1900. I fortsättningen kommer projektmedlemmar att sätta igång ett arbete som syftar åt länkning av individer genom successiva folkräkningar. En annan utmaning är att länka individer genom folkräkningar över riksgränser. Som redan antytts ovan har denna möjlighet diskuterats men kommer sannolikt inte att vara genomförbar på någon större skala, bl.a. på grund av förändringar av namn vid emigrationstillfället. Det var således mycket vanligt förekommande att både norrmän och islänningar förengelskade sina namn relativt snabbt efter emigrationen. Det kommer dock att finnas ett potential i det isländska materialet på grund av den relativt ringa befolkningen, stabilitet i namn och en grundlig kunskap om släktband före immigrationen. 20 Gunnar Thorvaldsen, en av deltagarna i projektet, har likaledes studerat möjligheterna att länka samman norska befolkningen i USA till tidigare folkräkningar i Norge. 21 Det länkade materialet kommer i framtiden även att underlätta longitudinella studier av familjebildning, livsloppsövergångar både med familjen och individen som studieobjekt. NAPP projektet kommer således att öppna forskningsmöjligheter på en mängd forskningsområden, framför allt, inom historia, geografi, demografi, sociologi och ekonomi. Den stora fördelen är att databasen är harmoniserat och ger därför en möjlighet till omfattande komparativa studier rörande bl.a. diverse aspekter av industrialiseringen i västvärlden, samt jämförande studier på olika demografiska variabler, dvs. familjebildning, fertilitet, dödlighet och inte minst migration. 19 Detta verifieras i en nylig omfattande antologi där 18 framträdande forskare bidrar med artiklar om livsloppstransitioner: The Road to Independence. Leaving Home in Western and Eastern Societies, 16th-20th centuries. Frans van Poppel, Michel Oris och James Lee (eds.) (Peter Lang: Bern 2004). 20 Júníus Kirstjánsson, Vesturfaraskrá. 21 Gunnar Thorvaldsen, Migrasjon i Troms i annen halvdel av 1800-tallet. En kvantitativ analyse av folketellingene 1865, 1875 og 1900). Tromsø 1995. 12
LESSONS TO BE LEARNED? Hur relevant var detta föredrag för de statistiska organisationerna? Finns det en användbar utgångspunkt i det beskrivna projektet för befolkningsenheterna på de moderna statistiska organisationerna? NAPP projektet har under behandling historisk data som inte rör personvärnlagstiftning i respektive länder till någon betydande utsträckning. På denna punkt finns det stora skillnader. Grundläggande skillnader finns även i strukturen på källmaterialet. Materialet inom NAPP-databasen består av tvärsnittdata (nästan uteslutande folkräkningar) medan befolkningsenheterna på de statistiska organisationerna inom Norden nästan uteslutande arbetar med material som är longitudinellt i sin karaktär. Inom NAPP projektet är länkning mellan olika källor (successiva folkräkningar) mycket begränsade jämfört med det mycket rika materialet från individuella nationala register. Traditionell befolkningsstatistik baseras nästan uteslutande på tvärsnittsdata. Strukturerna är sega. Finns det eventuellt anledning att tro att befolkningsenheterna inom de statistiska organisationerna har fastnat i ett traditionellt sätt att tänka och förmedla sina uppgifter? Finns det ett alternativt sätt att tänka? Longitudinella databaser med ett rätt långt tidsperspektiv finns antagligen tillgängliga på alla befolkningsenheterna inom Norden. Dessa ger mångfaldiga analysmöjligheter. Således kan det till exempel tänkas att publicera information om skilsmässor or hos olika giftermålskohorter där även olika aspekter av familjebildningen inkorporeras i analysen. Visserligen kan man fråga sig om analyser av den sorten hör hemma inom de statistiska organisationerna. Omfattande longitudinella studier om familjebildning, livsloppsövergångar både med familjen och individen som studieobjekt hör eventuellt snarare hemma inom större forskningsprojekt men skall inte ingå i den dagliga verksamheten hos de statistiska organisationerna. Då vaknar genast frågan om hur uttag till forskare skall genomföras. Enligt en nyligen publicerad rapport som framställdes av medlämmar från alla de nordiska statistiska organisationerna är huvudprincipen hos de flesta organisationerna att deidentifiera materialet innan det lämnas till forskare. 22 På Island görs länkningar av filer inom befolkningsstatistiken redan på begäran av forskare. Antagligen har Island samma problem som de andra nordiska länderna vad gäller disseminering av longitudinell data. Således är deidentifiering av individer ofta närmast omöjlig i länder med liten befolkning. Där framstår Island 22 Access to microdata in the Nordic countries. SCB, s 12-16. 13
dock som ett extremfall med sin befolkning på drygt 290.000 individer. I denna sammanhang kan man fråga sig om det finns en potentiell risk för missbruk av informationen. Vid tillstånd från Persónuvernd (institutionen som är jämförbar med Datainspektionen i Sverige) har befolkningsenheten på Island således varit relativt liberal i utlämnandet av identifierbar data till forskarsamhället. Hittills har länkning av data endast ägt rum inom enstaka enheter i Island. Således finns det till exempel i nuläget ingen möjlighet att länka data från befolkningsenheten och skolenheten. Forskare som är intresserade av en livsloppsanalys av ungdomars väg i vuxenlivet har således ingen möjlighet att beställa ett uttag där data från skolregistret länks till data från befolkningsregistret (rörande till exempel bosättning inom ursprungsfamiljen eller ej, barnafödande, samboförhållanden etc.). Trots ett mycket otroligt rikt källmaterial som bevaras i de olika register inom Hagstofa Íslands finns det således fortfarande hinder av strukturell art som bör avvecklas. 14