Befolkningsprognos för kommunerna i Stockholms län under perioden 2003-2012 Martin Elfsberg U.U.D.M. Project Report 2004:10 Examensarbete i matematisk statistik, 20 poäng Handledare: Silvelyn Zwanzig, Uppsala universitet och Johan Bring, Statisticon Examinator: Silvelyn Zwanzig Juni 2004 Department of Mathematics Uppsala University
Befolkningsprognos för kommunerna i Stockholms län under perioden 2003-2012 Martin Elfsberg 9 juni 2004
Tack! Jag vill börja med att tacka Johan Bring (chef Statisticon) för att du gav mig denna möjlighet och Tomas Pettersson (handledare vid Statisticon). Silvelyn Zwanzig (handledare/examinator vid Uppsala Universitet) för all tid och kunskap du bidragit med, du har varit ett stort stöd under arbetets gång. Till sist vill jag tacka John Brandel och Johan Eriksson för att ni alltid ställt upp och besvarat mina stundtals knäppa frågor under min studietid.
Sammanfattning För kommunerna i Stockholms län har en befolkningsprognos gjorts för perioden 2003-2012. Arbetet presenterar flera olika modeller för hur en sådan prognos kan göras antingen genom att använda regressionsanalys, tidsserieanalys eller multivariat tidsserieanalys. Regressionsmodellen användes för att göra prognoser för alla kommuner under tidsperioden medan tidssseriemodellerna och multivariat modellen användes på två kommuner. Det är stora skillnader i resultaten med varierande trender mellan prognoserna och stora variationer i standardavvikelserna. Ser man till den historiska utvecklingen hos kommunerna är det regressionsmodellen som ger den mest trovärdiga prognosen.
Innehåll 1 Inledning 6 1.1 Syftet med denna studie..................... 6 1.2 Kompletterande syfte....................... 7 2 Data 8 2.1 Datamaterial............................ 8 3 Multivariat tidsserieanalys 10 3.1 Andra ordningens egenskaper.................. 10 3.2 Estimering av väntevärdesvektorn och kovariansmatrisen. 11 3.3 Multivariata ARMA processer.................. 11 3.4 Prognos av multivariata autoregressiva processer...... 12 4 Analys 12 4.1 Kontroll av data.......................... 12 4.2 Tidsserieanalys.......................... 13 4.3 Multivariat tidsserieanalys.................... 14 4.4 Regressionsanalys......................... 14 5 Resultat 15 5.1 Kontroll av data.......................... 15 5.2 Tidsserieprognos......................... 15 5.3 Multivariat tidsserieprognos................... 17 5.4 Regressionsprognos........................ 17 6 Diskussion 20 7 Referenser 23 8 Bilaga 1: Förklaring av nyckeltal och kommunkoder 24 9 Bilaga 2: Resultat från kontrollen av datamaterialet 26 10 Bilaga 3: ARMA(p,q)-modeller för kommunerna med och utan trend 30 11 Bilaga 4: Resultat från tidsserieprognoser med modell 1 och 2, dvs Prognos med trend respektive Prognos utan trend, för kommun 114 och 115 34 4
12 Bilaga 5: Resultat från multivariat tidsserieanalys på kommun 114 och 115 36 13 Bilaga 6: Regressionsmodeller 37 14 Bilaga 7: Resultat av regressionsprognoser med linjär och kvadratisk extrapolation 39 15 Appendix 46 5
1 Inledning 1.1 Syftet med denna studie Landstingsstyrelsen fattade får några år sedan ett beslut om att det skulle göras en befolkningsprognos på kommunnivå för Stockholms län. Landstinget beslutade att Regionplane- och trafikkontoret (RTK) inom Stockholms läns landsting (SLL) skall ansvara för upphandlingen. Statisticon har på uppdrag av RTK fått i uppgift att göra en befolkningsprognos för länets kommuner mellan åren 2003-2012. Figur 1 visar hur befolkningsmängden ökat i Stockholms län under perioden 1968-2002. Befolkningsmängd Stockholms län 1968 2002 Befolkningsmängd 1500000 1600000 1700000 1800000 1970 1975 1980 1985 1990 1995 2000 År Figur 1: Befolkningsmängden i Stockholms län mellan åren 1968-2002. Varför kan det vara av intresse för SLL att få veta hur kommunernas befolkningsutveckling ser ut inom en kommande tioårsperiod? En prognos av befolkningsmängden kan ligga till grund för planeringen inom länet och då främst inom sjukvårdsplaneringen. Prognosen görs på kommunnivå så att den kan aggregeras till olika indelningar inom sjukvården tex för de ca. 250 vårdcentraler som länet är indelat i. Prognosen skall där användas tex för förlossningsplanering och diagnosprognoser, då man tex multiplicerar antalet kvinnor respektive män i olika åldrar med risken att få bröstcancer eller prostatacancer, med risken att få stroke eller olika typer 6
av infarkter 1. Arbetet är inte bara av intresse för SLL utan även intressant för Statisticon men deras intresse är av en lite annorlunda karaktär. De har ett behov av att få fram automatiserade processer för att kunna detektera avvikelser från ursprungliga prognoser. Genom att göra konfidensintervall för prognosen kan man lätt se om det blir någon avvikelse under åren. Det är tänkt att man ska få en varning om en eller flera prognoser hamnar utanför intervallet. I detta arbete begränsar jag mig till att bara studera befolkningsmängdens utveckling för länets kommuner under perioden 2003-2012. Studien kommer att göras genom att använda både tidsserie- och regressionsanalys. Jag har använt mig av programmet R i detta arbete. 2 Jag kommer att studera varje kommun var för sig men ger teorin bakom multivariat tidsserieanalys samt utför ett enkelt exempel för två av kommunerna. Anledning till varför jag inte undersöker det multivariata sambandet för alla kommuner och gör min prognos utifrån den är att metoden inte är färdigutvecklad i R och inte returnerar några standardavvikelser vilka behövs för beräkningen av konfidensintervallet. 3 1.2 Kompletterande syfte Detta arbete ska även kunna användas som ett hjälpmedel för andra studenter eller personer med ett intresse av att lära sig använda programmet R. I Appendix i slutet av detta arbete presenterar jag hur man kan gå till väga när man vill göra tidsserie- och regressionsanalyser samt prognoser i R. Det ska däremot förtydligas att det kan göras på flera olika sätt och att de metoder jag redovisar kanske inte är de bästa men syftet är att ge läsaren och den intresserade lite tips och idéer som han sedan själv kan utveckla vidare. 1 Ulla Moberg, statistikansvarig SLL, e-mail fått den 15/3-04 2 Kan laddas ner från www.r-project.org 3 I version 1.8.1 av R fungerar inte detta men det kommer att fungera i senare versioner. 7
2 Data 2.1 Datamaterial I datamaterialet för en kommun beskrivs tretton demografiska nyckeltal. Kort kan man säga att ett nyckeltal är en variabel som beskriver kommunens uppbyggnad vad gäller antal invånare, medelålder, antal döda osv. Vilka dessa nyckeltal är och en kort beskrivning av dem kan ses i Bilaga 1. Varje nyckeltal är en tidsserie med ett värde för varje år mellan 1968-2002. Som redan nämnts så begränsar jag mig till att bara studera nyckeltalet bef, dvs befolkningsmängden den 31/12 det aktuella året. Stockholms län består av 25 kommuner mellan åren 1968-1997 men from år 1998 består länet av 26 kommuner. Det som hände 1998 var att Södertäljes kommun delades upp i Södertälje och Nykvarns kommun. Det innebär att Nykvarns kommun bara har existerat i fem år och har lite för få observationer för att man ska kunna göra tillförlitliga modeller. Därför valde jag att inte studera dessa kommuner var för sig utan lägga ihop dess värden och studera de som en kommun som i detta arbete fått kommunkoden 140181. Vilka kommuner som ingår i Stockholms län samt deras kommunkod kan ses i Bilaga 1. I fortsättningen kommer jag att hänvisa till en kommun genom dess kod istället för att använda kommunens fullständiga namn. I de sex figurerna nedan visas befolkningsutvecklingen för varje kommun i länet under perioden 1968-2002. Anledningen till indelningen är att det är stora variationer i befolkningsmängden mellan kommunerna vilket gör att det kan bli otydliga figurer. 8
Befolkningsmängd 1968 2002 Befolkningsmängd 1968 2002 Befolkningsmängd 5000 10000 15000 20000 25000 115 125 128 139 187 192 Befolkningsmängd 15000 20000 25000 30000 35000 40000 114 117 120 138 1970 1975 1980 1985 1990 1995 2000 1970 1975 1980 1985 1990 1995 2000 År År Figur 2: Befolkningsmängd 1968-2002 Figur 3: Befolkningsmängd 1968-2002 Befolkningsmängd 1968 2002 Befolkningsmängd 1968 2002 Befolkningsmängd 25000 30000 35000 40000 162 183 186 191 1970 1975 1980 1985 1990 1995 2000 Befolkningsmängd 20000 30000 40000 50000 60000 70000 80000 90000 123 126 127 136 140181 1970 1975 1980 1985 1990 1995 2000 År År Figur 4: Befolkningsmängd 1968-2002 Figur 5: Befolkningsmängd 1968-2002 9
Befolkningsmängd 1968 2002 Befolkningsmängd 1968 2002 Befolkningsmängd 40000 50000 60000 70000 160 163 182 184 188 Befolkningsmängd 660000 680000 700000 720000 740000 760000 180 1970 1975 1980 1985 1990 1995 2000 1970 1975 1980 1985 1990 1995 2000 År År Figur 6: Befolkningsmängd 1968-2002 Figur 7: Befolkningsmängd 1968-2002 3 Multivariat tidsserieanalys Man kan studera tidsserier oberoende och var för sig som univariata tidsserier men denna metod är dock inte att föredra när man handskas med två eller flera tidsserier eftersom den inte tar hänsyn till möjliga beroenden mellan tidsserierna. Dessa korsvisa beroenden är av stor vikt framför allt när man ska prediktera framtida värden 4. 3.1 Andra ordningens egenskaper Vi har n stycken tidsserier X t1...x tn där n=1...25 observerade vid åren t=1968...2002. Varje tidsserie motsvarar nyckeltalet bef för en av kommunerna. Vi skapar en vektor X t =(X 11,..., X tn ) och definierar väntevärdesvektorn µ t = EX t =[µ t1...µ tn ] (1) och kovariansmatrisen 4 Brockwell & Davis, Introduction to Time Series and Forecasting,2002 10
Γ(t + h, t) = där γ ij (t + h, t) =Cov(X t+h,i,x t,j ). γ 11 (t + h, t)...γ 1m (t + h, t). γ m1 (t + h, t)...γ mm (t + h, t) (2) 3.2 Estimering av väntevärdesvektorn och kovariansmatrisen En naturlig väntevärdesriktig estimator av väntevärdesvektorn µ baserad på observationerna X 1...X n är medelvärdesvektorn 5 X n = 1 n n X t (3) t=1 Kovariansmatrisen estimeras enligt 1 n h ( ˆΓ(h) ={ n t=1 Xt+h X )( n Xt X ) n då 0 h n 1 ˆΓ( h) då n +1 h<0 (4) Om vi kallar den (i,j)-komponenten av ˆΓ(h) där i, j =1, 2,... för ˆγ ij (h) så är estimatet av korskorrelationen ˆρ ij (h) =ˆγ ij (h)[ˆγ ii (0)ˆγ jj (0)] 1 2 (5) Detta ger korrelationen mellan alla tidsserierna i datamaterialet och när i = j så blir ˆρ ij autokorrelations funktionen för den i te tidsserien. 3.3 Multivariata ARMA processer En multivariat ARMA(p,q) process kan skrivas X t Φ 1 X t 1... Φ p X t p = Z t +Θ 1 Z t 1 +...+Θ q Z t q (6) där Z t WN(0, ). 5 Brockwell & Davis, Introduction to Time Series and Forecasting,2002 11
3.4 Prognos av multivariata autoregressiva processer Om vi antar att X t är en AR(p) process med koefficientmatrisen Φ=Φ 1,...,Φ p kan vi skriva denna X t =Φ 1 X t 1 +...+Φ p X t p + Z t, Z t WN(0, ) (7) För att beräkna den bästa h-steg linjära prediktorn P n X n+h baserad på komponenterna X 1,..., X n så applicerar vi den linjära prediktorn P n på ekvation 7 för att utföra recursionen 6 P n X n+h =Φ 1 P n X n+h 1 +...+Φ p P n X n+h p (8) Kovariansmatrisen beräknas enligt E [ (X n+h P n X n+h )(X n+h P n X n+h ) ] n p (9) 4 Analys I detta avsnitt presenterar jag hur kontrollen av datamaterialet gjordes och vilka modeller som användes för att göra prognoser. 4.1 Kontroll av data När man ställs inför en uppgift där det är stora datamängder som ska hanteras är det viktigt att man börjar med att kontrollera sina data innan man gör sina analyser. Eftersom detta arbete går ut på att göra befolkningsprognoser är det mest intressant att analysera dessa data. Kan man tänka sig att befolkningen vid en viss tidpunkt i en kommun är beroende av andra nyckeltal? Det är intuitivt att befolkningen vid slutet av innestående år beror av kommunens befolkning året innan samt döds-, födelse-, inflyttningsoch utflyttningstalet innestående år. Nedan visas hur modellen ser ut som testar detta påstående och i Bilaga 2 visas resultaten. bef(t) αbef(t 1) + βdoda(t)+γfodda(t)+λinfl(t)+ρutfl(t) 1 6 Brockwell & Davis, Introduction to Time Series and Forecasting, 2002 12
4.2 Tidsserieanalys Det finns många olika sätt att anpassa en ARMA(p,q) modell till sin tidsserie och i Appendix ges förslag på hur det kan gå till. I detta arbete valde jag att göra påtvå olika sätt. 1. Med trend: Jag valde att behandla trenden genom att anpassa en kurva till tidsserien med en regressionsmodell. Vilken typ av kurva som anpassades beror av tidsseriens utseende mellan åren 1968-2002 och jag ansåg att det antingen är en linjär eller en andragrads ekvation som bäst kan förklara trenden. Ett annat antagande jag gör är att det för varje tidsserie inte är några säsongseffekter och då blir residualerna lika med tidsserien minus trenden. Till residualerna anpassades sedan en ARMA(p,q) modell. 2. Utan trend: Om man antar att tidsserien är stationär så kan man anpassa en ARMA(p,q) modell direkt på den. I Bilaga 3 kan man se vilka ARMA(p,q) modeller som anpassades till tidsserierna när de ovan beskrivna metoderna användes. Jag presenterar här två olika modeller för hur en prognos kan gå till väga. 1. Prognos med trend: Man börjar med att använda sig av en kortare del av tidsserien tex 1968-1996. Till denna anpassar man en modell för trenden och gör en prognos, pred.trend, för 1997 och en ARMA(p,q) modell anpassas till residualerna och en prognos, pred.arima,görs för 1997. För år 1998 används sedan tidsserien mellan 1968-1997. Detta upprepas tom år 2002 och då kan kovariansen mellan pred.trend och pred.arima beräknas. Sedan fortsätter man för år 2003 och då kan man beräkna prognosen för befolkningsmängden enligt pred(2003) = pred.trend + pred.arima (10) och konfidensintervallet enligt pred(2003) ± λ 1 α/2 se.trend 2 + se.arima 2 +2 Cov(pred.trend, pred.arima) där se.trend och se.arima är standardavvikelsen för pred.trend respektive pred.arima. Detta upprepas för varje år som ska prognosticeras. 13
2. Prognos utan trend: Här används hela tidsseriens längd, dvs 1968-2002, och om man antar att den är stationär kan en ARMA(p,q) modell anpassas direkt på den. En prognos görs för alla år samtidigt i perioden 2003-2012. Dessa två modeller har jag applicerat på två till utseendet olika kommuner, nämligen 114 och 115. Valet av kommuner har jag gjort eftersom trenden anpassas med en andragrads- respektive linjär ekvation och då kan man se om någon av modellerna är att föredra framför den andra. Resultaten kan ses i Bilaga 4. 4.3 Multivariat tidsserieanalys Som nämnts tidigare så saknas den viktiga funktionen i R som beräknar standardavvikelsen vid en prognos av multivariata tidsserier och därför kan inte konfidensintervallet beräknas. Men jag gjorde ändå en prognos, dock bara för ett år där kommunerna 114 och 115 behandlades som multivariata tidsserier. När man ska göra prognoser är det av stor betydelse att man studerar det multivariata sambandet mellan kommunerna och hur detta kan göras kan ses i Appendix. Två prognoser gjordes, den ena när en ARMA(p,q) modell hade anpassats enligt metoden Med trend och den andra med metoden Utan trend och resultaten kan ses i Bilaga 5. 4.4 Regressionsanalys Som jag nämnde tidigare så är det vissa skillnader i utseendet hos tidsserierna. Många tidsserier har en ganska stor variation under de första 10-20 åren vilket gör det svårt att anpassa en bra modell till hela serien. Där det har varit möjligt att anpassa en bra modell till hela tidsserien har det gjorts men för de flesta av kommunerna har jag använt mig av lokal linjär eller kvadratisk extrapolation på en kortare del av tidsserien. Hur detta har gått till kan man se i Appendix och i Bilaga 6 kan man se vilka regressionsmodeller som anpassats och i kolumnen Kod om jag använt mig av hela eller bara en del av tidsserien. Dessa regressionsmodeller har sedan använts för att göra en prognos för hela tidsperioden 2003-2012 på en gång. I Appendix kan man se hur denna prognos kan göras i R och i Bilaga 7 hur prognoserna ser ut. 14
5 Resultat Här presenteras vilka resultat som följer av kontrollen av datamaterialet och prognoserna. 5.1 Kontroll av data I Bilaga 2 visas resultaten från kontrollen av datamaterialet. Som man kan se av dessa resultat så är det för samtliga kommuner väldigt bra modellanpassningar (låga p-värden för F-stat) och bra relationer mellan de ingående variablerna (höga R 2 ) men det är dock vissa oklarheter. För kommun 187 är det bara bef(t-1) och infl(t) som är signifikanta och för kommun 117 är det fodda(t) som inte är signifikant även om doda(t) bara är signifikant på 10%-nivån. Någon bra förklaring till varför dessa kommuner avviker från de övriga kan jag inte ge men en sak som de har gemensamt är att de är kustkommuner. 5.2 Tidsserieprognos I de två figurerna nedan kan man se resultatet från prognoserna med modell 1 och 2, dvs Prognos med trend och Prognos utan trend. Prognos 2003 2012 för kommun 114 med modell 1 och 2 Prognos 2003 2012 för kommun 115 med modell 1 och 2 Befolkningsmängd 20000 25000 30000 35000 Prognos med trend Prognos utan trend Befolkningsmängd 15000 20000 25000 30000 Prognos med trend Prognos utan trend 1970 1980 1990 2000 2010 1970 1980 1990 2000 2010 År År Figur 8: Prognos 2003-2012 för kommun 114 med modell 1 och 2 Figur 9: Prognos 2003-2012 för kommun 115 med modell 1 och 2 15
Om man först studerar Figur 8 så är det stora skillnader i prognosen mellan modellerna. Den stora nedgången för modell 1 kan förklaras av att det till trenden anpassades en andragradsekvation och när sedan prognosen beräknades enligt ekvation 10 så är det prognosen för trenden (pred.trend) som dominerar. Detta får till följd att prognosen för modell 1 följer andragradsekvationen. Prognosen för modell 2 följer den avtagande trenden som tidsserien uppvisar under åren 2000-2002. Om man sedan ser på resultaten för kommun 114 i Bilaga 4 så är det stora skillnader vad gäller konfidensintervallet mellan modellerna pga stora skillnader i standardavvikelsen. För modell 1 är det höga standardavvikelser som ökar med prognosåret men än högre är det för modell 2 vilket får till följd att konfidensintervallen blir stora för båda modellerna. Den lägre standardavvikelsen för modell 1 har att göra med att prognosen görs för ett år i taget medan den betydligt högre standardavvikelsen för modell 2 beror av att prognosen görs för alla år samtidigt och då blir osäkerheten större för varje år. I Figur 9 ser man hur prognoserna blev för kommun 115. Modell 1 följer prognosen för trendmodellen som i detta fall är en linjär ekvation medan modell 2 följer trenden som tidsserien uppvisar under åren 2000-2002. I Bilaga 4 ser man att även här ger modellerna höga standardavvikelser som ökar med prognosåret och stora konfidensintervall. Dock är det inte en lika stor ökning av standardavvikelsen för modell 1 som det är för motsvarande modell för kommun 114. Även här görs prognosen för modell 2 för alla år samtidigt och dåökar standardavvikelsen med prognosåret. Kan man säga något om vilken modell som är bäst eller som passar vid ett givet tillfälle? När man har en kommun med ett utseende som liknar det för kommun 114, dvs där trenden bäst anpassas av en andragradsekvation, så är inte modell 1 att rekommendera. Den ger icke trovärdiga prognoser därför att de avtar väldigt snabbt. Modell 2 däremot, ger en prognos med liknande trend som tidsserien har under åren 2000-2002. Den avtar inte lika mycket och jag anser därför att den är mera trovärdig. För kommuner vars historiska utveckling varit nästan linjär kan båda modellerna användas även om modell 1 verkar mest trovärdig om man ser till den historiska utvecklingen. 16
5.3 Multivariat tidsserieprognos När man använder sig av multivariat tidsserieanalys så kan man bara anpassa en AR(p) modell, det fungerar alltså inte med en ARMA(p,q) modell. AR(p) modellen anpassades med båda metoderna Med trend och Utan trend. Av resultaten i Bilaga 5 ser man att det blir en AR(2) modell för tidsserierna Med trend och en AR(1) Utan trend. Man ser även korrelationen mellan kommunerna som koefficienterna bef114&bef115 och bef115&bef114. Eftersom dessa koefficienter är små så innebär det att det bara är en liten korrelationer mellan kommunerna. I Bilaga 5 kan man även se hur prognosen blev för år 2003. Prognosen blir högre för båda kommunerna i fallet då data behandlades med metoden Med trend än Utan trend. 5.4 Regressionsprognos För att konfidensintervallets längd ska kunna beräknas på ett korrekt sätt så ska residualerna vara oberoende men så är inte fallet för alla kommuner i detta arbete. Detta är något jag har varit medveten om men jag använder ändå metoden även om konfidensintervallens längd inte kommer att stämma exakt. Figurerna 10 och 11 visar residualerna för kommun 120 och 115 som är respektive inte är white noise. I de sex figurerna, Figur 12-17, presenteras prognoserna som gjordes med linjär och kvadratisk extrapolation av tidsserien. Indelningen av kommunerna i figurerna beror på variationen i befolkningsmängden och för att figurerna ska vara så tydliga som möjligt. 17
0.0 0.2 0.4 0.6 0.8 1.0 Series: Residual.120 0.0 0.1 0.2 0.3 0.4 0.5 frequency 0.0 0.2 0.4 0.6 0.8 1.0 Series: Residual.115 0.0 0.1 0.2 0.3 0.4 0.5 frequency Figur 10: Residualer kommun 120, white noise Figur 11: Residualer kommun 115, inte white noise Prognos 2003 2012 Prognos 2003 2012 Befolkningsmängd 5000 10000 15000 20000 25000 30000 115 125 128 139 187 192 1970 1980 1990 2000 2010 Befolkningsmängd 10000 15000 20000 25000 30000 35000 40000 45000 114 117 120 138 1970 1980 1990 2000 2010 År År Figur 12: Prognos 2003-2012 med linjär/ kvadratisk extrapolation Figur 13: Prognos 2003-2012 med linjär/ kvadratisk extrapolation 18
Prognos 2003 2012 Prognos 2003 2012 Befolkningsmängd 25000 30000 35000 40000 45000 162 183 186 191 1970 1980 1990 2000 2010 Befolkningsmängd 2 e+04 4 e+04 6 e+04 8 e+04 1 e+05 123 126 127 136 140181 1970 1980 1990 2000 2010 År År Figur 14: Prognos 2003-2012 med linjär/ kvadratisk extrapolation Figur 15: Prognos 2003-2012 med linjär/ kvadratisk extrapolation Prognos 2003 2012 Prognos 2003 2012 Befolkningsmängd 40000 50000 60000 70000 80000 160 163 182 184 188 Befolkningsmängd 650000 700000 750000 800000 180 1970 1980 1990 2000 2010 1970 1980 1990 2000 2010 År År Figur 16: Prognos 2003-2012 med linjär/ kvadratisk extrapolation Figur 17: Prognos 2003-2012 med linjär/ kvadratisk extrapolation 19
I Bilaga 6 kan man se vilka modeller som ligger till grund för prognoserna och i kolumnen Kod kan ses från vilken tid som modellen gäller, bara i tre fall användes hela tidsseriens längd. Man ser även att det användes linjär extrapolation överallt förutom på kommunerna 127, 160 och 180 där det användes kvadratisk. För de flesta av kommunerna är det väldigt bra relation mellan de ingående variablerna i modellen (höga R 2 värden) med värden klart över 0.9, det är bara kommun 162 som inte når upp till det värdet med 0.8899. P-värdet för koefficienterna är klart signifikanta för alla kommuner även om det för kommun 127 bara är signifikant på 5%- nivån. Det är även bra anpassade modeller med låga p-värden för F-stat. I Bilaga 7 ser man att det för alla kommuner är monotont växande befolkningsprognoser. Även standardavvikelserna ökar med prognosåret, detta har sin förklaring i att prognosen görs för alla år samtidigt och då blir osäkerheten större för prognoser längre fram i tiden. Man kan även se att med vissa undantag så är merparten av kommunernas standardavvikelser pånästan samma nivå. 6 Diskussion När jag gjorde mina prognoser med tidsserieanalys jämförde jag två olika modeller (modell 1: Prognos med trend, modell 2: Prognos utan trend) på kommunerna 114 och 115. För kommun 114 gav modell 1 en kraftigt avtagande prognos samt höga standardavvikelser som ökar med tiden. De höga standardavvikelserna ger i sin tur att konfidensintervallet blir stort. Den avtagande prognosen beror på att det till trenden anpassades en andragradsekvation och när prognosen sedan beräknas enligt ekvation 10 så är det (pred.trend) som dominerar varför detta medför att prognosen för modell 1 följer andragradsekvationen. Modell 2 ger även den en avtagande prognos som i detta fall följer tidsseriens trend för åren 2000-2002. Även här blev standardavvikelserna höga och högre för varje prognosår med ökande konfidensintervall som följd. De växande standardavvikelserna beror av att för denna modell görs prognosen för alla år samtidigt vilket ger större osäkerhet desto längre fram i tiden som ska prognosticeras. För kommun 115 ger modell 1 en växande prognos som även här följer prognosen för trenden som för denna kommun är linjär. Modellen ger höga standardavvikelser som ökar med tiden även om ökningen är betydligt mindre jämfört med samma modell för kommun 114. Modell 2 ger en svagt avtagande prognos som följer tidsseriens trend för åren 2000-2002. 20
Även här blev standardavvikelserna höga och högre för varje prognosår med ökande konfidensintervall. Om man jämför resultatet från multivariata tidsserieprognosen med resultaten från modellerna 1 och 2 så är prognosen för kommun 114 lite lägre i båda fallen (Med trend och Utan trend). För kommun 115 är däremot prognosen endast lägre i fallet Utan trend jämfört med modell 2. Jag presenterar mina prognoser från regressionsmodellerna som de slutgiltiga. Här har jag anpassat en modell till min tidsserie utifrån dess utseende och i de fall det var svårt att anpassa en bra modell till hela tidsserien använde jag mig av lokal linjär eller kvadratisk extrapolation på en kortare del av serien. Prognoserna gjordes för alla år samtidigt och är för alla kommuner monotont växande med växande standardavvikelser men de är, med vissa undantag, på enlåg nivå, därmed blir konfidensintervallets längd kort. Vid en jämförelse mellan alla olika sätt att göra en prognos på såär det stora skillnader metoderna emellan. Jämför man resultaten för kommun 114 så ger modell 1 och 2 prognoser där befolkningsmängden kommer att minska medan den kommer att öka med regressionsmetoden. Vilken metod som är sann kan jag så klart inte avgöra men det verkar lite underligt att befolkningsmängden kommer att minska så drastiskt med modell 1. Även modell 2 ger en prognos där det kommer att ske en minskning men den är betydligt mindre. Om man tittar på den historiska utvecklingen för kommunen i Figur 3 så verkar det minst troligt att resultaten från modell 1 skulle inträffa medan resultaten från modell 2 och regressionsmetoden (se Figur 8 resp Figur 13) mera troligt skulle kunna inträffa. När man sedan tittar på standardavvikelsen så blir de höga för både modell 1 och 2 medan de i sammanhanget blir relativt små för regressionsmetoden. För kommun 115 är det modell 1 och regressionsmetoden som ger en positiv ökning av befolkningsmängden medan modell 2 ger en liten minskning. Även här är det modell 1 och 2 som har de högsta standardavvikelserna och de längsta konfidensintervallen. För denna kommun verkar det som om modell 1 (se Figur 9) och regressionsmetoden (se Figur 12) är de som bäst skulle svara mot den verkliga befolkningsutvecklingen om man ser till hur den sett ut under perioden 1968-2002 enligt Figur 2. Kan man säga något om vilken modell som är bäst eller är att föredra vid en prognos? Det är stora skillnader mellan modellerna som presenter- 21
ats i detta arbete främst vad gäller prognosens trend för perioden 2003-2012 men även standardavvikelserna varierar kraftigt. Regressionsmetoden ger för alla kommuner växande prognoser och, med vissa undantag, låga standardavvikelser. Som man kan se i Figur 12-17 så verkar prognoserna vara trovärdiga om ser till hur befolkningsmängden utvecklats under åren 1968-2002. Däremot så är det lite svårare att dra några bra slutsatser från prognoserna från modell 1 och 2 eftersom de bara användes på två kommuner, men när en tidsseries trend anpassas med en andragradsekvation så är modell 2 att föredra. När trenden anpassas med en linjär ekvation är det däremot modell 1 som ger det mest trovärdiga resultatet. Här presenterar jag några förslag på hur man kan utveckla detta arbete vidare. Det finns flera sätt att behandla en tidsseries trend- och säsongseffekter än de som gjorts i detta arbete (se Appendix för olika metoder). Det vore intressant att se om man får liknande resultat eller om de avviker från de som framkommit i detta arbete. När en nyare version av R utges kan man testa det multivariata sambandet mellan kommunerna för att se om vissa kommuner samverkar och om en ökning av befolkningen i en kommun hör samman med en minskning i en annan eller tvärtom. Sedan kan man göra prognoser och jämföra med de som framkommit i detta arbete. Som det nämndes tidigare så består datamaterialet av flera sk nyckeltal, det kan finnas ett intresse att även undersöka dessa. 22
7 Referenser 1. Brockwell. Peter J. and Davis. Richard A. Time Series: Theory and Methods, Springer, Second edition, 1991. 2. Brockwell. Peter J. and Davis. Richard A. Introduction to Time Series and Forecasting, Springer, Second edition, 2002. 23
8 Bilaga 1: Förklaring av nyckeltal och kommunkoder Bef: befolkningsmängd den 31/12 respektive år. Doda: antal avlidna under det aktuella året. Fodda: antal levande födda under det aktuella året. Infl: antal inflyttade under det aktuella året. Utfl: antal utflyttade under det aktuella året. Mbef:årsmedelbefolkning (genomsnittet av befolkningen den 31/12. innevarande år och befolkningen den 31/12 föregående år). Dtal: det allmänna dödstalet (antal döda/medelbefolkningen). Ftal: det allmänna födelsetalet (antal levande födda/medelbefolkningen). Intal: det allmänna inflyttningstalet (antal inflyttade/medelbefolkningen). Uttal: det allmänna utflyttningstalet (antal utflyttade/medelbefolkningen). Folkokn: årets folkökning (absoluta tal). Konskvot: könskvot (antal män/totalbefolkningen). M.alder: medelålder. 24
Kod Kommun Upplands Väsby 114 Vallentuna 115 Österåker 117 Värmdö 120 Järfälla 123 Ekerö 125 Huddinge 126 Botkyrka 127 Salem 128 Haninge 136 Tyresö 138 Upplands-Bro 139 Nykvarn 140 Täby 160 Danderyd 162 Sollentuna 163 Stockholm 180 Södertälje 181 Nacka 182 Sundbyberg 183 Solna 184 Lidingö 186 Vaxholm 187 Norrtälje 188 Sigtuna 191 Nynäshamn 192 Tabell 1: Stockholms läns kommuner och motsvarande kommunkoder 25
9 Bilaga 2: Resultat från kontrollen av datamaterialet Kod Coef Est s.e p R 2 F-stat 114 bef(t 1) 1.0008795 0.0008736 2e 16 1 2.2e 16 doda(t) 0.9351931 0.084088 5.93e 11 fodda(t) 0.9528176 0.0280109 2e 16 infl(t) 1.0093891 0.0048149 2e 16 utfl(t) 1.0157659 0.0126654 2e 16 115 bef(t 1) 0.9999754 0.0007593 2e 16 1 2.2e 16 doda(t) 1.0447632 0.0903178 2.6e 11 fodda(t) 1.0102011 0.0237737 2e 16 infl(t) 1.0027265 0.0057002 2e 16 utfl(t) 1.0001095 0.0097336 2e 16 117 bef(t 1) 0.9977 0.013 2e 16 1 2.2e 16 doda(t) 1.1839 0.6461 0.078813 infl(t) 1.0925 0.1417 4.59e 8 utfl(t) 1.2251 0.3019 0.000427 120 bef(t 1) 1.002074 0.002444 2e 16 1 2.2e 16 doda(t) 1.208724 0.256703 8.71e 5 fodda(t) 0.935601 0.077566 1.12e 11 infl(t) 1.017983 0.017805 2e 16 utfl(t) 1.014933 0.030468 2e 16 123 bef(t 1) 1.000754 0.002039 2e 16 1 2.2e 16 doda(t) 1.010506 0.150004 5.74e 7 fodda(t) 0.833277 0.099747 1.45e 8 infl(t) 0.988467 0.024218 2e 16 utfl(t) 0.965261 0.021481 2e 16 Tabell 2: Resultat från kontrollen av datamaterialet. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 26
Kod Coef Est s.e p R 2 F-stat 125 bef(t 1) 1.00089 0.001056 2e 16 1 2.2e 16 doda(t) 1.247879 0.14757 1.17e 8 fodda(t) 0.971536 0.036188 2e 16 infl(t) 0.994042 0.010324 2e 16 utfl(t) 0.977018 0.016492 2e 16 126 bef(t 1) 0.99972 0.003035 2e 16 1 2.2e 16 doda(t) 0.958464 0.348699 0.0112 fodda(t) 0.947314 0.06952 8.62e 13 infl(t) 0.995747 0.017145 2e 16 utfl(t) 0.985483 0.023432 2e 16 127 bef(t 1) 0.9999374 0.0006213 2e 16 1 2.2e 16 doda(t) 0.975656 0.0729326 1.28e 12 fodda(t) 0.9937089 0.0151623 2e 16 infl(t) 0.9949948 0.0028215 2e 16 utfl(t) 0.9934003 0.0049049 2e 16 128 bef(t 1) 1.0005459 0.0007313 2e 16 1 2.2e 16 doda(t) 1.0720574 0.1001207 1.27e 10 fodda(t) 0.9824446 0.0336404 2e 16 infl(t) 0.9978481 0.006291 2e 16 utfl(t) 0.9977611 0.0066504 2e 16 136 bef(t 1) 0.999911 0.002165 2e 16 1 2.2e 16 doda(t) 0.90727 0.231268 0.00064 fodda(t) 0.998611 0.06706 1.27e 13 infl(t) 0.99765 0.011059 2e 16 utfl(t) 1.000452 0.017186 2e 16 138 bef(t 1) 1.0007924 0.0005167 2e 16 1 2.2e 16 doda(t) 1.0671447 0.0528704 2e 16 fodda(t) 1.0015733 0.0165739 2e 16 infl(t) 1.0007447 0.0045174 2e 16 utfl(t) 1.0082368 0.0052892 2e 16 139 bef(t 1) 1.000013 0.001406 2e 16 1 2.2e 16 doda(t) 0.895654 0.143291 1.85e 6 fodda(t) 1.072328 0.059606 1.95e 15 infl(t) 1.000916 0.005475 2e 16 utfl(t) 1.022022 0.01818 2e 16 Tabell 3: Resultat från kontrollen av datamaterialet. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 27
Kod Coef Est s.e p R 2 F-stat 140181 bef(t 1) 1.0005524 0.0004952 2e 16 1 2.2e 16 doda(t) 0.9720567 0.0482082 2e 16 fodda(t) 0.9699968 0.020926 2e 16 infl(t) 0.9958037 0.005906 2e 16 utfl(t) 1.0022267 0.0075999 2e 16 160 bef(t 1) 1.0002072 0.0004576 2e 16 1 2.2e 16 doda(t) 1.0183212 0.0483821 2e 16 fodda(t) 1.047954 0.0189176 2e 16 infl(t) 1.0032118 0.0021556 2e 16 utfl(t) 1.0152475 0.0034266 2e 16 162 bef(t 1) 0.9999102 0.0005868 2e 16 1 2.2e 16 doda(t) 1.052195 0.0558033 6.79e 16 fodda(t) 1.0633767 0.0382678 2e 16 infl(t) 0.9948989 0.0045052 2e 16 utfl(t) 0.9967756 0.0062731 2e 16 163 bef(t 1) 1.0001752 0.0008445 2e 16 1 2.2e 16 doda(t) 0.9834674 0.0939221 1.99e 10 fodda(t) 1.0075482 0.0315124 2e 16 infl(t) 0.9979608 0.0060143 2e 16 utfl(t) 1.0029394 0.0087107 2e 16 180 bef(t 1) 1.0000165 0.0005907 2e 16 1 2.2e 16 doda(t) 0.9691208 0.0213725 2e 16 fodda(t) 0.9965041 0.0101594 2e 16 infl(t) 1.00395 0.0042674 2e 16 utfl(t) 1.0103216 0.0039792 2e 16 182 bef(t 1) 1.000873 0.0005786 2e 16 1 2.2e 16 doda(t) 1.09069 0.0625227 3.89e 15 fodda(t) 1.0071841 0.0137245 2e 16 infl(t) 0.9986856 0.0040331 2e 16 utfl(t) 1.003003 0.0055974 2e 16 183 bef(t 1) 0.998422 0.001055 2e 16 1 2.2e 16 doda(t) 0.876522 0.059666 1.71e 13 fodda(t) 1.014978 0.015675 2e 16 infl(t) 0.999075 0.003184 2e 16 utfl(t) 0.998283 0.004383 2e 16 Tabell 4: Resultat från kontrollen av datamaterialet. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 28
Kod Coef Est s.e p R 2 F-stat 184 bef(t 1) 0.9999197 0.0007391 2e 16 1 2.2e 16 doda(t) 0.9639111 0.05254 1.26e 15 fodda(t) 1.0135313 0.0172346 2e 16 infl(t) 0.9901512 0.0049446 2e 16 utfl(t) 0.9945177 0.0055815 2e 16 186 bef(t 1) 1.0007121 0.0003738 2e 16 1 2.2e 16 doda(t) 1.0065958 0.0204981 2e 16 fodda(t) 0.9594692 0.0286276 2e 16 infl(t) 0.9976927 0.0029871 2e 16 utfl(t) 0.9991364 0.0049406 2e 16 187 bef(t 1) 0.97092 0.02299 2e 16 0.9992 2.2e 16 inf l(t) 0.76693 0.31932 0.0235 188 bef(t 1) 1.0010633 0.0003749 2e 16 1 2.2e 16 doda(t) 1.0411792 0.0225474 2e 16 fodda(t) 0.9864515 0.0133676 2e 16 infl(t) 1.0002188 0.0043311 2e 16 utfl(t) 1.0126212 0.0066721 2e 16 191 bef(t 1) 0.9975 0.001819 2e 16 1 2.2e 16 doda(t) 0.600977 0.171839 0.00185 fodda(t) 0.956883 0.035131 2e 16 infl(t) 0.999015 0.0103 2e 16 utfl(t) 0.985222 0.011614 2e 16 192 bef(t 1) 0.9999572 0.0006414 2e 16 1 2.2e 16 doda(t) 0.924532 0.0702784 1.82e 12 fodda(t) 0.9771507 0.0248474 2e 16 infl(t) 0.994923 0.008884 2e 16 utfl(t) 1.000194 0.011482 2e 16 Tabell 5: Resultat från kontrollen av datamaterialet. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 29
10 Bilaga 3: ARMA(p,q)-modeller för kommunerna med och utan trend Kod Med trend Koeff. Utan trend Koeff. 114 (2, 2) ar1 : 1.8694 (1, 3) ar1 : 0.9903 ar2 : 0.9545 ma1 : 1.1870 ma1 : 0.6081 ma2 : 0.9856 ma2 : 0.3917 ma3 : 0.3678 115 (1, 2) ar1 : 0.7802 (1, 6) ar1 : 0.9927 ma1 : 0.618 ma1 : 0.7759 ma2 : 0.4255 ma2 : 0.9366 ma3 : 0.4496 ma4 : 0.9284 ma5 : 0.9708 ma6 : 0.646 117 (1, 2) ar1 : 0.8982 (1, 5) ar1 : 0.989 ma1 : 0.7228 ma1 : 0.9322 ma2 : 0.6176 ma2 : 1.2887 ma3 : 0.7973 ma4 : 0.8945 ma5 : 0.4919 120 (2, 2) ar1 : 1.2693 (1, 4) ar1 : 1 ar2 : 0.3549 ma1 : 1.3109 ma1 : 0.5954 ma2 : 1.6905 ma2 : 0.7087 ma3 : 0.9947 ma4 : 0.4728 123 (2, 1) ar1 : 1.5531 (1, 4) ar1 : 0.9762 ar2 : 0.8261 ma1 : 1.2469 ma2 : 0.5155 ma2 : 0.971 ma3 : 0.9112 ma4 : 0.4942 30
Kod Med trend Koeff. Utan trend Koeff. 125 (2, 2) ar1 : 1.8524 (1, 5) ar1 : 0.9861 ar2 : 0.9677 ma1 : 1.0485 ma2 : 0.6344 ma2 : 1.089 ma2 : 0.3656 ma3 : 1.2074 ma4 : 0.5406 ma5 : 0.3737 126 (4, 1) ar1 : 2.0697 (1, 6) ar1 : 0.9887 ar2 : 1.8477 ma1 : 1.0937 ar3 : 1.2368 ma2 : 0.3128 ar4 : 0.5545 ma3 : 0.3279 ma1 : 1 ma4 : 0.7031 ma5 : 0.6669 ma6 : 0.4814 127 (2, 2) ar1 : 1.6887 (1, 3) ar1 : 0.9861 ar2 : 0.7553 ma1 : 1.3743 ma1 : 0.3637 ma2 : 1.1354 ma2 : 0.1258 ma3 : 0.2956 128 (1, 2) ar1 : 0.2765 (1, 2) ar1 : 0.6291 ma1 : 1.1852 ma1 : 1.1447 ma2 : 0.8275 ma2 : 0.8057 136 (2, 1) ar1 : 1.4503 (1, 4) ar1 : 0.9856 ar2 : 0.5263 ma1 : 1.1345 ma1 : 0.666 ma2 : 0.8952 ma3 : 1.246 ma4 : 0.7923 138 (1, 3) ar1 : 0.8598 (1, 3) ar1 : 0.9909 ma1 : 1.2978 ma1 : 1.3725 ma2 : 1.0388 ma2 : 1.236 ma3 : 0.6019 ma3 : 0.7435 139 (1, 1) ar1 : 0.8403 (1, 2) ar1 : 0.9872 ma1 : 0.7814 ma1 : 1.1342 ma2 : 0.5324 31
Kod Med trend Koeff. Utan trend Koeff. 140181 (1, 1) ar1 : 0.9078 (1, 3) ar1 : 0.8801 ma1 : 0.9998 ma1 : 1.3222 ma2 : 1.3417 ma3 : 0.9699 160 (2, 2) ar1 : 1.83 (1, 5) ar1 : 0.9893 ar2 : 0.9191 ma1 : 0.9164 ma1 : 0.5101 ma2 : 0.8188 ma2 : 0.4899 ma3 : 0.9235 ma4 : 1.0535 ma5 : 0.5589 162 (2, 1) ar1 : 1.7016 (1, 1) ar1 : 0.9211 ar2 : 0.847 ma1 : 0.4832 ma1 : 1 163 (2, 1) ar1 : 1.8696 (1, 6) ar1 : 0.9965 ar2 : 0.9565 ma1 : 0.7886 ma1 : 1 ma2 : 1.1027 ma3 : 0.9806 ma4 : 1.0325 ma5 : 0.9016 ma6 : 0.7282 180 (2, 1) ar1 : 1.5309 (1, 3) ar1 : 0.9646 ar2 : 0.7046 ma1 : 1.7259 ma1 : 0.8046 ma2 : 1.2254 ma3 : 0.4394 182 (2, 2) ar1 : 1.881 (1, 6) ar1 : 0.9914 ar2 : 0.975 ma1 : 0.7978 ma1 : 0.6244 ma2 : 0.9332 ma2 : 0.3755 ma3 : 0.7685 ma4 : 0.6972 ma5 : 0.8623 ma6 : 0.6552 32
Kod Med trend Koeff. Utan trend Koeff. 183 (3, 1) ar1 : 0.667 (1, 3) ar1 : 0.92 ar2 : 0.7578 ma1 : 0.4837 ar3 : 0.7029 ma2 : 0.8774 ma1 : 0.6124 ma3 : 0.4722 184 (3, 3) ar1 : 0.6967 (1, 2) ar1 : 0.9541 ar2 : 0.8649 ma1 : 0.357 ar3 : 0.7762 ma2 : 0.4294 ma1 : 0.6744 ma2 : 0.77 ma3 : 0.9043 186 (2, 3) ar1 : 0.3263 (1, 3) ar1 : 0.9478 ar2 : 0.0853 ma1 : 0.934 ma1 : 1.0758 ma2 : 1.0462 ma2 : 1.2189 ma3 : 0.6401 ma3 : 0.8033 187 (1, 1) ar1 : 0.508 (1, 3) ar1 : 0.9999 ma1 : 0.227 ma1 : 0.2654 ma2 : 0.2419 ma3 : 0.1681 188 (1, 4) ar1 : 0.9162 (1, 4) ar1 : 0.9984 ma1 : 0.8111 ma1 : 1.0868 ma2 : 0.946 ma2 : 1.3454 ma3 : 0.8111 ma3 : 1.0821 ma4 : 1 ma4 : 0.9787 191 (2, 1) ar1 : 1.4577 (1, 4) ar1 : 0.9704 ar2 : 0.9061 ma1 : 1.3582 ma1 : 0.3994 ma2 : 1.301 ma3 : 1.3573 ma4 : 0.9994 192 (1, 1) ar1 : 0.703 (1, 4) ar1 : 0.9871 ma1 : 0.3316 ma1 : 0.7597 ma2 : 0.7098 ma3 : 0.4666 ma4 : 0.8031 33
11 Bilaga 4: Resultat från tidsserieprognoser med modell 1 och 2, dvs Prognos med trend respektive Prognos utan trend, för kommun 114 och 115 Kod : Modell År Prognos Konfidensintervall (95%) s.e 114 : 1 2003 37127 (35965, 38288) 592.857 2004 36660 (35696, 37623) 491.837 2005 36057 (35124, 36990) 476.02 2006 35361 (33882, 36840) 754.592 2007 34611 (32559, 36663) 1046.939 2008 33829 (31325, 36333) 1277.551 2009 33029 (30086, 35972) 1501.531 2010 32218 (29052, 35384) 1615.306 2011 31397 (28092, 34702) 1686.224 2012 30564 (27172, 33957) 1730.612 114 : 2 2003 37394 (36534, 38259) 438.7301 2004 37364 (35304, 39424) 1051.1944 2005 37315 (33917, 40713) 1733.5311 2006 37210 (32683, 41737) 2309.8329 2007 37105 (31694, 42516) 2760.5572 2008 37002 (30847, 43157) 3140.3882 2009 36900 (30093, 43707) 3472.7885 2010 36799 (29409, 44189) 3770.4339 2011 36699 (28778, 44620) 4041.1124 2012 36599 (28191, 45007) 4290.0244 34
Kod : Modell År Prognos Konfidensintervall (95%) s.e 115 : 1 2003 26242 (24612, 27872) 831.633 2004 26669 (25000, 28338) 851.531 2005 27158 (25502, 28815) 844.898 2006 27619 (25980, 29257) 836.224 2007 28060 (26414, 29707) 839.796 2008 28488 (26703, 30272) 910.714 2009 28906 (27011, 30802) 966.837 2010 29318 (27455, 31180) 950.51 2011 29725 (27919, 31532) 921.429 2012 30129 (28361, 31897) 902.041 115 : 2 2003 26058 (25698, 26418) 183.7068 2004 26258 (25524, 26992) 374.6499 2005 26349 (25140, 27558) 616.7249 2006 26345 (24705, 27985) 836.7952 2007 26281 (24120, 28442) 1102.7618 2008 26225 (23469, 28981) 1406.1803 2009 26163 (22811, 29515) 1710.1955 2010 26101 (22251, 29951) 1964.2805 2011 26040 (21756, 30324) 2185.9624 2012 25979 (21306, 30652) 2384.338 35
12 Bilaga 5: Resultat från multivariat tidsserieanalys på kommun 114 och 115 Med trend Koeff. Prognos 2003 ar(1) bef114 : 1.19179 bef114 : 37006 bef115 : 0.8233 bef115 : 26481 bef114&bef115 : 0.2203 bef115&bef114 : 0.06956 ar(2) bef 114 : 0.3896 bef 115 : 0.06537 bef114&bef115 : 0.11056 bef115&bef114 : 0.1094 Utan trend Koeff. Prognos 2003 ar(1) bef114 : 0.9938 bef114 : 36239 bef115 : 0.7762 bef115 : 25024 bef114&bef115 : 0.1796 bef115&bef114 : 0.1024 36
13 Bilaga 6: Regressionsmodeller Kod Coef Est s.e p R 2 F-stat 114 Intercept 295025.81 23162.21 1.91e 09 0.9317 3.803e 10 t>1985 t 166.11 11.62 3.80e 10 115 Intercept 8.062e +05 1.406e +04 < 2e 16 0.9905 < 2.2e 16 t 1968 t 4.159e +02 7.081e +00 < 2e 16 117 Intercept 1.019e +06 3.800e +04 2.38e 15 0.9782 1.443e 15 t>1983 t 5.268e +02 1.907e +01 1.44e 15 120 Intercept 1687648.1 35546.8 4.09e 12 0.9962 3.517e 12 t>1991 t 859.4 17.8 3.52e 12 123 Intercept 765873.27 21742.76 8.07e 12 0.9931 3.854e 12 t>1990 t 413.22 10.89 3.85e 12 125 Intercept 717135.6 26118.5 6.90e 15 0.9803 4.477e 15 t>1984 t 369.8 13.1 4.48e 15 126 Intercept 2.308e +06 8.132e +04 6.85e 11 0.9885 4.896e 11 t>1990 t 1.196e +03 4.073e +01 4.90e 11 127 Intercept 4.662e +07 1.741e +07 0.0159 0.9572 2.344e 12 t>1982 t 4.716e +04 1.748e +04 0.0152 t 2 1.194e +01 4.386e +00 0.0145 128 Intercept 1.881e +05 1.534e +04 3.21e 09 0.9197 1.282e 09 t>1985 t 1.008e +02 7.692e +00 1.28e 09 136 Intercept 1.520e +06 4.380e +04 5.20e 10 0.9939 3.679e 10 t>1992 t 7.948e +02 2.193e +01 3.68e 10 138 Intercept 818728.06 22165.27 < 2e 16 0.9867 < 2.2e 16 t>1980 t 428.73 11.13 < 2e 16 139 Intercept 2.937e +05 1.060e +04 3.10e 09 0.991 1.819e 09 t>1992 t 1.573e +02 5.306e +00 1.82e 09 Tabell 6: Regressionsmodeller. Under kommunens kod står från vilken tid t som modellen gäller. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 37
Kod Coef Est s.e p R 2 F-stat 140181 Intercept 1.761e +06 1.310e +05 4.08e 05 0.9754 3.243e 05 t>1995 t 9.234e +02 6.554e +01 3.24e 05 160 Intercept 6.895e +07 8.187e +06 1.27e 09 0.9832 < 2.2e 16 t 1968 t 6.873e +04 8.249e +03 1.61e 09 t 2 1.711e +01 2.078e +00 2.09e 09 162 Intercept 347540.95 44163.16 2.52e 05 0.8899 1.324e 05 t>1991 t 188.59 22.11 1.32e 05 163 Intercept 1.222e +06 2.425e +04 < 2e 16 0.9935 < 2.2e 16 t>1982 t 6.398e +02 1.217e +01 < 2e 16 180 Intercept 6.943e +08 2.039e +08 0.00780 0.9963 1.182e 11 t>1990 t 6.886e +05 2.042e +05 0.00824 t 2 1.705e +02 5.115e +01 0.00874 182 Intercept 1.969e +06 3.768e +04 < 2e 16 0.9939 < 2.2e 16 t>1982 t 1.022e +03 1.891e +01 < 2e 16 183 Intercept 659884.85 37956.41 3.11e 08 0.9737 2.041e 08 t>1991 t 346.72 19.01 2.04e 08 184 Intercept 8.765e +05 1.160e +04 < 2e 16 0.9975 < 2.2e 16 t>1984 t 4.666e +02 5.818e +00 < 2e 16 186 Intercept 587997.01 30361.93 2.94e 09 0.9771 1.554e 09 t>1990 t 314.35 15.21 1.55e 09 187 Intercept 405960.06 17862.11 8.09e 08 0.9872 6.972e 08 t>1993 t 207.58 8.94 6.97e 08 188 Intercept 894191.24 29319.64 1.05e 08 0.9933 7.11e 09 t>1993 t 473.43 14.67 7.11e 09 191 Intercept 7.405e +05 1.388e +04 < 2e 16 0.9946 < 2.2e 16 t>1983 t 3.878e +02 6.962e +00 < 2e 16 192 Intercept 3.515e +05 7.078e +03 < 2e 16 0.9882 < 2.2e 16 t 1968 t 1.877e +02 3.566e +00 < 2e 16 Tabell 7: Regressionsmodeller. Under kommunens kod står från vilken tid t som modellen gäller. Signifikanskoder enligt: 0 ***, 0.001 **, 0.01 *, 0.05. 38
14 Bilaga 7: Resultat av regressionsprognoser med linjär och kvadratisk extrapolation Kod År Prognos Konfidensintervall (95%) s.e 114 2003 37693 (37132, 38254) 119.0277 2004 37859 (37288, 38430) 129.3494 2005 38025 (37443, 38608) 139.8742 2006 38191 (37597, 38786) 150.5595 2007 38358 (37751, 38965) 161.3735 2008 38524 (37903, 39144) 172.2919 2009 38690 (38055, 39324) 183.2961 2010 38856 (38206, 39505) 194.3715 2011 39022 (38357, 39687) 205.5066 2012 39188 (38507, 39869) 216.6921 115 2003 26876 (25966, 27787) 146.15 2004 27292 (26377, 28207) 152.3648 2005 27708 (26789, 28628) 158.6522 2006 28124 (27200, 29048) 165.0038 2007 28540 (27611, 29469) 171.4127 2008 28956 (28022, 29890) 177.8725 2009 29372 (28433, 30311) 184.378 2010 29788 (28844, 30732) 190.9244 2011 30204 (29254, 31154) 197.5077 2012 30620 (29664, 31575) 204.1243 39
Kod År Prognos Konfidensintervall (95%) s.e 117 2003 36342 (35277, 37406) 217.4161 2004 36868 (35788, 37949) 234.3195 2005 37395 (36298, 38493) 251.5328 2006 37922 (36806, 39038) 268.9965 2007 38449 (37314, 39584) 286.6647 2008 38976 (37820, 40131) 304.502 2009 39503 (38326, 40680) 322.4802 2010 40029 (38830, 41229) 340.5771 2011 40556 (39333, 41779) 358.7746 2012 41083 (39836, 42330) 377.0582 120 2003 33657 (33154, 34160) 120.726 2004 34517 (33993, 35040) 136.725 2005 35376 (34830, 35922) 153.1221 2006 36235 (35664, 36806) 169.8019 2007 37095 (36497, 37692) 186.6888 2008 37954 (37329, 38579) 203.7312 2009 38813 (38159, 39468) 220.8932 2010 39673 (38988, 40357) 238.1488 2011 40532 (39816, 41248) 255.4792 2012 41392 (40644, 42139) 272.87 123 2003 61814 (61473, 62155) 80.15133 2004 62227 (61875, 62580) 89.91471 2005 62640 (62275, 63006) 99.91134 2006 63054 (62674, 63434) 110.07769 2007 63467 (63072, 63862) 120.37078 2008 63880 (63469, 64291) 130.76067 2009 64293 (63865, 64721) 141.226 2010 64707 (64261, 65152) 151.75117 2011 65120 (64656, 65583) 162.32453 2012 65533 (65051, 66015) 172.93725 125 2003 23538 (22857, 24219) 141.8184 2004 23908 (23215, 24601) 153.4458 2005 24278 (23573, 24982) 165.2939 2006 24648 (23930, 25365) 177.3184 2007 25017 (24286, 25749) 189.4859 2008 25387 (24641, 26133) 201.7704 2009 25757 (24995, 26518) 214.1518 2010 26127 (25349, 26904) 226.6143 2011 26496 (25702, 27291) 239.1451 2012 26866 (26055, 27678) 251.734 40
Kod År Prognos Konfidensintervall (95%) s.e 126 2003 87618 (86344, 88893) 299.7806 2004 88815 (87496, 90133) 336.2974 2005 90011 (88643, 91379) 373.6866 2006 91207 (89786, 92628) 411.7107 2007 92403 (90925, 93881) 450.2087 2008 93599 (92061, 95137) 489.0688 2009 94795 (93194, 96396) 528.211 2010 95991 (94325, 97658) 567.5771 2011 97187 (95453, 98922) 607.1234 2012 98383 (96579, 100187) 646.8169 127 2003 75016 (73488, 76544) 432.3801 2004 75714 (74066, 77362) 522.13 2005 76435 (74639, 78232) 622.3461 2006 77181 (75208, 79154) 732.515 2007 77950 (75774, 80127) 852.2985 2008 78744 (76337, 81150) 981.4697 2009 79561 (76899, 82223) 1119.8723 2010 80402 (77460, 83344) 1267.3968 2011 81267 (78022, 84512) 1423.9641 2012 82156 (78585, 85726) 1589.5166 128 2003 13850 (13479, 14221) 78.81489 2004 13951 (13573, 14329) 85.64943 2005 14051 (13666, 14437) 92.61848 2006 14152 (13759, 14546) 99.69383 2007 14253 (13851, 14655) 106.85437 2008 14354 (13943, 14765) 114.08406 2009 14455 (14035, 14875) 121.37055 2010 14556 (14126, 14986) 128.70418 2011 14656 (14216, 15097) 136.07734 2012 14757 (14306, 15208) 143.48393 136 2003 71820 (71264, 72377) 136.065 2004 72615 (72032, 73198) 155.8339 2005 73410 (72797, 74023) 176.1149 2006 74205 (73559, 74850) 196.7497 2007 75000 (74319, 75680) 217.6378 2008 75794 (75078, 76511) 238.7126 2009 76589 (75834, 77344) 259.9288 2010 77384 (76589, 78179) 281.2543 2011 78179 (77343, 79014) 302.666 2012 78974 (78096, 79851) 324.1469 41
Kod År Prognos Konfidensintervall (95%) s.e 138 2003 40016 (39261, 40771) 146.179 2004 40445 (39681, 41208) 156.0169 2005 40874 (40101, 41646) 166.0181 2006 41302 (40520, 42085) 176.1547 2007 41731 (40938, 42524) 186.4047 2008 42160 (41356, 42963) 196.7503 2009 42588 (41774, 43403) 207.1773 2010 43017 (42190, 43844) 217.6738 2011 43446 (42607, 44285) 228.2304 2012 43875 (43023, 44726) 238.839 139 2003 21334 (21200, 21469) 32.9259 2004 21492 (21351, 21633) 37.70969 2005 21649 (21501, 21798) 42.61742 2006 21806 (21650, 21962) 47.61077 2007 21964 (21799, 22128) 52.6654 2008 22121 (21947, 22294) 57.76522 2009 22278 (22095, 22461) 62.89924 2010 22435 (22243, 22628) 68.05973 2011 22593 (22391, 22795) 73.24108 2012 22750 (22538, 22962) 78.43917 140181 2003 88589 (87422, 89756) 293.1148 2004 89513 (88240, 90785) 352.9569 2005 90436 (89047, 91825) 414.5269 2006 91359 (89843, 92876) 414.5269 2007 92283 (90632, 93933) 540.4769 2008 93206 (91415, 94997) 604.2716 2009 94129 (92194, 96065) 668.4045 2010 95053 (92969, 97137) 732.7869 2011 95976 (93741, 98211) 797.3584 2012 96899 (94511, 99288) 862.0764 160 2003 61413 (58823, 64003) 602.0495 2004 61577 (58916, 64238) 672.5302 2005 61707 (58964, 64451) 748.1856 2006 61803 (58965, 64641) 828.8177 2007 61865 (58920, 64810) 914.2711 2008 61892 (58828, 64957) 1004.4244 2009 61886 (58689, 65082) 1099.1815 2010 61845 (58503, 65186) 1198.4663 2011 61770 (58271, 65268) 1302.2177 2012 61660 (57992, 65329) 1410.3867 42
Kod År Prognos Konfidensintervall (95%) s.e 162 2003 30207 (29582, 30831) 149.9894 2004 30395 (29745, 31046) 169.8664 2005 30584 (29905, 31262) 190.2381 2006 30772 (30063, 31482) 210.961 2007 30961 (30219, 31703) 231.9412 2008 31150 (30373, 31926) 253.1146 2009 31338 (30525, 32151) 274.4365 2010 31527 (30676, 32377) 295.8749 2011 31715 (30826, 32605) 317.406 2012 31904 (30975, 32833) 339.0123 163 2003 59766 (59039, 60493) 145.7734 2004 60405 (59669, 61143) 156.5494 2005 61046 (60298, 61793) 167.5163 2006 61685 (60927, 62444) 178.6389 2007 62325 (61555, 63096) 189.8899 2008 62965 (62182, 63748) 201.2478 2009 63605 (62808, 64401) 212.6954 2010 64245 (63434, 65055) 224.2189 2011 64884 (64060, 65709) 235.8074 2012 65524 (64684, 66364) 247.4515 180 2003 766233 (760155, 772312) 1931.165 2004 771489 (764230, 778748) 2608.772 2005 776404 (767623, 785185) 3402.512 2006 780978 (770358, 791597) 4306.488 2007 785210 (772460, 797961) 5317.61 2008 789102 (773945, 804258) 6434.152 2009 792652 (774827, 810478) 7655.093 2010 795862 (775113, 816610) 8979.798 2011 798730 (774809, 822651) 10407.854 2012 801257 (773921, 828594) 11938.985 182 2003 77904 (76774, 79033) 226.5324 2004 78926 (77781, 80071) 243.2784 2005 79948 (78786, 81109) 260.3209 2006 80970 (79791, 82149) 277.6055 2007 81992 (80794, 83189) 295.0896 2008 83014 (81797, 84231) 312.7398 2009 84036 (82798, 85273) 330.5294 2010 85058 (83799, 86317) 348.4371 2011 86080 (84798, 87361) 366.4455 2012 87102 (85797, 88406) 384.5406 43