Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson

Relevanta dokument
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

TENTAMEN I STATISTIK B,

10.1 Enkel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F1

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F7

Statistik B Regressions- och tidsserieanalys Föreläsning 1

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Grundläggande matematisk statistik

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Examinationsuppgifter del 2

Vad Betyder måtten MAPE, MAD och MSD?

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Analys av egen tidsserie

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Metod och teori. Statistik för naturvetare Umeå universitet

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Regressions- och Tidsserieanalys - F8

Laboration 2 multipel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

7.5 Experiment with a single factor having more than two levels

TENTAMEN I MATEMATISK STATISTIK

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Skrivning i ekonometri lördagen den 25 augusti 2007

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Lösningar till SPSS-övning: Analytisk statistik

Föreläsning 12: Repetition

Skrivning i ekonometri torsdagen den 8 februari 2007

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

F11. Kvantitativa prognostekniker

Regressions- och Tidsserieanalys - F3

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Skrivning i ekonometri lördagen den 29 mars 2008

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

FACIT (korrekta svar i röd fetstil)

Statistiska metoder för säkerhetsanalys

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen Tillämpad statistik A5 (15hp)

Exempel 1 på multipelregression

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Föreläsning 12: Regression

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Tentamen Tillämpad statistik A5 (15hp)

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen i matematisk statistik

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

F7 Polynomregression och Dummyvariabler

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen i Matematisk statistik Kurskod S0001M

Något om val mellan olika metoder

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Exempel 1 på multipelregression

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Matematisk statistik för B, K, N, BME och Kemister

Regressions- och Tidsserieanalys - F4

Finansiell statistik

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Multipel Regressionsmodellen

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Tentamen MVE302 Sannolikhet och statistik

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Repetition 2, inför tentamen

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

sociology Unit B1: Introduction to correlation and regression 3/3 Brendan Halpin May

Tentamen i Matematisk statistik Kurskod S0001M

Strålsäkerhetsmyndigheten Stockholm

Samhällsvetenskaplig metod, 7,5 hp

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Transkript:

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson Det framtida medlemsantalet i svenska kyrkan tycks vara intressant för många, då det regelbundet diskuteras i olika sammanhang. Att kyrkans medlemsantal minskar är väl känt, och det har utförts studier där man försökt analysera varför det förhåller sig så. En annan typ av frågeställning rör det framtida medlemsantalet. Kausala samband är ofta utomordentligt svåra att analysera med statistiska modeller. Däremot brukar det vara desto mer fruktsamt att göra ickekausala prognosmodeller, d.v.s. sådana modeller som inte analyserar varför, utan hur många. Frågan är då om man skulle kunna göra prognoser av svenska kyrkans framtida medlemsantal, med hygglig precision, och därmed få bättre underlag för ekonomiska beslut. På svenska kyrkans hemsida (http://www.svenskakyrkan.se/statistik/) finns data över medlemsantalet, dels som procent av befolkningen, dels som medlemsantal direkt. Data presenteras både i tabellform och i grafisk form. Där avslöjas genast att medlemsantal är ganska skakigt över tiden. Kanske har detta med invandring att göra, eller också finns annan orsak. Hur som helst är medlemsandelen, i procent av befolkningen, betydligt stabilare (se Figur 1 nedan). Frågan är då om man kan anpassa en prognosmodell till dessa data.

En visuell granskning avslöjar att linjen är förvånansvärt lik ett andragradspolynom. Sådana modeller brukar som regel ha autokorrelerade resttermer. Med dessa två kriterier har följande prognosmodell valts, 2 ( ) ( ) τ β0 β1 τ β2 τ φ ( T T ) pct = ˆ + ˆ t + ˆ t + ˆh pct pct (1) där 1 t = T t= 1972 ( T 1972), T h t τ = +, pct τ och pct τ är observerade resp. prognoserade andelen medlemmar (i procent av totalbefolkningen) i svenska kyrkan vid år τ. Orsaken till att modellen är uttryckt som en funktion av ( τ t ), snarare än av τ direkt, är att polynommodeller får instabila skattningar om de inte är centrerade. Se Neter [1] för vidare detaljer om polynomregression. När detta skrivs finns endast officiella data t.o.m. år 2002, dvs T = 2002. Indexet h representerar antalet år in i framtiden att prognosera. Om man t.ex. vill prognosera andelen medlemmar år 2004 blir således h = 2 och τ = 2002 + 2 = 2004. Parametrarna i (1) har estimerats med maximum likelihood metoden, se Appendix för detaljer. Skattningar av andelen medlemmar har gjorts för åren 1972-2002 (av olika skäl brukar estimering av historiska utfall kallas skattningar medan estimering av framtida utfall kallas prognoser ). Dessa presenteras tillsammans med observerade medlemsandelar 1972-2002 i Figur 2. Figur 1. i svenska kyrkan i procent av befolkning. 100 1972.00 1977.00 1982.00 1987.00 1992.00 1997.00 2002.00

100 Figur 2. samt skattad andel medlemmar. 1972.00 1982.00 1992.00 2002.00 Skattat värde Observerat värde 1977.00 1987.00 1997.00 Anpassningen av modellen till data är förvånansvärt god för åren 1972-2002. Vad det gäller de prognoserade framtida värdena kan man naturligtvis inte veta exakt. Därför presenteras de prognoserade värdena tillsammans med 95%-iga prognosintervall i Tabell 3. Lite grovt kan man säga att prognosintervall är felmarginaler, d.v.s. inom dessa gränser kan man förvänta sig att sanningen ligger. Nu skall man tänka på att detta är en statistisk modell, och den bygger på att framtiden ser ut ungefär som idag. Stora händelser i världen, landet eller i kyrkan kommer naturligtvis att förändra situationen. Men om allt rullar på ungefär som vanligt bör modellen vara riktigt hygglig. Graferna visar tydligt trenden; raskt nedåt. De senaste 10 åren har minskningen i andelen procent av befolkningen varit 0.5-1% årligen. Några separata prognoser för 2003, 2005, 2010 och 2015 presenteras i Tabell 1. Man bör vara försiktig med att göra prognoser ännu längre fram, redan tolv år är en lång prognoshorisont, men man kan med fördel uppdatera modellen för varje nytt år (och därmed en ny observation) och fortlöpande göra prognoser fem- eller tio år framåt. Rimligtvis bör linjen så småningom plana ut, och antingen lägga sig någorlunda konstant på en fix nivå, vilket är mest rimligt, eller också få formen av ett bakvänt s och fortsätta avta. Den som lever får se.

Figur 3. samt prognoserad andel medlemmar. 100 1972,00 1992,00 2012,00 Nedre progn. gräns Övre progn. gräns Progn. medlemsandel 1982,00 2002,00 Tabell 1. Punktprognoser med tillhörande prognosintervall. Nedre konfidensgräns Punktprognos Övre konfidensgräns 2003 79.8.2.5 2005 78.0 78.6 79.2 2010 73.1 74.1 75.1 2015 67.7 69.1.6 Referenslista. [1] Neter, Kutner, Nachtsheim and Wasserman, Applied Linear Regression Models, ISBN 0-256-081-X. [2] Greene, W. H. Econometric Analysis, fifth ed. ISBN 0-13-110849-2. thomas.holgersson@ihh.hj.se 2004-01-26

Appendix. Parametrarna i model (1) har preliminärt skattats med vanlig minstakvadratskattning. Ett klassiskt Box-Ljung test (Greene [2] s. 622) visar att resstermen är autokorrelerad. P-värdet för Box-Ljung testet för de fem första laggarna är väldigt små (Tabell A1). Därför har rettermen i (1) tillåtits följa en AR(1) process för att få en mer dynamisk modell (minstakvadratskattningarna är konsistenta och väntevärdesriktiga, men hypotestest och prediktionsintervall kan bli missvisande). Parametrarna har därför skattats med maximum likelihood istället (Greene [2] s. 273). Dessa finns presenterade i Tabell A2. Enligt tabell A3 är residualerna från den utökade modellen inte autokorrelerade, vilket ger förutsättningar för att beräkna prognosintervall. Tabell A1. Box-Ljung test av residualer från den preliminära modellen. Auto- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0.25.5.75 1 Box-Ljung Prob. ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú 1.2.171. ó******.***** 12.433.000 2.249.168. ó*****. 14.640.001 3.054.165. ó*. 14.747.002 4 -.203.161. ****ó. 16.329.003 5 -.298.158 ******ó. 19.871.001 Plot Symbols: Autocorrelations * Two Standard Error Limits. Tabell A2. Maximum likelihoodestimat samt ANOVA av parametrar i prognosmodellen. Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 26.1871.02230572 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1.711018.14204083 5.00573.00003310 CT -.468683.00833944-56.20078.00000000 CT2 -.010448.000839-11.50221.00000000 CONSTANT.451295.12528845 721.94440.00000000 Tabell A3. Box-Ljung test av residualer från den sekundära modellen. Autocorrelations: ERR_1 Error for PCT from AREG, MOD_6 Auto- Stand. Lag Corr. Err. -1 -.75 -.5 -.25 0.25.5.75 1 Box-Ljung Prob. ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú 1.215.171. ó****. 1.581.209 2 -.006.168. *. 1.582.453 3.120.165. ó**. 2.110.550 4 -.267.161.*****ó. 4.847.303 5 -.157.158. ***ó. 5.831.323 Plot Symbols: Autocorrelations * Two Standard Error Limits.