ANALYS AV FINSKA DATA

Relevanta dokument
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Multipel Regressionsmodellen

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

InStat Exempel 4 Korrelation och Regression

Bolånetagarnas amorteringar har ökat sedan införandet av individuella amorteringsplaner

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Dekomponering av löneskillnader

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Linjär regressionsanalys. Wieland Wermke

2.1 Minitab-introduktion

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Laboration 3: Enkel linjär regression och korrelationsanalys

ÖVNINGSUPPGIFTER KAPITEL 4

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Appendix 2. Kommentar från Lars E.O. Svensson

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Ledtidsanpassa standardavvikelser för efterfrågevariationer

16. Max 2/0/ Max 3/0/0

Skrivning i ekonometri torsdagen den 8 februari 2007

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat?

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Sänkningen av parasitnivåerna i blodet

F13 Regression och problemlösning

OBS! Vi har nya rutiner.

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

oberoende av varandra så observationerna är

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning G60 Statistiska metoder

Samhällsekonomisk analys och underhåll förklarat på ett enklare sätt

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Kompletterande information om nyttan av väg- och järnvägsinvesteringar

Ränteberäkning vid reglering av monopolverksamhet

Känslighetsanalys för nuvärdeskalkyl för vindkraft för Sundbyberg stad

Föreläsning 12: Regression

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Anläggningskostnader för järnvägar i Sverige

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Medicinsk statistik II

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Banavgifter och nationalekonomi. Roger Pyddoke

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Resursfördelningsmodellen

Regressions- och Tidsserieanalys - F8

Tisdagen den 16 januari

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Mer om slumpvariabler

TVM-Matematik Adam Jonsson

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Vad Betyder måtten MAPE, MAD och MSD?

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

3. Hur snabbt förändras diametern av en cirkel med avseende på cirkelns area?

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen Metod C vid Uppsala universitet, , kl

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Sannolikhetsteori. Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Del A: Digitala verktyg är inte tillåtna. Endast svar krävs. Skriv dina svar direkt på provpappret.

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Perspektiv på den låga inflationen

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Regressions- och Tidsserieanalys - F7

Reglermässiga avskrivningstider vid beräkning av intäktsram för naturgasföretagen avseende tillsynsperioden

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

F11. Kvantitativa prognostekniker

Läs noggrant informationen nedan innan du börjar skriva tentamen

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Effekter internalisering av de olika transportslagens externa kostnader. Per Kågeson Bil Sweden

Finansiell profil Falköpings kommun

Bilaga 1. Kvantitativ analys

Uppgift 1. Deskripitiv statistik. Lön

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

TAMS65 - Seminarium 4 Regressionsanalys

Tentamen Tillämpad statistik A5 (15hp)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Busskostnader Samkalk 1

Nedan redovisas vilka kalkylvärden/parametrar som studerats samt kommentarer till genomförda beräkningar och resultat.

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Har förändringar i sammansättning av sysselsättningen bromsat löneökningstakten?

Innehåll. Standardavvikelse... 3 Betarisk... 3 Value at Risk... 4 Risknivån i strukturerade produkter... 4

Transkript:

Per Johansson Jan-Eric Nilsson 2001-01-08 ANALYS AV FINSKA DATA INLEDNING OCH SAMMANFATTNING På begäran av Banverket har vi genomfört en preliminär analys av ett finskt datamaterial avseende banunderhållskostnader som ställts till vårt förfogande. Nedan följer mycket kort några observationer som kan göras med utgångspunkt från denna förberedande genomgång. Vi kan, för det första, se att den modell som skattas tycks sammanfalla i de två länderna. I båda fallen är en translogfunktion skattad på en sammanslagning av de tre årens observationer det bästa sättet att förklara variationen i kostnadsdata. För det andra är den koefficient som anger med hur många procent som kostnaderna ökar för en viss procentuell förändring av trafikens omfattning 0,17 i Sverige och 0,07 i det finska materialet. Denna koefficient används för att beräkna marginalkostnaden och vi finner att marginalkostnaden i Sverige är ca 0,1 öre, medan den i Finland är ca 0,03 öre per bruttononkm. Sammantaget innebär detta en klar parallellitet i de två materialen. Likheten blir ännu större om man skulle nöja sig med att jämföra svenska huvudbanor med den del av det finska nätet som är elektrifierat. Man kan därför säga att ett försök att förstå hur kostnader för drift och underhåll av järnväg varierar med exogena parametrar i det ena landet i princip kan föras över också till det andra landet, åtminstone vad gäller huvuddelarna av respektive lands banor. En återkommande kritik av den typ av analys som representeras av ovanstående resultat har varit att man riskerar att tappa bort kopplingarna till branschens reinvesteringar och nyinvesteringar. Kanske, menar man, är marginalkostnaden större än vad som framgår av en analys av samband mellan trafikens omfattning å den ena sidan och enbart drift- och underhållskostnader å den andra. Svenska kostnadsdata har inte medgett en analys av denna fråga. Genom att det finska materialet också omfattar dessa andra kostnadskomponenter har en sådan analys nu blivit möjlig att göra; detta utgör den tredje komponenten i vår analys. Resultaten pekar också på att marginalkostnaden stiger när den kostnadsmassa som utsätts för analys tillförs också (re-) investeringskostnader. Det är emellertid för tidigt att på grundval av denna preliminära analys uttala sig om vilket av de olika måtten på marginalkostnad som bör ligga till grund för prissättningsrekommendationer. Man bör avslutningsvis också påpeka att de resultat som redovisats baseras på en analys av endast tre års kostnadsdata, såväl i Sverige som i Finland. Om dessa år på något systematiskt sätt avviker från vad som skulle kunna vara ett 'genomsnittligt' år kan resultaten av en längre tidsperiod också avvika från vad som här sägs. Problemet förstärks av att svenska data inte omfattar re- och nyinvesteringskostnader.

2 DATAMATERIALET Det finska materialet omfattar banunderhållskostnader för en period av tre år, 1997--99. I ett första steg av analysen har vi studerat enbart de variabla kostnaderna, det vill säga en kostnadsmassa som i allt väsentligt sammanfaller med den definition av kostnader som tidigare använts i den svenska studien. Vi har därefter separat undersökt vad som händer med resultaten om man lägger till ytterligare tre kostnadskomponenter; 'Minor repairs', exempelvis utbyte av enskilda sliprar och räler; enligt det finska synsättet är detta mer av ersättningsinvesteringar är ordinarie underhåll. Om denna komponent ingår i det som i Sverige betecknas som drift och underhåll borde man - för att åstadkomma bästa tänkbara jämförbarhet - överväga att infoga denna komponent i de 'rena' kostnaderna för att ta omhand banan. Reinvesteringar. Nyinvesteringar. Uppgifter om de senare två alternativt tre (se ovan) kategorierna fanns inte tillgängliga i det svenska materialet varför inga direkta jämförelser kan göras i denna del av analysen. För vart och ett av de tre åren finns i den finska analysen 108, 106 respektive 104 observationer och man tycks kunna tolka den minsta observationen 'bandel' på motsvarande sätt som i det svenska materialet. Bandel 102 saknar för år 1999 viss information, och en annan observation (bandel 103 år 1998) avviker på ett iögonfallande sätt från det övriga materialet; dessa observationer har plockats bort men i övrigt används samtlig information. I det svenska materialet saknades uppgifter om trafikens omfattning inne på stationer. Man kan tolka det finska materialet som att såväl kostnadsmassa som trafikuppgifter också omfattar stationer. Om detta är korrekt så skulle det finnas en viss diskrepans länderna emellan i detta avseende. Förutom kostnader omfattar det finska materialet information om följande förhållanden: Spårlängd; jag tolkar det finska materialet som att detta är samma mått som i Sverige, något som bland annat innebär att spårlängd banlängd vid (partiella) dubbelspår. Man har också uppgift om spårlängd inklusive sidospår och växlingsspår; min tolkning är att vi inte har tillgång till dessa uppgifter i det svenska materialet. Bruttoton per bandel; här finns separat information för godstrafik, kortdistant trafik (antagligen pendeltåg) och (övrig) persontrafik, men vi använder det sammanlagda värdet (samma som i den svenska studien). Antal växlar per bandel (samma som i den svenska studien). Index 1-6 för underhållsnivå; detta uttrycker myndighetens ambitionsnivå vad gäller omfattningen av underhållet. Denna uppgift finns inte tillgänglig i det svenska materialet. Vi har valt att inte använda denna indexvariabel då det eventuellt kan uppstå kollinearitet med trafikuppgiften, åtminstone om ambitionsnivån åtminstone delvis samvarierar med trafikens omfattning. En

3 jämförelse av koefficienter med och utan Index pekar dock på mycket små effekter. En dummyvariabel som anger om banan är elektrifierad eller ej. En angivelse av 'hastighet', sannolikt (genomsnittligt) sth för gods-, pendelrespektive övriga resandetåg. Hastighet kan eventuellt utgöra en proxy för banans standard; ju högre hastighet, desto bättre måste linjeföringen vara och inte heller får underhållet underskrida vissa miniminivåer. Man har däremot inga uppgifter om i vilka distrikt (motsvarande) som bandelarna ligger; detta har dock mindre betydelse för en analys som primärt syftar till att beräkna slitagekostnader. ANALYSEN; SVENSK OMARBETNING Man bör inledningsvis påpeka att vi ytterligare bearbetat det svenska materialet jämfört med det arbete som redovisades för något år sedan. Den viktigaste förändringen är att de tre årens observationer slagits samman och nu hanteras med hjälp av en enda regression. En konsekvens är att den kostnadsfunktion som används för att karaktärisera sambandet mellan underhållskostnader å ena sidan och olika förklaringsfaktorer å den andra har förändrats. I stället för att skatta tre ekvationer som är linjära med avseende på logaritmerade värden för vart och ett av åren skattar vi nu en enda ekvation som också innefattar andra ordningens effekter. Som en följd av detta är kostnadselasticiteterna med avseende på trafik och banlängd inte längre konstant. Detta får också effekter för skattningen av marginalkostnaderna; vi sammanfattar detta i Tabell 1a och 1b nedan. Tabell 1a; skattade koefficienter/elasticiteter för kostnader med avseende på trafik med tidigare respektive nuvarande modell avseende svenska data. Intervall för den tidigare skattningen beror på att det finns observationer från tre olika år. Tidigare skattning Ny skattning Genomsnitt 0,17 Huvudbanor 0,13-0,28 0,14 Länsbanor 0,23-0,34 0,22 Tabell 1b; beräknade marginalkostnader med tidigare respektive nuvarande modell avseende svenska data. Öre per bruttotonkm, prisnivå 1997. Intervall för den tidigare skattningen beror på att det finns observationer från tre olika år. Tidigare skattning Ny skattning Genomsnitt 0,30-0,35 0,1 Huvudbanor 0,12-0,29 0,01 Länsbanor 1,34-2,00 0,74 Som framgår av Tabell 1a ligger elasticiteten i samma storleksordning som i den tidigare skattningen. Däremot sjunker den beräknade marginalkostnaden. Detta beror på att

4 bandelar med mycket trafik har låga elasticiteter, lägre än tidigare. Dessa bandelar väger nu relativt sett tyngre i kostnadsanalysen än tidigare. ANALYSEN; FINSKA DATA En första analys av det finska materialet pekar på att man - på samma sätt som i nybearbetningen av det svenska materialet - kan aggregera de tre årens observationer och ansätta en enda regressionsekvation. Dessutom är ekvationsformen densamma som i Sverige, d v s en translog funktion. Vi kan därför redovisa skattade elasticiteter och marginalkostnader på samma sätt som angavs i ovanstående tabeller (jfr även Bilaga). Tabell 2a; skattade koefficienter/elasticiteter (standardavvikelse) för det finska materialet. Samtliga banor 0,071 (0,0055) Elektrifierade banor 0,088 (0,0092) Icke elektrifierade banor 0,058 (0,0066) Tabell 2b; beräknade marginalkostnader för det finska materialet. Penny respektive öre per bruttotonkm; antagen växelkurs 1,45. Penny/brtkm Öre/brtkm Genomsnitt 0,02 0,03 Elektrifierade banor 0,019 0,028 Icke elektrifierade banor 0,027 0,039 Vi kan se att den svenska kostnaden (Tabell 1b) är ca tre gånger högre än den finska. ANALYS; (RE-)INVESTERINGSKOSTNADER Genom att utgå från ovanstående resultat (=skattning 1) och lägga till först 'smärre åtgärder' (=skattning 2) och sedan också reinvesteringar (=skattning 3) och nyinvesteringar (=skattning 4) får man en bild av i vilken utsträckning som de två senare kostnadskategorierna betingas av trafikens omfattning. Omvänt kan vi därför se om beräkningen av trafikens marginalkostnader förändras när denna kostnadsmassa tillkommer. Som framgår av tabellen så blir marginalkostnaden väsentligt högre om man infogar (re-) investeringar i kostnadsmassan. Det återstår att ytterligare analysera detta resultat för att bättre kunna förklara effekten och för att klargöra huruvida man ska låta resultatet ligga till grund för att beräkna (marginella) slitagekostnader. Det finns flera problem att behandla: Tabell 3: Elasticitet och marginalkostnad (penni per bruttotonkm) för fyra olika mått på kostnadsmassan, standardavvikelse i parantes. Genomsnittlig elasticitet Genomsnittlig marginalkostnad Skattning 1 0,07 (0,005) 0,02 (0,002)

5 Skattning 2 0,03 (0,005) 0,007 (0,003) Skattning 3 0,34 (0,005) 0,33 (0,008) Skattning 4 0,45 (0,005) 0,62 (0,011) Resultatet ovan baseras på en statistiskt säkerställd koppling mellan kostnader och trafik; ju mer trafik, desto högre kostnader; och ju större kostnadsmassa, desto starkare är sambandet. Frågan är likafullt om man i den kortsiktiga marginalkostnaden ska inkludera konsekvenser av trafikvariationer som faller ut i form av högre investeringsvolym. Annorlunda uttryckt kan man säga att (mer) trafik med nödvändighet ger ett (ökat) behov av drift och underhåll. Men mer trafik kan också göra det lämpligt att investera mer. Detta kräver dock ett separat beslut, det vill säga att en större trafikmängd är en nödvändig men inte tillräcklig förutsättning för att genomföra en investering. Reinvesteringar befinner sig i en gråzon mellan drift och underhåll å ena sidan och investeringar å den andra. Om man bestämt sig för att hålla en bana öppen så måste en viss trafikökning betyda att tidpunkten för reinvesteringen skjuts framåt i tiden; om inte, så kan reinvesteringen behandlas som en nyinvestering med omvända förtecken. 1 Resultaten i såväl den finska som den svenska studien avser endast tre år. Alla resultat måste därför tolkas med stor försiktighet, inte minst med tanke på att det är svårt att veta om de tre årens observationer på något rimligt sätt kan sägas representera ett generellt mönster eller om det under just dessa år har inträffat exceptionella händelser. 1 Preliminärt skulle detta kunna hanteras genom att betrakta reinvesteringar på länsbanor som synonyma med nyinvesteringar och inte inkludera dem I analysen medan reinvesteringar på huvudnätet - som då antas ha en mycket lång kvarvarande livslängd - ska utgöra en del av slitagekostnaden.

6 BILAGA SKATTNINGSRESULTAT Skattning 1: Grundmodellen Value Std. Error t value Pr(> t ) (Intercept) 8.460 1.402 6.034 0.000 YEAR98-0.129 0.056-2.297 0.022 YEAR99-0.135 0.056-2.390 0.017 LNY 1.506 0.376 3.999 0.000 LNTRAF1 0.150 0.138 1.087 0.278 I(LNTRAF1 * LNY) -0.056 0.019-2.893 0.004 I(LNY^2) -0.020 0.025-0.797 0.426 I(LNTRAF1^2) 0.004 0.005 0.914 0.362 VAXEL 0.015 0.002 6.275 0.000 I(VAXEL^2) 0.000 0.000-1.067 0.287 EL 0.281 0.074 3.801 0.000 SPEED 0.004 0.004 0.998 0.319 I(SPEED^2) 0.000 0.000-1.237 0.217 Residual standard error: 0.409 on 304 degrees of freedom Multiple R-Squared: 0.766 F-statistic: 83.1 on 12 and 304 degrees of freedom, the p-value is 0 Skattning 2 Ovanstående kostnader plus samtliga 'reinvesteringar' Value Std. Error t value Pr(> t ) (Intercept) 8.458 1.402 6.032 0.000 YEAR98-0.129 0.056-2.297 0.022 YEAR99-0.135 0.056-2.389 0.018 LNY 1.506 0.376 3.999 0.000 LNTRAF1 0.150 0.138 1.090 0.277 I(LNTRAF1 * LNY) -0.055 0.019-2.892 0.004 I(LNY^2) -0.020 0.025-0.799 0.425 I(LNTRAF1^2) 0.004 0.005 0.910 0.364 VAXEL 0.015 0.002 6.274 0.000 I(VAXEL^2) 0.000 0.000-1.066 0.287 EL 0.281 0.074 3.800 0.000 SPEED 0.004 0.004 0.997 0.320 I(SPEED^2) 0.000 0.000-1.237 0.217 Residual standard error: 0.409 on 304 degrees of freedom Multiple R-Squared: 0.766 F-statistic: 83.1 on 12 and 304 degrees of freedom, the p-value is 0

7 Skattning 3 Ovanstående kostnader plus också samtliga nyinvesteringar Value Std. Error t value Pr(> t ) (Intercept) 8.455 1.399 6.045 0.000 YEAR98-0.127 0.056-2.278 0.023 YEAR99-0.137 0.056-2.434 0.015 LNY 1.513 0.376 4.030 0.000 LNTRAF1 0.148 0.138 1.076 0.283 I(LNTRAF1 * LNY) -0.056 0.019-2.904 0.004 I(LNY^2) -0.021 0.025-0.836 0.404 I(LNTRAF1^2) 0.004 0.005 0.943 0.347 VAXEL 0.015 0.002 6.264 0.000 I(VAXEL^2) 0.000 0.000-1.048 0.296 EL 0.277 0.074 3.759 0.000 SPEED 0.004 0.004 0.987 0.324 I(SPEED^2) 0.000 0.000-1.205 0.229 Residual standard error: 0.408 on 304 degrees of freedom Multiple R-Squared: 0.767 F-statistic: 83.6 on 12 and 304 degrees of freedom, the p-value is 0