Marginalkostnader för reinvesteringar i järnvägsanläggningar: En delrapport inom SAMKOST 3
|
|
- Georg Eklund
- för 5 år sedan
- Visningar:
Transkript
1 Marginalkostnader för reinvesteringar i järnvägsanläggningar: En delrapport inom SAMKOST 3 Jan-Eric Nilsson Statens väg- och transportforskningsinstitut (VTI) Kristofer Odolinski Statens väg- och transportforskningsinstitut (VTI) CTS Working Paper 2018:22 Abstract Reinvesteringar i järnvägsanläggningar påverkas av trafik och utgör därför en komponent i marginalkostnaden för nyttjandet av infrastrukturen. Tidigare studier har traditionellt fokuserat på reinvesteringskostnader i banöverbyggnad. I denna studie skattas separata marginalkostnader för reinvesteringar i Bana (banöverbyggnad, banunderbyggnad, bangårdar), El, Signal, Tele och Övriga anläggningar. Trots att slitage av exempelvis signal- och teleanläggningar inte torde variera med trafik, finner vi statistiskt signifikanta samband mellan trafik och reinvesteringar i samtliga anläggningar. En förklaring är att trafikökningen innebär en ökad störningskostnad, även i frånvaron av ett trafikberoende slitage, och därmed att reinvesteringen tidigareläggs. Analysen visar även att de skattade effekterna främst kommer från jämförelser mellan bandelar, vilket innebär en risk att de (delvis) är korrelationer och inte kausala samband mellan trafik och reinvesteringar. När marginalkostnaderna för anläggningsgrupperna läggs samman hamnar de på 0,0141 kr per bruttotonkilometer och 4,4520 kr per tågkilometer. Nyckelord: reinvestering; marginalkostnad; järnväg JEL-koder: H54; L92; R48 Centre for Transport Studies SE Stockholm Sweden
2 Marginalkostnader för reinvesteringar i järnvägsanläggningar: En delrapport inom SAMKOST 3 Jan-Eric Nilsson, VTI Kristofer Odolinski, VTI Abstract Reinvesteringar i järnvägsanläggningar påverkas av trafik och utgör därför en komponent i marginalkostnaden för nyttjandet av infrastrukturen. Tidigare studier har traditionellt fokuserat på reinvesteringskostnader i banöverbyggnad. I denna studie skattas separata marginalkostnader för reinvesteringar i Bana (banöverbyggnad, banunderbyggnad, bangårdar), El, Signal, Tele och Övriga anläggningar. Trots att slitage av exempelvis signal- och teleanläggningar inte torde variera med trafik, finner vi statistiskt signifikanta samband mellan trafik och reinvesteringar i samtliga anläggningar. En förklaring är att trafikökningen innebär en ökad störningskostnad, även i frånvaron av ett trafikberoende slitage, och därmed att reinvesteringen tidigareläggs. Analysen visar även att de skattade effekterna främst kommer från jämförelser mellan bandelar, vilket innebär en risk att de (delvis) är korrelationer och inte kausala samband mellan trafik och reinvesteringar. När marginalkostnaderna för anläggningsgrupperna läggs samman hamnar de på 0,0141 kr per bruttotonkilometer och 4,4520 kr per tågkilometer. Författarna tackar Gunnar Isacsson för värdefulla kommentarer och synpunkter på en tidigare version av studien. Tack till deltagarna på granskningsseminariet på VTI, Stockholm, 12 oktober Alla återstående felaktigheter är författarnas ansvar. Författarna tackar även Anna Willershausen (Trafikverket), Vivianne Karlsson (Trafikverket), Anne-Lie Mathiesen (Trafikverket) och Anders F. Nilsson (Trafikverket) för hjälp med att leverera data och svara på våra frågor. Nyckelord: reinvestering; marginalkostnad; järnväg JEL-koder: H54; L92; R48 1
3 Sammanfattning Studier kring marginalkostnader för reinvesteringar i järnväg har traditionellt fokuserat på kostnader för banöverbyggnad (spår, slipers, växlar, befästningssystem etcetera). Alla anläggningsgrupper ingick däremot i en delstudie inom det regeringsuppdrag som VTI redovisade under hösten 2016 (SAMKOST 2); marginalkostnadsberäkningen täckte reinvesteringar i Bana (banöverbyggnad, banunderbyggnad, bangårdar), El, Signal, Tele och Övriga anläggningar. Då exempelvis signal- och teleanläggningar har ett slitage som inte torde variera med trafiken, väcktes frågan om den nya beräkningen ger en korrekt bild av sambanden. Fann studien inom SAMKOST 2 en korrelation snarare än ett kausalt samband mellan trafik och reinvesteringar i dessa anläggningar? Syftet med denna studie är att beräkna marginalkostnader för reinvesteringar i olika järnvägsanläggningar och fördjupa analysen av hur trafik påverkar reinvesteringar. Separata translogmodeller för respektive anläggningsgrupp skattas för att ta hänsyn till deras underliggande produktionsfunktion. Modellskattningarna består av två steg: Det första steget ger svar på om trafiken påverkar beslutet att reinvestera och det andra steget om trafiken påverkar storleken på reinvesteringskostnaden. När dessa steg vägs samman visar resultaten att trafik har ett statistiskt signifikant samband med samtliga anläggningsgrupper, samtidigt som det finns skillnader i huruvida trafiken påverkar de olika beslutsstegen. De skattade effekterna kommer främst från jämförelser mellan bandelar. Det innebär att det finns en risk att effekterna (delvis) är ett resultat av korrelationer mellan trafik och bandelsspecifika egenskaper, och inte (helt) kausala samband mellan trafik och reinvesteringar. Trafik har en signifikant effekt på beslutet att reinvestera i signal, tele och övriga anläggningar, men ingen signifikant effekt på storleken på reinvesteringskostnaden. Resultatet ger stöd för tolkningen att behovet av en väl fungerande anläggning ökar med trafiken (mer trafik innebär en högre störningskostnad när en anläggning fallerar) och indikerar att kostnaden för reinvesteringar i dessa anläggningsgrupper är i genomsnitt densamma för olika trafikmängder, allt annat lika. Vad gäller reinvesteringar i banöverbyggnad, banunderbyggnad och elanläggningar har trafiken däremot en signifikant effekt på båda beslutsstegen, vilket rimmar väl med att dessa anläggningsgrupper har ett slitage som varierar med trafik. Modellskattningarna har utförts med både antal bruttoton och antal tåg som trafikvariabel för att undersöka om sambanden mellan trafikmåtten och reinvesteringar varierar för olika anläggningsgrupper, samt ge en rekommendation om vilket av dessa mått som är lämpligast att använda. Det är dock endast för banöverbyggnad och elanläggningar som de aktuella elasticiteterna är signifikant skilda från varandra. Men givet att det är (främst) störningskostnaden som motiverar reinvesteringar i signal, tele och övriga anläggningar, är antal tåg det lämpligaste måttet för dessa anläggningsgrupper: Störningskostnaden torde påverkas mer av linjens kapacitetsutnyttjande snarare än tågens kapacitetsutnyttjande. När marginalkostnaderna för anläggningsgrupperna läggs samman hamnar de på 0,0141 kr/bruttotonkilometer och 4,4520 kr/tågkilometer. Jämfört med SAMKOST 2 är dessa kostnader betydligt lägre. Den främsta anledningen är att föreliggande studie har använt en retransformation i prediktionen av kostnader som tar hänsyn till feltermernas heteroskedasticitet. Det genererar predikterade kostnader som hamnar närmare de observerade kostnaderna. Därutöver ingår fler kvalitetsvariabler i denna studie, vilket påverkar kostnadselasticiteterna för trafik. 2
4 1. Bakgrund Ett effektivt nyttjande av järnvägsinfrastrukturen kan skapas av en banavgift som motsvarar marginalkostnaden för att använda systemet. Reinvesteringar i järnvägsanläggningen är en av dessa kostnader och definieras som större utbyten och upprustningar (ej uppgradering). Det finns en rad olika ekonometriska analyser av hur trafik påverkar kostnader för underhåll, dvs. kostnader för att avhjälpa och förebygga fel och defekter i anläggningen (se Johansson och Nilsson (2004), Andersson (2008), Link et al. (2008), Wheat och Smith (2008), Wheat et al. (2009), Odolinski och Nilsson (2017). Litteraturen kring marginalkostnader för reinvesteringar har inte kommit lika långt, men Andersson et al. (2012) och Andersson et al. (2016) är två signifikanta bidrag där två olika modellansatser används (se avsnitt 3). Skattningar som har utförts på svenska data har resulterat i marginalkostnader med betydande nivåskillnader. I SAMKOST 1 (Nilsson et al. (2014)) beräknades marginalkostnaden för reinvesteringar i järnvägsanläggningar uppgå till 0,009 kronor per bruttotonkilometer (kr/brtkm) medan den i SAMKOST 2 (Yarmukhamedov et al. (2016)) beräknades uppgå till 0,034 kr/brtkm. Huvudförklaringen till det nästan fyra gånger högre värdet är att beräkningen i SAMKOST 1, likt Andersson et al. (2012), enbart avsåg kostnaden för reinvesteringar i Bana (dvs. spårbyten etc.), medan beräkningen i SAMKOST 2 också inkluderade El-, Signal och Teleanläggningar (BEST) samt gruppen Övriga anläggningar. Med anledning av den stora kostnadsökningen ställdes frågan om den nya hanteringen gav en korrekt bild av sambanden; beror verkligen kostnaden för reinvesteringar inom alla anläggningsdelar på trafiken? Det är tämligen uppenbart att trafikens slitage driver reinvesteringskostnaden för Bana, men inte när det gäller övriga anläggningsdelar. Slitage av exempelvis signal- och teleanläggningar torde inte variera med trafik; kan reinvesteringskostnaden för dessa delar ändå påverkas av trafiken? Av detta skäl genomfördes en ny beräkning under vintern 2017 där kostnaderna för de olika anläggningsdelarna studerades var och en för sig (Nilsson et al. (2017)). Resultatet från den studien visade att Trafikverkets reinvesteringar i olika anläggningar, med något undantag, har ett samband med trafikens omfattning: Ju mer trafik, allt annat lika, desto oftare behöver man inte bara byta ut räls utan också el-, signal- och teleanläggningar, samt gruppen Övriga anläggningar. Den sammanlagda marginalkostnaden beräknades uppgå till 0,028 kr/brtkm, dvs. något lägre än i SAMKOST 2. Den ekonometriska analysen kan inte förklara exakt på vilket sätt trafiken påverkar reinvesteringarna, men det är rimligt att tro att trafiken inte sliter på exempelvis signalanläggningar på samma sätt som mer trafik ökar behovet av löpande underhåll och reinvesteringar i själva banan. Syftet med denna studie är att beräkna marginalkostnader för reinvesteringar i olika järnvägsanläggningar och fördjupa analysen av hur trafik påverkar reinvesteringar. I Nilsson et al. (2017) var tolkningen att sambanden mellan trafik och exempelvis signalanläggning berodde på att behovet av en väl fungerande anläggning är större ju fler tåg som trafikerar en bana och att denna mekanism skapar en koppling mellan reinvesteringar och trafik. Eftersom denna bedömning kan ha betydelse för hur resultaten ska användas, och specifikt för valet mellan att ta betalt per bruttoton- eller per tågkilometer, är detta ett exempel på en typ av frågor som kräver fördjupade diskussioner mellan ekonomer och järnvägstekniker. Inledningsvis beskrivs i avsnitt 2 den information som används och vilka skillnader i underlagsmaterial som finns jämfört med de tidigare beräkningarna. I avsnittet beskrivs även hypotesen om den kausala strukturen mellan trafik och reinvesteringar. I avsnitt 3 behandlas frågan om vilken typ av ekonometrisk modell som bör användas. Tidigare analyser av dessa frågor baseras på två olika modeller; en modell baserad på överlevnadsanalys och en så kallad tvåstegsmodell där det första steget hanterar beslutet att reinvestera och det andra steget hur stor reinvesteringskostnaden blir. En 3
5 separat delstudie inom ramen för SAMKOST 3 (Odolinski och Nilsson (2018) har systematiskt jämfört dessa olika angreppssätt och avsnittet redovisar motiven för att fortsättningsvis använda tvåstegsmodellen. Den precisa specifikationen av tvåstegsmodellen och hur marginalkostnaderna beräknas redovisas i avsnitt 4. I avsnitt 5 presenteras resultaten och slutsatserna presenteras i avsnitt Databeskrivning Det statliga järnvägsnätet består av ca spårkilometer och är indelat i ca 245 bandelar (antal bandelar varierar över åren). Information om reinvesteringskostnader, trafik och infrastrukturens egenskaper finns registrerade på dessa bandelar och ger en utgångspunkt för de ekonometriska analyserna. Reinvesteringar utgör en stor del av de totala kostnaderna för drift och underhåll. Under 2016 uppgick totala drifts-, underhålls- och reinvesteringskostnaderna till ca 10 miljarder kronor, varav reinvesteringar utgjorde ca 2,4 miljarder. Jämfört med analysen i SAMKOST 2 finns tillgång till information för två ytterligare år, vilket innebär att vi använder data över perioden Kostnader för reinvesteringar i järnvägsanläggningarna har fyrdubblats under perioden (se Figur 1). Även trafiken har ökat under , men inte i samma omfattning Tågkilometer Bruttotonkilometer Reinvesteringar Figur 1. Kostnadsindex (1999=100) för reinvesteringar (källa: Trafikverket) i 2016 års priser, deflaterat med konsumentprisindex 1, samt index (1999=100) för antal tågkilometer och bruttotonkilometer (källa: Trafikanalys) Trafikökningen i relation till ökningen i kostnader i Figur 1 bör inte tolkas som ett direkt samband. Tidigare studier (Andersson et al. (2012), Nilsson et al. (2014), Yarmukhamedov et al. (2016)) finner att en 10 procentig trafikökning innebär ca 5 procents ökning av reinvesteringskostnaderna, allt annat lika 1 Anledningen till att konsumentprisindex används är att kostnader behöver uttryckas i relation till övriga kostnader i samhället. Om ett prisindex närmare industrin används (såsom investeringsindex för banhållning) skulle förändringar i övriga kostnader i samhället sopas undan (ges mindre vikt). 4
6 (kostnadselasticiteten med avseende på trafik är alltså ca 0.5). Det betyder att när analysen har korrigerat för övriga kostnadsdrivare innebär en trafikökning sjunkande reinvesteringskostnader per bruttotonkilometer. Med andra ord finns det stora delar av reinvesteringskostnaderna som inte är (direkt) trafikberoende. Därutöver bör det nämnas att modellskattningarna endast använder reinvesteringskostnader som finns bokförda på bandelar, medan Figur 1 baseras på alla kostnader (kostnader som inte är bokförda på bandelar är troligtvis oberoende av trafikvariationer). Deskriptiv statistik över information som ingår i skattningarna presenteras i Tabell 1. En del bandelar saknar information om en eller flera av variablerna som ingår i modellskattningarna. Det innebär att dessa bandelar faller bort. Kvar blir 223 bandelar som tillsammans utgör 3434 observationer under åren Tabell 1. Bandelsdata (N=3434). Variabler Median Medelvärde Std. av. Min Max Reinvesteringskostnader, miljoner kr a Totalt Banöverbyggnad Banunderbyggnad Bangårdar El Signal Tele Övriga Ingen anläggningstyp Trafik Tågkilometer, miljoner Bruttotonkilometer, miljoner Antal tåg, tusen Antal bruttoton, tusen Infrastruktur och organisation Banlängd, kilometer Rälsvikt, medelvärde (kg per meter) Kvalitetsklass, medelvärde (0 5) b Skarvar Dummy betongsliper Dummy stationsbandel Dummy region väst Dummy region norr Dummy region mitt Dummy region syd Dummy region öst a 2016 års priser b Kvalitetsklasserna 0 till 5 anger hög till låg tillåten hastighet. Klasserna varierar oftast inom en bandel, vilket innebär att ett medelvärde används. 5
7 I datamaterialet från Trafikverket anges reinvesteringskostnader per anläggningstyp. Med hjälp av Trafikverkets styrande dokument BVS 811 (Trafikverket (2018)) har dessa kostnader kategoriserats som Banöverbyggnad, Banunderbyggnad, Bangårdar, El, Signal och Tele, samt Övriga anläggningar. För vissa av reinvesteringskostnaderna finns ingen anläggningstyp angiven och de bildar därför en egen grupp ( Ingen anläggningstyp ). Anläggningstyperna och deras koder i kostnadsdata har förändrats under åren Den indelning av anläggningstyperna som har använts redovisas i Tabell 36 och Tabell 37 i bilagan. Många bandelar har stora minusposter under vissa år. Detta representerar återbetalningar från tidigare års reinvesteringsutbetalningar som gör att den totala reinvesteringskostnaden för en anläggningsgrupp är negativ. I dessa fall har minusposterna kvittats mot tidigare års reinvesteringskostnad. 2.1 Reinvesteringsprocess och hypotes om kausal struktur Att infrastrukturförvaltaren, givet en rad olika restriktioner, försöker minimera kostnaderna för underhåll och reinvesteringar samt störningskostnader (förseningskostnader och kostnader för inställda tåg) är grundantagandet bakom vår hypotes om reinvesteringsprocessen och kausal struktur mellan trafik och reinvesteringar. Mer specifikt utgår vi från att anläggningens livscykel består av underhålls- och störningskostnader som ökar över tid (ackumulerad användning) fram till dess att en reinvestering är fördelaktig istället för att fortsätta underhålla och låta störningskostnaderna öka, dvs. låta anläggningens funktionsnivå försämras (samband mellan underhålls- och reinvesteringskostnader analyserades i Odolinski och Wheat (2018), se nästa avsnitt). En viss årlig trafik resulterar i ett visst tidsintervall mellan reinvesteringarna (allt annat lika). Ökar trafiken leder det till ökade underhålls- och störningskostnader, vilket resulterar i att reinvesteringsintervallet kortas. Figur 2 är en illustration av anläggningens livscykel och hur reinvesteringstidpunkten förändras givet en temporär trafikökning. Om ökningen i trafik är permanent dvs. den årliga trafiken hamnar på en högre nivå kommer även tidsintervallet för reinvesteringar bli kortare. Figuren illustrerar att en hög kostnadsnivå för underhåll och störningar (K H ) motsvarar en underhålls- och störningskostnad som gör det fördelaktigt att reinvestera istället för att fortsätta underhålla. En låg kostnadsnivå (K L ) uppnås direkt efter en reinvestering. Ökningen i trafik leder till en ökad reinvesteringskostnad p.g.a. en förändring i nuvärdeskostnaden när en planerad reinvestering tidigareläggs, men kan även leda till att reinvesteringen blir mer omfattande med en ny trafiksituation (sker en uppgradering definieras det dock som en nyinvestering). 6
8 Underhålls- och störningskostnad K H K L t Tid Figur 2. En temporär trafikökning (tidpunkt t ) och påverkan på reinvesteringsintervall Hypotesen om den kausala strukturen mellan trafik och reinvesteringar illustreras i Figur 3. I denna reinvesteringsprocess ingår att nedbrytning och slitage orsakar defekter och fel i anläggningen som leder till störningar i trafiken eller till ökad risk för störningar. De innebär dels att det avhjälpande underhållet och förseningskostnaderna ökar, dels ett ökat förebyggande underhåll. En ny trafiknivå innebär även att fler besiktningar utförs (se exempelvis Trafikverket (2015a), (2015b) och (2016)). Det är ett sätt att motverka störningar och kan innebära ökade underhållsinsatser för att åtgärda defekter/brister och fel som upptäcks i och med besiktningen. De ökade underhålls- och störningskostnaderna, samt antal defekter/brister och fel upptäckta vid besiktningar, motiverar reinvesteringen. En viktig del i hypotesen om den kausala strukturen är att en ökad trafik även påverkar störningar och besiktningar allt annat lika. Trots att nedbrytning och slitage av en viss anläggningstyp inte varierar med trafik kommer anläggningstypens aktuella tillförlitlighetsnivå innebära ökade störningar när trafiken ökar, dvs. fler tåg/ton blir påverkade av ett fel. En del i detta består av att anläggningen är känsligare för störningar när kapacitetsutnyttjandet ökar (se exempelvis Abril et al. (2008), Lindfeldt (2015) och Andersson et al. (2017, kap. 8, sid ). Störningskostnaderna kommer därmed att öka, vilket gör att reinvesteringen behöver tidigareläggas (se Figur 2). Som beskrevs ovan kan även fler besiktningar leda till att fler defekter och fel upptäcks, vilket kan öka sannolikheten för en reinvestering tidigareläggs jämfört med att dessa defekter/brister och fel leder till störningar som sedan motiverar en reinvestering. En marginalkostnad för reinvesteringar (och underhåll) är med andra ord inte enbart kopplad till nedbrytning och slitage som varierar med trafik. 7
9 Nedbrytning och slitage Trafik Besiktningar Reinvesteringar Störningar Figur 3. Hypotes om kausal struktur mellan trafik och reinvesteringar 3. Val av skattningsmodell 2 Som en del av arbetet med SAMKOST 3 har skillnader mellan två ekonometriska metoder och deras implikationer för skattade marginalkostnader för reinvesteringar i järnvägsspår studerats. Ansatserna beskriver reinvesteringsprocessen på delvis liknande sätt, samtidigt som det finns tydliga metodologiska skillnader. Modellen för hörnlösningar delar in reinvesteringsprocessen i två delar; först fattas beslut om att genomföra en reinvestering, därefter hur stort varje projekt ska vara. Eftersom få delar av järnvägsnätet få bandelar renoveras under ett år, innehåller en lista över de förnyelseprojekt som ska genomföras ett visst år värdet noll för reinvesteringskostnaden på flertalet bandelar. I statistiska analyser är värdet noll ofta ett uttryck för att information saknas. I det är fallet är det emellertid sanna nollor eftersom infrastrukturförvaltaren tagit ett medvetet beslut om att genomföra en reinvestering på vissa bandelar men att inte genomföra upprustningar av andra bandelar (värdet 0). Information där vi har observationer som består av nollor (ingen reinvestering) och kontinuerliga värden (reinvesteringskostnader) är inte lämpliga att analyseras med standardmodeller såsom minstakvadratmetoden då det kan innebär snedvridna resultat. Istället används det som kommit att kallas hörnlösningsmodeller som har förmåga att hantera det faktum att utfallet dvs. att reinvestera kan vara noll. Tvåstegsmodellen är en variant, där sannolikheten för att en reinvestering sker estimeras i ett första steg med en probit-modell (på delar av anläggningen som förnyas anges värdet 1), och i ett andra steg analyseras kostnaderna med hänsyn taget till det första beslutssteget (trunkerad regression). Trafik är en variabel som ingår i båda stegen, och parameterskattningarna ger därmed information om hur variabeln påverkar reinvesteringskostnaderna. Överlevnadsmodellen analyserar i stället risken för (och/eller tiden fram till) att en reinvestering ska genomföras. Syftet är att skapa en förståelse av hur anläggningarnas livslängd bland annat beror på mängden trafik på banan. Den variabel som ska förklaras är hur länge en anläggning överlever till dess att den kräver en behandling i form av en reinvestering. I analysen används en Weibull-modell för att identifiera variabler som påverkar livslängden. Modellen är flexibel med en form- och skalparameter 3 som estimeras. Formparametern bestämmer i detta fall hur sannolika reinvesteringar är i förhållande till varandra över tid. Denna parameter anger även om 2 Detta avsnitt baseras på Odolinski et al. (2018). 3 Skalparametern anger hur utsträckt täthetsfunktionen är (dvs. den relativa sannolikheten för reinvesteringar över tid), där en ökning i parametern sträcker ut fördelningen och dess maxpunkt sjunker (innebär mindre dramatiska skillnader över tid) och vice versa. 8
10 sannolikheten för en reinvestering under ett tidsintervall (dividerat med längden på intervallet och givet att individen har överlevt till början av intervallet) ökar, minskar eller om den är konstant över tid. På samma sätt som för flertalet tekniska anläggningar ökar risken för att behöva bytas ut över tid. De skattningar som görs av formparametern visar hur snabbt denna process går i det material man har tillgång till, i det här fallet i form av en beskrivning av bandelarnas ålder. Syftet med båda modellerna är att öka förståelsen av vilka aspekter som påverkar kostnader för reinvesteringar i järnvägens infrastruktur. Medan övriga analyser i denna promemoria avser kostnader för både Bana, El, Signal och Tele avgränsas metodjämförelsen till kostnader för banöverbyggnad (exklusive spårväxlar). Avsikten är att på detta sätt fokusera på den principiella metodanalysen på en mer begränsad kostnadsmassa, samtidigt som resultatet av analysen är tillämpligt också för övriga delar av kostnaderna. Resultaten från överlevnadsanalysen visar att marginalkostnaden är SEK per bruttotonkilometer, medan modellen för hörnlösningar ger en marginalkostnad på SEK Skillnaden i estimaten pekar på vikten av att undersöka vilken metod som är lämpligast i denna typ av kostnadsskattning. Slutsatsen av genomgången är att modellen för hörnlösningar är att föredra. Huvudmotivet är att denna metod fångar trafikens effekt på både sannolikheten för en reinvestering och storleken på reinvesteringskostnaden. Överlevnadsmodellen tar inte hänsyn till den senare effekten. I stället multipliceras skattningen från överlevnadsanalysen med en genomsnittlig åtgärdskostnad. Detta är ett problem när det finns systematiska variationer i kostnader som kan kopplas till trafikmängd och olika infrastrukturegenskaper. En tredje modellansats används av Odolinski och Wheat (2018) som studerar dynamiken inom och mellan reinvesterings- och underhållskostnader i kontraktsområden (består av flera bandelar) med en vektor autoregressiv modell. De finner exempelvis att en ökning av underhållskostnader under år t kan förklara en ökning av reinvesteringskostnader under år t+2 (effekten skall dock inte tolkas som ett kausalt samband; det är en så kallad Granger-kausalitet som i detta fall säger att ökningen i underhållskostnader år t ger oss en bättre prediktion av reinvesteringskostnader år t+2). Detta är i linje med en kostnadsminimerande infrastrukturförvaltare som underhåller anläggningen fram till dess att underhållskostnaderna har nått en nivå som gör det nödvändigt att reinvestera i anläggningen. Resultaten i Odolinski och Wheat (2018) visar även att en ökad reinvesteringskostnad under år t kan förklara en ökning av reinvesteringskostnaden under år t+1. Det kan förklaras av att reinvesteringar i ett område sällan genomförs under endast ett år, vilket kan bero på budgetrestriktioner. Studien beräknade endast kostnadselasticiteter med avseende på trafik och ej marginalkostnader för reinvesteringar och underhåll. Det var en anledning till att den vektor autoregressiva modellen inte ingick i metodjämförelsen i Odolinski et al. (2018). 4. Modellspecifikation och beräkning av marginalkostnader Modellen med hörnlösningar används för att skatta trafikens effekter för reinvesteringskostnaderna hos 223 bandelar under åren , givet deras tekniska egenskaper. Marginalkostnader kan beräknas för både bruttoton- och tågkilometer. Samtidigt som dessa värden samvarierar finns det exempel på banor med hög andel person- eller godstrafik där samvariationen är lägre. Det finns också skäl att tro att nedbrytning och slitage mera generellt, en gradvis sämre funktion i vissa fall kan vara mer beroende av antal tågpassager snarare än tågvikten, eller vice versa. Exempelvis är det sannolikt att antal tågpassager är betydelsefullt för slitage på kontaktledningar 9
11 medan antal bruttoton (hur tunga tågen är) kan vara av mindre betydelse. Det omvända kan gälla för banöverbyggnaden, dvs. spåren, växlarnas, sliprarnas och befästningssystemens åldrande drivs mer av hur tunga tåg som använder en bana än av antalet tåg. Det innebär att det är möjligt att ta fram resultat i två dimensioner, dvs. att beräkna effekten på kostnad av variationer i trafik mätt som bruttotonkilometer (brtkm) och tågkilometer (tågkm). I avsnitt 5 redovisas skillnader mellan måttens kostnadselasticiteter. Den jämförelse mellan två modellansatser som redovisats i avsnitt 3 har applicerats enbart på uppgifter om banöverbyggnad. Som framgår av avsnitt 2 innehåller emellertid den nya analysen alla typer av reinvesteringar, dvs. både i Bana och i El-, Signal- och Teleanläggningar, samt Övriga anläggningar och en grupp där ingen anläggningstyp eller -grupp har angetts i kostnadsdata. 4 Separata modellskattningar genomförs för varje anläggningsgrupp och för båda måtten på trafik (antal bruttoton och antal tåg). Utgångspunkten för skattningarna är den flexibla translogmodellen som är en andra ordningens approximation av en kostnads- eller produktionsfunktion (se Christensen et al. (1971) eller Christensen och Greene (1976)). Det innebär att vi testar interaktionseffekter mellan våra förklarande variabler, samt om de kontinuerliga variablerna har icke-linjära effekter på reinvesteringar. Om dessa effekter inte förekommer hos någon av variablerna, resulterar det i en så kallad Cobb- Douglas-modell. I skattningarna specificeras reinvesteringsbeslutet inom anläggningsgrupp j på bandel i under år t som en probit-modell: z jit 1 = α 1ji + β 1m lnq 1mit + 1 β 2 1mm (lnq 1mit )2 + L l=1 β 1l lnx 1lit + L L 2 l=1 l=1 β 1ll lnx 1litlnX 1lit + L l=1 β 1lm lnx 1lit lnq 1mit + L L l=1 r=1 β 1lr lnx 1lit lnx 1rit + D d=1 θ 1d D 1dit + u 1jit I jit = 1 om z jit > 0, I jit = 0 i andra fall (1) z jit är en latent variabel som beskriver reinvesteringsbeslutet, I jit antar värdet 1 (eller noll) när en reinvestering sker (eller ej), indexet 1 anger att parametrarna och variablerna ingår i det första steget (probit-modellen) i tvåstegsmodellen, Q mit är en trafikvariabel (m = antal bruttoton eller antal tåg), lnx lit är en vektor med L antal förklarande variabler som beskriver bandelarnas tekniska egenskaper, D dit är en vektor med D antal dummyvariabler som indikerar vilken region bandelen tillhör, om det är en stationsbandel, om bandelen har främst betongslipers installerade och dummyvariabler för det år som informationen gäller. α 1ji är bandelsspecifika ej observerade effekter som är konstanta över tid och u 1jit är feltermen. Då modellen skattas som en pooled probit antas att α 1ji + u 1jit ~N(0,1). Storleken på reinvesteringen specificeras som en trunkerad regression: 4 I den nya analysen kan vi även använda fler observationer (N=3434) när vi inte är begränsade till en jämförelse med överlevnadsanalysen (resultaten från tvåstegsmodellen i Odolinski et al. (2018) baseras på 2880 observationer). 10
12 y jit (I jit = 1) = α 2ji + β 2m lnq 2mit + 1 β 2 2mm (lnq 2mit )2 + L l=1 β 2l lnx 2lit + 1 L L 2 l=1 l=1 β 2ll lnx 2litlnX 2lit + L l=1 β 2lm lnx 2lit lnq 2mit + L L l=1 r=1 β 2lr lnx 2lit lnx 2rit + D d=1 θ 2d D 2dit + u 2jit (2) Indexet 2 anger att parametrarna och variablerna ingår i det andra steget i tvåstegsmodellen. Det förväntade värdet på feltermen är noll för positiva värden för reinvesteringskostnader. De slutliga modellerna i (1) och (2) kan se olika ut. Med andra ord kan funktionen för beslutet att reinvestera se annorlunda ut än funktionen för hur stor reinvesteringskostnaden ska vara. Båda modellstegen skattas med så kallad pooled regression där ej observerade bandelsspecifika effekter (α i ) antas ha ett medelvärde som är noll. Om så inte är fallet finns det en risk att våra förklarande variabler korrelerar med den bandelsspecifika effekten och vi får då en bias i de skattade parametrarna. Ett sätt att hantera detta är att inkludera gruppmedelvärden av de förklarande variablerna (lnq mi = T 1 T t=1 lnq mit och L l=1 lnx li = T 1 T L t=1 l=1 lnx lit ), dvs. varje bandels medelvärde av den förklarande variabeln under den studerade tidsperioden. Dessa medelvärden fångar därmed relationen mellan de förklarande variablerna och den ej observerade bandelsspecifika effekten (genom att inkludera interaktionstermer och kvadrerade termer av variablernas gruppmedelvärden, likt vår translogmodell, tar vi hänsyn till att relationen kan vara icke-konstant, exempelvis med avseende på trafik.) Denna ansats föreslogs av Mundlak (1978), som visade att parameterskattningarna för de förklarande variablerna därmed fångar effekter likt en modell med fixa effekter (fixed effects-estimatorn). Vi använder avvikelser från gruppmedelvärdet som förklarande T variabler, dvs. lnq mit = lnq mit T 1 t=1 lnq mit och l=1 lnx lit = l=1 lnx lit T 1 T L t=1 l=1 lnx lit för att hantera kollineraritet mellan de förklarande variablerna och dess gruppmedelvärden, samt för att få mer renodlade effekter av förändringar inom en bandel (se exempelvis Bell och Jones (2015)). Sammanfattningsvis kommer parametrarna β m och β l fånga effekter mellan bandelar, och β m och β l effekter inom bandelar. Dock finns det en risk att β m och β l är snedvridna då de kan fånga andra ej observerade bandelsspecifika effekter. Denna risk finns inte hos β m och β l, som kommer att vara konsistenta, givet att de inte korrelerar med feltermen (u jit ). Probit-modellen kan även skattas med så kallade slumpmässiga effekter (random effects-estimator), vilket innebär att vi får konsistenta skattningar trots att ej observerade bandelsspecifika effekter (α 1i ) och feltermen (u 1jit ) är autokorrelerade. Random effects-modellen kräver att de skattade parametrarna multipliceras med (1 + σ 2 α ) 1 2 2, där σ α är den bandelsspecifika standardavvikelsen (Wooldrige (2002)). Det visade sig emellertid att en pooled probit (vars skattade parameter inte behöver skalas) genererade nästintill identiska resultat. Kostnadselasticiteten med avseende på trafik är (givet en Cobb-Douglas-modell och en vanlig pooled regression): L L γ jim = E[y] Q m = β Q m E[y] 2m + β 1m λ(z ji ) (3) 11
13 β 1m är koefficienten för trafikvolym i probit-modellen och β 2m är motsvarande koefficient i den trunkerade regressionen. λ(z ji ) = φ(z ji ) Φ(z ji ) sannolikhetens täthetsfunktion och Φ(z ji ) är dess fördelningsfunktion. 5 är ett så kallat Inverse Mills Ratio, där φ(z ji ) är Kostnadselasticiteten används för att beräkna marginalkostnaden per bruttoton eller tågkilometer MC jim = γ jim AC jim (4) AC jim är predikterade kostnader per tåg- eller bruttotonkilometer. Den beräknas enligt E[y] = Φ(z ji ) exp(y ) exp ( 1 2 σ 2) (5) där σ 2 är feltermernas varians. En viktad (genomsnittlig) marginalkostnad beräknas genom att använda varje observations andel av total trafikvolym. Den viktade marginalkostnaden per bruttotonkilometer (brtkm) är MC1 W j = i MC ji BRTKM ( BRTKM i ) i (6) Motsvarande kostnad per tågkilometer (tågkm) är MC2 W j = i MC ji TÅGKM i ( i TÅGKM i ) (7) Beräkningen i ekvation (5) hanterar ett principiellt problem som uppstår när en log-transformerad beroende variabel används i modellskattningen. Mer specifikt innebär det att vi får resultat i termer n av geometriska medelvärden ( x 1 x 2 x 3 x n ), och bör inte behandla det som aritmetiska medelvärden ( x 1+x 2 +x 3 + +x n n ), där x n 1 x 2 x 3 x n x 1+x 2 +x 3 + +x n (se Casella och Berger (2002, sid. n 191)). Det får till följd att feltermerna har medelvärdet noll i dess logtransformerade form, men ej när vi retransformerar feltermerna till dess antilog, vilket beaktas av ekvation (5). 6 Beräkningen i ekvation (5) baseras på antagandet att feltermerna är normalfördelade och homoskedastiska (konstant varians). För att hantera ej normalfördelade feltermer föreslog Duan 5 Inverse Mills Ratio anger den momentana sannolikheten att bli vald(reinvesteras). 6 Skattas modellen lny = β 1 X 1 + u kan predikterade värden erhållas lny = β 1X 1 där u~n(0, σ 2 ), dvs. E(lny) = β 1X 1. Men att sedan beräkna y = exp (lny ) ger ett felaktigt resultat eftersom E(y) = exp(β 1X 1 ) E(exp(u)) exp(β 1X 1 ), eftersom E(exp(u)) 1. Se exempelvis Beauchamp och Olson (1973), Newman (1993) och Manning (1998). 12
14 (1983) en så kallad smearing estimate, vilket är medelvärdet av de exponentiella feltermerna. Den predikterade kostnaden beräknas då enligt E[y] = Φ(z ji ) exp(y ) N 1 exp (u 2ji ) (8) Feltermerna kan vara relaterade till de förklarande variablerna på olika sätt, dvs. vi har problem med betingad heteroskedasticitet, vilket gör ovanstående retransformationer ej konsistenta (Mullahy (1998)). Feltermernas varians är då Var(u Q 2mi, X 2li, D 2di ) = σ 2 h(q 2mi, X 2li, D 2di ), där h( ) är den funktion som anger hur de förklarande variablerna skapar heteroskedasticitet. En lösning som föreslås av Baser (2007) är att använda de skattade feltermerna u 2ji för att få fram ett estimat (f ji ) på variansen och dess funktion av kovariaterna (σ 2 h(q 2mi, X 2li, D 2di )), och använda detta estimat i prediktionen E[y] = Φ(z ji ) exp(y ) exp ( 1 2 f ) (9) Metoden som föreslås av Baser (2007) är att skatta en modell där de kvadrerade feltermerna (u 2ji 2 ) är beroende variabel och använda de förklarande variablerna från den trunkerade regressionen. 7 Vi väljer att istället använda predikterat värde (y i) från den trunkerade regressionen som förklarande variabel. Det predikterade värdet från denna regression är vårt estimat (f ji ) för variansen och dess funktion av kovariaterna (σ 2 h(q 2mi, X 2li, D 2di )). Skillnaden mellan att använda predikterat värde (y ji ) och de förklarande variablerna är inte särskilt betydande för det genomsnittliga estimatet f ji, men däremot för vare bandels f ji, där användningen av y ji ger en bättre prediktion av kostnader. 5. Resultat och diskussion 5.1 Elasticiteter med avseende på trafik De fullständiga resultaten från skattningarna av probitmodeller (steg 1) och från de trunkerade regressionerna (steg 2) redovisas i Tabellerna 14 till 31 i bilagan. I Tabell 2 10 nedan redovisas enbart koefficienterna för trafik från respektive modellsteg, samt kostnadselasticiteten med avseende på trafik enligt ekvation (3) där effekterna från båda modellstegen ingår. Modellerna har skattats med antal bruttoton respektive antal tåg som trafikmått. Resultat från test huruvida respektive trafikmåtts estimat är signifikant skilda från varandra redovisas också i Tabell 2 10, där nollhypotesen är att koefficienterna är lika (H 0 : γ bruttoton = γ tåg ). I alla modellskattningar används standardfel som är klustrade med avseende på 223 bandelar då deras observationer inte kan ses som helt oberoende (frånvaron av klustring kan i sådant fall leda till standardfel som är missvisande låga). Av resultattabellerna i bilagan framgår att olika modellspecifikationer använts för de olika anläggningsgrupperna. Som beskrivits i avsnitt 4 utgår vi från en translogmodell där alla variabler antas ha en icke-linjär effekt på reinvesteringar, samt att variablernas effekter interagerar med varandra. På 7 Det finns även andra metoder än den som föreslås av Baser (2007). Se exempelvis Mullahy (1998) och Manning och Mullahy (2001). En av dessa är en icke-parametrisk metod som innebär att ett smearing estimate beräknas för varje individ. Detta innebar dock i vårt fall en större differens mellan predikterad och observerad genomsnittskostnad jämfört med de som redovisas i Tabell 11 och Tabell
15 så sätt skiljer sig dessa modellskattningar från de som genomfördes i anslutning till SAMKOST 2, där alla anläggningsgrupper antogs följa en Cobb-Douglas kostnadsfunktion (inga icke-linjära effekter eller interaktionstermer). Därutöver ingår fler variabler som beskriver infrastrukturens kvalitetsegenskaper i föreliggande studie. Odolinski et al. (2018) visade att dessa variabler var viktiga att inkludera då det påverkade kostnadselasticiteterna med avseende på trafik, vilket indikerar att en modell som exkluderar dessa variabler lider av ett endogenitetsproblem (i detta fall omitted variable bias ). Som beskrevs i avsnitt 4 skattar vi en pooled regression i båda stegen, men inkluderar även gruppmedelvärden och avvikelser från gruppmedelvärden för de förklarande variablerna. På så sätt skiljer vi på effekter av förändringar i trafikvolym inom bandelar och effekter av skillnader i trafikvolym mellan bandelar. Resultaten som benämns Pooled regression i tabellerna nedan är viktade genomsnitt av steg 1- respektive steg 2-effekter inom och mellan bandelar. En första observation från resultaten i Tabell 2 10 är att både antal bruttoton och antal tåg har en signifikant effekt på reinvesteringar inom de flesta anläggningsgrupperna. När tvåstegsmodellen skattas med alla anläggningsgrupper sammanslaget har antal bruttoton och antal tåg signifikanta effekter på både sannolikheten för att en reinvestering sker och storleken på reinvesteringskostnaden. Den sammanlagda effekten för antal bruttoton är något högre jämfört med antal tåg, men skillnaden är inte statistiskt signifikant (Prob>chi2=0.101). Förändringar inom en bandel i antal bruttoton eller antal tåg har inte en signifikant effekt på sannolikheten för en reinvestering. Däremot har antal tåg en signifikant effekt på storleken på reinvesteringen i detta avseende. När jämförelser görs mellan bandelar har trafikmåtten signifikanta effekter på båda stegen i beslutsprocessen. Tabell 2. Elasticiteter med avseende på trafik alla anläggningsgrupper: Steg 1 och 2 samt totalt (ekv. 3). Alla anläggningsgrupper Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg *** *** Förkasta H 0 (p>chi2=0.015) Steg *** *** Acceptera H 0 (p>chi2=0.300) Totalt *** *** Acceptera H 0 (p>chi2=0.101) Effekter inom bandelar Steg Steg ** Totalt ** Effekter mellan bandelar Steg *** *** Steg *** *** Totalt *** *** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. Banöverbyggnaden består av bl.a. räl, slipers, befästningssystem och spårväxlar (se Tabell 36 och 37 för en fullständig lista). Denna del har ingått i tidigare skattningar av marginalkostnader för reinvesteringar (Andersson et al. (2012), Andersson et al. (2016)). Likt tidigare studier har trafik en effekt på reinvesteringar i banöverbyggnad. Antal tåg påverkar dock enbart sannolikheten för en reinvestering inom denna anläggningsgrupp, inte hur stor reinvesteringskostnaden blir. Den totala kostnadselasticiteten är nästan dubbelt så stor för bruttoton jämfört med antal tåg, och dessa estimat är statistiskt skilda från varandra (chi2(1)=8.50, Prob>chi2=0.0035). Det skulle kunna förklaras med att 14
16 tågets vikt har ett starkare samband med slitage och nedbrytning av järnvägsspåren jämfört med antal tågpassager. Effekter inom bandelar visar att fler bruttoton ökar sannolikheten för en reinvestering, men visar även det oväntade resultatet att fler bruttoton har en negativ effekt på det andra steget i beslutsprocessen, dvs. storleken på reinvesteringen. Med andra ord visar resultaten att infrastrukturförvaltaren tenderar att genomföra reinvesteringar som är mindre när trafiken ökar, även om ökningen i trafik inom bandelen ökar sannolikheten för beslut om en reinvestering. Större reinvesteringar i banöverbyggnad kräver begränsad eller stoppad trafik, vilket skulle kunna förklara den negativa effekten. Det skulle i så fall indikera ett endogenitetsproblem (i detta fall simultaneity bias ), där reinvesteringen under ett år påverkar trafikförändringen under samma år (modellspecifikationen utgår från att trafiken påverkar reinvesteringen). En dynamisk modell som hanterar effekter över tid är ett sätt att komma åt det problemet (se Odolinski och Wheat (2018)). I jämförelsen mellan bandelar innebär fler brutton däremot en positiv och signifikant effekt på både beslutet att reinvestera och på reinvesteringsstorleken i banöverbyggnad. Tabell 3. Elasticiteter med avseende på trafik banöverbyggnad: Steg 1 och 2 samt totalt (ekv. 3). Banöverbyggnad Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg *** *** Förkasta H 0 (p>chi2=0.095) Steg *** Förkasta H 0 (p>chi2=0.003) Totalt *** *** Förkasta H 0 (p>chi2=0.004) Effekter inom bandelar Steg * Steg ** Totalt Effekter mellan bandelar Steg *** *** Steg *** Totalt *** *** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. Elasticiteterna för banunderbyggnad (bro, tunnel, trumma, bank etc.) med avseende på bruttoton och tåg är nästintill identiska i båda stegen, där det är främst sannolikheten för en reinvestering som påverkas av trafik. Sambandet mellan trafikmängd och storleken på reinvesteringskostnaden är statistiskt signifikant för antal bruttoton (p-värde = 0.085), men ej för antal tåg (p-värde = 0.222). När vi studerar trafikförändringar inom bandelar visar resultaten en signifikant effekt på beslutet att reinvestera. Likt banöverbyggnad har trafik en signifikant effekt inom bandelar på sannolikheten för en reinvestering. Den negativa effekten på reinvesteringsstorleken är ej signifikant, medan jämförelsen mellan bandelar ger signifikanta (positiva) effekter i båda stegen för antal bruttoton. 15
17 Tabell 4. Elasticiteter med avseende på trafik banunderbyggnad: Steg 1 och 2 samt totalt (ekv. 3). Banunderbyggnad Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg *** *** Acceptera H 0 (p>chi2=0.527) Steg * Acceptera H 0 (p>chi2=0.780) Totalt *** *** Acceptera H 0 (p>chi2=0.972) Effekter inom bandelar Steg *** *** Steg Totalt Effekter mellan bandelar Steg *** *** Steg ** Totalt *** ** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. För bangårdar är sambandet mellan bruttoton och reinvesteringar inte särskilt robust; kostnadselasticiteten är statistisk signifikant på 10-procentsnivån. Sambandet är något robustare för antal tåg, men skillnaderna i estimaten mellan trafikmåtten är ej signifikanta. Däremot får vi robustare elasticiteter när vi endast studerar effekter mellan bandelar. Tabell 5. Elasticiteter med avseende på trafik bangårdar: Steg 1 och 2 samt totalt (ekv. 3). Bangårdar Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg Acceptera H 0 (p>chi2=0.448) Steg * Acceptera H 0 (p>chi2=0.420) Totalt * ** Acceptera H 0 (p>chi2=0.319) Effekter inom bandelar Steg Steg Totalt Effekter mellan bandelar Steg * Steg ** * Totalt ** ** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. För reinvesteringar i elanläggningar har antal bruttoton men ej antal tåg en signifikant effekt; av Tabell 6 framgår dock att både tåg och bruttoton har en signifikant effekt på sannolikheten att en reinvestering sker i elanläggningar. Resultaten från modellskattningarna för denna anläggningsgrupp presenteras i Tabell 22 (probit - steg 1) och Tabell 23 (trunkerad regression - steg 2) i bilagan, och visar att något annorlunda translogmodeller har skattats för bruttoton och för tåg. 8 Resultaten strider mot 8 I steg 2 var interaktioner mellan antal tåg och infrastrukturegenskaper ej signifikanta. Detsamma gäller de ickelinjära effekterna (förutom för rälsvikt). Interaktionerna och de icke-linjära effekterna var däremot signifikanta i modellen för bruttoton, men det förklarar inte hela skillnaden mellan elasticiteterna (elasticiteten med avseende på bruttoton är (p-värde 0.001) när vi exkluderar interaktioner och icke-linjära effekter i steg 2, dvs. skattar samma modell som för antal tåg). 16
18 intuitionen att antal tågpassager har ett starkare samband med reinvesteringar i kontaktledningar jämfört med bruttoton. Därutöver kan det antas att de flesta andra komponenter inom denna anläggningsgrupp inte slits eller bryts ned av trafiken, vilket innebär att det bör vara behovet av en väl fungerande elanläggning som ligger bakom ett samband med trafik och beslutet att reinvestera, snarare än att en trafikökning innebär att reinvesteringskostnaden blir större. Resultaten visar dock att även reinvesteringskostnaden ökar med antal bruttoton, vilket kan vara en indikation på att mer trafik innebär att fler komponenter/anläggningstyper inom elanläggningar reinvesteras när ett reinvesteringsbeslut har tagits. Likt banöverbyggnad och banunderbyggnad innebär en jämförelse inom bandelar att trafik ökar sannolikheten för en reinvestering, men ej storleken på reinvesteringen. Tabell 6. Elasticiteter med avseende på trafik elanläggningar: Steg 1 och 2 samt totalt (ekv. 3). Elanläggningar Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg *** ** Förkasta H 0 (p>chi2=0.006) Steg ** Acceptera H 0 (p>chi2=0.107) Totalt *** Förkasta H 0 (p>chi2=0.012) Effekter inom bandelar Steg * ** Steg Totalt Effekter mellan bandelar Steg *** ** Steg ** Totalt *** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. Båda trafikmåtten har ett robust samband med beslutet att genomföra en reinvestering i signalanläggningar, men effekten på storleken på reinvesteringskostnaden är inte statistiskt signifikant. Det är en indikation på att behovet av en väl fungerande signalanläggning ökar med trafiken, men att kostnaden för reinvesteringen är i genomsnitt lika för olika trafikmängder. Tabell 7. Elasticiteter med avseende på trafik signalanläggningar: Steg 1 och 2 samt totalt (ekv. 3). Signalanläggningar Bruttoton Tåg Koef. Std. Fel Koef. Std. Fel H 0 : γ bruttoton = γ tåg Pooled regression Steg *** *** Acceptera H 0 (p>chi2=0.107) Steg Acceptera H 0 (p>chi2=0.398) Totalt *** *** Acceptera H 0 (p>chi2=0.783) Effekter inom bandelar Steg Steg Totalt Effekter mellan bandelar Steg *** *** Steg Totalt ** ** *,**,***: Statistisk signifikans på 10-, 5- respektive 1-procents nivå. 17
ANALYS AV FINSKA DATA
Per Johansson Jan-Eric Nilsson 2001-01-08 ANALYS AV FINSKA DATA INLEDNING OCH SAMMANFATTNING På begäran av Banverket har vi genomfört en preliminär analys av ett finskt datamaterial avseende banunderhållskostnader
Marginalkostnader för järnvägsunderhåll: trafikens påverkan på olika anläggningar
Marginalkostnader för järnvägsunderhåll: trafikens påverkan på olika anläggningar Kristofer Odolinski Statens väg- och transportforskningsinstitut (VTI) CTS Working Paper 2018:24 Abstract En del av banavgiften
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER
Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Dekomponering av löneskillnader
Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population
Konsekvensbeskrivning av ny plannivå för drift och underhåll av järnväg
PM Till: Näringsdepartementet Trafikverket Från: Trafikverket 2010-10-29 Konsekvensbeskrivning av ny plannivå för drift och underhåll av järnväg Inledning Den plannivå som låg till grund för drift- och
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Verksamhetsutvärdering av Mattecentrum
Verksamhetsutvärdering av Mattecentrum April 2016 www.numbersanalytics.se info@numbersanalytics.se Presskontakt: Oskar Eriksson, 0732 096657 oskar@numbersanalytics.se INNEHÅLLSFÖRTECKNING Inledning...
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
Repetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
Multipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Statistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
F19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA
Kapitel 22: KLUSTRADE SAMPEL OCH PANELDATA Statistiska tester bygger alltid på vissa antaganden. Är feltermen homoskedastisk? Är den normalfördelad? Dessa antaganden är faktiskt aldrig uppfyllda i praktiken,
Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
import totalt, mkr index 85,23 100,00 107,36 103,76
1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen
Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Diskussionsproblem för Statistik för ingenjörer
Diskussionsproblem för Statistik för ingenjörer Måns Thulin thulin@math.uu.se Senast uppdaterad 20 februari 2013 Diskussionsproblem till Lektion 3 1. En projektledare i ett byggföretaget ska undersöka
Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
Paneldata och instrumentvariabler/2sls
Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller
1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Bolånetagarnas amorteringar har ökat sedan införandet av individuella amorteringsplaner
PROMEMORIA Datum 2014-11-11 FI Dnr 14-15503 Författare Johan Berg, Maria Wallin Fredholm Finansinspektionen Box 7821 SE-103 97 Stockholm [Brunnsgatan 3] Tel +46 8 787 80 00 Fax +46 8 24 13 35 finansinspektionen@fi.se
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
F11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Uppgift 1. f(x) = 2x om 0 x 1
Avd. Matematisk statistik TENTAMEN I Matematisk statistik SF1907, SF1908 OCH SF1913 TORSDAGEN DEN 30 MAJ 2013 KL 14.00 19.00. Examinator: Gunnar Englund, 073 321 3745 Tillåtna hjälpmedel: Formel- och tabellsamling
Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Linjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:
1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Samhällsekonomisk analys och underhåll förklarat på ett enklare sätt
Samhällsekonomisk analys och underhåll förklarat på ett enklare sätt I den här broschyren får du en inblick i hur Trafikverket arbetar med samhällsekonomiska analyser på underhållsområdet och hur vi arbetar
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012
Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Statistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Exempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Korrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Tillvägaghångssätt för skattning av körkortsmodell
Siamak Baradaran sia@kth.se Tillvägaghångssätt för skattning av körkortsmodell 1 Syfte med modellen Syftet med denna forskning har varit att utveckla en beskrivande modell som kan hjälpa oss att förstå
Föreläsning 4: Konfidensintervall (forts.)
Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika
Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik
Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Fråga nr a b c d 2 D
Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841
Statistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Teknisk not: Lönealgoritmen
Teknisk not: Lönealgoritmen Konjunkturlönestatistiken, som räknas till den officiella lönestatistiken, har som huvudsyfte att belysa nivån på arbetstagarnas löner i Sverige och hur dessa utvecklas. Konjunkturlönestatistiken
Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, VT2014 2014-05-26 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare
MIKROEKONOMETRI Data på individ/hushålls/företags/organisationsnivå Tvärsnittsdata och/eller longitudinella data o paneldata Idag större datamänger än tidigare Tekniska framsteg erbjuder möjligheter till
Modell för löneökningar
Lönebildningsrapporten 13 35 FÖRDJUPNING Modell för löneökningar I denna fördjupning redovisas och analyseras en modell för löneökningar. De centralt avtalade löneökningarna förklarar en stor del av den
Matematisk statistik TMS064/TMS063 Tentamen
Matematisk statistik TMS64/TMS63 Tentamen 29-8-2 Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof
Hur måttsätta osäkerheter?
Geotekniska osäkerheter och deras hantering Hur måttsätta osäkerheter? Lars Olsson Geostatistik AB 11-04-07 Hur måttsätta osäkerheter _LO 1 Sannolikheter Vi måste kunna sätta mått på osäkerheterna för
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski
FACIT för Förberedelseuppgifter: SF9 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 206 KL 4.00 9.00. Examinator: Timo Koski - - - - - - - - - - - - - - - - - - - - - - - - 0. FACIT Problem
Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24
1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar
Finansiell statistik
Finansiell statistik Föreläsning 5 Tidsserier 4 maj 2011 14:26 Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs
Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18
LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341, STN2) 213-1-11 kl 14 18 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd
Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion
Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
En empirisk studie om sambandet mellan inspektionsbesök och kemtvättars miljöbeteende i Stockholm
En empirisk studie om sambandet mellan inspektionsbesök och kemtvättars miljöbeteende i Stockholm Författare: Anders Hed och Linda Hoff Rudhult Handledare: Adam Jacobsson EC6902 Kandidatuppsats i nationalekonomi
Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018
Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
F9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
16. Max 2/0/ Max 3/0/0
Del III 16. Max 2/0/0 Godtagbar ansats, visar förståelse för likformighetsbegreppet, t.ex. genom att bestämma en tänkbar längd på sidan med i övrigt godtagbar lösning med korrekt svar (8 cm och 18 cm)
Anders Lunander, Handelshögskolan vid Örebro universitet (huvudansvarig) Sofia Lundberg, Handelshögskolan vid Umeå universitet
Slutrapport för projektet Högt anbudspris hög kvalitet? En empirisk analys av relationen mellan anbudspris och bedömning av kvalitet i offentlig upphandling Anders Lunander, Handelshögskolan vid Örebro
Avd. Matematisk statistik
Avd. Matematisk statistik TENTAMEN I SF1913 MATEMATISK STATISTIK FÖR IT OCH ME ONSDAGEN DEN 12 JANUARI 2011 KL 14.00 19.00. Examinator: Camilla Landén, tel. 7908466. Tillåtna hjälpmedel: Formel- och tabellsamling
EXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
STOCKHOLMS UNIVERSITET FYSIKUM
STOCKHOLMS UNIVERSITET FYSIKUM Tentamensskrivning i Fysikexperiment, 7,5 hp, för FK2002 Onsdagen den 15 december 2010 kl. 9-14. Skrivningen består av två delar A och B. Del A innehåller enkla frågor och