Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:17 Effekten av borttaget ränteavdrag The effect of a reduced mortgage interest deduction Pardis Ghadrdan och Samuel Hultqvist Självständigt arbete 15 högskolepoäng inom Statistik III, HT2014 Handledare: Pär Stockhammar
Sammanfattning Hur påverkas Sveriges ekonomi av ett minskat ränteavdrag? För att undersöka detta har vi använt oss av vektor autoregressiva modeller för att se hur Sveriges ekonomi utvecklas om ränteavdraget minskar. Vi gör tre olika modeller för att se hur en chock i räntan motsvarande ett minskat ränteavdrag påverkar BNP, konsumtion och arbetslöshet. Vi fann att det gick att göra goda prognoser för framtiden som stämmer väl med till exempel Riksbankens prognos för BNP. När vi sedan chockade räntan motsvarande ett minskat ränteavdrag visade det sig att det gav stora negativa effekter på ekonomin. Nyckelord: Vektor Autoregressiva modeller, Ekonometri, Ränteavdrag, BNP Abstract How is the Swedish economy affected by reduced mortgage interest deduction? To investigate this, we used vector autoregressive models to see how the economy is developing in case of a reduced interest deduction. We make three different models to see how a chock on the interest rate, corresponding to a reduced interest deduction, affects GDP, consumption and unemployment. We found that it was possible to make good forecasts for the future that fits well with those of the Central Bank of Sweden for GDP. When we chocked the interest rate, corresponding to a reduced interest deduction, it turned out having negative effects on the economy. Keywords: Vector Autoregressive Models, Econometrics, Mortgage interest deductibility, GDP i
Förord Vi vill tacka vår handledare Pär Stockhammar, lektor vid Statistiska institutionen, för konstruktiva idéer samt stöd och uppmuntrande under arbetets gång. ii
Innehållsförteckning 1 Inledning... 1 1.1 Syfte... 2 1.2 Metod... 2 2 Data... 3 3 Metod... 4 3.1 Tidsserieanalys... 4 3.2 Stationäritet... 4 3.2.1 Enhetsrot... 6 3.2.2 Test av stationäritet... 6 3.2.3 Augmented Dickey-Fuller (ADF) test... 7 3.3 Vektor autoregressiva modeller (VAR)... 8 3.3.1 Impuls-responsfunktion... 9 3.3.2 Laggar... 9 3.3.3 Prognoser med VAR... 10 3.4 Modelldiagnostik... 11 3.4.1 Normalfördelning och heteroskedasticitet... 11 3.4.2 Granger kausalitetstest... 12 3.4.3 Prognosutvärdering... 13 4 Resultat... 15 4.1 Stationäritet... 15 4.2 Granger kausalitetstest... 16 4.3 VAR-modeller... 16 4.3.1 Optimalt antal laggar... 17 4.3.2 Normalfördelning och heteroskedasticitet... 18 4.3.3 Modelldiagnostik... 19 4.3.4 Impuls-respons... 19 4.3.5 Prognosutvärdering... 20 4.4 Prognoser... 21 4.5 Effekten av minskat ränteavdrag... 23 5 Diskussion och slutsats... 26 6 Litteraturförteckning... 28 Appendix A... 29 A.1 Källförteckning variabler... 29 Appendix B... 30 Figur B.1: Grafisk granskning av stationäritet... 30 Figur B.2: Korrelogram variabel 1, 2, 3, 4... 31 Figur B.3: Det utökade Dickey-Fuller testet variabel 1, 2, 3, 4... 32 iii
Figur B.4: ADF differentierade värden I(1) variabel 2, 3 och 4... 33 Tabell B.1: Variabler, benämning, iteraktionsordning, urvalsstorlek och urvalsperiod... 33 Appendix C... 34 Tabell C.1: Resultat för optimalt antal laggar Modell 2... 34 Tabell C.2: Resultat för optimalt antal laggar Modell 3... 34 Figur C.2: Modell 2 output... 36 Figur C.3: Modell 3 output... 37 Figur C.4: Normalitetstest Modell 1... 38 Figur C.5: Normalitetstest Modell 2... 39 Figur C.6: Normalitetstest Modell 3... 40 Figur C.7: White test Modell 1... 40 Figur C.8: White test Modell 2... 41 Figur C.9: White test Modell 3... 41 Modell C.1: Ekvation Modell 2... 42 Modell C.2: Ekvation Modell 3... 42 Figur C.10: Impulsrespons Modell 2... 43 Figur C.11: Impulsrespons Modell 3... 43 iv
1 Inledning Diskussionen om ränteavdragets avskaffande blossar upp med jämna mellanrum i den politiska debatten, men har nu aktualiserats i och med hushållens höga skuldsättning och de stigande bostadspriserna. Ränteavdrag på bostadslån är något relativt ovanligt världen över, endast fem andra länder tillämpar ränteavdrag på bostadslån, däribland USA och Schweiz. 2013 uppmanade EU-kommissionen Sverige att fasa ut ränteavdraget för att minska skevheten på bostadsbeskattningen. I skrivande stund är endast Vänsterpartiet och Miljöpartiet villiga att diskutera en förändring av ränteavdragets utformning. I Sverige innebär ränteavdraget att 30 procent av räntekostnaden på lån, främst då bolån, betalas varje år ut som en skattereduktion. Om räntekostnaden överstiger 100 000 kronor så erhålls endast 21 procent av räntekostnaden. Ränteavdraget är ett gammalt avdrag som uppkom dels för att skatten på ränteinkomsten i Sverige är 30 procent, dels för att för ge privatpersoner möjligheten att köpa en egen bostad. På 1970-talet var ränteavdraget fullständigt vilket innebar att man fick hela räntekostnaden subventionerat. Det var alltså väldigt fördelaktigt att låna under den perioden. Under skattereformen 1990-1991 fick ränteavdraget sin nuvarande utformning. (Fregert & Jonung, 2010) 70 procent av Sveriges hushåll gör idag ränteavdrag varav snittet för subventionen ligger på 6500 kronor per person. Dock är avdraget ojämnt fördelat då personer i 40 års ålder gör störst avdrag medan unga och gamla får lägst. De största avdragen gör familjer i storstäderna. (Heggeman, 2014) Figur 1.1: Ränteavdrag för låntagare 20 84 år. Genomsnittligt belopp i kronor, efter ålder, år 2012, källa: SCB 1
Det finns flera anledningar att studera effekterna av ränteavdraget, dels rör det sig om en stor kostnad för staten, 2012 utbetalades 32 miljarder i ränteavdrag. Dels finns det en växande opinion att ränteavdraget spär på bostadsprisernas drastiska prisutveckling och därmed bör avskaffas. Den kända opinionsbildaren Lars Wilderäng (Cornucopia) skriver att ränteavdraget överskrider bankernas vinst: Eftersom bankerna gör mindre vinst på bostadslånen än ränteavdraget saknar privata banker existensberättigande. Antingen förstatligar man alla bostadslån eller så tar man bort ränteavdraget. Under rådande ideologiska paradigm där statligt är fult blir slutsatsen att hela ränteavdraget omgående ska avskaffas. (Wilderäng, 2013) Ränteavdragets vara eller inte vara är synnerligen en het potatis. 1.1 Syfte Syftet med denna uppsats är att utgöra underlag för en diskussion om hur effekten av ett slopat alternativt minskat ränteavdrag skulle drabba svensk ekonomi. Vi har valt att statistiskt analysera effekterna på BNP, hushållens konsumtion och arbetslöshet. 1.2 Metod För att undersöka effekten av ett reducerat samt borttaget ränteavdrag kommer vi skapa modeller för de ekonomiska variabler som vi ska analysera, för att därefter göra en prognos för hur dessa variabler kommer utvecklas de närmaste tre åren. Slutligen kommer vi lägga till en chock på räntan motsvarande ett minskat ränteavdrag och analysera hur denna påverkar BNP, hushållens konsumtion och arbetslöshet. Vi kommer att använda oss av så kallade vektor autoregressiva modeller (VAR) som är en effektiv metod för att göra prognoser på framförallt finansiell data. För att kunna göra goda prognoser med VAR-modeller krävs det att både de enskilda variablerna och själva modellerna uppfyller vissa kriterier och antaganden. Modellbyggandet påminner mycket om en vanlig ARIMA-process. Den statistiska mjukvaran vi använder för VAR-modellerna är Eviews 8. Med hjälp av Excel kommer vi utvärdera våra modellers giltighet genom att jämföra dem med faktiska värden från 2012-2014 med måtten MAPE och MAE. 2
2 Data De variabler vi använder oss av har vi valt utifrån makroekonomisk teori. Vi har valt följande fyra variabler för att mäta effekten av ett minskat ränteavdrag: Bruttonationalprodukt (BNP) är ett mått på den totala ekonomiska aktiviteten i ett land under ett år. Ett lands BNP kan uttryckas som värdet av total konsumtion av varor och tjänster, bruttoinvesteringar samt export minus import. Vi kommer använda oss av BNP till marknadspris med säsongsrensning som är det vanligaste måttet. Hushållens konsumtion är säsongsjusterad och till marknadspris. Sveriges ekonomi är väldigt konsumtionsdriven och hushållens konsumtion står ungefär till cirka hälften av värdet av BNP. Räntan är de fem storbankernas viktade rörliga utlåningsränta. Arbetslöshet uttrycker andelen som inte är sysselsatta för åldrarna 15-74. Datamaterialet är hämtat från Statistiska Centralbyrån och Konjunkturinstitutet. Appendix A hänvisar källor för samtliga variabler. Variablernas frekvens är kvartalsvis då de flesta makroekonomiska variabler publiceras på kvartalsbasis. De variabler som släpps på månadsbasis har vi justerat till kvartalsdata med aritmetiskt medelvärde. All data utgår från 2003 då det var det första året vi kunde finna data över bankernas utlåningsränta. 3
3 Metod 3.1 Tidsserieanalys En tidsserie är en uppsättning observationer som genereras vid givna tidpunkter, t. Den observerade tidsserien kan ses som en stokastisk process, Y!, där observerade värden är en realisation av processen. Vi kan betrakta observation y! vid tidpunkt t som en realisation av en slumpmässig variabel y! med täthetsfunktionen p(y! ). På samma sätt som ett urval används för att analysera en viss population, förklaras den underliggande stokastiska processen av dess observerade värden. Tidsserieanalys syftar till att identifiera beroende mellan observationer i tiden för att konstruera en modell som reflekterar dessa. (Brooks, 2008) 3.2 Stationäritet En central del i tidsseriedata och utformning av tidsseriemodeller är antagandet om viss form av statistik jämvikt. Närmare bestämt talar man om begreppet stationäritet som är av särskild betydelse för de autoregressiva modeller som kommer att behandlas längre fram. En stokastisk process sägs vara strikt stationär om fördelningens egenskaper är opåverkade av en tidsförskjutning fram eller bak i tid. Den simultana täthetsfunktionen för observationerna y!!, y!!,..., y!! vid tidpunkt t!, t!,..., t! är densamma som den för observationerna y!!!!, y!!!!,., y!!!! vid tidpunkt t! + k, t! + k,, t! + k. Men andra ord är sannlikhetsfördelningen oberoende av tidsförskjutningar. Vid praktisk tillämpning är det minst sagt krångligt och empiriskt osannolikt att uppnå detta. För att möjliggöra analys av tidsserier finns ett mindre restriktivt antagande om statistisk jämvikt - svag stationäritet. I fortsättningen benämner vi stationäritet i denna form. (Box & Jenkins, 2008) En svag stationär stokastisk tidsserie Y! har ett konstant medelvärde som är oberoende av tid, en konstant varians och en kovarians mellan två tidsperioder som endast beror på avståndet k mellan perioderna och inte tiden t: 4
E(Y t ) = µ (3.1) V(Y t ) = E(Y t µ) 2 = σ 2 (3.2) γ k = E [(Y t µ)(y t+k µ) ] (3.3) Det mest fundamentala exemplet på stationär process är en sekvens av oberoende, identiskt fördelade och slumpmässiga variabler som antar väntevärdet 0 och variansen σ!. Processen är strikt stationär och refereras till vitt brus. Då oberoendet implicerar att variablerna inte är korrelerade, ter sig autokovariansfunktionen på samma sätt som vid strikt stationäritet. Alla vitt brus processer är stationära, dock gäller inte det omvända sambandet alltid. En normalfördelad vitt brus -process refereras som Gaussisk vitt brus och har då samma egenskaper som svag stationäritet. (Gujarati & Porter, 2009) Av flera skäl är stationäritet en önskvärd egenskap vid estimering av AR-modeller. Avsaknad av stationäritet kan ha stark påverkan på beteendet och egenskaperna hos en tidsserie. Ett exempel är att oförutsedda händelser på en variabel så som chocker i tidpunkt t har en oändlig och bestående effekt på kommande tidsperioder. För en stationär process har chocker och feltermer en avtagande effekt ju längre fram i tiden man kommer. Om en serie inte uppfyller kravet om stationäritet är det omöjligt att studera eller generalisera beteendet av tidsserien i andra tidsperioder. Prognoser blir då på det hela taget meningslösa. Ett annat problem som lätt kan uppstå är så kallade spuriösa eller nonsens-regressioner. Vad som händer är att två icke-stationära variabler som i själva verket inte är korrelerade uppvisar statistisk samband vid linjär regression. Regressionen ser bra ut när det egentligen inte föreligger något samband (Gujarati & Porter, 2009). Detta kan påvisas genom extremt låga värden på Durbin Watson d-statistika som tyder på hög autokorrelation samtidigt som R! värdet är väldigt högt. Om R! > d är det läge att misstänka att estimerade värden är spuriösa där t-statistikan är missvisande. Vid ett sådant samband krävs vidare granskning av tidsserien där nästa steg är att göra en kointegrationsanalys för att utreda om det istället finns ett giltigt statistiskt samband mellan variablerna. 5
3.2.1 Enhetsrot Trots det faktum att man eftersträvar stationäritet vid tidsserieanalys är finansiell data dessvärre sällan stationär i sin grundform. Tillgångspriser så som aktiepriser och växelkurser följer ofta det klassiska exemplet av en slumpvandring (Random Walk model) som är en icke stationär process. En möjlig åtgärd att vidta för att justera för icke-stationär process, utöver de formella testerna som kommer att förklaras närmare i kommande avsnitt, är att logaritmera en tidsserie. (Gujarati & Porter, 2009) Man skiljer mellan tre varianter av slumpvandring: (1) slumvandring utan konstant, (2) slumvandring med konstant och (3) slumvandring med konstant och deterministisk trend. Den första är en AR(1) modell där y! = y!!! + ε! vilket innebär att värdet av variabel y i tidpunkt t motsvaras av dess senaste historiska värde i tidpunkt t 1 plus en felterm som är vitt brus med väntevärde 0 och varians σ!. Väntevärdet för variabeln motsvarar dess initiala värde där E(Y! ) = Y! och är således konstant. Variansen däremot ökar med tiden då var(y! ) = tσ! och strider därmed mot villkor (3.2) för stationäritet. De beskrivna AR (1) modellerna är exempel på vad som i litteraturen benämns som enhetsrot. 3.2.2 Test av stationäritet Våra tidsserier med autoregressiva komponenter behöver uppfylla kravet på stationäritet och transformeras om villkoret inte uppfylls. Ett första steg är att intuitivt granska tidsserien grafiskt för att få en uppfattning om hur serien beter sig. En uppåtgående trend indikerar att väntevärdet och/eller variansen varierar med tiden. Tidsserien är således inte stationär. Ett annat sätt att grafiskt studera stationäritet är via autokorrelationsfunktionen i ett korrelogram. Höga och långsamt avtagande värden på autokorrelationskoefficienterna samt signifikans indikerar icke stationäritet (Gujarati & Porter, 2009). Vidare behöver en tidsserie testas formellt via enhetsrottest vilket innebär att sambandet mellan stationäritet och enhetsrot för en tidsserie studeras. En stokastisk process med enhetsrot utgår från ekvationen Y! = py!!! + ε! där feltermen är vitt brus. I fallet av enhetsrot då p = 1 är serien en slumpvandring utan konstant vilket är en icke-stationär process. Den generella tanken bakom test av enhetsrot är ta reda på om det estimerade p värdet är lika med 1. Det går emellertid inte att direkt estimera p värdet genom vanlig OLS då den är biased vid fallet av 6
enhetsrot. I praktiken estimeras istället den differentierade serien av Y! = py!!! + ε! under nollhypotesen att δ = (p 1) = 0 och mothypotesen att δ < 0. Om δ = 0 är p = 1 och tyder på att vi har en enhetsrot och därmed en icke-stationär serie. Ett vanligt OLS tillvägagångsätt skulle i det här fallet innebära att förändringen av Y! regresseras på Y!!! för att se om δ = 0 eller inte. Problemet är att t-värden för de estimerade koefficienterna av Y!!! inte följer en t-fördelning och är därför inte normalfördelade. I ovannämnda hypoteser visade Dickey och Fuller (1979) istället att teststatistikan följer en τ-fördelning baserat på Monte Carlo-simulering. Detta är känt som DF-testet. Beroende på en given series utformning estimeras DF-testet under tre olika nollhypoteser: ΔY t = δy t 1 +ε t ΔY t = β 1 +δy t 1 +ε t ΔY t = β 1 + β 2 t +δy t 1 +ε t H! = y! är en slumpvandring (3.4) H! = y! ".. " med konstant (3.5) H! = y! ".." runt en deterministisk trend (3.6) Dessa hypoteser råder under antagandet att feltermerna ε! är okorrelerade. I det fall där ε! är autokorrelerade har Dickey-Fuller utvecklat det så kallade ADF-testet som tillåter oss att testa för stationäritet. 3.2.3 Augmented Dickey- Fuller (ADF) test Det utökade DF-testet härleds från det föregående testet genom att utöka de tre ekvationerna med laggade värden för beroende variabeln Y!. Därigenom justeras eventuell autokorrelation i residualerna. Ekvation (3.6) skrivs om som: ΔY t = β 1 + β 2 t +δy t 1 + m i=1 a i ΔY t i +ε t (3.7) där den utökade termen uttrycker antalet laggade värden, Y!!! = Y!!! Y!!!, och därε t är vitt brus. För att erhålla väntevärdesriktiga estimat för koefficienten av laggade värden δ, behöver man inkludera ett visst antal laggar. Valet av dessa laggar går ut på att välja så många termer som det krävs för att residualerna ska vara okorrelerade. Eviews föreslår antalet laggar baserat på ett antal viktiga 7
informationskriterier, bland annat Akaike och Schwarz som förklaras närmare i kommande avsnitt. 3.3 Vektor autoregressiva modeller (VAR) Vektor Autoregressiva modeller har utvecklats av Christopher Sims som ett alternativt sätt att modellera tidseriedata. (Sims, 1980) Inom makroekonomi används strukturella modeller där man försöker påvisa ekonomiska samband där vissa variabler ses som endogena respektive exogena. I VAR-modeller betraktas alla variabler som endogena vilket inte förutsätter någon teoretisk förkunskap för valet av variabler utan endast ett hypotetiskt antagande hur dessa variabler samspelar med varandra 1. (Brooks, 2008) VAR-modellen bygger på generaliserade univariata AR-modeller. Autoregressiva modeller innebär att y! beror linjärt på dess tidigare tidsförskjutna värden plus en felterm. Ekvationen för en AR(p) med p laggade feltermer skrivs som: y t = δ +φ 1 y t 1 +φ 2 y t 2 +... +φ p y t p +ε t (3.8) alternativt som: y t = δ + p i=1 φ i y t i +ε t (3.9) där y! är tidsserien, δ är en konstant, φ är modellparametrar och ε! är vitt brus. Om vi går vidare till enklaste formen av multivariata tidsserier, den bivariata modellen med m antal laggar på båda variablerna och feltermen ε!", erhålls: y 1t = δ 10 +α 11 y 1t 1 +... +α 1m y 1t m + β 11 y 2t 1 +... + β 1m y 2t m +ε 1t (3.10) y 2t = δ 20 +α 21 y 2t 1 +... +α 2m y 2t m + β 21 y 1t 1 +... + β 2m y 1t m +ε 2t (3.11) Introduceras fler variabler k så blir denna form aningen otymplig. Om man går över till matrisform får man en mer kompakt modell: y t = δ + Φ 1 y t 1 + Φ 2 y t 2 +... + Φ m y t m +ε t (3.12) 1 I vissa fall kan endast exogena variabler inkluderas i modellen för att tillåta för trend- och säsongsfaktorer. (Gujarati & Porter, 2009) 8
där y t = (y 1t, y 2t,..., y kt ), δ t = (δ 1,δ 2,...,δ k ) " $ och Φ i = $ $ # $ φ 11i φ 1ki φ k1i φ kki % ' ' ' &' VAR-modellers ateoretiska natur är både en för- och nackdel. Modellens största styrka ligger i att generera prognoser som i de flesta fall är mer precisa än de prognoser som görs med strukturella ekvationer, genom att fånga upp samband som är okända mellan variablerna. Detta gör att VAR modeller är mindre lämpade för teoretisk analys och mer passande för prognoser. Ett annat problem som kan uppkomma gäller val av antal laggar. För en reducerad VAR-modell av formen (3.12) estimeras varje ekvation separat genom OLS. En modell med k antal ekvationer och m laggar i varje ekvation ger k + mk! parametrar att skatta. För en modell med två variabler med fyra laggar, vilket är vanligt vid användandet av kvartalsdata, får man 34 parametrar plus en felterm i varje ekvation vilket kan ge stora standardfelen. (Brooks, 2008) 3.3.1 Impuls- responsfunktion Impuls-responsfunktionen används som ett komplement vid analys av VAR-modeller då koefficienterna i den estimerade modellen ofta är svåra att tolka. Impulsresponsfunktionen kvantifierar effekten av en exogen chock på varje enskild endogen variabel i modellen. Om vi antar att feltermen i (3.10) chockas med en standardavvikelse kommer den endogena variabeln att påverkas i tidpunkt t och längre fram i tid. I den bivariata VAR-modellen kommer chocken även ge utslag på den andra endogena variabeln i (3.11) då de laggade värdena för den första endogena variabeln även ingår i den andra ekvationen. Med andra ord ger en chock av ε!! effekt på y!! och på y!! och omvänt. 3.3.2 Laggar Att välja optimalt antal laggar för en VAR-modell är inte helt enkelt. Väljer man för få laggar kommer prognosen bli felspecifierad, väljer man däremot för många laggar konsumeras för många frihetsgrader vilket ökar standardfelet. Lyckligtvis finns en 9
mängd kriterier för att välja rätt antal laggar. Vi kommer titta närmare på två informationskriterier; Akaike Information Criterium (AIC) och Schwartz Information Criterium (SIC) 2. Dessa kriterier frångår normalfördelningsantagande i residualer då finansiell data sällan är normalfördelat. (Brooks, 2008) Detta diskuteras närmare i avsnitt 3.4.1. De multivariata versionerna av informationskriterierna AIC och SIC uttrycks enligt: MAIC = log Σ + 2 k" T (3.13) MSIC = log Σ + 2 k" T log(t ) (3.14) där Σ är varians-kovarians matrisen av residualerna, T är antal observationer och k totala antalet regressorer i alla ekvationer. Dessa informationskriterier bestraffar kvadratsumman av residualerna RSS när fler laggar läggs till. Därför eftersträvas det lägsta värdet på informationskriterierna för att välja ut optimalt antal laggar. 3.3.3 Prognoser med VAR Fördelen med VAR-modeller är att prognoser endast beror på tidigare värden på variablerna vilket gör att modellens form inte förändras under prognosperioden. (Lütkepohl, 2005) Prognos för Y!!! : ŷ T+1 = δ + Φ 1 y T + Φ 2 y T 1 +... + Φ m y t m+1 ŷ T+2 = δ + Φ 1 y T+1 + Φ 2 y T +... + Φ m y t m+2 ŷ T+h = δ + Φ 1 y T+h 1 + Φ 2 y T+h 2 +... + Φ m y t+h m (3.15a) (3.15b) (3.15c) 2 Frekvensen i datamaterialet kan även avgöra valet av antalet laggar. För månadsdata används 12 laggar, för kvartalsdata använd 4 laggar och så vidare. (Brooks, 2008) 10
3.4 Modelldiagnostik Modellbyggandet av VAR-modeller är av liknande slag som AR-modeller. Vid behandling av finansiell data är det nästan utopiskt att datat uppfyller alla kriterier. Det är därför lite av en konstform att bygga bra VAR-modeller, mycket trial and error samt att olika av avvägningar krävs. (Gujarati & Porter, 2009) Då varje enskild variabel i en VAR-modell bestäms utifrån dess tidigare värden samt de historiska värdena på andra variabler i modellen, kan man genomföra dynamiska prediktioner vilket innebär att det görs prognoser för alla variabler samtidigt för en period framåt i tid. Dessa prognosvärden används i sin tur för att fortsätta proceduren för ytterliga en period framåt. 3.4.1 Normalfördelning och heteroskedasticitet För att formellt testa om residualerna är normalfördelade använder vi Jarque-Bera normalitetstest (Jarque och Bera, 1980). Testet utgår från egenskaperna hos en normalfördelning där skevheten(s) och kurtosis (K) hos residualerna jämförs. Skevheten mäter till vilken grad en fördelning inte är symmetrisk kring medelvärdet och kurtosis eller toppighet mäter hur tjocka svansarna är. S = E! " ε 3 # $ (σ 2 ) 3 2 K = E! " ε 4 # (3.16) $ (σ 2 ) 2 ε är feltermerna och σ! är variansen som estimeras utifrån OLS-regressionen. Därefter beräknas det univariata Jarque-Bera testet genom följande teststatistika: " JB = N S 2 $ # 6 + (K 3)2 24 % ' & (3.17) där N är urvalsstorleken och S och K följer ovanstående definition. Jarque och Bera formulerade dessa idéer om att koefficienterna för skevhet och för excess kurtosis gemensamt är noll vilket innebär at S = 0 och K = 3. Under nollhypotesen att residualerna är normalfördelade följer testet en asymptotisk χ! -fördelning med två frihetsgrader. Om p värdet av teststatistikan är skilt från noll förkastas nollhypotesen 11
för normalfördelning i residualerna. För att testa för heteroskedasticitet i residualerna används White-test (White, 1980). Utifrån det univariata fallet där: Y i = β 1 + β 2 x 2i + β 3 x 3i +ε i (3.18) erhålls estimerade residulerna ε!. Sedan estimeras följande hjälpregressionen : ˆε i = α 1 +α 2 x 2i +α 3 x 3i +α 4 x 2 2i +α 5 x 2 3i +α 6 x 2i x 3i + v i (3.19) Under nollhypotesen att det inte råder heteroskedasticitet i residualerna urvalsstorleken N gånger R! asymptotiskt χ! - fördelat med lika många frihetsgrader som antalet regressorer minus konstanten. I vårt fall är det fem frihetsgrader. Om χ! - värdet överskrider vald signfikansnivå råder ingen heteroskedasticitet utan a! = a! = a! = a! = a! = 0. I VAR-modeller motsvaras frihetsgraderna av m gånger n där m = k(k + 1)/2 är antalet korsprodukter och n är antalet termer i hjälpregressionen. är 3.4.2 Granger kausalitetstest När VAR-modellen innehåller många laggar är det svårt att utröna vilken kombination av laggade variabler som har respektive inte har signifikant inverkan på de beroende variablerna. För att lösa problemet introducerade Granger (1969) ett kausalitetstest där avsikten var att avgöra om en tidsserie har en signifikant roll att prediktera framtida utfall hos en annan. En tidsserie y! sägs Granger-orsaka y! om värden på y! ger statistisk signifikant information om framtida värden på y!. Det vill säga y! har förmågan att prediktera y!. Testet estimeras genom följande regressioner: n y 1t = α i y 2t i + β j y 1t i +ε 1t i=1 n i=1 (3.20) n n y 2t = γ i y 2t i + δ j y 1t i +ε (3.21) 2t i=1 Feltermerna ε!! och ε!! antas vara okorrelerade. Nuvärdet av variabel y! i ekvation (3.20) är en funktion av dess egna tidigare värden samt den andra variabelns tidigare i=1 12
värden. En förutsättning för att genomföra testet är att alla variabler skall vara stationära. Testet genomförs med F-testet där: F = (RSS R RSS UR ) / m RSS UR / (n k) (3.22) m är antalet skattade parametrar och k är totalt antal skattade parametrar. I första steget av testet regresseras y!! med alla dess laggade värden för att återfå RSS! som är den begränsade kvadratsumman av residualen. I nästa regression där den andra variabelns laggade värden inkluderas återfås den obegränsade residualkvadratsumman RSS!". Under nollhypotesen att den andra variabelns laggade värden inte påverkar y!!, H! : α! = 0 = 1, 2, n, får vi reda på om y! i det här fallet Granger-orsakar y!. Man skiljer på fyra olika utfall för Granger kausalitet: 1. y! orsakar y! - De laggade termerna i y! är statistiskt skiljda från noll och de laggade termerna i y! inte är det. 2. y! orsakar y! - De laggade termerna i y! är statistisk skiljda från noll och de laggade termerna i y! inte är det. 3. Ömsesidig kausalitet - De laggade termerna i y! och y! är statistisk signifikanta. 4. Oberoende - De laggade termerna i varken y! eller y! är statistiskt signifikanta. Antalet valda laggar i testet är kritiskt för riktningen på kausalitet. Vi kommer därför att testa för ett antal olika laggar. 3.4.3 Prognosutvärdering Eftersom vi gör prognoser för framtiden så kan vi inte uppskatta det faktiska prognosfelet, vilket endast kan göras retroaktivt. Men för att få en uppfattning om vår modells giltighet kommer vi att göra prognoser utifrån tidigare värden, till exempel från 2012 till 2014 för att se hur bra vår modell är. Prognosfelet räknas ut genom att man tar det faktiska värdet på variabeln minus prognosen. Om prognosfelet är negativt innebär det att modellen är överskattad och 13
om prognosfelet är positivt är modellen underskattad. Vi kommer att använda oss av dessa två mått: Medelabsolutprocentfel, MAPE är inte beroende av skalan på den beroende variabeln utan är ett relativt prognosmått. Att använda sig av MAPE som prognosmått kan ge problem ifall man har data som visar nollvärden då man inte kan dividera med noll. MAPE = 1 n!!!! y! y! y! (3.23) Medelabsolutfel, MAE mäter det absoluta medelvärdet på prognosfelet i faktiska tal. MAE = 1 n!!!! y! y! (3.24) 14
4 Resultat 4.1 Stationäritet Figur 4.1 Stationäritet 1,000,000 960,000 920,000 880,000 840,000 800,000.03.02.01.00 -.01 -.02 -.03 760,000 -.04 03 04 05 06 07 08 09 10 11 12 13 14 03 04 05 06 07 08 09 10 11 12 13 14 I ett första steg för kontroll av stationäritet granskades tidsserierna för respektive variabel grafiskt. I vänster figur (4.1) visas tidsserien för BNP i fasta priser från första kvartalet år 2003 till och med tredje kvartalet 2014 enligt y!. Grafen visar på en tydlig uppåtgående trend under tidsperioden vilket indikerar att väntevärdet har ändrats under peioden och serien är således icke-stationär. Vi valde att transformera serien till logaritmerad form för att minska på skevheten. Utifrån ACF-diagrammet i Appendix B (Figur B.2) råder tydliga tecken på icke-stationäritet då koefficienten för autokorrelationsfunktionen startar vid ett högt värde vid första laggen (0.914) och avtar därefter långsamt. Den logaritmerade BNP-serien testades därefter för enhetsrot i det utökade Dickey-Fuller testet. Först vid en förstadifferentiering, y! y!!! = ΔY! = ε!, uppvisade serien tydligare tecken på stationäritet med ett konstant medelvärde (höger Figur 4.1). ADF testet gav ett p-värde på 0.0013 vilket tillät oss att förkasta nollhypotesen för enhetsrot vid samtliga signifikansnivåer. I Appendix B finns resultaten för samtliga variabler där ACF-diagrammet samt iteraktionsordningen för samtliga variabler redovisas. Serien för hushållens konsumtion logartimerades och differentierades av första ordningen för att erhålla stationäritet. Variabeln arbetslöshet användes i sin grundform men krävde differentiering av första ordningen för att bli stationär. Räntan å andra sidan uppfyllde kravet i sin grundform utan att transformeras. I fortsättningen används de logaritmerade och differentierade serierna för BNP och konsumtion då stationäritetskravet är starkare än vid icke logaritmerade serier. 15
4.2 Granger kausalitetstest I våra modeller har vi med så kallad prior kunskap enligt makroekonomisk teori valt ut fyra variabler som påverkas av en ändring i ränteläget. För att testa detta statistiskt tillämpades Grangers Kausalitetstest. Tanken bakom testet är som tidigare förklarat att om variabel X Granger-orsakar variabel Y så bör förändringar i variabel X även påverka framtida förändringar i variabel Y. Genom cause(1) kommandot i Eviews skattade vi en bivariat VAR(1) modell för kombinationen mellan bolåneränta och varje variabel 3. Nollhypotesen är att testvariabeln inte Granger-orsakar motvariabeln. Tabell 4.1: Granger Kausalitetstest Variabler 2 laggar 4 laggar 6 laggar 8 laggar ränta y i y i ränta ränta y i y i ränta ränta y i y i ränta ränta y i y i ränta Log (BNP) 0.0014** 0.0026** 0.0044** 0.0453* 0.03* 0.04* 0.0226* 0.1985 Arbetslöshet 0.0005** 0.0027** 0.0039** 0.0054** 0.0026** 0.0221* 0.0276* 0.1136 Log(EHK) 0.0065** 0.0851 0.0134* 0.0009** 0.2825 0.0001*** 0.5427 0.0020** p- värde *<0.05, **<0.01,***<0.0001 Utifrån ovanstående resultat kan vi konstatera att valet av antalet laggar är kritiskt för testet. VAR (1) modellen uppvisar ömsesidig kausalitet upp till sjätte laggen för alla tre variabler (undantag för konsumtion mot ränta vid andra laggen). I fallet av två och fyra laggar förkastas samtliga nollhypoteser på högst fem procents signifikansnivå vilket innebär att det föreligger ett ömsesidigt samband (punkt 3 avsnitt 3.4.2) för alla tre variabler under den kvartalsvisa tidsperioden 2003 till 2014. Vid sex och åtta laggar visar resultaten att det inte föreligger något statistiskt urskiljbart samband mellan flera av variablerna i de parvisa Granger-testen. Därmed kan vi bekräfta att valet av variabler är relevanta för våra kommande modeller. 4.3 VAR- modeller Vi kommer nu skapa tre modeller för att undersöka hur en räntechock motsvarande en sänkning av ränteavdraget påverkar svensk BNP, konsumtion och arbetslöshet. Vi 3 Då varje test (totalt tre) inkluderar två variabler hanterar vi en så kallad bilateral kausalitet. 16