The effect of a reduced mortgage interest deduction. Pardis Ghadrdan och Samuel Hultqvist

Relevanta dokument

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

- en statistisk analys

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Stokastiska processer med diskret tid

Finansiell statistik

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Osäkerhetsindex för Sverige. - ett verktyg för svensk realekonomi. Uncertainty index for Sweden - an instrument for Swedish real economic

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

ARIMA del 2. Patrik Zetterberg. 19 december 2012

7.5 Experiment with a single factor having more than two levels

Statistiska institutionen. Bachelor thesis, Department of Statistics. Reporäntegenomslaget skattat med felkorrigeringsmodeller

1 Empirisk analys (April 25, 2006)

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Korrelation och autokorrelation

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Stokastiska processer med diskret tid

Lektionsanteckningar 11-12: Normalfördelningen

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Vilka indikatorer kan prognostisera BNP?

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Paneldata och instrumentvariabler/2sls

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Statistik B Regressions- och tidsserieanalys Föreläsning 1

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

Regressions- och Tidsserieanalys - F4

Skrivning i ekonometri torsdagen den 8 februari 2007

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

import totalt, mkr index 85,23 100,00 107,36 103,76

Promemoria Finansdepartementet. Ekonomiska avdelningen. Utvärdering av makroekonomiska prognoser Inledning

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Statistik 1 för biologer, logopeder och psykologer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Uppgift 1. Produktmomentkorrelationskoefficienten

Multipel Regressionsmodellen

Regressions- och Tidsserieanalys - F7

Föreläsning 12: Regression

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

MVE051/MSG Föreläsning 7

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Data på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

8.1 General factorial experiments

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Industriell matematik och statistik, LMA /14

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen Tillämpad statistik A5 (15hp)

Dekomponering av löneskillnader

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Kandidatuppsats. Att prognosticera svensk inflation med Vektor Autoregressiva Modeller

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

F3 Introduktion Stickprov

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Kandidatuppsats VT2009 Nationalekonomi/finans. Blankning. -en studie om instrumentets påverkan på Stockholmsbörsen.

Metod och teori. Statistik för naturvetare Umeå universitet

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Repetitionsföreläsning

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 12: Repetition

F9 SAMPLINGFÖRDELNINGAR (NCT

Linjär regressionsanalys. Wieland Wermke

Uppgift a b c d e Vet inte Poäng

ÖVNINGSUPPGIFTER KAPITEL 7

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Föreläsning 5. Kapitel 6, sid Inferens om en population

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

3 Maximum Likelihoodestimering

Skrivning i ekonometri lördagen den 29 mars 2008

Grundläggande matematisk statistik

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

, s a. , s b. personer från Alingsås och n b

Följande resultat erhålls (enhet: 1000psi):

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Regressionsmodellering inom sjukförsäkring

FÖRELÄSNING 8:

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

2.1 Mikromodul: stokastiska processer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Transkript:

Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:17 Effekten av borttaget ränteavdrag The effect of a reduced mortgage interest deduction Pardis Ghadrdan och Samuel Hultqvist Självständigt arbete 15 högskolepoäng inom Statistik III, HT2014 Handledare: Pär Stockhammar

Sammanfattning Hur påverkas Sveriges ekonomi av ett minskat ränteavdrag? För att undersöka detta har vi använt oss av vektor autoregressiva modeller för att se hur Sveriges ekonomi utvecklas om ränteavdraget minskar. Vi gör tre olika modeller för att se hur en chock i räntan motsvarande ett minskat ränteavdrag påverkar BNP, konsumtion och arbetslöshet. Vi fann att det gick att göra goda prognoser för framtiden som stämmer väl med till exempel Riksbankens prognos för BNP. När vi sedan chockade räntan motsvarande ett minskat ränteavdrag visade det sig att det gav stora negativa effekter på ekonomin. Nyckelord: Vektor Autoregressiva modeller, Ekonometri, Ränteavdrag, BNP Abstract How is the Swedish economy affected by reduced mortgage interest deduction? To investigate this, we used vector autoregressive models to see how the economy is developing in case of a reduced interest deduction. We make three different models to see how a chock on the interest rate, corresponding to a reduced interest deduction, affects GDP, consumption and unemployment. We found that it was possible to make good forecasts for the future that fits well with those of the Central Bank of Sweden for GDP. When we chocked the interest rate, corresponding to a reduced interest deduction, it turned out having negative effects on the economy. Keywords: Vector Autoregressive Models, Econometrics, Mortgage interest deductibility, GDP i

Förord Vi vill tacka vår handledare Pär Stockhammar, lektor vid Statistiska institutionen, för konstruktiva idéer samt stöd och uppmuntrande under arbetets gång. ii

Innehållsförteckning 1 Inledning... 1 1.1 Syfte... 2 1.2 Metod... 2 2 Data... 3 3 Metod... 4 3.1 Tidsserieanalys... 4 3.2 Stationäritet... 4 3.2.1 Enhetsrot... 6 3.2.2 Test av stationäritet... 6 3.2.3 Augmented Dickey-Fuller (ADF) test... 7 3.3 Vektor autoregressiva modeller (VAR)... 8 3.3.1 Impuls-responsfunktion... 9 3.3.2 Laggar... 9 3.3.3 Prognoser med VAR... 10 3.4 Modelldiagnostik... 11 3.4.1 Normalfördelning och heteroskedasticitet... 11 3.4.2 Granger kausalitetstest... 12 3.4.3 Prognosutvärdering... 13 4 Resultat... 15 4.1 Stationäritet... 15 4.2 Granger kausalitetstest... 16 4.3 VAR-modeller... 16 4.3.1 Optimalt antal laggar... 17 4.3.2 Normalfördelning och heteroskedasticitet... 18 4.3.3 Modelldiagnostik... 19 4.3.4 Impuls-respons... 19 4.3.5 Prognosutvärdering... 20 4.4 Prognoser... 21 4.5 Effekten av minskat ränteavdrag... 23 5 Diskussion och slutsats... 26 6 Litteraturförteckning... 28 Appendix A... 29 A.1 Källförteckning variabler... 29 Appendix B... 30 Figur B.1: Grafisk granskning av stationäritet... 30 Figur B.2: Korrelogram variabel 1, 2, 3, 4... 31 Figur B.3: Det utökade Dickey-Fuller testet variabel 1, 2, 3, 4... 32 iii

Figur B.4: ADF differentierade värden I(1) variabel 2, 3 och 4... 33 Tabell B.1: Variabler, benämning, iteraktionsordning, urvalsstorlek och urvalsperiod... 33 Appendix C... 34 Tabell C.1: Resultat för optimalt antal laggar Modell 2... 34 Tabell C.2: Resultat för optimalt antal laggar Modell 3... 34 Figur C.2: Modell 2 output... 36 Figur C.3: Modell 3 output... 37 Figur C.4: Normalitetstest Modell 1... 38 Figur C.5: Normalitetstest Modell 2... 39 Figur C.6: Normalitetstest Modell 3... 40 Figur C.7: White test Modell 1... 40 Figur C.8: White test Modell 2... 41 Figur C.9: White test Modell 3... 41 Modell C.1: Ekvation Modell 2... 42 Modell C.2: Ekvation Modell 3... 42 Figur C.10: Impulsrespons Modell 2... 43 Figur C.11: Impulsrespons Modell 3... 43 iv

1 Inledning Diskussionen om ränteavdragets avskaffande blossar upp med jämna mellanrum i den politiska debatten, men har nu aktualiserats i och med hushållens höga skuldsättning och de stigande bostadspriserna. Ränteavdrag på bostadslån är något relativt ovanligt världen över, endast fem andra länder tillämpar ränteavdrag på bostadslån, däribland USA och Schweiz. 2013 uppmanade EU-kommissionen Sverige att fasa ut ränteavdraget för att minska skevheten på bostadsbeskattningen. I skrivande stund är endast Vänsterpartiet och Miljöpartiet villiga att diskutera en förändring av ränteavdragets utformning. I Sverige innebär ränteavdraget att 30 procent av räntekostnaden på lån, främst då bolån, betalas varje år ut som en skattereduktion. Om räntekostnaden överstiger 100 000 kronor så erhålls endast 21 procent av räntekostnaden. Ränteavdraget är ett gammalt avdrag som uppkom dels för att skatten på ränteinkomsten i Sverige är 30 procent, dels för att för ge privatpersoner möjligheten att köpa en egen bostad. På 1970-talet var ränteavdraget fullständigt vilket innebar att man fick hela räntekostnaden subventionerat. Det var alltså väldigt fördelaktigt att låna under den perioden. Under skattereformen 1990-1991 fick ränteavdraget sin nuvarande utformning. (Fregert & Jonung, 2010) 70 procent av Sveriges hushåll gör idag ränteavdrag varav snittet för subventionen ligger på 6500 kronor per person. Dock är avdraget ojämnt fördelat då personer i 40 års ålder gör störst avdrag medan unga och gamla får lägst. De största avdragen gör familjer i storstäderna. (Heggeman, 2014) Figur 1.1: Ränteavdrag för låntagare 20 84 år. Genomsnittligt belopp i kronor, efter ålder, år 2012, källa: SCB 1

Det finns flera anledningar att studera effekterna av ränteavdraget, dels rör det sig om en stor kostnad för staten, 2012 utbetalades 32 miljarder i ränteavdrag. Dels finns det en växande opinion att ränteavdraget spär på bostadsprisernas drastiska prisutveckling och därmed bör avskaffas. Den kända opinionsbildaren Lars Wilderäng (Cornucopia) skriver att ränteavdraget överskrider bankernas vinst: Eftersom bankerna gör mindre vinst på bostadslånen än ränteavdraget saknar privata banker existensberättigande. Antingen förstatligar man alla bostadslån eller så tar man bort ränteavdraget. Under rådande ideologiska paradigm där statligt är fult blir slutsatsen att hela ränteavdraget omgående ska avskaffas. (Wilderäng, 2013) Ränteavdragets vara eller inte vara är synnerligen en het potatis. 1.1 Syfte Syftet med denna uppsats är att utgöra underlag för en diskussion om hur effekten av ett slopat alternativt minskat ränteavdrag skulle drabba svensk ekonomi. Vi har valt att statistiskt analysera effekterna på BNP, hushållens konsumtion och arbetslöshet. 1.2 Metod För att undersöka effekten av ett reducerat samt borttaget ränteavdrag kommer vi skapa modeller för de ekonomiska variabler som vi ska analysera, för att därefter göra en prognos för hur dessa variabler kommer utvecklas de närmaste tre åren. Slutligen kommer vi lägga till en chock på räntan motsvarande ett minskat ränteavdrag och analysera hur denna påverkar BNP, hushållens konsumtion och arbetslöshet. Vi kommer att använda oss av så kallade vektor autoregressiva modeller (VAR) som är en effektiv metod för att göra prognoser på framförallt finansiell data. För att kunna göra goda prognoser med VAR-modeller krävs det att både de enskilda variablerna och själva modellerna uppfyller vissa kriterier och antaganden. Modellbyggandet påminner mycket om en vanlig ARIMA-process. Den statistiska mjukvaran vi använder för VAR-modellerna är Eviews 8. Med hjälp av Excel kommer vi utvärdera våra modellers giltighet genom att jämföra dem med faktiska värden från 2012-2014 med måtten MAPE och MAE. 2

2 Data De variabler vi använder oss av har vi valt utifrån makroekonomisk teori. Vi har valt följande fyra variabler för att mäta effekten av ett minskat ränteavdrag: Bruttonationalprodukt (BNP) är ett mått på den totala ekonomiska aktiviteten i ett land under ett år. Ett lands BNP kan uttryckas som värdet av total konsumtion av varor och tjänster, bruttoinvesteringar samt export minus import. Vi kommer använda oss av BNP till marknadspris med säsongsrensning som är det vanligaste måttet. Hushållens konsumtion är säsongsjusterad och till marknadspris. Sveriges ekonomi är väldigt konsumtionsdriven och hushållens konsumtion står ungefär till cirka hälften av värdet av BNP. Räntan är de fem storbankernas viktade rörliga utlåningsränta. Arbetslöshet uttrycker andelen som inte är sysselsatta för åldrarna 15-74. Datamaterialet är hämtat från Statistiska Centralbyrån och Konjunkturinstitutet. Appendix A hänvisar källor för samtliga variabler. Variablernas frekvens är kvartalsvis då de flesta makroekonomiska variabler publiceras på kvartalsbasis. De variabler som släpps på månadsbasis har vi justerat till kvartalsdata med aritmetiskt medelvärde. All data utgår från 2003 då det var det första året vi kunde finna data över bankernas utlåningsränta. 3

3 Metod 3.1 Tidsserieanalys En tidsserie är en uppsättning observationer som genereras vid givna tidpunkter, t. Den observerade tidsserien kan ses som en stokastisk process, Y!, där observerade värden är en realisation av processen. Vi kan betrakta observation y! vid tidpunkt t som en realisation av en slumpmässig variabel y! med täthetsfunktionen p(y! ). På samma sätt som ett urval används för att analysera en viss population, förklaras den underliggande stokastiska processen av dess observerade värden. Tidsserieanalys syftar till att identifiera beroende mellan observationer i tiden för att konstruera en modell som reflekterar dessa. (Brooks, 2008) 3.2 Stationäritet En central del i tidsseriedata och utformning av tidsseriemodeller är antagandet om viss form av statistik jämvikt. Närmare bestämt talar man om begreppet stationäritet som är av särskild betydelse för de autoregressiva modeller som kommer att behandlas längre fram. En stokastisk process sägs vara strikt stationär om fördelningens egenskaper är opåverkade av en tidsförskjutning fram eller bak i tid. Den simultana täthetsfunktionen för observationerna y!!, y!!,..., y!! vid tidpunkt t!, t!,..., t! är densamma som den för observationerna y!!!!, y!!!!,., y!!!! vid tidpunkt t! + k, t! + k,, t! + k. Men andra ord är sannlikhetsfördelningen oberoende av tidsförskjutningar. Vid praktisk tillämpning är det minst sagt krångligt och empiriskt osannolikt att uppnå detta. För att möjliggöra analys av tidsserier finns ett mindre restriktivt antagande om statistisk jämvikt - svag stationäritet. I fortsättningen benämner vi stationäritet i denna form. (Box & Jenkins, 2008) En svag stationär stokastisk tidsserie Y! har ett konstant medelvärde som är oberoende av tid, en konstant varians och en kovarians mellan två tidsperioder som endast beror på avståndet k mellan perioderna och inte tiden t: 4

E(Y t ) = µ (3.1) V(Y t ) = E(Y t µ) 2 = σ 2 (3.2) γ k = E [(Y t µ)(y t+k µ) ] (3.3) Det mest fundamentala exemplet på stationär process är en sekvens av oberoende, identiskt fördelade och slumpmässiga variabler som antar väntevärdet 0 och variansen σ!. Processen är strikt stationär och refereras till vitt brus. Då oberoendet implicerar att variablerna inte är korrelerade, ter sig autokovariansfunktionen på samma sätt som vid strikt stationäritet. Alla vitt brus processer är stationära, dock gäller inte det omvända sambandet alltid. En normalfördelad vitt brus -process refereras som Gaussisk vitt brus och har då samma egenskaper som svag stationäritet. (Gujarati & Porter, 2009) Av flera skäl är stationäritet en önskvärd egenskap vid estimering av AR-modeller. Avsaknad av stationäritet kan ha stark påverkan på beteendet och egenskaperna hos en tidsserie. Ett exempel är att oförutsedda händelser på en variabel så som chocker i tidpunkt t har en oändlig och bestående effekt på kommande tidsperioder. För en stationär process har chocker och feltermer en avtagande effekt ju längre fram i tiden man kommer. Om en serie inte uppfyller kravet om stationäritet är det omöjligt att studera eller generalisera beteendet av tidsserien i andra tidsperioder. Prognoser blir då på det hela taget meningslösa. Ett annat problem som lätt kan uppstå är så kallade spuriösa eller nonsens-regressioner. Vad som händer är att två icke-stationära variabler som i själva verket inte är korrelerade uppvisar statistisk samband vid linjär regression. Regressionen ser bra ut när det egentligen inte föreligger något samband (Gujarati & Porter, 2009). Detta kan påvisas genom extremt låga värden på Durbin Watson d-statistika som tyder på hög autokorrelation samtidigt som R! värdet är väldigt högt. Om R! > d är det läge att misstänka att estimerade värden är spuriösa där t-statistikan är missvisande. Vid ett sådant samband krävs vidare granskning av tidsserien där nästa steg är att göra en kointegrationsanalys för att utreda om det istället finns ett giltigt statistiskt samband mellan variablerna. 5

3.2.1 Enhetsrot Trots det faktum att man eftersträvar stationäritet vid tidsserieanalys är finansiell data dessvärre sällan stationär i sin grundform. Tillgångspriser så som aktiepriser och växelkurser följer ofta det klassiska exemplet av en slumpvandring (Random Walk model) som är en icke stationär process. En möjlig åtgärd att vidta för att justera för icke-stationär process, utöver de formella testerna som kommer att förklaras närmare i kommande avsnitt, är att logaritmera en tidsserie. (Gujarati & Porter, 2009) Man skiljer mellan tre varianter av slumpvandring: (1) slumvandring utan konstant, (2) slumvandring med konstant och (3) slumvandring med konstant och deterministisk trend. Den första är en AR(1) modell där y! = y!!! + ε! vilket innebär att värdet av variabel y i tidpunkt t motsvaras av dess senaste historiska värde i tidpunkt t 1 plus en felterm som är vitt brus med väntevärde 0 och varians σ!. Väntevärdet för variabeln motsvarar dess initiala värde där E(Y! ) = Y! och är således konstant. Variansen däremot ökar med tiden då var(y! ) = tσ! och strider därmed mot villkor (3.2) för stationäritet. De beskrivna AR (1) modellerna är exempel på vad som i litteraturen benämns som enhetsrot. 3.2.2 Test av stationäritet Våra tidsserier med autoregressiva komponenter behöver uppfylla kravet på stationäritet och transformeras om villkoret inte uppfylls. Ett första steg är att intuitivt granska tidsserien grafiskt för att få en uppfattning om hur serien beter sig. En uppåtgående trend indikerar att väntevärdet och/eller variansen varierar med tiden. Tidsserien är således inte stationär. Ett annat sätt att grafiskt studera stationäritet är via autokorrelationsfunktionen i ett korrelogram. Höga och långsamt avtagande värden på autokorrelationskoefficienterna samt signifikans indikerar icke stationäritet (Gujarati & Porter, 2009). Vidare behöver en tidsserie testas formellt via enhetsrottest vilket innebär att sambandet mellan stationäritet och enhetsrot för en tidsserie studeras. En stokastisk process med enhetsrot utgår från ekvationen Y! = py!!! + ε! där feltermen är vitt brus. I fallet av enhetsrot då p = 1 är serien en slumpvandring utan konstant vilket är en icke-stationär process. Den generella tanken bakom test av enhetsrot är ta reda på om det estimerade p värdet är lika med 1. Det går emellertid inte att direkt estimera p värdet genom vanlig OLS då den är biased vid fallet av 6

enhetsrot. I praktiken estimeras istället den differentierade serien av Y! = py!!! + ε! under nollhypotesen att δ = (p 1) = 0 och mothypotesen att δ < 0. Om δ = 0 är p = 1 och tyder på att vi har en enhetsrot och därmed en icke-stationär serie. Ett vanligt OLS tillvägagångsätt skulle i det här fallet innebära att förändringen av Y! regresseras på Y!!! för att se om δ = 0 eller inte. Problemet är att t-värden för de estimerade koefficienterna av Y!!! inte följer en t-fördelning och är därför inte normalfördelade. I ovannämnda hypoteser visade Dickey och Fuller (1979) istället att teststatistikan följer en τ-fördelning baserat på Monte Carlo-simulering. Detta är känt som DF-testet. Beroende på en given series utformning estimeras DF-testet under tre olika nollhypoteser: ΔY t = δy t 1 +ε t ΔY t = β 1 +δy t 1 +ε t ΔY t = β 1 + β 2 t +δy t 1 +ε t H! = y! är en slumpvandring (3.4) H! = y! ".. " med konstant (3.5) H! = y! ".." runt en deterministisk trend (3.6) Dessa hypoteser råder under antagandet att feltermerna ε! är okorrelerade. I det fall där ε! är autokorrelerade har Dickey-Fuller utvecklat det så kallade ADF-testet som tillåter oss att testa för stationäritet. 3.2.3 Augmented Dickey- Fuller (ADF) test Det utökade DF-testet härleds från det föregående testet genom att utöka de tre ekvationerna med laggade värden för beroende variabeln Y!. Därigenom justeras eventuell autokorrelation i residualerna. Ekvation (3.6) skrivs om som: ΔY t = β 1 + β 2 t +δy t 1 + m i=1 a i ΔY t i +ε t (3.7) där den utökade termen uttrycker antalet laggade värden, Y!!! = Y!!! Y!!!, och därε t är vitt brus. För att erhålla väntevärdesriktiga estimat för koefficienten av laggade värden δ, behöver man inkludera ett visst antal laggar. Valet av dessa laggar går ut på att välja så många termer som det krävs för att residualerna ska vara okorrelerade. Eviews föreslår antalet laggar baserat på ett antal viktiga 7

informationskriterier, bland annat Akaike och Schwarz som förklaras närmare i kommande avsnitt. 3.3 Vektor autoregressiva modeller (VAR) Vektor Autoregressiva modeller har utvecklats av Christopher Sims som ett alternativt sätt att modellera tidseriedata. (Sims, 1980) Inom makroekonomi används strukturella modeller där man försöker påvisa ekonomiska samband där vissa variabler ses som endogena respektive exogena. I VAR-modeller betraktas alla variabler som endogena vilket inte förutsätter någon teoretisk förkunskap för valet av variabler utan endast ett hypotetiskt antagande hur dessa variabler samspelar med varandra 1. (Brooks, 2008) VAR-modellen bygger på generaliserade univariata AR-modeller. Autoregressiva modeller innebär att y! beror linjärt på dess tidigare tidsförskjutna värden plus en felterm. Ekvationen för en AR(p) med p laggade feltermer skrivs som: y t = δ +φ 1 y t 1 +φ 2 y t 2 +... +φ p y t p +ε t (3.8) alternativt som: y t = δ + p i=1 φ i y t i +ε t (3.9) där y! är tidsserien, δ är en konstant, φ är modellparametrar och ε! är vitt brus. Om vi går vidare till enklaste formen av multivariata tidsserier, den bivariata modellen med m antal laggar på båda variablerna och feltermen ε!", erhålls: y 1t = δ 10 +α 11 y 1t 1 +... +α 1m y 1t m + β 11 y 2t 1 +... + β 1m y 2t m +ε 1t (3.10) y 2t = δ 20 +α 21 y 2t 1 +... +α 2m y 2t m + β 21 y 1t 1 +... + β 2m y 1t m +ε 2t (3.11) Introduceras fler variabler k så blir denna form aningen otymplig. Om man går över till matrisform får man en mer kompakt modell: y t = δ + Φ 1 y t 1 + Φ 2 y t 2 +... + Φ m y t m +ε t (3.12) 1 I vissa fall kan endast exogena variabler inkluderas i modellen för att tillåta för trend- och säsongsfaktorer. (Gujarati & Porter, 2009) 8

där y t = (y 1t, y 2t,..., y kt ), δ t = (δ 1,δ 2,...,δ k ) " $ och Φ i = $ $ # $ φ 11i φ 1ki φ k1i φ kki % ' ' ' &' VAR-modellers ateoretiska natur är både en för- och nackdel. Modellens största styrka ligger i att generera prognoser som i de flesta fall är mer precisa än de prognoser som görs med strukturella ekvationer, genom att fånga upp samband som är okända mellan variablerna. Detta gör att VAR modeller är mindre lämpade för teoretisk analys och mer passande för prognoser. Ett annat problem som kan uppkomma gäller val av antal laggar. För en reducerad VAR-modell av formen (3.12) estimeras varje ekvation separat genom OLS. En modell med k antal ekvationer och m laggar i varje ekvation ger k + mk! parametrar att skatta. För en modell med två variabler med fyra laggar, vilket är vanligt vid användandet av kvartalsdata, får man 34 parametrar plus en felterm i varje ekvation vilket kan ge stora standardfelen. (Brooks, 2008) 3.3.1 Impuls- responsfunktion Impuls-responsfunktionen används som ett komplement vid analys av VAR-modeller då koefficienterna i den estimerade modellen ofta är svåra att tolka. Impulsresponsfunktionen kvantifierar effekten av en exogen chock på varje enskild endogen variabel i modellen. Om vi antar att feltermen i (3.10) chockas med en standardavvikelse kommer den endogena variabeln att påverkas i tidpunkt t och längre fram i tid. I den bivariata VAR-modellen kommer chocken även ge utslag på den andra endogena variabeln i (3.11) då de laggade värdena för den första endogena variabeln även ingår i den andra ekvationen. Med andra ord ger en chock av ε!! effekt på y!! och på y!! och omvänt. 3.3.2 Laggar Att välja optimalt antal laggar för en VAR-modell är inte helt enkelt. Väljer man för få laggar kommer prognosen bli felspecifierad, väljer man däremot för många laggar konsumeras för många frihetsgrader vilket ökar standardfelet. Lyckligtvis finns en 9

mängd kriterier för att välja rätt antal laggar. Vi kommer titta närmare på två informationskriterier; Akaike Information Criterium (AIC) och Schwartz Information Criterium (SIC) 2. Dessa kriterier frångår normalfördelningsantagande i residualer då finansiell data sällan är normalfördelat. (Brooks, 2008) Detta diskuteras närmare i avsnitt 3.4.1. De multivariata versionerna av informationskriterierna AIC och SIC uttrycks enligt: MAIC = log Σ + 2 k" T (3.13) MSIC = log Σ + 2 k" T log(t ) (3.14) där Σ är varians-kovarians matrisen av residualerna, T är antal observationer och k totala antalet regressorer i alla ekvationer. Dessa informationskriterier bestraffar kvadratsumman av residualerna RSS när fler laggar läggs till. Därför eftersträvas det lägsta värdet på informationskriterierna för att välja ut optimalt antal laggar. 3.3.3 Prognoser med VAR Fördelen med VAR-modeller är att prognoser endast beror på tidigare värden på variablerna vilket gör att modellens form inte förändras under prognosperioden. (Lütkepohl, 2005) Prognos för Y!!! : ŷ T+1 = δ + Φ 1 y T + Φ 2 y T 1 +... + Φ m y t m+1 ŷ T+2 = δ + Φ 1 y T+1 + Φ 2 y T +... + Φ m y t m+2 ŷ T+h = δ + Φ 1 y T+h 1 + Φ 2 y T+h 2 +... + Φ m y t+h m (3.15a) (3.15b) (3.15c) 2 Frekvensen i datamaterialet kan även avgöra valet av antalet laggar. För månadsdata används 12 laggar, för kvartalsdata använd 4 laggar och så vidare. (Brooks, 2008) 10

3.4 Modelldiagnostik Modellbyggandet av VAR-modeller är av liknande slag som AR-modeller. Vid behandling av finansiell data är det nästan utopiskt att datat uppfyller alla kriterier. Det är därför lite av en konstform att bygga bra VAR-modeller, mycket trial and error samt att olika av avvägningar krävs. (Gujarati & Porter, 2009) Då varje enskild variabel i en VAR-modell bestäms utifrån dess tidigare värden samt de historiska värdena på andra variabler i modellen, kan man genomföra dynamiska prediktioner vilket innebär att det görs prognoser för alla variabler samtidigt för en period framåt i tid. Dessa prognosvärden används i sin tur för att fortsätta proceduren för ytterliga en period framåt. 3.4.1 Normalfördelning och heteroskedasticitet För att formellt testa om residualerna är normalfördelade använder vi Jarque-Bera normalitetstest (Jarque och Bera, 1980). Testet utgår från egenskaperna hos en normalfördelning där skevheten(s) och kurtosis (K) hos residualerna jämförs. Skevheten mäter till vilken grad en fördelning inte är symmetrisk kring medelvärdet och kurtosis eller toppighet mäter hur tjocka svansarna är. S = E! " ε 3 # $ (σ 2 ) 3 2 K = E! " ε 4 # (3.16) $ (σ 2 ) 2 ε är feltermerna och σ! är variansen som estimeras utifrån OLS-regressionen. Därefter beräknas det univariata Jarque-Bera testet genom följande teststatistika: " JB = N S 2 $ # 6 + (K 3)2 24 % ' & (3.17) där N är urvalsstorleken och S och K följer ovanstående definition. Jarque och Bera formulerade dessa idéer om att koefficienterna för skevhet och för excess kurtosis gemensamt är noll vilket innebär at S = 0 och K = 3. Under nollhypotesen att residualerna är normalfördelade följer testet en asymptotisk χ! -fördelning med två frihetsgrader. Om p värdet av teststatistikan är skilt från noll förkastas nollhypotesen 11

för normalfördelning i residualerna. För att testa för heteroskedasticitet i residualerna används White-test (White, 1980). Utifrån det univariata fallet där: Y i = β 1 + β 2 x 2i + β 3 x 3i +ε i (3.18) erhålls estimerade residulerna ε!. Sedan estimeras följande hjälpregressionen : ˆε i = α 1 +α 2 x 2i +α 3 x 3i +α 4 x 2 2i +α 5 x 2 3i +α 6 x 2i x 3i + v i (3.19) Under nollhypotesen att det inte råder heteroskedasticitet i residualerna urvalsstorleken N gånger R! asymptotiskt χ! - fördelat med lika många frihetsgrader som antalet regressorer minus konstanten. I vårt fall är det fem frihetsgrader. Om χ! - värdet överskrider vald signfikansnivå råder ingen heteroskedasticitet utan a! = a! = a! = a! = a! = 0. I VAR-modeller motsvaras frihetsgraderna av m gånger n där m = k(k + 1)/2 är antalet korsprodukter och n är antalet termer i hjälpregressionen. är 3.4.2 Granger kausalitetstest När VAR-modellen innehåller många laggar är det svårt att utröna vilken kombination av laggade variabler som har respektive inte har signifikant inverkan på de beroende variablerna. För att lösa problemet introducerade Granger (1969) ett kausalitetstest där avsikten var att avgöra om en tidsserie har en signifikant roll att prediktera framtida utfall hos en annan. En tidsserie y! sägs Granger-orsaka y! om värden på y! ger statistisk signifikant information om framtida värden på y!. Det vill säga y! har förmågan att prediktera y!. Testet estimeras genom följande regressioner: n y 1t = α i y 2t i + β j y 1t i +ε 1t i=1 n i=1 (3.20) n n y 2t = γ i y 2t i + δ j y 1t i +ε (3.21) 2t i=1 Feltermerna ε!! och ε!! antas vara okorrelerade. Nuvärdet av variabel y! i ekvation (3.20) är en funktion av dess egna tidigare värden samt den andra variabelns tidigare i=1 12

värden. En förutsättning för att genomföra testet är att alla variabler skall vara stationära. Testet genomförs med F-testet där: F = (RSS R RSS UR ) / m RSS UR / (n k) (3.22) m är antalet skattade parametrar och k är totalt antal skattade parametrar. I första steget av testet regresseras y!! med alla dess laggade värden för att återfå RSS! som är den begränsade kvadratsumman av residualen. I nästa regression där den andra variabelns laggade värden inkluderas återfås den obegränsade residualkvadratsumman RSS!". Under nollhypotesen att den andra variabelns laggade värden inte påverkar y!!, H! : α! = 0 = 1, 2, n, får vi reda på om y! i det här fallet Granger-orsakar y!. Man skiljer på fyra olika utfall för Granger kausalitet: 1. y! orsakar y! - De laggade termerna i y! är statistiskt skiljda från noll och de laggade termerna i y! inte är det. 2. y! orsakar y! - De laggade termerna i y! är statistisk skiljda från noll och de laggade termerna i y! inte är det. 3. Ömsesidig kausalitet - De laggade termerna i y! och y! är statistisk signifikanta. 4. Oberoende - De laggade termerna i varken y! eller y! är statistiskt signifikanta. Antalet valda laggar i testet är kritiskt för riktningen på kausalitet. Vi kommer därför att testa för ett antal olika laggar. 3.4.3 Prognosutvärdering Eftersom vi gör prognoser för framtiden så kan vi inte uppskatta det faktiska prognosfelet, vilket endast kan göras retroaktivt. Men för att få en uppfattning om vår modells giltighet kommer vi att göra prognoser utifrån tidigare värden, till exempel från 2012 till 2014 för att se hur bra vår modell är. Prognosfelet räknas ut genom att man tar det faktiska värdet på variabeln minus prognosen. Om prognosfelet är negativt innebär det att modellen är överskattad och 13

om prognosfelet är positivt är modellen underskattad. Vi kommer att använda oss av dessa två mått: Medelabsolutprocentfel, MAPE är inte beroende av skalan på den beroende variabeln utan är ett relativt prognosmått. Att använda sig av MAPE som prognosmått kan ge problem ifall man har data som visar nollvärden då man inte kan dividera med noll. MAPE = 1 n!!!! y! y! y! (3.23) Medelabsolutfel, MAE mäter det absoluta medelvärdet på prognosfelet i faktiska tal. MAE = 1 n!!!! y! y! (3.24) 14

4 Resultat 4.1 Stationäritet Figur 4.1 Stationäritet 1,000,000 960,000 920,000 880,000 840,000 800,000.03.02.01.00 -.01 -.02 -.03 760,000 -.04 03 04 05 06 07 08 09 10 11 12 13 14 03 04 05 06 07 08 09 10 11 12 13 14 I ett första steg för kontroll av stationäritet granskades tidsserierna för respektive variabel grafiskt. I vänster figur (4.1) visas tidsserien för BNP i fasta priser från första kvartalet år 2003 till och med tredje kvartalet 2014 enligt y!. Grafen visar på en tydlig uppåtgående trend under tidsperioden vilket indikerar att väntevärdet har ändrats under peioden och serien är således icke-stationär. Vi valde att transformera serien till logaritmerad form för att minska på skevheten. Utifrån ACF-diagrammet i Appendix B (Figur B.2) råder tydliga tecken på icke-stationäritet då koefficienten för autokorrelationsfunktionen startar vid ett högt värde vid första laggen (0.914) och avtar därefter långsamt. Den logaritmerade BNP-serien testades därefter för enhetsrot i det utökade Dickey-Fuller testet. Först vid en förstadifferentiering, y! y!!! = ΔY! = ε!, uppvisade serien tydligare tecken på stationäritet med ett konstant medelvärde (höger Figur 4.1). ADF testet gav ett p-värde på 0.0013 vilket tillät oss att förkasta nollhypotesen för enhetsrot vid samtliga signifikansnivåer. I Appendix B finns resultaten för samtliga variabler där ACF-diagrammet samt iteraktionsordningen för samtliga variabler redovisas. Serien för hushållens konsumtion logartimerades och differentierades av första ordningen för att erhålla stationäritet. Variabeln arbetslöshet användes i sin grundform men krävde differentiering av första ordningen för att bli stationär. Räntan å andra sidan uppfyllde kravet i sin grundform utan att transformeras. I fortsättningen används de logaritmerade och differentierade serierna för BNP och konsumtion då stationäritetskravet är starkare än vid icke logaritmerade serier. 15

4.2 Granger kausalitetstest I våra modeller har vi med så kallad prior kunskap enligt makroekonomisk teori valt ut fyra variabler som påverkas av en ändring i ränteläget. För att testa detta statistiskt tillämpades Grangers Kausalitetstest. Tanken bakom testet är som tidigare förklarat att om variabel X Granger-orsakar variabel Y så bör förändringar i variabel X även påverka framtida förändringar i variabel Y. Genom cause(1) kommandot i Eviews skattade vi en bivariat VAR(1) modell för kombinationen mellan bolåneränta och varje variabel 3. Nollhypotesen är att testvariabeln inte Granger-orsakar motvariabeln. Tabell 4.1: Granger Kausalitetstest Variabler 2 laggar 4 laggar 6 laggar 8 laggar ränta y i y i ränta ränta y i y i ränta ränta y i y i ränta ränta y i y i ränta Log (BNP) 0.0014** 0.0026** 0.0044** 0.0453* 0.03* 0.04* 0.0226* 0.1985 Arbetslöshet 0.0005** 0.0027** 0.0039** 0.0054** 0.0026** 0.0221* 0.0276* 0.1136 Log(EHK) 0.0065** 0.0851 0.0134* 0.0009** 0.2825 0.0001*** 0.5427 0.0020** p- värde *<0.05, **<0.01,***<0.0001 Utifrån ovanstående resultat kan vi konstatera att valet av antalet laggar är kritiskt för testet. VAR (1) modellen uppvisar ömsesidig kausalitet upp till sjätte laggen för alla tre variabler (undantag för konsumtion mot ränta vid andra laggen). I fallet av två och fyra laggar förkastas samtliga nollhypoteser på högst fem procents signifikansnivå vilket innebär att det föreligger ett ömsesidigt samband (punkt 3 avsnitt 3.4.2) för alla tre variabler under den kvartalsvisa tidsperioden 2003 till 2014. Vid sex och åtta laggar visar resultaten att det inte föreligger något statistiskt urskiljbart samband mellan flera av variablerna i de parvisa Granger-testen. Därmed kan vi bekräfta att valet av variabler är relevanta för våra kommande modeller. 4.3 VAR- modeller Vi kommer nu skapa tre modeller för att undersöka hur en räntechock motsvarande en sänkning av ränteavdraget påverkar svensk BNP, konsumtion och arbetslöshet. Vi 3 Då varje test (totalt tre) inkluderar två variabler hanterar vi en så kallad bilateral kausalitet. 16