Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics

Transkript

1 Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics ATT MODELLERA SVENSK INFLATION -ett univariat perspektiv MODELING SWEDISH INFLATION -a univariate approach Mathias Damm och Philip Havossar Handledare: Pär Stockhammar Självständigt arbete 15 högskolepoäng inom Statistik III, vt 2013

2 SAMMANFATTNING: I denna studie undersöks univariata modellers prognoskapacitet avseende KPI-utvecklingen i Sverige mellan 2003 och KPI-data för perioden 1980 till 2009 har i sekventiell ordning använts för att estimera modeller som sedan skapat prognoser. Prognoserna utvärderades via en jämförelse med Finansdepartementets prognoser som gjorts i anslutning till vårpropositionerna 2003, 2006 och 2009 och budgetpropositionerna 2005 och Prognosutvärderingen gjordes med måtten, och samt Diebold-Marianos teststatistika. Inför prognoserna utvecklades tre modeller: en -, en - och en -modell. Vi fann att prognoserna som genererats av dessa modeller låg mycket nära varandra vilket tycktes indikera att G -effekterna under prognosperioden var begränsade. Avseende prognoskapaciteten fann vi, om vi exkluderar prognosen från år 2008, att kvaliteteten på Finasdepartementets prognoser i jämförelse med modellprognoserna, på kort frist var högre. Då kvaliteten på modellprognoserna för år 2006 var starkt begränsad för alla tidshorisonter, framlägger vi hypotesen att de univariata modeller som utvecklats i denna studie har svårt att fånga en vändning i ekonomin som inträffar efter prognostillfället. Om prognosen från 2006 exkluderas uppvisade dock de univariata modellerna viss prognoskapacitet där prognoskvaliteten på medelfrist samt på lång sikt var likvärdig eller bättre än kvaliteten på Finansdepartementets prognoser. I den avlutande diskussionen framlägger vi möjligheten av att, på olika sätt, låta modellerna inkludera en exogen variabel för att öka modellernas känslighet för framtida konjunkturomsvängningar.. 1

3 INNEHÅLLSFÖRTECKNING: 1. Inledning Bakgrund Konsumentprisindex som inflationsmått Att modellera inflation Syfte, metod och upplägg Data och hjälpmedel 5 2.Metoder och teori Grundläggande begrepp Tidsserieanalys och vitt brus Stationäritet Heteroskedasticitet Test av Stationäritet ARIMA-analys MA-modeller AR-modeller ARIMA-modeller Test av heteroskedasticitet Ljungbox Q-statistika Lagrange Multiplier Test ARCH-modeller GARCH-modeller Icke-linjära modeller EGARCH TAR och SETAR Modellutvärdering Informationskriterier Residualanalys och modellval Halveringsmetod Prognosutvärdering Prognosmått Diebold-Marianos DM-test Prognoser av ARMA1,12 och variansprognoser av GARCH1, Resultat Stationäritet Heteroskedasticitet Modellutprövning och halveringsmetod Modelldiagnostik Prognsoresultat Utvärdering på kortfrist Utvärdering på medelfrist Utvärdering på lång sikt Begränsningar i DM-test Tolkning av resultat Studie av data mellan Slutsatser och diskussion Diskussion Slutsatser 33 5.Referenser 34 APPENDIX A 35 APPENDIX B 44 2

4 1.INLEDNING 1.1 Bakgrund Ämnet för den här studien uppkom i samarbete med Pär Stockhammar vid prognosenheten på Finansdepartementet som uttryckt ett intresse av att undersöka olika tidsseriemodellers potentiella prognoskapacitet, avseende KPI-utveckling på kort och medelång sikt, och då särskilt att jämföra kvaliteten mellan sådana modellers och Finansdepartementets prognoser. Prognosenhetens prognostiseringsarbete karaktäriseras av en ner-ifrån-och-upp -process där först prognoser för KPI:s olika delar, som exempelvis energipriser, boendekostnader och varor & tjänster, görs separat. Dessa prognoser aggregeras sedan ihop, enligt en viktning som SCB fastställt, till en prognos av KPI. För Finansdepartementet är de prognoser på kortfrist om 11 respektive 18 månader som ges årligen i slutet av januari respektive juli de viktigaste. Prognoserna ges då till regeringen som beslutsunderlag för den planerade ekonomiska politiken i vårpropositionen respektive höstbudgeten. Prognoserna för vårpropositionen innehåller även prognostiserade värden upp till 23 månader och dessa kallas då medelfristprognoser och avser utgöra underlag för den ekonomiska politiken på medellång sikt. Även prognoser 1 på längre sikt bifogas vars främsta syfte får sägas vara indikativt då osäkerheten är stor. 1.2 Konsumentprisindex som inflationsmått I Sverige används sedan 1950-talet vanligen konsumentprisindex KPI som mått på inflation. Sverige har sedan 1999 en självständig Riksbank som genom att kontrollera den så kallade styrräntan försöker reglera inflationsutvecklingen till den årliga takten om 2 %. En effekt på KPI är att en räntehöjning från Riksbanken i sig blir inflationsdrivande genom ökade räntebetalningar varför man också använder sig av det närliggande måttet KPIF där hänsyn till räntebetalningar för bostadslån tagits. För Riksbanken blir således den förväntade KPI-utveckling central när styrräntan sätts. Om 1 Till skillnad mot prognoserna på kortfrist och medelfrist, finns inget uttalat syfte med dessa prognoser. Skälen till att vi valde att jämföra modellprognoserna även mot dessa prognoser var att vi tyckte det skulle vara av intresse att undersöka modellernas prognoskapacitet även på längre sikt. 3

5 Riksbanken uppfattar att inflationen väntas stiga över 2 % kommer den att höja räntan och det omvända om inflationstrycket väntas sjunka under 2 %. Förutom Riksbankens räntesättningar är också KPI-utvecklingen viktig för förståelsen av hur realinkomsterna förändras och är således en viktig indikator på den totala välståndsutvecklingen i landet. Slutligen har KPI-utvecklingen också en central betydelse för hur olika mått inom socialförsäkringssystemet skall uppdateras. 1.3 Att modellera inflation Enligt neoklassicistisk nationalekonomisk teori kan inflationen beskrivas som en relation i Phillipskurvan och i den förväntningsutvidgade Philipskurvan. Inflation och förändringen av inflation kan enligt dessa teorier beskrivas av tidsförskjuten inflation men också av exogena variabler som arbetslösheten i relation till den så kallade potentiella arbetslösheten och företagens prispåslag. Föresatsen i studien är att undersöka möjligheten av att beskriva inflationen i Sverige, i form av utvecklingen av KPI, utan att dessa exogena variabler med nödvändighet ingår i den förklarande modellen. Till skillnad mot Finansdepartementet försöker vi alltså här modellera huvudaggregatet, KPI, direkt. Huvudfrågan är alltså om det går att skapa univariata tidsseriemodeller med rimliga prognoser utan att variabler som fångar marknadens effektivitet eller arbetslöshetsnivån ingår som förklarande variabler. I Sverige är den svenska växelkursen sedan 1992 given till en rörlig kurs och vi har idag, som nämnts, också en självständig Riksbank som försöker kontrollera inflationsutvecklingen. Inte heller Riksbankens agerande eller förväntade agerande kommer att innefattas av modellerna, utan endast de tidsförskjutna värdena i tidsserien själv. Linjära tidsserieanalyser av olika makroekonomiska data är idag vanliga och -modellens upphovsman och tillika pristagare av Riksbankens ekonomipris till Alfred Nobels minne, Robert Engle, skattade 1982 en -modell för den brittiska inflationen som vi berör under avsnitt 2.5. Fyra år senare skattade Tim Bollerslev en -modell, som alltså är en vidareutveckling av -modellen, för den amerikanska inflationen. Med utgångspunkt från dessa ekonometrins pionjärer skattas i denna uppsats, med hjälp av historiska KPI-data från och med 1980, både - och -modeller i syfte att prognosticera den svenska inflationen under perioden Syfte, metod och upplägg I den här studien undersöks univariata modellers prognosförmåga i jämförelse med Finansdepartementets prognosresultat för fem prognoser mellan Upplägget av studien följer i stort Box-Jenkins tre rekommenderade faser för modellselektion: identifikationsfasen, estimationsfasen och undersökande av diagnostik Box och Jenkins, Vi inleder med att undersöka möjligheten av att etablera en stationär serie av den KPI-serie fram till och med 2003 som erhållits från Finansdepartementet. Därefter undersöker vi om denna serie uppvisar tecken på heteroskedasticitet. Utifrån resultaten i nämnda test försöker vi sedan ta fram modeller med tillfredsställande residualdiagnostik och prognosförmåga. De bästa modeller vi lyckas frambringa kommer härefter att få ge prognoser för år Utifrån de successiva resultaten för åren 2003,2005,2006,2008 och 2009 kommer sedan modeller att utvecklas och prognosticera respektive år. Vi simulerar alltså för varje prognos att vi bara har data fram till tidpunkten för prognosens början men ej därefter. Vi inleder med att utvärdera prognoserna på kortfrist där , och motsvarar de 11 första månaderna och och motsvarar de 18 första månaderna. Därefter utvärderas prognoserna på medelfrist där , och motsvarar månad 12 till 23, , och motsvarar hela 23-månadersperioden samt där 2008.L och 4

6 2009.L motsvarar perioderna från prognostillfällena till och med oktober I jämförelsen av resultaten kommer vi att genomföra ett så kallat Diebold-Mariano test för att se om prognoserna på signifikansnivån 5 % kan skiljas i kvalitet från Finansdepartementets prognoser. Därefter kommer vi att genomföra eventuella eftertester av datamaterialet för att försöka förklara eventuella brister hos våra modeller och kunna hypotisera eventuella utvägar härtill. I del 2 följer den teoretiska bakgrunden till de test och modeller som omfattas av uppsatsen. I del 3 följer resultaten från undersökningen och kortfattat hur dessa kan förstås. Uppsatsen avslutas i del 4 med en sammanfattande diskussion där slutsatser, alternativa angreppssätt samt hypoteser om potentiella vidareutvecklingar redovisas. 1.5 Data och hjälpmedel Från Finansdepartementet fick vi data med prognoser från 2003, 2005, 2006, 2008 och 2009 samt de historiska KPI-data som fanns tillgängliga inför varje prognos. Prognostillfälllena får anses representera de senaste 10 årens makroekonomiska klimat, där de tre första prognoserna till skillnad mot de två senare sker på betryggande avstånd till konkursen i Lehman Borthers och den därpå följande krisen. KPI före 2008 har i omgångar med mycket små justeringar reviderats i efterhand, men för att prognoserna på ett rättvist sätt skall kunna jämföras används alltså Finansdepartementets data. För KPI-data efter februari 2009 använder vi SCB:s indextal med basår 1980 och årsmedeltalet 100. Den mjukvara som användes är SAS version 9.3 och Excel I SAS användes kommandot PROC ARIMA för analys av KPI-tidsserien, skattning av autokorrelationer, skattning och jämförelse av -modeller samt prognostisering med hjälp av dessa modeller. Dickey-Fullers -test genomfördes med ett makrokommando. PROC AUTOREG användes för heteroskedasticitetstest och för utprövande av -modell. PROC VARMAX användes för att skatta och utvärdera -modeller samt utföra prognoser. För den fullständiga koden se appendix 5. För transformeringar, beräkning av,, och Diebold-Marianos DM-statistika användes Excel

7 2. METODER OCH TEORI 2.1.Grundläggande begrepp Tidsserieanalys och vitt brus Inom tidsserieanalys försöker man identifiera regelbundenheter hos en tidsserie och med hjälp av dessa konstruera en modell som reflekterar dessa regelbundenheter. Serien av feltermer t, som återstår när man subtraherar tidsserien med den av modellen skattade serien, karaktäriseras då i idealfallet som Gaussiskt vitt brus. I den sistnämnda residualserien är feltermerna icke-korrelerade och normalfördelade med väntevärde 0 och varians 1. Avvikelser från den av modellen beskrivna serien är i detta fall således slumpmässiga. Modellerna som utvecklas inom tidsserieanalys kan sedan vara ett verktyg till att beskriva och/eller skapa prognoser av en given tidsserie Stationäritet Huruvida en serie uppfyller villkoret om stationäritet eller ej är av fundamental betydelse i tidsserieanalys och då speciellt för de autoregressiva modeller avsnitt som kommer att användas i den fortsatta analysen. För att återknyta till föregående avsnitt så är också alla vitt brus processer stationära även om det omvända inte gäller. När stationäritet nämns i fortsättningen av denna studie åsyftas svag stationäritet och med detta avses då att det förväntade värdet av är konstant och således inte beror på tidpunkten och att den så kallade autokovariansfunktionen, definierad i villkor ii nedan, endast beror på tidsförskjutningen och inte tidpunkten. Det senare innebär att kovariansen mellan två observationer endast beror på tidsavståndet mellan dessa i serien och inte på de tidpunkter som svarar mot dessa observationer. Kriteriet för svag stationäritet sammanfattas i i och ii nedan. Av ii följer iii som innebär konstant varians för serien Heteroskedasticitet Ett fundamentalt antagande för många modeller inom tidserieanalys, exempelvis för de modeller som behandlas under punkt 2.3.3, är att den givna serien är homoskedastisk det vill säga att villkor iii i ekvation 2.1 är uppfyllt. Många ekonomiska tidsserier uppfyller dock inte detta villkor. I vissa fall uppvisar sådana serier då istället så kallad villkorlig heteroskedasticitet som innebär att de under vissa begränsade turbulenta perioder uppvisar förhöjd varians medan variansen sett i ett längre perspektiv, den så kallade icke-villkorliga variansen, är konstant. För dessa serier behöver vi utveckla volatilitetsmodeller, av exempelvis typen eller, som tar hänsyn till och utnyttjar informationen i variansmönstret. 6

8 2.2 Test av stationäritet De modeller med autoregressiva komponenter som används i denna uppsats kräver att given tidserie är stationär. För varje serie gäller det således att först testa för stationäritet och sedan om det krävs transformera serien så att den uppfyller detta villkor. För att undersöka om en serie uppvisar ickestationäritet studerar vi först diagram av den så kallade autokorrelationsfunktionen avsnitt Icke-stationäritet karaktäriseras av att autokorrelationerna i dessa diagram är signifikanta och långsamt avtagande. I det fallet att icke-stationäritet misstänks genomförs Dickey-Fullers utökade augmented stationäritetstest ADF. I ADF-testet undersöker vi om en given serie är en slumpvandring,, där och för något tidsavstånd. En slumpvandring är inte stationär då de ackumulerade feltermerna,, orsakar att variansen för serien blir en funktion av tiden då. Slumpvandringen bryter alltså mot villkor ii i ekvation 2.1 och är således inte stationär. Då processen som bäst beskriver är okänd undersöker vi också separat dels möjligheten att serien beskriver en slumpvandring med konstant, och dels möjligheten att den beskriver en slumpvandring runt en deterministisk trend. Grundtanken i ADF-testet är att vi, om vi kunde regressera på förändringen av och då inte kan förkasta att tvingas acceptera möjligheten av en enhetsrot vilket alltså är detsamma som att tvingas acceptera att serien är en slumpmässig vandring av något slag, och således icke-stationär. Dickey-Fuller visade att under ovan nämnda nollhypoteser är teststatistikan fördelad och följaktligen att stationäritet kan testas för en diskussion om testet och -fördelningen se Dickey och Fuller, Anledningen till att det utökade testet, ADF-testet, görs är att det ursprungliga testet DF inte är giltigt då feltermerna är autokorrelerade. Då autokorrelation mellan feltermerna inte kan uteslutas för KPIserien utför vi sålunda ADF-testet i den kommande analysen. För att justera för autokorrelerade feltermer lade Dickey-Fuller i ADF-testet till termen, där bakåtoperatorn B skall förstås så att och. För ett ADF-test av potentiell rot på tidsavstånd ett följer regressionerna, för var och en av nollhypoteserna, nedan: 2.2 Värdet på m skattas automatiskt i SAS med hjälp av utvärderande av olika informationskriterier som exempelvis AIC avsnitt För den tidsserie som vi nu för en given ordning inte kan förkasta en nollhypotes för, får vi alltså anta att serien inte är stationär och differentiera tidsserien enligt denna ordning och genomföra testet ånyo. 2.3 ARIMA-analys MA-modeller 7

9 Ekvation 2.3 beskriver en Moving Average - process av ordningen. En -modell kan alltså ses som en funktion där beskrivs av ett intercept, en vitt-brus -term samt de tidsförskjutna felen med tillhörande parametrar. Om k är tidsförskjutningen kan man också visa att följande gäller för en -process: E = { { I ekvation som följer av att ser vi att väntevärdet är konstant vilket i kombination med ekvation 2.6 innebär att alla -processer är stationära. Ekvation beskriver den så kallade autokovariansfunktionen som i sin tur beskriver vilken kovarians som finns mellan en observation och en tidigare observation i serien med tidsförskjutningen k, det vill säga y t-k. Ekvation 2.7 som följer av ekvationerna 2.5 och 2.6 beskriver den så kallade autokorrelationsfunktionen. Vad gäller så karaktäriseras en -process av signifikanta autokorrelationer på tidsförskjutningarna 1,2. funktionen utgör således ett instrument att identifiera av vilken ordning en förmodad -process rimligast beskrivs av. Den partiella autokorrelationsfunktionen beskriver autokorrelationer mellan t.ex. och när vi kontrollerar för de mellanliggande autokorrelationerna som för och är:,,..,. Det typiska -mönstret för en -process utgörs av ett exponentiellt avtagande och/eller sinusidalt mönster. Ett nödvändigt villkor för att -processer skall kunna vara skattningsbara är att de uppfyller villkoret om invertibilitet. En -process är exempelvis invertibel om. Generellt har en invertibel -process rötter vars absolutvärde är mindre än 1, det vill säga att <1, för polynomet i ekvation AR-modeller Ekvation 2.9 beskriver en autoregressiv process av ordningen. I en -process beskrivs således som en funktion av för serien egna tidsförskjutna värden upp till. För en stationär -process kan visas att sambanden i ekvationerna 2.10, 2.11 och 2.12 gäller. 8

10 , k=1, Man kan vidare visa att ekvation 2.13 som beskriver för AR-processen fås då man dividerar ekvation 2.11 med ekvation Av autokorrelationsfunktionen i ekvation 2.13 kan vi se att autokorrelationerna för en -process består av summan autokorrelationer från alla tidigare tidsförskjutna autokorrelationer. Detta leder till att den typiska -karaktäristiken för en process utgörs av ett exponentiellt avtagande och/eller sinusidalt mönster. -karaktäristiken, för -process är dock att den uppvisar signifikanta autokorrelationer upp till tidsavståndet. Då en -process kännetecknas av att den har signifikanta autokorrelationer upp till en tidsförskjutningen q och ett exponentiellt avtagande och/eller sinusidalt mönster för så gäller -process som har signifikanta partiella autokorrelationer upp till alltså det omvända för en tidsförskjutningen p och ett exponentiellt avtagande och/eller sinusidalt mönster för -process är alltid invertibel men skall för att kunna skattas vara autokorrelationerna. En -process att den är stationär om <1. Generellt har en stationär. Exempelvis gäller för en -process rötter vars absolutvärde är mindre än 1, det vill säga att <1, för stationär polynomet i ekvation ARIMA-modeller - och -komponenter, så kallade För processer som består av kombinationer av -processer, är det inte lika enkelt som för dessa modeller separat att identifiera värdena på och. De villkor som är ställda på - och -processerna gäller dock även för processerna det vill säga att -komponenten enligt specificeringen ovan skall vara invertibel och att -komponenten på motsvarande sätt skall vara stationär. Då man undersöker möjligheten av att beskriva en tidsserie med en -modell kan det visa sig att tidsserien inte är stationär. För att åstadkomma stationäritet kan serien som nämnts differentieras. Om det visar sig att första, och om den visar sig ickedifferensen är stationär kan vi modellera en på serien av. Kombinationer av dessa går stationär på säsongsbasis kan vi differentiera den enligt också bra och under avsnitt 3.1 kommer vi exempelvis att differentiera vår serie enligt Om och avser - respektive -komponenterna på säsongsavståndet s, P och Q dessa komponenters ordning, d differentieringen och D säsongsdifferentieringen för gäller t.ex. att d=d=1 så fås en som, för skiftande ordningar, kan skrivas: 2.4 Test av heteroskedasticitet Om en serie är homoskedastisk så gäller att = =. Testen som följer nedan testar på olika sätt om seriens kvadrerade residualer,, är korrelerade med de tidsförskjutna kvadrerade residualerna,, så att gäller för vissa Ljungbox -statistika Detta test inleds med att vi tar fram en serie av kvadrerade residualer,, som erhålls från den bäst avbildande - eller regressionsmodellen. Om T är antal skattningsfel och n antalet tidsförskjutningar upp till vilka vi vill testa nollhypotesen skattas urvalsvariansen sedan enligt: 9

11 där under nollhypotesen är chi-två-fördelad med n frihetsgrader. Om nu >. kan vi således förkasta nollhypotesen om att ingen förekomst av -fel upp till tidsförskjutningen n detekterats, det vill säga vi kan förkasta att de tidsförskjutna kvadrerade felen på tidsavstånd upp till n inte är seriellt korrelerade med varandra Lagrange Multiplier Först tar vi fram en serie av kvadrerade residualer, på samma sätt i som föregående avsnitt1. Därefter regresseras felen på de tidsförskjutna felen. För ett test av ordningen q används ekvation 2.19: 2.19 Tanken med testet är att om nu de kvadrerade feltermerna är icke-korrelerade så bör förklaringsgraden av ekvation 2.19, vara liten. Givet att residualer beräknas är teststatistikan chitvå-fördelad med q frihetsgrader under nollhypotesen. Om nu förklaringsgraden är för stor, så att, kan vi förkasta nollhypotesen om att ingen förekomst av -fel detekterats, det vill säga nollhypotesen att termerna inte är seriellt korrelerade förkastas modeller I -analysen ovan har det förutsatts att serien är homoskedastisk. Om signifikanta resultat nu uppträder i de ovan nämnda heteroskedacitetstesten gäller inte antagandena för -analysen och vi behöver utveckla modeller som hanterar det heteroskedastiska mönstret. Modeller som har visats sig framgångsrika i att hantera och utnyttja informationen i serier som uppvisar villkorlig heteroskedasticitet är - och -modeller. För att skatta en -modell skattar man -modell. När det nu inledningsvis en -modell. Ponera i detta hypotetiska fall att vi har en visar sig att t -termen i den estimerade modellen inte följer ett homoskedastiskt mönster behöver vi hantera detta. Om vi nu antar att feltermerna följer något som skulle kunna liknas vid det mönster vi etablerade i -modellen ovan så kan vi modellera serien enligt de metoder som utvecklats av Engle Engle, Antag att feltermerna,, kan beskrivas enligt ekvation 2.20: [, där ] = [ ] 1 I denna studie regresseras den differentierade serien av KPI, wt. på tiden, t. Då PROC AUTOREG saknar stöd för MAkomponenter undersökte vi även möjligheten att genomföra testet på en serie residualer från en AR36-modell, men då resultatet inte märkbart avvek från det första testet, valde vi testet med den enklare regressionen. 10

12 I ekvationen 2.20 gäller alltså att men inte är en vitt-brus-term och att den föränderliga variansen som beror av de realiserade värdena i -serien, det vill säga den villkorliga eller betingade variansen, är ekvation Om vi nu simultant skattar vår -modell och variansen h t får vi: Eftersom modellerna skattas simultant kan det nu hända att en eller flera variabler I den ursprungliga -modellen, den nuvarande nivåekvationen, visar sig icke-signifikanta när vi tagit hänsyn till det heteroskedastiska mönstret hos feltermen. I detta fall estimerar vi om modellerna utan dessa variabler. För positiv och ändlig obetingad varians krävs, då, att: Engle lät skatta den brittiska inflationen mellan med en -modell. Till skillnad från de univariata modeller som undersöks i denna uppsats inkluderade Engle också den tidsförskjutna realönen i nivåekvationen. Engle fann att inflationen bäst beskrevs med en -modell och kunde med hjälp av denna också visa hur variansen hos inflationen förändrades mellan olika perioder. Sammanfattningsvis kan det sägas att då -modellen använder sig av mer information än exempelvis en -modell i det att den identifierar det heteroskedastiska mönstret hos feltermen, så blir detta mönster för -modellen en tillgång. Givet att mönstret som ges av korrekt beskriver den betingade variansen kan nu också mer exakta konfidensintervall för prognoser skattas modeller En vidareutveckling av -modellen ovan är -modeller som fångar det fall att felet följer ett så kallat Generellt Autoregressivt Schema. Den betingade variansen följer då ett autoregressivt mönster jämförbart med i -modellen. Variansekvationen beskrivs i så fall bättre av: 2.25 Bollerslev presenterade -modellen Bollerslev, som ett alternativ till -modellen då han ansåg att den senare modellens restriktioner ekvation 2.24 var alltför begränsande. Bollerslev belyste att man med -modellen, på grund av reststriktionen om icke-negativa parametrar tvingades införa en arbitrary declining lag structure för att fånga mönstret hos de historiska chockerna. För att kunna ge bättre punktskattningar och konfidensintervall lät Bollerslev nu modellera den amerikanska inflationen mellan 1948 och 1983 med hjälp av en -modell. Han utgick från Engle s -ekvation men estimerade en univariat modell utan reallön och lade till en -komponent av första ordningen i variansekvationen. Han testade sedan nollhypotesen att och fann att denna parameter var signifikant. -modellen som skattas ovan skrivs. Svårigheter att identifiera ordningen gör att man idag vanligen använder modellerna och se t.ex. Tsay, 2010, s.134. Man kan slutligen visa jämför med ekvation 2.36 nedan att ändlig obetingad varians kräver att: 11

13 2.7 Icke-linjära modeller En modell av typen exponentiell, en så kallad -modell Nelson, 1991, tillåter assymmetriska chocker, det vill säga att negativa och positiva chocker tillåts påverka variansskattningarna med olika styrka. Finansiella tidsserier präglas t.ex. ofta av att volatiliteten än av positiva Denna assymmetri tenderar att öka mer av negativa chocker fångas nu med hjälp av absoluttecknen i ekvation modellen standardiserar vidare de tidsförskjutna feltermerna i variansekvationen samt kräver inte restriktionen för ändlig varians som specificerats i ekvation Variansekvationen för en modell av typen skrivs: I den avslutande diskussionen hypotiserar vi möjligheten av att utpröva en så kallad Threshold Autoregressive Model eller -modell Tong, TAR-modellen består förutom tidsseriemodeller av en indikatorvariabel och ett tröskelvärde Om vi hypotetiskt estimerat en -modell för hela serien så kan man nu exempelvis undersöka en 2-regims -modell enligt: { Om indikatorn kan beskrivas av tidsförskjutna värden i serien själv kallas modellen för. Med en dummyvariabel skattas - och -modellerna från serieavsnitt där respektive råder. I avslutningen av denna uppsats diskuterar vi möjligheten av att finna en exogen indikatorvariabel som kan identifiera ett tröskelvärde med vilket vi kan identifiera vilka avsnitt av serien som ligger i hög- respektive lågkonjunktur. Om vi tänker oss att motsvarar exempelvis förändring av BNP så kommer ett värde över, för detta, innebära att exempelvis modell ii skattar/prognosticerar observationen ifråga istället för modell i. Stöd finns för att TAR-modellen är effektiv i att exempelvis prognosticera BNP se t.ex. Potter Modellutvärdering Informationskriterier För att jämföra hur väl potentiella modeller beskriver en serie kan man använda sig av olika mått på goodness of fit. I denna uppsats används två mått: Akaikes informationskriterium och Schwartz Bayesian Criterion. Dessa kan, om n motsvarar antalet skattade parametrar, de kvadrerade residualerna och antalet observationer, skrivas enligt ekvationerna 2.29 och 2.30: 12

14 En modell med ett lägre värde på måtten 1 i ekvation 2.29 och 2.30 är, allt annat lika, att föredra framför en modell med högre värde på desamma. Av två modeller med samma kvadratfel så får den med flest parametrar högst. Detta görs då ett stort antal parametrar i en modell automatiskt tenderar att öka goodness of fit jämfört med modeller med få parametrar. Idealt sett vill man att bägge måtten väljer samma modell. tenderar att hårdare bestraffa för tillägg av parametrar än och enligt exempelvis Walter Enders bör man, allt annat lika, välja den modell med lägst snarare än den med lägst, vid stora urvalstorlekar Enders, 2010, s RESIDUALANALYS OCH MODELLVAL Det första steget i modellutvärderingen är att kontrollera så att alla koefficienter är signifikanta. Det gäller även att undersöka magnituden hos paramaterskattningar och kontrollera för parameterstabilitet. Därefter gäller det att undersöka residualerna som bildats då modellens skattade serie subtraherats från den realiserade serien. I utvecklandet av en -modell kan det vara till god hjälp att undersöka plottar av - och -diagrammen av residualerna. Idealt skall residualerna uppträda slumpmässigt och autokorrelationerna skall inte vara signifikanta på något tidsavstånd eftersom modellen skall beskriva dessa. I det fallet att residualerna är autokorrelerade finns det således skäl att misstänka att någon annan bättre modell skulle kunna utnyttja informationen i denna systematik. Mönstren specificerade under punkt och används således i arbetet att ta fram modeller. Med Ljung-Box Q-teststatistika det s.k. Portmonnä-testet kan också undersökas om residualerna sammantaget jointly upp till ett givet tidsavstånd är autokorrelerade. Om vi återvänder till ekvation 2.18 och för beräknar autokorrelationen av residualerna istället för de kvadrerade residualerna så är denna statistika chitvå-fördelad med K-p frihetsgrader. K motsvarar nu upp till vilken ordning av autokorrelationer vi gör testet och p antalet parametrar. Om nu > X 2 K-p 0.05 kan vi alltså förkasta nollhypotesen att residualerna inte är autokorrelerade upp till ordningen K. Då vi i det kommande undersöker modeller med respektive utan -komponent inkluderas i analysen även Durbin-Watsons klassiska test DW av första ordningens autokorrelation. Ur tabell avläses med hjälp av urvalsstorleken,, och antalet parametrar,, kritiska värden för två mått och. Följande gäller för -statistikan: Då förkastas nollhypotesen att residualerna inte är positivt autokorrelerade, då förkastas nollhypotesen att residualerna inte är negativt autokorrelerade, då kan ingen nollhypotes förkastas samt då eller och urvalsstorleken ges DW-statistikan av: kan inget konklusivt sägas. Om är de skattade residualerna Givet att serien är normalfördelad så skall även residualerna, vid rätt modellval, vara normalfördelade. Detta testas enklast via QQ-plottar och histogram av residualerna. Normalfördelning kan också formellt testas genom Jarque-Bera s teststatistika JB enligt: [ ], Detta är ett sätt att skriva måtten på, då det finns olika transformationer av dessa mått som alla väljer samma modell. 13

15 där n svarar mot urvalstorleken, S skevheten och K kurtosis eller toppigheten för en diskussion om dessa mått se t.ex. Gujarati och Porter, 2009, appendix A. Nollhypotesen är att residualerna är normalfördelade vilket då svarar mot att S=0 och K=3. Teststatistikan är asymptotiskt chitvå-fördelad med två frihetsgrader och om p-värdet faller under signifikansnivån får vi förkasta nollhypotesen om normalfördelning. Slutligen bör beaktas om mjukvaran kräver ett stort antal iterationer innan konvergens vid Maximum-Likelihood - estimeringen av modellerna. Om iterationerna konvergerar långsamt kan detta indikera att modellen ifråga är instabil se t.ex. Enders, HALVERINGSMETOD Att en modell får låga - respektive - värden är dock inte ekvivalent med att prognosförmågan hos modellen är god. Om man använder hela datamaterialet till att etablera modeller så uppstår ett metodologiskt problem: vi har inget data kvar med vilket vi kan kontrollera om modellen beskriver ett verkligt samband. Eventuellt råder sambandet endast för den skattade serien. För att undersöka vilken prognosförmåga en modell har kan man använda sig av så kallad halveringsmetod. Metoden förklaras i det följande: antag att man har 200 observationer och att man delar upp datamaterialet i två delar, i form av en serie bestående av de första 150 observationerna och en serie bestående av de sista 50 observationerna. Antag vidare att modellerna skattas med hjälp av den första serien och att dessa modeller sedan får skapa prognoser för den andra serien. De prognosticerade värdena kan nu jämföras mot observationer, från vilka vi ej skattat modellen. Därefter kan de mått och test som definieras i avsnitt 2.9 användas för att utvärdera modellernas relativa prognosförmåga. 2.9 Prognosutvärdering Prognosmått Ekvationen ovan beskriver prognosfelet för det realiserade värdet prognosen för samma tidpunkt som gjorts vid tidpunkt vid tidpunkt och. I uppsatsen används tre olika mått,, och för att utvärdera modellernas prognosförmåga. Det första, Mean Absolute Deviation, beskriver medelvärdet av de absoluta avvikelserna mellan de realiserade värdena och en modells prediktion vilket, i sammanhanget för denna uppsats, kan skrivas enligt: Mean Squared Error ger oss medelvärdet av de kvadrerade avvikelserna från de realiserade värdena och kan för uppsatsens prognosjämförelser skrivas enligt: Mean Absolute Percentage Error ger oss procentfelen i medeltal av modellens absoluta prediktionsfel, vilket i sammanhanget för uppsatsen kan skrivas enligt: 14

16 Diebold-Marianos DM-Test Med måtten i avsnitt kan man få en uppfattning av olika modellers prognosprestationer, men vi kan inte konklusivt besvara frågan om relativ prognosförmåga då skillnaderna hypotetiskt kan vara slumpmässiga. Traditionellt har man utfört F-test för att bestämma relativ prognosförmåga. För att statistikan skulle vara F-fördelad krävdes då bland annat att prognosfelen var normalfördelade och inte seriellt korrelerade. Diebold och Mariano utvecklade ett test som varken krävde normalfördelade residualer eller att residualerna inte var autokorrelerade Diebold och Mariano, I den urspungliga versionen användes en normalfördelad teststatistika, men i denna studie används en t-fördelad statistika som bland annat rekommenderas av Enders se t.ex Enders, 2010, s. 88. Enligt -testet väljs först en förlustmodell, g av prognosfelet. Förlustmodeller kan t.ex. vara ga = eller gb =. -testet tillåter alltså användaren att själv specificera kostnaden och är inte bunden att använda kvadrerade prognosfel, som t.ex. F-testet krävde. Testet görs på följande sätt. Vi antar att prognoserna består av vardera värden och prediktionsfelet för modell ett och två är respektive. Vi beräknar nu differenserna di=g -g och medeldifferensen. Autokovarianserna estimeras också från serien. Standardavvikelsen av skattas sedan enligt: och då 2.10 Prognoser av, kan nollhypotesen om lika prestationsförmåga förkastas. -1,12 och variansprognoser av 1,1 Studiens prognoser, skattas med iterationsteknik och i det följande exemplifieras proceduren med en j-stegsprognos av en -modell. Då prognoserna från en är väntevärdesriktiga, då och, ges j-stegs-prognosen vid tidpunkt t för av: { Prognoserna,, fås sedan genom iteration där Då ARMA-modellen är stationär fås även att =, det vill säga prognosen konvergerar mot det långsiktiga medelvärdet då tidsavståndet ökar. För J-stegsprognosen av den betingade variansen,, för en modell gäller följande: Eftersom variansen och felet är känd vid tidpunkt får vi med ekvation 2.25 att och då får vi med ekvation 2.25 också att: 15

17 3.RESULTAT 3.1 Stationäritet w w w t t FIGUR 3.1a FIGUR 3.1b 300 t FIGUR 3.1c I figur 3.1a som beskriver tidsserien av KPI mellan framgår tydligt att serien inte är stationär. Vi transformerade serien med förstadifferensen och lät utföra ett ADF-test ekvation 2.2 ii med hjälp av ett makrokommando i SAS. P-värdet 0 rapporterades för enhetsrot på tidsavståndet 1. -diagrammet för serien av förstadifferensen antydde dock att serien kunde vara icke-stationär på tidsavståndet 12 figur 3.2a Testet genomfördes således även på tidsavstånd 12 och ett p-värde om 0.2 rapporterades. Vi kunde således inte förkasta nollhypotesen om att säsongsrot förekom. Följaktligen differentierade vi serien ånyo genom att multiplicera alla värden med. Den nya serien verkade stationär figur 3.2b. Vi genomförde ADF-testet ånyo på tidsförskjutningarna 1,6 och 12 och kunde på alla rimliga signifikansnivåer förkasta nollhypotesen att serien inte var stationär. FIGUR 3.2a FIGUR 3.2b 3.2 Heteroskedasticitet Om vi för ett ögonblick återvänder till figur 3.1c så kan vi konstatera att vår differentierade serie tycks uppvisa perioder av förhöjd varians. I mitten av serien, det vill säga från slutet av åttiotalet och fram till nittiotalets mitt, återfinner vi kraftiga svängningar som tycks avvika från det långsiktiga medelvärdet. Vi misstänker sålunda att serien uppvisar heteroskedasticitet och genomförde formella -test och -test. I tabell 3.1 rapporteras, för serien från , signifikanta -fel på tidsförskjutningarna upp till 3 med och tidsförskjutningarna upp till 11 och 12. En slutsats av detta resultat är alltså hypotetiskt att -modeller är 16

18 otillräckliga i att fånga den skiftande variansen hos feltermen. Föresatsen är nu att undersöka möjligheten av att etablera och/eller -modeller med nivåekvationer bestående av utprövade -modeller. Vi noterar att -effekter uppmätts på stora tidsavstånd -modell. tidsförskjutningarna 11 och 12 vilket tycks indikera behovet av en - eller TABELL 3.1 Order Q Pr > Q LM Pr > LM < < < < Modellutprövning och Halveringsmetod FIGUR 3.3a FIGUR 3.3b Om vi för ett ögonblick återvänder till figur 3.2 b så ser vi att den transformerade serien uppvisar ett intressant -och -mönster. Vi utläser en tydligt signifikant autokorrelation på tidsavstånd 12 och ett exponentiellt avtagande av signifikanta partiella autokorrelationer på tidsavstånden 12, 24 -komponent eller möjligen av en och 36. Detta tycks kunna beskrivas av en -process av -process estimerats och högre ordning. I figur 3.3b ser vi residualdiagnostiken av en subtraherats från serien och i figur 3.3.a motsvarande residualdiagnostik för en process. Vad gäller -och -mönstren så ser, förutom en knappt signifikant autokorrelation -modellen klarar portmonnäpå tidsavstånd 23, diagnostiken tämligen god ut. Vi noterar att testet bättre än -modellen. Med de två modellerna ovan undersökte vi vidare möjliga kombinationer som kunde ge låga värden på och tillfredsställande diagnostik på, och 17

19 i portmonnä-testet. De modeller som vi efter detta valde att testa med halveringsmetod var nu, Diagnostiken för de två senare,, och redovisas i figur 3.4a och 3.4b. Vi delade härpå upp tidsserien i två delar, en serie som svarade mot KPI fram till och med december 2001, och en serie från januari till december för Våra modeller estimerades nu från den första serien och fick prognosticera den andra serien, varpå prognoserna utvärderades. Resultaten följer i tabell 3.2. FIGUR 3.4a FIGUR 3.4b TABELL 3.2 AIC MA12 AR12,24,36 ARMA1,12 AR1,12,24, , , , , , , , ,437 1,669 2,098 1,623 2,184 SBC MAD MSE MAPE 3,638 5,043 3,437 5,496 0,0061 0,0077 0,0059 0,0080 I tabell 3.2 ser vi att -modellen har lägst och men något högre än modellen. Prognoserna finns representerade i figur 3.5a. Då -modellen får lägst värden på och i kombination med den relativt tillfredsställande residualdiagnostiken illustrerad i figur 3.4b, fick detta bli vår första modell inför prognosen Då serien uppvisade signifikanta -fel under punkt 3.2 undersökte vi nu möjligheten av att bilda - eller -modeller för att hantera och dra nytta av dessa störningar. När vi bildade en -modell med vår i nivåekvation fann vi att - men inte -komponenten visade sig signifikant. Under avsnitt 3.2 noterade vi låga p-värden för -fel på tidsförskjutningarna upp till 1,2, 11 och 12. Efter visst utprövande fann vi att 1,2,12 med vår i nivåekvationen hade lägst AIC samt klarade portmonnätestet bäst av de utprövade modellerna. -modellen kom således att bli vår andra modell inför prognosen Modellen skattades med data fram till och med december 2001, för den differentierades serien wt, och kunde för denna förprognos skrivas enligt ekvationerna 3.1 och AIC och SBC beräknad under PROC ARIMA. AIC och SBC i appendix för prognoserna beräknades i PROC VARMAX på den differentierade serien varför resultaten från dessa två olika beräkningssätt ej är jämförbara med varandra. 18

20 Då heteroskedasticitetstesten indikerat -fel av hög ordning ville vi även undersöka möjligheten av en -modell. Enligt den strategi för modellselektion som Box-Jenkins utvecklat betonas stringens parsemony i modellutformningen, varför vi prövade att estimera en -modell med endast -komponenten i nivåekvationen. -komponenten visade sig nu signifikant, även om portmonnätestet fortsatt inte var tillfredsställande. Vi valde dock att låta -modellen vara den tredje modellen inför prognosen 2003, då vi ansåg det teoretiskt intressant att undersöka hur en -modell skulle uppträda i de kommande prognoserna. -modellen, estimerad från serien fram till och med december 2001, följer i ekvation 3.3 och Modelldiagnostik Diagnostiken för -, - och -modellerna, inför prognosen 2003, kan avläsas i tabell A1 och A2 i appendix A. Vi noterar att ARIMA modellen får lägst och ä Diagrammen i appendix A avslöjar också att samtliga modeller har en svagt signifikant autokorrelation på tidsavståndet 23. För - och -modellerna visar sig Portmonnä-testet White Noise Indicator vara icke-signifikant på alla tidsavstånd medan - modellen uppvisar signifikanta Q-värden på flertalet tidsavstånd. Vi kan alltså inte förkasta nollhypotesen om vitt brus för - och -modellen men för -modellen. Samtliga modeller fick, med undantag för -modellens intercept signifikanta parameterskattningar. Särskilt höga t-värden noterades för -komponenten. Resultatet avseende - och - diagrammen och Q-värdena i Ljung-Box teststatistika för prognoserna 2005,2006, 2008 och 2009 överenstämde i princip med de från 2003, även om - och -modellen uppvisade en svagt signifikant autokorrelation på tidsavstånd 7 i prognosen från 2008 samt att -modellen uppvisade några signifikanta Q-värden i samma prognos. Gällande informationskriterierna uppmätte ömsom - ömsom -modellen lägst värden. Avseende DW-statistikan uppmättes låga DW-värden för alla GARCH-prognoser, vilket alltså torde vara en effekt av att modellen saknade 1-komponent. Inget konklusivt besked hurivida autokorrelation förelåg kunde dock ges då. Eventuellt är serien således endast mycket svagt autokorrelerad av första ordningen. Vidare visade sig alla parametrar, med undantag för vissa intercept 2, signifikanta för de övriga prognoserna. Antalet konvergensiterationer i SAS var genomgående större för - och -modellen än för modellen, vilket måhända förklaras av att de senare modellerna är mer komplexa. Parameterskattningarna var någorlunda stabila för de fem prognoserna och koefficienten för -komponenten, som tycktes vara modellens centrala komponent, rörde sig runt 0,7 för samtliga modeller och tidsserier. Avseende normalfördelningsantagandet kunde vi konstatera att JB-testet visade sig signifikant för samtliga prognoser och modeller, och vi var därmed tvungna att förkasta nollhypotesen om normalfördelning. Histogrammen över residualerna, i appendix A, antyder också en större toppighet 1 *, ** och *** är notationen för signifikans på och respektive. 2 Intercepten behölls dessa då dessa var signifikanta för ARCH- och GARCH-prognoserna 2003, 2005 och 2006, samt att prognosförmågan försämrades då intercepten exkluderades. 19

21 än vad som karaktäriseras av en normalfördelning även om de ser någorlunda symmetriska ut. Detta indikerar att fler observationer än under normalfördelning samlas kring värdet noll. Vi noterar också att svansarna verkar tjockare än under normalfördelning. Vi undersökte vidare möjligheten att etablera en 1,1-modell1 för att hantera det faktum att normalfördelningsantagandet var ifrågasatt. Resultaten indikerade visserligen att AIC, om än marginellt, sjönk i jämförelse med motsvarande -modell, men också att residualerna fortsatt, enligt testen inte kunde inrymmas i en normalfördelning. Prognosförmågan för modellen var inte heller märkbart bättre än för -modellen. När vi testade KPI-serien från 1992 och framåt fann vi dock att p-värdet förbättrades, tyvärr inte med så mycket att testet blev icke-signifikant. Vi antog dock att fördelningen var approximativt normalfördelad. Vår hypotes är att de kraftiga svängningar som karaktäriserar KPI-serien under visa kortare perioder, särskilt under slutet av åttiotalet och början av nittiotalet skapat outliers som inte inryms i en normalfördelning. I appendix A kan de standardiserade residualerna och prediktionsfelen avläsas och vi ser att de största avvikelserna samlas mellan observation 100 och 200. Att frågor uppstod om normalfördelningen gjorde dock att vi fortsättningsvis fick iaktta försiktighet vid tolkning av signifikansnivåer på parameterskattningarna. -komponenten fick exempelvis i alla test mycket höga t-värden, vilket då alltså ska ses i ljuset av fördelningen inte fullt uppfyller villkoret om normalfördelning. Då uppsatsen främst syftar till att skapa och utvärdera prognoser, där konfidensintervallen för dessa är av sekundär betydelse, får vi således delvis förlita oss på att halveringsmetoden lett oss rätt vad gäller modellval. Undersökningar av finansiella data på olika marknadsplatser har dock visat att dessa data inte alltid är normalfördelade Stockhammar, 2009, s. 3 och om man är av åsikten att antagandet om approximativ normalfördelning är för stark för vår serie är man hänvisad till Icke-linjära modeller. Utmaningen ligger då i att på ett effektivt sätt kunna utnyttja informationen i de autokorrelationer som uppmärksammas i denna uppsats. I den avslutande delen föreslås att en utvidgad undersökning med fördel även skulle kunna inkludera en TAR-modell. 3.5 Prognosresultat Som nämnts i inledningen utvärderas i nästa avsnitt prognoserna på kortfrist, där , och motsvarar de 11 första månaderna februari till december år 1 och och motsvarar de 18 första månaderna juli år 1 till december år 2. I det därpå följande avsnittet utvärderas prognoserna på medelfrist där , och motsvarar månad 12 till 23 januari till december år 2, , och motsvarar hela 23-månadersperioden februari år ett till december år två. I avsnitt utvärderas prognoserna på längre sikt, där 2008.L och 2009.L, motsvarar perioderna juli 2008 t.o.m. oktober 2012 respektive juli 2009 t.o.m. oktober PROC AUTOREG i SAS har endast stöd för autoregressiva komponenter i nivåekvationen, varför ingen ARMA-EGARCH kunde utprövas Utvärdering på kortfrist 20

22 3.5.1 Utvärderande på kortfrist 1 TABELL 3.3 PROGNOS FD ARCH GARCH ARIMA ,25-0, t MSE 1, , , , MAD 1, , , , MAPE 0, , , , t17-1,29-1,50-1, MSE 0, , , , MAD 0, , , , MAPE 0, , , , t10 ***-3,25 **-3,11 ***-3, MSE 0, , , , MAD 0, , , , MAPE 0, , , , t17 *1,84 **2,69 **2, MSE 58, , , , MAD 6, , , , MAPE 2, , , , t10 ***-3,52 **-3,03 **-2, MSE 1, , , , MAD 0, ,73 2, , MAPE 0, , , ,73503 I tabellen nedan ovan kan resultaten för kortfristprognoserna , , och utläsas. För , får prognosen från Finansdepartementet FD lägst och, men nollhypotesen kan inte uteslutas då t-värden mellan - 0,71 och -0,25 rapporteras. I figur 3.5b kan vi utläsa att våra modeller under- respektive överestimerar utvecklingen före respektive efter månad tre. Mellan månad 3 och 6 tycks modellerna prestera bättre än prognosen från FD, men sämre i övrigt. För kan vi i figur 3.5c se att modellerna i väsentlighet fångar utvecklingen för de åtta första månaderna, men underestimerar utvecklingen därefter. Låga t-värden om mellan -1,29 och -1,50, liksom figur 3.5c avslöjar att FD:s prognos i betydligt högre grad fångar den realiserade utvecklingen. I figur 3.5d ser vi att våra modeller kraftigt underestimerar utvecklingen medan FD:s prognos framstår som träffsäker. T-värden mellan och gör att vi förkastar nollhypotesen för samtliga modellprognoser. För 2008 fick våra prognoser relativt höga t-värden i spannet från 1,8 till 2,69 och vi kunde förkasta nollhypotesen för -och -prognoserna. Samtliga värden på och var i förhållande till övriga prognoser höga men lägre än för FD:s prognos. Utvecklingen i figur 3.5e illustrerar också att prognoserna från våra modeller ligger närmare utfallet än FD:s prognos. För ser vi i figur 3.5f att våra modeller överestimerar utvecklingen för hela perioden samt att FD:s prognos tycks ligga närmare utfallet för de 10 första månaderna. Lägst värden på och rapporteras unisont för FD:s prognos och t-värden mellan 2.82 och gör att vi kan förkasta nollhypotesen för samtliga modeller. 1 *, ** och *** är notationen för förkastande av H0 på och respektive. 21

23 FIGUR 3.5a FIGUR 3.5b FIGUR 3.5c 22

24 FIGUR 3.5d FIGUR 3.5e FIGUR 3.5f 23

25 3.5.2 Utvärderande på medelfrist TABELL 3.4 Medelfristprognoser FD GARCH ARIMA ***3,74 ***3,78 ***3,86 21, , , , MAD 4, , , , MAPE 1, , , , ,42 1,51 1,44 MSE 12, , , , MAD 2, , , , MAPE 1, , , , t11 **-2,83 **-2,75 **-2, MSE 1, , , , MAD 0, , , , MAPE 0, , , , t22 *-1,81 *-1,86 *-1, MSE 0, ,045 52, , MAD 0, , , , MAPE 0, , , , t11 0,76 1,14 1, MSE 13, , , , MAD 3, , , , MAPE 1, , , , t22 0,24 0,48 0, MSE 7,7462 7, , , MAD 2, , , , MAPE 0, , , , PROGNOS t MSE t ARCH I tabell 3.4 kan resultaten för medelfristprognoserna , , och utläsas. För kan vi utläsa t-värden mellan 3,74 och 3,86 och vi kan förkasta nollhypotesen till modellprognosernas fördel. Lägst och fick -modellen. I figur 3.6a ser vi att modellprognoserna ligger närmast utfallet för hela perioden. Även för rapporterar modellerna lägre värden på och. I figur 3.6b ser vi att våra modeller tycks ligga närmare det realiserade resultatet men då t-värden i spannet mellan 1,42 och 1.51 rapporteras kan vi inte förkasta nollhypotesen. För och rapporteras unisont lägre värden på och för FD:s prognos samtidigt som låga t-värden rapporteras. I figur 3.6c och 3.6d ser vi att FD:s prognos, till skillnad mot modellprognoserna, huvudsakligen fångar den realiserade trenden. För rapporterar -prognosen lägst och, men t-värden mellan 0,77 och 1,20 gör att vi kan inte förkasta nollhypotesen för någon modell. För kan vi i figur 3.6e se att FD:s prognos tycks ligga något närmare utfallet månad 3 till 8, men längre ifrån på de övriga månaderna. För rapporteras t-värden mellan 0,24 och 0,62 och vi kan inte heller här förkasta nollhypotesen. Lägst och får -prognosen. I figur ser 3.6f ser vi att våra modeller fram till månad 23 överestimerar utvecklingen medan FD:s prognos underestimerar den för hela perioden. 24

28 3.5.3 Utvärdering på lång sikt Tabell 3.6 Långtidsprognoser PROGNOS FD 2008.L T 2008.L MSE 2008.L ARCH GARCH ARIMA *1,39 **1,7 *1,6 107, , , ,33994 MAD 9, , , , L MAPE 3, , , , L T *1,48 *1,59 *1, L MSE 38, , , , L MAD 5, , , , L MAPE 1, , , , För våra två långtidsprognoser från 2008 och 2009 rapporterar samtliga modellprognoser lägre värden på prognosmåtten än vad FD:s prognos gör. -prognosen får lägst värden och och ett t-värde om 1,70. I figur 3.7a kan vi följa 2008.L och vi ser att varken våra modellers eller FD:s prognos förutser nergången hösten 2008, då samtliga prognoser överskattar utvecklingen. För 2009 fick GARCH-modellen lägst och. Den får dock ett lägre tvärde än -prognosen då den skattade standardavvikelsen i DM-testet var lägre för modellens prognos. I figur 3.7.b ser vi att modellprognoserna ligger närmare den realiserade utvecklingen efter månad 20. Nollhypotesen kunde dock inte förkastas för någon prognos då tvärden mellan 1.48 och 1,62 rapporteras. 3.6 Begränsningar i DM-test En svårighet med beräkningen av Diebold-Marianos DM-statistika är att osäkerhet i skattningarna av autokovarianserna uppstår i det fall att färre än 50 observationerna finns att tillgå se t.ex. Montgomery, 2008, s. 30. Ytterligare en svårighet är att autokovarianser för tidsförskjutningar endast tillförlitligt kan beräknas upp till ett värde av 25 % av prognosseriens längd se t.ex. Montgomery, 2008, s. 30. Vi antog således att de resterande autokovarianserna närmade sig 0. Risken finns här således för att variansen underskattas och att vi då begår ett typ II-fel. De t-värden som rapporterats för 11- och 12-månadersprognoserna ovan bör alltså tolkas med extra stor försiktighet och vikt bör läggas vid att tolka dessa i kombination med att måtten och utvärderas. Speciellt bör resultaten för prognoserna från 2005 och 2006 tolkas särdeles försiktigt, osäkerhet i skattningarna av autokovarianserna kan eventuellt för dessa utvärderingar orsaka att t-statistikan inte blir signifikant trots stora skillnader gällande och. Ytterligare ett skäl att utvärdera samtliga prognosmått är att valet av förlustfunktion i form av kvadrerade prognosfel eventuellt skulle kunna påverka statistikans utslag. Givet dessa begränsningar följer en tolkning av resultaten i det kommande avsnittet. 27

31 3.7 Tolkning av prognosresultat Om vi för ett ögonblick undantar prognosen från 2008, tycks resultaten indikera att modellprognoserna är sämre än prognoserna från Finansdepartementet på kortfrist. Nollhypotesen kunde förkastas för och och för och rapporterades lägre värden på prognosmåtten för Finansdepartementets prognos. Prognosen från 2008 undantagen låg Finansdepartementets för dessa utvärderingar mellan 0,13 och 0,37 medan för våra modeller låg mellan 0,44 och 1,25. För att återvända till prognosen från 2008 var den rimligaste förklaringen, till att våra modeller presterade signifikant bättre prognoser än Finansdepartementet, förmodligen att finanskrisen inträffade i samband med att investmentbanken Lehman Brothers oförutsägbart gick i konkurs. Hela KPI-kurvan försköts således ner se figur 3.5c och vår modell kom att ligga närmare den realiserade utvecklingen. Om vi för ett ögonblick undantar prognosen från 2006 så tycktes prognoserna uppvisa viss slagkraftighet på medelfrist och för de två långsiktsprognoserna1. För dessa prognoser uppmättes positiva t-värden för samtliga modeller. Även lägre värden än Finansdepartementets prognoser avseende och uppmättes generellt för våra modeller. För -prognoserna var samtliga mått lägre än för prognoserna från finansdepartementet. Givet nämnd osäkerhet i variansskattningarna uppmättes också relativt höga t-värden för samtliga modeller för , samt 2009.L. För kunde nollhypotesen för samtliga modellprognoser förkastas. Modellprognoserna från 2006 och 2005 lyckades dock betydligt sämre än övriga modellprognoser att fånga KPI utvecklingen. Vår hypotes är att modellernas - respektive - komponent har svårt att fånga riktningen i en konjunkturuppgång respektive konjunkturavmattning om de närmast föregående åren inte innefattar denna trend. I figur 3.7c ser vi för -modellen med KPI-serien utsträckt 24 månader bakåt i tiden. Man kan där notera att prognosen fångar trenden hos KPI-serien för denna 24-månadersperiod. I figur 3.7d ser vi motsvarande diagram för modellen och Prognosen fångar även i detta fall trenden i den föregående perioden men misslyckas alltså med fånga den accelererade utveckling som sker efter att prognosen gjorts. Utvecklingen för prognoserna från 2008 och 2009 som kan avläsas i figur 3.6e och 3.6f visar ungefär detsamma, det vill säga att modellerna prognosticerar den trend som föregåtts prognostillfället. Vi ser här alltså en potentiell begränsning med vår modell: modellerna kan inte prognostisera på ett rimligt sätt om prognostillfället föregås av en period som har en annan trend än den för vilken modellen skall prognostisera. Med andra ord klarar modellerna inte av att prognostisera väl om prognostillfället ligger före en vändning i ekonomin. Trendriktningsändringen blir således exogent given för de univariata modellerna som vi utvecklat här. Problemet med okänslighet för konjunktursvändningar berör trots vissa framgångar som beskrivits ovan alla våra prognoser. Kastar man exempelvis en blick på figur 3.7b så ser man att vår modell prognostiserar en jämn trend och helt missar den accelererade utvecklingen mellan månad Studie av data mellan Utifrån ovanstående resultat, där prognoserna från våra modeller var svårskiljbara, valde vi att genomföra en efteranalys och ånyo undersöka datamaterialet med LM- och Q-test. Testen gjordes för perioderna som Sverige haft fast respektive rörlig växelkurs. Vi fann att datamaterialet var starkt heteroskedastiskt mellan tabell 3.7a. För perioden tabell 3.7b hittades -fel, men serien tycktes homoskedastisk upp till de andra visserligen indikationer på 1 Prognosserierna från modellerna, på den differentierade serien, konvergerade strax före månad 23 i flertalet av prognoserna, varför den prognosticerade utvecklingen efter denna månad huvudsakligen är en effekt av differentieringen. Den senare delen av kurvan i långtidsprognoserna speglar alltså snarast säsongsvariationen hos serien. Effekten blir att serien upprepar sig själv. 30

32 tidsavstånden. Därefter modellerade vi vår estimerad enbart på den senare serien. Vår bedömning är att residualerna låg nära vitt brus för denna modell. Vi redovisar inte resultatet här men prognosförmågan för denna modell var dock begränsad. I diskussionen som följer hypotiserar vi eventuella begränsningar och möjligheter som detta skulle kunna tänkas innebära. TABELL 3.7a test KPI TABELL 3.7b test KPI Order Q Pr > Q LM Pr > LM Order Q Pr > Q LM Pr > LM < < < <

33 4.DISKUSSION OCH SLUTSATSER 4.1 Diskussion Om vi för ett ögonblick återvänder till figurerna 3.5b, 3.5c, 3,5d, 3.6a, 3.6b och 3.7b så kan vi se att modellprognoserna, stundtals precist avbildar det realiserade förloppet, även om kapaciteten att fånga rätt nivå varierar. Under avsnitt 3.7 uppmärksammade vi att modellernas prognoskapacitet vad gäller trend, och följaktligen nivå, begränsades i det att modellerna var okänsliga för att fånga vändningar i ekonomin som inträffar efter det att prognosen utfärdats se figur 3.7d. En möjlighet att öka känsligheten för framtida konjunkturomsvängningar skulle kunna vara att låta modellerna inkludera ytterligare en variabel. En sådan variabel skulle exempelvis kunna vara Engle s reallön, arbetslöshetsnivån, BNP, realräntan eller ett aggregat av importpriser. I det fall att denna variabel avslöjar en kommande konjunktursförändring innan den syns i KPI-serien, skulle modellerna eventuellt då bättre kunna fånga de realiserade förloppen redovisade i figur 3.5c januari till december och 3.5d. En annan slutsats som kan dras av prognosutvärderingarna var att -modellen presterade i paritet med -modellen och möjligen bättre än -modellen. Kastar man en blick på diagrammen för prognoserna finner man att modellprognoserna ofta är svåra att särskilja, och det är möjligt att den gemensamma -komponenten ensam är den avgörande modellkomponenten. Med anledning av ovan blev vi intresserade av att undersöka seriens heteroskedastiska status ånyo. Under 1980-talet bedrevs en radikalt annorlunda penningpolitik än vad man gör idag. Vi hade fast växelkurs och under flera tillfällen devalverade man kronkursen mot utländska valutor för att stärka konkurrenskraften gick vi över till fast fastväxelkurs och såsmåningom fick vi en självständig Riksbank med inflationsmål. Hypotetiskt kan alltså mönstren för dessa avsnitt av tidsserien skilja sig åt. Vi undersökte därför som redovisats under avsnitt 3.8 serien på nytt avseende heteroskedasticitet. Vi fann i och med detta indikationer på att materialet var starkt heteroskedastiskt under perioden , men att effekterna avtar för perioden Därefter modellerade vi fram en -modell utifrån den senare tidsperioden, med mycket god residualdiagnostik. Den visade sig dock ha begränsad prognosförmåga. En hypotes för att förklara detta resultat är att datamaterialet sedan 1992 innehåller för lite information för att univariata prognosmodeller skall kunna använda sig av serien med framgång. Att mönstret avseende heteroskedasticitet skiljer sig åt för de olika perioderna måhända förklaras av att Riksbanken genom att kontrollera KPI-utvecklingen gjort tidsserien fattigare på information och då eventuellt också homoskedastisk. Hypotetiskt skulle detta senare då kunna innebära att man begränsat den möjliga informationsmängden för våra volatilitetsmodeller. En tänkbar utväg för den som under denna hypotes vill modellera inflationen med data från 1992 och framåt skulle i så fall liksom i fallet med åtgärder för att öka känsligheten för konjunkturomsvängningar vara att införa ytterligare en variabel i modellernas nivåekvationer. Denna uppsats syftade dock till att undersöka univariata modeller, för KPI-serien från , varför vi lämnar fältet öppet för sådana undersökningar. Perioden sedan mitten av 1990-talet fram till finanskrisen 2008 har också av nationalekonomer internationellt karaktäriserats som the Great Moderation. Måhända bröts denna lugna period hösten 2008 och vi skulle då kunna hypotisera att - och -effekterna i en framtida prognosstudie skulle vara tydligare än de vi funnit inom ramen för denna studie. 32

34 En annan möjlighet som nämndes i avsnitt 3.4, skulle också kunna vara att undersöka möjligheten av att bilda icke-linjära modeller. Om KPI-utvecklingen beskriver regimskiften mellan hög och lågkonjunkturer, som vi hypotiserat, skulle eventuellt en -modell som specificerades i ekvation 2.28 vara ett bättre alternativ än de modeller som vi undersökt. Med en indikatorvariabel som identifierar regimskiftet i förväg, skulle vi dels kunna prognosticera när vändningen kommer och dels från vändpunkten modellera utvecklingen utifrån det konjunkturläge som då råder. Om vi återvänder till figur 3.5c skulle hypotetiskt modell i, i ekvation 2.28, kunna prognosticera fram till januari 2006 vartefter modell ii prognosticerar den fortsatta utvecklingen. Resultatet för våra modeller på medelfrist och i de två långtidsprognoserna var dock ändå tillfredsställande då utvärderingarna för 2006 undantas. för modellerna låg för samtliga dessa prognoser mellan 0,64 och 1,02 medan Finansdepartementets prognosers mätte mellan 0,69 och 1,6. Det skall dock nämnas att Finansdepartementets träffsäkra prognos från 2006 uppmätte en om 0,24 respektive 0.34, ett resultat som överträffade samtliga prestationer från våra modeller. Utifrån dessa resultat skulle alltså slutsatsen kunna dras att de univariata modeller som utvecklats i denna uppsats eventuellt skulle kunna vara ett hjälpmedel på medelfrist eller längre sikt, i tider som präglas av stor prognososäkerhet, givet att ingen vändning i ekonomin väntas ske under prognosperioden. 4.2 Slutsatser Uppsatsförfattarna tycker sig ha funnit vissa indikationer på att linjära univariata modeller, men då inte nödvändigtvis av typen eller, skulle kunna ha en viss prognosförmåga på medellång och längre sikt givet att prognostillfället inte ligger mellan två konjunkturfaser. Dessa modeller skulle då speciellt kunna vara behjälpliga under perioder som karaktäriseras av stor makroekonomisk oförutsägbarhet, då osäkerheten i prognoser är stor. För att återvända till frågeställningen i inledningen, skulle det i en fördjupad studie vara av intresse att även undersöka prognosförmågan hos modeller som också inkluderar en exogen variabel, antingen direkt i modellerna eller som indikatorvariabel i en TAR-modell. 33

35 5.REFERENSER Bollerslev, T Generazed Autoregressive Conditional Heteroscedasticity, Journal of Econometrics, 31, Box, G. och Jenkins, G Time Series Analysis, Forecasting and Control. San Francisisco, Calif.: Holden Day. Dickey, D. och Fuller, W. A Distrbution of the Estimated for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association, 74 June 1979, Diebold, F.X. och Mariano, R Comparing Predictive Accuracy, Journal of Business and Economic Statistics, 13, Enders, W Applied Econometric Time Series 3 rd. New Jersey: John Wiley & Sons. Engle, R. F Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation, Econometrica, July Volume 50 Issue 4, Gujarati, D.N. och Porter. D.C Basic Econometrics, 5 th ed. New York: McGraw-Hill. Montgomery, D.C., Jennings, C.L. och Kulachi, M Introduction to Time Series Analysis and Forecasting. New Jersey: John Wiley & Sons Nelson, D.B Inequality constraints in the univariate GARCH model. Journal of Business and Econometric Statistics, 10, Potter, S A nonlinear approach to US GNP. Journal of Applied Econometrics, 10, Stockhammar, P Icke-Linjära Ekonomiska Tidsseriemodeller, Stockholms Universitet Tong, H On a threshold model. Pattern Recognition and Signal processing, Amsterdam: Sihthoff & Noordhooff, Tsay, R. S Analysis of Financial Time Series, 3 rd ed. New Jersey: John Wiley & Sons. 34

36 APPENDIX A: Prognosticerande Modeller TABELL A1 Informationskriterier, iterationshistorik och residualdiagnostik för prognosticerande modeller MODELL/PROGNOS SBC AIC ITER JB P< DW GARCH/ ARCH/ ARIMA/ GARCH/ ARCH/ ARIMA/ GARCH/ ARCH/ ARIMA/ GARCH/ ARCH/ ARIMA/ GARCH/ ARCH/ ARIMA/ TABELL A2 Parameterskattningar för prognosticerande modeller INTERCEPT GARCH0 ARCH1 GARCH1 GARCH/2003 ** *** *** GARCH/2005 *** *** *** *** ** GARCH/2006 *** *** *** *** ** GARCH/2008 * *** *** *** ** GARCH/2009 * *** *** *** ** INTERCEPT 1 MA12 1 MA12 ** ** AR1 ARIMA/ *** ** ARIMA/ *** ** ARIMA/ *** ** ARIMA/ *** ** ARIMA/ *** *** INTERCEPT MA12 ARCH/2003 *** *** *** *** *** ARCH/2005 *** *** ** *** *** *** *** ARCH/2006 *** *** ** *** *** *** *** ARCH/2008 * *** *** *** *** *** *** ARCH/2009 * *** *** *** *** *** *** *, ** och *** är notationen signifikans på AR1 ARCH0 och ARCH1 ARCH2 ARCH12 ** *** respektive 35

37 ARCH 2003 GARCH

38 ARIMA 2003 ARCH

39 GARCH 2005 ARIMA

40 ARCH 2006 GARCH

41 40 ARIMA 2006 ARCH 2008

42 GARCH 2008 ARIMA

43 ARCH 2009 GARCH

44 43 ARIMA 2009

Visa mer