Svensk varuhandel. Tidsserieanalys över

Relevanta dokument
Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Finansiell statistik

ARIMA del 2. Patrik Zetterberg. 19 december 2012

Korrelation och autokorrelation

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Analys av egen tidsserie

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Regressions- och Tidsserieanalys - F8

Teknisk not: Lönealgoritmen

Hemuppgift 2 ARMA-modeller

Prognostisering av växelkursindexet KIX En jämförande studie. Forecasting the exchange rate index KIX A comparative study

ÖVNINGSUPPGIFTER KAPITEL 7

Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS).

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Regressions- och Tidsserieanalys - F7

Tentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Något om val mellan olika metoder

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Summakonsistent säsongrensning

Vad Betyder måtten MAPE, MAD och MSD?

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Utvärdering av Transportstyrelsens flygtrafiksmodeller

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Grundläggande matematisk statistik

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Utökade användningsområden för trafikarbetets förändring Expanded uses for the change in traffic density Magnus Kjellman

Paneldata och instrumentvariabler/2sls

Multipel Regressionsmodellen

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hemuppgift 3 modellval och estimering

Homework Three. Farid Bonawiede Samer Haddad Michael Litton Alexandre Messo. 28 november Time series analysis

MVE051/MSG Föreläsning 7

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Avsnitt 2. Modell: intuitiv statistisk

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Den framtida verksamhetsvolymen i rättskedjan - Centrala prognoser för perioden : Resultatbilaga

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

F3 Introduktion Stickprov

Regressions- och Tidsserieanalys - F4

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

F9 SAMPLINGFÖRDELNINGAR (NCT

Statistik 1 för biologer, logopeder och psykologer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Säsongrensning i tidsserier.

F13 Regression och problemlösning

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

3 Maximum Likelihoodestimering

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

, s a. , s b. personer från Alingsås och n b


Medicinsk statistik II

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Lektionsanteckningar 11-12: Normalfördelningen

F11. Kvantitativa prognostekniker

Uppgift a b c d e Vet inte Poäng

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

MVE051/MSG Föreläsning 14

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Regressionsanalys av lägenhetspriser i Spånga

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Föreläsning 12: Regression

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Dekomponering av löneskillnader

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

HYPOTESPRÖVNING sysselsättning

Transkript:

STATISTISKA INSTITUTIONEN Uppsala universitet Examensarbete C Författare: David Magnusson och Petter Samuelsson Handledare: Lars Forsberg Höstterminen 2010 Tidsserieanalys över Svensk varuhandel januari 1975 augusti 2010 0

Sammandrag Syftet med denna uppsats är att modellera och prognostisera Sveriges varuexport, varuimport och handelsnetto. Vi använder oss av data från januari 1975 till och med augusti 2010 för respektive serie. Dessa data testas och jämförs i olika ARIMA- och SARIMA-modeller samt skattas även medelst säsongsreningsprogrammet TRAMO/SEATS. För de modeller som bäst passar serierna genomförs därefter in sample- och out of sample-analyser med felmåtten RMSE och MAPE. Modellerna med bäst felmått och som därpå väljs ut för att göra prognoser för serierna till och med augusti 2012 är (3,1,0)x(0,1,1) för export, (2,1,1)x(0,1,1) för import samt (0,1,1)x(0,1,1) skattad i TRAMO/SEATS för handelsnetto. Nyckelord: SARIMA; TRAMO/SEATS; prognostisering; varuhandel 1

Innehållsförteckning 1. Inledning... 3 1.1. Avgränsning... 3 1.2. Disposition... 4 2. Tidigare studier... 4 3. Teori... 5 3.1. Tidsserieanalys... 5 3.1.1. ARMA... 5 3.1.2. Säsongsrensning... 8 3.2. Felmått... 11 3.3. Modellidentifikation... 13 3.3.1. Enhetsrotstest... 14 3.3.2. Autokorrelation... 15 3.3.3. Modellspecifikation... 16 3.3.4. Chows test... 17 4. Data... 17 4.1. Granskning av data... 21 5. Resultat... 23 5.1. Modellval... 24 5.1.1. Efter 90-talskrisen... 26 5.2. Utvärdering av modellerna... 29 5.2.1 Efter 90-talskrisen... 30 5.3. Prognoser... 32 6. Slutsats... 34 Källförteckning... 35 Appendix 1 - Plottar på förstadifferenser... 37 Appendix 2 - Korrelogram... 42 Appendix 3 - Residualplottar... 48 Appendix 4 Prognoser... 51 2

1. Inledning I en allt mer globaliserad värld där den internationella varuhandeln mellan länderna ständigt växer är Sverige inget undantag. Som ett litet export- och importberoende land är Sverige särskilt beroende av en positiv och gynnsam utveckling av den internationella handeln. Sedan år 1975 har både Sveriges export och import mångdubblats och har de senaste åren bestått av omkring 40-45 % vardera av Sveriges totala BNP, till skillnad från omkring 27-28 % år 1975. 1 Under denna tidsperiod har varuflödena emellertid ej haft en linjär och enkelt förklarad utveckling, utan de har istället varierat i viss omfattning kring en positiv trend. Detta samtidigt som finansiella kriser i omvärlden under vissa perioder har fått utvecklingen att stanna av och i vissa fall även falla. Med hjälp av tidsserieanalytiska verktyg kommer denna uppsats att modellera, diskutera och prognostisera Sveriges månatliga utveckling inom varuexport och varuimport mellan januari 1975 och augusti 2010. Samtidigt ger användandet av månadsdata en utmärkt möjlighet att närmare undersöka ifall dessa tidsserier består av trender som är mindre skönjbara i form av säsongsspecifika element och faktorer. När dessa element har hittats och när de olika serierna har passats till relevanta och förklarande modeller kommer dessa slutligen att tillämpas för att göra tvååriga prognoser för framtiden. Med antagandet att framtidens utveckling kommer att kunna förklaras på samma sätt som den gångna är det därpå möjligt att ge tidsserierna plausibla utvecklingsbanor. Syftet med denna uppsats är: Att visa hur Sveriges export, import och handelsnetto (export - import) har utvecklats. Att anpassa de mest lämpade modellerna till dessa tidsserier. Att prediktera seriernas framtida utveckling med hjälp av de bäst lämpade modellerna. 1.1. Avgränsning Denna uppsats begränsar sig till att endast använda månadsdata över Sveriges totala export och import från januari 1975 till och med augusti 2010. Metodiken som används är av univariat karaktär där vardera serie analyseras var för sig. Då dessa serier tenderar att bero på andra faktorer i hög grad är det dock vanskligt att låta datamaterialet sträcka sig över en 1 Enligt data från the World Bank. 3

längre period. Redan nu kan tidsspannet tänkas vara allt för långt, vilket dock kommer att testas genom Chows brytpunktstest som undersöker ifall effekterna är olika stora under olika delar av tidsperioden. Likaså är vi fullt medvetna över att export och import är två tidsserier som är endogena och därför skulle kunna förklaras med hjälp av flertalet övriga relaterade variabler. Samtidigt har vi inte utrymme för att testa samtliga tidsseriemodeller i denna uppsats, utan kommer därför att fokusera på modeller sprungna ur Box-Jenkins ARMAmodell. 1.2. Disposition Uppsatsen är i fortsättningen strukturerad på följande sätt: Kapitel 2 går igenom ett par tidigare tidsseriestudier inom området svensk varuhandel. Kapitel 3 bygger den teoretiska referensramen, både genom att definiera och konkretisera tidsserier och genom att redogöra för den diagnostik och de tester som är nödvändiga vid användande av tidsseriedata. Kapitel 4 beskriver de data som används i denna uppsats. Kapitel 5 visar sedan de resultat som framkommer när datamaterialet tillämpas i de modeller som beskrivs i den teoretiska delen. Kapitel 6 avslutar slutligen genom att sammanfatta uppsatsen och dra slutsatser av resultaten. 2. Tidigare studier Tidsserieanalyser över den svenska varuhandeln har inte gjorts i någon större omfattning enligt vår kännedom. I Statistiska Centralbyråns serie Bakgrundsfakta till Ekonomisk statistik författade Erkelius och Zeed uppsatsen En tillämpning av TRAMO/SEATS: Den svenska utrikeshandeln 1914 2003 (2003). I uppsatsen delades den långa perioden in i fem kortare perioder, som sedan undersöktes och analyserades i en säsongskontext. Den sista perioden 1978-2003, som även ligger närmast en jämförelse med perioden i denna uppsats, uppvisade cykler på mellan 3 och 6 år. I samband med att kronan släpptes fri i november 1992 påfanns positiva effekter på både import och export. En annan slutsats var att sommarsemestereffekten på säsongselementen, som visserligen fortfarande var stora, har minskat under periodens gång. Detta tros bero på en ökad flexibilitet över möjligheterna för anställda när de kan ta ut sin semester. 4

Tongur (2010) har i två rapporter använt sig av svensk varuhandelsdata från 1993 till och med 2008. I den ena rapporten jämfördes TRAMO/SEATS med att säsongsrensa med hjälp av en dynamisk linjär modell (DLM). Även fast den senare visar intressanta och tillämpbara resultat, kommer TRAMO/SEATS samt SARIMA att användas i vår uppsats. I den andra rapporten diskuteras huruvida direkta eller indirekta säsongsrensningsmetoder är att föredra, utan att komma fram till någon allmän regel. 3. Teori Metoden i denna uppsats är klassisk tidsserieanalysteori. Inom detta område finns en mängd olika modeller, men den som kommer att användas är ARMA-modellen vilken kan utvecklas och anpassas till olika typer av tidsseriedata. Underlaget till denna modell finns bland annat beskrivet i Box, Jenkins & Reinsel (1994). Modellerna i uppsatsen är skattade med hjälp av EViews 7. Vi har även valt att använda TRAMO/SEATS som säsongsrensningsprogram eftersom att de är standard för säsongsrensning vid bland annat SCB och Eurostat. I följande avsnitt kommer denna ARMA-modellen och vidareutvecklingar av denna att definieras och diskuteras i vilka fall den är tillämpbar. 3.1. Tidsserieanalys En tidsserie beskriver utfallet från en stokastisk process och kan definieras som * + vari är det observerbara utfallet i de på varandra följande tidpunkterna t=1,2,,t. En tidsseriemodell syftar till att beskriva och modellera den process som skapade dessa utfall. Vid erhållande av en modell som kan beskriva de historiska observerbara utfallen är det därpå möjligt att använda densamma till att prediktera framtida utfall. 3.1.1. ARMA En metod som ofta används för att modellera en tidsserie är ARMA-modellen. För att korrekt kunna modellera en tidsserie enligt ARMA-modellen behöver vissa grundantaganden vara uppfyllda. Grundkravet är att den underliggande tidsserien är svagt stationär, det vill säga att serien har konstant medelvärde och varians samt att korrelationskoefficienten mellan y t och y t-k enbart beror på längden av lag k. En serie som innehåller en stokastisk trend och därmed 5

inte är stationär kan dock differentieras för att uppnå stationaritet och benämns då som ARIMA. En ARIMA-modell består därför av tre delar; den autoregressiva delen (AR), ett antal differentieringar (I) om den ursprungliga serien inte är stationär samt glidande medelvärde-delen (MA). Följande avsnitt är baserat på Pindyck och Rubinfeld sid. 521-542. Autoregressiv modell - AR(p) Den autoregressiva modellen av ordning p är genererad av ett viktat snitt av observationer p perioder tillbaka i tiden och är definierad enligt ekvation (1)., (1) där är observationen p perioder tillbaka i tiden, är den vikt med vilken observationen för p-perioder sedan påverkar den nuvarande observationen, är feltermen och är en konstant. För att en AR-process skall vara stationär får den inte innehålla någon enhetsrot. Ett nödvändigt villkor för stationaritet är att summan av -termerna är mindre än ett. Om detta villkor inte är uppfyllt är processen en slumpvandring med postitiv trend om är större än noll och med negativ trend om är mindre än noll. I den autoregressiva modellen, liksom i glidande medelvärde-modellen (som presenteras härnäst), antas störningstermerna vara genererade av en vitt brus -process, det vill säga att slumptermerna skall vara okorrelerade över tid samt ha konstant varians och väntevärde. Varje felterm antas dessutom vara normalfördelad med medelvärde 0 och varians σ 2. Autokorrelationsfunktionen 2 i en autoregressiv modell beror på alla tidigare observationer och är normalt avtagande för en stationär process. För att ta reda på av vilken ordning en modell är autoregressiv, alltså storleken på p, används den partiella autokorrelationsfunktionen. De p första värdena i den autoregressiva modellens autokorrelationsfunktion är 2 Se kapitel 3.3.2 för en beskrivning av autokorrelationsfunktionerna. 6

,.. (2) Dessa ekvationer är Yule Walker-ekvationerna 3. Om ρ 1, ρ 2,, ρ p är kända kan ekvationerna lösas för. Detta kräver dock att vi redan vet av vilken ordning (p) modellen är autoregressiv. Det går dock att komma fram till rätt ordning genom att testa olika värden på p i Yule-Walker-ekvationen och se om värdet på p (den partiella autokorrelationen vid lag p) är signifikant skilt från noll 4. Glidande medelvärde MA(q) En glidande medelvärde-modell av ordning q är definierad som, (3) Autokorrelationen för en glidande medelvärde-process av ordning q ges av { k = 1,, q k>q. (4) Således har en glidande medelvärde-funktion av ordning q ett minne på q perioder och det är därför möjligt att, genom att undersöka vid vilka laggar autokorrelationen skiljer sig från noll, få en uppfattning om vilken ordning glidande medelvärde-processen består av. Differentiering (I) Om en tidsserie inte är stationär, det vill säga att den underliggande stokastiska processen förändras över tiden, kan serien vanligtvis differentieras en eller flera gånger för att serien ska kunna modelleras i en autoregressiv- och/eller en glidande medelvärde-modell. På motsvarande sätt kan en serie säsongsdifferentieras för exempelvis månadsdata och därmed 3 Se Pindyck och Rubinfeld sid 527-531 för härledning av Yule Walker-ekvationen 4 Om man t.ex. testar p=n och φ n är signifikant skilt från noll är det autoregressiva modellen åtminstone av ordning n. φ n är även definierat som värdet på den partiella autokorrelation för lag n. Genom att då testa p=n+1 kan man så småningom hitta vilken ordning modellen är av. 7

differentieras med avseende på 12 perioder tillbaka. En serie y t är homogent icke-stationär av ordning d ifall serien w t specificerad av ekvation (5), är en stationär serie.. (5) En metod för att upptäcka om en serie är stationär är att undersöka huruvida den har någon enhetsrot eller ej. Om serien har en enhetsrot bör den differentieras en gång för att åstadkomma stationaritet, har den två enhetsrötter bör serien differentieras två gånger och så vidare enligt samma logik vid fler enhetsrötter. ARIMA Vissa tidsserier är vare sig genererade av en ren glidande medelvärde- eller av en ren autoregressiv process, utan är istället genererade av en blandning av dessa. I fallet med en stationär tidsserie definieras för detta fall ARMA-modellen enligt. (6) Denna serie kan skrivas om till ekvation 7 med hjälp av backshiftoperatorn 5 ; ( ) ( ) (7) På liknande sätt kan ARIMA-modellen skrivas om till ( ) ( ). (8) I ekvation 7 och 8 är ( ) och ( ). 3.1.2. Säsongsrensning Tidsserier avseende ekonomisk månadsstatistik kan delas upp i dess icke-observerbara delar; trend (T), säsong (S), cyklisk (C) och irreguljära effekter (slumpmässiga) (I). Med trend åsyftas den långsiktiga utvecklingen hos serien vilken exempelvis kan bero på ekonomisk tillväxt. Säsongselement kan vara sommarsemestrar, konsumentbeteenden runt exempelvis jul 5 Backshiftoperatorn (B) står för en lag en period tillbaka i tiden. B( ) är således detsamma som och B j är lika med. 8

eller av klimatologiska eller institutionella slag. Den cykliska komponenten däremot beror på periodiska faktorer som exempelvis konjunktureffekter. Slumpdelen fångar upp det brus som existerar i serien. Andra element som kan förekomma och som också kan påverka serierna för enskilda tidpunkter eller under begränsad tid är extremvärden (E) och kalendereffekter (K). Varje observerat värde i en originalserie ser därför ut enligt ekvation (9): O T C S K E (9) Med dessa effekter försvåras tolkningen av data likaså jämförelser över tid. På grund av detta finns det därför anledning att utveckla metoder, alltså säsongsrensning, för att urskilja och eliminera de effekter i datamaterialet som beror på dessa effekter. I en säsongsrensad serie är alla dessa effekter eliminerade. Den säsongsrensade serien kan därför användas för att göra jämförelser mellan alla tidpunkter i en tidsserie. I en säsongsrensad serie finns emellertid alltid ett kvarvarande brus, vilket skapar viss osäkerhet vid dylika jämförelser. Säsongen kan allmänt vara beskaffad på två olika sätt, antigen additiv eller multiplikativ. I den additiva modellen adderas eller subtraheras samma värde för alla de observationer som berör januari respektive februari et cetera. I den multiplikativa metoden är varje komponent istället proportionell mot det observerbara värdet i serien. Vid en logaritmering blir den multiplikativa metoden additiv för den ursprungliga serien. (Öhlén sid. 4-6, 2003) 3.1.2.1. SARIMA I vissa typer av tidsserier förekommer trender i säsongslika strukturer med återkommande mellanrum. Dessa fenomen är speciellt vanliga i ekonomiska data där positiva effekter i handeln kring jul och helger efter löneutbetalningar är två exempel på års- respektive månadssäsonger som är återkommande. En ARIMA-modell kan använda sig av dylik information genom att tillåta säsongsvariation och sålunda bli en SARIMA-modell (Seasonal Autoregressive Integrated Moving Average). Om en vid lag s (exempelvis säsongens längd) differentierad serie ( ( ) ) passas till en ARMA(p,q)-modell ( ( ) ( ) ), ger detta SARIMA(p,d,q)x(P,D,Q)- modellen som är definierad enligt 9

( ) ( ). (10) Där och är polynom av ordning p+sp och q+sq och Y t är differentierad eller säsongsdifferentierad om serien innehåller någon enhetsrot. En skillnad med en SARIMA-modell jämfört med att använda säsongsvariationerna som dummyvariabler är att den tillåter slumpmässighet i säsongstermen. (Brockwell och Davies, sid. 201-208, 1996) 3.1.2.2. TRAMO/SEATS TRAMO (Time Series Regression with ARIMA Noise) och SEATS (Signal Extraction in ARIMA Time Series) är två program som används tillsammans av bland andra Statistiska Centralbyrån (Can Tongur, SCB) för att säsongsrensa tidsserier. Följande beskrivning av programmen är skriven med vägledning av Ghysels och Osborn (2001) samt Gómez och Maravall (1997). TRAMO lineariserar den ursprungliga tidsserien genom att identifiera och ta bort flera typer av extremvärden, och interpolerar saknade observationer. Den automatiska detektionen av extremvärden plockar bort dessa en och en och estimerar däremellan ARIMA-processens parametrar på nytt för att undersöka deras betydelse för regressionens parametrar. Användaren har också möjlighet att ange specifika extremvärden, vilkas effekt då elimineras av TRAMO. TRAMO innehåller även en modellvalsalgoritm som väljer den modell som optimalt passar till den använda tidsserien. Givet observationsvektorn z som består av alla observationer skattar TRAMO, (11) där är en vektor av regressionsvariabler som kan väljas i TRAMO (till exempel för att fånga effekter av antalet vardagar eller påsk) och är en vektor av deras koefficienter. följer en ARIMA-process som väljs ut av programmet beroende på tidsseriens egenskaper. Programmet undersöker alla möjliga SARIMA-modeller till och med (3,2,3)x(2,1,2) (Gómez 10

& Maravall sid. 15-16) och väljer modell enligt Hannan-Rissanen kriteriet 6 med Kalmanfilter. Den slutgiltiga modellen väljs sedan ut efter BIC-kriteriet (se kapitel 3.3.3.) med ett möjligt tillval för att öka sannolikheten att antalet AR- och MA-termer skall vara detsamma. SEATS däremot delar upp tidsserien i dess icke-observerbara delar; trend, säsong, cyklisk och irreguljära effekter. Trendkomponenten fångar seriens långsiktiga trend, säsongskomponenten fångar säsongsmönstret, den cykliska komponenten fångar kortvariga variationer som kan uppstå av MA-komponenter av låg ordning. Den slumpmässiga komponenten fångar upp allt brus, vilket gör de tre första delarna brusfria. När SEATS används tillsammans med TRAMO använder programmet den modell som valts ut av TRAMO. Avslutningsvis justeras komponenterna samt prognoserna för de deterministiska effekter som togs bort av TRAMO. 3.2. Felmått När en modell har anpassats till ett datamaterial finns det flera olika sätt att kontrollera hur väl modellen förhåller sig till de faktiska observationerna. Den enklaste metoden är att estimera värden enligt den angivna modellen för att sedan jämföra dessa värden med de sanna värdena. Det finns ett stort antal felmått som kan göra liknande jämförelser, varav två används och förklaras i denna uppsats. Dessutom kan felmåtten användas på olika sätt där skillnader i informationsfönster och sampelstorlek påverkar tolkningen och vars intuition även förklaras i detta avsnitt (Pindyck & Rubinfeld, sid. 210, samt 380-388, 1998). RMSE En vanlig metod för att utvärdera en tidsserieprognos är att undersöka modellens RMSE (root mean squared error), där RMSE är definierat enligt ekvation 12, där är det predikterade värdet, är det verkliga värdet och T är antalet perioder. ( ). (12) 6 Enligt Hannan-Rissanen kriteriet skattas först en autoregressiv process till X t. Sedan skattas Xt på [Xt-i, ât-j] där â är residualerna från den första skattningen och där i och j går till p och q. Detta utförs för många olika p och q. (Newbold & Bos) 11

Detta kan antingen göras genom att göra en prediktion över det datamaterial som används för modellskattningen, eller genom att skatta en del av tidsserien och undersöka hur bra prediktionen är prognostiserad för den del som inte använts i modellskattningen. Genom att utvärdera modellen på det senare sättet minskar risken för att överskattning av modellen ska påverka felmåttet. MAPE Ett felmått som är relativt och således inte beroende av storleken på de estimerade värdena är MAPE (Mean absolute percentage error). Felmåttet ger värdet noll om modellen är perfekt skattad och saknar övre gräns. MAPE är definierat enligt ( ). (13) In sample En in sample-analys genomförs genom att skatta modellen för hela den undersökta tidsserien. Sedan jämförs modellens prognoser för varje i tidsserien ingående tidpunkt med de sanna värdena. Informationsfönster och Prognosfönster Figur 1. In sample - översiktsbild 12

Jan 1975 Nov 1989 Nov 1991 Jan 1975 Okt 1989 Okt 1991 Out of sample I en out of sample-analys är informationsfönstret vanligtvis rullande till skillnad från det fasta i in sample-kontexten I detta fall görs prognoser endast inom en given periodslängd på en modell skattad av en delmängd av samtliga observationer. Jämförelsen mellan de sanna och estimerade värden görs därefter på observationer som inte ingick i modellspecifikationen istället för på hela perioden. Denna delmängd flyttas sedan inom tidsperioden för att på så sätt undersöka felmåttet på olika delmängder. Informationsfönster Prognosfönster Informationsfönster Prognosfönster Figur 2 Out of sample - översiktsbild 3.3. Modellidentifikation I detta avsnitt presenteras de olika test och diagnosverktyg som kommer att användas i denna uppsats vid val och specificering av ARIMA-modell. 13

3.3.1. Enhetsrotstest För att kunna genomföra tidsserieanalyser korrekt krävs det att tidsserievariabeln är stationär vid användning av ARMA-modellen. För att testa detta är den konventionella metoden att undersöka huruvida tidsserien innehåller enhetsrötter eller inte. Avsaknad av enhetsrötter implicerar att det ej finns en stokastisk trend, medan en serie med enhetsrötter kan differentieras för att åstadkomma stationaritet. Förekomsten av enhetsrötter kan testas på ett flertal sätt, där ADF-testet och KPSS-testet är två av de mest användbara. Augmented Dickey Fuller (ADF) Det ursprungliga Dickey Fuller-testet är en form av enhetrotstest som undersöker förekomsten av enhetsrötter i en AR-modell (Pindyck & Rubinfeld sid. 507-510, 1998). Enligt nollhypotesen, δ = 0, förekommer minst en enhetsrot. ADF-testet är en förlängning av det vanliga Dickey Fuller-testet som undersöker förekomsten av enhetsrötter i en AR(p)-modell, istället för en AR(1)-modell som i originaltestet. Enligt nollhypotesen δ = 0 (där δ = ρ 1) förekommer minst en enhetsrot, medan mothypotesen anger att tidsserien är stationär. Testet använder Dickey-Fuller-fördelningen 7, snarare än en vanlig t-fördelning. Testet utgår från. (14) KPSS KPSS-testet är en form av ett enhetrotstest som testar ifall stationaritet föreligger. Nollhypotesen säger att den observerbara originalserien är nivåstationär, alternativt trendstationär., (15) där täljaren är residualerna från en OLS-regression innehållande säsongselement och nämnaren är feltermens varians. Mothypotesen säger däremot att tidsserien har en enhetsrot. (Eviews 7. User Guide II sid. 387) 7 EViews använder sig av MacKinnons förkastelsegränser. 14

3.3.2. Autokorrelation Autokorrelationsfunktionen visar korrelationer mellan olika tidpunkter i en stokastisk process, vilket är användbart vid val av modell (se nedan under Modellspecifikation samt för en utförligare beskrivning Pindyck & Rubinfeld se sid. 494-497, 1998). Tidsserier som innehåller systematiska element, alltså korrelation mellan observationerna i serien, är autokorrelerade. Autokorrelationsfunktionen beskrivs enligt ekvation 16 där autokorrelationen tas fram genom att beräkna korrelationsfunktionen mellan y t och y t+k ( ). (16) Den partiella autokorrelationen mellan och mäter däremot korrelationen mellan dessa variabler om korrelationen som härrör från de mellanliggande variablerna elimineras. Detta är således ett mått på det marginella bidraget till autokorrelationsfunktionen för varje observation. Ljung Box Ljung Box-testet är en form av portmanteau-test som undersöker autokorrelationen i tidsserier (Brockwell och Davies, sid. 34-37, 1996). Testet är därför speciellt användbart vid användning av ARIMA-modeller eftersom att dessa förutsätter vitt brus. Ljung Box-testet prövar ifall residualerna av en skattad modell i den undersökta tidsserien är signifikant skilda från noll eller inte. Nollhypotesen utgår ifrån att observationerna, alltså populationskorrelationen, är slumpartad. Sålunda : ( ) ( ) ( ) 0. (17) Mothypotesen däremot säger att det inte är slumpartat. Teststatistikan ser ut som följer ( ), (18) där n är stickprovsstorleken på tidsserien, p k är autokorrelationskoeffiecenten vid lag k och h är antalet laggar som testas. Nollhypotesen förkastas vid signifikansnivå α ifall, efter χ 2 -fördelningen med h antal frihetsgrader. Godtas nollhypotesen anses tidsserien vara vitt brus. 15

3.3.3. Modellspecifikation För att välja vilken modell som är bäst lämpad till en tidsseries observationer när flertalet modeller är specificerade, finns det flera olika principer samt två stycken kriterier att använda som riktlinjer. Det finns däremot ingen konvention som exakt säger hur modellval rent allmänt skall gå till. Till att börja med är emellertid en modell med färre parametrar att föredra framför en modell med många parametrar, enligt måttfullhetsprincipen. Dessutom är ett högt justerat R 2 -värde att föredra framför en modell med ett lågt värde. Detta gäller speciellt när syftet med modellen är att göra prognoser eftersom att dessa gynnas av en högre förklaringsgrad. En ytterligare vägledning går att finna i autokorrelationsfunktionen och den partiella autokorrelationen. Som tidigare har beskrivits kan den förstnämnda hjälpa till med att bestämma i vilken ordning q MA-delen är beskaffad av, medan den senare går att hänföra till AR-delens antal laggar. AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) kan användas för att välja antalet laggar i en distribuerad lag-modell. AIC är definierat som ( ( ) ), (19) medan BIC definieras som ( ( ) ). (20) Skillnaden mellan att använda dessa kriterier mot att använda justerad R 2 vid modellval är att AIC och BIC till högre grad straffar fler variabler i modellen. Enligt kriteriet skall den modell med lägst värde på AIC eller BIC väljas av de alternativ till modeller som finns. Emellertid är dessa metoder dock inte regelrätta statistiska test för att välja antalet laggar och bör därför alltid användas tillsammans med intuition. (Pindyck & Rubinfeld, sid. 238-239, 1998) 16

3.3.4. Chows test Råder det osäkerhet ifall en modell egentligen innehåller data där effekterna skiljer sig åt mellan olika perioder inom hela tidsperioden är Chows test en metod för att undersöka detta. Testet bryter ner tidsperioden i två delperioder som sedan separat skattas med identiska regressioner: Nollhypotesen blir sålunda (21). (22), vilket indikerar, om det är sant, att parameterkoefficienter för de två regressionerna är likadana och att effekterna därmed lika stora över hela tidsperioden. Kan nollhypotesen förkastas indikerar detta att datamaterialet lider av tidsseriebrott och att effekterna därmed skiljer sig åt i delperioderna inom tidsperioden. (Pindyck & Rubinfeld, sid. 133-134, 1998) 4. Data Denna uppsats använder sig av tre olika tidsserier hämtade från Statistiska Centralbyrån med månadsdata som alla berör Sveriges varuhandel med omvärlden. Två stycken serier är oberoende av varandra, Sveriges totala export respektive totala import, medan den sista serien är beroende av de två första och består av total export minus total import och sålunda består av Sveriges handelsnetto. Samtliga serier är i originalform varken säsongs-, inflations- eller volymjusterade. Var och en innehåller serierna 428 observationer; en sträckning från januari 1975 till och med augusti 2010. De olika seriernas utveckling kan ses i figur 3. 17

1975M01 1977M01 1979M01 1981M01 1983M01 1985M01 1987M01 1989M01 1991M01 1993M01 1995M01 1997M01 1999M01 2001M01 2003M01 2005M01 2007M01 2009M01 Miljoner kronor 130000 110000 90000 70000 50000 30000 10000-10000 Sveriges handel januari 1975- augusti 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 3. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010 Både export- och importserierna har utvecklats positivt sedan 1975. Den totala exporten har vuxit från ett värde av 6 200 miljoner kronor 1975 till ett värde av 85 300 miljoner kronor i augusti 2010. Motsvarande siffror för total import är från 7 975 miljoner kronor till 88 100 miljoner kronor. Se tabell 1 för ytterligare deskriptiv statistik. Tabell 1. Deskriptiv statistik för svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010. Variabel Observationer Medelvärde Standardavvikelse Min-värde Max-värde Import 428 36839 25133 4979 101200 Export 428 42237 29265 4276 110600 Handelsnetto 428 5400 5368-4210 21800 18

I tabell 2 syns dessutom medelvärdena för respektive månad och serie. Export är låg i början på året, men lägst under juli och augusti samt högst i mars, juni och oktober. Import visar en liknande struktur som exporten, men är klart lägst i juli. Handelsnetto har sin topp i juni och botten i augusti. Överlag är det tydligt att säsongseffekter föreligger, med stora skillnader mellan de högsta och lägsta månadsvisa medelvärdena. Tabell 2. Månadsvisa medelvärden i miljontals kronor för export, import och handelsnetto. Månad Export Import Handelsnetto Januari 39120 34265 4858 Februari 40919 35205 5714 Mars 46113 39543 6572 April 43209 37472 5736 Maj 42732 37134 5601 Juni 45017 37167 7845 Juli 36404 30868 5536 Augusti 37782 36040 1739 September 43954 38202 5752 Oktober 45641 40219 5449 November 44708 39477 5231 December 41437 36681 4753 De positiva trenderna för serierna har egentligen bara brutits ordentligt med nedgångar vid två tillfällen, även om den positiva utvecklingen tillfälligt stannade av både vid 90-talets mitt och under IT-kraschen i början av 2000-talet. I början av 90-talet kan en svag nedgång skönjas i samband med 90-talskrisen efterdyningar medan en starkare nedgång inträffade under den senaste finanskrisen som inleddes 2008. Tidsserien kan därför delas in i två perioder; före och efter 90-talskrisen. Även om denna brytpunkt inte är den klaraste gör vi det av två anledningar: i) Brytpunkten är i ungefär mitten av tidsserien. ii) Den ligger mitt i en period där väldigt mycket skedde som påverkade den svenska ekonomin i grunden. En närmare beskrivning av vad som inträffade under denna 19

1975M01 1976M01 1977M01 1978M01 1979M01 1980M01 1981M01 1982M01 1983M01 1984M01 1985M01 1986M01 1987M01 1988M01 1989M01 1990M01 1991M01 1992M01 Miljoner kronor turbulenta tid och vilka följder dessa fick är dock utanför denna uppsats ramar. Vad som emellertid är relevant och värt att nämna är att den svenska kronan släpptes att flyta fritt den 19 november 1992. Detta efter åratal av att tidigare ha varit fastknuten mot andra valutor, vilket påverkade den svenska köpkraften och värdet på den svenska kronan gentemot omvärlden. Även om den största delen av den absoluta tillväxten har skett efter krisen, var tillväxten rent procentuellt sett större perioden före krisen gällande exporten. Denna växte med 472 % perioden innan och med 315 % perioden efter. Motsvarande siffror för importen visar däremot en större tillväxt efter (358 %) gentemot perioden före 90-talskrisen (321 %). Sveriges handel januari 1975 - oktober 1992 35000 30000 25000 20000 15000 10000 5000 0-5000 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 4. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med oktober 1992 Handelsnetto kan delas in efter ett liknande mönster. Innan 90-talskrisen fluktuerade det nära och omkring ett balanserat resultat där export och import var lika stora. I början av 90-talet utvecklades detta däremot till ett positivt handelsnetto där export kontinuerligt låg högre än 20

1992M11 1993M11 1994M11 1995M11 1996M11 1997M11 1998M11 1999M11 2000M11 2001M11 2002M11 2003M11 2004M11 2005M11 2006M11 2007M11 2008M11 2009M11 Miljoner kronor import. I samband med den senaste finanskrisen vändes dock trenden med stora fluktuationer och ett negativt handelsnetto i augusti 2010 som följd. 130000 110000 90000 70000 50000 30000 10000-10000 Sveriges handel nov 1992 - aug 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 5. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med november 1992 till och med augusti 2010 4.1. Granskning av data De tre serierna har testats för förekomsten av enhetsrötter via ADF- och KPSS-testen. Testresultaten återfinns i tabell 3. I samtliga fall är både intercept och trend inkluderade i testregressionerna. Detta eftersom att den deskriptiva statistiken visar på trender i serierna. Resultaten tyder på att ingen av serierna är stationära enligt samtliga förkastelsegränser upp till 10 procents-nivån. Efter en differentiering av serierna tyder emellertid ADF- och KPSStesten på att export och import är stationära. Testen av handelsnetto visar stationaritet på olika nivåer. ADF-testet kan på 1-procentsninvån förkasta nollhypotesen om enhetsrot medan KPSS-testet på 1-procentsnivån inte förkastar nollhypotesen om stationaritet. Med anledning av detta tillsammans med att vi har undersökt korrelogrammen av serien och residualerna för ett antal modeller samt deras AIC och BIC värden har vi valt att differentiera serien en gång i fortsättningen av uppsatsen. 21

Tabell 3. Resultat av enhetsrotstest på serierna export, import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010. Serie Nivå Första differensen ADF KPSS ADF KPSS Export -2,709191 0,476332*** -4,968191*** 0,076548 Import -1,804025 0,502016*** -7,447996*** 0,046358 Handelsnetto 0,325140 0,272895*** -7,695800*** 0,152056** Dickey-Fuller t-statistika för ADF; förkastelsegränser: 1 % -3,980489, 5 % -3,420768, 10 % -3,133098 Nollhypotes: Serien innehåller en enhetsrot. Test-statistika för KPSS; förkastelsegränser: 1 % 0,216000, 5 % 0,146000, 10 % 0,119000 Nollhypotes: Serien är stationär. *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Eftersom att detta ger oss anledning att tro att åtminstone import- och exportserierna inte är stationära på grund av deras respektive positiva trender, tittar vi även på hur utvecklingen av förstadifferensen för respektive serie har utvecklats över vår undersökta tidsperiod. 8 Det framgår att medelvärdena i serierna över perioden 1975-2010 är mer konstanta än i de versioner där variablerna inte är differentierade. Däremot ser vi att variansen ökar med tiden, vilket inte uppfyller kriterierna för en ARIMA-modell. Därför logaritmeras serierna innan de differentieras, vilket förbättrar seriernas egenskaper. Då vi enbart undersöker tidsperioden från och med november 1992 ser det ut som att tidsseriernas medelvärde även här är konstanta över tiden. Variansen uppvisar inte lika stora problem med att variera över tiden, men det skulle fortfarande kunna utgöra ett problem för vår analys om tidsserierna inte transformeras. Därför logaritmeras export- och importserierna även i detta fall. 8 För diagram, se appendix 1. 22

5. Resultat I detta kapitel presenteras resultaten av denna uppsats. Till att börja med att skattas de olika tidsserierna i ett flertal modeller som har valts ut efter teorin i modellspecifikationsavsnittet. Modellerna valdes ut framför allt med hänsyn till strukturen på de tre olika seriernas autokorrelationer och partiella autokorrelationer. Därefter gjordes de slutliga modellvalen efter vilka modeller som hade de lägsta AIC/BIC-värdena. De modeller som valdes ut användes sedan för att göra in sample- och out-of-sample-jämförelser. Därefter utsågs de modeller med lägst felmått för att göra prognoser två år fram i tiden. Att finna de modeller som passar data bäst innebär, som tidigare har förklarats, att inte alltid färdas på en enkelriktad och intuitiv väg. För att välja ut de modeller som med minst fel predikterar export, import respektive handelsnetto har vi därför först valt ut modeller efter tre olika tillvägagångssätt. I det första har vi först logaritmerat 9 serierna för att sedan själva säsongsrensat serierna med additiv metod och slutligen differentiera dem för att uppnå stationaritet. Serierna har till slut anpassats till ARIMA-modeller. I den andra metoden används SARIMA-modeller där serierna har logaritmerats, i vilka säsongsrensningen sker genom att differentiera serierna även på säsongsnivå (12 månader med anledning av att månadsdata används) och genom inkluderandet av säsongs-ar- respektive -MA-termer (SAR/SMA) i regressionerna. Till vår hjälp i dessa två metoder har vi använt oss av korrelogrammen 10 av de slutgiltiga serierna. I den sista metoden kördes programmet TRAMO/SEATS som själv räknar fram de bästa modellerna. Detta körs utan att korrigera för kalendereffekter men med automatisk extremvärdesdetektion. Resultaten för de, enligt korrelogrammen, mest logiska modellerna samt angränsande modeller för de olika serierna presenteras nedan och är grunden för resten av arbetet. 9 Eftersom att handelsnettoserien innehåller negativa tal kan denna dock inte logaritmeras. 10 För korrelogram över förstadifferenserna, se appendix 2. 23

5.1. Modellval Både TRAMO/SEATS och SARIMA pekar ut en modell med två AR-termer och en säsongs- MA-term för export-serien, se tabell 4. När vi själva säsongsrensar serien visar det sig däremot att även inkluderandet av en ordinär MA-term innebar ett lägre AIC-värde. Enligt måttfullhetsprincipen och ett lägre BIC-värde så väljs (2,1,0) för ARIMA. För SARIMA har (1,1,1)x(1,1,1) de lägsta AIC- och BIC-värdena, men eftersom den innehåller både en SARoch SMA-term så väljs även (2,1,0)x(0,1,1) ut. Dessa kommer sedan att användas till att göra prognoser. Tabell 4. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export januari 1975-augusti 2010. Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,0) AR(1) -0,652770-2,594348-2,575279 0,321824 AR(2) -0,329798 (1,1,0) AR(1) -0,489419-2,462846-2,453328 0,234146 (1,1,1) AR(1) -0,183448 0,022-2,549817-2,530783 0,301228 MA(1) -0,465139 (0,1,1) MA(1) -0,571770-2,537528-2,528027 0,288005 (2,1,1) AR(1) -0,880827 AR(2) -0,440089 MA(1) 0,265398 0,031-2,599830-2,571227 0,327108 (1,1,1)x(1,1,1) AR(1) -0,132244 MA(1) -0,569967 SAR(12) 0,153011 SMA(12) -0,923339 (2,1,1)x(0,1,1) AR(1) -0,426725 AR(2) -0,230163 MA(1) -0,283113 SMA(12) -0,899628 (2,1,0)x(0,1,1) AR(1) -0,675882 AR(2) -0,361417 MA(12) -0,902780 (0,1,1)x(0,1,1) MA(1) -0,646768 SMA(12) -0,916695 (3,1,0)x(0,1,1) AR(1) -0,679506 AR(2) -0,369079 AR(3) -0,015016 SMA(12) -0,902582 TRAMO/SEATS (2,1,0)x(0,1,1) AR(1) 0,81273 AR(2) 0,45119 MA(12) -0,82195 0,085 0,003 0,001 0,005 0,024 0,762-2,651375-2,611610 0,578677-2,631824-2,592856 0,597399-2,635620-2,606394 0,597961-2,624608-2,605194 0,595146-2,631724-2,592685 0,589849 - - - Fetmarkerade värden är de lägsta AIC/BIC-värdena, vilket innebär bäst modeller inom ARIMA respektive SARIMA.. 24

För import-serien visar både ARIMA och SARIMA i grunden ut samma modell, enligt tabell 5. Denna modell innehåller två AR-termer och en MA-term, med en säsongs-ma-term i SARIMA-fallet. TRAMO/SEATS däremot vill inkludera ytterligare en AR-term, något som dock inte får stöd av AIC- och BIC-värdena av en liknande modell enligt de två första metoderna. Tabell 5. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för import januari 1975-augusti 2010 Modell Koefficienter P-värden AIC BIC Justerat R 2 (2,1,0) AR(1) -0,679339-2,747096-2,728028 0,357522 AR(2) -0,364709 (1,1,0) AR(1) -0,464869-2,543400-2,533882 0,218539 (1,1,1) AR(1) -0,207353 0,006-2,650839-2,631804 0,299785 MA(1) -0,426813 (0,1,1) MA(1) -0,557981-2,592467-2,582966 0,282638 (2,1,1) AR(1) -0,862667 AR(2) -0,454868 MA(1) 0,226194 0,030-2,758169-2,729566 0,366081 (3,1,1) AR(1) 0,549126 AR(2) -0,217875 AR(3) 0,149457 MA(1) -0,069099 (1,1,1)x(1,1,1) AR(1) -0,200835 MA(1) -0,431875 SAR(12) 0,166960 SMA(12) -0,935802 (3,1,1)x(0,1,1) AR(1) -0,722010 AR(2) -0,374670 AR(3) 0,058226 MA(1) 0,069598 SMA(12) -0,881922 (2,1,1)x(0,1,1) AR(1) -0,847065 AR(2) -0,466069 MA(1) 0,191126 SMA(12) -0,884372 (3,1,0)x(0,1,1) AR(1) -0,653398 AR(2) -0,327693 AR(3) 0,083932 MA(12) -0,882002 0,096 0,337 0,235 0,837 0,019 0,001 0,184 0,322 0,790 0,898 0,101 0,089-2,756422-2,718217 0,345228-2,796179-2,756414 0,553662-2,745189-2,745189 0,567978-2,799068-2,760100 0,581642-2,798681-2,759642 0,568967 (0,1,1)x(0,1,1) MA(1) -0,575162 SMA(12) -0,953199 TRAMO/SEAT AR(1) 0,68488 S AR(2) 0,36247 (3,1,0)x(0,1,1) AR(3) -0,12692 0,002 MA(12) -0,80695 Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. -2,728402-2,708988 0,562004 - - - 25

I fallet där handelsnettot används pekar samtliga tre metoder ut, se tabell 6, samma modell som den bäst lämpade. Denna innehåller en MA-term och en säsong-ma-term. Tabell 6. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för handelsnetto januari 1975-augusti 2010. Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,1) AR(1) -0,056932 0,413 17,82260 17,85121 0,405070 AR(2) 0,009060 MA(1) -0,780820 0,887 (1,1,1) AR(1) -0,061875 0,314 17,81579 17,83483 0,406592 MA(1) 0,776329 0,038 (0,1,1) MA(1) -0,7978926 17,81151 17,82101 0,406774 (1,1,0) AR(1) -0,525076 18,02731 18,03683 0,265094 (1,1,1)x(1,1,1) AR(1) -0,111782 MA(1) -0,759237 SAR(12) 0,080153 SMA(12) -0,877794 0,202 0,301 18,29104 18,35395 0,636201 (2,1,2)x(0,1,1) AR(1) 0,221246 AR(2) 0,114758 MA(1) -1,082167 MA(2) 0,209339 SMA(12) -0,857886 (2,1,1)x(0,1,1) AR(1) -0,047957 AR(2) 0,082201 MA(1) -0,810766 SMA(12) -0,861017 (3,1,0)x(0,1,1) AR(1) -0,771529 AR(2) -0,407234 AR(3) 0,093996 MA(12) -0,868813 0,727 0,138 0,090 0,674 0,490 0,210 0,067 17,83902 17,88773 0,621583 17,83580 17,87477 0,621895 17,90736 17,94639 0,594844 (0,1,1)x(0,1,1) MA(1) -0, 804486 17,83038 17,84979 0,620521 SMA(12) -0,875959 TRAMO/SEATS (0,1,1)x(0,1,1) MA(1) -0,74291 SMA(12) -0,69336 - - - Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. 5.1.1. Efter 90-talskrisen En misstanke är dock att det finns ett brott i tidsserierna eftersom att serierna dels är långa och att det dels skedde mycket under denna period med 90-talskrisen som kulmen av detta. Därför genomför vi Chows brytpunktstest för att utröna om parametereffekterna egentligen skiljer sig åt under perioden istället för att vara konstanta över hela perioden. Eftersom att den svenska kronan släpptes flytande den 19:e november 1992 testar vi ifall det existerar ett brott i tidsserierna vid november i samma år. Testen för export- och import-serierna som visas i tabell 7 förkastar att det inte finns något brott på 5-procentsnivån, medan testet för handelsnetto-serien förkastar nollhypotesen på 10-procentsnivån. 26

Tabell 7. Chows brytpunktstest för brott i serien i november 1992. Export Import Handelsnetto F-värde 8,16*** 3,15** 2,41* *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Med hänsyn av detta skattar vi nya modeller för perioden november 1992 till och med augusti 2010 och exkluderar därför de äldre observationerna. Modellvalen genomförs efter samma metodik som tidigare och resultaten presenteras i tabell 8. Resultaten visar att både export och import bäst förklaras av (3,1,0)x(0,1,1)-modeller, vilka skiljer sig från de modeller som bäst passade till hela perioden. Handelsnettot förklaras dessutom bäst av en (0,1,1)x(0,1,1)-modell i SARIMA-fallet, medan TRAMO/SEATS väljer en (1,1,3)x(0,1,1)-modell för serien. 27

Tabell 8. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export, import samt handelsnetto november 1992-augusti 2010. Modell Koefficienter P-värde AIC BIC Justerat R 2 Export (2,1,0)x(0,1,1) AR(1) -0,779685-3,063528-3,016342 0,639237 AR(2) -0,430894 SMA(12) -0,915271 (3,1,0)x(0,1,1) AR(1) -0,673780-3,116854-3,053939 0,659539 AR(2) -0,238651 AR(3) 0,247421 SMA(12) -0,916015 0,003 (0,1,1)x(0,1,1) MA(1) -0,573442-2,918647-2,887189 0,581063 SMA -0,925579 TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,80082 AR(2) 0,40206 - - - AR(3) -0,15358 SMA(12) -0,77293 0,045 Import (2,1,1)x(0,1,1) AR(1) -0,957950-3,136855-3,073940 0,537713 AR(2) -0,525466 MA(1) 0,296197 SMA(12) -0,824789 0,058 (3,1,0)x(0,1,1) AR(1) -0,614209-3,161412-3,098497 0,548927 AR(2) -0,221766 AR(3) 0,234274 MA(12) -0,808902 0,005 0,001 (0,1,1)x(0,1,1) MA(1) -0,526223-3,008348-2,976891 0,469455 SMA(12) -0,898814 TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,68753 AR(2) 0,31497 AR(3) -0,18049 SMA(12) -0,70555 0,022 - - - Handelsnetto (0,1,1)x(0,1,1) MA(1) -0,803599 18,28423 18,29694 0,635324 SMA (12) -0,868306 (1,1,3)x(0,1,1) AR(1) -0,006957 0,987 18,29252 18,37117 0,637322 MA(1) -0,866478 MA(2) 0,211823 MA(3) -0,155101 SMA(12) -0,858965 0,046 0,576 0,053 TRAMO/SEATS (1,1,3)x(0,1,1) AR(1) -0,09517 MA(1) -0,97196 MA(2) 0,23154 MA(3) -0,10493 SMA(12) -0,75043 0,216 0,163 - - - Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. 28

5.2. Utvärdering av modellerna De utvalda modellerna från det förra avsnittet har i detta avsnitt använts till att estimera värden för de olika serierna. Dessa har tagits fram i både en in sample-kontext såväl som i en dynamisk out of sample-kontext, för att därefter valideras med hjälp av felmåtten RMSE och MAPE, se tabell 9. Out of sample-analysen har genomförts genom att prediktera de kommande två åren i ett rullande informationsfönster där slutperioden varierar från oktober 1989 till augusti 2010. Tabell 9. Felmått för export, import, handelsnetto samt export-import januari 1975-augusti 2010. Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0) 8902 0,398 45474 0,843 (2,1,0)x(0,1,1) 2969 0,048 8941 0,087 (1,1,1)x(1,1,1) 3150 0,047 9008 0,087 TRAMO/SEATS N/A 11 N/A 8598 0,088 Import (2,1,1) 10949 0,428 36532 0,751 (2,1,1)x(0,1,1) 2473 0,046 8068 0,087 TRAMO/SEATS N/A N/A 8315 0,094 Handelsnetto (0,1,1) 1784 0,810 3551 0,745 (0,1,1)x(0,1,1) 1793 1,301 2787 0,393 TRAMO/SEATS N/A N/A 2657 0,355 Export-Import ARIMA 4241 2,100 10839 1,003 SARIMA 2049 1,197 3625 0,397 TRAMO/SEATS N/A N/A 3662 0,414 För hela tidsperiodens out of sample är det inledningsvis enkelt att se att de olika seriernas ARIMA-modeller leder till betydligt större fel än SARIMA-modellerna och modellerna från TRAMO/SEATS. 12 I övrigt är det svårare att göra någon tydlig gränsdragning mellan de två senare modellernas träffsäkerhet. T/S predikterar export bättre, medan SARIMA-modellen predikterar import bättre. Gällande handelsnetto har T/S ett lägre RMSE-värde, medan SARIMA har ett lägre MAPE-värde. Om vi istället definierar handelsnetto med hjälp av de andra serierna (export-import) ser vi att SARIMA-modellerna ger bättre felmått än TRAMO/SEATS, men sämre än den ursprungliga handelsnettoserien. 11 TRAMO/SEATS ger ingen information om in sample-felmåtten. 12 Eftersom att ARIMA-modellerna visar stora fel exkluderas dessa från vidare diskussion. 29

5.2.1 Efter 90-talskrisen Eftersom att vi fann ett brott i tidsserierna och därefter skattade nya modeller för tidsperioden november 1992 fram till och med augusti, gör vi även in-sample- och out-of-sample-analyser för denna kortare tidsperiod, se tabell 10. I dessa fall ligger prognosfönstret mellan februari 1998 till augusti 2010 för export och import, medan det börjar i mars 2006 för handelsnetto 13. SARIMA ger bättre felmått än TRAMO/SEATS i fallen export och import, medan resultaten visar det omvända för handelsnetto. Export-import visar till sist större fel än handelsnetto, detta skulle kunna bero på att handelsnetto är mer stabil än de övriga serierna. Tabell 10. Felmått för export, import, handelsnetto samt export-import november 1992-augusti 2010. RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Modell Export (3,1,0)x(0,1,1) 3542 0,039 9882 0,084 TRAMO/SEATS N/A N/A 10319 0,099 Import (3,1,0)x(0,1,1) 3087 0,0387 9603 0,094 TRAMO/SEATS N/A N/A 10484 0,1127 Handelsnetto (0,1,1)x(0,1,1) 2235 0,295 3848 1,062 TRAMO/SEATS N/A N/A 3559 0,748 Export-Import (Handelsnetto) SARIMA 3512 0,587 4364 0,870 TRAMO/SEATS N/A N/A 4993 0,824 Då vi har noterat att valet av modell i de kortare serierna förändras vid borttagande av endast ett fåtal variabler, tittar vi istället på det brutna datasetet från november 1992 och framåt, med samma antal AR- och MA-termer som för hela perioden och med samma prognosfönster. När vi gör denna jämförelse ser vi att modellerna anpassade för den kortare tidsperioden har lägre in sample-fel än modellerna som är anpassade för hela perioden men skattade för den korta, se tabell 11. En sådan tydlig skillnad föreligger inte för out of sample-felmåtten. I export-fallets SARIMA-modell, som visar bättre felmått än TRAMO/SEATS, är RMSE-värdet något lägre 13 Anledningen till det kortare prognosfönstret är TRAMO/SEATS-modellen (1,1,3)x(0,1,1) inte kan göra prognoser längre tillbaka i tiden med det rådande informationsfönstret. 30

för modellen anpassade för hela perioden medan MAPE-värdet är marginellt lägre (0,0837 mot 0,0840) i modellen anpassad för den korta perioden. För import har modellen på den långa perioden för SARIMA bättre out of sample-felmått i båda fallen. I fallet handelsnetto är det samma modell i SARIMA-fallet och inga jämförelser kan därför göras. I TRAMO/SEATS-fallet, som visar bättre resultat än SARIMA, är RMSE betydligt lägre i modellen anpassad för den långa perioden, medan MAPE är något lägre i modellen anpassad för den korta perioden. Tabell 11. Felmått för export, import samt handelsnetto november 1992-augusti 2010, med samma antal AR- och MA-termer som modellerna anpassade för perioden januari 1975 augusti 2010. Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0)x(0,1,1) 3686 0,0401 9867 0,0840 TRAMO/SEATS N/A N/A 10057 0,0964 Import (2,1,1)x(0,1,1) 3154 0,0390 9501 0,0933 TRAMO/SEATS N/A N/A 10484 0,1127 Handelsnetto (0,1,1)x(0,1,1) 2235 0,295 3848 1,062 TRAMO/SEATS N/A N/A 3104 0,780 De slutliga prognosmodellerna blir sålunda (3,1,0)x(0,1,1) för export, främst med tanke på att vi har ett brott i serien. För import blir det (2,1,1)x(0,1,1), då modellen anpassad för den långa perioden skattad på den korta perioden i samtliga out of sample-fall visar bättre felmått. För handelsnetto väljs (0,1,1)x(0,1,1) från TRAMO/SEATS ut eftersom att denna modell visar avsevärt lägst RMSE-värden. Tittar vi på residualerna 14 från dessa modeller ser vi att export uppvisar lägre Q-värden än import som snabbt visar insignifikans. Däremot kan vi inte säga att residualerna från någon av dessa två modeller består av vitt brus. I motsats till detta tyder residualerna för handelsnetto 14 Korrelogram av residualerna återfinns i appendix 3. 31