Svensk varuhandel. Tidsserieanalys över

Transkript

1 STATISTISKA INSTITUTIONEN Uppsala universitet Examensarbete C Författare: David Magnusson och Petter Samuelsson Handledare: Lars Forsberg Höstterminen 2010 Tidsserieanalys över Svensk varuhandel januari 1975 augusti

2 Sammandrag Syftet med denna uppsats är att modellera och prognostisera Sveriges varuexport, varuimport och handelsnetto. Vi använder oss av data från januari 1975 till och med augusti 2010 för respektive serie. Dessa data testas och jämförs i olika ARIMA- och SARIMA-modeller samt skattas även medelst säsongsreningsprogrammet TRAMO/SEATS. För de modeller som bäst passar serierna genomförs därefter in sample- och out of sample-analyser med felmåtten RMSE och MAPE. Modellerna med bäst felmått och som därpå väljs ut för att göra prognoser för serierna till och med augusti 2012 är (3,1,0)x(0,1,1) för export, (2,1,1)x(0,1,1) för import samt (0,1,1)x(0,1,1) skattad i TRAMO/SEATS för handelsnetto. Nyckelord: SARIMA; TRAMO/SEATS; prognostisering; varuhandel 1

3 Innehållsförteckning 1. Inledning Avgränsning Disposition Tidigare studier Teori Tidsserieanalys ARMA Säsongsrensning Felmått Modellidentifikation Enhetsrotstest Autokorrelation Modellspecifikation Chows test Data Granskning av data Resultat Modellval Efter 90-talskrisen Utvärdering av modellerna Efter 90-talskrisen Prognoser Slutsats Källförteckning Appendix 1 - Plottar på förstadifferenser Appendix 2 - Korrelogram Appendix 3 - Residualplottar Appendix 4 Prognoser

4 1. Inledning I en allt mer globaliserad värld där den internationella varuhandeln mellan länderna ständigt växer är Sverige inget undantag. Som ett litet export- och importberoende land är Sverige särskilt beroende av en positiv och gynnsam utveckling av den internationella handeln. Sedan år 1975 har både Sveriges export och import mångdubblats och har de senaste åren bestått av omkring % vardera av Sveriges totala BNP, till skillnad från omkring % år Under denna tidsperiod har varuflödena emellertid ej haft en linjär och enkelt förklarad utveckling, utan de har istället varierat i viss omfattning kring en positiv trend. Detta samtidigt som finansiella kriser i omvärlden under vissa perioder har fått utvecklingen att stanna av och i vissa fall även falla. Med hjälp av tidsserieanalytiska verktyg kommer denna uppsats att modellera, diskutera och prognostisera Sveriges månatliga utveckling inom varuexport och varuimport mellan januari 1975 och augusti Samtidigt ger användandet av månadsdata en utmärkt möjlighet att närmare undersöka ifall dessa tidsserier består av trender som är mindre skönjbara i form av säsongsspecifika element och faktorer. När dessa element har hittats och när de olika serierna har passats till relevanta och förklarande modeller kommer dessa slutligen att tillämpas för att göra tvååriga prognoser för framtiden. Med antagandet att framtidens utveckling kommer att kunna förklaras på samma sätt som den gångna är det därpå möjligt att ge tidsserierna plausibla utvecklingsbanor. Syftet med denna uppsats är: Att visa hur Sveriges export, import och handelsnetto (export - import) har utvecklats. Att anpassa de mest lämpade modellerna till dessa tidsserier. Att prediktera seriernas framtida utveckling med hjälp av de bäst lämpade modellerna Avgränsning Denna uppsats begränsar sig till att endast använda månadsdata över Sveriges totala export och import från januari 1975 till och med augusti Metodiken som används är av univariat karaktär där vardera serie analyseras var för sig. Då dessa serier tenderar att bero på andra faktorer i hög grad är det dock vanskligt att låta datamaterialet sträcka sig över en 1 Enligt data från the World Bank. 3

5 längre period. Redan nu kan tidsspannet tänkas vara allt för långt, vilket dock kommer att testas genom Chows brytpunktstest som undersöker ifall effekterna är olika stora under olika delar av tidsperioden. Likaså är vi fullt medvetna över att export och import är två tidsserier som är endogena och därför skulle kunna förklaras med hjälp av flertalet övriga relaterade variabler. Samtidigt har vi inte utrymme för att testa samtliga tidsseriemodeller i denna uppsats, utan kommer därför att fokusera på modeller sprungna ur Box-Jenkins ARMAmodell Disposition Uppsatsen är i fortsättningen strukturerad på följande sätt: Kapitel 2 går igenom ett par tidigare tidsseriestudier inom området svensk varuhandel. Kapitel 3 bygger den teoretiska referensramen, både genom att definiera och konkretisera tidsserier och genom att redogöra för den diagnostik och de tester som är nödvändiga vid användande av tidsseriedata. Kapitel 4 beskriver de data som används i denna uppsats. Kapitel 5 visar sedan de resultat som framkommer när datamaterialet tillämpas i de modeller som beskrivs i den teoretiska delen. Kapitel 6 avslutar slutligen genom att sammanfatta uppsatsen och dra slutsatser av resultaten. 2. Tidigare studier Tidsserieanalyser över den svenska varuhandeln har inte gjorts i någon större omfattning enligt vår kännedom. I Statistiska Centralbyråns serie Bakgrundsfakta till Ekonomisk statistik författade Erkelius och Zeed uppsatsen En tillämpning av TRAMO/SEATS: Den svenska utrikeshandeln (2003). I uppsatsen delades den långa perioden in i fem kortare perioder, som sedan undersöktes och analyserades i en säsongskontext. Den sista perioden , som även ligger närmast en jämförelse med perioden i denna uppsats, uppvisade cykler på mellan 3 och 6 år. I samband med att kronan släpptes fri i november 1992 påfanns positiva effekter på både import och export. En annan slutsats var att sommarsemestereffekten på säsongselementen, som visserligen fortfarande var stora, har minskat under periodens gång. Detta tros bero på en ökad flexibilitet över möjligheterna för anställda när de kan ta ut sin semester. 4

6 Tongur (2010) har i två rapporter använt sig av svensk varuhandelsdata från 1993 till och med I den ena rapporten jämfördes TRAMO/SEATS med att säsongsrensa med hjälp av en dynamisk linjär modell (DLM). Även fast den senare visar intressanta och tillämpbara resultat, kommer TRAMO/SEATS samt SARIMA att användas i vår uppsats. I den andra rapporten diskuteras huruvida direkta eller indirekta säsongsrensningsmetoder är att föredra, utan att komma fram till någon allmän regel. 3. Teori Metoden i denna uppsats är klassisk tidsserieanalysteori. Inom detta område finns en mängd olika modeller, men den som kommer att användas är ARMA-modellen vilken kan utvecklas och anpassas till olika typer av tidsseriedata. Underlaget till denna modell finns bland annat beskrivet i Box, Jenkins & Reinsel (1994). Modellerna i uppsatsen är skattade med hjälp av EViews 7. Vi har även valt att använda TRAMO/SEATS som säsongsrensningsprogram eftersom att de är standard för säsongsrensning vid bland annat SCB och Eurostat. I följande avsnitt kommer denna ARMA-modellen och vidareutvecklingar av denna att definieras och diskuteras i vilka fall den är tillämpbar Tidsserieanalys En tidsserie beskriver utfallet från en stokastisk process och kan definieras som * + vari är det observerbara utfallet i de på varandra följande tidpunkterna t=1,2,,t. En tidsseriemodell syftar till att beskriva och modellera den process som skapade dessa utfall. Vid erhållande av en modell som kan beskriva de historiska observerbara utfallen är det därpå möjligt att använda densamma till att prediktera framtida utfall ARMA En metod som ofta används för att modellera en tidsserie är ARMA-modellen. För att korrekt kunna modellera en tidsserie enligt ARMA-modellen behöver vissa grundantaganden vara uppfyllda. Grundkravet är att den underliggande tidsserien är svagt stationär, det vill säga att serien har konstant medelvärde och varians samt att korrelationskoefficienten mellan y t och y t-k enbart beror på längden av lag k. En serie som innehåller en stokastisk trend och därmed 5

7 inte är stationär kan dock differentieras för att uppnå stationaritet och benämns då som ARIMA. En ARIMA-modell består därför av tre delar; den autoregressiva delen (AR), ett antal differentieringar (I) om den ursprungliga serien inte är stationär samt glidande medelvärde-delen (MA). Följande avsnitt är baserat på Pindyck och Rubinfeld sid Autoregressiv modell - AR(p) Den autoregressiva modellen av ordning p är genererad av ett viktat snitt av observationer p perioder tillbaka i tiden och är definierad enligt ekvation (1)., (1) där är observationen p perioder tillbaka i tiden, är den vikt med vilken observationen för p-perioder sedan påverkar den nuvarande observationen, är feltermen och är en konstant. För att en AR-process skall vara stationär får den inte innehålla någon enhetsrot. Ett nödvändigt villkor för stationaritet är att summan av -termerna är mindre än ett. Om detta villkor inte är uppfyllt är processen en slumpvandring med postitiv trend om är större än noll och med negativ trend om är mindre än noll. I den autoregressiva modellen, liksom i glidande medelvärde-modellen (som presenteras härnäst), antas störningstermerna vara genererade av en vitt brus -process, det vill säga att slumptermerna skall vara okorrelerade över tid samt ha konstant varians och väntevärde. Varje felterm antas dessutom vara normalfördelad med medelvärde 0 och varians σ 2. Autokorrelationsfunktionen 2 i en autoregressiv modell beror på alla tidigare observationer och är normalt avtagande för en stationär process. För att ta reda på av vilken ordning en modell är autoregressiv, alltså storleken på p, används den partiella autokorrelationsfunktionen. De p första värdena i den autoregressiva modellens autokorrelationsfunktion är 2 Se kapitel för en beskrivning av autokorrelationsfunktionerna. 6

8 ,.. (2) Dessa ekvationer är Yule Walker-ekvationerna 3. Om ρ 1, ρ 2,, ρ p är kända kan ekvationerna lösas för. Detta kräver dock att vi redan vet av vilken ordning (p) modellen är autoregressiv. Det går dock att komma fram till rätt ordning genom att testa olika värden på p i Yule-Walker-ekvationen och se om värdet på p (den partiella autokorrelationen vid lag p) är signifikant skilt från noll 4. Glidande medelvärde MA(q) En glidande medelvärde-modell av ordning q är definierad som, (3) Autokorrelationen för en glidande medelvärde-process av ordning q ges av { k = 1,, q k>q. (4) Således har en glidande medelvärde-funktion av ordning q ett minne på q perioder och det är därför möjligt att, genom att undersöka vid vilka laggar autokorrelationen skiljer sig från noll, få en uppfattning om vilken ordning glidande medelvärde-processen består av. Differentiering (I) Om en tidsserie inte är stationär, det vill säga att den underliggande stokastiska processen förändras över tiden, kan serien vanligtvis differentieras en eller flera gånger för att serien ska kunna modelleras i en autoregressiv- och/eller en glidande medelvärde-modell. På motsvarande sätt kan en serie säsongsdifferentieras för exempelvis månadsdata och därmed 3 Se Pindyck och Rubinfeld sid för härledning av Yule Walker-ekvationen 4 Om man t.ex. testar p=n och φ n är signifikant skilt från noll är det autoregressiva modellen åtminstone av ordning n. φ n är även definierat som värdet på den partiella autokorrelation för lag n. Genom att då testa p=n+1 kan man så småningom hitta vilken ordning modellen är av. 7

9 differentieras med avseende på 12 perioder tillbaka. En serie y t är homogent icke-stationär av ordning d ifall serien w t specificerad av ekvation (5), är en stationär serie.. (5) En metod för att upptäcka om en serie är stationär är att undersöka huruvida den har någon enhetsrot eller ej. Om serien har en enhetsrot bör den differentieras en gång för att åstadkomma stationaritet, har den två enhetsrötter bör serien differentieras två gånger och så vidare enligt samma logik vid fler enhetsrötter. ARIMA Vissa tidsserier är vare sig genererade av en ren glidande medelvärde- eller av en ren autoregressiv process, utan är istället genererade av en blandning av dessa. I fallet med en stationär tidsserie definieras för detta fall ARMA-modellen enligt. (6) Denna serie kan skrivas om till ekvation 7 med hjälp av backshiftoperatorn 5 ; ( ) ( ) (7) På liknande sätt kan ARIMA-modellen skrivas om till ( ) ( ). (8) I ekvation 7 och 8 är ( ) och ( ) Säsongsrensning Tidsserier avseende ekonomisk månadsstatistik kan delas upp i dess icke-observerbara delar; trend (T), säsong (S), cyklisk (C) och irreguljära effekter (slumpmässiga) (I). Med trend åsyftas den långsiktiga utvecklingen hos serien vilken exempelvis kan bero på ekonomisk tillväxt. Säsongselement kan vara sommarsemestrar, konsumentbeteenden runt exempelvis jul 5 Backshiftoperatorn (B) står för en lag en period tillbaka i tiden. B( ) är således detsamma som och B j är lika med. 8

10 eller av klimatologiska eller institutionella slag. Den cykliska komponenten däremot beror på periodiska faktorer som exempelvis konjunktureffekter. Slumpdelen fångar upp det brus som existerar i serien. Andra element som kan förekomma och som också kan påverka serierna för enskilda tidpunkter eller under begränsad tid är extremvärden (E) och kalendereffekter (K). Varje observerat värde i en originalserie ser därför ut enligt ekvation (9): O T C S K E (9) Med dessa effekter försvåras tolkningen av data likaså jämförelser över tid. På grund av detta finns det därför anledning att utveckla metoder, alltså säsongsrensning, för att urskilja och eliminera de effekter i datamaterialet som beror på dessa effekter. I en säsongsrensad serie är alla dessa effekter eliminerade. Den säsongsrensade serien kan därför användas för att göra jämförelser mellan alla tidpunkter i en tidsserie. I en säsongsrensad serie finns emellertid alltid ett kvarvarande brus, vilket skapar viss osäkerhet vid dylika jämförelser. Säsongen kan allmänt vara beskaffad på två olika sätt, antigen additiv eller multiplikativ. I den additiva modellen adderas eller subtraheras samma värde för alla de observationer som berör januari respektive februari et cetera. I den multiplikativa metoden är varje komponent istället proportionell mot det observerbara värdet i serien. Vid en logaritmering blir den multiplikativa metoden additiv för den ursprungliga serien. (Öhlén sid. 4-6, 2003) SARIMA I vissa typer av tidsserier förekommer trender i säsongslika strukturer med återkommande mellanrum. Dessa fenomen är speciellt vanliga i ekonomiska data där positiva effekter i handeln kring jul och helger efter löneutbetalningar är två exempel på års- respektive månadssäsonger som är återkommande. En ARIMA-modell kan använda sig av dylik information genom att tillåta säsongsvariation och sålunda bli en SARIMA-modell (Seasonal Autoregressive Integrated Moving Average). Om en vid lag s (exempelvis säsongens längd) differentierad serie ( ( ) ) passas till en ARMA(p,q)-modell ( ( ) ( ) ), ger detta SARIMA(p,d,q)x(P,D,Q)- modellen som är definierad enligt 9

11 ( ) ( ). (10) Där och är polynom av ordning p+sp och q+sq och Y t är differentierad eller säsongsdifferentierad om serien innehåller någon enhetsrot. En skillnad med en SARIMA-modell jämfört med att använda säsongsvariationerna som dummyvariabler är att den tillåter slumpmässighet i säsongstermen. (Brockwell och Davies, sid , 1996) TRAMO/SEATS TRAMO (Time Series Regression with ARIMA Noise) och SEATS (Signal Extraction in ARIMA Time Series) är två program som används tillsammans av bland andra Statistiska Centralbyrån (Can Tongur, SCB) för att säsongsrensa tidsserier. Följande beskrivning av programmen är skriven med vägledning av Ghysels och Osborn (2001) samt Gómez och Maravall (1997). TRAMO lineariserar den ursprungliga tidsserien genom att identifiera och ta bort flera typer av extremvärden, och interpolerar saknade observationer. Den automatiska detektionen av extremvärden plockar bort dessa en och en och estimerar däremellan ARIMA-processens parametrar på nytt för att undersöka deras betydelse för regressionens parametrar. Användaren har också möjlighet att ange specifika extremvärden, vilkas effekt då elimineras av TRAMO. TRAMO innehåller även en modellvalsalgoritm som väljer den modell som optimalt passar till den använda tidsserien. Givet observationsvektorn z som består av alla observationer skattar TRAMO, (11) där är en vektor av regressionsvariabler som kan väljas i TRAMO (till exempel för att fånga effekter av antalet vardagar eller påsk) och är en vektor av deras koefficienter. följer en ARIMA-process som väljs ut av programmet beroende på tidsseriens egenskaper. Programmet undersöker alla möjliga SARIMA-modeller till och med (3,2,3)x(2,1,2) (Gómez 10

12 & Maravall sid ) och väljer modell enligt Hannan-Rissanen kriteriet 6 med Kalmanfilter. Den slutgiltiga modellen väljs sedan ut efter BIC-kriteriet (se kapitel ) med ett möjligt tillval för att öka sannolikheten att antalet AR- och MA-termer skall vara detsamma. SEATS däremot delar upp tidsserien i dess icke-observerbara delar; trend, säsong, cyklisk och irreguljära effekter. Trendkomponenten fångar seriens långsiktiga trend, säsongskomponenten fångar säsongsmönstret, den cykliska komponenten fångar kortvariga variationer som kan uppstå av MA-komponenter av låg ordning. Den slumpmässiga komponenten fångar upp allt brus, vilket gör de tre första delarna brusfria. När SEATS används tillsammans med TRAMO använder programmet den modell som valts ut av TRAMO. Avslutningsvis justeras komponenterna samt prognoserna för de deterministiska effekter som togs bort av TRAMO Felmått När en modell har anpassats till ett datamaterial finns det flera olika sätt att kontrollera hur väl modellen förhåller sig till de faktiska observationerna. Den enklaste metoden är att estimera värden enligt den angivna modellen för att sedan jämföra dessa värden med de sanna värdena. Det finns ett stort antal felmått som kan göra liknande jämförelser, varav två används och förklaras i denna uppsats. Dessutom kan felmåtten användas på olika sätt där skillnader i informationsfönster och sampelstorlek påverkar tolkningen och vars intuition även förklaras i detta avsnitt (Pindyck & Rubinfeld, sid. 210, samt , 1998). RMSE En vanlig metod för att utvärdera en tidsserieprognos är att undersöka modellens RMSE (root mean squared error), där RMSE är definierat enligt ekvation 12, där är det predikterade värdet, är det verkliga värdet och T är antalet perioder. ( ). (12) 6 Enligt Hannan-Rissanen kriteriet skattas först en autoregressiv process till X t. Sedan skattas Xt på [Xt-i, ât-j] där â är residualerna från den första skattningen och där i och j går till p och q. Detta utförs för många olika p och q. (Newbold & Bos) 11

13 Detta kan antingen göras genom att göra en prediktion över det datamaterial som används för modellskattningen, eller genom att skatta en del av tidsserien och undersöka hur bra prediktionen är prognostiserad för den del som inte använts i modellskattningen. Genom att utvärdera modellen på det senare sättet minskar risken för att överskattning av modellen ska påverka felmåttet. MAPE Ett felmått som är relativt och således inte beroende av storleken på de estimerade värdena är MAPE (Mean absolute percentage error). Felmåttet ger värdet noll om modellen är perfekt skattad och saknar övre gräns. MAPE är definierat enligt ( ). (13) In sample En in sample-analys genomförs genom att skatta modellen för hela den undersökta tidsserien. Sedan jämförs modellens prognoser för varje i tidsserien ingående tidpunkt med de sanna värdena. Informationsfönster och Prognosfönster Figur 1. In sample - översiktsbild 12

14 Jan 1975 Nov 1989 Nov 1991 Jan 1975 Okt 1989 Okt 1991 Out of sample I en out of sample-analys är informationsfönstret vanligtvis rullande till skillnad från det fasta i in sample-kontexten I detta fall görs prognoser endast inom en given periodslängd på en modell skattad av en delmängd av samtliga observationer. Jämförelsen mellan de sanna och estimerade värden görs därefter på observationer som inte ingick i modellspecifikationen istället för på hela perioden. Denna delmängd flyttas sedan inom tidsperioden för att på så sätt undersöka felmåttet på olika delmängder. Informationsfönster Prognosfönster Informationsfönster Prognosfönster Figur 2 Out of sample - översiktsbild 3.3. Modellidentifikation I detta avsnitt presenteras de olika test och diagnosverktyg som kommer att användas i denna uppsats vid val och specificering av ARIMA-modell. 13

15 Enhetsrotstest För att kunna genomföra tidsserieanalyser korrekt krävs det att tidsserievariabeln är stationär vid användning av ARMA-modellen. För att testa detta är den konventionella metoden att undersöka huruvida tidsserien innehåller enhetsrötter eller inte. Avsaknad av enhetsrötter implicerar att det ej finns en stokastisk trend, medan en serie med enhetsrötter kan differentieras för att åstadkomma stationaritet. Förekomsten av enhetsrötter kan testas på ett flertal sätt, där ADF-testet och KPSS-testet är två av de mest användbara. Augmented Dickey Fuller (ADF) Det ursprungliga Dickey Fuller-testet är en form av enhetrotstest som undersöker förekomsten av enhetsrötter i en AR-modell (Pindyck & Rubinfeld sid , 1998). Enligt nollhypotesen, δ = 0, förekommer minst en enhetsrot. ADF-testet är en förlängning av det vanliga Dickey Fuller-testet som undersöker förekomsten av enhetsrötter i en AR(p)-modell, istället för en AR(1)-modell som i originaltestet. Enligt nollhypotesen δ = 0 (där δ = ρ 1) förekommer minst en enhetsrot, medan mothypotesen anger att tidsserien är stationär. Testet använder Dickey-Fuller-fördelningen 7, snarare än en vanlig t-fördelning. Testet utgår från. (14) KPSS KPSS-testet är en form av ett enhetrotstest som testar ifall stationaritet föreligger. Nollhypotesen säger att den observerbara originalserien är nivåstationär, alternativt trendstationär., (15) där täljaren är residualerna från en OLS-regression innehållande säsongselement och nämnaren är feltermens varians. Mothypotesen säger däremot att tidsserien har en enhetsrot. (Eviews 7. User Guide II sid. 387) 7 EViews använder sig av MacKinnons förkastelsegränser. 14

16 Autokorrelation Autokorrelationsfunktionen visar korrelationer mellan olika tidpunkter i en stokastisk process, vilket är användbart vid val av modell (se nedan under Modellspecifikation samt för en utförligare beskrivning Pindyck & Rubinfeld se sid , 1998). Tidsserier som innehåller systematiska element, alltså korrelation mellan observationerna i serien, är autokorrelerade. Autokorrelationsfunktionen beskrivs enligt ekvation 16 där autokorrelationen tas fram genom att beräkna korrelationsfunktionen mellan y t och y t+k ( ). (16) Den partiella autokorrelationen mellan och mäter däremot korrelationen mellan dessa variabler om korrelationen som härrör från de mellanliggande variablerna elimineras. Detta är således ett mått på det marginella bidraget till autokorrelationsfunktionen för varje observation. Ljung Box Ljung Box-testet är en form av portmanteau-test som undersöker autokorrelationen i tidsserier (Brockwell och Davies, sid , 1996). Testet är därför speciellt användbart vid användning av ARIMA-modeller eftersom att dessa förutsätter vitt brus. Ljung Box-testet prövar ifall residualerna av en skattad modell i den undersökta tidsserien är signifikant skilda från noll eller inte. Nollhypotesen utgår ifrån att observationerna, alltså populationskorrelationen, är slumpartad. Sålunda : ( ) ( ) ( ) 0. (17) Mothypotesen däremot säger att det inte är slumpartat. Teststatistikan ser ut som följer ( ), (18) där n är stickprovsstorleken på tidsserien, p k är autokorrelationskoeffiecenten vid lag k och h är antalet laggar som testas. Nollhypotesen förkastas vid signifikansnivå α ifall, efter χ 2 -fördelningen med h antal frihetsgrader. Godtas nollhypotesen anses tidsserien vara vitt brus. 15

17 Modellspecifikation För att välja vilken modell som är bäst lämpad till en tidsseries observationer när flertalet modeller är specificerade, finns det flera olika principer samt två stycken kriterier att använda som riktlinjer. Det finns däremot ingen konvention som exakt säger hur modellval rent allmänt skall gå till. Till att börja med är emellertid en modell med färre parametrar att föredra framför en modell med många parametrar, enligt måttfullhetsprincipen. Dessutom är ett högt justerat R 2 -värde att föredra framför en modell med ett lågt värde. Detta gäller speciellt när syftet med modellen är att göra prognoser eftersom att dessa gynnas av en högre förklaringsgrad. En ytterligare vägledning går att finna i autokorrelationsfunktionen och den partiella autokorrelationen. Som tidigare har beskrivits kan den förstnämnda hjälpa till med att bestämma i vilken ordning q MA-delen är beskaffad av, medan den senare går att hänföra till AR-delens antal laggar. AIC och BIC AIC (Akaike Information Criterion) och BIC (Bayesian Information Criterion) kan användas för att välja antalet laggar i en distribuerad lag-modell. AIC är definierat som ( ( ) ), (19) medan BIC definieras som ( ( ) ). (20) Skillnaden mellan att använda dessa kriterier mot att använda justerad R 2 vid modellval är att AIC och BIC till högre grad straffar fler variabler i modellen. Enligt kriteriet skall den modell med lägst värde på AIC eller BIC väljas av de alternativ till modeller som finns. Emellertid är dessa metoder dock inte regelrätta statistiska test för att välja antalet laggar och bör därför alltid användas tillsammans med intuition. (Pindyck & Rubinfeld, sid , 1998) 16

18 Chows test Råder det osäkerhet ifall en modell egentligen innehåller data där effekterna skiljer sig åt mellan olika perioder inom hela tidsperioden är Chows test en metod för att undersöka detta. Testet bryter ner tidsperioden i två delperioder som sedan separat skattas med identiska regressioner: Nollhypotesen blir sålunda (21). (22), vilket indikerar, om det är sant, att parameterkoefficienter för de två regressionerna är likadana och att effekterna därmed lika stora över hela tidsperioden. Kan nollhypotesen förkastas indikerar detta att datamaterialet lider av tidsseriebrott och att effekterna därmed skiljer sig åt i delperioderna inom tidsperioden. (Pindyck & Rubinfeld, sid , 1998) 4. Data Denna uppsats använder sig av tre olika tidsserier hämtade från Statistiska Centralbyrån med månadsdata som alla berör Sveriges varuhandel med omvärlden. Två stycken serier är oberoende av varandra, Sveriges totala export respektive totala import, medan den sista serien är beroende av de två första och består av total export minus total import och sålunda består av Sveriges handelsnetto. Samtliga serier är i originalform varken säsongs-, inflations- eller volymjusterade. Var och en innehåller serierna 428 observationer; en sträckning från januari 1975 till och med augusti De olika seriernas utveckling kan ses i figur 3. 17

19 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor Sveriges handel januari augusti 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 3. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti 2010 Både export- och importserierna har utvecklats positivt sedan Den totala exporten har vuxit från ett värde av miljoner kronor 1975 till ett värde av miljoner kronor i augusti Motsvarande siffror för total import är från miljoner kronor till miljoner kronor. Se tabell 1 för ytterligare deskriptiv statistik. Tabell 1. Deskriptiv statistik för svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Variabel Observationer Medelvärde Standardavvikelse Min-värde Max-värde Import Export Handelsnetto

20 I tabell 2 syns dessutom medelvärdena för respektive månad och serie. Export är låg i början på året, men lägst under juli och augusti samt högst i mars, juni och oktober. Import visar en liknande struktur som exporten, men är klart lägst i juli. Handelsnetto har sin topp i juni och botten i augusti. Överlag är det tydligt att säsongseffekter föreligger, med stora skillnader mellan de högsta och lägsta månadsvisa medelvärdena. Tabell 2. Månadsvisa medelvärden i miljontals kronor för export, import och handelsnetto. Månad Export Import Handelsnetto Januari Februari Mars April Maj Juni Juli Augusti September Oktober November December De positiva trenderna för serierna har egentligen bara brutits ordentligt med nedgångar vid två tillfällen, även om den positiva utvecklingen tillfälligt stannade av både vid 90-talets mitt och under IT-kraschen i början av 2000-talet. I början av 90-talet kan en svag nedgång skönjas i samband med 90-talskrisen efterdyningar medan en starkare nedgång inträffade under den senaste finanskrisen som inleddes Tidsserien kan därför delas in i två perioder; före och efter 90-talskrisen. Även om denna brytpunkt inte är den klaraste gör vi det av två anledningar: i) Brytpunkten är i ungefär mitten av tidsserien. ii) Den ligger mitt i en period där väldigt mycket skedde som påverkade den svenska ekonomin i grunden. En närmare beskrivning av vad som inträffade under denna 19

21 1975M M M M M M M M M M M M M M M M M M01 Miljoner kronor turbulenta tid och vilka följder dessa fick är dock utanför denna uppsats ramar. Vad som emellertid är relevant och värt att nämna är att den svenska kronan släpptes att flyta fritt den 19 november Detta efter åratal av att tidigare ha varit fastknuten mot andra valutor, vilket påverkade den svenska köpkraften och värdet på den svenska kronan gentemot omvärlden. Även om den största delen av den absoluta tillväxten har skett efter krisen, var tillväxten rent procentuellt sett större perioden före krisen gällande exporten. Denna växte med 472 % perioden innan och med 315 % perioden efter. Motsvarande siffror för importen visar däremot en större tillväxt efter (358 %) gentemot perioden före 90-talskrisen (321 %). Sveriges handel januari oktober Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 4. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med januari 1975 till och med oktober 1992 Handelsnetto kan delas in efter ett liknande mönster. Innan 90-talskrisen fluktuerade det nära och omkring ett balanserat resultat där export och import var lika stora. I början av 90-talet utvecklades detta däremot till ett positivt handelsnetto där export kontinuerligt låg högre än 20

22 1992M M M M M M M M M M M M M M M M M M11 Miljoner kronor import. I samband med den senaste finanskrisen vändes dock trenden med stora fluktuationer och ett negativt handelsnetto i augusti 2010 som följd Sveriges handel nov aug 2010 Månad import totalt, mkr export totalt, mkr handelsnetto, mkr Figur 5. Svensk varuexport, -import samt handelsnetto i miljontals kronor från och med november 1992 till och med augusti Granskning av data De tre serierna har testats för förekomsten av enhetsrötter via ADF- och KPSS-testen. Testresultaten återfinns i tabell 3. I samtliga fall är både intercept och trend inkluderade i testregressionerna. Detta eftersom att den deskriptiva statistiken visar på trender i serierna. Resultaten tyder på att ingen av serierna är stationära enligt samtliga förkastelsegränser upp till 10 procents-nivån. Efter en differentiering av serierna tyder emellertid ADF- och KPSStesten på att export och import är stationära. Testen av handelsnetto visar stationaritet på olika nivåer. ADF-testet kan på 1-procentsninvån förkasta nollhypotesen om enhetsrot medan KPSS-testet på 1-procentsnivån inte förkastar nollhypotesen om stationaritet. Med anledning av detta tillsammans med att vi har undersökt korrelogrammen av serien och residualerna för ett antal modeller samt deras AIC och BIC värden har vi valt att differentiera serien en gång i fortsättningen av uppsatsen. 21

23 Tabell 3. Resultat av enhetsrotstest på serierna export, import samt handelsnetto i miljontals kronor från och med januari 1975 till och med augusti Serie Nivå Första differensen ADF KPSS ADF KPSS Export -2, ,476332*** -4,968191*** 0, Import -1, ,502016*** -7,447996*** 0, Handelsnetto 0, ,272895*** -7,695800*** 0,152056** Dickey-Fuller t-statistika för ADF; förkastelsegränser: 1 % -3,980489, 5 % -3,420768, 10 % -3, Nollhypotes: Serien innehåller en enhetsrot. Test-statistika för KPSS; förkastelsegränser: 1 % 0,216000, 5 % 0,146000, 10 % 0, Nollhypotes: Serien är stationär. *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Eftersom att detta ger oss anledning att tro att åtminstone import- och exportserierna inte är stationära på grund av deras respektive positiva trender, tittar vi även på hur utvecklingen av förstadifferensen för respektive serie har utvecklats över vår undersökta tidsperiod. 8 Det framgår att medelvärdena i serierna över perioden är mer konstanta än i de versioner där variablerna inte är differentierade. Däremot ser vi att variansen ökar med tiden, vilket inte uppfyller kriterierna för en ARIMA-modell. Därför logaritmeras serierna innan de differentieras, vilket förbättrar seriernas egenskaper. Då vi enbart undersöker tidsperioden från och med november 1992 ser det ut som att tidsseriernas medelvärde även här är konstanta över tiden. Variansen uppvisar inte lika stora problem med att variera över tiden, men det skulle fortfarande kunna utgöra ett problem för vår analys om tidsserierna inte transformeras. Därför logaritmeras export- och importserierna även i detta fall. 8 För diagram, se appendix 1. 22

24 5. Resultat I detta kapitel presenteras resultaten av denna uppsats. Till att börja med att skattas de olika tidsserierna i ett flertal modeller som har valts ut efter teorin i modellspecifikationsavsnittet. Modellerna valdes ut framför allt med hänsyn till strukturen på de tre olika seriernas autokorrelationer och partiella autokorrelationer. Därefter gjordes de slutliga modellvalen efter vilka modeller som hade de lägsta AIC/BIC-värdena. De modeller som valdes ut användes sedan för att göra in sample- och out-of-sample-jämförelser. Därefter utsågs de modeller med lägst felmått för att göra prognoser två år fram i tiden. Att finna de modeller som passar data bäst innebär, som tidigare har förklarats, att inte alltid färdas på en enkelriktad och intuitiv väg. För att välja ut de modeller som med minst fel predikterar export, import respektive handelsnetto har vi därför först valt ut modeller efter tre olika tillvägagångssätt. I det första har vi först logaritmerat 9 serierna för att sedan själva säsongsrensat serierna med additiv metod och slutligen differentiera dem för att uppnå stationaritet. Serierna har till slut anpassats till ARIMA-modeller. I den andra metoden används SARIMA-modeller där serierna har logaritmerats, i vilka säsongsrensningen sker genom att differentiera serierna även på säsongsnivå (12 månader med anledning av att månadsdata används) och genom inkluderandet av säsongs-ar- respektive -MA-termer (SAR/SMA) i regressionerna. Till vår hjälp i dessa två metoder har vi använt oss av korrelogrammen 10 av de slutgiltiga serierna. I den sista metoden kördes programmet TRAMO/SEATS som själv räknar fram de bästa modellerna. Detta körs utan att korrigera för kalendereffekter men med automatisk extremvärdesdetektion. Resultaten för de, enligt korrelogrammen, mest logiska modellerna samt angränsande modeller för de olika serierna presenteras nedan och är grunden för resten av arbetet. 9 Eftersom att handelsnettoserien innehåller negativa tal kan denna dock inte logaritmeras. 10 För korrelogram över förstadifferenserna, se appendix 2. 23

25 5.1. Modellval Både TRAMO/SEATS och SARIMA pekar ut en modell med två AR-termer och en säsongs- MA-term för export-serien, se tabell 4. När vi själva säsongsrensar serien visar det sig däremot att även inkluderandet av en ordinär MA-term innebar ett lägre AIC-värde. Enligt måttfullhetsprincipen och ett lägre BIC-värde så väljs (2,1,0) för ARIMA. För SARIMA har (1,1,1)x(1,1,1) de lägsta AIC- och BIC-värdena, men eftersom den innehåller både en SARoch SMA-term så väljs även (2,1,0)x(0,1,1) ut. Dessa kommer sedan att användas till att göra prognoser. Tabell 4. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,022-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,031-2, , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) -0, SMA(12) -0, (2,1,0)x(0,1,1) AR(1) -0, AR(2) -0, MA(12) -0, (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) -0, SMA(12) -0, TRAMO/SEATS (2,1,0)x(0,1,1) AR(1) 0,81273 AR(2) 0,45119 MA(12) -0, ,085 0,003 0,001 0,005 0,024 0,762-2, , , , , , , , , , , , , , , Fetmarkerade värden är de lägsta AIC/BIC-värdena, vilket innebär bäst modeller inom ARIMA respektive SARIMA.. 24

26 För import-serien visar både ARIMA och SARIMA i grunden ut samma modell, enligt tabell 5. Denna modell innehåller två AR-termer och en MA-term, med en säsongs-ma-term i SARIMA-fallet. TRAMO/SEATS däremot vill inkludera ytterligare en AR-term, något som dock inte får stöd av AIC- och BIC-värdena av en liknande modell enligt de två första metoderna. Tabell 5. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för import januari 1975-augusti 2010 Modell Koefficienter P-värden AIC BIC Justerat R 2 (2,1,0) AR(1) -0, , , , AR(2) -0, (1,1,0) AR(1) -0, , , , (1,1,1) AR(1) -0, ,006-2, , , MA(1) -0, (0,1,1) MA(1) -0, , , , (2,1,1) AR(1) -0, AR(2) -0, MA(1) 0, ,030-2, , , (3,1,1) AR(1) 0, AR(2) -0, AR(3) 0, MA(1) -0, (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, (3,1,1)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(1) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) -0, MA(1) 0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,096 0,337 0,235 0,837 0,019 0,001 0,184 0,322 0,790 0,898 0,101 0,089-2, , , , , , , , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, SMA(12) -0, TRAMO/SEAT AR(1) 0,68488 S AR(2) 0,36247 (3,1,0)x(0,1,1) AR(3) -0, ,002 MA(12) -0,80695 Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. -2, , ,

27 I fallet där handelsnettot används pekar samtliga tre metoder ut, se tabell 6, samma modell som den bäst lämpade. Denna innehåller en MA-term och en säsong-ma-term. Tabell 6. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för handelsnetto januari 1975-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 (2,1,1) AR(1) -0, ,413 17, , , AR(2) 0, MA(1) -0, ,887 (1,1,1) AR(1) -0, ,314 17, , , MA(1) 0, ,038 (0,1,1) MA(1) -0, , , , (1,1,0) AR(1) -0, , , , (1,1,1)x(1,1,1) AR(1) -0, MA(1) -0, SAR(12) 0, SMA(12) -0, ,202 0,301 18, , , (2,1,2)x(0,1,1) AR(1) 0, AR(2) 0, MA(1) -1, MA(2) 0, SMA(12) -0, (2,1,1)x(0,1,1) AR(1) -0, AR(2) 0, MA(1) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, AR(2) -0, AR(3) 0, MA(12) -0, ,727 0,138 0,090 0,674 0,490 0,210 0,067 17, , , , , , , , , (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (0,1,1)x(0,1,1) MA(1) -0,74291 SMA(12) -0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA Efter 90-talskrisen En misstanke är dock att det finns ett brott i tidsserierna eftersom att serierna dels är långa och att det dels skedde mycket under denna period med 90-talskrisen som kulmen av detta. Därför genomför vi Chows brytpunktstest för att utröna om parametereffekterna egentligen skiljer sig åt under perioden istället för att vara konstanta över hela perioden. Eftersom att den svenska kronan släpptes flytande den 19:e november 1992 testar vi ifall det existerar ett brott i tidsserierna vid november i samma år. Testen för export- och import-serierna som visas i tabell 7 förkastar att det inte finns något brott på 5-procentsnivån, medan testet för handelsnetto-serien förkastar nollhypotesen på 10-procentsnivån. 26

28 Tabell 7. Chows brytpunktstest för brott i serien i november Export Import Handelsnetto F-värde 8,16*** 3,15** 2,41* *** = signifikant på 1-procentsnivån, ** = signifikant på 5-procentsnivån, * = signifikant på 10- procentsnivån Med hänsyn av detta skattar vi nya modeller för perioden november 1992 till och med augusti 2010 och exkluderar därför de äldre observationerna. Modellvalen genomförs efter samma metodik som tidigare och resultaten presenteras i tabell 8. Resultaten visar att både export och import bäst förklaras av (3,1,0)x(0,1,1)-modeller, vilka skiljer sig från de modeller som bäst passade till hela perioden. Handelsnettot förklaras dessutom bäst av en (0,1,1)x(0,1,1)-modell i SARIMA-fallet, medan TRAMO/SEATS väljer en (1,1,3)x(0,1,1)-modell för serien. 27

29 Tabell 8. ARIMA-, SARIMA- och TRAMO/SEATS-modeller för export, import samt handelsnetto november 1992-augusti Modell Koefficienter P-värde AIC BIC Justerat R 2 Export (2,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, SMA(12) -0, (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, SMA(12) -0, ,003 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,80082 AR(2) 0, AR(3) -0,15358 SMA(12) -0, ,045 Import (2,1,1)x(0,1,1) AR(1) -0, , , , AR(2) -0, MA(1) 0, SMA(12) -0, ,058 (3,1,0)x(0,1,1) AR(1) -0, , , , AR(2) -0, AR(3) 0, MA(12) -0, ,005 0,001 (0,1,1)x(0,1,1) MA(1) -0, , , , SMA(12) -0, TRAMO/SEATS (3,1,0)x(0,1,1) AR(1) 0,68753 AR(2) 0,31497 AR(3) -0,18049 SMA(12) -0, , Handelsnetto (0,1,1)x(0,1,1) MA(1) -0, , , , SMA (12) -0, (1,1,3)x(0,1,1) AR(1) -0, ,987 18, , , MA(1) -0, MA(2) 0, MA(3) -0, SMA(12) -0, ,046 0,576 0,053 TRAMO/SEATS (1,1,3)x(0,1,1) AR(1) -0,09517 MA(1) -0,97196 MA(2) 0,23154 MA(3) -0,10493 SMA(12) -0, ,216 0, Fetmarkerade värden är de lägsta AIC/BIC-värdena inom ARIMA respektive SARIMA. 28

30 5.2. Utvärdering av modellerna De utvalda modellerna från det förra avsnittet har i detta avsnitt använts till att estimera värden för de olika serierna. Dessa har tagits fram i både en in sample-kontext såväl som i en dynamisk out of sample-kontext, för att därefter valideras med hjälp av felmåtten RMSE och MAPE, se tabell 9. Out of sample-analysen har genomförts genom att prediktera de kommande två åren i ett rullande informationsfönster där slutperioden varierar från oktober 1989 till augusti Tabell 9. Felmått för export, import, handelsnetto samt export-import januari 1975-augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0) , ,843 (2,1,0)x(0,1,1) , ,087 (1,1,1)x(1,1,1) , ,087 TRAMO/SEATS N/A 11 N/A ,088 Import (2,1,1) , ,751 (2,1,1)x(0,1,1) , ,087 TRAMO/SEATS N/A N/A ,094 Handelsnetto (0,1,1) , ,745 (0,1,1)x(0,1,1) , ,393 TRAMO/SEATS N/A N/A ,355 Export-Import ARIMA , ,003 SARIMA , ,397 TRAMO/SEATS N/A N/A ,414 För hela tidsperiodens out of sample är det inledningsvis enkelt att se att de olika seriernas ARIMA-modeller leder till betydligt större fel än SARIMA-modellerna och modellerna från TRAMO/SEATS. 12 I övrigt är det svårare att göra någon tydlig gränsdragning mellan de två senare modellernas träffsäkerhet. T/S predikterar export bättre, medan SARIMA-modellen predikterar import bättre. Gällande handelsnetto har T/S ett lägre RMSE-värde, medan SARIMA har ett lägre MAPE-värde. Om vi istället definierar handelsnetto med hjälp av de andra serierna (export-import) ser vi att SARIMA-modellerna ger bättre felmått än TRAMO/SEATS, men sämre än den ursprungliga handelsnettoserien. 11 TRAMO/SEATS ger ingen information om in sample-felmåtten. 12 Eftersom att ARIMA-modellerna visar stora fel exkluderas dessa från vidare diskussion. 29

31 5.2.1 Efter 90-talskrisen Eftersom att vi fann ett brott i tidsserierna och därefter skattade nya modeller för tidsperioden november 1992 fram till och med augusti, gör vi även in-sample- och out-of-sample-analyser för denna kortare tidsperiod, se tabell 10. I dessa fall ligger prognosfönstret mellan februari 1998 till augusti 2010 för export och import, medan det börjar i mars 2006 för handelsnetto 13. SARIMA ger bättre felmått än TRAMO/SEATS i fallen export och import, medan resultaten visar det omvända för handelsnetto. Export-import visar till sist större fel än handelsnetto, detta skulle kunna bero på att handelsnetto är mer stabil än de övriga serierna. Tabell 10. Felmått för export, import, handelsnetto samt export-import november 1992-augusti RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Modell Export (3,1,0)x(0,1,1) , ,084 TRAMO/SEATS N/A N/A ,099 Import (3,1,0)x(0,1,1) , ,094 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,748 Export-Import (Handelsnetto) SARIMA , ,870 TRAMO/SEATS N/A N/A ,824 Då vi har noterat att valet av modell i de kortare serierna förändras vid borttagande av endast ett fåtal variabler, tittar vi istället på det brutna datasetet från november 1992 och framåt, med samma antal AR- och MA-termer som för hela perioden och med samma prognosfönster. När vi gör denna jämförelse ser vi att modellerna anpassade för den kortare tidsperioden har lägre in sample-fel än modellerna som är anpassade för hela perioden men skattade för den korta, se tabell 11. En sådan tydlig skillnad föreligger inte för out of sample-felmåtten. I export-fallets SARIMA-modell, som visar bättre felmått än TRAMO/SEATS, är RMSE-värdet något lägre 13 Anledningen till det kortare prognosfönstret är TRAMO/SEATS-modellen (1,1,3)x(0,1,1) inte kan göra prognoser längre tillbaka i tiden med det rådande informationsfönstret. 30

32 för modellen anpassade för hela perioden medan MAPE-värdet är marginellt lägre (0,0837 mot 0,0840) i modellen anpassad för den korta perioden. För import har modellen på den långa perioden för SARIMA bättre out of sample-felmått i båda fallen. I fallet handelsnetto är det samma modell i SARIMA-fallet och inga jämförelser kan därför göras. I TRAMO/SEATS-fallet, som visar bättre resultat än SARIMA, är RMSE betydligt lägre i modellen anpassad för den långa perioden, medan MAPE är något lägre i modellen anpassad för den korta perioden. Tabell 11. Felmått för export, import samt handelsnetto november 1992-augusti 2010, med samma antal AR- och MA-termer som modellerna anpassade för perioden januari 1975 augusti Modell RMSE In sample MAPE In sample RMSE - Out of sample MAPE - Out of sample Export (2,1,0)x(0,1,1) , ,0840 TRAMO/SEATS N/A N/A ,0964 Import (2,1,1)x(0,1,1) , ,0933 TRAMO/SEATS N/A N/A ,1127 Handelsnetto (0,1,1)x(0,1,1) , ,062 TRAMO/SEATS N/A N/A ,780 De slutliga prognosmodellerna blir sålunda (3,1,0)x(0,1,1) för export, främst med tanke på att vi har ett brott i serien. För import blir det (2,1,1)x(0,1,1), då modellen anpassad för den långa perioden skattad på den korta perioden i samtliga out of sample-fall visar bättre felmått. För handelsnetto väljs (0,1,1)x(0,1,1) från TRAMO/SEATS ut eftersom att denna modell visar avsevärt lägst RMSE-värden. Tittar vi på residualerna 14 från dessa modeller ser vi att export uppvisar lägre Q-värden än import som snabbt visar insignifikans. Däremot kan vi inte säga att residualerna från någon av dessa två modeller består av vitt brus. I motsats till detta tyder residualerna för handelsnetto 14 Korrelogram av residualerna återfinns i appendix 3. 31

Visa mer