2003:11 Säsongrensning av Naionalräkenskaperna Översik Bruonaionalproduken (BNP) Förändring från föregående kvaral, uppräkna ill årsak, procen. Säsongrensade värden och rend 7 6 5 4 3 2 1 0 1993 1994 1995 1996 1997 1998 1999 2000 2001-1 Källa: SCB Bilaga A ill Tidsserieprojekes slurappor
I serien Bakgrundsfaka preseneras bakgrundsmaerial ill den saisik som avdelningen för ekonomisk saisik vid SCB producerar. De kan röra sig om produkbeskrivningar, meodredovisningar sam olika sammansällningar av saisik som kan ge en överblick och underläa användande av sasisiken. Ugivna publikaioner från 2001 i serien Bakgrundsfaka ill Ekonomisk saisik 2001:1 Offenlig och priva verksamhe saisik om anordnare av välfärdsjänser 1995, 1997 och 1999 2002:1 Forskar kvinnor mer än män? Resula från en arbesidsundersökning rikad ill forskande och undervisande personal vid universie och högskolor år 2000 2002:2 Forskning och uveckling (FoU) i föreag med färre än 50 ansällda år 2000 2002:3 Föreagsenheen i den ekonomiska saisiken 2002:4 Saisik om privaiseringen av välfärdsjänser 1995 2001. En sammansällning från SCB:s saisikkällor 2003:1 Effeker av minskad dealjeringsgrad i varunomenklauren i Inrasa från KN8 ill KN6 2003:2 Consequences of reduced grade in deail in he nomenclaure in Inrasa from CN8 o CN6 2003:3 SAMU. The sysem for co-ordinaion of frame populaions and samples from he Business Regiser a Saisics Sweden 2003:4 Projek med anknyning ill projeke Saisik om den nya ekonomin. En karläggning av uvecklingsprojek och uppdrag 2003:5 Developmen of Alernaive Mehods o Produce Early Esimaes of he Swedish Foreign Trade Saisics 2003:6 Övergång från SNI 92 ill SNI 2002: Underlag för a bedöma effeker av idsseriebro 2003:7 Sveriges indusriprodukionsindex 1913 2002 Tidsserieanalys The Swedish Indusrial Producion Index 1913 2002 Time Series Analysis 2003:8 Cross-counry comparison of prices for durable consumer goods: Pilo sudy washing machines 2003:9 Monhly leading indicaors using he leading informaion in he monhly Business Tendency Survey 2003:10 Priva drif av offenlig finansierade välfärdsjänser. En sammansällning av saisik Ovannämnda rapporer, liksom övriga SCB-publikaioner, kan besällas från: Saisiska cenralbyrån, SCB, Publikaionsjänsen, 701 89 ÖREBRO, elefon 019-17 68 00 eller fax 019-17 64 44. Du kan också köpa SCB:s publikaioner i Saisikbuiken: Karlavägen 100, Sockholm
2003:11 Säsongrensning av Naionalräkenskaperna Översik Saisiska cenralbyrån 2003
2 Producen Saisiska cenralbyrån Avdelningen för Ekonomisk saisik Förfrågningar Sven Öhlén, el 08-506 950 95, Saisiska cenralbyrån e-pos: sven.ohlen@scb.se 2003 Saisiska cenralbyrån ISSN 1650-9447 Prined in Sweden SCB-Tryck, Örebro 2004.01 MILJÖMÄRKT Trycksak 341590
3 Innehåll 1 Bakgrund...4 2 En idsseries variaionskällor... 5 3 Uvecklingsarbee för säsongrensning... 6 3.1 Vad är bra kvalie vid säsongrensning?... 6 3.2 Uvecklingsarbee vid SCB... 7 3.3 Uvecklingsarbee vid Eurosa och ECB... 9 3.4 Vale av meod för säsongrensning... 9 4 Programmen TRAMO/SEATS... 9 4.1 Vad är en ARIMA-modell?... 9 4.1.1 Beeckningar för en ARIMA-modell... 10 4.1.2 Auoregressiva modeller... 12 4.1.3 Moving average modeller... 16 4.1.4 Mixade ARIMA-modeller... 16 4.2 TRAMO... 18 4.3 SEATS... 20 5 Säsongrensningens genomförande... 21 5.1 Val av ARIMA-modell... 21 5.2 Diagnosiska es... 28 5.3 Kalendereffeker... 28 5.4 Exremvärden... 32 5.6 Revidering av specifikaioner... 34 5.7 Osäkerhesmå... 35 5.8 Tidskonsisens och aggregeringar... 35 5.9 Teser med X-12-ARIMA... 36 5.10 Direk eller indirek säsongrensning... 36 5.10.1 Rekommendaioner från Eurosa och ECB... 36 5.10.2 Teoreiska överväganden... 36 5.10.3 Övriga kvaliesaspeker... 37 5.11 Variabilie hos säsongrensade serier... 37 5.12 Förbäringar av säsongrensningen... 40 Referenser... 42 BILAGA 1 Diagram... 45 BILAGA 2 Revideringar... 53
4 1 Bakgrund 1 Säsongrensning av naionalräkenskaperna gjordes fram ill 1999 med programme X-11- ARIMA på SCB:s cenraldaor. Då fick meodfunkionen vid avdelningen för ekonomisk saisik i uppdrag a se över säsongrensningen. Redan 1998 hade e uvecklingsarbee påbörjas vid SCB avseende val av meod/programvara för säsongrensning. Dea uredningsarbee har genomförs i samverkan med Eurosa. En arbesgrupp kring säsongrensning, val av programvara och saisiska meodfrågor kring säsongrensning har vari akiv sedan 1996 med represenaner från medlemsländerna sam flera associerade länder, däribland USA. SCB har delagi i denna arbesgrupp. E vikig beslu för SCB och Eurosa har vari vilken programvara/meod som bör användas för säsongrensning. Flera skäl har framförs för a programme X-11-ARIMA på sik borde ersäas. De alernaiv som ansågs vara mes inressana var X-12-ARIMA, en vidareuveckling av X-11-ARIMA och programmen TRAMO/ SEATS, som uvecklas av A. Maravall och V. Gomez 2. Med söd av idigare erfarenheer vid SCB 3 och de arbee som genomförs vid Eurosa 4, begränsades meoderna ill X-12- ARIMA sam TRAMO/SEATS. Uvecklingsarbee vid SCB har visa a meoderna för säsongrensning med TRAMO/ SEATS illämpade på svenska idsserier ger säsongrensade serier med hög kvalie. SCB har därför val a i försa hand använda TRAMO/SEATS för säsongrensning av de officiella idsserierna. Införande av dessa nya meoder har nu påbörjas vid SCB och genomförs hel vid naionalräkenskaperna. Övergången från X-11-ARIMA ill TRAMO/SEATS kommer också a succesiv genomföras i andra saisikgrenar. SCB har lag ned e omfaande arbee för a uppnå och bibehålla hög kvalie på säsongrensningen av naionalräkenskaperna, bl.a. genom a kalendereffekerna och effekerna av exremvärden har separeras från själva esimaionen av säsongeffekerna. För närvarande säsongrensas 136 idsserier i den löpande produkionen. För varje serie, har många beslu agis för a användaren av saisiken på bäsa sä skall kunna se den svenska ekonomins uveckling över iden, idenifiera vändpunker men även separera effeker av sörningar, som med andra meoder försvårar idsjämförelser. SCB:s meod för säsongrensning håller så hög kvalie som nu är eknisk möjlig, även i e inernaionell perspekiv. De rekommendaioner för god säsongrensning som nu diskueras bland experer i säsongrensning och idsserieanlys vid Eurosa och vid ECB, är sedan 1999 i väsenliga delar i produkion vid SCB. Dea innebär ine a korreka idsjämförelser allid kan göras för alla säsongrensade serier. Briser i underlagen och i saisiken framräder också hos de säsongrensade serierna. Samidig bör de beonas a efersom komponenerna i en idsserie,.ex. säsongfakorn, ine är direk observerbara, finns de ine någon rä meod. Varje meod och dess illämpning är en kompromiss, där olika aspeker måse värderas. I denna översik av säsongrensningen av naionalräkenskaperna vill SCB så enkel som möjlig beskriva hur den går ill och vad som har vari vägledande för a producera saisik med sor jämförbarhe över iden. 5 I kapiel 2, redovisas de variaionskällor som har beakas. Vad är en bra säsongrensningsmeod? är en cenral fråga som diskueras i avsni 3.1 följ av en kor presenaion av SCB:s uvecklingsarbee i 3.2. I kapiel 4 gör vi en uflyk i modellernas värld. Här preseneras den saisiska meodiken bakom programmen TRAMO/SEATS. Vissa saisiska kunskaper är 1 2 3 4 5 Förfaaren vill framföra e ack ill Lena Hagman, som på e konsrukiv sä framför saisikanvändarnas synpunker. Sluligen, e ack ill Lars-Erik Öller, som med sin sakkunskap bidragi med värdefulla synpunker. Spaniens riksbank. S.k. srukurella idsseriemodeller har idigare esas för säsongrensning vid SCB. Se (Öhlén, S. (1991). Se.ex. B. Fisher (1995) Decomposiion of Time Series Comparing Differen Mehods in Theory and Pracice. Eurosa April 1995. En saisisk meodrappor kommer a publiceras. Denna skrivs på engelska och kommer a redovisa resula för samliga serier vid naionalräkenskaperna. Två WEB-versioner (en svensk och en engelsk) kommer a göras illgängliga under 2003.
en fördel för försåelse av dea avsni,.ex. begreppen parameer, skaning, vekorer, ec. I kapiel 5 redogörs för hur SCB har genomför och lös olika kvaliesfrågor kring säsongrensning,.ex. SCB:s val av ARIMA-modell för en idsserie. I avsni 5.12 diskueras sluligen frågor om förbäringar av säsongrensningen vid SCB. Här berörs också kor behove av en forsa analys av udaa från säsongrensningen vid naionalräkenskaperna i syfe a förbära saisikens kvalie. I bilaga 1 visas diagram för de vikigase säsongrensade serierna i försörjningsbalansen. 5 2 En idsseries variaionskällor De finns många fakorer som påverkar de värden vi observerar i en idsserie,.ex. bruonaionalproduken (BNP). Meodiken som modern säsongrensning bygger på, skiljer på sex fakorer; Trend, Cykel, Säsong, Kalendereffeker, Exremvärden 6 sam Irreguljära effeker (slumpmässiga). Varje observera värde i en idsserie, O är summan av dessa icke observerbara fakorer, O = T + C + S + K + E + I (2-1) Den säsongrensade och kalenderkorrigerade serien SRK får vi genom a subrahera säsongfakorn och kalendereffeken från originalserien, dvs. SRK = O S K = T + C + E + I (2-2) som allså besår av rendcykeln sam effeker av slumpen och exremvärden. I många naionalräkenskapsserier är slumpfakorn ine så beydelsefull. Däremo kan exremvärdena E i en serie ibland vara sora. Skäle ill a exremvärden as med som en separa fakor vid säsongrensningen är a beräkningen av säsongfakorn då kan göras säkrare. Med rend brukar vi mena den långsikiga uvecklingen hos serien och anas bero på srukurella förändringar hos de bakomliggande fakorer som genererar serien,.ex. ekonomisk illväx. Den cykliska komponenen beror på periodiska fakorer,.ex. konjunkureffeker 7. Vad som skall räknas ill rend och cykel är ine hel give uan dessa brukar ofa sammanföras ill komponenen rendcykeln. Vi kommer i forsäningen a med renden avse rend inklusive cyklisk komponen. Orsaker ill säsongeffekerna är ofa klimaologiska, insiuionella eller konsumeners beeende,.ex. julhandeln. I Sverige är den mes dominerande säsongeffeken indusrisemesern under juli. Med kalendereffeker avser vi effeker som beror av.ex. anal arbesdagar under en period, sammansäning av dagar under e kvaral,.ex. anal måndagar och periodens längd i anal dagar. Även evenuell effek av påskhelgen räknas som en kalendereffek. De finns flera vikiga krav för a komponenerna i modellen (2-1) skall kunna esimeras. E av dessa är a komponenerna måse vara oberoende av varandra. Om.ex. säsongfakorn samvarierar med den cykliska komponenen, har förusäningarna för säsongrensningen försämras. E anna krav är a den irreguljära fakorn anas följa en oberoende normalfördelning. I prakiken är dessa och andra saisiska krav mer eller mindre uppfyllda, varför varje modell för idsserien allid är en viss förenkling av verkligheen. Vissa av de grundläggande förusäningarna för a den valda modellen är en accepabel approximaion, kan esas med saisiska es, vilke kan sägas vara ruin vid modern säsongrensning. 6 7 Den engelska beeckningen är oulier. Den kan dock ine direk översäas ill en konjunkurcykel i ekonomisk mening.
6 (2-1) kallar vi för en modell av idsserien med addiiva komponener (addiiv modell). För de flesa idsserier använder vi s.k. muliplikaiv modell, O = T C S K E I (2-3) Varje enskild komponen är här proporionell mo de observerade värde i serien. Om vi logarimerar (2-3), överförs (2-3) ill en addiiv modell. Därför kan vi diskuera säsongrensningen i ansluning ill en addiiv modell. Säsongrensning görs för a primär underläa för användaren a göra jämförelser av saisiken över iden. Om idsjämförelser görs på originalserien kommer olika förändringsmå a bero på mosvarande förändringar hos komponenerna i serien enlig (2-1). Genom a uppskaa alla komponener hos serien och hur dessa förändras över iden, kan vi eliminera de fakorer som för en viss användare är av mindre inresse. Till exempel är säsongvariaion kanske ine så inressan för de flesa saisikanvändare 8. De är inresserade av andra fakorer som påverkar uvecklingen. Den relaiva beydelsen av fakorerna enlig (2-1) 9 är olika för olika idsserier och varierar också över iden för en given idsserie. Ofa varierar alla fakorer i modellen (2-1) över iden. Säsongfakorn svarar ofa för sörre delen av variaionerna i serien men även kalendereffekerna och effeker av exremvärden kan vara beydande. Vid säsongrensningen skaas alla komponener i (2-1). I avsni 3, redovisas korfaa de frågesällningar som lega ill grund för SCB:s val av meod för säsongrensning av naionalräkenskaperna. Förs redovisas de egenskaper som analyseras vid SCB. Därefer ges en eknisk beskrivning av meoderna TRAMO/SEATS. 3 Uvecklingsarbee för säsongrensning I dea kapiel diskueras förs olika krav som kan sällas på meoder för säsongrensning. Därefer sammanfaas de meodarbee som genomförs vid SCB, Eurosa och vid ECB i samband med val av meod/programvara för säsongrensning. 3.1 Vad är bra kvalie vid säsongrensning? En cenral fråga vid uvecklingsarbee vid SCB och vid Eurosa, har vari vilka egenskaper som karakäriserar en bra/bäsa meod för säsongrensning. Val av meod/program och övriga val kring säsongrensningens genomförande har här vägles av de rekommendaioner som preseneras av Eurosa. Nedan ges en kor beskrivning av dessa rekommendaioner 10. a) Teoreiska egenskaper I vid mening skulle vi kunna säga a saisisk meod bör vara vägledande. Här avses.ex. a vid en modellbaserad ansas bör modellen vara validerad enlig saisisk meod och vara konsisen med daa. Anaganden bakom specifikaioner och esimaion bör vara explicia och precisa och vila på saisiska principer. Dea innebär.ex. a må på osäkerhe bör kunna beräknas på basis av saisisk eori. Uppskaade paramerar skall kunna relaeras ill mosvarande sanna sorheer,.ex. genom s.k. konfidensinervall. Meoden bör också ge vägledning och varna för problemaiska siuaioner med diagnosik. b) Empiriska egenskaper Modellen för en idsserie skall vara adekva och ha hög förklaringsvärde i saisisk mening 11. Om en säsongrensad serie rensas en gång ill med samma meod skall den nya sä- 8 9 För.ex. glassförsäljare, julgransförsäljare, ec. är naurligvis säsongvariaion synnerligen inressan. I relaion ill den fakiska serien. 10 Se hp://europa.eu.in/en/comm/eurosa/research/noris4/documens/plcy_v40.pp 11 E exempel på denna princip är a modellen väljs för a maximera likelihood-funkionen give de realiserade värdena i idsserien (likelihood-principen).
songrengrensade serien ine skilja sig från den idigare säsongrensade serien (idempoen). En säsongrensad serie med låg variabilie föredras framför e alernaiv med hög variabilie, om de för övrig är likvärdiga. Årliga oaler för den säsongrensade serien och originalserien bör vara så lika som möjlig (idskonsisens 12 ). En relaerad egenskap är e speciell önskemål a säsongrensad BNP och summan av dess delar skall vara lika. 13 Säsongfakorn och övriga komponener i idsserien bör vara oberoende (se idigare avsni) För meoder som bygger på prognoser av serien bör prognosfelen vara små. Den säsongrensade serien bör ha små revisioner. 14 Vändpunker hos den säsongrensade serien skall uppäckas så idig som möjlig men ändå vara säkra 15. Meoden skall också ha effekiva filer för esimaion av komponener i idsserien och för filrering av s.k. brus. Meoden bör sluligen ha e användarvänlig gränssni i Windows. c) Övriga aspeker Uöver de önskvärda egenskaper, som redovisas i a) och b) ovan, har SCB beaka andra vikiga egenskaper. Bland de saisiska har bias hos skaade komponener i en idsserie undersöks. Med bias avses här den genomsniliga avvikelsen mellan en esimerad fakor och mosvarande sanna fakor. Programvarans 'daalogiska' egenskaper har diskueras. Här avses hur den saisiska meoden har programmeras, gränssni mo användaren, förekomsen av s.k. buggar, robushe med avseende på nyjade algorimer, ec. Även implemenering av programvaran i SCB:s daormiljö, har övervägs och diskueras. 16 Inom ramen för samarbee med Eurosa, har frågan om direk eller indirek säsongrensning behandlas. Vad som här är bäs, är forfarande oklar, både beräffande eoreiska aspeker som prakiska/användarrelaerade. SCB:s sällningsagande beräffande direk eller indirek säsongrensning diskueras uförligare i avsni 5.10. 7 3.2 Uvecklingsarbee vid SCB Av kapiel 2 och 3.1 framgår a säsongrensning har många dimensioner. De är därför ine förvånande a de är svår a nå enighe om hur säsongrensning bör göras. E sor anal krav kan sällas och de slugiliga val som görs, måse med nödvändighe bli kompromisser mellan vad som är önskvär och vad som går a uppnå. I de här kapile beskriver vi sammanfaningsvis de uvecklingsarbee beräffande val av meoder för säsongrensning som genomförs vid SCB och vid Eurosa. Programmen TRAMO/SEATS och X-12-ARIMA anskaffades under hösen 1998. Med båda programmen följer en manual som beskriver insallaion av programvara och ekniska aspeker sam de paramerar som syr programmen. Båda programmen är skrivna för DOS. In/udaa sam syrfiler ill programmen skrivs som exfiler. Någon kommunikaion med WIN- DOWS fans ej 1998 med undanag av TRAMO/SEATS, för vilken e EXCEL-makro var uveckla av Eurosa 17 18. Gränssnie DEMETRA är sedan flera år under uveckling vid Eurosa. För närvarande finns versionen DEMETRA 2.0 (Sp.1) 19. De uvecklingsarbee och de eser som redovisas i dea avsni är genomförda med DOS-versionerna av X-12-ARIMA och TRAMO/SEATS. Under hösen 1998 genomfördes simuleringar avrapporerade i Lundqvis, P. och S. Öhlén (1998). Rapporen presenerades vid konferensen SAM98 (Seasonal Adjusmen Mehods) i okober 1998 i Bukares. Simuleringarna gjordes på fyra idsseriemodeller med kända syse- 12 Översäning från den engelska beeckningen ime consisency. 13 Dea har framförs vid Eurosa som e användarönskemål. 14 Här avses ine revisioner i originalserien. 15 Dea användarkrav går dock ej i prakiken a realisera då en idig signal ofa är behäfad med sörre osäkerhe än en senare signal. 16 Se Sköllermo och Öhlén (2000). 17 Dea används för vissa serier vid SCB. SCB har gjor ändringar i källkoden för a filer i Office 2000 skall kunna bearbeas. Makro har begränsad funkionalie, bl.a. kan ine naionell dagkorrigering göras. Någon suppor eller underhåll av makro ges ej av Eurosa. 18 Numera finns X-12-ARIMA i SAS version 8, dock med begränsad funkionalie. 19 Denna pupblicerades under 2002 och är föremål för eser vid SCB.
8 maiska komponener och sannolikhesfördelningar. Seriernas sokasiska egenskaper besämdes bl.a. av urvalsfele i fyra branscher i den korperiodiska leveranssaisiken vid SCB. De simulerade serierna hade sora likheer med de fakiska serierna från dessa fyra branscher. 1 000 serier genererades och rensades med programmen. Bias, RMSE och samband mellan säsongrensade värden, rendskaningar och mosvarande sanna värden suderades. Några väsenliga skillnader mellan TRAMO/SEATS och X-12-ARIMA kunde ej fassällas. Bias och RMSE för båda programmen är mycke lien. Samidig konsaerades a de för vissa månader råder problem,.ex. a säsongeffekerna hörande ill semesermånaden juli ine skaas på e korrek sä. Dea gäller dock båda programmen. I Öhlén (1998:3) redovisas en empirisk sudie på 66 serier från naionalräkenskaperna. Här görs jämförelser mellan X-12-ARIMA och TRAMO/SEATS med avseende på: Auomaiska val av ARIMA-modell, skillnader mellan årliga oaler av originalserien och den rensade serien (idskonsisens), jämnhe hos den rensade serien, kalendereffeker (påskeffek och sammansäning av veckodagar), idenifiering och esimaion av exremvärden. X-12-ARIMA idenifierar i allmänhe en ARIMA-modell med sörre komplexie än TRAMO/SEATS. Endas i undanagsfall idenifieras samma ARIMA-modell. Tidskonsisens hos rensade serier är i allmänhe e lie problem och skiljer sig ine mellan meoderna. TRAMO/SEATS producerar rensade serier vars förändringar har mindre variabilie. De rensade serierna är således jämnare. Meoderna skiljer sig väsenlig beräffande kalendereffeker. X-12-ARIMA idenifierar en påskeffek i 13 fall - TRAMO/SEATS endas i e fall. Mosvarande för ouliers är 27 fall respekive 17 fall. I Öhlén, S. (1999:1) görs en vidare analys av hur meoderna skaar exremvärden och kalendereffeker i ansluning ill en fix ARIMA-modell. 13 kvaralsserier från naionalräkenskaperna har unyjas. Vidare undersöks om SCB:s meod för jusering för anal arbesdagar är lämplig. I rapporen analyseras vidare meodernas skaningar av paramerar i ARIMA-modellen sam regressionsmodellen för anal arbesdagar. X-12-ARIMA och TRAMO/SEATS skaar regressionsmodellen lika. SCB:s kvomeod 20 för dagkorrigering ger ine goda resula. Parameerskaningarna av ARIMA-modellen är i flerale fall lika för de båda meoderna. Dea gäller dock ine alla serier. Båda meoderna kan generera inerna regressionsvariabler som kan användas för a esa effeken av anal dagar av viss yp,.ex. anal måndagar + anal isdagar + anal fredagar - anal helgdagar (rading day variabler). De visar sig här a programmen skiljer sig på e anmärkningsvär och svårolka sä. För a yerligare klargöra skillnaderna mellan programmen vid esimaion av kalendereffeker görs i Öhlén, S. (1999:2) en simulering med en idsseriemodell med kända kalendereffeker i en kvaralsserie. De visar sig här a X-12-ARIMA ger skaningar av de sanna effekerna som är mycke nära de sanna. TRAMO/SEATS gav ej korreka skaningar. Rapporen skickades ill A. Maravall, som är meodansvarig för TRAMO/SEATS och D. Findley som är ansvarig för X-12-ARIMA. Fele bekräfades av Maravall för versioner av TRAMO/SEATS före juni 1998. Fele är nu ågärda 21. I Öhlén, S. (1999:2)konsaeras bl.a. a programmens skaningar av en ARIMA-modell är olika då kalendereffeker också ingår i modellen. För a undersöka meodernas esimaion av dessa, görs i Öhlén, S. (1999:3) simuleringar med 12 ARMA-modeller med kända paramerar. Modellerna skaas också med programmen SAS och AUTOBOX. Skillnaderna mellan programmen är små och precisionen hos skaningarna måse anses godagbar. 20 Härvid juseras den fakiska serien före rensning i proporion ill anal arbesdagar under e kvaral relaiv ill e normalkvaral. 21 A de förekommer s.k. buggar i daorprogram är inge anmärkningsvär för TRAMO/SEATS. De förekommer vid all programuveckling, ine mins med Microsof s produker.
När nya observaioner läggs ill en idsserie revideras i allmänhe både de säsongrensade värdena och rendskaningarna jämför med idigare rensningar. Dea skapar e revisionsproblem hos den rensade serien. Dea revisionsproblem suderas i Öhlén, S. (1999:4)med unyjande av vå idsserier, BNP för perioden 1987-1998 och oala månaliga leveranser under 1990 1998. Revisionsfele mäs med RMSE 22. Säsongrensningen görs här dels i falle då meoderna själva väljer ARIMA-modell men även i falle då en given ARIMA-modell används vid alla rensningarna. Resulaen är här enydiga. TRAMO/SEATS ger i alla suderade fall mindre revisionsfel än X-12-ARIMA. 9 3.3 Uvecklingsarbee vid Eurosa och ECB Eurosa har sedan 1996 ure val av säsongrensningsmeod med hjälp av experis i idsserieanalys. En omfaande redovisning finns på Eurosas hemsida. 23 På basis av dea och de resula som presenerades vid konferensen SAM98 i Bukares 1998, har Eurosa förorda TRAMO/SEATS för säsongrensning 24. Även ECB har genomför liknande sudier i mindre omfaning. 25 ECB verkar för en konvergens mellan TRAMO/SEATS och X-12-ARIMA med en gemensam programvara. De är sannolik a dea kommer a genomföras inom de närmase åren. 26 3.4 Vale av meod för säsongrensning På basis av de uredningsarbee som genomförs vid SCB och vid Eurosa faade SCB 1999 beslue a använda TRAMO/SEATS för säsongrensning av naionalräkenskaperna. De resula som redovisas vid ECB beräffande val av programvara har ine ändra dea sällningsagande. E gränssni mellan de DOS-baserade programmen TRAMO/SEATS uvecklades med programvaran SAS och EXCEL vid SCB. 4 Programmen TRAMO/SEATS TRAMO (Time Series Regression wih Arima Noise, Missing Observaions and Ouliers) är e Forran-program som vid SCB körs på PC under MS-DOS och Windows. Programme används vid SCB som e förseg ill säsongrensning med programme SEATS (Signal Exracion in Arima Time Series). I programme SEATS sker dekomponeringen av en idsserie enlig modell (2-1) eller (2-3). I programme TRAMO skaas olika yper av kalendereffeker,.ex. en påskeffek sam olika sammansäningar av anal arbesdagar under en idsperiod. Programme skaar också effeker av exremvärden (ouliers) hos en idsserie, som negaiv påverkar säsongrensningens kvalie, såvida dessa effeker ine elimineras före säsongrensningen. Ouliers kan vara av olika yper och dessa beskrivs senare i dea kapiel. Sluligen används TRAMO för a skaa effeker av användardefinierade variabler. Den variabel som här används är baserad på anale arbesdagar under e kvaral. 4.1 Vad är en ARIMA-modell? Programmen TRAMO, SEATS men även den gamla meoden X-11-ARIMA, som forfarande används vid vissa saisikgrenar vid SCB, använder sig av s.k. ARIMA-modeller. Dea görs i TRAMO/SEATS som en inegrerad del i både skaning av exremvärden och andra deerminisiska effeker, men även vid dekomponeringen av serien i en säsongfakor och andra fakorer. För a läsaren skall få en viss försåelse för dea momen i säsongrens- 22 Roo mean square error. 23 hp://forum.europa.eu.in/public/irc/dsis/eurosam/informaion 24 Se fono 23. 25 hp://www.ecb.in/sas/press/pr0008sama.hm. Final repor, Task Force on Seasonal Adjusmen of Quarerly Naional Accouns, European Commision, Eurosa & European Cenral Bank, 10 Jan. 2002. 26 Dessa frågor och gemensamma rekommendaioner för Eurosa och ECB kring säsongrensning har diskueras vid e CMFB-möe i januari 2002 (Commiee on moneary, financial and balance of paymens saisics).
10 ningen, görs i dea avsni en kor presenaion av de grundläggande begreppen vid ARIMAmodellering. 4.1.1 Beeckningar för en ARIMA-modell Beeckningen ARIMA sår för AuoRegressive Inegraed Moving Average och parenensen (p,d,q)(p,d,q) är e kompak sä a represenera modellsrukuren. Beeckningen SARIMA används ibland och sår för Seasonal ARIMA och avser en ARIMA-modell med säsong. I forsäningen använder vi beeckningen ARIMA även i falle a modellen innehåller en säsongdel. Perioden f i en säsongmodell är ofa kvaral eller månad. En ARIMA-modell är en mycke generell klass av linjära idsseriemodeller, vars uveckling kan sägas börja med Herman Wold s berömda eorem om villkor för a en sådan modell exiserar. Han visade a om en idsserie var saionär kunde den represeneras som en s.k. moving average process. De sora lyfe med ARIMA-modellering gjordes av Box och Jenkins på 1970-ale, som uveckla en allmän meod för a idenifiera, esimera och diagosicera en ARIMA-modell och unyja den för prognoser av idsserien. 27 Figur 4.1.1 En ARIMA-modells beeckningar Icke-säsongdel säsongdel 6786 4748 AR I MA(p,d,q)(P,D,Q) f Periodicie Anal AR-ermer Anal differenieringar Anal AR-ermer Anal MA-ermer Anal differenieringar Anal MA-ermer Vi skall förs införa de grundläggande begreppen, idsserie, realisering, saionarie och auokorrelaioner. Sedan ger vi exempel på en s.k. AR(1) modell med unyjande av BNP. Efersom saionarie är e grundläggande krav vid ARIMA-modellering, går vi egenom hur man uppnår saionarie. Därefer ger vi exempel på s.k. MA(1) modell. Vad är en idsserie? För de flesa användare av saisik, orde de vara uppenbar vad som menas med en idsserie. De kan dock vara vär a fäsa focus på a en idsserie Y i saisisk mening är ufall på en slumpvariabel som är indexerad med iden. De är således fundamenal a se Y som en slumpvariabel, vars ufall beror av en sannolikhesfördelning. Om vi observerar den sokasiska variabelns värden (ufall) för T konsekuiva idpunker = < <, L, < brukar vi skriva slumpvariabelns ufall enlig { } 1 2 T { y,, L, } I sälle för { Y }, 1 2 T = (4-1-0), skriver vi Y eller bara y underförså a de kan vara den sokasiska variabeln som är av inresse, dess ufall och a idsvariabeln har e anal värden. Om vi känner sannolikhesfördelningen P(.) för Y, kan vi beräkna sannolikheen för olika händelser,.ex. Y Y. Sannolikheen för den fakisk observerade idsserien < P(Y <0) eller för händelsen 1 (4-1-0) brukar kallas för likelihooden för idsserien och beecknas ofa med y =,, L,. Denna beror normal av e enal okända paramerar represenerade L{ }, 1 2 T 27 Se Box, Jenkins (1970).
av en vekor Θ, liksom av en maemaisk funkion av dessa paramerar. För a kunna beräkna sannolikheer för alla idpunker i en idsserie kräver de a vi känner sannolikhesfördelningen för alla idpunker, dvs. den s.k. mulivariaa fördelningen Sannolikheen för den observerade serien kan vi då skriva formell som L ( { Y, = 1, 2, L, T } Θ). Olika skaningar ˆΘ 1 och ˆΘ 2 av paramerarna Θ ger olika sannolikheer L 1 och L 2 för den observerade idsserien. E vanlig sä a esimera Θ är a välja den skaning som ger den sörsa sannolikheen, max L ( { Y,,,, } ˆ = 1 2 L T Θ). Denna princip kallas maximum likelihood (förkoras ML) och används i TRAMO/SEATS för a skaa paramerar. Den är mycke vanlig inom saisiken och vid normalfördelningar har den goda saisiska egenskaper. Saionarie Begreppe saionarie är mycke vikig inom idsserieanalysen, ine mins vid prognoser av idsserier. Om sannolikhesfördelningen P(.) för Y ine förändras över iden, sägs den vara saionär. Ofa har ekonomiska idsserier en rend, vilke innebär a vänevärde för Y förändras över iden (ej saionär). Om variansen för Y ine är konsan uan beror.ex. av iden, har vi också en ej saionär idsserie. De försa momene vid ARIMA-modellering är a undersöka om idsserien är saionär. Om den ej är saionär,.ex. om de finns en rend, används olika knep för a överföra idsserien i saionär form. E vanlig knep a eliminera en rend är medels s.k. differenieringar, vilka beskrivs närmare i näsföljande kapiel. För a sabilisera variansen är de vanlig a logarimera seriens värden. I TRAMO/SEATS används differenieringar och logarimering för a överföra en icke saionär serie ill en saionär. Auokorrelaion I en idsserie { Y, = 1, 2, L, T } är de ofa samband mellan ufall vid olika idpunker. Korrelaionskoefficienen mellan mellan Y och Y h kallas för auokorrelaionen för lag h. Den brukar beecknas med ρ(h) och definieas som [ E( Y )][ Y h E( Y h )] [ E( Y )] 2 E[ Y E( Y )] 2 ρ ( h) = E Y (4-1-1) E Y h där E är medelvärde. Vi kan beräkna auokorrelaionen för en känd idsseriemodell. Omvän kan vi också genom analys av esimerade auokorrelaioner och andra likarade saisiska verkyg uala oss om vilken idsseriemodell som generera en viss idsserie. 28. Den är också e vikig verkyg för a karakärisera en idsseriemodell men även för a avgöra om.ex. residualerna i en idsseriemodell är s.k. vi brus. Auokorrerlaionerna hos residulerna beräknas för alla ARIMA-modeller som används vid naionalräkenskaperna för säsongrensning. BIC Vid idenifieringen av ARIMA-modeller i naionalräkenskaperna har speciell vik lags på måe BIC (Bayes Informaion Crierion) som bygger på likelihoodfunkionen L och definieras som BIC = -2 log(l) + K log (T), där K är anal paramerar i modellen och T anal observaioner som används vid esimaionen av modellens paramerar. h 11 28 Dea momen brukar kallas för idenifikaion och en klassisk referens är Box & Jenkions (1970).
12 Genom a öka komplexieen hos en idsseriemodell inkluderande flera ingående paramerar, kan värde på L ökas, vilke kan leda ill en s.k. överparamerisering av modellen. BIC-måe är en jusering av likelihoodfunkionen på så sä a e sraff udelas för anal paramerar K som modellen innehåller. E likara må är AIC (Akaikes Informaion Crierion), som definieras som AIC = -2 log(l) + 2 K Den modell som har min(aic), min(bic) är bäs enlig AIC respekive BIC-krierie. För uförligare diskussioner om modellval hänvisas ill Parzen (1974), Schwarz (1978) och Schibaa (1976,1986). I näsa avsni ger vi exempel på ARIMA-modeller. 4.1.2 Auoregressiva modeller kan approximeras med Många ekonomiska idsserier { Y } p i= 0 a Y = e, (4-1-2) i i där ai är s.k. paramerar (fixa al) och e en okorrelerad slumpvariabel. Denna idsserie kallas för auoregressiv modell AR(p) av ordningen p, där p är anal ermer bakå, för vilka de finns e idsberoende i serien. I en AR(1) beror Y endas av Y 1, dvs. Y = ay 1 + e (4-1-3) Genom a unyja rekursivieen Y i = ay i 1 + e i för i=1,, T, kan (4-1-2) uryckas Y = a T T + Y T i= 1 0 i a e i a T Y Om a < 1 blir T lie för sora T, varför en AR(1) kan skrivas29 = i Y a ei (4-1-4) i=0 Dvs. en AR(1) och illräcklig lång idsserie kan represeneras av ufall på en följd av slumpvariabler. Dea är e exempel på en viss ubybarhe i represenaionen av en idsserie. (4-1-4) är nämligen exempel på en s.k. moving average process, vilka exemplifieras i näsa avsni. De finns flera saisisk likvärdiga sä a represenera en idsserie. 29 Om.ex. p=9, X=100 och a=0.50, blir urycke 0.10.
I AR(p) processen (4-1-2) beror ufalle Y av vad som hän idigare, dvs av Y i och på paramerarna a i. Auokorrelaionskoefficienen för en AR(1)-modell kan visas vara ( h ) = a h ρ och auokorrelaionen mellan Y och Y h beror endas på idsavsånde h och på parameern a. Då a anas vara mindre än e, är ρ(h) en avagande funkion och nära noll för avlägsna observaioner. Från de maemaiska urycke för idsserien, kan vi härleda idssambande hos serien för godyckliga idpunker. Egenskaper hos idsserien ger egenskaper hos auokorrelaionerna. Omvän ger kunskap om auokorrelaionerna informaion om egenskaper hos idsserien, vilke används vid s.k. idenifiering av idsseriemodellen. Vi skall nu ge e exempel på en auroregressiv modell av ordningen 1, dvs. en AR(1) för BNP. 30 Om vi anar a BNP för e kvaral beror linjär av BNP föregående kvaral, kan en AR(1) - modell för BNP skrivas 31 BNP = m + abnp 1 + e (4-1-5) 13 där m,a är paramerar och e en normalfördelad slumpvariabel, som anas vara oberoende och lika fördelad för olika idpunker (vi brus) med medelvärde 0 och konsan sandardavvikelse σ. Om vi esimerar modellens paramerar med.ex. programvaran SAS, får vi följande skaade modell för perioden 1993-2001 i 1995 års priser. BNP = 71325 + 0.392BNP 1 + e (3.8) (2.5) (4-1-6) AIC=817, R 2 = 0. 13, σˆ =38926 och alen inom pareneser är e -es för hypoesen a de sanna parameervärde är noll. -ese för hypoesen b=0 förkasas på signifikansnivån 5 procen. De linjära beroende mellan BNP e kvaral och BNP föregående kvaral är saisisk signifikan men modellen har låg förklararingsvärde. R 2 = 0.13 är den s.k. mulipla korrelaionskoefficienen, vilken är e må på hur väl modellen anpassar sig ill daa 32. Dea låga värde anyder a modell (4-1-6) ine är lämplig. Vad är de som orsakar modellens låga förklaringsvärde? Lå oss undersöka modellens residualer, dvs. avvikelserna mellan fakisk BNP och de skaningar som modellen (4-1-6) ger, dvs. serien e. I fig. 4.1.1 illusreras denna residual. 30 Den kan också skrivas ARIMA(100)(000). 31 Denna modell kallas också för markov-process med drif. Förändringen från en idpunk ill näsa besäms av värde på m sam ufalle på slumpvariabeln e. 32 För en modell med perfek linjär sambanb är denna koefficien lika med e. Koefficienen för en modell uan linjär samband är noll.
14 Figur 4.1.1 Residual för modell (4-1-6) för BNP 100000 80000 60000 40000 20000 0-20000 -40000-60000 -80000 1993 1994 1995 1996 1997 1998 1999 2000 2001 Vi kan här se a residualen har en rend över iden sam a de finns e säsongmönser. De är uppenbar a residualen ine uppför sig som s.k. vi brus; dess fördelning ändras över iden och de finns e idsberoende. Auokorrelaionerna för residualen redovisas i abell 4.1.1 för olika lag; Lag =1 avser kvaral -1, Lag=2 kvaral -2 ec. I abellen redovisas också sandardavvikelserna för auokorrelaionerna och es av hypoesen a en auokorrelaion är noll. -ese för Lag=4 har värde 3.52 och vi har e saisisk signifikan idssamband på fyra kvaral, dvs. vår serie uppvisar saisisk signifikan säsongvariaion. För a modell (4-1-6) skall vara adekva för våra daa, måse vi eliminera denna säsongvariaion men även renden. De vanligase säe a eliminera säsongvariaionen i residualen, är a differeniera serien på säsongfrekvensen, i dea fall 4 kvaral. Dea brukar skrivas 33 ( 1 B 4 ) BNP = BNP BNP 4. I sälle för a modellera BNP serien, modelleras denna differenierade serie. Tabell 4-1-1 Auokorrelaioner hos residual för modell (4-1-6) Lag Auokorrelaions- Sandard- -es koefficien avvikelse 1-0.26 0.17-1.53 2 0.53 0.18 2.94 3-0.30 0.22 1.36 4 0.81 0.23 3.52 5-0.31 0.31 1.00 6 0.38 0.32 1.19 7-0.32 0.33 0.97 8 0.63 0.34 1.85 ( 1 5 4 1 B ) BNP = 4286 + 0.669( BNP BNP ) + e (1.8) (4.4) (4-1-7) AIC=604, R 2 = 0. 40 och σˆ =5553. Denna modell är bäre i ermer av AIC, anpassning och i ermer av variabilieen hos slumpermen. 33 Operaorn B k definieras som k B ( y ) = y. k
15 I Fig. 4.1.2 illusreras residualen i (4-1-7) En alernaiv formulering av (4-1-7) är: = BNP 4 + 4286 + 0.669( BNP 1 BNP 5 ) e (4-1-8) BNP + Den skaade modellen, kan vi använda för prognos.ex. för idpunken 2001:4 genom BNP 4286 + e 2001 :4 = BNP2000:4 + + 0.669( BNP2001:3 BNP2000:3 ) Här är alla ermer kända med undanag av slumpermen e 2001: 4. Efersom vi anar a den är oberoende över iden och har medelvärde noll, är 0 den bäsa predikionen av denna, varför prognosen för fjärde kvarale 2001 blir: BNP = 532738+4286+0.669(457783-455781)=538 363, 2001:4 vilke innebär en ökning med 1.1 procen jämför med fjärde kvarale 2000. Denna prognos ger en ökning i BNP mellan år 2000 och 2001 med 1.2 procen. Av Fig. 4-1-2 framgår a residualen för modell (4-1-7) baserad på den säsongdifferenierade serien uppvisar en mera komplex karakär. Dels uppvisar serien auokorrelaion men också en variaion som kan hänföras ill anal arbesdagar. En yerligare differeniering på Lag =1, visas nedan. E idsberoende på Lag=1, kan elimineras genom a införa en differensiering på serien ( 1 B 4 ) BNP = BNP BNP 4 enlig 4 ( 1 B )(1 B ) BNP = (1 B)( BNP BNP 4 ) BNP BNP ( BNP BNP 5 ) = 4 1 Den variabilie i residualen som beror på anal arbesdagar, kan dock ej elimineras på dea sä. 34 BNP BNP ) = 339 + 0.492 (-0.5) (7.5) 2001:4 [ BNP BNP ( BNP BNP )] 4 ( BNP 1 BNP 5 1 5 2 6 AIC=555, R 2 = 0. 67 och σˆ =3386, en förbäring jämför med modell (4-1-7) 4 Modellens kan skrivas enklare med operaorern B ( y ) = y y 4 som BNP 339 + e (4-1-9) 4 4 = + BNP 4 + 1.492(1 B ) BNP 1 0.492(1 B ) BNP 2 BNP besämmes här som BNP samma kvaral föregående år plus en vägd summa av idigare förändringar av BNP. Den skaade modellen (4-1-9) kan också användas för prognos av BNP. För fjärde kvarale 2001 är denna prognos 532747, vilke mosvarar en oförändrad BNP jämför med fjärde kvarale 2000. Beroende på a denna modell är en bäre beskrivning av BNP-serien jämför med modell (4-1-7), är denna prognos mer sannolik än den idigare prognosicerade ökningen, 1.1 procen. 34 Vid säsongrensningen modelleras denna explici. Se avsni 4.2.
16 I Fig. 4-1-3 illusreras BNP-serien och predikionen av BNP med modell (4-1-9) grafisk inklusive prognosen för fjärde kvarale 2001. 35 I denna modell av BNP har vi gjor vå differenieringar, den ena med avseende på säsongfrekvensen och den andra för icke-säsongdelen, dvs. vi har sa d=1 och D=1 för a BNP-serien skall vara saionär. Vi har därefer skaa den auoregressiva parameern i modellen med programvaran SAS och dess värde är 0.49. Dea är e exempel på en ARIMA(110)(010). 4.1.3 Moving average modeller Vi skall även i dea avsni unyja BNP-serien för a visa a andra modeller för BNP är änkbara. Vi börjar med en s.k. moving average modell, MA-modell. Redan idigare har vi konsaera a originalserien för BNP uppvisar säsongvariaion med perioden 4. Vi kan därför sara med säsongdifferenieriangen 4 (1 B ) BNP = µ + ε Om vi esimerar denna modell, får vi 4 (1 B ) BNP = 13363 + e (4-1-10) Residualen illusreras i Fig.4.1.10 och visar en hög auokorrelaion. Residualen e och e 1har sark posiiv korrelaion. De visar sig a den kan modelleras som e 0.61 + ε (4-1-11) = e 1 där ε är okorrelerad i iden. (4-1-10) och (4-1-11) kan sammanföras ill 4 ( 1 B ) BNP = 12691+ 0.61e + e (4-1-12) (4-1-2) kallas för en moving average process av försa ordningen MA(1). 1 Genom a a med flera e k för k=2,, får vi en MA-process av högre ordning. Modell (4-1-12) skrivs ARIMA(001)(010). 4.1.4 Mixade ARIMA-modeller Många idsserier kan approximeras som AR-modeller eller MA-modeller. För vissa idsserier kan man genom a införa både AR-ermer och MA-ermer uppnå en bäre anpassning än om enbar AR-ermer as med. För a avgöra hur många ermer som skall as med och vilken yp av represenaion som är bäs, används många olika saisiska verkyg, bl.a. auokorrelaioner, värde på likelihood funkionen och BIC-måe. I avsni 4.1.2 och 4.1.3 gavs exempel på olika sä a represenera BNP-serien. Hur dea görs, har konsekvenser på den esimerade modellens prognosförmåga sam på residualernas egenskaper. Indirek har vale av modell också effeker på säsongrensningen. Dea beskrivs närmare i avsni 5.1. 35 Differenieringen av serien medför a vi miser observaioner i början av serien. Prognoserna kan dock göras bakå i serien med unyjande av rekursivieen eller med andra meoder,.ex. s.k. Kalman-filer.
17 Figur 4.1.2 Residual för modell (4-1-7) för BNP 15000 10000 5000 0-5000 -10000-15000 1993 1994 1995 1996 1997 1998 1999 2000 2001 Figur 4.1.3 Predikion av BNP. Modell 4-1-9 Fakisk Predikion 550000 500000 450000 400000 350000 300000 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
18 Fig. 4.1.4 Residual i modell 4-1-9 8000 6000 4000 2000 0-2000 -4000-6000 1993 1994 1995 1996 1997 1998 1999 2000 2001 Figur 4.1.5 Residual i modell (4-1-10) 12000 7000 2000-3000 -8000-13000 -18000-23000 1993 1994 1995 1996 1997 1998 1999 2000 4.2 TRAMO Framsällningen i dea avsni är mera eknisk och orde kräva viss saisisk erfarenhe. Säsongrensningen med TRAMO/SEATS görs i vå seg. I TRAMO specificeras och skaas en regressionsmodell vars slumperm, kan beskrivas med en ARIMA-modell. Give idsserien y = ( y 1, L, y ) av observerade värden, skaar TRAMO regressionsmodellen y = x' β + v (4-2-1)
19 där x är en vekor besående av m regressionsvariabler x = ( x, L, x ), (4-2-2) ' 1 m β en vekor av m okända paramerar. β = ( β, L, β ) (4-2-3) ' 1 m och v följer en generell ARIMA-process. I forsäningen låer vi beeckningen ARIMA(Θ) avse den ARIMA-modell som i saisisk mening är en bra beskrivning av den observerade idsserien y. Θ är en vekor av okända paramerar, ˆβ, Θˆ är skaningar av β, Θ. Alla paramerar i ARIMA-modellen och regressionsmodellen skaas samidig med maximum likelihood (ML). Härvid beräknas e anal diagnosiska es, bl. a. modellvalsmåe BIC, vilke anger likelihood för modellen. BIC-måe har en besraffning för överparamerisering av modellen (se kapiel 4.1.1). TRAMO har en algorim för auomaisk idenifiering av ARIMA-modellen men den kan också specificeras av användaren. Regressionsmodellen (4-2-1) används för a skaa vå yper av effeker, kalenderefeker sam effeker av exremvärden. Nedan redovisas närmare hur dessa effeker har införs. Fördefinierade regressionsvariabler i TRAMO är: a) dummyvariabler för addiiva exremvärden (AO), nivåskifen (LS) och emporära förändringar (TC), b) anal arbesdagar, # 36 (måndagar+isdagar+, +fredagar)-#lördagar- #söndagar, c) #måndagar-#söndagar,, #lördagar-#söndagar, d) anal dagar i kvarale, e) påskeffek. Påskeffekens längd kan varieras för a uppnå bäsa förklaringsvärde för idsserien. Regressionseffeken av en addiiv oulier specificeras enlig regressionsmodellen y = β x + v (4-2-4) där 1om =0 x = (4-2-5) 0 om 0 TRAMO använder en sökalgorim baserad på e signifikanses för βˆ för alla idpunker i serien. Algorimen påminner om segvis regression, varvid man söker sig från en enkel modell ill en sörre. Om βˆ är signifikan för en godycklig idpunk = 0 bland våra observaioner, föreligger en AO av sorleken βˆ vid idpunken = 0. 36 # beecknar anal.
20 För e nivåskife (LS), definieras regressionsvariabeln enlig 1om 0 x = (4-2-6) 0 om < 0 Regressionsvariabeln för en påskeffek är 1om 0 + x = (4-2-7) 0 för övrig 0 l där längden av påskeffeken, l konrolleras av användaren. En regressionsvariabel associerad med en emporär förändring har också inkluderas. Härvid avar effeken exponeniell från e värde ill noll under en begränsad id. 37 Exremvärden av yp AO, LS och TC skaas auomaisk av TRAMO och inkluderas om dessa är signifikana. Effeken av anale arbesdagar har inkluderas i modellen på följande sä. Från den svenska almanackan beräknas följande kvo på finase branschnivå anal arbesdagar under kvaral x = (4-2-8) genomsnilig anal arbesdagar under e kvaral Kvoen (4-2-8) som ine är direk applicerbar i TRAMO, har räknas om ill en addiiv komponen i värde med fasa priser, vars aggregerade effek under e år är noll. 38 Programme esimerar modellens paramerar med ML eller med minsa kvadrameoder, vilka beskrivs närmare i Gómez och Maravall (1992,1994), Gómez, Maravall och Pena (1996). Programme använder Kalman filre och andra filer, beskrivna i Gómez och Maravall (1993) för de prognoser av idsserien som används vid säsongrensningen. Exremvärden behandlas e å gången enlig en meod som beskrivs i Tsay (1984). Inklusion av e ny exremvärde baseras på e signifikanses. TRAMO eliminerar vad vi kan benämna deerminisiska effeker hos idsserien. Dessa anas ine ha någo samband med säsongvariaionen i serien. Serien med eliminerade regressionseffeker, dvs y x' βˆ används därefer av programme SEATS, där dekomponeringen av serien görs. Dea beskrivs korfaa nedan. 4.3 SEATS I SEATS dekomponeras den lineariserade serien 39 i komponerna 40 v = v i (4-3-1) i där komponenerna i SEATS är v p = rend, v s = säsong, v c = cykel och v u = slump. 37 Exempel på dessa yper av exremvärden ges i abell 5.4.1. 38 Dea är vikig då de ine skall vara någon aggregerad effek av anale arbesdagar under e år, såvida arbesiden ine har förändras. 39 Effekerna av exremvärden och kalendereffeker har elimineras av TRAMO. 40 Den saisiska grundvalen för denna dekomponering med SEATS ges i Creveland och Tiao (1976), Box, Hilmer och Tiao (1978), Burman (1980), Hillmer och Tiao (1982), Bell och Hillmer (1984), Maravall och Pierce (1987).
Klassificering av komponener refererar ill egenskaper i den s.k. frekvensdomänen, närmare besäm spekralähesfunkionen 41 hos komponenerna. Trendkomponenen represenerar den långsikiga förändringen av en serie med en spekralopp vid frekvensen noll. Säsongkomponenen har en spekralopp för säsongfrekvenserna, vå för kvaralsdaa och fem för månadsdaa. Den slumpmässiga komponenen skall vara vi brus med e jämn spekrum 42. Idenifiering av komponenerna sker således i frekvensdomänen med nyjande av spekralanalyiska meoder. Varje komponen i (4-3-1) ges en ARIMA represenaion 43. Idenifiering av paramerar görs genom införande av resrikioner i modellen 44. Dessa går här under benämningen den kanoniska egenskapen. Maemaisk innebär dea a komponenerna görs orogonala mo varandra. 45 Dea leder ill en dekomponering av serien som minimerar bruse i den säsongrensade serien. Dea görs konsisen med den specificerade ARIMA-modellen för v. Vid skaningen av komponenerna prognosiceras originalserien vå år framå/bakå för a kunna unyja opimala Wiener-Kolmogorov filer med minsa medelkvadrafel (MMSE). Om den specificerade ARIMA-modellen är adekva och komponenerna oberoende 46, är denna meod i saisisk mening den bäsa linjära meoden för a filrera brus, dvs. a a fram signalerna säsong och rendcykel. 47 21 5 Säsongrensningens genomförande De finns ine någo enydig kvaliesbegrepp rörande säsongrensning. Därför är de ine förvånande a de i dag förekommer många olika meoder för säsongrensning. Tidigare har uvecklingsarbee för a välja en bra meod vid SCB berörs och moiven för vale av TRAMO/SEATS har diskueras. Hur säsongrensningen görs för varje enskild serie beror ine bara på val av programvara/saisisk meod uan också på hur meoden anpassas ill varje enskild serie. Här kan vi låa programme göra alla val (defaulvärden). Vi kan också göra individuella anpassningar och val för varje enskild serie. Vid säsongrensning av naionalräkenskaperna har varje individuell serie analyseras och vale av den saisiska modellen för serien har ske individuell så a den på bäsa sä beskriver de fakiska variaionerna i serien. I följande avsni redogörs för säsongrensningens genomförande. 5.1 Val av ARIMA-modell Den modellbaserade säsongrensningen bygger på saisiska meoder inom idsserieanalysen. E vikig inslag är a prognosicera serien vå år framå/bakå för a med rensningen nå u ill bägge ändarna i serien. Om prognoserna är bra kommer revisionerna av de säsongrensade värdena a vara så små som är möjlig med hänsyn ill varje enskild series variabilie och osäkerhe. För a kunna göra en prognos, görs förs en saisisk beskrivning av idserien med en ARIMA-modell, vilke nu är en sandardmeod för linjär modellering av idsserier. Vid denna modellering besäms förs srukuren på den modell som skall nyjas 48. Dea kan göras på flera sä, men en vanlig saisisk meod bygger på den s.k. likelihood-principen, 41 Exempel på unyjande av spekralanalys ges i.ex. Fishman (1969), kapiel 3. 42 Beeckningen vi brus refererar ill en spekraluppdelning av frekvenser i de ljus som öga kan uppfaa. Om man blandar ljus med olika färger, dvs. frekvenser, blir de ljus som öga uppfaar vi. 43 Denna är konsisen med ARIMA-modellen för originalserien. 44 Se Maravall (1995), sid 32. 45 Dea villkor för a uppnå idenifiering av icke observerbara fakorer används också inom andra områden i saisisk eori,.ex. vid s.k. principalkomponenanalys och fakoranalys. Se Morrison (1967). 46 Märk a modellens anaganden om linjarie, saionarie och komponenernas orogonalie ine allid är hel uppfyllda i prakiken. 47 De meoder som används i programme X-12-ARIMA har ine denna egenskap. Beydelsen av dea är a för vissa serier, kan X-12-ARIMA sägas ha godagbara filer. För andra serier, är filreringen i X-12-ARIMA hel olämplig. För beydelsen av filer för a eliminera brus, se.ex. Monson H. Hayes (1996), Saisical Digial Signal Processing and Modeling. JWS. 48 Härvid görs bl.a. ransformaioner för a serien skall vara saionär, vilke är e grundläggande krav vid ARIMA-modellering.
22 som i sin ur vilar på normalfördelningsanagande och oberoende hos residualerna. Sannolikhesfördelningen för observaionerna skall följa en normalfördelning, vars paramerar ej ändras över iden (saionarie). Efer denna princip är den skaning bäs som maximerar sannolikheen a erhålla de sickprov vi fakisk fick uryck som en maemaisk funkion av de okända paramerarna. Härvid unyjas de s.k. BIC-måe, som ar hänsyn ill a anale paramerar ine bör vara för sor. Dessa frågor har idigare diskueras i kapiel 4.1.1. Vi kan här illägga a BIC-måe är dock endas av värde då förusäningarna för inferensen är uppfyllda, dvs. då vi har oberoende normalfördelningar. Dea esas med olika saisiska es i TRAMO 49. Linjarie hos residualerna esas också. 50 Endas när dessa es ine indikerar avvikelser från oberoende normalfördelningar, har BICmåe relevans. E anal okända konsaner (paramerar) måse esimeras. För a säsongrensningen skall hålla hög kvalie, bör paramerarna i ARIMA-modellen vara sabila och saisisk signifikana 51. Den ARIMA-modell som bäs förklarar den fakiska variabilieen hos varje enskild serie har vals bland ca 50 modeller. 52 För speciell vikiga serier,.ex. BNP, hushållens konsumion, inveseringar, m.fl. har ännu fler modeller undersöks. Dea har gjors i försa hand enlig saisiska krierier. Nedan redovisas de krierier som unyjas vid val av bäsa modell: K1. Maximum likelihood (BIC) K2. Saisiska es av residualegenskaper K3. Auokorrelaioner hos residualer K4. Diagram över residualer K5. Signifikans hos paramerar i ARIMA-modellen. K6. Variabilie hos den säsongrensade serien K7. Diagram över säsongrensade serier I fig. 5.1.1 illusreras schemaisk de olika momenen i SCB:s säsongrensning av naionalräkenskaperna. 49 Normalfördelningses, Durbin Wason es av auokorrelaion sam Q-es av auokorrelaion hos residualer. Se Ljung och Box(1978) sam Pierce(1978). Även icke parameriska eckenes används. 50 Härvid används kvadrerade residualer. Tesvariabeln beskrivs i Maravall (1983) och Fiorinini och Maravall (1996). 51 Dea gäller naurlivis också paramerarna i modellen för kalendereffeker. 52 De saisiska krierier BIC (Bayes informaionskrierium) har används. Den modell som har de lägsa värde på BIC-måe berakas som den modell som har bäsa överenssämmelsen med den fakiska serien uan a överparamerisera modellen. Se kapiel 4.4.1.