Lunds universie Saisiska insiuionen En flashesimaor för den privaa konsumionen i Sverige med hjälpvariablerna HIP och dealjhandeln En idsserieanalys med hjälp av saisikprogramme TRAMO Åsa Kaldersam Uppsas i saisik 0 poäng Nivå 4-60 poäng Februari 006 Handledare: Mas Hagnell och Lars-Erik Öller
Absrac In his essay we aim a finding an appropriae flash esimaor of he quarerly Swedish privae consumpion (PK). Wih he aid of he saisics program TRAMO we sudy if monhly daa from he consumer survey (HIP) and reail indusry (DH) can be used in a ransfer funcion model (TFM) o forecas PK. In he work of assessing he sae of he marke and he business rend, fas informaion from he naional accouns is needed for making decisions for he economic poliics in Sweden. A way o speed up he informaion process is o use leading economic indicaors o asses his developmen. Anoher way o ge informaion faser is o use a flash esimae. Such an esimae is made by invesigaing wheher a change in one variable can be approximaed by anoher. The idea of flash esimaes is ha i should be available earlier han he variable ha s esimaed. This mehod is used in he UK, Ialy and Porugal. If a flash esimae can be found, hen a forecas for PK is possible beween 40 and 00 days earlier han he ordinary quarerly repor, depending on wheher one, wo or hree monhs were used o be in he model. To make one-sep ahead forecass of PK we use he program TRAMO. The forecass are evaluaed by comparing he absolue mean percenage error (MAPE) and by applying he forecas accuracy ess of Granger-Newbold and Diebold-Mariano. In he analysis of he residuals of he ransfer funcion models wih one, wo and hree monhs of daa we saw ha he Jarque-Bera es for normaliy, Durbin-Wasons and Ljung-Box s es for auocorrelaion all gave good values. MAPE for he forecass all gave a lower value for he TFM han he univariae model. On he basis of hese resuls all he TFM improved he forecass of PK. PK +(Framå mån,dh mån ) gave he lowes MAPE (0,58%) of he models. The Granger-Newbold and Diebold-Mariano ess resuled in non-significanly beer forecass made by TFM wih one monh daa. For he TFM wih wo and hree monhs of daa only PK+CCI mån,dh mån and PK+Framå 3mån,DH 3mån respecively were found nonsignificanly beer. All oher forecass made by TFM were significanly beer han he forecas made by he univariae model a he 5%-level. The four TFM (PK+Samida mån,dh mån, PK+Framå mån,dh mån, PK+CCI 3mån,DH 3mån and PK+Samida 3mån,DH 3mån ) can be used as a flash esimae of he Swedish privae consumpion. The mos accurae forecas was made wih he PK+Framå mån,dh mån, which could presen a forecas of PK 70 days before he quarerly forecas of he Swedish privae consumpion.
Innehållsföreckning ABSTRACT... INNEHÅLLSFÖRTECKNING...3 FÖRORD...4 TACK...4 INLEDNING...5 METOD...8. ARMA MODELLER...8. ARIMA MODELLER...9.3 TRANSFERFUNKTIONSMODELLER...0.4 TRAMO/SEATS...0.5 TRANSFORMATION....6 STATIONARITET....7 EXTREMVÄRDEN...3.8 AUTOKORRELATION...3.9 MODELL OCH PROGNOS...4 3 DATA...9 3. PRIVAT KONSUMTION...9 3. HUSHÅLLENS INKÖPSPLANER...9 3.3 DETALJHANDELN...0 4 RESULTAT... 4. TEST FÖR STATIONARITET... 4. MODELLSPECIFICERING... 4.3 PROGNOSER...6 4.4 VILKEN PROGNOS ÄR BÄST?...9 4.5 KAN MAN LITA PÅ DEN BÄSTA MODELLEN?...30 5 SAMMANFATTNING...3 REFERENSER...34 LITTERATUR...34 INTERNET...34 BILAGOR...35 HIP FRÅGEFORMULÄR...35 PRIVAT KONSUMTION...36 HIP CCI...38 HIP SAMTIDA...39 HIP FRAMÅT...40 HIP SFRAMÅT...4 DETALJHANDELN...4 3
Förord Föreliggande rappor om flash-esimaorer har skrivis av Åsa Kaldersam som en c- uppsas i saisik vid Lunds universie. Den får ses som e led i en serie sudier över hur man kunde få fram idiga indikaorer för vikiga makroekonomiska variabler, se Bakgrundsfaka 003:9 och 004:4. De är min förhoppning a dessa sudier kan vara ill hjälp vid uvecklingen av idig rapporering på Saisiska cenralbyrån. Lars-Erik Öller MP/LED Tack Idén ill denna uppsas kommer från Lars-Erik Öller på SCB. Uppsasen hade ine vari möjlig a genomföra uan hans inspiraion och värdefulla hjälp. 4
Inledning De sora saisiska underlag som krävs för a kunna mäa e lands BNP kallas för naionalräkenskaperna (NR). Underlage hämas från all möjlig annan saisik, urikeshandel, dealjhandel, arbeade immar, inveseringsenkäen o.s.v. Om man vill följa ekonomins uveckling är de ine bara inressan a vea hur mycke resurser som finns illgängliga, uan också hur de används. Vad gör vi med de som produceras eller imporeras? Man brukar dela in användningen av BNP i följande delar: Priva konsumion de varor och jänser som hushållen förbrukar under åre. Offenlig konsumion de varor och jänser som saen, kommuner och landsing förbrukar under åre. Inveseringar Lagerinveseringar Expor Impor De innebär a man kan skriva: BNP = priva konsumion + offenlig konsumion + inveseringar + lagerinveseringar + expor - impor De finns flera fakorer som påverkar den långsikiga uvecklingen. Några aspeker är a konsumenens beslu, id och budgeresrikion säer gränsen. Då konsumenen har ändliga resurser, måse denne besämma om han ska spendera hela sin inkoms, eller spara en del för framida konsumion eller kanske ill och med låna, eller a ill egna sparmedel för a kunna konsumera mer idag. Enlig naionalekonomisk eori försöker allid individen a maximera sin nya. En vikig fakor i dea resonemang är förvänningar, vilka i sor usräckning syr hur konsumenen väljer a spendera sina pengar över id. Subsiuionsprincipen innebär a konsumenen aldrig är fas i si val, uan har möjlighe a ändra sin konsumionskorg om förusäningarna förändras. Konsumenen faar e beslu vid idpunk som kommer slå igenom vid idpunk +. En vanligare och mer flexibel modell för adapiva förvänningar är ill exempel a kommande inflaionsvärde är de samma som de senas observerade värde. Dea kallas för naiv prognos eller bakåblickande förvänningar. Enlig den permanena inkomshypoesen väljer ine konsumenen enbar sin konsumion på dagens inkoms uan även på sin förvänade framida inkoms. Den förvänade inkomsen kan emellerid förändras om konsumenen får ny informaion som påverkar dennes förvänningar i någon rikning. I arbee med a bedöma konjunkurläge och var i konjunkurcykeln vi befinner oss behövs därför snabb informaion från naionalräkenskaperna efersom denna informaion används som beslusunderlag för den ekonomiska poliiken i Sverige. E sä a påskynda informaionsprocessen är a använda ekonomiska indikaorer för a bedöma denna 5
uveckling. Exempel på ekonomiska indikaorer är indusriprodukionsindex, konsumenprisindex och Konjunkurinsiues enkä hushållens inköpsplaner (HIP). E yerligare sä a få informaion snabbare är a använda sig av så kallade flashesima. E sådan esima kan närmas beskrivas som en proxyvariabel, där de undersöks om en variabels förändring kan approximeras med någon annan. Idén med flashesima är a de ska finnas illgänglig snabbare än de man ursprungligen vill esimera. Flashesima har hisorisk använs genom kvanifiering av kvaliaiva daa och kombineras med idsseriedaa för a förusäga någo aggrega inom naionalräkenskaperna. Uifrån dessa esimas predikionsförmåga vikas sedan resulaen in i skaningen av NR. Dea illvägagångssä används bland anna i Sorbriannien, Ialien och Porugal, se Bolminger (004) Eurosa undersöker lösningar för a få fram informaion snabbare. Måle är a få u naionalräkenskaper kvaralsvis på europanivå med en fördröjning med maximal 45 dagar. För a dea ska bli möjlig krävs a varje land kan leverera daa mins lika snabb, hels snabbare. Idag är dea ine möjlig. Arbee med flashesimaorer följer vanligvis en våsegsprocess vari de försa sege besår av a idenifiera och välja e lämplig daamaerial uifrån vissa önskvärda egenskaper. Föruom a daamaeriale skall vara illgänglig snabbare än daa för den variabel som ska esimeras så måse korrelaionen vara sark och sabil så a esimaorn blir illförlilig. Näsa seg blir a idenifiera och skaa sambande mellan hjälpvariabeln och aggregae för a sedan kunna skapa prognosmodeller, se Bolminger (004) I denna uppsas söker vi efer e flashesima för den kvaralsvisa oala privaa konsumionen i Sverige (PK). Syfe är a undersöka möjligheen a använda månadsdaa för enkäen Hushållens inköpsplaner (HIP) och dealjhandeln (DH) som ledande informaion för a få fram en snabb och illförlilig prognosmodell för PK. Modellen skall i försa hand användas för a skaa innevarande kvarals PK och kommer a jämföras med modeller som enbar bygger på kvaralsdaa för PK uan a unyja informaionen i månadsdaa för HIP och DH. Kvaralsdaa för NR publiceras 70 dagar efer kvarales slu medan månadsdaa för DH kommer u 5-6 dagar efer månadens slu och månadsdaa för HIP kommer u ca. 30 dagar efer månadens slu. Därmed kan man, om korrelaionen är illräcklig sark, skapa prognosmodeller som bygger på dessa månadsdaa. I bäsa fall räcker de med månadsdaa för kvarales försa månad men mer rolig är a de kan behövas vå månader. Även en prognos som baseras på re månaders månadsdaa ger snabbare informaion än om enbar kvaralsdaa används. I figur. kan en idslinje över de olika publiceringsiderna ses. 6
Kv Kv Kv 3 Kv 4 Jan Feb Mars April Maj Juni Juli Aug Sep Ok Nov Dec HIP 4: DH 4: HIP 4:3 DH 4:3 HIP : DH : HIP : DH : HIP :3 DH :3 HIP : DH : HIP : DH : HIP :3 DH :3 HIP 3: DH 3: HIP 3: DH 3: HIP 3:3 DH 3:3 HIP 4: DH 4: PK Kv4 PK Kv PK Kv PK Kv3 Figur.: Publiceringsider av daa för priva konsumion (PK), hushållens inköpsplaner (HIP) och dealjhandeln (DH). Flashesimaorn som idenifieras med försa månadsdaa för respekive kvaral skulle ge en idsvins med c:a 00 dagar. Mosvarande idsvins skulle vara ca. 70 dagar om flashesimaorn konsrueras med a använda daa om försa och andra månad för respekive kvaral. För en flashesimaor konsruerad a använda daa om försa, andra och redje månaden för respekive kvaral skulle idsvinsen bli ca. 40 dagar. I den här uppsasen används saisikprogramme TRAMO, se avsni.4, för a göra esegsprognoser för priva konsumion med hjälp av månadsdaa från hushållens inköpsplaner och dealjhandeln. Vi kommer ine a undersöka om andra programpake ger andra resula efersom användande av TRAMO är en del av syfe med uppsasen. Prognoserna uvärderas sedan genom a de jämförs med en prognos gjord med en univaria modell för priva konsumion. Man jämför de absolua procenuella medelfele, MAPE. Därefer esas om räffsäkerheen skiljer sig mellan univariaa prognoser och de som använder sig av hjälpvariabler på månad. Granger-Newbolds och Diebold-Marianos eser används för dea ändamål. Avsluningsvis kommer vi även a se på e 95% konfidensinervall för den bäsa modellen. Uppsasen inleds med avsni följ av avsni som bland anna ar upp meodiken bakom TRAMO/SEATS sam de illvägagångssä som använs. I avsni 3 redovisas daamaeriale och i avsni 4 preseneras resulaen. En sammanfaning preseneras i avsni 5. 7
Meod. ARMA modeller En saionär idsserie kan beskrivas av en ARMA modell. Man använder sig av hisoriska daa för a a fram modellen och med hjälp av den göra prognoser. Den generella formen för ARMA-modellen beskrivs nedan. AR(p)-modell AR(p) är en auoregressiv modell med p paramerar, där de nuvarande värde i processen är en linjär kombinaion av idigare p sycken värden, sam en slumperm. z + = δ + φ z + φ z +... + φ p z p a (..) där δ är en konsan, φ i är paramerar och a är e gaussisk vi brus. Vi kan flya över alla z ill en sida av ekvaionen och skriva: [ φ B B... B ] z = ( B) z = a (..) p φ φ p φ p Där B är den bakåskifande operaorn som definieras enlig: B p z = z (.9.) p MA(q)-modell MA(q) är en glidande medelalsmodell med q paramerar, där de nuvarande värde i processen är en linjär funkion av e konsan värde δ och e ändlig anal av idigare slumpermer. z = δ + a + θ θ... θ a + a + + qa q (..3) Anage a δ är lika med noll kan vi skriva ekvaionen på följande sä: z = [ θ B B... B ] a = ( B) a (..4) q θ θ q θ q ARMA(p,q)-modell En ARMA-modell av ordning p och q, som besår av dessa vå delar, beecknas därför som: z = δ + φz + φ z +... + φ p z p + a θa + θ a +... + θ qa q, (..5) vilke kan skrivas i korare form enlig ovan: φ ( B ) z = θ ( B) a (..6) p q 8
. ARIMA modeller Alla idsserier är dock ine saionära, se avsni.6, från början. När differenieringar krävs för a göra en idsserie saionär alar man om ARIMA-modeller där I sår för Inegraed (anale differenieringar). Modellen kan skrivas som: φ ( = θ a (..) p d B ), z q ( B) d d där = ( B) är differenieringsoperaorn och d beecknar de minsa möjliga anal differenieringar som krävs för a idsserien ska bli saionär. Om serien uppvisar e säsongsmönser finns de korrelaion mellan observaioner illhörande samma säsong vid olika år. Om vi beecknar säsongen med s, så är z och z -s korrelerade. På säsongnivå beecknas AR(p)- och en MA(q)-paramerarna med Φ P respekive Θ Q. Vi definierar på säsongsnivån enlig: Φ (B s ) = Θ a (..) P D s s z Q ( B ) s =- B s är differenieringsoperaorn på säsongnivån och D beecknar de minsa möjliga anal differenieringar på säsongnivå som krävs för a göra idsserien saionär. Tillsammans bildar (..) och (..) en ARIMA-modell definierad på icke-säsong- och säsongnivån, illusrera i figur.. och vars uryck är: φ ( Φ = Θ a (..4) p s d D s B ) P (B ) s z θ q ( B) Q ( B ) Modellens srukur karakäriseras av värdena inom pareneserna (p,d,q) och (P,D,Q), ickesäsongs- respekive säsongsnivå. De anger anale auoregressiva ermer och anale glidande medelvärdesermer. Dessuom anges de minsa anal differenieringar som krävs för a göra serien saionär. Periodicieen s är 4 för kvaralsdaa eller för månadsdaa. Visar idsserien ingen säsongsvariaion beskrivs processen uan säsongsdelen. Icke-säsongsdel Säsongsdel ARIMA (p,d,q) (P,D,Q)s Periodicie Anal AR-ermer Anal MA-ermer Anal differenieringar Anal differenieringar Anal MA-ermer Anal AR-ermer Figur..: ARIMA-modellens srukur 9
.3 Transferfunkionsmodeller En ARIMA modell använder informaion från bara en idsserie. Men ofa kanske de finns annan informaion som skulle kunna unyjas för a på e bäre sä modellera idsserien. Dea kan man göra genom a lägga ill en eller flera förklarande variabler. Den generella ransferfunkionsmodellen med en förklaringsvariabel x är: y = δ ( B) w( B) x + φ ( B) θ ( B) a (.3.) b där b är anale perioder innan x börjar påverka y - värdena. p w( B) = ( w B w B... w p B ) är e äljarpolynom av ordning p, där p är anale idigare värden av variabeln och δ ( B r ) = ( δ B δ B... δ B r ) är e nämnarpolynom av ordningen r, där r är anale lags, se Bowerman, O Connell och Koehler (004). En ARIMA modell med k regressionsvariabler ser u enlig: ( B ) z + N (.3.) = b0 + b x, + b x, +... + bk xk, där ( x x ) x,,,..., k,, är de förklarande variablerna i regressionen och N anas följa en ARIMA process. Konsanerna ( b b, b,..., ) 0, b k är regressionsparamerar, vilka skaas samidig som paramerarna för ARIMA processen. I en vanlig regression anas slumpermen i ekvaionen ovan vara vi brus, se Enders (004). För en ARIMA (,,) modell och en förklarande variabel ger dea modellen: ( B) z = b0 + b x, + N där ( φb) N = ( θb) e och e är vi brus. En prognos kan se u enlig: = ˆ ˆ 0 (.3.3) z ˆ + h b + b x, + h + N + h.4 TRAMO/SEATS Saisikprogrammen TRAMO, Time Series Regression wih Arima Noise, Missing Observaions and Ouliers, och SEATS, Signal Exracion in ARIMA Time Series, är vå Forran-program som uvecklades av Augusin Maravall och Vicor Gomez vid Spaniens cenralbank. Dessa program finns a ladda ner grais från Spaniens cenralbanks hemsida. De vå programmen är officiell rekommenderade av Eurosa och den Europeiska cenralbanken (ECB). Sedan 999 använder SCB TRAMO/SEATS vid säsongsresning av den officiella saisiken, exempelvis naionalräkenskaperna och indusriprodukionsindex. Dessförinnan användes programme X--ARIMA. Bye av säsongsrensningsprogram ägde rum efer e uvecklingsarbee, som genomfördes på SCB under slue av 990-ale, delvis i samarbee med Eurosa, se (Öhlén, 003). TRAMO är e program för skaning och prognosisering av regressionsmodeller med hjälp av exak maximum likelihood meod. Programme idenifierar och korrigerar för de olika yperna av exremvärden och kan även skaa speciella effeker såsom kalender- 0
effek. Programme kan idenifiera adekva ARIMA-modell och kan auomaisk även undersöka om en predifferansransformaion behövs. Dessa vå möjligheer har använs för a välja rä differens och modell för idsserierna. SEATS är e program för skaning av icke-observerbara komponener i idsserier. Programme använder en ARIMA-baserad meod. De olika komponenerna skaas och prognosiseras med signalexraheringseknik applicerad på ARIMA-modeller, se (Öhlén, 003). En uförlig beskrivning av meodologin bakom de båda programmen finns a läsa i Gomez och Maravall (994, 996, 998) och Maravall och Sánchez (000)..5 Transformaion Vid skaning av univariaa ARIMA-modeller ugår man från a idsseriens varians är konsan över iden, de vill säga homoskedasisk. Ekonomiska idsserier är dock ofa växande över iden och korsiksvariaionen proporionell mo nivån. De vanligase förfaringssäe för a sabilisera serien är då a logarimera den, vilke kan ha flera prakiska fördelar. Dels får man en direk skaning på elasicieen i regressionsekvaioner med ekonomiska variabler och dels gäller, för små förändringar, a differensen av en logarimisk serie är approximaiv en procenuell förändring. Den vikigase egenskapen är dock a vi kan få idsserien homoskedasisk. En mer generell ransformaion som kan användas för a sabilisera en idserie med varierande varians är den så kallade Box Cox-ransformaionen. För idserien y definieras Box Cox-ransformaionen T(y ) som: λ y λ 0 λ T ( y ) = (.5.) ln( y ) λ = 0 där λ är ransformaionsparameern..6 Saionarie För a en ARIMA modell ska kunna användas måse residualen vara saionär. De beyder a daa flukuerar kring e konsan värde, medelvärde, och a kovariansmarisen är konsan över iden. För a en slumpprocess ska kunna berakas som saionär måse allså följande villkor vara uppfyllda för alla : Medelvärde: E y ) = µ (.6.) Variansen: ( Var ( y ) = E( y µ ) = σ (.6.) γ k = E ( y µ )( y k µ ) = g( k) k =, (.6.3) Kovariansen: [ ],... Om idsserien ine är saionär kan den differenieras så a den blir saionär, se avsni.. En icke-saionär idsserie av d:e graden kan allså ransformeras ill en saionär
idsserie genom differeniering d gånger. Ofa räcker de med a a försa differensen. A idsserien har blivi saionär kan esas genom e Dickey-Fuller es. Dickey-Fuller- och uöka Dickey-Fuller-es Anag: Y = ρ + ε (.6.4) Y där ε är e vi brus och ρ är AR-parameern för Y, då sägs den ha enhesro i fall ρ=. En process med en enhesro är ine saionär. I dea fall beecknas serien med I(). Om ρ < så är idsserien saionär och beecknas med I(0). Är däremo ρ > blir processen explosiv. Y - kan subraheras på båda sidorna av ekvaionen och vi får: Y Y ρ ε ( ρ + ε, (.6.5) = Y Y + = ) Y vilke kan skrivas om ill: Y = δ + ε m, (.6.6) Y där är symbolen för försa differensen och δ är lika med ρ-. Är δ =0 har vi en I() idsserie. Nollhypoesen för Dickey-Fuller-es (DF-es) är δ =0 och mohypoesen är a δ <0. Förkasar man nollhypoesen är idsserien I(0). Tessaisikan har en ickesandardfördelning (τ-fördelning) och värde på saisikan skall vara negaiv, annars är idsserien explosiv. DF-ese kan uföras i re versioner: ) För Y, process uan drif och uan deerminisisk rend: Y = δ Y + ε ) För Y, process med drif (β) och uan deerminisisk rend: Y = β + δy + ε 3) För Y, process med drif och deerminisisk rend (): Y = β + β + δy + ε De kriiska värde för DF-esen är olika beroende på vilken version som används. Vale av version som skall användas beror på empiriska grunder. ADF-es (Augmened Dickey-Fuller es) ar hänsyn ill a felermerna kan vara korrelerade. Tese innehåller e specifik anal laggade värden av den beroende variabeln Y. ADF- ese kan även dea uföras i de re ovan nämnda versionerna. Tessaisikan är ˆ δ ADF = (.6.7) s ˆ δ där s är sandardavvikelsen för δˆ och H δˆ 0 : enhesro i y förkasas vid sora negaiva ADF värden. För uförligare informaion om Dickey-Fuller es, se Enders, W. (004).
.7 Exremvärden Exremvärden (ouliers) är observaioner, som avviker från de övriga värdena i serien även om vi ar hänsyn ill säsongs- och kalendereffeker (för a kunna definiera en avvikelse måse en specifik gräns fassällas). Exremvärdena definieras uifrån re skilda yper: Addiiv exremvärde (AO) karakeriseras av a den påverkar serien endas vid en idpunk, varvid serien hoppar ill men genas åergår ill ungefär samma nivå som idigare. Nivåskife (LS) serien hoppar ill en annan nivå och sannar där. Temporär förändring (TC) serien hoppar ill en ny nivå, men åergår ill den ursprungliga nivån efer några perioder. Orsakerna ill a exremvärdena exiserar i en serie kan variera. I vissa fall kan förändringar i den ekonomiska poliiken ge upphov ill exremvärden. I andra fall kan exerna händelser påverka serien, ill exempel a världsmarknadsprise på olja av någon anledning drasisk förändras, fel i saisiken eller en srejk. Exremvärden bör undersökas noggran. De finns flera problem som exremvärden kan ge upphov ill ex. bias och felakig sluledning..8 Auokorrelaion Auokorrelaion uppsår om de finns samband mellan observaionerna för olika idsperioder i en idsserie. Om auokorrelaion exiserar i residualerna är koefficienskaningens sandardfel och essaisikor ine längre konsisena. Vid es för auokorrelaion uan srik exogena förklarande variabler används e anna es än de vanliga Durbin-Wason ese. Durbin-Wasons es För a esa om de föreligger negaiv eller posiiv linjär auokorrelaion mellan ε, dvs. felermen i period och ε, felermen i perioden -, används Durbin-Wason es vars saisika är: d där (.8.) n ( e e ) = = n e = e, e..., en är de esimerade residualerna i idsordning. Nollhypoesen är a felermerna ine är auokorrelerade och mohypoesen är a de är aningen posiiv eller negaiv auokorrelerade. Durbin och Wason visade a genom a säa sannolikheen för så kallade Typ I-fel illα så gäller följande:. Om d < L,α / d kan nollhypoesen förkasas.. Om d > d U,α / kan nollhypoesen ine förkasas. 3. Om d L,α / d d U,α / kan nollhypoesen varken bekräfas eller förkasas. För uförligare resonemang kring Durbin-Wason es se Ramanahan (00). 3
Ljung-Boxs es De kan även förekomma en annan form av auokorrelaion än den av försa ordningen. När den beroende variabeln är fördröjd på höger sida i modellen används Ljung-Box ese Q LB. Q-saisikan esar nollhypoesen a de ine föreligger någon auokorrelaion upp ill ordning k. Q LB definieras som: Q LB r ( aˆ) = n ( n + ) (.8.) l) K l l= ( n Här är n = n d, där n är anale observaioner i original-idsserien och d är anale differenieringar på icke-säsongnivå som använs för a göra idsserien saionär. r är den kvadrerade auokorrelaionen mellan vå residualer separerade med l idsenheer. Q LB är fördelad. Frihesgraderna, m, ges av anale observaioner minus anale skaade χ m,α paramerar och α är den valda signifikansnivån. Om Q > m α påvisas auokorrelaion vilke innebär a modellen ine är adekva. Om man väljer för få laggar uppäcker ine ese korrelaion mellan laggar av högre ordning. Om isälle för många laggar väljs blir syrkan i ese svag. χ, För uförligare resonemang kring Ljung-Box es se Bowerman, O Connel, Koehler (005)..9 Modell och prognos E prognosfel, e, definieras som skillnaden mellan verklig ( y ) och skaa ( ŷ ) värde, e = y yˆ. Bias är e konsan prognosfel över iden, dvs. a de verkliga värdena i genomsni är högre eller lägre än prognosvärden. För a uppäcka bias jämför man verkliga värden med prognosvärden över en längre idsperiod. Slumpmässig variaion är den andra delen av prognosfele. När bias är boragen beyder dea a prognosen är lika sannolik a vara låg som hög vid en given idpunk. E sä a uvärdera prognoser är a konrollera rikningsfel eller om prognosen är bäre eller sämre än en naiv prognos. De är vikig a änka långsikig i val av prognosmeodik och uvärdera de saisiska egenskaperna hos olika prognoser. Exempelvis kan en prognos som sysemaisk överskaar/underskaar uvecklingen av priva konsumion, men som har god precision, föredras framför en annan prognos som ine gör någo genomsnilig fel på eferfrågenivån, men isälle har dålig precision. För a a reda på hur bra prognosmodeller är på a göra predikioner kan man jämföra prognosen med de man vill prognosisera genom a ria diagram. Dea kan fungera som en försa indikaor. Naiv modell När en idsserie ugör en kumulaion av chocker som beer sig som vi brus kallas den för en slumpvandring och kan skrivas som y = y + ε där allså ε är i.i.d. För a de överhuvudage ska vara meningsfull a göra prognoser måse de prognoser man får fram visa sig bäre överrenssämma med de sanna värde än vad en naiv prognos gör, l 4
de vill säga den opimala prognosen för en slumpvandring. Den naiva prognosen kan användas som e slags måsock på hur bra de andra prognoserna är. Om den suderade idsserien innehåller e ydlig säsongmönser kommer den naiva modellen a göra dåliga prognoser. De man då kan göra är a använda en varian på denna modell för a kunna a hänsyn ill säsongvariaionen. Den naiva modell som isälle 4 4 kommer a användas är.ex. ( B)( B ) = ε eller ( B ) = ε. Prognosen kan i de förra falle skrivas som: ˆ = 4 5 y Pr og y E( y ) = y + ( y y ) (.9.) I denna uppsas kommer isälle en univaria ARIMA-modell för priva konsumion, se avsni 4., a användas som måsock vid jämförelse av modellerna. A vara bäre än ARIMA är e srängare krav än a vara bäre än en naiv prognos. BIC Vid idenifiering av ARIMA-modeller i programme TRAMO läggs ofa speciell vik vid måe BIC (Bayes Informaion Crierion). Den modell som minimerar värde på BIC är enlig krierie också den bäsa modellen. BIC-värde används följakligen ill a jämföra de olika modellerna som anpassas ill en given idsserie. Värde bygger på likelihoodfunkionen, L, och definieras enlig: BIC = -log(l) + Klog(T) (.9.3) där K represenerar anale paramerar i modellen och T anale observaioner, som används vid skaningen av modellens paramerar. Genom a öka komplexieen hos en idsseriemodell, dvs. a öka anale paramerar, kan värde på L ökas, vilke dock kan leda ill en så kallad överparamerisering av modellen. BIC-måe kan därmed ses som en jusering av likelihoodfunkionen på så sä a e sraff udelas för anale paramerar, K, som modellen innehåller. AIC E må som liknar BIC är AIC (Akaikes Informaion Crierion), som definieras enlig: AIC = -log(l) + K (.9.4) En skillnad mellan AIC och BIC är a AIC har en endens a godkänna överparameeriserade modeller, medan BIC kan vara för sräng. Skevhe och Kurosis TRAMO/SEATS esar om residualerna är normalfördelade genom a konrollera fördelningens symmeri och oppighe. Skevhe kan översäas med orde asymmeri och innebär a den ena svansen i normalfördelningskurvan är mer udragen än den andra. För normalfördelning ska värde på skevheen vara 0. Värde definieras enlig: y 5
E (( x µ ) ( Var( x)) 3 3 ) (.9.5) Kurosis eller oppighe är e må på i vilken usräckning värdena befinner sig nära medelvärde av fördelningen eller i svansarna. Man skiljer på flera olika yper av kurosis, vilka besäms som: Mesokurosis är benämningen på fördelningar med kurosisvärde lik normalfördelningen. Playkurosis innebär a fördelningen har e kurosisvärde, som är mindre än normalfördelningens värde. Fördelningen har e relaiv jock mipari på båda sidorna av medelvärde och en låg oppighe. Lepokurosis är en beeckning för e kurosisvärde, som är sörre än normalfördelningens värde. Fördelningen har mer sannolikhesmassa i svansarna, så kallade jocka svansar, och är oppigare än normalfördelningen. För normalfördelningen ska värde på kurosis vara 3 och beräknas enlig följande: 4 E (( x µ ) ) ( Var( x)) (.9.6) Jarque-Bera Jarque-Beras normalieses konrollerar om felermerna följer en normalfördelning. Tessaisikan JB är χ,α fördelad och ger e kriisk värde på 5,99 på 5%-nivån. JB= ( K 3) S n + (.9.7) 6 4 där n är anal observaioner i sickprove, S är skevheen och K är kurosismåe. Är essaisikan mindre än 5,99 kan nollhypoesen a felermerna följer en normalfördelning ej förkasas. Skulle nollhypoesen förkasas innebär dea a de finns en asymmeri (skevhe) och/eller oppighe (kurosis) som avviker från normalfördelningen. Skevhe och kurosis kan även esas var för sig med den ena av de vå ermerna i JB och med en frihesgrad. Granger-Newbold Dea es jämför vå prognosers precision. Lå δ vara prognosfele i den försa och δ vara prognosfele i den andra prognosen, ( δ,δ, i,i ) är oberoende av ( δ,δ, j, j ) för i j, i= n och j= n där n är anale prognoser. Ponera a de finns vå nya sokas- + iska variabler δ = δ + δ och δ = δ δ. De förvänade värde av produken är: + E ( δ δ ) = E( δ = σ σ (.9.8) + δδ δδ δ ) = E( δ ) E( δ ) + Där E( δ ) och E( δ ) anas vara 0 och därσ och variablerna + δ och δ är okorrelerade så a korrelaionen σ är lika om och endas om de nya 6
+ δ i δ i ρ = i= T + = 0 (.9.9) M M + ( δ i ) ( δ i ) i= T + M i= T + Om den andra prognosen är bäre än den försa så är σ sörre än σ, dvs. r >0. Förusa a σ är felvariansen för försa prognosen och σ är fele för den andra prognosen. T är anale observaioner som använs för a göra prognoserna och M är T + anale prognoser som gjor. Följande hypoeser esas genom e -es: H : σ = σ mo H : σ > σ 0 rˆ N GN = rˆ (.9.0) GN följer en -fördelning med beslusregel P( GN >α ) där α = N ) där N är anale ( 0,05 observaioner som används för a göra prognoserna. För uförligare resonemang, se Enders (004). Diebold-Mariano E anna sä a bedöma vilken prognosmeod som är bäs är Diebold-Mariano ese, som gör parvisa jämförelser där man ugår från vå prognoser y ˆ, och y ˆ, för idsserien y med prognosfelen u, och u,. Jämförelsen besår av a skillnaden av de kvadrerade prognosfelen, = ˆ ˆ d + u u, +, +, beräknas för a sedan räkna u skillnaden mellan medelkvadrafele, MSE, för de båda prognoserna: d = H i= d H + = MSE MSE (.9.) MSE Var( MSE MSE MSE ) d DM = = (.9.) H 0 : MSE = MSE H : MSE > MSE Var H ( d ) ( d + d ) H i= d ( 0,05 DM följer en -fördelning med beslusregel P( DM >α ) där α = H ) där H är anale prognoser. För uförligare informaion se Enders (004) sam Clark och McCracken (999). 7
MAPE e De procenuella fele räknas u enlig: PE = 00 (.9.3) y Då negaiva och posiiva fel kan a u varandra använder man absolubeloppe för a undvika dea. Ekvaionen används för a räkna u de absolua medelfele i procen för en idsperiod enlig: MAPE = n n = PE (.9.4) Predikionsinervall För a uvärdera hur bra en prognos är kan man använda sig av e predikionsinervall och genom a sudera bredden på inervalle bedöma hur räffsäker prognosen är och därmed göra bedömningen om man kan lia på den prognos man ar fram. [ yˆ ( n) ± z SE ( n) ] n+ τ n+ τ (.9.5) yˆ n+ τ ( n) beecknar en prognos gjord vid idpunk n vid period n + τ, dea ger formeln för predikionsinervalle. Där SE n+ τ (n) är sandardfele för prognosfele, i idpunk n när man prognosiserarτ seg framå. 8
3 Daa 3. Priva konsumion Med priva konsumion (PK) avses i denna uppsas den oala privaa konsumionen i miljoner kr per kvaral i 000 års penningvärde. Daa som används är perioden kvaral 980 ill kvaral 005 (0 observaioner). Daa har hämas från SCBs saisikdaabas på Inerne. Den oala privaa konsumionen kommer a represeneras av y i formlerna och härefer endas benämnas som priva konsumion i uppsasen. observaioner (3 år) i slue av daamaeriale (kvaral 3, 00 kvaral, 005) har agis bor ur idsserieanalysen för a kunna jämföras med prognoserna. Tidserien PK omfaar 90 observaioner (kv. 980 kv. 00). 3. Hushållens inköpsplaner Undersökningen Hushållens inköpsplaner (HIP) har genomförs sedan okober 973. Den belyser hushållens uppfaning om den egna sam den svenska ekonomiska uvecklingen, och ligger ill grund för konjunkurprognoser. Undersökningen har sedan 973 genomförs av SCB och sarade som en kvaralsundersökning men är sedan 993 månalig. Konjunkurinsiue (KI) har vari uppdragsgivare sedan 979 och från okober 995 även EG-kommissionen i Bryssel. Urvalssorleken har successiv reduceras sedan 973. Urvale var från början 0000 hushåll, från juli 979 var de 6600 hushåll och 985 minskades urvale yerligare ill 400 för april- och okoberundersökningarna och 500 för januari- och juliundersökningarna. Från och med 993 gjordes undersökningen i ansluning ill SCB:s arbeskrafsundersökning (AKU) och omfaade då 00 hushåll. Från okober 995 gjorde SCB e illäggsurval av personer 65 år och äldre. Från och med januari 000 genomförde SCB undersökningen i en s.k. elefonbuss med flera kunder. Urvale omfaade då elefonbussens 000 individer 8 74 år plus e illäggsurval av 00 personer 6-7 år och 75- år. De oala urvale under 000-00 ugjordes därmed av 00 inervjuer. Från och med januari 00 genomförs undersökningen av GfK Sverige AB. Undersökningen genomförs månadsvis med individer 6 84 år och de oala urvale ugörs av 500 neoinervjuer. Några juseringar genomfördes i frågeformuläre inför 00. Efersom frågorna i enkäen har variera har jag val a ia på de re frågor som vari med längs Hushålles ekonomi jämför med e år idigare Hushålles ekonomi om e år Sveriges ekonomi om e år (Samida) (Framå) (SFramå) (Frågornas exaka formulering framgår av bilagan) Förroendeindikaorn (CCI) är e medelal av de re försa HIP-variablerna och kallas ofa för förroendeindikaor. I denna uppsas avser CCI den gamla förroendeindikaorn efersom de illkommi vå frågor i beräkningen av CCI som i dagsläge är e medelal av fem frågor. 9
Resulae av HIP-undersökningarna kommer i slue av den månad enkäen görs. De är därför inressan a se om denna serie kan föruspå priva konsumion då resulae av HIPen kommer u ca e kvaral före daa för priva konsumion. Svaren som ges av dessa undersökningar är mycke bäre, någo bäre, ungefär lika, någo sämre, mycke sämre och ve ine. För a kunna represenera hela denna fördelning med en enda siffra gör man om resulaen ill neoal. Dea görs genom a man illdelar svaren olika värden. + för mycke bäre och bäre, 0 för samma och - för sämre och mycke sämre. Före 993 gavs endas svaren bäre, samma och sämre. Om ill exempel 40 procen anser a den ekonomiska siuaionen är bäre i nuläge jämför med för olv månader sen, 0 procen anser a den är sämre och 50 procen anser a den är oförändrad. Då blir neoale 40 minus 0, de vill säga 30. Daa som används är kvaralsdaa för kvaral 980 kvaral 4 99 (5 observaioner) och månadsdaa för januari 993 augusi 005 (5 observaioner). Dessa kommer från Konjunkurinsiue. Tidsserien HIP mån, skapas genom a a försa månaden i varje kvaral. Tidsserien HIP mån, skapas genom a a medelvärde av försa och andra månaden i varje kvaral och idsserien HIP 3mån, skapas genom a a medelvärde av försa, andra och redje månaden i varje kvaral. Samliga serier innehåller oal 03 observaioner. 3.3 Dealjhandeln Dealjhandeln (SNI-kod 5) omfaar all försäljning inom dealjhandeln. De värden som används avser egenlig dealjhandel vilke innebär a försäljning vid apoek och sysembolag ine räknas med. Dealjhandeln (DH) sammansälls av SCB och Handelns Uredningsinsiu (HUI). Siffrorna över dealjhandeln as fram genom a sora och små buikskedjor skickar in sina omsäningsdaa ill HUI och SCB. Publicering sker 5 ill 6 dagar efer månadsskife. Daa för dealjhandeln är månadsdaa i miljoner kronor i fasa priser med basår 000. De har sedan omvandlas ill årsförändringar kvaralsvis i procen och omfaar perioden januari 980 augusi 005 (308 observaioner). Tidsserien DH mån, skapas genom a a försa månaden i varje kvaral. Tidsserien DH mån, är medelvärde av försa och andra månaden i varje kvaral och DH 3mån, medelvärde av försa, andra och redje månaden i varje kvaral. Samliga serier innehåller oal 03 observaioner. Samliga idsserier åskådliggörs grafisk i bilagan. 0
4 Resula I dea avsni preseneras de modeller som vals i TRAMO sam diagnosiken för varje modell. Modellerna kommer sedan a både esas med hjälp av de essaisikor som presenerades i eoriavsnie och sällas mo varandra med hjälp av Granger-Newbold och Diebold-Mariano es och de absolua procenfele, MAPE, för a få en anydan om vilken modell som är bäs. 4. Tes för saionarie Dickey-Fuller ese används för a esa om idsserierna kan berakas som saionära, vilke beskrevs i eoriavsnie. Ofa räcker de med en differeniering för a få en ekonomisk idsserie saionär. Tese har dålig syrka, vilke innebär a de finns en risk a man ine uppäcker en felakig nollhypoes (Enders 004). Tabell 4.. Uan drif & rend AIC BIC Uan drif & rend AIC BIC PK,68 I () 958 8,93 Framå mån -,49 I () 59 3, lnpk,6 I () -6-5,74 Framå mån -,8 I () 53 3,04 lnpk -4 Diff -7,78 I (0)** -47-8,3 Framå 3mån -, I () 5 3,03 CCI mån -, I (0)** 59 3,89 SFramå mån -,47 I (0)** 7 5,3 CCI mån - I (0)** 579 3,75 SFramå mån -,38 I (0)** 689 5,0 CCI 3mån -,99 I (0)** 573 3,69 SFramå 3mån -,4 I (0)** 684 4,95 Samida mån -,65 I (0)* 56 3, DH mån-diff -3,86 I (0)** 44,6 Samida mån -,66 I (0)* 50 3,06 DH mån-diff -3,6 I (0)** 387,66 Samida 3mån -,55 I () 55 3,00 DH 3mån-Diff -3,77 I (0)** 383,54 Kriisk värde ** 5%-nivå = -,95 * 0%-nivå = -,6 Tabell 4..: ADF-es uöka med en lag. Anale lags besäms genom a AIC/BIC värde minimeras. Ingen anydan om auokorrelaion i residualerna enlig Ljung-Box auokorrelaionses. Samida 3mån, Framå mån, Framå mån, Framå 3mån kan ha enhesröer uan drif och deerminisisk rend enlig ADF-ese uökad med en lag. De respekive τ-saisikorna är -,55, -,49, -,8 och -,, se abell 4... Alla är sörre än de kriiska τ-värde -,95 på signifikansnivån 5%. Därför kan nollhypoesen ej förkasas och processerna anses vara I(), d.v.s. innehålla enhesröer och vara icke saionära. När en av hjälpvariablerna används för a besämma prognosmodellen för priva konsumion finns de sor risk för meningslös regression, dea efersom alla idsserierna ej är saionära. Modellen som skaas uifrån idsseriens observaioner kan då ine användas för prognoser. För a kunna hia en modell som kan användas för prognoser uanför de observerade värdena är de vikig a egenskapen om svag saionarie gäller.
De kan dock uppså koinegraion mellan de icke-saionära serierna. Denna visar a en långsikig relaion mellan den beroende variabeln och hjälpvariablerna exiserar. Felermerna av regressionen mellan dessa vå icke-saionära idsserier är då saionära. För a konrollera om månadsdaan för HIP och DH och PK är koinegrerade används AEG-es (Augmened Engle-Granger es). Tese besår av a e ADF-es på residualerna av regression av månadsdaa för hjälpvariablerna på PK uförs. De ADF-es som används på residualerna är uan drif och deerminisisk rend. I abell 4.. kan vi se a vi kan förkasa nollhypoesen för alla hjälpvariablerna. Om nollhypoesen kan förkasas är variablerna koinegrerade och felermerna saionära. Regressionen mellan PK och månadsdaa av hjälpvariablerna är relevan och skaningarna robusa. Tabell 4.. lnpk -4 Diff + Uan drif o rend lnpk -4 Diff + Uan drif o rend CCI mån, DH mån-diff -7,50 I(0)** Framå mån, DH mån-diff -7,59 I(0)** CCI mån, DH mån-diff -7,46 I(0)** Framå mån, DH mån-diff -7,56 I(0)** CCI 3mån, DH 3mån-Diff -7,43 I(0)** Framå 3mån, DH 3mån-Diff -7,5 I(0)** Samida mån, DH mån-diff -7,79 I(0)** SFramå mån, DH mån-diff -7,45 I(0)** Samida mån, DH mån-diff -7,7 I(0)** SFramå mån, DH mån-diff -7,39 I(0)** Samida 3mån, DH 3mån-Diff -7,7 I(0)** SFramå 3mån, DH 3mån-Diff -7,59 I(0)** Kriisk värde ** 5%-nivå = -,95 * 0%-nivå = -,6 Tabell 4..: AEG-es uöka med en lag Sammanfaningsvis ser vi a månadsdaa för HIP och DH kan användas som regressionsvariabeln för a skaa den logarimerade oala privaa konsumionen. 4. Modellspecificering Som univaria modell har vå modeller esas för den privaa konsumionen. Den ena är den klassiska Airlinemodellen, AIRMA(0)(0), vilke är en mycke vanlig modell som ofa passar för ekonomiska idsserier med säsongmönser. Den andra en ARIMA(00)(0) modell, vilken även den är en enkel modell. I abell 4.. kan vi se a båda modellerna har signifikana MA-paramerar men en ARIMA(0)(0) har både lägs AIC- (-47,77) och BIC-värde (-8,3068) vilke yder på a denna modell är den bäre av de vå. För Airline-modellen hias en signifikan emporär oulier vid kv. 993. Kriisk gräns för -värdena är -,96 och,96 för en signifkans på 5% nivån. Airline-modellen kommer a användas som univaria modell för priva konsumion vid jämförelse av ensegsprognoserna i avsni 4.3-4.4. Tabell 4.. θ (-värde) ARIMA (0)(0) ARIMA (00)(0) -0,379 (-,3) Θ (-värde) -0,43754 (-4,) Exremvärden (-värde) TC ( 993) -0,037936 (-3,3) AIC BIC -47,77-8,3068-0,508 (-5,44) -46,4-8,633 Tabell 4..: Parameervärden, AIC och BIC för vå univariaa modeller av PK inom sample (kv. 980 kv. 00).
Samliga modeller med månadsdaa som hjälpvariabler i abell 4.. har signifikana MAparamerar men för PK+Framå mån,dh mån och PK+SFramå mån,dh mån är regressionsvariablerna DH mån respekive SFramå mån icke-signifikana på 5%-nivån. PK+Framå mån,dh mån är dock signifikan på 0% nivån. I re av modellerna med hjälpvariabler hias samma nivåskifande oulier vid kv. 993. AIC och BIC är lägre för samliga modeller med hjälpvariabler jämför med den univariaa men lägs för PK+CCI mån,dh mån med en AIC på -480,08 och BIC på -8,35. Tabell 4.. PK + HIP mån,dh mån mån CCI, DH Samida,DH Framå,DH SFramå,DH θ (-värde) Θ (-värde) Exremvärden (-värde) HIP (-värde) DH (-värde) -0,5330 -,33-0,37986-3,5 LS ( 993) -0,0365-3,5 0,00040,38 0,00055, -0,4685 -,6-0,3905-3,64 0,00094 3,68 0,00049,0-0,399 -,6-0,40087-3,76 LS ( 993) -0,03664-3,4 0,00057,5 0,00049,93-0,3808 -,5-0,3698-3,36 LS ( 993) -0,03683-3,45 0,000,3 0,00063,58 AIC -480,08-478,40-480,97-477,70 BIC -8,35-8,36-8,36-8,3 Tabell 4..: ARIMA(0)(0) - Parameervärden, AIC och BIC för PK + ( HIP mån, + DH mån, ) inom sample (kv. 980 kv. 00). I abell 4..3 har samliga modeller för hjälpvariabler med vå månadersdaa signifikana MA-paramerar och endas PK+SFramå mån,dh mån har regressionsvariablen SFramå mån icke-signifikana på 5%-nivån. I re av modellerna med hjälpvariabler hias samma nivåskifande oulier vid kv. 993 som för hjälpvariablerna med en-månadsdaa. AIC och BIC är lägre för samliga modeller med hjälpvariabler jämför med den univariaa, men lägs för PK+Framå mån,dh mån med en AIC på -483, och BIC på -8,39, vilke är lägre än för modellerna med en månadsdaa. Tabell 4..3 PK + HIP mån,dh mån mån CCI, DH Samida,DH Framå,DH SFramå,DH θ (-värde) Θ (-värde) Exremvärden (-värde) HIP (-värde) DH (-värde) -0,5394 -,35-0,3874-3,53 LS ( 993) -0,03887-3,47 0,00043,39 0,0005,0-0,4354 -, -0,40383-3,80 0,0008 3,07 0,00066,46-0,3360 -,5-0,40459-3,77 LS ( 993) -0,03854-3,46 0,00056,5 0,00060,4-0,368 -,0-0,36707-3,34 LS ( 993) -0,03743-3,59 0,0000,03 0,00078,95 AIC -480,6-478,05-483, -480,9 BIC -8,35-8,36-8,39-8,35 Tabell 4..3: ARIMA(0)(0) - Parameervärden, AIC och BIC för PK + ( HIP mån, + DH mån, ) inom sample (kv. 980 kv. 00). 3
I abell 4..4 har endas PK+(Samida 3mån,, DH 3mån, ) signifikana MA-paramerar och regressionsvariabler. Inga ouliers hias för någon av modellerna. AIC och BIC för PK+(Samida 3mån,, DH 3mån, ) är visserligen lägre än för den univariaa med en AIC på - 477,54 och BIC på -8,3 men dessa är ine lägre än för modellerna för en och vå månadersdaa. Därför har även en (00)(0)-modell esas för re månadersdaa. Tabell 4..4 PK + HIP 3mån,DH 3mån 3 mån CCI, DH Samida,DH Framå,DH SFramå,DH θ (-värde) Θ (-värde) Exremvärden (-värde) HIP (-värde) DH (-värde) -0,6075 -,38-0,4357-4,05 0,00038,9 0,00089,56-0,979 -,0-0,4698-3,9 0,00089 3,3 0,00089,79-0,595 -,38-0,454-4,6 0,00054,07 0,00080,3-0,4850 -,6-0,43873-4, 0,000,05 0,0000,87 AIC -470,97-477,54-47,58-468,3 BIC -8,5-8,3-8,5-8, Tabell 4..4: ARIMA(0)(0) - Parameervärden, AIC och BIC för PK + ( HIP 3mån, + DH 3mån, ) inom sample (kv. 980 kv. 00). Tabell 4..5 PK + HIP 3mån,DH 3mån 3 mån CCI, DH Samida,DH Framå,DH SFramå,DH Θ (-värde) Exremvärden (-värde) HIP (-värde) DH (-värde) -0,356-3,03 LS ( 993) -0,0376-3,68 AO ( 987) 0,097 3,5 AO ( 985) 0,067 3, 0,00039,38 0,000 3,56-0,3983-4,00 AO ( 985) 0,056 3,0 0,0008 3,9 0,0008 3,57-0,33370-3,6 LS ( 993) -0,03980-3,9 AO ( 987) 0,0455 3,39 AO ( 985) 0,09 3,7 0,0006,95 0,00089 3,06-0,37505-3,73 TC ( 993) -0,0354-3,50 AO ( 985) 0,0464 3, 0,00008 0,89 0,009 3,90 AIC -496,36-485,89-498,80-486,74 BIC -8,5-8,45-8,54-8,43 Tabell 4..5: ARIMA(00)(0) - Parameervärden, AIC och BIC för PK + ( HIP 3mån, + DH 3mån, ) inom sample (kv. 980 kv. 00). I abell 4..5 ser vi har resulae av en ARIMA(00)(0)-modell och hjälpvariablerna. Samliga modeller för hjälpvariabler med re månadersdaa har nu signifikan MAparamerar och endas PK+(SFramå 3mån,, DH 3mån, ) har regressionsvariabeln SFramå mån, icke-signifikana på 5%-nivån. Dock hias fler ouliers för dessa modeller. I re av modellerna med hjälpvariabler hias samma nivåskifande oulier vid kv. 993 som för hjälpvariablerna med en och vå månadsdaa. Dessuom hias yerligare vå signifikana addiiva ouliers vid kv. 987 och kv. 985 för PK+(CCI 3mån,, DH 3mån, ) och PK+(Framå 3mån,, DH 3mån, ). För PK+(Samida 3mån,, DH 3mån, ) hias endas en signifikan addiiv oulier vid kv. 985. 4
AIC och BIC är lägre för samliga modeller med hjälpvariabler jämför med den univariaa men lägs för PK+(Framå 3mån,, DH 3mån, ) med en AIC på -485,89 och BIC på -8,45, vilke även är lägre än för modellerna med en och vå månadersdaa. I abell 4..6-4..8 ser vi residualanalysen av respekive ransferfunkionsmodell med en, vå och re månadersdaa. TRAMO/SEATS kräver sark saionarie för modellens residualer. Dea beyder a residualerna även skall vara normalfördelade. Den valda signifikansnivån är 5%. De kriiska värde närmar sig då 5,99. Om Jarque-Bera saisikan är mindre än de kriiska värde kan nollhypoesen om a residualerna är normalfördelade ej förkasas. Vi konsaerar därför a alla modeller kan anas ha normalfördelade residualer då inge värde överskrider 5,99. Tabell 4..6 PK PK + HIP mån,dh mån CCI, DH Samida, DH Framå, DH Skevhe -0,04 0,5-0,0 0,3 Kurosis 3,05 3,74 4,00 3,3 Jaque-Bera 0,08,4 3,56,76 Durbin-Wason,839,7570,746,858 LB Q lag 6,5 7,87 6,96,58 (P-värde) 0,65 0,95 0,94 0,56 Kriisk värde 3,689 6,96 3,685 3,685 Tabell 4..4: Diagnosik för residualerna för respekive ransferfunkionsmodell med en-månadsdaa inom sample (kv. 980 kv. 00). Tabell 4..7 PK PK + HIP mån,dh mån CCI, DH Samida, DH Framå, DH Skevhe -0,04 0,6 0,0 0,35 Kurosis 3,05 3,74 4,0 3,54 Jaque-Bera 0,08,30 3,64,78 Durbin-Wason,839,7583,7853,908 LB Q lag 6,5,58 7,5 3,97 (P-värde) 0,65 0,56 0,93 0,45 Kriisk värde 3,689 3,685 3,685 3,685 Tabell 4..7: Diagnosik för residualerna för respekive ransferfunkionsmodell med vå-månadersdaa inom sample (kv. 980 kv. 00). Tabell 4..8 PK PK + HIP 3mån,DH 3mån CCI, DH Samida, DH Framå, DH Skevhe -0,04-0,0 0, -0,8 Kurosis 3,05 4,5 3,50 4,9 Jaque-Bera 0,08 5,65,49 5,49 Durbin-Wason,839,0686,0845,8335 LB Q lag 6,5 7,8 9,59 8,89 (P-värde) 0,65 0,93 0,9 0,88 Kriisk värde 3,689 4,996 4,996 4,996 Tabell 4..8: Diagnosik för residualerna för respekive ransferfunkionsmodell med re-månadersdaa inom sample (kv. 980 kv. 00). Med Durbin-Wasons es konrollerar vi för linjär auokorrelaion av försa ordningen i residualerna. För en signifikansnivå på α=0.05 med 85 observaioner är d L =,600 och 5
d U =,696. Dea beyder a om Durbin-Wason d-saisika befinner sig mellan,600 och,400 förekommer ej auokorrelaion av försa ordningen i residualerna. Alla modeller har sin respekive saisika inom dessa gränser. Ljung-Box-esen vid lag 6 ger även den bra resula för samliga modeller, efersom alla värden ligger klar under den kriiska värde för en signifikans på 5%-nivån. Linjär auokorrelaion av högre ordning än e förekommer därför ej. 4.3 Prognoser ( För den univariaa modellen, PK, och ransferfunkionsmodellerna, PK+HIP mån,dh mån, PK+HIP mån,dh mån, PK+HIP 3mån,DH 3mån, har ensegsprognoser F ) gjors, dvs. prognoser som är konsruerade så a endas e kvaral isänder prognosiseras. Sedan läggs de verkliga värde in från denna period när man sedan går yerligare e kvaral framå. För modellerna med hjälpvariabler har n+ värden använs dvs. när man gör prognoser på priva konsumion för.ex. n=9 så har används n=9 observaioner av HIPen och dealjhandeln. Prognoser för PK av PK+CCIm ån,dhm ån Verklig PK PK PK+CCI,DH 95000 90000 Miljoner kronor 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.: Prognoser för priva konsumion med hjälp av en månadsdaa för CCI,DH. Prognoser för PK av PK+Samidamån,DHmån Verklig PK PK PK+Samida,DH 95000 90000 Miljoner kronor 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.: Prognoser för priva konsumion med hjälp av en månadsdaa för Samida,DH. 6
Prognoser för PK av PK+Framåmån,DHmån Verklig PK PK PK+Framå,DH 95000 90000 Miljoner kronor 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.3: Prognoser för priva konsumion med hjälp av en månadsdaa för Framå,DH. I diagram 4.3. - 4.3.3 ser vi ensegsprognoserna för de ransferfunkionsmodellerna med en månadsdaa. A döma av diagrammen ser PK+Samida mån,dh mån u a ge bäs prognoser. Prognoser för PK av PK+CCImån,DHmån Verklig PK PK PK+CCI,DH 95000 Miljoner kronor 90000 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.4: Prognoser för priva konsumion med hjälp av vå månadsdaa för CCI,DH. Prognoser för PK av PK+Samidamån,DHmån Verklig PK PK PK+Samida,DH 95000 90000 Miljoner kronor 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.5: Prognoser för priva konsumion med hjälp av av vå månadsdaa för Samida,DH. 7
Prognoser för PK av PK+Framåmån,DHmån Verklig PK PK PK+Framå,DH Miljoner kronor 95000 90000 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.6: Prognoser för priva konsumion med hjälp av av vå månadsdaa för Framå,DH. I diagram 4.3.4-4.3.6 ser vi ensegsprognoserna för ransferfunkionsmodellerna med vå månadersdaa. A döma av diagrammen ser PK+Samida mån,dh mån u a ge bäs prognoser. Prognoser för PK av PK+CCI3mån,DH3mån 95000 Miljoner kronor 90000 85000 80000 75000 70000 Verklig PK PK+CCI,DH PK 65000 00 003 004 005 År Diagram 4.3.7: Prognoser för priva konsumion med hjälp av av re månadsdaa för CCI,DH. Prognoser för PK av PK+Samida3mån,DH3mån 95000 Verklig PK PK PK+Samida,DH Miljoner kronor 90000 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.8: Prognoser för priva konsumion med hjälp av av re månadsdaa för Samida,DH. 8
Prognoser för PK av PK+Framå3mån,DH3mån 95000 Verklig PK PK PK+Framå,DH Miljoner kronor 90000 85000 80000 75000 70000 65000 00 003 004 005 År Diagram 4.3.9: Prognoser för priva konsumion med hjälp av av re månadsdaa för Framå,DH. I diagram 4.3.7-4.3.9 ser vi ensegsprognoserna för ransferfunkionsmodellerna med re månadersdaa. A döma av diagrammen ser PK+Samida 3mån,DH 3mån u a ge bäs prognoser. För alla ransferfunkionsmodellerna ser de u a vara den med Samida, DH som ger bäs prognoser. Vid jämförelse av modellerna ser vi a prognoserna är väldig lika och de är svår a säga om de är någon skillnad genom a enbar se på diagrammen. Alla prognoser ligger ill grund för resulaen när modellerna sälls mo varandra i avsni 4.4 sam när konfidensinervalle ploas i avsni 4.5. Modellernas prognosförmåga och hur adekvaa de är har givevis e samband. Genom a sudera diagnosiken kan man få en försa bild av hur bra prognoserna kan änkas bli. 4.4 Vilken prognos är bäs? Prognosfelen redovisas i procenuell avvikelse från de sanna värde, summera över alla gjorda prognoser, (MAPE) absolu medelfel i procen. Dea gör de möjlig a på e enkel sä överblicka evenuella skillnader mellan serierna och även mellan de vå modellerna. Tabell PK PK + CCI, DH PK + Samida,DH PK + Framå,DH 4.4. mån mån 3 mån mån mån 3 mån mån mån 3 mån MAPE 0,73% 0,67% 0,65% 0,6% 0,7% 0,60% 0,6% 0,7% 0,58% 0,64% Tabell 4.4.: De absolua medelfele i procen, MAPE För samliga prognoser blir MAPE relaiv låg. För e-segsprognoserna ger a ransferfunkionsmodellerna alla har lägre MAPE än den univariaa. Uifrån dessa värden förbärar ransferfunkionsmodellerna prognosen för priva konsumion i samliga fall. PK+Framå mån, DH mån ger dock allra lägs MAPE (0,58%) av modellerna. Vilken prognos är bäs? Och är den bäsa prognosen signifikan bäre än den univariaa? Dea esas med Granger-Newbold- och Diebold-Mariano-es, där vi säller modellerna mo varandra. Teorin bakom ese redovisades i eoriavsnie. 9