Tidsserier. Data. Vi har tittat på två typer av data

Relevanta dokument
F11. Kvantitativa prognostekniker

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Regressions- och Tidsserieanalys - F8

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Säsongrensning i tidsserier.

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Vad Betyder måtten MAPE, MAD och MSD?

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Tidsserier. Tre modeller för tidsserier är den multiplikativa, additiva och säsongdummymetoden.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Multipel Regressionsmodellen

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Facit till Extra övningsuppgifter

Regressions- och Tidsserieanalys - F7

TAMS65 - Seminarium 4 Regressionsanalys

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Föreläsning 12: Linjär regression

Regressions- och Tidsserieanalys - F1

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Regressions- och Tidsserieanalys - F1

Planering av flygplatser

Prognoser. ekonomisk-teoretisk synvinkel. Sunt förnuft i kombination med effektiv matematik ger i regel de bästa prognoserna.

Stokastiska processer med diskret tid

Matematisk statistik för D, I, Π och Fysiker

ÖVNINGSUPPGIFTER KAPITEL 7

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Upplands län och Uppsala kommun.

Finansiell statistik

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Västmanlands län och Västerås kommun.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Statistiken bygger på uppgifter från Statistiska centralbyrån, Arbetsförmedlingen och Bolagsverket.

Metod för beräkning av potentiella variabler

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Tentamen Tillämpad statistik A5 (15hp)

Matematisk statistik för B, K, N, BME och Kemister

Modellutveckling 2018: UCM Unobserved Component Model En ny modell för inrikes inflyttning på kommunnivå

10.1 Enkel linjär regression

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Föreläsning 15: Faktorförsök

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Föreläsning G60 Statistiska metoder

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Tentamen i Matematisk statistik Kurskod S0001M

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Stockholms län och stad.

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Stokastiska processer med diskret tid

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Tentamen Tillämpad statistik A5 (15hp)

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

TENTAMEN I STATISTIK B,

Föreläsning 13: Multipel Regression

Matematisk statistik för B, K, N, BME och Kemister

Utvärdering av Transportstyrelsens flygtrafiksmodeller

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Något om val mellan olika metoder

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Föreläsning 11: Mer om jämförelser och inferens

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Tentamen Tillämpad statistik A5 (15hp)

F23 forts Logistisk regression + Envägs-ANOVA

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Föreläsning 3. Prognostisering: Prognosprocess, efterfrågemodeller, prognosmodeller och prognosverktyg

Mer om konfidensintervall + repetition

Matematisk statistik för B, K, N, BME och Kemister

Skrivning i ekonometri lördagen den 25 augusti 2007

Föreläsning 12: Regression

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Transkript:

F9 Tidsserier Data Vi har tittat på två typer av data Tvärsnittsdata: data som härrör från en bestämd tidpunkt eller tidsperiod Tidsseriedata: data som insamlats under en följd av tidpunkter eller tidsperioder 1

Tidsseriedata Tidsserieanalys Vi har samlat in data vid olika (ofta lika avstånd emellan) tidpunkter, såsom varje dag, vecka, månad, kvartal, år osv. Ex på modeller vi tittat på: Användning Ekonomiska data finns ofta som observationer vid olika tidpunkter Vi är ofta intresserade av att göra prognoser 2

Illustration av tidsserier i diagram Vi använder ofta linjediagram eller stapeldiagram 25 2 15 1 5 t1 t2 t3 t4 Exempel på en tidsserie* 25 2 Omsättning (miljoner kr) 15 1 5 *Ur Körner & Wahlgren (22). Praktisk statistik 1997:1 1998:1 1999:1 2:1 21:1 3

Variationsorsaker Vi kan se i diagrammet ovan att det finns flera variationsorsaker Trend Konjunktur Säsong Slump En tidsserie kan byggas upp på följande sätt Additiv modell: y = T + C + S + ε Kan användas om vi antar att säsongvärdet ligger ett visst antal enheter över eller under trendvärdet Multiplikativ modell: y = T x C x S x ε Kan användas om vi antar att säsongvärdet ligger en viss procent över eller under trendvärdet 4

Hypotetiskt exempel: Additiv modell 9 8 Tidsserie: Additiv modell Omsättning (miljoner kr) 7 6 5 4 3 2 1 1997:1 1998:1 1999:1 2:1 Exempel: Multiplikativ modell 24 Tidsserie: Multiplikativ modell 22 Omsättning (miljoner kr) 2 18 16 14 12 1 8 6 1997:1 1998:1 1999:1 2:1 21:1 5

Vad vill vi göra? Vi vill skatta trenden Ett trendvärde som inte är påverkat av säsongvariation Vi vill skatta säsongkomponenter Hur stor del av omsättningen (exempelvis) beror på den säsongmässiga variationen? Uppskattning av trenden (T) Om man antar att trenden följer en speciell matematisk form: regressionsanalys Kan användas för att göra prognoser Kan bedöma prognosernas osäkerhet med konfidensintervall Om man inte har något antagande om trenden: glidande medelvärden 6

Uppskattning av trend med regressionsanalys Antag först att vi endast har en trendkomponent och en slumpkomponent: y = T + ε eller y = T x ε Möjliga modeller för att skatta trenden: y ˆ = a + bt y ˆ = a + bt + b t t y ˆ = ab 1 2 2 Exempel År 1994 1995 1996 1997 1998 1999 2 21 Oms (milj kr) 8.5 9.7 11. 12.4 14.4 16.6 18.9 21.9 Vi vill skatta trendkomponenten 7

Beroendevariabel: y Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1 149.72595 149.72595 244.85 <.1 Fel 6 3.6695.61151 Korrigerad total 7 153.395 Rot MSE.78199 R-kvadrat.9761 Beroende medel 14.175 Just. R-kvadr..9721 Koeff.var. 5.51668 Parameterskattningar Beroendevariabel: logy Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1.14447.14447 7641.69 <.1 Fel 6.11343.1891 Korrigerad total 7.14459 Rot MSE.435 R-kvadrat.9992 Beroende medel 1.138 Just. R-kvadr..9991 Koeff.var..38451 Parameterskattningar Parameter- Medel- Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 14.175.27648 51.27 <.1 t 1 1.8881.1266 15.65 <.1 Medel- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 1.138.154 735.59 <.1 t 1.5865.6792 87.42 <.1 8

Beroendevariabel: y Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 2 153.3281 76.6645 5729.34 <.1 Fel 5.669.1338 Korrigerad total 7 153.395 Rot MSE.11568 R-kvadrat.9996 Beroende medel 14.175 Just. R-kvadr..9994 Koeff.var..8166 Parameterskattningar Parameter- Medel- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 13.4625.6219 215.56 <.1 t 1 1.8881.1785 15.78 <.1 t2 1.14643.892 16.41 <.1 25 2 Omsättning 15 1 5 1993 1994 1995 1996 1997 1998 1999 2 21 22 År 25 2 Omsättning 15 1 5 25 2 1993 1994 1995 1996 1997 1998 1999 2 21 22 År Omsättning 15 1 5 1993 1994 1995 1996 1997 1998 1999 2 21 22 År 9

Uppskattning av säsongkomponenter med regressionsanalys Antag nu att vi istället för att ha gjort mätningar årligen, gör dem varje kvartal, tertial etc. Vi har antagligen säsongvariation förutom trendvariation Vi kan skapa dummyvariabler Antal dummyvariabler = antal säsonger - 1 Exempel (sid 28) Arbetade timmar per vecka (1 -tal inom jordbruk, skogsbruk, jakt, fiske) Kvartal År 1 2 3 4 1998 414 493 49 451 1999 435 536 533 421 2 426 484 457 46 21 373 459 476 423 22 378 448 435 393 23 368 431 41 365 24 38 429 426 388 1

55 Arbetade timmar (1 -tal) 5 45 4 35 1998:1 1999:1 2:1 21:1 22:1 Kvartal 23:1 24:1 Skatta trend och säsong med additiv modell Timmar = a + bt + c 1 D 1 + c 3 D 2 + c 4 D 3 11

SAS - kod data one; input Timmar D1 D2 D3 t; cards; 414 1 1 493 1 2 49 1 3 451 4 435 1 5... 388 28 ; proc reg; model Timmar= t D1 D2 D3; run; Beroendevariabel: Timmar Antal använda observationer 28 Rot MSE 19.78832 R-kvadrat.8437 Beroende medel 433.14286 Just. R-kvadr..8165 Koeff.var. 4.56854 Parameterskattningar Variansanalys Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Modell 4 48599 1215 31.3 <.1 Fel 23 96.28571 391.57764 Korrigerad total 27 5765 Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 46.14286 1.5773 43.5 <.1 t 1-3.33929.46746-7.14 <.1 D1 1-2.44643 1.66986-1.92.678 D2 1 55.17857 1.61854 5.2 <.1 D3 1 5.94643 1.58763 4.81 <.1 12

Skattade linjen Timmar = 46 3.34t 2.4D 1t + 55.2D 2t + 5.9D 3t Uppskattning av trendkomponenten T y b t + b t = a + b t = a = 433.14 ( 3.34) 14.5 = 481.57 Skattade linjen Uppskattning av säsongkomponenter S + = a a c 1 1 S = 46 481.57 + ( 2.4) = 41.97 1 S = + a a c 2 2 S + = a a c 3 3 S + = a a c 4 4 S = 46 481.57 + 55.2 = 33.63 2 S = 46 481.57 + 5.9 = 29.33 3 S = 46 481.57 = 4 21.57 13

Additiv skattad linje: y ˆ = T + S Skattade linjen Trendkomponentens ekvation: T = a + bt T = 481.57 3. 34t Säsongkomponenter: S 1 =-41.97, S 2 =33.63, S 3 =29.33, S 4 =-21.57 Prognos Gör en prognos för första kvartalet 25 yˆ = 481.57 (3.34 29) 41.97 = 342.74 55 Arbetade timmar (1 -tal) 5 45 4 35 1998:1 1999:1 2:1 21:1 22:1 Kvartal 23:1 24:1 ŷ 14