Regressions- och Tidsserieanalys - F8

Relevanta dokument
732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Vad Betyder måtten MAPE, MAD och MSD?

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I STATISTIK B,

Tidsserier. Data. Vi har tittat på två typer av data

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

Regressions- och Tidsserieanalys - F7

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Säsongrensning i tidsserier.

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

Regressions- och Tidsserieanalys - F1

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

F11. Kvantitativa prognostekniker

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Regressions- och Tidsserieanalys - F1

Tidsserier. Tre modeller för tidsserier är den multiplikativa, additiva och säsongdummymetoden.

Facit till Extra övningsuppgifter

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Prognoser. ekonomisk-teoretisk synvinkel. Sunt förnuft i kombination med effektiv matematik ger i regel de bästa prognoserna.

Föreläsning 8. Kap 7,1 7,2

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Regressions- och Tidsserieanalys - F3

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Regressions- och Tidsserieanalys - F4

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Statistik B Regressions- och tidsserieanalys Föreläsning 1

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Utvärdering av Transportstyrelsens flygtrafiksmodeller

Analys av egen tidsserie

Stokastiska processer med diskret tid

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Något om val mellan olika metoder

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Regressions- och Tidsserieanalys - F3

ÖVNINGSUPPGIFTER KAPITEL 7

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Metod och teori. Statistik för naturvetare Umeå universitet

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Föreläsning G60 Statistiska metoder

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

10.1 Enkel linjär regression

Föreläsning 12: Regression

Tentamen Tillämpad statistik A5 (15hp)

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Regressions- och Tidsserieanalys - F3

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Läs noggrant informationen nedan innan du börjar skriva tentamen

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Upplands län och Uppsala kommun.

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Planering av flygplatser

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Västmanlands län och Västerås kommun.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsning 12: Linjär regression

Statistiken bygger på uppgifter från Statistiska centralbyrån, Arbetsförmedlingen och Bolagsverket.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Lektionsanteckningar 11-12: Normalfördelningen

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år.

DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2


Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Preliminärt lösningsförslag - omtentamen i Finansiell statistik,

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Regressions- och Tidsserieanalys - F5

F13 Regression och problemlösning

Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS).

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Finansiell statistik

7.5 Experiment with a single factor having more than two levels

Rapporten är utgiven av Stockholm Business Region och publiceras fyra gånger per år. Rapporten omfattar Stockholms län och stad.

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

7.5 Experiment with a single factor having more than two levels

MVE051/MSG Föreläsning 14

Beräkna standardavvikelser för ledtider

tentaplugg.nu av studenter för studenter

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Transkript:

Regressions- och Tidsserieanalys - F8 Klassisk komponentuppdelning, kap 7.1.-7.2. Linda Wänström Linköpings universitet November 26 Wänström (Linköpings universitet) F8 November 26 1 / 23

Klassisk komponentuppdelning Klassisk komponentuppdelning har ingen teoretisk grund, men här användbar när parametrarna som beskriver tidsserien inte förändras över tid. Vid ökande/minskande säsongsvariation används multiplikativ modell och vid konstant säsongsvariation används addtiv modell. Multiplikativ modell: Additiv modell: y t = TR t SN t CL t IR t y t = TR t + SN t + CL t + IR t där y t är värdet på y vid tidpunkt t, TR t är trendkomponenten vid tidpunkt t som skattas med tr t, SN t är säsongskomponenten vid tidpunkt t som skattas med sn t, CL t är den cykliska komponenten vid tidpunkt t som skattas med cl t och IR t är slumpkomponenten vid tidpunkt t som skattas med ir t. Wänström (Linköpings universitet) F8 November 26 2 / 23

Exempel: Antal arbetade timmar per vecka inom jordbruk, skogsbruk, jakt och fiske 1998-2004 År Kvartal y 1 1 414 2 493 3 490 4 451 2 1 435 2 536 3 533 4 421 3 1 426 2 484 3 457 4 406 4 1 373 2 459 3 476 4 423 5 1 378 2 448 3 435 4 393 6 1 368 2 431 3 410 4 365 7 1 380 2 429 3 426 4 388 Wänström (Linköpings universitet) F8 November 26 3 / 23

Wänström (Linköpings universitet) F8 November 26 4 / 23

Glidande medelvärden (moving averages) och centrerade (centered) glidande medelvärden Vi börjar med att beräkna glidande medelvärden (MA) för att få bort säsongsvariation och slumpvariation från data. Eftersom vi har 4 säsonger beräknar vi 4-punkts-medelvären. 414 + 493 + 490 + 451 MA 2.5 = = 462 4 Detta MA är centrerat på tidpunkt 2.5, dvs mitt emellan kvartal två och tre. Nästa MA är centrerat på tidpunkt 3.5: 493 + 490 + 451 + 435 MA 3.5 = = 467.25 4 Eftersom vi vill ha medelvärden som är centrerade på specifika säsonger, beräknar vi centrerade medelvärden (CMA). Följande CMA är centrerat på på tidpunkt 3, dvs kvartal 3. 462 + 467.25 CMA 3 = = 464.63 2 Wänström (Linköpings universitet) F8 November 26 5 / 23

y MA CMA 414 493 490 462 464,625 451 467,25 472,625 435 478 483,375 536 488,75 485 533 481,25 480,125 421 479 472,5 426 466 456,5 484 447 445,125 457 443,25 436,625 406 430 426,875 373 423,75 426,125 459 428,5 430,625 476 432,75 433,375 423 434 432,625 378 431,25 426,125 448 421 417,25 435 413,5 412,25 393 411 408,875 368 406,75 403,625 431 400,5 397 410 393,5 395 365 396,5 396,25 380 396 398 429 400 402,875 426 405,75 388 Wänström (Linköpings universitet) F8 November 26 6 / 23

Skattning av säsongkomponenter Vi ska nu gå vidare för att skatta säsongkomponenter. Först noterar vi att CMA skattar trendkomponent gånger cyklisk komponent (för multiplikativ modell) och trendkomponent plus cyklisk komponent (för additiv modell) eftersom vi har fått bort säsongsvariation och slumpvariation genom att beräkna CMA. Eftersom CMA t = tr t cl t har vi att: y t sn t ir t = = tr t cl t CMA t för multiplikativ modell, och eftersom CMA t = tr t + cl t har vi att y t för additiv modell. sn t + ir t = y t (tr t + cl t ) = y t CMA t Wänström (Linköpings universitet) F8 November 26 7 / 23

y MA CMA snxir 414 493 490 462 464,625 1,054614 451 467,25 472,625 0,954245 435 478 483,375 0,899922 536 488,75 485 1,105155 533 481,25 480,125 1,110128 421 479 472,5 0,891005 426 466 456,5 0,933187 484 447 445,125 1,087335 457 443,25 436,625 1,046665 406 430 426,875 0,951098 373 423,75 426,125 0,87533 459 428,5 430,625 1,065893 476 432,75 433,375 1,098356 423 434 432,625 0,977752 378 431,25 426,125 0,887064 448 421 417,25 1,073697 435 413,5 412,25 1,055185 393 411 408,875 0,961174 368 406,75 403,625 0,911737 431 400,5 397 1,085642 410 393,5 395 1,037975 365 396,5 396,25 0,921136 380 396 398 0,954774 429 400 402,875 1,064846 426 405,75 388 Wänström (Linköpings universitet) F8 November 26 8 / 23

Uppskattning av säsongkomponenter Vi har nu fått skattningar för cyklisk komponent gånger slumpkomponent (för multiplikativ modell) respektive cyklisk komponent plus slumpkomponent (för additiv modell). För att få bort slumpkomponenten och få skattningar endast av säsongkomponenter beräknar vi medelvärdet för varje säsong (här kvartal): Kvartal År 1 År 2 År 3 År 4 År 5 År 6 År 7 medel sn 1 0,899922 0,933187 0,87533 0,887064 0,911737 0,954774 0,910336 2 1,105155 1,087335 1,065893 1,073697 1,085642 1,064846 1,080428 3 1,054614 1,110128 1,046665 1,098356 1,055185 1,037975 1,067154 4 0,954245 0,891005 0,951098 0,977752 0,961174 0,921136 0,942735 Wänström (Linköpings universitet) F8 November 26 9 / 23

Standardisering av säsongkomponenter För att alla (4 i detta fall) säsongkomponenter ska summera till antal säsonger, L, (dvs 4 i detta fall) multipliceras varje kvartalsmedelvärde (sn t ) med L L t=1 sn t = 4 4.000652 = 0.999837 för multiplikativ modell, dvs sn t = sn t L/ L t=1 sn t. Vi får alltså fyra skattningar (en per säsong): sn 1, sn 2, sn 3 och sn 4. Kvartal År 1 År 2 År 3 År 4 År 5 År 6 År 7 medel sn sn 1 0,899922 0,933187 0,87533 0,887064 0,911737 0,954774 0,910336 0,910187 2 1,105155 1,087335 1,065893 1,073697 1,085642 1,064846 1,080428 1,080252 3 1,054614 1,110128 1,046665 1,098356 1,055185 1,037975 1,067154 1,06698 4 0,954245 0,891005 0,951098 0,977752 0,961174 0,921136 0,942735 0,942581 4,000652 För additiv modell ska summan av säsongkomponenterna bli noll och vi justerar i stället på detta sätt: sn t = sn t ( L t=1 sn t /L). Wänström (Linköpings universitet) F8 November 26 10 / 23

Säsongrensade värden För att kunna gå vidare och skatta en trend rensar vi nu bort säsongsvariationen från data med hjälp av säsongkomponenterna. För multiplikativ modell får vi de säsongsrensade värdena som: d t = y t sn t. För additiv modell får vi de säsongsrensade värdena som: d t = y t sn t. Wänström (Linköpings universitet) F8 November 26 11 / 23

y MA CMA snxir sn d 414 0,910187 454,8514 493 1,080252 456,3751 490 462 464,625 1,054614 1,06698 459,2403 451 467,25 472,625 0,954245 0,942581 478,4733 435 478 483,375 0,899922 0,910187 477,9236 536 488,75 485 1,105155 1,080252 496,1806 533 481,25 480,125 1,110128 1,06698 499,5409 421 479 472,5 0,891005 0,942581 446,6458 426 466 456,5 0,933187 0,910187 468,0355 484 447 445,125 1,087335 1,080252 448,0437 457 443,25 436,625 1,046665 1,06698 428,3118 406 430 426,875 0,951098 0,942581 430,7321 373 423,75 426,125 0,87533 0,910187 409,8058 459 428,5 430,625 1,065893 1,080252 424,9009 476 432,75 433,375 1,098356 1,06698 446,1191 423 434 432,625 0,977752 0,942581 448,7677 378 431,25 426,125 0,887064 0,910187 415,2991 448 421 417,25 1,073697 1,080252 414,7181 435 413,5 412,25 1,055185 1,06698 407,6929 393 411 408,875 0,961174 0,942581 416,9402 368 406,75 403,625 0,911737 0,910187 404,3124 431 400,5 397 1,085642 1,080252 398,9811 410 393,5 395 1,037975 1,06698 384,2623 365 396,5 396,25 0,921136 0,942581 387,2345 380 396 398 0,954774 0,910187 417,4965 429 400 402,875 1,064846 1,080252 397,1296 426 405,75 1,06698 399,2579 388 0,942581 411,6356 Wänström (Linköpings universitet) F8 November 26 12 / 23

Säsongrensade värden Wänström (Linköpings universitet) F8 November 26 13 / 23

Skattning av trend Vi vill nu skatta en trend på de säsongsrensade värdena med hjälp av regressionsanalys. Beroende på hur vi tror att trenden ser ut skattar vi en linjär, kvadratisk etc. trend (se förra föreläsningen). För enkelhetens skull börjar vi med att anta en linjär trend: TR t = β 0 + β 1 t dvs vi anpassar följande modell till de säsongrensade värdena d t = β 0 + β 1 t + ɛ t. Använder vi formler för b 1 respektive b 0 från vanlig enkel regressionsanalys (alternativt använder MINITAB) får vi tr t = b + b 1 t = 480.587 3.270t. Wänström (Linköpings universitet) F8 November 26 14 / 23

Skattning av cyklisk komponent Nu har vi skattningar för säsongskomponenter och trend. Vi behöver skattningar för cykliska komponenten, CL t. För multiplikativ modell har vi att cl t ir t = tr t sn t Om vi har kvartalsdata eller månadsdata kan vi beräkna en skattning av cyklisk komponent som medelvärdet för tre närliggande tidpunkter cl t = (cl t 1 ir t 1 ) + (cl t ir t ) + (cl t+1 ir t+1 ) 3 För de första tre tidpunkterna får vi cl 2 = 0.953+0.963+0.975 3 = 0.964. Vi kan slutligen skatta IR t y t ir t = cl t ir t cl t som för andra observationen blir ir 2 = 0.963 0.964 = 0.999. Wänström (Linköpings universitet) F8 November 26 15 / 23

Skattning av cyklisk komponent För additiv modell har vi i stället att cl t + ir t = y t tr t sn t Då får vi skattningar av cykliska komponenterna genom cl t = (cl t 1 + ir t 1 ) + (cl t + ir t ) + (cl t+1 + ir t+1 ) 3 och slutligen för slumpkomponenterna ir t = (cl t + ir t ) cl t Wänström (Linköpings universitet) F8 November 26 16 / 23

y MA CMA snxir sn d tr trxsn clxir cl ir 414 0,910187 454,8514 477,317 434,4479 0,952934 493 1,080252 456,3751 474,047 512,0901 0,962721 0,963716 0,998967 490 462 464,625 1,054614 1,06698 459,2403 470,777 502,3095 0,975494 0,987224 0,988118 451 467,25 472,625 0,954245 0,942581 478,4733 467,507 440,6633 1,023457 1,009478 1,013848 435 478 483,375 0,899922 0,910187 477,9236 464,237 422,5426 1,029482 1,04311 0,986935 536 488,75 485 1,105155 1,080252 496,1806 460,967 497,9604 1,076391 1,065765 1,00997 533 481,25 480,125 1,110128 1,06698 499,5409 457,697 488,3534 1,091423 1,05023 1,039222 421 479 472,5 0,891005 0,942581 446,6458 454,427 428,3344 0,982877 1,037237 0,947591 426 466 456,5 0,933187 0,910187 468,0355 451,157 410,6374 1,037412 1,006879 1,030324 484 447 445,125 1,087335 1,080252 448,0437 447,887 483,8307 1,00035 1,000363 0,999987 457 443,25 436,625 1,046665 1,06698 428,3118 444,617 474,3973 0,963328 0,979875 0,983112 406 430 426,875 0,951098 0,942581 430,7321 441,347 416,0054 0,975949 0,958247 1,018473 373 423,75 426,125 0,87533 0,910187 409,8058 438,077 398,7321 0,935465 0,962877 0,971531 459 428,5 430,625 1,065893 1,080252 424,9009 434,807 469,701 0,977217 0,982158 0,99497 476 432,75 433,375 1,098356 1,06698 446,1191 431,537 460,4412 1,033791 1,019626 1,013893 423 434 432,625 0,977752 0,942581 448,7677 428,267 403,6765 1,047869 1,019614 1,027712 378 431,25 426,125 0,887064 0,910187 415,2991 424,997 386,8269 0,977181 1,00281 0,974443 448 421 417,25 1,073697 1,080252 414,7181 421,727 455,5713 0,983381 0,97828 1,005214 435 413,5 412,25 1,055185 1,06698 407,6929 418,457 446,4851 0,974277 0,987293 0,986816 393 411 408,875 0,961174 0,942581 416,9402 415,187 391,3475 1,004223 0,986679 1,01778 368 406,75 403,625 0,911737 0,910187 404,3124 411,917 374,9216 0,981538 0,987369 0,994095 431 400,5 397 1,085642 1,080252 398,9811 408,647 441,4417 0,976346 0,968599 1,007998 410 393,5 395 1,037975 1,06698 384,2623 405,377 432,529 0,947913 0,962424 0,984922 365 396,5 396,25 0,921136 0,942581 387,2345 402,107 379,0185 0,963014 0,985904 0,976782 380 396 398 0,954774 0,910187 417,4965 398,837 363,0164 1,046785 1,004583 1,042009 429 400 402,875 1,064846 1,080252 397,1296 395,567 427,312 1,00395 1,022826 0,981545 426 405,75 1,06698 399,2579 392,297 418,5729 1,017744 1,026603 0,99137 388 0,942581 411,6356 389,027 366,6896 1,058116 Wänström (Linköpings universitet) F8 November 26 17 / 23

Cyklisk komponent och slumpkomponent Wänström (Linköpings universitet) F8 November 26 18 / 23

Prognoser Vi kan slutligen göra prognoser för multiplikativ modell som ŷ t = tr t sn t cl t. En prognos för första kvartalet 2005 ges av (om vi antar att vi inte kan förutspå cyklisk komponent) ŷ 29 = tr 29 sn 29 = (480.587 3.270 29) 0.910 = 351, 0389 För additiv modell får vi prognoser som ŷ t = tr t + sn t + cl t. Wänström (Linköpings universitet) F8 November 26 19 / 23

Analys i MINITAB Utskrift från multiplikativ uppdelning (utan cyklisk komponent). MINTAB använder medianer vid uträkning av säsongkomponenter i stället för medelvärden. Time Series Decomposition for Antal timmar Multiplicative Model Data Antal timmar Length 28 NMissing 0 Fitted Trend Equation Yt = 480,95 3,30015*t Seasonal Indices Period Index 1 0,90740 2 1,08154 3 1,05673 4 0,95432 Accuracy Measures MAPE 3,316 MAD 14,538 MSD 313,710 Wänström (Linköpings universitet) F8 November 26 20 / 23

Skattade värden, trend, och observerade värden Wänström (Linköpings universitet) F8 November 26 21 / 23

Fler grafer från Minitab Första grafen ger originaldata. Andra grafen ger data med trenden bortrensad. Här kan vi se om det finns säsongsvariation, cyklisk variation samt slumpvariation. Tredej grafen ger säsongsrensad data. Här kan vi se trend, cyklisk variation samt slumpvariation. Fjärde grafen ger data med både säsong och trend bortrensad. Här kan vi se cyklisk variation samt slumpvariation. Finns det något mönster i denna graf som inte enbart ser slumpmässigt ut antar vi att det förekommer cyklisk variation. Wänström (Linköpings universitet) F8 November 26 22 / 23

fler grafer från Minitab Första grafen visar säsongskomponenterna. Andra grafen visar boxplottar över säsongsvariation (dvs spridning). Tredje grafen visar säsongsvariation i procent. Fjärde grafen visar spridningen (boxplottar) för residualerna per säsong. Ju större sprdning för residualerna för en viss säsong desto sämre skattar vi värden för den säsongen. Wänström (Linköpings universitet) F8 November 26 23 / 23