732G71 Statistik B Föreläsning 8 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23
Klassisk komponentuppdelning Klassisk komponentuppdelning bygger på en intuitiv approach, utan teoretisk grund, som har visat sig vara användbart då parametrarna som beskriver tidsserien inte förändras över tid. Vid ökande/minskande säsongsvariation används en multiplikativ modell och vid konstant säsongsvariation används en additiv modell. Multiplikativ modell: Additiv modell: y t = TR t SN t CL t IR t y t = TR t + SN t + CL t + IR t där y t är värdet på y vid tidpunkt t, TR t är trendkomponenten vid tidpunkt t som skattas med tr t, SN t är säsongskomponenten vid tidpunkt t som skattas med sn t, CL t är den cykliska komponenten vid tidpunkt t som skattas med cl t och IR t är slumpkomponenten vid tidpunkt t som skattas med ir t. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 2 / 23
Omsättningsindex hotell och restaurangverksamhet År Kvartal Kvartal Kvartal Kvartal 1 2 3 4 2000 100 112 116 117 2001 103 114 117 120 2002 99 114 117 113 2003 99 112 116 112 2004 100 116 118 113 2005 102 124 126 119 2006 107 128 136 127 2007 114 135 146 136 2008 117 144 148 135 2009 113 134 143 134 2010 116 145 158 145 2011 125 154 161 147 2012 127 156 162 149 2013 130 163 170 157 2014 136 170 177 167 2015 145 178 187 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 3 / 23
Omsättningsindex hotell och restaurangverksamhet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 4 / 23
Glidande medelvärden och centrerade glidande medelvärden Glidande medelvärden (moving averages (MA)) kan användas för att ta bort säsongsvariation och slumpvariation från data. Eftersom vi har 4 säsonger för kvartalsdata beräknar vi 4-punkts-medelvärden: MA 2.5 = 100 + 112 + 116 + 117 4 = 111.25 Detta MA är centrerat på tidpunkt 2.5, d.v.s. mitt emellan kvartal 2 och 3. Nästa MA är centrerat på tidpunkt 3.5: MA 3.5 = 112 + 116 + 117 + 103 4 = 112 Vi vill ha centrerade medelvärden (CMA) som är centrerade på specika säsonger. CMA för kvartal 3 ges som medelvärdet av MA 2.5 och MA 3.5, d.v.s. CMA 3 = 111.25 + 112 2 = 111.625 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 5 / 23
Glidande medelvärden och centrerade glidande medelvärden Årtal y MA CMA Årtal y MA CMA 2000 100 2008 117 135,75 136 112 144 136,25 136,125 116 111,25 111,625 148 136 135,5 117 112 112,25 135 135 133,75 2001 103 112,5 112,625 2009 113 132,5 131,875 114 112,75 113,125 134 131,25 131,125 117 113,5 113 143 131 131,375 120 112,5 112,5 134 131,75 133,125 2002 99 112,5 112,5 2010 116 134,5 136,375 114 112,5 111,625 145 138,25 139,625 117 110,75 110,75 158 141 142,125 113 110,75 110,5 145 143,25 144,375 2003 99 110,25 110,125 2011 125 145,5 145,875 112 110 109,875 154 146,25 146,5 116 109,75 109,875 161 146,75 147 112 110 110,5 147 147,25 147,5 2004 100 111 111,25 2012 127 147,75 147,875 116 111,5 111,625 156 148 148,25 118 111,75 112 162 148,5 148,875 113 112,25 113,25 149 149,25 150,125 2005 102 114,25 115,25 2013 130 151 152 124 116,25 117 163 153 154 126 117,75 118,375 170 155 155,75 119 119 119,5 157 156,5 157,375 2006 107 120 121,25 2014 136 158,25 159,125 128 122,5 123,5 170 160 161,25 136 124,5 125,375 177 162,5 163,625 127 126,25 127,125 167 164,75 165,75 2007 114 128 129,25 2015 145 166,75 168 135 130,5 131,625 178 169,25 146 132,75 133,125 187 136 133,5 134,625 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 6 / 23
Skattning av säsongskomponenter CMA skattar trendkomponent gånger cyklisk komponent för multiplikativ modell och trendkomponent plus cyklisk komponent för additiv modell, eftersom vi har tagit bort säsongsvariation och slumpvariation vid beräkning av CMA. Alltså, för multiplikativ modell har vi att CMA t = tr t cl t och sn t ir t = y t tr t cl t = y t CMA t och för additiv modell har vi att CMA t = tr t + cl t och sn t + ir t = y t (tr t + cl t ) = y t CMA t Bertil Wegmann (IDA, LiU) 732G71, Statistik B 7 / 23
Multiplikativ modell för klassisk komponentuppdelning Årtal y MA CMA sn x ir Årtal y MA CMA sn x ir 2000 100 2008 117 135,75 136 112 144 136,25 136,125 116 111,25 111,625 1,04 148 136 135,5 1,09 117 112 112,25 1,04 135 135 133,75 1,01 2001 103 112,5 112,625 0,91 2009 113 132,5 131,875 0,86 114 112,75 113,125 1,01 134 131,25 131,125 1,02 117 113,5 113 1,04 143 131 131,375 1,09 120 112,5 112,5 1,07 134 131,75 133,125 1,01 2002 99 112,5 112,5 0,88 2010 116 134,5 136,375 0,85 114 112,5 111,625 1,02 145 138,25 139,625 1,04 117 110,75 110,75 1,06 158 141 142,125 1,11 113 110,75 110,5 1,02 145 143,25 144,375 1,00 2003 99 110,25 110,125 0,90 2011 125 145,5 145,875 0,86 112 110 109,875 1,02 154 146,25 146,5 1,05 116 109,75 109,875 1,06 161 146,75 147 1,10 112 110 110,5 1,01 147 147,25 147,5 1,00 2004 100 111 111,25 0,90 2012 127 147,75 147,875 0,86 116 111,5 111,625 1,04 156 148 148,25 1,05 118 111,75 112 1,05 162 148,5 148,875 1,09 113 112,25 113,25 1,00 149 149,25 150,125 0,99 2005 102 114,25 115,25 0,89 2013 130 151 152 0,86 124 116,25 117 1,06 163 153 154 1,06 126 117,75 118,375 1,06 170 155 155,75 1,09 119 119 119,5 1,00 157 156,5 157,375 1,00 2006 107 120 121,25 0,88 2014 136 158,25 159,125 0,85 128 122,5 123,5 1,04 170 160 161,25 1,05 136 124,5 125,375 1,08 177 162,5 163,625 1,08 127 126,25 127,125 1,00 167 164,75 165,75 1,01 2007 114 128 129,25 0,88 2015 145 166,75 168 0,86 135 130,5 131,625 1,03 178 169,25 146 132,75 133,125 1,10 187 136 133,5 134,625 1,01 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 8 / 23
Skattning av säsongskomponenter Vi har nu skattningar för säsongskomponent gånger slumpkomponent för den multiplikativa modellen och vi kan även beräkna skattningar för säsongskomponent plus slumpkomponent för den additiva modellen. För att ta bort slumpkomponenten och få skattningar av endast säsongskomponenterna beräknar vi medelvärdet för varje säsong (här kvartal): Kvartal År 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 medel sn 1 0,91 0,88 0,9 0,9 0,89 0,88 0,88 0,86 0,86 0,85 0,86 0,86 0,86 0,85 0,86 0,87 2 1,01 1,02 1,02 1,04 1,06 1,04 1,03 1,06 1,02 1,04 1,05 1,05 1,06 1,05 1,04 3 1,04 1,04 1,06 1,06 1,05 1,06 1,08 1,1 1,09 1,09 1,11 1,1 1,09 1,09 1,08 1,08 4 1,04 1,07 1,02 1,01 1 1 1 1,01 1,01 1,01 1 1 0,99 1 1,01 1,01 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 9 / 23
Standardisering av säsongskomponenter För att alla säsongskomponenter (4 st. för kvartalen) ska summera till antal säsonger, L, multipliceras varje kvartalsmedelvärde sn t med L L t=1 = sn t 4 3.99995 = 1.0000125 för multiplikativ modell, d.v.s. sn t = sn t skattningar (en per säsong): sn 1, sn 2, sn 3, sn 4. L L t=1 sn t. Vi får alltså fyra För additiv modell ska summan av säsongskomponenterna bli noll och justering blir därmed på detta sätt: sn t = sn t L t=1 sn t L Bertil Wegmann (IDA, LiU) 732G71, Statistik B 10 / 23
Säsongsrensade värden För att skatta en trend rensar vi bort säsongsvariationen från data med hjälp av säsongskomponenterna. För multiplikativ modell ges de säsongsrensade värdena som: d t = y t sn t För additiv modell ges de säsongsrensade värdena som: d t = y t sn t Bertil Wegmann (IDA, LiU) 732G71, Statistik B 11 / 23
Skattade trendvärden Årtal y MA CMA sn x ir sn d Årtal y MA CMA sn x ir sn d 2000 100 0,87 114,50 2008 117 135,75 136 0,87 133,97 112 1,04 107,77 144 136,25 136,125 1,04 138,56 116 111,25 111,625 1,04 1,08 107,81 148 136 135,5 1,09 1,08 137,55 117 112 112,25 1,04 1,01 115,69 135 135 133,75 1,01 1,01 133,49 2001 103 112,5 112,625 0,91 0,87 117,94 2009 113 132,5 131,875 0,86 0,87 129,39 114 112,75 113,125 1,01 1,04 109,69 134 131,25 131,125 1,02 1,04 128,93 117 113,5 113 1,04 1,08 108,74 143 131 131,375 1,09 1,08 132,90 120 112,5 112,5 1,07 1,01 118,66 134 131,75 133,125 1,01 1,01 132,50 2002 99 112,5 112,5 0,88 0,87 113,36 2010 116 134,5 136,375 0,85 0,87 132,82 114 112,5 111,625 1,02 1,04 109,69 145 138,25 139,625 1,04 1,04 139,52 117 110,75 110,75 1,06 1,08 108,74 158 141 142,125 1,11 1,08 146,84 113 110,75 110,5 1,02 1,01 111,73 145 143,25 144,375 1,00 1,01 143,38 2003 99 110,25 110,125 0,90 0,87 113,36 2011 125 145,5 145,875 0,86 0,87 143,13 112 110 109,875 1,02 1,04 107,77 154 146,25 146,5 1,05 1,04 148,18 116 109,75 109,875 1,06 1,08 107,81 161 146,75 147 1,10 1,08 149,63 112 110 110,5 1,01 1,01 110,74 147 147,25 147,5 1,00 1,01 145,35 2004 100 111 111,25 0,90 0,87 114,50 2012 127 147,75 147,875 0,86 0,87 145,42 116 111,5 111,625 1,04 1,04 111,62 156 148 148,25 1,05 1,04 150,10 118 111,75 112 1,05 1,08 109,67 162 148,5 148,875 1,09 1,08 150,56 113 112,25 113,25 1,00 1,01 111,73 149 149,25 150,125 0,99 1,01 147,33 2005 102 114,25 115,25 0,89 0,87 116,79 2013 130 151 152 0,86 0,87 148,85 124 116,25 117 1,06 1,04 119,31 163 153 154 1,06 1,04 156,84 126 117,75 118,375 1,06 1,08 117,10 170 155 155,75 1,09 1,08 157,99 119 119 119,5 1,00 1,01 117,67 157 156,5 157,375 1,00 1,01 155,24 2006 107 120 121,25 0,88 0,87 122,52 2014 136 158,25 159,125 0,85 0,87 155,73 128 122,5 123,5 1,04 1,04 123,16 170 160 161,25 1,05 1,04 163,57 136 124,5 125,375 1,08 1,08 126,39 177 162,5 163,625 1,08 1,08 164,50 127 126,25 127,125 1,00 1,01 125,58 167 164,75 165,75 1,01 1,01 165,13 2007 114 128 129,25 0,88 0,87 130,53 2015 145 166,75 168 0,86 0,87 166,03 135 130,5 131,625 1,03 1,04 129,90 178 169,25 1,04 171,27 146 132,75 133,125 1,10 1,08 135,69 187 1,08 173,79 136 133,5 134,625 1,01 1,01 134,48 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 12 / 23
Säsongsrensade värden Bertil Wegmann (IDA, LiU) 732G71, Statistik B 13 / 23
Skattning av trend över tiden Man skattar en trend på de säsongsrensade värdena över tiden med hjälp av en enkel eller multipel linjär regressionsanalys. Beroende på hur vi tror att trenden ser ut skattar vi en linjär, kvadratisk, etc. trend (se förra föreläsningen). Anta att vi vill skatta en linjär trend: TR t = β 0 + β 1 t, d.v.s. vi anpassar följande modell till de säsongsrensade värdena d t = β 0 + β 1 t + ɛ t. Detta ger den skattade regressionslinjen till tr t = b 0 + b 1 t = 100.34 + 0.991t. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 14 / 23
Skattning av cyklisk komponent, multiplikativ modell Nu har vi skattningar för säsongskomponenter och trend. Skattningar för den cykliska komponenten, CL t, ges från y t cl t ir t = tr t sn t Om vi har kvartalsdata eller månadsdata kan vi beräkna en skattning av cyklisk komponent som medelvärdet för tre närliggande tidpunkter: cl t = (cl t 1 ir t 1 ) + (cl t ir t ) + (cl t+1 ir t+1 ) 3 För de första tre tidpunkterna får vi att cl 2 = 1.130+1.053+1.044 3 1.08. Vi kan slutligen skatta IR t som ir t = cl t ir t cl t, som för den andra observationen blir ir 2 = 1.053 1.08 0.98. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 15 / 23
Skattning av cyklisk komponent, additiv modell För additiv modell har vi istället att cl t + ir t = y t tr t sn t Då får vi skattningar av de cykliska komponenterna som cl t = (cl t 1 + ir t 1 ) + (cl t + ir t ) + (cl t+1 + ir t+1 ) 3 och slutligen för slumpkomponenterna ir t = (cl t + ir t ) cl t Bertil Wegmann (IDA, LiU) 732G71, Statistik B 16 / 23
Slutlig tabell för komponenterna, multiplikativ modell Årtal y MA CMA sn x ir sn d tr cl x ir cl ir Årtal y MA CMA sn x ir sn d tr cl x ir cl ir 2000 100 0,87 114,50 101,33 1,13 2008 117 135,75 136 0,87 133,97 133,04 1,01 1,02 0,99 112 1,04 107,77 102,32 1,05 1,08 0,98 144 136,25 136,125 1,04 138,56 134,03 1,03 1,02 1,01 116 111,25 111,625 1,04 1,08 107,81 103,31 1,04 1,07 0,98 148 136 135,5 1,09 1,08 137,55 135,02 1,02 1,01 1,01 117 112 112,25 1,04 1,01 115,69 104,3 1,11 1,09 1,02 135 135 133,75 1,01 1,01 133,49 136,01 0,98 0,98 1,00 2001 103 112,5 112,625 0,91 0,87 117,94 105,29 1,12 1,09 1,03 2009 113 132,5 131,875 0,86 0,87 129,39 137 0,94 0,95 0,99 114 112,75 113,125 1,01 1,04 109,69 106,28 1,03 1,06 0,98 134 131,25 131,125 1,02 1,04 128,93 138 0,93 0,94 0,99 117 113,5 113 1,04 1,08 108,74 107,28 1,01 1,05 0,97 143 131 131,375 1,09 1,08 132,90 138,99 0,96 0,95 1,01 120 112,5 112,5 1,07 1,01 118,66 108,27 1,10 1,05 1,04 134 131,75 133,125 1,01 1,01 132,50 139,98 0,95 0,95 1,00 2002 99 112,5 112,5 0,88 0,87 113,36 109,26 1,04 1,04 0,99 2010 116 134,5 136,375 0,85 0,87 132,82 140,97 0,94 0,96 0,98 114 112,5 111,625 1,02 1,04 109,69 110,25 0,99 1,00 0,99 145 138,25 139,625 1,04 1,04 139,52 141,96 0,98 0,98 1,00 117 110,75 110,75 1,06 1,08 108,74 111,24 0,98 0,99 0,99 158 141 142,125 1,11 1,08 146,84 142,95 1,03 1,00 1,03 113 110,75 110,5 1,02 1,01 111,73 112,23 1,00 0,99 1,00 145 143,25 144,375 1,00 1,01 143,38 143,94 1,00 1,00 0,99 2003 99 110,25 110,125 0,90 0,87 113,36 113,22 1,00 0,98 1,02 2011 125 145,5 145,875 0,86 0,87 143,13 144,93 0,99 1,00 0,99 112 110 109,875 1,02 1,04 107,77 114,21 0,94 0,96 0,98 154 146,25 146,5 1,05 1,04 148,18 145,92 1,02 1,01 1,01 116 109,75 109,875 1,06 1,08 107,81 115,2 0,94 0,94 0,99 161 146,75 147 1,10 1,08 149,63 146,91 1,02 1,01 1,01 112 110 110,5 1,01 1,01 110,74 116,19 0,95 0,96 1,00 147 147,25 147,5 1,00 1,01 145,35 147,9 0,98 0,99 0,99 2004 100 111 111,25 0,90 0,87 114,50 117,18 0,98 0,96 1,02 2012 127 147,75 147,875 0,86 0,87 145,42 148,9 0,98 0,99 0,99 116 111,5 111,625 1,04 1,04 111,62 118,18 0,94 0,95 1,00 156 148 148,25 1,05 1,04 150,10 149,89 1,00 0,99 1,01 118 111,75 112 1,05 1,08 109,67 119,17 0,92 0,93 0,99 162 148,5 148,875 1,09 1,08 150,56 150,88 1,00 0,99 1,01 113 112,25 113,25 1,00 1,01 111,73 120,16 0,93 0,94 0,99 149 149,25 150,125 0,99 1,01 147,33 151,87 0,97 0,98 0,99 2005 102 114,25 115,25 0,89 0,87 116,79 121,15 0,96 0,96 1,01 2013 130 151 152 0,86 0,87 148,85 152,86 0,97 0,99 0,99 124 116,25 117 1,06 1,04 119,31 122,14 0,98 0,96 1,01 163 153 154 1,06 1,04 156,84 153,85 1,02 1,00 1,01 126 117,75 118,375 1,06 1,08 117,10 123,13 0,95 0,96 0,99 170 155 155,75 1,09 1,08 157,99 154,84 1,02 1,01 1,01 119 119 119,5 1,00 1,01 117,67 124,12 0,95 0,96 0,99 157 156,5 157,375 1,00 1,01 155,24 155,83 1,00 1,00 0,99 2006 107 120 121,25 0,88 0,87 122,52 125,11 0,98 0,97 1,01 2014 136 158,25 159,125 0,85 0,87 155,73 156,82 0,99 1,01 0,98 128 122,5 123,5 1,04 1,04 123,16 126,1 0,98 0,98 0,99 170 160 161,25 1,05 1,04 163,57 157,81 1,04 1,02 1,01 136 124,5 125,375 1,08 1,08 126,39 127,09 0,99 0,98 1,01 177 162,5 163,625 1,08 1,08 164,50 158,81 1,04 1,04 1,00 127 126,25 127,125 1,00 1,01 125,58 128,09 0,98 1,00 0,98 167 164,75 165,75 1,01 1,01 165,13 159,8 1,03 1,03 1,00 2007 114 128 129,25 0,88 0,87 130,53 129,08 1,01 1,00 1,01 2015 145 166,75 168 0,86 0,87 166,03 160,79 1,03 1,04 0,99 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 17 / 23
Cyklisk komponent och slumpkomponent Bertil Wegmann (IDA, LiU) 732G71, Statistik B 18 / 23
Prognoser Vi kan slutligen göra prognoser för den multiplikativa modellen som ŷ t = tr t sn t cl t. En prognos för det fjärde kvartalet år 2015 ges som (om vi antar att vi inte kan förutspå cyklisk komponent) ŷ 64 = tr 64 sn 64 = (100.34 + 0.991 64) 1.01 = 165.40 För additiv modell ges prognoser som ŷ t = tr t + sn t + cl t. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 19 / 23
Analys i Minitab Utskrift från multiplikativ uppdelning (utan cyklisk komponent). Minitab använder medianer vid uträkning av säsongskomponenter i stället för medelvärden. Time Series Decomposition for Omsättningsindex i fasta priser Multiplicative Model Data Omsättningsindex i fasta priser Length 63 NMissing 0 Fitted Trend Equation Yt = 100,55 + 0,9856 t Seasonal Indices Period Index 1 0,86608 2 1,04113 3 1,08539 4 1,00740 Accuracy Measures MAPE 3,4129 MAD 4,3091 MSD 29,9838 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 20 / 23
Trend, skattade och observerade värden Bertil Wegmann (IDA, LiU) 732G71, Statistik B 21 / 23
Fler grafer från Minitab Första grafen ger originaldata. Andra grafen ger data med trenden bortrensad. Här kan vi se om det nns säsongsvariation, cyklisk variation samt slumpvariation. Tredje grafen ger säsongsrensad data. Här kan vi se trend, cyklisk variation samt slumpvariation. Fjärde grafen ger data med både säsong och trend bortrensad. Här kan vi se cyklisk variation samt slumpvariation. Om det nns något mönster i denna graf som inte enbart ser slumpmässigt ut antar vi att det förekommer cyklisk variation. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 22 / 23
Fler grafer från Minitab Första grafen visar säsongskomponenterna. Andra grafen visar boxplottar över säsongsvariation (d.v.s. spridning). Tredje grafen visar säsongsvariation i procent. Fjärde grafen visar spridningen (boxplottar) för residualerna per säsong. Ju större spridning för residualerna för en viss säsong desto sämre skattar vi värden för den säsongen. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 23 / 23