Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning. Oftast visar alla 3 måtten åt samma håll. Men i vissa fall kan man vara tvungen att välja ett av dem. Vid val mellan t ex additiv modell och multiplikativ modell kan det hända att något av måtten är högre för den ena modellen medan ett annat mått är lägre. Det gäller alltså att tolka måtten med visst förnuft.
MSD kan också jämföras med MSE i den multipla regressionen: MSD 1 n n y t yˆ t t1 2 Mean Square Deviation MSE 1 n k 1 n y t yˆ t t1 2 Mean Square Error 2
MAD 1 n n t1 y t yˆ t Mean Absolute Deviation Skillnaden mellan MAD och MSD är att MAD använder absolutavvikelser istället för kvadratiska avvikelser. MAD är mindre känslig för avvikande värden och blir mer användbar när vi har något enstaka värde som uppträder konstigt. Ytterligare en fördel med MAD är att dess värde är i samma skala som y t - observationerna själva, vilket gör det lättare att tolka. 3
MAPE 1 n n t1 y t y t yˆ t Mean Absolute Percentage Error Måttet använder också absoluta avvikelser, men mäter dem relativt nivån hos y. Vi får alltså relativa (procentuella) avvikelser. Måttet är praktiskt för multiplikativa modeller där den oregelbundna komponenten (IR t ) är ganska betydande, eftersom avvikelserna då blir stora när vi har stora värden på y. 4
Multiplikativ Additiv 5
Föreläsning 9 Kap 8,1 8,3 8,4 I kap 8,3 och 8,4: Ej prognosintervall för hand, endast prognosberäkning. 6
Tre typer av utjämningar Kap 8,1 Enkel exponentiell utjämning: Används när tidsserien rör sig runt en konstant nivå. Bok: Simple exponential smoothing. Minitab: Single exponential smoothing Kap 8,3 Dubbel exponentiell utjämning: Använd då en trend finns i tidsserien. Bok: Holts trend corrected exponetial smoothing Minitab: Double exponential smoothing Kap 8,4 Holt winters metod: Används när trend och säsongsvariation finns i tidsserien. Bok: Holt-Winters method Minitab: Winters method 7
Exponentiell utjämning liknar glidande medelvärden men nyare obs får mer vikt. Exponentiell utjämning baseras dock på en modell vilket inte CMA gör. Istället för att skatta parametrarna till ett fix värde, såsom görs vid minsta-kvadrat-skattning vid regressionsanalys, så tillåts parameterskattningarna att ändra sig med tiden, vid exponentiell utjämning. Parameterskattningarna går inte att tolka vid exponentiell utjämning. Exponentiell utjämning används för prognostisering. Fungerar bra då tidsserien har ett dynamiskt mönster. 8
Kap 8,1 Enkel exponentiell utjämning Används för att göra prognoser för en tidsserie som inte innehåller varken trend- eller säsongskomponenter, t ex årlig försäljning av en vara. Modell: y t = 0 + t Modellen ska inte ses som statisk utan vi kan tillåta att nivån ( 0 ) kan ändras lite med tiden, men inte enligt någon typisk trendstruktur. 9
Enkel exponentiell utjämning innebär att man använder historiska data för att jämna ut serien och därmed plocka bort den rent slumpmässiga variationen. Vid utjämningen låter man gamla värden och nyare värden spela olika stora roll Den utjämnade serien använder vi sen för att göra prognoser efter den sista observationen. 10
Beteckna de tillgängliga historiska observationerna y 1,y 2, y n För enkel exponentiell utjämning används utjämningsekvationen: T y T ( 1) 1, T 1,..., n T dvs vi har här infört funktionen T som anger det utjämnade värdet vid tidpunkt T. T är skattningen av 0 vid tiden T är den s k utjämningskonstanten eller utjämningsparametern (smoothing parameter). 0 < <1, och den styr hur mycket vikt det nyaste värdet i serien ska ha. 11
Med ett lågt värde på (nära 0) spelar de tidigare värdena i serien en större roll än de senare: Serien blir mer utjämnad (mer lik ett medelvärde av samtliga observationer) Med ett högt värde på (mellan 0,5 och 0,99) spelar de senare värdena i serien en större roll än de tidigare: Serien blir mindre utjämnad och T kommer i högre grad att fånga upp de successiva förändringarna i tidsserien. 12
Som prognos för ett framtida värde (vilket som helst!) används: ˆ T y ( T) T Uppdateringsformeln (utjämningsekvationen) anger antal tidssteg efter tidpunkten T och kallas på engelska lead time. T y T ( 1) 1, T 1,, n T Hur skall vi välja? Hur/var ska vi börja, dvs vilket värde ska 0 vi välja på? 13
Valet av 0 kan göras på litet olika sätt beroende på tillgången till historiska data: Många historiska värden: - Använd 10-50% av de historiska värdena och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter 0 till. - Låt y 1 vara den första observationen i det resterande datamaterialet och börja utjämningen från denna, eller den första observationen i hela datamaterialet och börja utjämningen från denna. (Så gör jag) 14
Ett fåtal historiska värden: - Använd samtliga historiska data och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter 0 till. - Låt y 1 vara den första observationen i hela datamaterialet och börja utjämningen från denna. 15
Exempel: Försäljning av dagligvaror i USA Year Sales values 1985 151 1986 151 1987 147 1988 149 1989 146 1990 142 1991 143 1992 145 1993 141 1994 143 1995 145 1996 138 1997 147 1998 151 1999 148 2000 148 16
sales Tidsseriegraf 150 145 140 1985 1990 1995 2000 year 17
Sätt upp modellen: yt 0 t Skatta β 0 = l 0 (=startvärdet) med medelvärdet av de första 8 observationerna i tidsserien (151151...145)/8 146. 75 ˆ0 Låt 0 = 0 ˆ =146.75 18
Anta först att försäljningen är ganska stabil, dvs, under den studerade perioden antas inte genomsnittsvärdet β 0 ändra sig nämnvärt. Då kan man välja ett relativt lågt värde på. Detta innebär att de tidigare värdena i serien kommer att spela en större roll i prognoserna än de senare. Vi låter = Vi använder nu uppdateringsformeln, som egentligen uppdaterar skattningen av β 0. Vi låter y 1 vara det första värdet i tidsserien. 19
20 043 146. 145.826 148 145.826 145.584 148 145.584 144.982 151 144.982 144.758 147 144.758 145.509 138 145.509 145.566 145 145.566 145.851 143 145.851 146.390 141 146.390 146.544 145 146.544 146.938 143 146.938 147.487 142 147.487 147.652 146 147.652 147.502 149 147.502 147.5575 147 147.5575 147.175 151 147.175 146.75 151 15 16 16 14 15 15 13 14 14 12 13 13 11 12 12 10 11 11 9 10 10 8 9 9 7 8 8 6 7 7 5 6 6 4 5 5 3 4 4 2 3 3 1 2 2 0 1 1 y y y y y y y y y y y y y y y y 2000: 1999: 1998: 1997: 1996: 1995: 1994: 1993: 1992: 1991: 1990: 1989: 1988: 1987: 1986: 1985:
Prognoser yˆ yˆ yˆ yˆ 17 18 19 20 etc. 16 146.04 146.04 146.04 146.04 21
Analys med hjälp av Minitab StatTime SeriesSingle Exp Smoothing 22
Year T Sales val. l T-1 y T l T-1 Forecasts 1985 1 151 146,750 4,25000 * 1986 2 151 147,175 3,82500 * 1987 3 147 147,558-0,55750 * 1988 4 149 147,502 1,49825 * 1989 5 146 147,652-1,65158 * 1990 6 142 147,486-5,48642 * 1991 7 143 146,938-3,93778 * 1992 8 145 146,544-1,54400 * 1993 9 141 146,390-5,38960 * 1994 10 143 145,851-2,85064 * 1995 11 145 145,566-0,56557 * 1996 12 138 145,509-7,50902 * 1997 13 147 144,758 2,24188 * 1998 14 151 144,982 6,01770 * 1999 15 148 145,584 2,41593 * 2000 16 148 145,826 2,17433 * 2001 17 146,043 2002 18 146,043 2003 19 146,043 2004 20 146,043 20 yˆ yˆ yˆ yˆ 17 18 19 23
sales Single Exponential Smoothing 153 148 Actual Predicted Forecast Actual Predicted Forecast 143 Smoothing Constant Alpha: 0,100 138 MAPE: MAD: MSD: 2,2378 3,2447 14,4781 0 10 20 Time 24
Anta nu att försäljningsvärdena är mindre stabila, dvs. under den studerade perioden kan β 0 tänkas ändra sig: Då är det bättre att använda ett som är relativt stort, vilket innebär att senare observationer får större betydelse i prognosen. Låt =0.5 25
sales Analys i MINITAB Single Exponential Smoothing 155 150 Actual Predicted Forecast Actual Predicted Forecast 145 Smoothing Constant Alpha: 0,500 140 MAPE: MAD: MSD: 1,9924 2,8992 13,0928 0 10 20 Time 26
Ett alternativ är också att göra uppdateringen med olika och sedan välja det som ger bäst successiva prognoser. Det finns också inbyggt i Minitab s procedur: 27
sales Automatiskt val av utjämningsparameter i Minitab Single Exponential Smoothing 155 Actual Predicted 150 Forecast Actual Predicted Forecast 145 Smoothing Constant Alpha: 0,567 140 MAPE: MAD: MSD: 1,7914 2,5940 12,1632 0 10 20 Time 28
Residualanalys 29
Prognosintervall vid enkel exponentiell utjämning Prognos: Y T+τ T = l T Felmarginal: z s 1 + τ 1 α 2 s = där Y t t 1 = l t 1 Ex på tavlan. Låt s = SSE T 1 = Y t Y t (t 1) 2 T 1 MSD 30
Kap 8,3 Dubbel exponentiell utjämning Data antas även innehålla en linjär trend. Modell: Två utjämningsparametrar, och Uppdateringsschema, utjämningsekvationer: Prognoser: t t t y 1 0 n T b b b y T T T T T T T T, 1, ) (1 ] [ ) (1 1 1 1 1 T T T b y ˆ 31
StatTimes SeriesDouble Exp Smoothing Två utjämningsparametrar (alpha och gamma) Prognos i en tidpunkt begärs 32
33
34
Eftersom datamaterialet inte har någon trendstruktur så fungerar inte dubbel exponentiell utjämning (gamma >1). Prognoserna blir orimliga. 35
Exempel: Miljöstatistik Nedanstående diagram visar koncentrationen i juli månad av kväve i alla dess tänkbara former i Råån vid Helsingborg, åren 1987-2001. Diagrammet tyder på en nedåtgående trend. Vad kan värdet i juli 2002 tänkas bli? 36
Double Exponential Smoothing Data Total N Length 15.0000 NMissing 0 Smoothing Constants Alpha (level): 0.2 Gamma (trend): 0.2 Accuracy Measures MAPE: 46 MAD: 1873 MSD: 5111241 Row Period Forecast Lower Upper 1 16 2560.25-2027.82 7148.32 37
38
39
40
utjämnade serien one-step-ahead forecasts: successiva prognoser 41
Kap8,4 Exponentiell utjämning av tidsserier med trend och säsong: (Holt-)Winters additiva modell (Holt-)Winters multiplikativa modell Bägge modellerna använder tre utjämningsparametrar,, för nivå, lutning och säsongsvariation. Val av modell görs enligt samma principer som vid klassisk komponentuppdelning 42
sales Exempel: Kvartalsvisa försäljningsdata year quarter sales 1991 1 124 1991 2 157 1991 3 163 1991 4 126 1992 1 119 1992 2 163 1992 3 176 1992 4 127 1993 1 126 1993 2 160 1993 3 181 1993 4 121 1994 1 131 1994 2 168 1994 3 189 1994 4 134 1995 1 133 1995 2 167 1995 3 195 1995 4 131 200 190 180 170 160 150 140 130 120 Index 5 10 15 20 43
StatTime SeriesWinters Method 44
Winters' multiplicative model Data sales Length 20.0000 NMissing 0 Smoothing Constants Alpha (level): 0.2 Gamma (trend): 0.2 Delta (seasonal): 0.2 Accuracy Measures MAPE: 2.6446 MAD: 3.8808 MSD: 23.7076 Row Period Forecast Lower Upper 1 21 135.625 126.117 145.133 2 22 174.430 164.724 184.136 45
46
Jämför med klassiskkomponentuppdelning 47
Value Tidsserie över andelen anställda i USA Det kan vara bra att använda exponentiell utjämning om komponenterna ändras över tiden och om det finns tydliga cykliska komponenter. 68 63 58 Index 100 200 300 400 500 600 48
Tidsserie över andelen anställda i USA 49
Klassisk komponentuppdelning med prognoser 12 månader 50
Winters modell: 51