Vad Betyder måtten MAPE, MAD och MSD?



Relevanta dokument
Prognoser. ekonomisk-teoretisk synvinkel. Sunt förnuft i kombination med effektiv matematik ger i regel de bästa prognoserna.

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F8

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I STATISTIK B,

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

F11. Kvantitativa prognostekniker

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

Något om val mellan olika metoder

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Tentamen Tillämpad statistik A5 (15hp)

Utvärdering av Transportstyrelsens flygtrafiksmodeller

Tidsserier. Data. Vi har tittat på två typer av data

Regressions- och Tidsserieanalys - F7

Föreläsning 7 Kap G71 Statistik B

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Säsongrensning i tidsserier.

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F1

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Regressions- och Tidsserieanalys - F1

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Föreläsning 8. Kap 7,1 7,2

Modellskattningen har gjorts med hjälp av minsta kvadratmetoden (OLS).

Prognostisering med exponentiell utjämning

Facit till Extra övningsuppgifter

Handbok i materialstyrning - Del F Prognostisering

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

DEN FRAMTIDA VERKSAMHETSVOLYMEN I RÄTTSKEDJAN - CENTRALA PROGNOSER FÖR PERIODEN : RESULTATBILAGA

Multipel Regressionsmodellen

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Tentamen Tillämpad statistik A5 (15hp)

Tidsserier. Tre modeller för tidsserier är den multiplikativa, additiva och säsongdummymetoden.

Datorövning 5 Exponentiella modeller och elasticitetssamband

ÖVNINGSUPPGIFTER KAPITEL 7

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Metod och teori. Statistik för naturvetare Umeå universitet

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 4. Kap 5,1-5,3

Föreläsning G60 Statistiska metoder

Regressions- och Tidsserieanalys - F3

Planering av flygplatser

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Föreläsning 3. Prognostisering: Prognosprocess, efterfrågemodeller, prognosmodeller och prognosverktyg

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

F19, (Multipel linjär regression forts) och F20, Chi-två test.

7.5 Experiment with a single factor having more than two levels

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Prognoser

Analys av egen tidsserie

Den framtida verksamhetsvolymen i rättskedjan - Centrala prognoser för perioden : Resultatbilaga

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Statistiska Institutionen Gebrenegus Ghilagaber (docent) Skriftlig tentamen i FINANSIELL STATISTIK, grundnivå, 7,5 hp, HT08. Torsdagen 15 januari 2009

Finansiell statistik

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Skrivning i ekonometri torsdagen den 8 februari 2007

Del A: Schema för ifyllande av svar nns på sista sidan

Regressions- och Tidsserieanalys - F4

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Räkneövning 3 Variansanalys

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Läs noggrant informationen nedan innan du börjar skriva tentamen

Skrivning i ekonometri lördagen den 25 augusti 2007

LABORATION 3 - Regressionsanalys

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Stockholms Univ., Statistiska Inst. Finansiell Statistik, GN, 7,5 hp, HT2008 Inlämningsuppgift (1,5hp)

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Stockholms Univ., Statistiska Inst. Finansiell Statistik, GN, 7,5 hp, VT2009 Inlämningsuppgift (1,5hp)

Reducering av svinnet i fa rskvaruhandeln genom fo rba ttrade efterfra geprognoser

Stokastiska processer med diskret tid

Ledtidsanpassa standardavvikelser för efterfrågevariationer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Transkript:

Vad Betyder måtten MAPE, MAD och MSD? Alla tre är mått på hur bra anpassningen är och kan användas för att jämföra olika modeller. Den modell som har lägst MAPE, MAD och/eller MSD har bäst anpassning. Oftast visar alla 3 måtten åt samma håll. Men i vissa fall kan man vara tvungen att välja ett av dem. Vid val mellan t ex additiv modell och multiplikativ modell kan det hända att något av måtten är högre för den ena modellen medan ett annat mått är lägre. Det gäller alltså att tolka måtten med visst förnuft.

MSD kan också jämföras med MSE i den multipla regressionen: MSD 1 n n y t yˆ t t1 2 Mean Square Deviation MSE 1 n k 1 n y t yˆ t t1 2 Mean Square Error 2

MAD 1 n n t1 y t yˆ t Mean Absolute Deviation Skillnaden mellan MAD och MSD är att MAD använder absolutavvikelser istället för kvadratiska avvikelser. MAD är mindre känslig för avvikande värden och blir mer användbar när vi har något enstaka värde som uppträder konstigt. Ytterligare en fördel med MAD är att dess värde är i samma skala som y t - observationerna själva, vilket gör det lättare att tolka. 3

MAPE 1 n n t1 y t y t yˆ t Mean Absolute Percentage Error Måttet använder också absoluta avvikelser, men mäter dem relativt nivån hos y. Vi får alltså relativa (procentuella) avvikelser. Måttet är praktiskt för multiplikativa modeller där den oregelbundna komponenten (IR t ) är ganska betydande, eftersom avvikelserna då blir stora när vi har stora värden på y. 4

Multiplikativ Additiv 5

Föreläsning 9 Kap 8,1 8,3 8,4 I kap 8,3 och 8,4: Ej prognosintervall för hand, endast prognosberäkning. 6

Tre typer av utjämningar Kap 8,1 Enkel exponentiell utjämning: Används när tidsserien rör sig runt en konstant nivå. Bok: Simple exponential smoothing. Minitab: Single exponential smoothing Kap 8,3 Dubbel exponentiell utjämning: Använd då en trend finns i tidsserien. Bok: Holts trend corrected exponetial smoothing Minitab: Double exponential smoothing Kap 8,4 Holt winters metod: Används när trend och säsongsvariation finns i tidsserien. Bok: Holt-Winters method Minitab: Winters method 7

Exponentiell utjämning liknar glidande medelvärden men nyare obs får mer vikt. Exponentiell utjämning baseras dock på en modell vilket inte CMA gör. Istället för att skatta parametrarna till ett fix värde, såsom görs vid minsta-kvadrat-skattning vid regressionsanalys, så tillåts parameterskattningarna att ändra sig med tiden, vid exponentiell utjämning. Parameterskattningarna går inte att tolka vid exponentiell utjämning. Exponentiell utjämning används för prognostisering. Fungerar bra då tidsserien har ett dynamiskt mönster. 8

Kap 8,1 Enkel exponentiell utjämning Används för att göra prognoser för en tidsserie som inte innehåller varken trend- eller säsongskomponenter, t ex årlig försäljning av en vara. Modell: y t = 0 + t Modellen ska inte ses som statisk utan vi kan tillåta att nivån ( 0 ) kan ändras lite med tiden, men inte enligt någon typisk trendstruktur. 9

Enkel exponentiell utjämning innebär att man använder historiska data för att jämna ut serien och därmed plocka bort den rent slumpmässiga variationen. Vid utjämningen låter man gamla värden och nyare värden spela olika stora roll Den utjämnade serien använder vi sen för att göra prognoser efter den sista observationen. 10

Beteckna de tillgängliga historiska observationerna y 1,y 2, y n För enkel exponentiell utjämning används utjämningsekvationen: T y T ( 1) 1, T 1,..., n T dvs vi har här infört funktionen T som anger det utjämnade värdet vid tidpunkt T. T är skattningen av 0 vid tiden T är den s k utjämningskonstanten eller utjämningsparametern (smoothing parameter). 0 < <1, och den styr hur mycket vikt det nyaste värdet i serien ska ha. 11

Med ett lågt värde på (nära 0) spelar de tidigare värdena i serien en större roll än de senare: Serien blir mer utjämnad (mer lik ett medelvärde av samtliga observationer) Med ett högt värde på (mellan 0,5 och 0,99) spelar de senare värdena i serien en större roll än de tidigare: Serien blir mindre utjämnad och T kommer i högre grad att fånga upp de successiva förändringarna i tidsserien. 12

Som prognos för ett framtida värde (vilket som helst!) används: ˆ T y ( T) T Uppdateringsformeln (utjämningsekvationen) anger antal tidssteg efter tidpunkten T och kallas på engelska lead time. T y T ( 1) 1, T 1,, n T Hur skall vi välja? Hur/var ska vi börja, dvs vilket värde ska 0 vi välja på? 13

Valet av 0 kan göras på litet olika sätt beroende på tillgången till historiska data: Många historiska värden: - Använd 10-50% av de historiska värdena och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter 0 till. - Låt y 1 vara den första observationen i det resterande datamaterialet och börja utjämningen från denna, eller den första observationen i hela datamaterialet och börja utjämningen från denna. (Så gör jag) 14

Ett fåtal historiska värden: - Använd samtliga historiska data och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter 0 till. - Låt y 1 vara den första observationen i hela datamaterialet och börja utjämningen från denna. 15

Exempel: Försäljning av dagligvaror i USA Year Sales values 1985 151 1986 151 1987 147 1988 149 1989 146 1990 142 1991 143 1992 145 1993 141 1994 143 1995 145 1996 138 1997 147 1998 151 1999 148 2000 148 16

sales Tidsseriegraf 150 145 140 1985 1990 1995 2000 year 17

Sätt upp modellen: yt 0 t Skatta β 0 = l 0 (=startvärdet) med medelvärdet av de första 8 observationerna i tidsserien (151151...145)/8 146. 75 ˆ0 Låt 0 = 0 ˆ =146.75 18

Anta först att försäljningen är ganska stabil, dvs, under den studerade perioden antas inte genomsnittsvärdet β 0 ändra sig nämnvärt. Då kan man välja ett relativt lågt värde på. Detta innebär att de tidigare värdena i serien kommer att spela en större roll i prognoserna än de senare. Vi låter = Vi använder nu uppdateringsformeln, som egentligen uppdaterar skattningen av β 0. Vi låter y 1 vara det första värdet i tidsserien. 19

20 043 146. 145.826 148 145.826 145.584 148 145.584 144.982 151 144.982 144.758 147 144.758 145.509 138 145.509 145.566 145 145.566 145.851 143 145.851 146.390 141 146.390 146.544 145 146.544 146.938 143 146.938 147.487 142 147.487 147.652 146 147.652 147.502 149 147.502 147.5575 147 147.5575 147.175 151 147.175 146.75 151 15 16 16 14 15 15 13 14 14 12 13 13 11 12 12 10 11 11 9 10 10 8 9 9 7 8 8 6 7 7 5 6 6 4 5 5 3 4 4 2 3 3 1 2 2 0 1 1 y y y y y y y y y y y y y y y y 2000: 1999: 1998: 1997: 1996: 1995: 1994: 1993: 1992: 1991: 1990: 1989: 1988: 1987: 1986: 1985:

Prognoser yˆ yˆ yˆ yˆ 17 18 19 20 etc. 16 146.04 146.04 146.04 146.04 21

Analys med hjälp av Minitab StatTime SeriesSingle Exp Smoothing 22

Year T Sales val. l T-1 y T l T-1 Forecasts 1985 1 151 146,750 4,25000 * 1986 2 151 147,175 3,82500 * 1987 3 147 147,558-0,55750 * 1988 4 149 147,502 1,49825 * 1989 5 146 147,652-1,65158 * 1990 6 142 147,486-5,48642 * 1991 7 143 146,938-3,93778 * 1992 8 145 146,544-1,54400 * 1993 9 141 146,390-5,38960 * 1994 10 143 145,851-2,85064 * 1995 11 145 145,566-0,56557 * 1996 12 138 145,509-7,50902 * 1997 13 147 144,758 2,24188 * 1998 14 151 144,982 6,01770 * 1999 15 148 145,584 2,41593 * 2000 16 148 145,826 2,17433 * 2001 17 146,043 2002 18 146,043 2003 19 146,043 2004 20 146,043 20 yˆ yˆ yˆ yˆ 17 18 19 23

sales Single Exponential Smoothing 153 148 Actual Predicted Forecast Actual Predicted Forecast 143 Smoothing Constant Alpha: 0,100 138 MAPE: MAD: MSD: 2,2378 3,2447 14,4781 0 10 20 Time 24

Anta nu att försäljningsvärdena är mindre stabila, dvs. under den studerade perioden kan β 0 tänkas ändra sig: Då är det bättre att använda ett som är relativt stort, vilket innebär att senare observationer får större betydelse i prognosen. Låt =0.5 25

sales Analys i MINITAB Single Exponential Smoothing 155 150 Actual Predicted Forecast Actual Predicted Forecast 145 Smoothing Constant Alpha: 0,500 140 MAPE: MAD: MSD: 1,9924 2,8992 13,0928 0 10 20 Time 26

Ett alternativ är också att göra uppdateringen med olika och sedan välja det som ger bäst successiva prognoser. Det finns också inbyggt i Minitab s procedur: 27

sales Automatiskt val av utjämningsparameter i Minitab Single Exponential Smoothing 155 Actual Predicted 150 Forecast Actual Predicted Forecast 145 Smoothing Constant Alpha: 0,567 140 MAPE: MAD: MSD: 1,7914 2,5940 12,1632 0 10 20 Time 28

Residualanalys 29

Prognosintervall vid enkel exponentiell utjämning Prognos: Y T+τ T = l T Felmarginal: z s 1 + τ 1 α 2 s = där Y t t 1 = l t 1 Ex på tavlan. Låt s = SSE T 1 = Y t Y t (t 1) 2 T 1 MSD 30

Kap 8,3 Dubbel exponentiell utjämning Data antas även innehålla en linjär trend. Modell: Två utjämningsparametrar, och Uppdateringsschema, utjämningsekvationer: Prognoser: t t t y 1 0 n T b b b y T T T T T T T T, 1, ) (1 ] [ ) (1 1 1 1 1 T T T b y ˆ 31

StatTimes SeriesDouble Exp Smoothing Två utjämningsparametrar (alpha och gamma) Prognos i en tidpunkt begärs 32

33

34

Eftersom datamaterialet inte har någon trendstruktur så fungerar inte dubbel exponentiell utjämning (gamma >1). Prognoserna blir orimliga. 35

Exempel: Miljöstatistik Nedanstående diagram visar koncentrationen i juli månad av kväve i alla dess tänkbara former i Råån vid Helsingborg, åren 1987-2001. Diagrammet tyder på en nedåtgående trend. Vad kan värdet i juli 2002 tänkas bli? 36

Double Exponential Smoothing Data Total N Length 15.0000 NMissing 0 Smoothing Constants Alpha (level): 0.2 Gamma (trend): 0.2 Accuracy Measures MAPE: 46 MAD: 1873 MSD: 5111241 Row Period Forecast Lower Upper 1 16 2560.25-2027.82 7148.32 37

38

39

40

utjämnade serien one-step-ahead forecasts: successiva prognoser 41

Kap8,4 Exponentiell utjämning av tidsserier med trend och säsong: (Holt-)Winters additiva modell (Holt-)Winters multiplikativa modell Bägge modellerna använder tre utjämningsparametrar,, för nivå, lutning och säsongsvariation. Val av modell görs enligt samma principer som vid klassisk komponentuppdelning 42

sales Exempel: Kvartalsvisa försäljningsdata year quarter sales 1991 1 124 1991 2 157 1991 3 163 1991 4 126 1992 1 119 1992 2 163 1992 3 176 1992 4 127 1993 1 126 1993 2 160 1993 3 181 1993 4 121 1994 1 131 1994 2 168 1994 3 189 1994 4 134 1995 1 133 1995 2 167 1995 3 195 1995 4 131 200 190 180 170 160 150 140 130 120 Index 5 10 15 20 43

StatTime SeriesWinters Method 44

Winters' multiplicative model Data sales Length 20.0000 NMissing 0 Smoothing Constants Alpha (level): 0.2 Gamma (trend): 0.2 Delta (seasonal): 0.2 Accuracy Measures MAPE: 2.6446 MAD: 3.8808 MSD: 23.7076 Row Period Forecast Lower Upper 1 21 135.625 126.117 145.133 2 22 174.430 164.724 184.136 45

46

Jämför med klassiskkomponentuppdelning 47

Value Tidsserie över andelen anställda i USA Det kan vara bra att använda exponentiell utjämning om komponenterna ändras över tiden och om det finns tydliga cykliska komponenter. 68 63 58 Index 100 200 300 400 500 600 48

Tidsserie över andelen anställda i USA 49

Klassisk komponentuppdelning med prognoser 12 månader 50

Winters modell: 51