Vad är tidsserier? En tidsserie är en mängd av observationer y t, där var och en har registrerats vid en specifik tidpunkt t. Vanligen görs mätningarna vid vissa tidpunkter och med samma avstånd mellan dem. T ex en gång i veckan, månaden eller året. Låt oss se på några exempel.
Sveriges bruttonationalprodukt 1861-1988 Årsdata. En kraftig trend.
Procentuella förändringar i BNP 1951-1982 Årsdata. Varför var det ca 6% tillväxttakt i ekonomin 1970 och ca 0% året efter? Förändringar p g a konjunktur.
Dödsorsak: olycksfall. USA 1973-1978. Månadsdata. Ett tydligt säsongsmönster.
Orsakerna till variationen i en tidsserie Byggstenarna eller komponenterna (med olika analogier) i en tidsserie är: 1 TREND Den allmänna utveckling som föreligger under en längre period. 2 KONJUNKTUR Kring den trend vi i stora drag kan urskilja finner vi kanske att värdena fluktuerar mer eller mindre regelbundet. 3 SÄSONG Periodiska mönster som återkommer varje år. 4 SLUMP De variationer som inte kan förklaras av ovan utan snarare av tillfälligheter.
Vad är prognoser? En förutsägelse angående framtida händelser eller tillstånd kallas en prognos (forecast). Olika metoder: kvalitativa och kvantitativa. Behövs dem? Människan måste göra prognoser. Prognoserna kan vara punktskattningar eller intervallskattningar.
Vad är prognoser?-kvalitativa metoder Experters åsikter. Historiska data saknas. Subjektiv kurvanpassning. S-kurvor. Delfi-metoden: (oraklet i Delfi) Rand Corporation; en grupp experter samlas; använts för att bedöma utvecklingen inom olika teknologiska områden. Teknologiska jämförelser.
Vad är prognoser?-kvantitativa metoder Univariata prognosmodeller använder uteslutande tidigare värden. Kausala prognosmodeller söker finna andra variabler som påverkar den variabel som skall prognosticeras.
När man gör en prognos kommer framtiden troligen visa att det inte var rätt tänkt Det observerade värdet i period t betecknas y t. Prognosen betecknas ŷ t. Prognosfelet(forecast error) för prognosen ŷ t definieras som e t = y t ŷ t. Utseendet kan avslöja brister i modellvalet.
Mått på prognosernas noggrannhet Vi definierar även det absoluta felet(absolute deviations) Absoluta felet = e t = y t ŷ t. Genom att bilda det aritmetiska medelvärdet av de absoluta felen erhåller vi den genomsnittliga absoluta avvikelsen(mean absolute deviation (MAD)) Genomsnittliga absoluta avvikelsen = 1 n n e t = 1 n t=1 n y t ŷ t. t=1
Mått på prognosernas noggrannhet Vi kvadrerar prognosfelen e 2 t = (y t ŷ t ) 2 och bildar det aritmetiska medelvärdet av de kvadrerade felen. Då erhåller vi medelkvadratavvikelsen(mean squared error(mse)) Medelkvadratavvikelsen = 1 n n et 2 = 1 n t=1 n (y t ŷ t ) 2. t=1
Mått på prognosernas noggrannhet Absoluta procentuella felet ges som APT t = e t y t (100) = y t ŷ t y t (100). Bildar aritmetiska medelvärdet. Då erhåller vi den genomsnittliga absoluta procentavvikelsen(mean absolute percentage error(mape)) Genomsnittliga absoluta procentavvikelsen = 1 n n t=1 y t ŷ t y t (100).
Komponenter Vi har en tidsserie X 1, X 2,..., X n. Låt T t (trendkomponenten) S t (säsongskomponenten) C t (konjunkturkomponenten) I t (slumpkomponenten) Två modeller för X t : X t = T t + S t + C t + I t (additiv modell) X t = T t S t C t I t (multiplikativ modell) Den additiva modellen är lämpad för växande eller avtagande säsongsvariation. Den multiplikativa modellen för konstant säsongsvariation.
Löpande medeltal För att rensa x t, t = 1, 2,..., n på den slumpmässiga komponenten kan man använda löpande medeltal x t = 1 2m + 1 m j= m x t+j t = m + 1, m + 2,..., n m. Vi kommer att använda m = 1 (eftersom det täcker hela kalenderåret nedan), så x t = x t 1 + x t + x t+1 3
Ett företags omsättning Ett företag redovisar följande omsättning i miljoner kronor för en femårsperiod: År jan-apr maj-aug sep-dec 1997 7,9 12,9 14,6 1998 8,9 14,5 16,4 1999 10,0 16,3 18,3 2000 11,0 18,4 20,4 2001 12,2 20,5 22,3
Ett företags omsättning
Löpande medeltals beräkning Period Obs. 3-punkt-summa Medelvärde 1997: I 7,9 II 12,9 35,4 11,800 III 14,6 36,4 12,133 1998: I 8,9 38,0 12,667 II 14,5 39,8 13,267 III 16,4 40,9 13,633 1999: I 10,0 42,7 14,233 II 16,3 44,6 14,867 III 18,3 45,6 15,200 2000: I 11,0 47,7 15,900 II 18,4 49,8 16,600 III 20,4 51,0 17,000 2001: I 12,2 53,1 17,700 II 20,5 55,0 18,333 III 22,3
Observerat värde/beräknat trendvärde i % Vi jämför observationsvärdet och trendvärdet. År I II III 1997 109,3 120,3 1998 70,3 109,3 120,3 1999 70,3 109,6 120,4 2000 69,2 110,8 120,0 2001 68,9 111,8
Medelvärdet av varje tertial Tertial I II III Summa Medelvärde 69,675 110,160 120,250 300,085
Säsongsindex Tertial I II III Säsongsindex 69,7 110,1 120,2 Under första tertialet ligger omsättningen på grund av att det är lågsäsong drygt 30 % under det beräknade trendvärdet.
Säsongsrensade värden Säsongsrensat värde=(observerat värde)/(säsongsindex) T ex för tertial 1 1997 7, 9 = 11, 3. 0, 697 För tertial 2 1997 12, 9 = 11, 7. 1, 101 För övriga tidpunkter gör vi liknande beräkningar.
Säsongsrensade värden
Enkel exponentiell utjämning Antag att vi har en tidsserie x 1, x 2,..., x t utan (märkbar) trend eller säsong. Vi önskar utjämna tidsserien för att göra prognoser. Varför inte använda alla tidigare observationer från innevarande tidpunkt t, men med olika vikt? Det utjämnade värdet i t ges av ˆx t = αx t + α(1 α)x t 1 + α(1 α) 2 x t 2 + där α är ett tal mellan 0 och 1. α kallas utjämningskonstant.
Enkel exponentiell utjämning Man kan härleda ett rekursivt uttryck för det utjämnade värdet i t som ˆx t = (1 α) ˆx t 1 + αx t. Vi behöver ett startvärde ˆx 1 för att få igång rekursionen. Man kan välja den första observationen x 1 eller någon sorts medelvärde. I tidsperiod t gör vi prognoser för framtida värden på tidsserien genom uttrycket Prognosfelet beräknas som ˆx t+h = ˆx t h = 1, 2, 3,... e t = x t ˆx t 1.
Enkel exponentiell utjämning Hur ska α väljas? Man kan välja ett specifikt värde på α och beräkna kvadratsumman av prognosfelen: t ei 2 = i=2 t (x i ˆx i 1 ) 2. i=2