F9 Tidsserier Data Vi har tittat på två typer av data Tvärsnittsdata: data som härrör från en bestämd tidpunkt eller tidsperiod Tidsseriedata: data som insamlats under en följd av tidpunkter eller tidsperioder 1
Tidsseriedata Tidsserieanalys Vi har samlat in data vid olika (ofta lika avstånd emellan) tidpunkter, såsom varje dag, vecka, månad, kvartal, år osv. Ex på modeller vi tittat på: Användning Ekonomiska data finns ofta som observationer vid olika tidpunkter Vi är ofta intresserade av att göra prognoser 2
Illustration av tidsserier i diagram Vi använder ofta linjediagram eller stapeldiagram 25 2 15 1 5 t1 t2 t3 t4 Exempel på en tidsserie* 25 2 Omsättning (miljoner kr) 15 1 5 *Ur Körner & Wahlgren (22). Praktisk statistik 1997:1 1998:1 1999:1 2:1 21:1 3
Variationsorsaker Vi kan se i diagrammet ovan att det finns flera variationsorsaker Trend Konjunktur Säsong Slump En tidsserie kan byggas upp på följande sätt Additiv modell: y = T + C + S + ε Kan användas om vi antar att säsongvärdet ligger ett visst antal enheter över eller under trendvärdet Multiplikativ modell: y = T x C x S x ε Kan användas om vi antar att säsongvärdet ligger en viss procent över eller under trendvärdet 4
Hypotetiskt exempel: Additiv modell 9 8 Tidsserie: Additiv modell Omsättning (miljoner kr) 7 6 5 4 3 2 1 1997:1 1998:1 1999:1 2:1 Exempel: Multiplikativ modell 24 Tidsserie: Multiplikativ modell 22 Omsättning (miljoner kr) 2 18 16 14 12 1 8 6 1997:1 1998:1 1999:1 2:1 21:1 5
Vad vill vi göra? Vi vill skatta trenden Ett trendvärde som inte är påverkat av säsongvariation Vi vill skatta säsongkomponenter Hur stor del av omsättningen (exempelvis) beror på den säsongmässiga variationen? Uppskattning av trenden (T) Om man antar att trenden följer en speciell matematisk form: regressionsanalys Kan användas för att göra prognoser Kan bedöma prognosernas osäkerhet med konfidensintervall Om man inte har något antagande om trenden: glidande medelvärden 6
Uppskattning av trend med regressionsanalys Antag först att vi endast har en trendkomponent och en slumpkomponent: y = T + ε eller y = T x ε Möjliga modeller för att skatta trenden: y ˆ = a + bt y ˆ = a + bt + b t t y ˆ = ab 1 2 2 Exempel År 1994 1995 1996 1997 1998 1999 2 21 Oms (milj kr) 8.5 9.7 11. 12.4 14.4 16.6 18.9 21.9 Vi vill skatta trendkomponenten 7
Beroendevariabel: y Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1 149.72595 149.72595 244.85 <.1 Fel 6 3.6695.61151 Korrigerad total 7 153.395 Rot MSE.78199 R-kvadrat.9761 Beroende medel 14.175 Just. R-kvadr..9721 Koeff.var. 5.51668 Parameterskattningar Beroendevariabel: logy Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1.14447.14447 7641.69 <.1 Fel 6.11343.1891 Korrigerad total 7.14459 Rot MSE.435 R-kvadrat.9992 Beroende medel 1.138 Just. R-kvadr..9991 Koeff.var..38451 Parameterskattningar Parameter- Medel- Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 14.175.27648 51.27 <.1 t 1 1.8881.1266 15.65 <.1 Medel- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 1.138.154 735.59 <.1 t 1.5865.6792 87.42 <.1 8
Beroendevariabel: y Antal lästa observationer 8 Antal använda observationer 8 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 2 153.3281 76.6645 5729.34 <.1 Fel 5.669.1338 Korrigerad total 7 153.395 Rot MSE.11568 R-kvadrat.9996 Beroende medel 14.175 Just. R-kvadr..9994 Koeff.var..8166 Parameterskattningar Parameter- Medel- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 13.4625.6219 215.56 <.1 t 1 1.8881.1785 15.78 <.1 t2 1.14643.892 16.41 <.1 25 2 Omsättning 15 1 5 1993 1994 1995 1996 1997 1998 1999 2 21 22 År 25 2 Omsättning 15 1 5 25 2 1993 1994 1995 1996 1997 1998 1999 2 21 22 År Omsättning 15 1 5 1993 1994 1995 1996 1997 1998 1999 2 21 22 År 9
Uppskattning av säsongkomponenter med regressionsanalys Antag nu att vi istället för att ha gjort mätningar årligen, gör dem varje kvartal, tertial etc. Vi har antagligen säsongvariation förutom trendvariation Vi kan skapa dummyvariabler Antal dummyvariabler = antal säsonger - 1 Exempel (sid 28) Arbetade timmar per vecka (1 -tal inom jordbruk, skogsbruk, jakt, fiske) Kvartal År 1 2 3 4 1998 414 493 49 451 1999 435 536 533 421 2 426 484 457 46 21 373 459 476 423 22 378 448 435 393 23 368 431 41 365 24 38 429 426 388 1
55 Arbetade timmar (1 -tal) 5 45 4 35 1998:1 1999:1 2:1 21:1 22:1 Kvartal 23:1 24:1 Skatta trend och säsong med additiv modell Timmar = a + bt + c 1 D 1 + c 3 D 2 + c 4 D 3 11
SAS - kod data one; input Timmar D1 D2 D3 t; cards; 414 1 1 493 1 2 49 1 3 451 4 435 1 5... 388 28 ; proc reg; model Timmar= t D1 D2 D3; run; Beroendevariabel: Timmar Antal använda observationer 28 Rot MSE 19.78832 R-kvadrat.8437 Beroende medel 433.14286 Just. R-kvadr..8165 Koeff.var. 4.56854 Parameterskattningar Variansanalys Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Modell 4 48599 1215 31.3 <.1 Fel 23 96.28571 391.57764 Korrigerad total 27 5765 Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1 46.14286 1.5773 43.5 <.1 t 1-3.33929.46746-7.14 <.1 D1 1-2.44643 1.66986-1.92.678 D2 1 55.17857 1.61854 5.2 <.1 D3 1 5.94643 1.58763 4.81 <.1 12
Skattade linjen Timmar = 46 3.34t 2.4D 1t + 55.2D 2t + 5.9D 3t Uppskattning av trendkomponenten T y b t + b t = a + b t = a = 433.14 ( 3.34) 14.5 = 481.57 Skattade linjen Uppskattning av säsongkomponenter S + = a a c 1 1 S = 46 481.57 + ( 2.4) = 41.97 1 S = + a a c 2 2 S + = a a c 3 3 S + = a a c 4 4 S = 46 481.57 + 55.2 = 33.63 2 S = 46 481.57 + 5.9 = 29.33 3 S = 46 481.57 = 4 21.57 13
Additiv skattad linje: y ˆ = T + S Skattade linjen Trendkomponentens ekvation: T = a + bt T = 481.57 3. 34t Säsongkomponenter: S 1 =-41.97, S 2 =33.63, S 3 =29.33, S 4 =-21.57 Prognos Gör en prognos för första kvartalet 25 yˆ = 481.57 (3.34 29) 41.97 = 342.74 55 Arbetade timmar (1 -tal) 5 45 4 35 1998:1 1999:1 2:1 21:1 22:1 Kvartal 23:1 24:1 ŷ 14