732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Relevanta dokument
Regressions- och Tidsserieanalys - F7

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F3

10.1 Enkel linjär regression

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Regressions- och Tidsserieanalys - F3

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Regressions- och Tidsserieanalys - F4

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Tentamen i matematisk statistik

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

TENTAMEN I STATISTIK B,

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri torsdagen den 8 februari 2007

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F8

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Metod och teori. Statistik för naturvetare Umeå universitet

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen Tillämpad statistik A5 (15hp)

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

F7 Polynomregression och Dummyvariabler

Föreläsning 4. Kap 5,1-5,3

Skrivning i ekonometri lördagen den 15 januari 2005

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Exempel 1 på multipelregression

Multipel Regressionsmodellen

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Regressions- och Tidsserieanalys - F5

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Examinationsuppgifter del 2

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Bayesiansk statistik, 732g43, 7.5 hp

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

7.5 Experiment with a single factor having more than two levels

8.1 General factorial experiments

Räkneövning 3 Variansanalys

Laboration 2 multipel linjär regression

Korrelation och autokorrelation

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

Skrivning i ekonometri lördagen den 25 augusti 2007

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen Tillämpad statistik A5 (15hp)

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Finansiell statistik

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i matematisk statistik

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 44 poäng.

tentaplugg.nu av studenter för studenter

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Facit till Extra övningsuppgifter

Exempel 1 på multipelregression

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Transkript:

732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann (IDA, LiU) 732G71, Statistik B 2 / 29

Tidsserieregressionsanalys (kap. 6.1-6.4) En tidsserie kan möjligen delas upp i följande komponenter: Trend Cykel Säsongsvariation Slumpvariation Bertil Wegmann (IDA, LiU) 732G71, Statistik B 3 / 29

Tidsserier med endast trend Det enklaste fallet är en tidsserie som endast innehåller en trend- och slumpkomponent. Trendmodell: y t = TR t + ɛ t, där y t är värdet på y vid tidpunkt t, TR t är trenden vid tidpunkt t och ɛ t är feltermen vid tidpunkt t. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 4 / 29

Olika modeller för trenden Beroende på hur trenden ser ut, kan den modelleras på olika sätt. y t = TR t + ɛ t Ingen trend: TR t = β 0 Linjär trend: TR t = β 0 + β 1 t Kvadratisk trend: TR t = β 0 + β 1 t + β 2 t 2 Regressionsantaganden: ɛ t N (0, σ) Bertil Wegmann (IDA, LiU) 732G71, Statistik B 5 / 29

Exempel: KPI, månadsvis 2006:1-2015:10 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 6 / 29

Exempel: Ingen trend Om vi först (felaktigt) antar att vi inte har någon trend skattar vi följande modell: y t = β 0 + ɛ t, där β 0 skattas som medelvärdet av KPI: b 0 = 108.85. Ett 95 % prediktionsintervall för y t för denna modell ges av ȳ ± t [0.05/2],(n 1) s 1 + 1 n, där s är den vanliga skattningen av (y standardavvikelsen för y, d.v.s. s = t ȳ) 2. n 1 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 7 / 29

Exempel: skattad KPI utan trend Bertil Wegmann (IDA, LiU) 732G71, Statistik B 8 / 29

Exempel: Linjär trend Om vi tror att KPI ökar linjärt över tid kan vi skatta en linjär trendmodell med tidsvariabeln t som förklaringsvariabel, där t = 1, 2, 3,..., 118: y t = β 0 + β 1 t + ɛ t De vanliga formlerna för en enkel linjär regressionsanalys kan användas för att anpassa modellen. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 9 / 29

Exempel: Linjär trend Regression Analysis: KPI versus t Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 1 1383,3 1383,30 633,37 0,000 t 1 1383,3 1383,30 633,37 0,000 Error 116 253,3 2,18 Total 117 1636,7 Model Summary S R-sq R-sq(adj) R-sq(pred) 1,47785 84,52% 84,39% 83,89% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 102,871 0,274 375,67 0,000 t 0,10052 0,00399 25,17 0,000 1,00 Regression Equation KPI = 102,871 + 0,10052 t Bertil Wegmann (IDA, LiU) 732G71, Statistik B 10 / 29

Exempel: Linjär trend Bertil Wegmann (IDA, LiU) 732G71, Statistik B 11 / 29

Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = β 0 + β 1 t + β 2 t 2 + ɛ t Den kvadratiska trendmodellen kan anpassas med vanlig multipel linjär regressionsanalys. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 12 / 29

Exempel: Kvadratisk trend Regression Analysis: KPI versus t; tsquared Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 2 1553,42 776,708 1073,08 0,000 t 1 477,81 477,810 660,13 0,000 tsquared 1 170,11 170,111 235,02 0,000 Error 115 83,24 0,724 Total 117 1636,65 Model Summary S R-sq R-sq(adj) R-sq(pred) 0,850769 94,91% 94,83% 94,72% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 100,117 0,239 418,90 0,000 t 0,23821 0,00927 25,69 0,000 16,26 tsquared -0,001157 0,000075-15,33 0,000 16,26 Regression Equation KPI = 100,117 + 0,23821 t - 0,001157 tsquared Bertil Wegmann (IDA, LiU) 732G71, Statistik B 13 / 29

Exempel: Kvadratisk trend Bertil Wegmann (IDA, LiU) 732G71, Statistik B 14 / 29

Autokorrelation Ett av antagandena i linjär regressionsanalys är att feltermerna är oberoende av varandra. Detta antagande är ofta inte uppfyllt när man har tidsserier. Positiv autokorrelation: En positiv felterm vid tidpunkt t tenderar att följas av en positiv felterm vid tidpunkt t + 1. En negativ felterm vid tidpunkt t tenderar att följas av en negativ felterm vid tidpunkt t + 1. Negativ autokorrelation: En positiv felterm vid tidpunkt t tenderar att följas av en negativ felterm vid tidpunkt t + 1. En negativ felterm vid tidpunkt t tenderar att följas av en positiv felterm vid tidpunkt t + 1. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 15 / 29

Exempel: autokorrelation för linjär trendmodell Vi undersöker om vi har positiv/negativ autokorrelation i den fjärde residualplotten. Vad verkar vara fallet? Bertil Wegmann (IDA, LiU) 732G71, Statistik B 16 / 29

Exempel: autokorrelation för kvadratisk trendmodell Vi undersöker om vi har positiv/negativ autokorrelation i den fjärde residualplotten. Vad verkar vara fallet? Bertil Wegmann (IDA, LiU) 732G71, Statistik B 17 / 29

Durbin-Watson test för positiv autokorrelation H 0 : Feltermerna är ej autokorrelerade H a : Feltermerna är positivt autokorrelerade d = n t=2 (e t e t 1 ) 2 n, t=2 et 2 där e t är residualen (skattade feltermen) vid tidpunkt t. Förkasta H 0 om d < d L,α Förkasta ej H 0 om d > d U,α Om d L,α d d U,α ger testet inget svar om hypoteserna. Värden på d L,α och d U,α ges från tabeller på sidan 598 och 599. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 18 / 29

Durbin-Watson test för negativ autokorrelation H 0 : Feltermerna är ej autokorrelerade H a : Feltermerna är negativt autokorrelerade d = n t=2 (e t e t 1 ) 2 n, t=2 et 2 där e t är residualen (skattade feltermen) vid tidpunkt t. Förkasta H 0 om (4 d) < d L,α Förkasta ej H 0 om (4 d) > d U,α Om d L,α (4 d) d U,α ger testet inget svar om hypoteserna. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 19 / 29

Exempel: Durbin-Watson test för Linjär trendmodell Regression Analysis: KPI versus t Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 1 1383,3 1383,30 633,37 0,000 t 1 1383,3 1383,30 633,37 0,000 Error 116 253,3 2,18 Total 117 1636,7 Model Summary S R-sq R-sq(adj) R-sq(pred) 1,47785 84,52% 84,39% 83,89% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 102,871 0,274 375,67 0,000 t 0,10052 0,00399 25,17 0,000 1,00 Regression Equation KPI = 102,871 + 0,10052 t Durbin-Watson Statistic = 0,102533 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 20 / 29

Exempel: Durbin-Watson test för Kvadratisk trendmodell Regression Analysis: KPI versus t; tsquared Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 2 1553,42 776,708 1073,08 0,000 t 1 477,81 477,810 660,13 0,000 tsquared 1 170,11 170,111 235,02 0,000 Error 115 83,24 0,724 Total 117 1636,65 Model Summary S R-sq R-sq(adj) R-sq(pred) 0,850769 94,91% 94,83% 94,72% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 100,117 0,239 418,90 0,000 t 0,23821 0,00927 25,69 0,000 16,26 tsquared -0,001157 0,000075-15,33 0,000 16,26 Regression Equation KPI = 100,117 + 0,23821 t - 0,001157 tsquared Durbin-Watson Statistic = 0,303298 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 21 / 29

Säsongsvariation Många tidsserier som är mätta månadsvis, kvartalsvis osv. uppvisar säsongsvariation. Om säsongsvariationen inte beror på nivån är den konstant. Är säsongsvariationen konstant för detaljhandelns försäljning per kvartal? Bertil Wegmann (IDA, LiU) 732G71, Statistik B 22 / 29

Ökande säsongsvariation Om säsongsvariationen beror på nivån på tidsserien är den ökande eller minskande. Vid ökande säsongsvariation kan man transformera y för att få konstant säsongsvariation. Nedan följer tre vanliga transformationer som man kan pröva med om man har detta problem. y = y = y 0.5 y = y 0.25 y = ln y Bertil Wegmann (IDA, LiU) 732G71, Statistik B 23 / 29

Ökande säsongsvariation för detaljhandelns försäljning Bertil Wegmann (IDA, LiU) 732G71, Statistik B 24 / 29

Dummyvariabler för att modellera säsongsvariation Om en tidsserie har konstant säsongsvariation kan vi använda följande modell: y t = TR t + SN t + ɛ t, där y t är värdet på y vid tidpunkt t, TR t är trenden vid tidpunkt t, SN t är säsongsfaktorn vid tidpunkt t och ɛ t är feltermen vid tidpunkt t. Säsongsfaktorerna kan skattas om vi skapar dummyvariabler: om vi har L säsonger skapar vi L 1 dummyvariabler. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 25 / 29

Multipel linjär regressionsanalys med dummyvariabler Modellen ln y t = β 0 + β 1 t + β 2 D 1 + β 3 D 2 + β 4 D 3 + ɛ t skattas i Minitab som en vanlig linjär multipel regressionsmodell, där D 1 = 1 om kvartal 1, 0 annars, D 2 = 1 om kvartal 2, 0 annars, D 3 = 1 om kvartal 3, 0 annars. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 26 / 29

Skattad multipel linjär regressionsmodell Regression Analysis: ln y versus t; D_1; D_2; D_3 Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 4 6,68290 1,67073 429,84 0,000 t 1 6,25034 6,25034 1608,06 0,000 D_1 1 0,38878 0,38878 100,02 0,000 D_2 1 0,08288 0,08288 21,32 0,000 D_3 1 0,10065 0,10065 25,90 0,000 Error 94 0,36537 0,00389 Total 98 7,04827 Model Summary S R-sq R-sq(adj) R-sq(pred) 0,0623449 94,82% 94,60% 94,19% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 3,9674 0,0168 236,16 0,000 t 0,008795 0,000219 40,10 0,000 1,00 D_1-0,1782 0,0178-10,00 0,000 1,53 D_2-0,0823 0,0178-4,62 0,000 1,53 D_3-0,0907 0,0178-5,09 0,000 1,53 Regression Equation ln y = 3,9674 + 0,008795 t - 0,1782 D_1-0,0823 D_2-0,0907 D_3 Durbin-Watson Statistic = 0,161703 Bertil Wegmann (IDA, LiU) 732G71, Statistik B 27 / 29

Signikanstest och modellutvärdering Eftersom vi har skattat en vanlig multipel linjär regressionsmodell kan vi använda de vanliga signikanstesten. F-test för hela modellen Signikanstest för trend: t-test för förklaringsvariabel t Signikanstest för säsongsvariation: Partiellt F-test för dummyvariablerna Modellen utvärderas sedan på vanligt sätt, d.v.s. vi kan undersöka förklaringsgraden och s (eller MSE) samt undersöka residualplottar och testa för autokorrelation. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 28 / 29

Residualplottar Bertil Wegmann (IDA, LiU) 732G71, Statistik B 29 / 29