F11. Kvantitativa prognostekniker

Relevanta dokument
Tidsserier. Data. Vi har tittat på två typer av data

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Multipel Regressionsmodellen

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Regressions- och Tidsserieanalys - F8

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Föreläsning 13: Multipel Regression

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

10.1 Enkel linjär regression

Vad Betyder måtten MAPE, MAD och MSD?

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Statistik B Regressions- och tidsserieanalys Föreläsning 1

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Regressions- och Tidsserieanalys - F7

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

Facit till Extra övningsuppgifter

Planering av flygplatser

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Matematisk statistik för D, I, Π och Fysiker

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen Tillämpad statistik A5 (15hp)

Matematisk statistik för B, K, N, BME och Kemister

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Föreläsning 12: Linjär regression

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Regressions- och Tidsserieanalys - F4

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

F23 forts Logistisk regression + Envägs-ANOVA

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

TENTAMEN I STATISTIK B,

Regressions- och Tidsserieanalys - F3

Höftledsdysplasi hos dansk-svensk gårdshund

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Skrivning i ekonometri torsdagen den 8 februari 2007

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Föreläsning 15, FMSF45 Multipel linjär regression

Regressions- och Tidsserieanalys - F3

Föreläsning 15: Faktorförsök

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

TAMS65 - Seminarium 4 Regressionsanalys

Regressions- och Tidsserieanalys - F3

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Metod och teori. Statistik för naturvetare Umeå universitet

Finansiell statistik. Multipel regression. 4 maj 2011

Stokastiska processer med diskret tid

Matematisk statistik för B, K, N, BME och Kemister

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Skrivning i ekonometri lördagen den 29 mars 2008

Sveriges bruttonationalprodukt Årsdata. En kraftig trend.

F7 Polynomregression och Dummyvariabler

Skrivning i ekonometri lördagen den 25 augusti 2007

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Enkel och multipel linjär regression

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistisk försöksplanering

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Statistisk försöksplanering

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Föreläsning G60 Statistiska metoder

Datorövning 5 Exponentiella modeller och elasticitetssamband

Matematisk statistik, Föreläsning 5

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Transkript:

F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer samma funktion Säsongernas avvikelser från trenden följer samma form Om man antagit att en kausal modell gäller (ex att efterfrågan påverkas av pris och inkomst) så antar man att den kausala modellen också gäller i framtiden Kvantitativa prognostekniker till skillnad mot kvalitativa 1

Olika typer av prognoser Naiva prognoser Prognoser baserade på regressionsanalys Prognoser baserade på glidande medelvärden MSE Jämförelser mellan prognostekniker MAD MAPE 2

550 500 450 Observerade värden Skattade värden (additiv modell) Skattade värden (multiplikativ modell) 400 350 300 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Repetition av kursen Regressionsanalys Grafiska och analytiska metoder för att bestämma samband mellan undersökningsvariabeln och en eller flera förklarande variabler Användning Undersöka vilka (förklarande) variabler som kan tänkas påverka en viss (undersöknings-) variabel Göra prognoser 3

Enkel linjär regression En undersökningsvariabel (Y), en förklarande variabel (X) Linjär funktion för samband Den genomsnittliga förändringen i Y är lika stor för en given förändring i X oavsett vilket X-värde vi utgår från Sannolikhetsteoretisk modell y = α + βx + ε Skattad linje (med hjälp av MK-metoden) y ˆ = a + bx Tolkning av parameterskattningarna (regressionskoefficienterna) a: intercept/skärning b: lutning/riktning genomsnittlig ökning i Y då X ökar med en enhet. 4

Beroendevariabel: sparande Antal lästa observationer 13 Antal använda observationer 13 Variansanalys Modell 1 70.52804 70.52804 36.05 <.0001 Fel 11 21.51965 1.95633 Korrigerad total 12 92.04769 Rot MSE 1.39869 R-kvadrat 0.7662 Beroende medel 3.76923 Just. R-kvadr. 0.7450 Koeff.var. 37.10808 Parameterskattningar Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1-21.20274 4.17709-5.08 0.0004 inkomst 1 0.11280 0.01879 6.00 <.0001 ε iidn(0, Modellantaganden 2 σ ε ) 5

Uppskattningar/prognoser Multipel linjär regression En undersökningsvariabel (Y), flera förklaringsvariabler Sannolikhetsteoretisk modell: y α + β x + β x +... + β + ε = x 1 1 2 2 k k Skattad linje ˆ 2 y = a + b1 x1 + b2 x +... + b k x k 6

Tolkning av parameterskattningar /regressionskoefficienter b 1 : genomsnittlig ökning i Y vid en enhets ökning av X 1, givet att X 2,, X k är konstanta. b 2 : genomsnittlig ökning i Y vid en enhets ökning av X 2, givet att X 1,, X k är konstanta. Uppdelning av variation i y Total variation i y = Oförklarad variation i y + Ar regressionen förklarad variation i y SST = SSE + SSR 7

ANOVA-tabell Source df SS MS F p Regression k SSR MSR=SSR/k MSR/MSE Error n-k-1 SSE MSE=SSE/(n-k-1) Total n-1 SST=SSR+SSE R 2 = 1-(SSE/SST) = SSR/SST Beroendevariabel: sparande Antal lästa observationer 13 Antal använda observationer 13 Variansanalys Modell 2 71.92534 35.96267 17.87 0.0005 Fel 10 20.12235 2.01223 Korrigerad total 12 92.04769 Rot MSE 1.41853 R-kvadrat 0.7814 Beroende medel 3.76923 Just. R-kvadr. 0.7377 Koeff.var. 37.63454 Parameterskattningar Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Parameter- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1-18.85816 5.08556-3.71 0.0041 inkomst 1 0.11676 0.01964 5.95 0.0001 boende 1-0.02642 0.03170-0.83 0.4241 8

Modellval 1. Beskrivande statistik 2. Val av modell 1. Utgå från teori 2. Stegvis regression/förklaringsgrad 3. Modellkontroll 1. Multikolinjäritet? 2. Heteroskedasticitet? 3. Normalfördelade feltermer 4. Rätt funktionsform? 5. Oberoende feltermer? Icke-linjär regression Icke-linjära samband Polynomsamband Exponentiella samband Loglinjära samband Vi behöver ha kunskap om sambandets form för att skatta icke-linjära modeller 9

Polynomsamband Exempel: andragradssamband 2 y = α + β x + β + ε x 1 2 Beroendevariabel: Skord Antal lästa observationer 6 Antal använda observationer 6 Variansanalys Summa av Källa DF kvadrater kvadrat F-värde Sh. > F Modell 2 1407.79762 703.89881 161.99 0.0009 Fel 3 13.03571 4.34524 Korrigerad total 5 1420.83333 Rot MSE 2.08452 R-kvadrat 0.9908 Beroende medel 55.83333 Just. R-kvadr. 0.9847 Koeff.var. 3.73347 Parameterskattningar Parameter- Medel- Standard- Variabel DF skattning fel t-värde Pr > t Skärning 1-4.50000 3.72891-1.21 0.3140 Godsel 1 33.87500 2.43955 13.89 0.0008 Godsel*Godsel 1-3.83929 0.34116-11.25 0.0015 10

Tolkning av parameterskattningar / regressionskoefficienter Effekt = (b 1 + 2b 2 x)*(förändring i x) Exponentiella samband Sannolikhetsteoretisk modell y = α β x ε 1. Logaritmera y 2. Beräkna loga och logb genom MK-metoden på loggade y-värden 3. Ta antiloger för att få a och b Tolkning av b: genomsnittlig procentuell ökning i Y då X ökar med en enhet 11

Elasticitetssamband / loglinjära samband Sannolikhetsteoretisk modell b 1 1 2 y = a x x ε Logaritmera: b 2 log y = log a + b + 1 log x1 b2 log Om vi logaritmerar variablerna kan vi använda de vanliga MK-formlerna för att skatta loga, b1 och b2. x 2 Tolkning av regressionskoefficienter b 1 : genomsnittlig procentuell ökning i Y då X 1 ökar med en procent och X 2 är konstant b 2 : genomsnittlig procentuell ökning i Y då X 2 ökar med en procent och X 1 är konstant 12

Variationsorsaker Trend Konjunktur Säsong Slump Tidsserier En tidsserie kan byggas upp på följande sätt Additiv modell: y = T + C + S + ε Kan användas om vi antar att säsongvärdet ligger ett visst antal enheter över eller under trendvärdet Multiplikativ modell: y = T x C x S x ε Kan användas om vi antar att säsongvärdet ligger en viss procent över eller under trendvärdet 13

Uppskattning av trend och säsong Trend och säsong kan uppskattas med hjälp av regressionsanalys Trend och säsong kan uppskattas med hjälp av glidande medelvärden Uppskattning av trend och säsong med hjälp av regressionsanalys Vi antar en additiv eller multiplikativ modell Vi antar en funktion för trenden Ex. Additiv modell med linjär trend (med 4 säsonger): y = α + βt + c1d1 + c2d2 + c3d3 + ε Vi använder MK-metoden för att skatta parametrarna Vi skattar trend och säsongkomponenter Tˆ = a0 + bt, a0 = S ˆ a a + k = 0 c k y bt yˆ = a bt ˆ 0 + + S k Multiplikativ modell skattas på samma sätt på logy-värden. 14

Uppskattning av trend och säsong med hjälp av glidande medelvärden Beräkna glidande medelvärden Beräkna säsongkomponenter Additiv modell Multiplikativ modell Säsongrensa ursprungliga serien Säsongrensade värden ger skattning av trend Justerade (korrigerade) säsongkomponenter (index) ger skattningar för säsong 15