HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

Relevanta dokument
Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F7

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Facit till Extra övningsuppgifter

Regressions- och Tidsserieanalys - F4

TENTAMEN I STATISTIK B,

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tentamen Tillämpad statistik A5 (15hp)

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Regressions- och Tidsserieanalys - F1

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Regressions- och Tidsserieanalys - F1

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Vad Betyder måtten MAPE, MAD och MSD?

Föreläsning G60 Statistiska metoder

10.1 Enkel linjär regression

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Föreläsning 4. Kap 5,1-5,3

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Skrivning i ekonometri lördagen den 25 augusti 2007

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Skrivning i ekonometri torsdagen den 8 februari 2007

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Regressions- och Tidsserieanalys - F3

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Laboration 2 multipel linjär regression

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F8

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Skrivning i ekonometri lördagen den 29 mars 2008

Tentamen i matematisk statistik

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Metod och teori. Statistik för naturvetare Umeå universitet

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F3

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

732G71 Statistik B. Föreläsning 9. Bertil Wegmann. December 1, IDA, Linköpings universitet

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

Exempel 1 på multipelregression

Tentamen Tillämpad statistik A5 (15hp)

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Multipel Regressionsmodellen

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Tentamen i Matematisk statistik Kurskod S0001M

Kvadratisk regression, forts.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

F11. Kvantitativa prognostekniker

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Matematisk statistik, Föreläsning 5

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

TENTAMEN I MATEMATISK STATISTIK

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Skrivning i ekonometri lördagen den 15 januari 2005

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Exempel 1 på multipelregression

Examinationsuppgifter del 2

Tentamen i Matematisk statistik Kurskod S0001M

tentaplugg.nu av studenter för studenter

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Matematisk statistik för D, I, Π och Fysiker

Tentamen i Matematisk statistik Kurskod S0001M

Datorövning 1 Enkel linjär regressionsanalys

Läs noggrant informationen nedan innan du börjar skriva tentamen

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

tentaplugg.nu av studenter för studenter

Räkneövning 3 Variansanalys

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen i Matematisk statistik Kurskod S0001M

Transkript:

LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik, ANd HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen REGRESSIONS- OCH TIDSSERIEANALYS, 5 P TENTAMEN LÖRDAGEN DEN 20 MAJ 2006 08.00-12.00 Hjälpmedel: Räknedosa. Jourhavande lärare: Anders Nordgaard Poänggränser m m: Skrivningen ger maximalt 15 skrivningspoäng. För betyget Godkänd krävs normalt 9 poäng. För betyget Väl Godkänd krävs normalt 12 poäng. Skriv namn och personnummer på varje inlämnat papper! Formelsamling och tabeller följer efter uppgifterna, Svarsformulär till uppgifterna 2-5 finns i slutet. Lycka till! Obs! Till uppgift 1 skall fullständig lösning inlämnas. Till uppgifterna 2-5 lämnas endast svar på svarsblankett, som finns längst bak i detta formulär. 1. En industrianläggning ligger intill ett vattendrag och en del restprodukter släpps efter rening ut i detta. För att kontrollera att reningsprocessen fungerar som den skall görs regelbundet provtagningar av vatten nedströms om utsläppet där halten av det aktuella ämnet mäts. De uppmätta halterna får då ej överstiga ett visst gränsvärde. Skulle detta vara fallet måste dyrbara investeringar göras i reningsprocessen vilket man naturligtvis vill undvika. Under de senaste två åren har man vid några tillfällen mätt halter som faktiskt överstigit gränsvärdet. Det hävdas dock att ämnet förekommer i vattendraget även utöver det som tillförs av industrin och vid höga vattenflöden kommer därför gränsvärdet att kunna överskridas utan att detta skulle bero på dålig rening i industrin. Normalt vattenflöde vid provtagningsplatsen är 0.85 kubikmeter/sekund. Följande data innehåller mätvärden från 12 olika provtagningstillfällen, där man dels har mätt halten, y (i milligram/liter), av det aktuella ämnet, dels mätt vattenflödet, x (i kubikmeter/sekund), vid provtagningsplatsen. Provtagning Halt (y) Vattenflöde (x) 1 1.37 2.81 2 1.29 2.02 3 1.16 1.50 4 1.12 1.3 5 1.15 1.2 6 1.04 0.97 7 1.09 0.89 8 0.97 0.82 9 0.81 0.78 10 0.86 0.74 11 0.85 0.71 12 0.83 0.58 Man beräknar följande summor: x = 14.320, 13.481, x y = 16.159 y = 12.540, x 2 = 21.758, y 2 = 1

Antag att den vanliga modellen för enkel linjär regression: y i = β 0 + β 1 x i + ε i gäller. a) Beräkna punktskattningar av parametrarna β 0 och β 1. (1p) b) Beräkna korrelationskoefficienten mellan x och y. (0.5p) c) Testa på 1% nivå nollhypotesen att det inte skulle finnas något linjärt samband mellan halten av det aktuella ämnet och vattenflödet. (1.5p) d) Beräkna ett 99% prognosintervall för halten av det aktuella ämnet då vattenflödet är 0.85 kubikmeter/sekund. (1.5 ) e) Det gränsvärde som ej får överskridas är satt till 1.25 milligram/liter. Kan man påstå med god säkerhet att så inte sker vid normalt vattenflöde? Motivera ditt svar. (0.5p) f) Nedan visas några residualplottar från en Minitab-analys av ovanstående modell. Bedöm modellen utifrån dessa. (1p) 2

2. Kan man tillämpa regressionsanalys på vad som helst? Svaret är ju egentligen nej, men här skall vi ändå ge oss på ett datamaterial för att se hur det går. Nedan visas data över några räntor, valutakurser mm. för bankdagar under perioden 18 april till 11 maj 2006. Data är sammaställda av nyhetsbyrån Ticker och har hämtats från Affärsvärldens hemsida. Variablerna är: Ssvx Stob5 Stob10 DEMBUND Spread USA10 USA30 USD/SEK EUR/SEK EUR/USD JPY/USD TCW Ränta på statsskuldsväxlar 5 årsränta, statsobligationer 10 årsränta, statsobligationer Tysk 10 årsränta Skillnad i köp och säljkurs för statsobligationer 10 årsränta, USA 30 årsränta, USA Valutakurs amerikanska dollar/svenska kronor Valutakurs euro/svenska kronor Valutakurs euro/amerikanska dollar Valutakurs japanska yen/amerikanska dollar Valutakursindex Ssvx Stob5 Stob10 DEM- Spread USA10 USA30 USD/ EUR/ EUR/ JPY/ TCW BUND SEK SEK USD USD 2.16 3.55 3.87 3.94-0.07 4.98 5.08 7.5779 9.3059 1.228 117.68 128.39 2.13 3.53 3.86 3.95-0.09 5.03 5.13 7.5392 9.3009 1.2334 117.74 128.22 2.13 3.51 3.86 3.93-0.07 5.05 5.14 7.5366 9.2811 1.2314 117.47 127.95 2.13 3.49 3.84 3.92-0.08 5.01 5.1 7.564 9.3177 1.2317 116.94 128.52 2.14 3.51 3.86 3.93-0.07 4.99 5.07 7.5579 9.3387 1.235 114.97 128.78 2.16 3.61 3.94 4-0.06 5.08 5.17 7.5369 9.3257 1.2376 114.9 128.56 2.17 3.61 3.93 3.99-0.06 5.11 5.18 7.4893 9.3188 1.2437 114.83 128.25 2.17 3.6 3.92 3.98-0.06 5.08 5.18 7.4665 9.3346 1.2491 114.31 128.47 2.16 3.61 3.91 3.97-0.05 5.07 5.17 7.391 9.29 1.2574 113.98 127.88 2.16 3.61 3.92 3.98-0.06 5.12 5.2 7.3827 9.328 1.2633 113.45 128.46 2.16 3.6 3.93 4-0.07 5.14 5.23 7.3773 9.301 1.261 113.54 128.27 2.16 3.63 3.96 4.02-0.06 5.15 5.24 7.3559 9.3154 1.2663 113.57 128.28 2.16 3.58 3.92 3.99-0.07 5.11 5.2 7.299 9.3044 1.2746 112.49 128.03 2.17 3.58 3.93 4-0.07 5.12 5.19 7.3277 9.3037 1.2696 111.68 128.2 2.17 3.58 3.93 4.03-0.1 5.13 5.21 7.2986 9.3125 1.2755 111.16 128.19 2.16 3.55 3.91 4.01-0.1 5.13 5.19 7.2889 9.3226 1.2791 110.56 128.36 2.17 3.63 3.97 4.06-0.09 5.16 5.23 7.3093 9.342 1.279 110.89 128.73 Antag att vi vill försöka förklara växelkursen mellan amerikanska dollar och svenska kronor (USD/SEK) med hjälp av övriga variabler. Först görs följande Minitab analys: 3

Regression Analysis: USD/SEK versus EUR/SEK; EUR/USD;... The regression equation is USD/SEK = 6.79 + 0.529 EUR/SEK - 5.62 EUR/USD + 0.0187 TCW + 0.00232 JPY/USD - 0.050 Ssvx - 0.044 Stob5-0.626 Stob10 + 0.790 DEMBUND + 0.720 Spread + 0.0851 USA10-0.139 USA30 Predictor Coef SE Coef T P VIF Constant 6.794 1.449 4.69 0.005 EUR/SEK 0.5289 0.1187 4.46 0.007 11.3 EUR/USD -5.6236 0.2009-28.00 0.000 39.6 TCW 0.018724 0.008114 2.31 0.069 11.5 JPY/USD 0.002316 0.002224 1.04 0.345 77.4 Ssvx -0.0499 0.1501-0.33 0.753 13.5 Stob5-0.0439 0.1188-0.37 0.727 77.9 Stob10-0.6264 0.5552-1.13 0.310 1248.5 DEMBUND 0.7895 0.6155 1.28 0.256 1602.5 Spread 0.7199 0.6309 1.14 0.306 246.9 USA10 0.08510 0.08380 1.02 0.356 63.1 USA30-0.13905 0.09279-1.50 0.194 64.0 S = 0.002377 R-Sq = 100.0% R-Sq(adj) = 100.0% Analysis of Variance Source DF SS MS F P Regression 11 0.187114 0.017010 3009.74 0.000 Residual Error 5 0.000028 0.000006 Total 16 0.187142 Source DF Seq SS EUR/SEK 1 0.000445 EUR/USD 1 0.186566 TCW 1 0.000057 JPY/USD 1 0.000000 Ssvx 1 0.000000 Stob5 1 0.000005 Stob10 1 0.000000 DEMBUND 1 0.000010 Spread 1 0.000018 USA10 1 0.000001 USA30 1 0.000013 4

a) Vilket av följande påståenden stämmer bäst om analysen? (0.5p) (i) Förklaringsgraden visar att modellen är perfekt och all variation har förklarats. (ii) P värdet för F -testet är ekvivalent med P värdet för den mest signifikanta förklaringsvariabeln (i detta fall EUR/USD). (iii) De höga P värdena för Ssvx och Stob5 visar att kvadratiska termer behövs för dessa variabler. (iv) I modellen finns stora problem med multikolinjäritet. (v) Den skattade modellen kan ej användas då flera av parametrarna har skattats med negativa värden. b) Testa med hjälp av analysen en nollhypotes som säger att endast förklaringsvariablerna EUR/SEK, EUR/USD och TCW skall vara med i modellen, dvs att övriga 8 variabler har lutningsparametrar som är = 0. Genomför testet på 5% nivå och ange teststorhetens värde, samt om testet är signifikant eller ej. (1p) Vi gör vidare en analys med följande resultat: Best Subsets Regression: USD/SEK versus Ssvx; Stob5;... Response is USD/SEK D E E J S E S U U P S t M p U U R R Y S t o B r S S / / / s o b U e A A S U U T v b 1 N a 1 3 E S S C Vars R-Sq R-Sq(adj) C-p S x 5 0 D d 0 0 K D D W MODELL 1 98.6 98.5 466.0 0.013435 X 1 1 85.0 84.0 4943.9 0.043217 X 2 2 99.9 99.9 12.3 0.0030652 X X 3 2 99.9 99.9 25.6 0.0038439 X X 4 3 100.0 100.0 4.3 0.0024012 X X X 5 3 99.9 99.9 12.1 0.0030296 X X X 6 4 100.0 100.0 5.3 0.0024023 X X X X 7 4 100.0 99.9 5.9 0.0024649 X X X X 8 5 100.0 100.0 5.4 0.0023066 X X X X X 9 5 100.0 100.0 5.7 0.0023481 X X X X X 10 6 100.0 100.0 5.7 0.0022206 X X X X X X 11 6 100.0 100.0 6.2 0.0022828 X X X X X X 12 7 100.0 100.0 5.8 0.0020607 X X X X X X X 13 7 100.0 100.0 6.5 0.0021739 X X X X X X X 14 8 100.0 100.0 7.4 0.0021294 X X X X X X X X 15 8 100.0 100.0 7.7 0.0021742 X X X X X X X X 16 9 100.0 100.0 9.0 0.0021951 X X X X X X X X X 17 9 100.0 100.0 9.1 0.0022173 X X X X X X X X X 18 10 100.0 100.0 10.1 0.0021941 X X X X X X X X X X 19 10 100.0 100.0 10.1 0.0021996 X X X X X X X X X X 20 11 100.0 100.0 12.0 0.0023773 X X X X X X X X X X X 21 5

c) Vilken av modellerna ovan har högst värde på Radj 2 och vilken modell skall väljas om man ser till C p måttet? (Svaren ges med hjälp av de inlagda modellnumren till höger i analysen.) (1p) Ytterligare en analys görs: Stepwise Regression: USD/SEK versus Ssvx; Stob5;... Forward selection. Alpha-to-Enter: 0.05 Response is USD/SEK on 11 predictors, with N = 17 Step 1 2 3 Constant 14.656 7.676 7.596 EUR/USD -5.764-5.878-5.801 T-Value -31.97-140.91-141.82 P-Value 0.000 0.000 0.000 EUR/SEK 0.765 0.475 T-Value 16.56 4.78 P-Value 0.000 0.000 TCW 0.0209 T-Value 3.13 P-Value 0.008 S 0.0134 0.00307 0.00240 R-Sq 98.55 99.93 99.96 R-Sq(adj) 98.46 99.92 99.95 C-p 466.0 12.3 4.3 d) Vilket av följande gäller för analysen? (0.5p) (i) Bakåteliminering, test utförda på 1% nivå. (ii) Fullständig stegvis regression, partiella F -test på 1% nivå. (iii) Framåtvalsprincipen, test utförda på 1% nivå. (iv) Bakåteliminering, test utförda på 5% nivå. (v) Fullständig stegvis regression, partiella F -test på 5% nivå. (vi) Framåtvalsprincipen, test utförda på 5% nivå. 6

e) Vilken av följande tolkningsbeskrivningar är korrekt för den slutliga modell som analysen kommit fram till? (0.5p) (i) Valutakursen USD/SEK minskar i genomsnitt med 1 enhet då valutakursen EUR/USD ökar med 5.88 enheter och valutakursen EUR/SEK minskar med 0.765 enheter. (ii) Valutakursen USD/SEK minskar i genomsnitt med 5.76 enheter då valutakursen EUR/USD ökar med 1 enhet. (iii) Valutakursen USD/SEK blir i genomsnitt oförändrad då var och en av variablerna EUR/USD, EUR/SEK och TCW ökar med en enhet. (iv) För fixa värden på EUR/USD och EUR/SEK ökar valutakursen USD/SEK med i genomsnit 0.021 enheter då TCW ökar med en enhet. (v) För fixa värden på TCW och EUR/USD ökar valutakursen USD/SEK med i genomsnitt 0.47% då valutakursen EUR/USD ökar med 1%. Betrakta slutligen följande analys: Regression Analysis: USD/SEK versus EUR/SEK; EUR/USD The regression equation is USD/SEK = 7.68 + 0.765 EUR/SEK - 5.88 EUR/USD Predictor Coef SE Coef T P Constant 7.6761 0.4247 18.07 0.000 EUR/SEK 0.76483 0.04619 16.56 0.000 EUR/USD -5.87834 0.04172-140.91 0.000 S = 0.003065 R-Sq = 99.9% R-Sq(adj) = 99.9% Analysis of Variance Source DF SS MS F P Regression 2 0.187011 0.093505 9951.97 0.000 Residual Error 14 0.000132 0.000009 Total 16 0.187142 Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 7.58928 0.00183 ( 7.58536; 7.59320) ( 7.58163; 7.59694) Values of Predictors for New Observations New Obs EUR/SEK EUR/USD 1 9.34 1.23 f) I analysen har ett 95% prognosintervall beräknats för USD/SEK. Räkna om detta till ett 99% prognosintervall. (1p) 7

3. Betrakta datamaterialet i uppgift2. Den sista variabeln TCW är ett valutaindex beräknat för var och en av de 17 dagarna som data härrör från. a) Hur har indexet förändrats från dag 1 till dag 17? (0.5p) b) Hur har valutakursen USD/SEK förändrats från dag 1 till dag 17 relativt utvecklingen hos TCW? (1p) 4. Betrakta åter datamaterialet i uppgift 2. Man vill testa en annan modellansats och inför därför variabeln DAG som antar värdena 1, 2, 3,..., 17 i datamaterialet. Följande modell skall analyseras: log(usd/sek) = β 0 + β 1 DAG + ε där log innebär 10 logaritmen och ε antas vara (vanliga) normalfördelade slumpkomponenter. En analys i Minitab ger följande resultat: Regression Analysis: log(usd/sek) versus DAG The regression equation is log(usd/sek) = 0.882-0.00120 DAG Predictor Coef SE Coef Constant 0.881733 0.000914 DAG -0.00120288 0.00008923 S = 0.001802 Analysis of Variance Source DF SS Regression 1 0.00059034 Residual Error 15 0.00004873 Total 16 0.00063907 Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 0.860081 0.000914 (0.858132;0.862030) (0.855773;0.864388) Values of Predictors for New Observations New Obs DAG 1 18.0 a) Avgör med ett lämpligt t-test på 5% nivå om det finns ett linjärt samband mellan log(usd/sek) och DAG. Ange teststorhetens värde samt om testet är signifikant eller ej. (1p) b) Beräkna ett 95% prognosintervall för valutakursen USD/SEK då DAG är 18 (dvs. närmaste bankdag efter datamaterialets slut). (0.5p) 8

5. I nedanstående graf visas årsdata för det s.k. prisbasbeloppet för åren 1960 till 2006. a) Antag att vi vill anpassa en klassisk modell (multiplikativ eller additiv) för komponentuppdelning till dessa data. Vilka komponenter kan då tänkas ingå? (i) T R t, SN t, CL t och IR t (ii) T R t, SN t och IR t (iii) T R t, CL t och IR t (iv) SN t, CL t och IR t (v) T R t, SN t och CL t (0.5p) En analys görs med följande (censurerade) utskrift och diagram: Data Basbelopp Length 47.0000 NMissing 0 Smoothing Constants Alpha (level): 1.18362 Gamma (trend): 0.42113 Accuracy Measures MAPE: 2 MAD: 348 MSD: 198509 Row Period Forecast Lower Upper 1 48 40092.4 39239.5 40945.3 2 49 40477.6 39002.8 41952.3 9

b) Vilken prognosmetod har använts här och vad är prognosvärdet för år 2008? (1p) 10

Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i där ε N(0, σ). Anpassad regressionslinje: ŷ = b 0 + b 1 x där (xi x) (y b 1 = i ȳ) xi y (xi x) 2 = i n x ȳ x 2 i n ( x) 2 = = xi y i (P x i) ( P y i) n x 2 i (P x i) 2 b 0 = ȳ b 1 x Kvadratsummor: n Formelsamling = n x i y i ( x i ) ( y i ) n x 2 i ( x i ) 2 Total: SST = (y i ȳ) 2 = y 2 i n (ȳ)2 = y 2 i (P y i) 2 Residual: SSE = (y i ŷ i ) 2 = (y i ȳ) 2 b 1 (x i x) (y i ȳ) = y 2 i b 0 y i b 1 x i y i Regression: SSR = (ŷ i ȳ) 2 = SST SSE Förenklingsformler: Se ovan för (y i ȳ) 2 och samma kan användas på (x i x) 2 (xi x) (y i ȳ) = x i y i n x ȳ = x i y i (P x i) ( P y i) n Obs!! (x i x) (y i ȳ) n x i y i ( x i ) ( y i ) Denna variant används bara i uttryck för b 1 och r då motsvarande variant används i nämnaren! Variansskattning σ 2 = s 2 = MSE = SSE n 2 s = MSE = SSE n 2 Förklaringsgrad: r 2 = SST SSR Korrelationskoefficient: r = r 2 = (xi x) (y i ȳ) (xi x) 2 (y i ȳ) 2 = Konfidensintervall, prognosintervall och hypotesprövning Stickprovsfördelningar: ( ) b 1 N β 1, σ (xi x) 2 b 0 N ( 1 β 0, σ n + ) P ( x)2 (xi x) 2 n xi y i n x ȳ ( x 2 i n ( x) 2 ) ( y 2 i n (ȳ)2 ) = I

( ) 1 b 0 + b 1 x 0 N β 0 + β 1 x 0, σ n + P (x0 x)2 (xi x) 2 Konfidensintervall för β 1 : b 1 ± t (n 2) s (xi x) 2 Konfidensintervall för β 0 : ( 1 n + b 0 ± t (n 2) s ) P ( x)2 (xi x) 2 Konfidensintervall för µ y0 x 0 = β 0 + β 1 x 0 : ( ) b 0 + b 1 x 0 ± t (n 2) 1 s n + P (x0 x)2 (xi x) 2 Prognosintervall för y 0 = β 0 + β 1 x 0 + ε 0 : ( ) b 0 + b 1 x 0 ± t (n 2) s 1 + 1 n + P (x0 x)2 (xi x) 2 Formellt t-test av H 0 : β 0 = 0: Testfunktion: t = b 0 s b0 = Jämför med ±t (n 2) Formellt t-test av H 0 : β 1 = 0: Testfunktion: t = b 1 s b1 = Jämför med ±t (n 2) b 0 s ( 1 n + b 1s P(xi x) 2 ) P ( x)2 (xi x) 2 Formellt t-test av H 0 : β 1 = B (där B är något annat än 0): Testfunktion: t = b 1 B s b1 = b 1 B s Jämför med ±t (n 2) P(xi x) 2 Vid enkelsidiga mothypotseser jämförs t med t (n 2) [α] Formellt F -test av H 0 : β 1 = 0: Testfunktion: F = MSE MSR = SSR/1 SSE/(n 2) Jämför med F (1,n 2) [α] Multipel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i1 + β 2 x i2 +... + β k x ik + ε i där ε i N(0, σ). Anpassad modell: ŷ = b 0 + b 1 x 1 + b 2 x 2 +... b k x k (eller med -t (n 2) [α] beroende på mothypotesens riktning). II

Kvadratsummor: SST =SSE +SSR Total: SST = (y i ȳ) 2 = y 2 i n (ȳ)2 = y 2 i (P y i) 2 Residual: SSE = (y i ŷ i ) 2 Regression: SSR = (ŷ i ȳ) 2 = SST SSE SSE har n k 1 frihetsgrader, SSR har k frihetsgrader. Variansskattning: σ 2 = s 2 = MSE = Förklaringsgrad: SSE n k 1 R 2 = SSR SST Justerad förklaringsgrad: R 2 adj = R2 = 1 SSE/(n k 1) SST /(n 1) Konfidensintervall och hypotesprövning Stickprovsfördelningar: b j N(β j, σ bj ) Formellt F -test av H 0 : β 1 = β 2 =... = β k = 0: Testfunktion: F = MSE MSR = SSR/k SSE/(n k 1 ) Jämför med F (k,n k 1) [α] Konfidensintervall för β j : b j ± t (n k 1) s bj där s bj hämtas från datorutskrift. Formellt t-test av H 0 : β j = 0: Testfuktion: t = b j s bj Jämför med t (n k 1) Konfidensintervall för µ y0 x 01,...,x 0k : ŷ 0 ± t (n k 1) s Distance value där s = MSE och Distance value (eller s Distance value) bestäms från datorutskrift. Prognosintervall för y 0 : ŷ 0 ± t (n k 1) s 1 + Distance value där s = MSE och Distance value (eller s 1 + Distance value) bestäms från datorutskrift. n III

Partiellt F -test av H 0 : β g+1 =... = β k = 0: Testfunktion: F = (SSE R SSE C )/(k g) SSE C /(n k 1) = (SSR C SSR R )/(k g) SSE C /(n k 1 ) där SSE R =Residualkvadratsumman i den mindre (reducerade) modellen och SSE C =Residualkvadratsumman in den större (kompletta) modellen. Jämför med F (k g,n k 1) [α]. Variance Inflation Factor (VIF): VIF = 1 1 R 2 j där R 2 j =Förklaringsgraden i modell där x j är y-variabel och övriga x-variabler är förklaringsvariabler. Sekventiella kvadratsummor: SSR = SSR(x 1 ) + SSR(x 2 x 1 ) +... + SSR(x k x 1,..., x k 1 ) där SSR(x j x 1,..., x j 1 ) är tillskottet till SSR då variabel x j läggs till en modell med variablerna x 1, x 2,..., x j 1. Ett partiellt F -test av H 0 : β g+1 =... = β k = 0 kan då göras med testfunktionen F = (SSR(x g+1 x 1,..., x g ) + SSR(x g+2 x 1,..., x g+1 ) +... + SSR(x k x 1,..., x k 1 )) /(k g) MSE, Jämför med F (k g,n k 1) [α] förutsatt att variablerna matas in i ordningen x 1, x 2,..., x k i modellen. Exponentiella samband och elasticitetsmodeller: Exponentiell modell: y = β 0 (β 1 ) x δ där log δ N(0, σ) log y = log β 0 + (log β 1 ) x + log δ Anpassad modell: ŷ = b 0 (b 1 ) x där (xi x) (log y log b 1 = i log y) xi log y (xi x) 2 = i n x log y x 2 i n ( x) 2 = = xi log y i (P x i) ( P log y i) n x 2 i (P x i) 2 och log b 0 = log y (log b 1 ) x n Kvadratsummor, variansskattning och test: SST = (log y i log y) 2 = (log y i ) 2 n (log y) 2 = n x i log y i ( x i ) ( log y i ) n [log x 2 i ( x i ) 2 y = n 1 ] log yi SSE = SST (log b 1 ) (x i x) (log y i log y) = SST (log b 1 ) ( x i log y i n x log y) = (log yi ) 2 (log b 0 ) log y i (log b 1 ) x i log y i σ 2 = SSE n 2 Test av H 0 : β 1 = 1 dvs inget samband mellan y och x log β 1 = 0: log b Testfunktion t = 1, jämför med t (n 2) SSE/(n 2) P (xi x) 2 IV

Elasticitetsmodeller: Q = A (P ) EP δ, Q = α (I) EI δ Q = A (P ) EP (I) EI δ log Q = log A + E P log P + log δ log Q = log A + E I log I + log δ log Q = log A + E P log P + E I log I + log δ där log δ N(0, σ) Exempel på anpassad modell: Q = a (P ) d EP, där ÊP = (log Pi log P ) (log Q i log Q) (log Pi log P ) 2 = (log Pi ) (log Q = i ) n log P log Q (log Pi ) 2 n (log P ) 2 och [ log a = log Q ÊP log P log P = 1 n log Pi och log Q = 1 ] n log Qi Kvadratsummor, variansskattning och test: SST = (log Q i log Q) 2 = (log Q i ) 2 n (log Q) 2 SSE = SST ÊP (log P i log P ) (log Q i log Q) = SST ÊP [ (log P i ) (log Q i ) n log P log Q ] = = (log Q i ) 2 (log a) log Q i ÊP (log P i ) (log Q i ) σ 2 = SSE n 2 Test av H 0 : E P = B där B är ett ifrågasatt värde på E P : Testfunktion t = t (n 2) [α]. Index Sammansatta fastbasindex: Ê P B SSE/(n 2), jämför med t (n 2) P (log Pi log P ) 2 och vid enkelsidig mothypotes med t (n 2) [α] I t = i 1,t w 1 + i 2,t w 2 +... + i n,t w n där n är antalet ingående varor/tjänster, i 1,t,..., i n,t är enkla prisindex för ingående varor, alla med basår t 0 och w 1,..., w n väljs enligt ett viktsystem: Laspeyre: w i = Paasche: w i = Kedjeprisindex: p i,t 0 q i,t0 j p j,t 0 q j,t0 p i,t 0 q i,t j p j,t 0 q j,t I t = L 0,1 L 1,2... L t 1,t 100 där L t 1,t = n i=1 p i,t p i,t 1 w i,t 1,t är årslänken från år t 1 till t för n ingående varor/tjänster. w i,t 1,t väljs enligt ett viktsystem: Laspeyre: wi,t 1,t L Försäljningsvärdet för vara i år t 1 = Totala försäljningsvärdet år t 1 Paasche: wi,t 1,t P Försäljningsvärdet för vara i år t i priser för år t 1 = Totala försäljningsvärdet år t i priser för år t 1 Med representantvaror byts Försäljningsvärdet för vara i mot Försäljningsvärdet för varugrupp i i vikterna. Implicitprisindex: eller V

Försäljningsvärdet av varan/tjänsten/gruppen år t i löpande priser I t = Försäljningsvärdet av varan/tjänsten/gruppen år t i basårets priser 100 Relativprisindex: It R = Iv t It 0 100 där It v =Prisindex för aktuell vara/tjänst/grupp och It 0 =Prisindex för den större jämförelsegruppen, t ex KPI. Tidsserieanalys Tidsserieregression: Modell: y t = TR t + SN t + ε t där TR t = β 0 + β 1 t eller TR t = β 0 + β 1 t + β 2 t 2 och SN t = L 1 i=1 β si x si,t med L =Antal säsonger och x si,t = 1 om t tillhör säsong i och = 0 annars. Durbin-Watson s test: Test av H 0 : Residualerna är okorrelerade. n Testfunktion d = t=2 (e t e t 1 ) 2 n t=1 e2 t där e t = y t ŷ t. Jämförelser: Om d < d L,α/2 eller (4 d) < d L,α/2 Förkasta H 0 Om d > d U,α/2 och (4 d) > d U,α/2 Förkasta ej H 0 Om d L,α/2 d d U,α/2 och d L,α/2 (4 d) d U,α/2 Inget uttalande kan ges Komponentuppdelning: Modeller: Multiplikativ modell: y t = TR t SN t CL t IR t Additiv modell: y t = TR t + SN t + CL t + IR t Enkel exponentiell utjämning: Modell: y t = β 0 + ε t Uppdateringsschema för skattning av β 0 : l T = α y T + (1 α) l T 1 0 < α < 1 Prognos: ŷ T +τ (T ) = l T Prognosintervall: l t ± z s 1 + α 2 där z =1.96 för 95% intervall, 2.576 för 99% intervall och s = 1 T 1 T t=1 (y t ȳ) 2 VI

LINKÖPINGS UNIVERSTET Matematiska institutionen Statistik, ANd HSTA72, Regressions- och tidsserieanalys Ekonomprogrammet, t2, Vt 06 Tentamen, svarsblankett HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS SVARSBLANKETT Namn: Pers.nr. Markera ditt svarsalternativ genom att ringa in det. Endast ett svarsalternativ per deluppgift får markeras. Kontrollera att du har markerat i alla deluppgifter du har besvarat! Uppgift 2 (a) (i) (ii) (iii) (iv) (v) (b) (c) 1 Teststorhetens värde blir 1.0, H 0 förkastas ej 2 Teststorhetens värde blir 7.8, H 0 förkastas 3 Teststorhetens värde blir 3009.7, H 0 förkastas 4 Teststorhetens värde blir 1.7, H 0 förkastas ej 5 Teststorhetens värde blir 1288.6, H 0 förkastas 1 Modell 21 har högst värde på R 2 adj. Modell 5 skall väljas enligt C p måttet. 2 Modell 13 har högst värde på R 2 adj. Modell 9 skall väljas enligt C p måttet. 3 Modell 7 har högst värde på R 2 adj. Modell 2 skall väljas enligt C p måttet. 4 Modell 7 har högst värde på R 2 adj. Modell 9 skall väljas enligt C p måttet. 5 Modell 13 har högst värde på R 2 adj. Modell 5 skall väljas enligt C p måttet. 6 Modell 21 har högst värde på R 2 adj. Modell 2 skall väljas enligt C p måttet. (d) (i) (ii) (iii) (iv) (v) (vi) (e) (i) (ii) (iii) (iv) (v) (f) 1 (7.585, 7.594) 2 (3.827, 11.351) 3 (7.579, 7.600) 4 (7.571, 7.607) 5 (7.584, 7.595) 6 (4.582, 9.597) i

Namn: Pers.nr. Uppgift 3 (a) 1 Minskning med 0.34% 2 Ökning med 0.34% 3 Minskning med 0.05% 4 Ökning med 0.05% 5 Minskning med 0.26% 6 Ökning med 0.26% (b) 1 Relativ minskning med 3.80% 2 Relativ ökning med 3.80% 3 Relativ minskning med 3.67% 4 Relativ ökning med 3.67% 5 Relativ minskning med 0.27% 6 Relativ ökning med 0.27% Uppgift 4 (a) 1 Teststorhetens värde blir 12.11, Testet är ej signifikant. 2 Teststorhetens värde blir 13.48, Testet är signifikant. 3 Teststorhetens värde blir 2.75, Testet är ej signifikant. 4 Teststorhetens värde blir 964.7, Testet är signifikant. 5 Teststorhetens värde blir 181.7, Testet är ej signifikant. 6 Teststorhetens värde blir 55.58, Testet är signifikant. (b) 1 (0.856, 0.864) 2 (0.858, 0.862) 3 (7.174, 7.318) 4 (7.213, 7.278) 5 (0.997, 0.998) 6 (6.241, 8.250) Uppgift 5 (a) (i) (ii) (iii) (iv) (v) (b) 1 Winters additiva metod; prognosvärde: 40477.6 2 Winters multiplikativa metod; prognosvärde: 40477.6 3 Winters additiva metod; prognosvärde: 40092.4 4 Winters multiplikativa metod; prognosvärde: 40992.4 5 Dubbel exponentiell utjämning; prognosvärde: 40477.6 6 Dubbel exponentiell utjämning; prognosvärde: 40992.4 ii