Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Betygsgränser: Tentamen omfattar totalt 20p. Godkänt från 12p, väl godkänt från 16p. Siffrorna i uppgifterna är delvis påhittade. Redovisa och motivera tydligt alla dina lösningar! Uppgift 1 (6p) I ett slumpmässigt urval av 9 stycken företag samlade fackförbundet Ringen bland annat in information om månadslön för den verkställande direktören (lön i tusentals kronor) och värdet på lönsamhetsmåttet Return On Equity (ROE) för respektive företag. Detta gav följande tabell: Företag Lön ROE 1 330 15 2 411 22 3 372 13 4 402 25 5 300 12 6 345 15 7 249 13 8 282 14 9 336 17 a) Beräkna ett 99 %-igt konfidensintervall för lutningen i en linjär regressionsmodell där lönerna för de verkställande direktörerna antas bero på företagens lönsamhet. Använd SSE = 9915. Tolka konfidensintervallet i ord. (4p) b) Beräkna förklaringsgraden i denna linjära regressionsmodell med hjälp av korrelationskoefficienten. Tolka både korrelationskoefficienten och förklaringsgraden i ord. (2p) 1
Uppgift 2 (4p) Ett verkstadsföretag redovisar följande priser och försäljningsvärden för sina produkter under åren 2013-2015 (notera att produkt B inte såldes år 2013): År Produkt A Produkt B Pris/st (kr) Försäljningsvärde (i miljontals kronor) Pris/st (kr) Försäljningsvärde (i miljontals kronor) 2013 86 8.2 2014 90 7.5 127 5.8 2015 92 8.9 132 6.4 a) Beräkna ett enkelt prisindex för produkt A med 2015 som basår. (1p) b) Beräkna ett kedjeindex för företagets produkter med Laspeyres viktsystem. Använd 2013 som basår. (3p) Uppgift 3 (6p) I ett utökat nytt slumpmässigt urval av 20 stycken företag samlade fackförbundet Ringen även in (förutom de verkställande direktörernas lön och företagens ROE) information om respektive företag tillhörde bransch A (kodad till värdet 0 för variabeln Bransch) eller bransch B (kodad till värdet 1 för variabeln Bransch). Detta gav följande resultat för två multipla linjära regressionsmodeller: MODELL 1: Regression Analysis: Lön versus ROE; Bransch Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 2 45022 22511,2 19,87 0,000 ROE 1 Bransch 1 Error 17 19262 1133,1 Lack-of-Fit 10 Pure Error 7 Total 19 64284 Model Summary S R-sq R-sq(adj) R-sq(pred) 33,6608 70,04% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 192,3 31,5 ROE 10,49 1,81 Bransch -39,1 15,4 2
MODELL 2: Regression Analysis: Lön versus ROE; Bransch; ROE*Bransch Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 3 45089,6 15029,9 12,53 0,000 ROE 1 Bransch 1 ROE*Bransch 1 Error 16 19194,6 1199,7 Lack-of-Fit 9 Pure Error 7 Total 19 64284,2 Model Summary S R-sq R-sq(adj) R-sq(pred) 34,6362 70,14% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 179,4 63,3 ROE 11,28 3,85 Bransch -22,3 72,8 ROE*Bransch -1,04 4,40 a) Redovisa den skattade regressionsekvationen för bransch B i modell 2. (1p) b) Testa på 5 % signifikansnivå om företagens branschinformation signifikant bidrar till att förklara de verkställande direktörernas löner i modell 1. Dra fullständig slutsats av ditt test i ord. (2p) c) Beräkna en prognos i modell 1 för en verkställande direktörs lön och ett tillhörande 95%-igt prognosintervall i ett företag i bransch A med ROE = 15. Distance value = 0.129. (2p) d) Vilken modell är bäst utifrån utskrifterna ovan? Vad ger detta för information om interaktionen mellan förklaringsvariablerna Bransch och ROE? Motivera. (1p) Uppgift 4 (4p) Hushållens nettosparande i miljontals kronor samlas in kvartalsvis av statistiska centralbyrån för varje år. Nedan presenteras resultaten av klassisk komponentuppdelning, enkel exponentiell utjämning och Holt-Winters metod från Minitab fr.o.m. kvartal 1 år 1980 t.o.m. kvartal 4 år 2005. 3
Time Series Decomposition for Nettosparande Additive Model Data Nettosparande Length 104 NMissing 0 Fitted Trend Equation Yt = -738 + 180,6 t Seasonal Indices Period Index 1-2897,8 2 16792,5 3 2297,0 4-16191,7 Accuracy Measures MAPE 395 MAD 6342 MSD 60521598 4
a) Rangordna metoderna utifrån vilka metoder som verkar anpassa data bäst. Motivera. (1p) b) Tolka säsongskomponenten för kvartal 4 i ord i den klassiska komponentuppdelningen. (1p) c) Beräkna en prognos för kvartal 1 år 2006 med hjälp av den klassiska komponentuppdelningen. Tolka prognosen i ord. (1p) d) Ge en ungefärlig prognos för kvartal 1 år 2006 med hjälp av den enkla exponentiella utjämningen. (1p) 5