LINKÖPINGS UNIVERSITET 73G71 Statistik B, 8 hp Institutionen för datavetenskap Civilekonomprogrammet, t 3 Avdelningen för Statistik/ANd HT 009 Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanals, 3:uppl. Uppgift.1 A. Väljs 00 års sjukskrivingsdata istället för 001 års och -variabeln 4, 3,, 0,, 4 erhålls den skattade modellen ˆ = 3.9 + 3. 9 Väljs åldersklassmitt (, 7, 3, 37, 4, 47, 5, 57, 6) som direkt -variabel erhålls: för 001 års data modellen: ˆ = 4.13 + 0. 91 och för 00 års data modellen: ˆ = 0.48 + 0. 77 B. Genomsnittligt antal sjukdagar ökar 001 med 4.6 (4.56) dagar när åldersklassen ökar med en enhet eller med 0.91 dagar när åldern ökar med 5 år. Genomsnittligt antal sjukdagar ökar 00 med 3.9 (3.86) dagar när åldersklassen ökar med en enhet eller med 0.77 dagar när åldern ökar med 5 år. Uppgift.6 Det framgår egentligen inte vad som skall vara och i uppgiften. Vill man anpassa en modell där temperaturen förklaras av luftfuktigheten blir den istället ˆ = 16.3 + 0. 37 Uppgift.1 Facit är helt felaktigt. Följande svar är korrekta: A. ˆ = 1618.1+ 658. 6 För en ett år äldre traktor är den årliga underhållskostnaden i genomsnitt 659 kronor högre. B. b t s = 658.6 ±.131 178.0 658.6 ± 379.3 = ( 79.3,1037.9) ± b C. prognos: = 1618.1+ 658.6 5 = 4911. 1 pr 95% prognosintervall: ± t pr s pr 4911.1± 3150.0 = = 4911.1±.131 1417.40 ( 1761.1, 8061.1) 1+ 1 17 + ( 5 3.647) 63.68
Uppgift 3. Facit har korrekta svar, men i uträkningen av R i B-uppgiften ser det ut som att man har använt sig av värdet 3 istället för 36 som medelvärde hos. Det har man dock inte gjort i uträkningen. Uppgift 3.8 Facit innehåller i och för sig inga fel, men den figur som ges i A kan inte användas för att illustrera den tolkning som ges i B. Tolkningen i B utgår från att en modell har anpassats med tillägg av en dummvariabel för bolagstp. Anpassningen är dock gjord utan samspelsterm vilket skapar parallella regressionslinjer ur tolkningssnvinkel. Regressionslinjerna i A är däremot separat anpassade till de två bolagstperna och de är inte parallella. De reflekterar mer de linjer man skulle kunna ha tolkat ut om anpassningen med dummvariabel gjorts med en samspelsterm. Uppgift 3.10 Den modell vi skall använda är = 0 1 1 β + β + ε Facit ger värden på b 0 och b 1 som motsvarar att / 1 anges i kronor per person medan fortfarande ges i 100 000-tals kronor.. Om man använder data rakt av, dvs. struntar i att det är miljontals kronor för, 100 000 tals personer för 1 resp. 10000-tals kronor för så får man i 1i = 9.97949, i = 34, i 1i = 13.48874, ( i ) = 181.58, i i = 40.91116 1i vilket ger värdena b 0 =1.419 och b 1 = 0.04049 Ni ser att det är samma siffror som förekommer men de är en tiondedel lägre. Räknar man om alla värden till enskilda kronor och personer så blir koefficienterna b 0 =14.19 och b 1 = 0.00004049. Uppgift 3.11 Inget fel i facit, men i uppgiften har man angett modellen = β 11 + β + ε, och sedan analserat modellen = β 0 + β11 + β + ε. Utgå alltså från den andra modellen och inte den första. Uppgift 3.13 Facit saknas här och anledningen är väl att detta är en tpisk diskussionsuppgift utan något tdligt svar. Funderingarna bör dock ligga runt två saker: (i) Är det troligt att TOMT skulle bli signifikant i modellen? (ii) Kan sambandet mellan TOMT och PRIS i huvudsak täckas upp av övriga variabler?
Uppgift 4.1 Kurvan C i facits diagram stämmer inte riktigt med = 3. Istället har funktionen = ( 3 )/10 ritats in. Detta har väl gjorts för att kurvorna skall kunna ses i samma diagram, men man borde ha upplst om detta. Uppgift 4.7 I uppgiften står det tre situationer, men det skall vara två. Det är ingen situation som är gömd någonstans. Uppgift 4.10 Om man istället använder årtal direkt som tidsvariabel får man den anpassade modellen ˆ = 10 153.754 1.195 årtal Denna modell är förstås opraktisk att använda sig av då startvärdet är så litet att det lätt blir kalklfel när det skall användas. Observera dock att valet av tidsvariabel i detta fall inte har någon betdelse för tillvätfaktorns värde. Så blir det så länge vi bara drar bort ett konstant värde, som i detta fall 00. Om vi däremot (som t.e. föreslås i uppgift 4.1) också gör en multiplikation eller division med ett konstant värde så påverkas även tillvätfaktorn eftersom den då relaterar till en annan skala på tidsaeln. Uppgift 4.1 Facits värden stämmer inte så bra överens med de data som finns i uppgiften. Endera har man använt sig av avrundningar i beräkningarnas mellanled, eller så har man använt befolkningstal med fler decimaler. Med facits transformation av årtalet, dvs. med t = (årtal 1900)/10 blir den anpassade modellen: ˆ = 4.8347 1. 06950 t Om man istället använder årtalen direkt som t får man ˆ = 0.0000144 1.006718 årtal ˆ 000 När det gäller prognosen anser man att det är bättre att användas sig av = * b Man tänker sig då att befolkningsutvecklingen följer en tillvätmodell med en bestämd tillvätfaktor som är just värdet på b. Med facits värden är då den 10-åriga tillväten 6.8717%. Istället för att utgå från 1850 års befolkning som startvärde, tillämpar denna tillvätmodell på det senast registrerade värdet som är för 000. Prognosen blir då med facits värden ˆ = 8.88 1.068717 1 9.490
Observera att ettan i eponenten relaterar till att tiden mäts i perioder av 10 år. Detta har man åstadkommit genom divisionen med 10 när man har skapat t enligt ovan. Däremot har subtraktionen med 1900 ingen inverkan på detta. Den delen påverkar bara värdet hos a (eller b 0 ) Om vi istället använder de värden vi fått i anpassningen ovan blir prognosberäkningarna ˆ = 8.88 1.06950 1 9.495 med användande av tid i 10-årsperioder och ˆ = 8.88 1.006718 10 9.495 med användande av tid i successiva år Observera att de sista två modellerna i teorin ger identiska svar men det kan bli vissa skillnader p.g.a. avrundningar när koefficienterna bestäms
Uppgift 5.10 Använder man År direkt som tidsvariabel får man den anpassade modellen Lägenheter = 115811 + 1061År (Observera att det bara är konstanten (interceptet) som ändras när man ändrar på t-variabeln (År) på det här sättet. Hade vi däremot också dividerat År med någonting så hade även lutningsparametern ändrats.) Uppgift 5.11 Det kan vara en fördel att göra ett diagram över de olika serierna: Uppgift 5.1 A. Konstanten (interceptet) skall vara 4.01 och inte 4.01. B. Prognosintervallet är snarare 18 < < 4