Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl.

Relevanta dokument
Facit till Extra övningsuppgifter

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Datorövning 5 Exponentiella modeller och elasticitetssamband

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

ÖVNINGSUPPGIFTER KAPITEL 7

Laboration 3. Funktioner, vektorer, integraler och felskattning

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Föreläsning G60 Statistiska metoder

Kompletterande lösningsförslag och ledningar, Matematik 3000 kurs B, kapitel 2

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Prov 1 2. Ellips 12 Numeriska och algebraiska metoder lösningar till övningsproven uppdaterad a) i) Nollställen för polynomet 2x 2 3x 1:

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Tillämpad statistik (A5), HT15 Föreläsning 24: Tidsserieanalys III

LAB 1. FELANALYS. 1 Inledning. 2 Flyttal. 1.1 Innehåll. 2.1 Avrundningsenheten, µ, och maskinepsilon, ε M

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

LABORATION 3 - Regressionsanalys

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

FACIT (korrekta svar i röd fetstil)

LABORATION 3 - Regressionsanalys

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

import totalt, mkr index 85,23 100,00 107,36 103,76

F11. Kvantitativa prognostekniker

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Laboration 3. Funktioner, vektorer, integraler och felskattning

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Matematisk statistik, Föreläsning 5

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Säsongrensning i tidsserier.

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

TVM-Matematik Adam Jonsson

Demografisk rapport 2014:10. Prognosmetoder och modeller. Regressionsanalys. Befolkningsprognos /45

InStat Exempel 4 Korrelation och Regression

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Faktorer som påverkar befolkningstillväxten av unga individer i olika kommuntyper

tentaplugg.nu av studenter för studenter

Regressions- och Tidsserieanalys - F1

Företagsklimatet viktigt för ungas val av kommun. Johan Kreicbergs April 2009

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Regressions- och Tidsserieanalys - F1

F7 Polynomregression och Dummyvariabler

ÖVNINGSUPPGIFTER KAPITEL 9

Modellutveckling 2016: Regressionsmodellen för inrikes inflyttning

Den räta linjens ekvation

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen Tillämpad statistik A5 (15hp)

Den räta linjens ekvation

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Fråga nr a b c d 2 D

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Regression med Genetiska Algoritmer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Befolkningsprognos

Datorövning 1 Enkel linjär regressionsanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Sammanfattningar Matematikboken X

Arbetsblad 1:1. Tiondelar på tallinjen 0,1 0,5 0,9 0,2 0,8 0,3 0,8 1,1 1,5 1,6 2,1 2,4 1,1 1,4 2,6 3,2 3,8

Arbetsblad 1:1. Tiondelar på tallinjen 0,9 1,1 0,8. 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4

Arbetsblad 1:1. Tiondelar på tallinjen. 6 Sätt ut pilar som pekar på talen: A = 0,3 B = 0,8 C = 1,4

Räkneövning 4. Om uppgifterna. 1 Uppgift 1. Statistiska institutionen Uppsala universitet. 14 december 2016

Grundläggande statistik kurs 1

ÖVNINGSUPPGIFTER KAPITEL 9

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

F13 Regression och problemlösning

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Metod och teori. Statistik för naturvetare Umeå universitet

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Tentamen Tillämpad statistik A5 (15hp)

16. Max 2/0/ Max 3/0/0

Multipel Regressionsmodellen

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Sänkningen av parasitnivåerna i blodet

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Läs noggrant informationen nedan innan du börjar skriva tentamen

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Valresultat Riksdagen 2018

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Grundläggande matematisk statistik

Vad Betyder måtten MAPE, MAD och MSD?

Bilaga 6 till rapport 1 (5)

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Transkript:

LINKÖPINGS UNIVERSITET 73G71 Statistik B, 8 hp Institutionen för datavetenskap Civilekonomprogrammet, t 3 Avdelningen för Statistik/ANd HT 009 Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanals, 3:uppl. Uppgift.1 A. Väljs 00 års sjukskrivingsdata istället för 001 års och -variabeln 4, 3,, 0,, 4 erhålls den skattade modellen ˆ = 3.9 + 3. 9 Väljs åldersklassmitt (, 7, 3, 37, 4, 47, 5, 57, 6) som direkt -variabel erhålls: för 001 års data modellen: ˆ = 4.13 + 0. 91 och för 00 års data modellen: ˆ = 0.48 + 0. 77 B. Genomsnittligt antal sjukdagar ökar 001 med 4.6 (4.56) dagar när åldersklassen ökar med en enhet eller med 0.91 dagar när åldern ökar med 5 år. Genomsnittligt antal sjukdagar ökar 00 med 3.9 (3.86) dagar när åldersklassen ökar med en enhet eller med 0.77 dagar när åldern ökar med 5 år. Uppgift.6 Det framgår egentligen inte vad som skall vara och i uppgiften. Vill man anpassa en modell där temperaturen förklaras av luftfuktigheten blir den istället ˆ = 16.3 + 0. 37 Uppgift.1 Facit är helt felaktigt. Följande svar är korrekta: A. ˆ = 1618.1+ 658. 6 För en ett år äldre traktor är den årliga underhållskostnaden i genomsnitt 659 kronor högre. B. b t s = 658.6 ±.131 178.0 658.6 ± 379.3 = ( 79.3,1037.9) ± b C. prognos: = 1618.1+ 658.6 5 = 4911. 1 pr 95% prognosintervall: ± t pr s pr 4911.1± 3150.0 = = 4911.1±.131 1417.40 ( 1761.1, 8061.1) 1+ 1 17 + ( 5 3.647) 63.68

Uppgift 3. Facit har korrekta svar, men i uträkningen av R i B-uppgiften ser det ut som att man har använt sig av värdet 3 istället för 36 som medelvärde hos. Det har man dock inte gjort i uträkningen. Uppgift 3.8 Facit innehåller i och för sig inga fel, men den figur som ges i A kan inte användas för att illustrera den tolkning som ges i B. Tolkningen i B utgår från att en modell har anpassats med tillägg av en dummvariabel för bolagstp. Anpassningen är dock gjord utan samspelsterm vilket skapar parallella regressionslinjer ur tolkningssnvinkel. Regressionslinjerna i A är däremot separat anpassade till de två bolagstperna och de är inte parallella. De reflekterar mer de linjer man skulle kunna ha tolkat ut om anpassningen med dummvariabel gjorts med en samspelsterm. Uppgift 3.10 Den modell vi skall använda är = 0 1 1 β + β + ε Facit ger värden på b 0 och b 1 som motsvarar att / 1 anges i kronor per person medan fortfarande ges i 100 000-tals kronor.. Om man använder data rakt av, dvs. struntar i att det är miljontals kronor för, 100 000 tals personer för 1 resp. 10000-tals kronor för så får man i 1i = 9.97949, i = 34, i 1i = 13.48874, ( i ) = 181.58, i i = 40.91116 1i vilket ger värdena b 0 =1.419 och b 1 = 0.04049 Ni ser att det är samma siffror som förekommer men de är en tiondedel lägre. Räknar man om alla värden till enskilda kronor och personer så blir koefficienterna b 0 =14.19 och b 1 = 0.00004049. Uppgift 3.11 Inget fel i facit, men i uppgiften har man angett modellen = β 11 + β + ε, och sedan analserat modellen = β 0 + β11 + β + ε. Utgå alltså från den andra modellen och inte den första. Uppgift 3.13 Facit saknas här och anledningen är väl att detta är en tpisk diskussionsuppgift utan något tdligt svar. Funderingarna bör dock ligga runt två saker: (i) Är det troligt att TOMT skulle bli signifikant i modellen? (ii) Kan sambandet mellan TOMT och PRIS i huvudsak täckas upp av övriga variabler?

Uppgift 4.1 Kurvan C i facits diagram stämmer inte riktigt med = 3. Istället har funktionen = ( 3 )/10 ritats in. Detta har väl gjorts för att kurvorna skall kunna ses i samma diagram, men man borde ha upplst om detta. Uppgift 4.7 I uppgiften står det tre situationer, men det skall vara två. Det är ingen situation som är gömd någonstans. Uppgift 4.10 Om man istället använder årtal direkt som tidsvariabel får man den anpassade modellen ˆ = 10 153.754 1.195 årtal Denna modell är förstås opraktisk att använda sig av då startvärdet är så litet att det lätt blir kalklfel när det skall användas. Observera dock att valet av tidsvariabel i detta fall inte har någon betdelse för tillvätfaktorns värde. Så blir det så länge vi bara drar bort ett konstant värde, som i detta fall 00. Om vi däremot (som t.e. föreslås i uppgift 4.1) också gör en multiplikation eller division med ett konstant värde så påverkas även tillvätfaktorn eftersom den då relaterar till en annan skala på tidsaeln. Uppgift 4.1 Facits värden stämmer inte så bra överens med de data som finns i uppgiften. Endera har man använt sig av avrundningar i beräkningarnas mellanled, eller så har man använt befolkningstal med fler decimaler. Med facits transformation av årtalet, dvs. med t = (årtal 1900)/10 blir den anpassade modellen: ˆ = 4.8347 1. 06950 t Om man istället använder årtalen direkt som t får man ˆ = 0.0000144 1.006718 årtal ˆ 000 När det gäller prognosen anser man att det är bättre att användas sig av = * b Man tänker sig då att befolkningsutvecklingen följer en tillvätmodell med en bestämd tillvätfaktor som är just värdet på b. Med facits värden är då den 10-åriga tillväten 6.8717%. Istället för att utgå från 1850 års befolkning som startvärde, tillämpar denna tillvätmodell på det senast registrerade värdet som är för 000. Prognosen blir då med facits värden ˆ = 8.88 1.068717 1 9.490

Observera att ettan i eponenten relaterar till att tiden mäts i perioder av 10 år. Detta har man åstadkommit genom divisionen med 10 när man har skapat t enligt ovan. Däremot har subtraktionen med 1900 ingen inverkan på detta. Den delen påverkar bara värdet hos a (eller b 0 ) Om vi istället använder de värden vi fått i anpassningen ovan blir prognosberäkningarna ˆ = 8.88 1.06950 1 9.495 med användande av tid i 10-årsperioder och ˆ = 8.88 1.006718 10 9.495 med användande av tid i successiva år Observera att de sista två modellerna i teorin ger identiska svar men det kan bli vissa skillnader p.g.a. avrundningar när koefficienterna bestäms

Uppgift 5.10 Använder man År direkt som tidsvariabel får man den anpassade modellen Lägenheter = 115811 + 1061År (Observera att det bara är konstanten (interceptet) som ändras när man ändrar på t-variabeln (År) på det här sättet. Hade vi däremot också dividerat År med någonting så hade även lutningsparametern ändrats.) Uppgift 5.11 Det kan vara en fördel att göra ett diagram över de olika serierna: Uppgift 5.1 A. Konstanten (interceptet) skall vara 4.01 och inte 4.01. B. Prognosintervallet är snarare 18 < < 4