STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Relevanta dokument
Tidsserier. Data. Vi har tittat på två typer av data

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

F11. Kvantitativa prognostekniker

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F8

Höftledsdysplasi hos dansk-svensk gårdshund

TENTAMEN I STATISTIK B,

10.1 Enkel linjär regression

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Finansiell statistik. Multipel regression. 4 maj 2011

Regressions- och Tidsserieanalys - F4

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Multipel Regressionsmodellen

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

Laboration 2 multipel linjär regression

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Facit till Extra övningsuppgifter

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Tentamen Tillämpad statistik A5 (15hp)

Tidsserier, forts från F16 F17. Tidsserier Säsongrensning

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen Tillämpad statistik A5 (15hp)

TENTAMEN I MATEMATISK STATISTIK

Regressions- och Tidsserieanalys - F3

Tentamen Tillämpad statistik A5 (15hp)

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Statistisk försöksplanering

TAMS65 - Seminarium 4 Regressionsanalys

STOCKHOLMS UNIVERSITET VT 2008 Statistiska institutionen Linda Wänström

Matematisk statistik, Föreläsning 5

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressionsanalys av lägenhetspriser i Spånga

Regressions- och Tidsserieanalys - F3

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Skrivning i ekonometri torsdagen den 8 februari 2007

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Statistik B Regressions- och tidsserieanalys Föreläsning 1

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Tentamen för kursen. Linjära statistiska modeller. 22 februari

TENTAMEN I MATEMATISK STATISTIK

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen Tillämpad statistik A5 (15hp)

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Regressions- och Tidsserieanalys - F3

LABORATION 3 - Regressionsanalys

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Tillämpad statistik (A5), HT15 Föreläsning 22: Tidsserieanalys I

Föreläsning G60 Statistiska metoder

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Linjär regressionsanalys. Wieland Wermke

F13 Regression och problemlösning

Matematisk statistik för D, I, Π och Fysiker

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Statistisk försöksplanering

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Föreläsning 12: Linjär regression

Tentamensgenomgång och återlämning: Måndagen 9/6 kl12.00 i B413. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

REGRESSIONSANALYS. Exempel från F6. Statistiska institutionen, Stockholms universitet 1/11

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

OBS! Vi har nya rutiner.

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Föreläsning 13: Multipel Regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Läs noggrant informationen nedan innan du börjar skriva tentamen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Tentamen Tillämpad statistik A5 (15hp)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Föreläsning G60 Statistiska metoder

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

Skrivning i ekonometri lördagen den 29 mars 2008

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Transkript:

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består av fem uppgifter. Uppgifterna ger totalt 50 poäng tillsammans. För full poäng på en uppgift krävs tydliga, utförliga och väl motiverade lösningar. Lycka till! Uppgift 1. (10 poäng) En ekonom ville undersöka sambandet mellan inkomst och sparande och antog följande modell: y = α + β x + ε där x motsvarar månadsinkomst (i 1000-tals kr.) och y motsvarar månadssparande (i 1000-tals kr.). Följande uppgifter erhölls från 10 personer: x y 25 1 43 5 36 2 49 10 37 3 35 6 41 3 38 4 30 2 17 1 a) Skatta modellen. b) Tolka parameterskattningarna. c) Testa på 5% signifikansnivå om β är skild från 0. Vad är din slutsats?

Uppgift 2. (15 poäng) En mäklare vill planera försäljningen av villor. Hon samlar in uppgifter om försäljning, y (milj. kr), folkmängd, x 1 (100 000 pers.) och annonsvolym, x 2 (10 000 kr) i 11 distrikt. Hon funderar på tre möjliga modeller: Modell 1: y = α + β 1 x 1 + β 2 x 2 + ε Modell 2: y = α + β 1x 1 + ε Modell 3: y = α + β 2x 2 + ε I BILAGAN ges SAS-utskrifter inklusive residualplottar (plot mellan skattade y-värden och standardiserade residualer samt histogram för standardiserade residualer) från analyser av respektive modell. a) Fyll i de uppgifter som saknas för modell 1 i utskriften, dvs ersätt de 13 frågetecknen i bilagan. Skriv in dina svar på SÄRSKILT INLÄMNINGBLAD. b) Vad är korrelationen mellan försäljning och folkmängd? c) Vilken modell (modell 1, 2 eller 3) skulle du rekommendera att mäklaren använder? Motivera. d) Tolka parameterskattningarna i den modell du valt i c) ovan. e) Gör en prognos för försäljningen i ett distrikt med folkmängd 500 000 samt annonsvolym 50 000 (använd här endast de uppgifter som är relevanta för ditt val av modell i c). f) Finns det fog att ifrågasätta den valda modellen? Motivera ditt svar. Uppgift 3. (5 poäng) Heteroskedasticitet (icke-konstant varians) är något som ibland är ett problem i samband med linjär regression. a) Vad menas med begreppet heteroskedasticitet (icke-konstant varians)? Ge ett exempel. b) Hur kan man upptäcka heteroskedasticitet? c) Kan heteroskedasticitet förekomma vid både enkel och multipel linjär regression? Motivera.

Uppgift 4. (10 poäng) Följande data visar vinsten (i milj kr) för ett visst företag mellan åren 2000 och 2004. År 2000 2001 2002 2003 2004 Vinst 6 8 11 14 19 Antag att vinsten följer en exponentialfunktion och skatta en lämplig modell. a) Ange den skattade regressionsekvationen. b) Hur stor har den genomsnittliga årliga procentuella vinstökningen varit under perioden enligt modellen? c) Gör en prognos över vinsten år 2008. d) Antag att någon istället föreslår att du ska skatta ett polynom av andra graden (en andragradsfunktion). Du erhåller y = 5 + 0.63 t + 0.43 t 2, där t = 1, 2,, 5. Kan man utifrån denna ekvation uttala sig om vad den årliga genomsnittliga vinstökningen är? Varför/varför inte?

Uppgift 5. (10 poäng) Följande tabell visar försäljningen (i 1000-tal) av en viss vara varje kvartal mellan 2005 och 2007. År Kvartal1 Kvartal2 Kvartal3 Kvartal4 2005 11 13 9 15 2006 12 14 8 18 2007 13 16 7 21 a) Plotta försäljningen över tid i ett lämpligt diagram. Kommentera utvecklingen. b) Bör man använda en additiv eller multiplikativ modell för att uppskatta säsongkomponenter till materialet ovan? Motivera. c) Antag att vi vill använda regressionsanalys för att uppskatta trendkomponent och säsongkomponenter. Antag också att vi har bestämt oss för att skatta en additiv modell. Ett första steg är att skatta en multipel linjär regressionsmodell som innehåller dummyvariabler. Skriv upp denna modell samt definiera variablerna i modellen. e) Antag att vi också vill skatta en multiplikativ modell med hjälp av regressionsanalys. Vi kan således få prognoser både från vår additiva samt vår multiplikativa modell. Beskriv en metod vi kan använda för att statistiskt jämföra prognoserna från de två modellerna. Illustrera gärna med hjälp av formel. f) Finns det någon annan metod (vilken?), förutom regressionsansatsen, vi skulle kunna använda för att säsongrensa datamaterialet? Beskriv eventuella för- och nackdelar med att använda regressionsanalys jämfört med den andra metoden.

BILAGA Modell 1 Beroendevariabel: y Antal lästa observationer 11 Antal använda observationer 11 Variansanalys Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Modell??? 28.04 0.0002 Fel??? Korrigerad total? 67.92727 Rot MSE? R-kvadrat? Beroende medel 5.74545 Just. R-kvadr.? Koeff.var. 17.91927 Parameterskattningar Parameter- Standard- Variations- Variabel DF skattning fel t-värde Pr > t inflation Skärning 1? 0.78426 0.86 0.4137 0 x1 1 0.68849? 2.23 0.0561 5.82664 x2 1 0.34150 0.36737? 0.3798 5.82664

6 5 Frequency 4 3 2 1 0-1 0 1 2 3 4 Standardiserad residual 5 6

Modell 2 Beroendevariabel: y Antal lästa observationer 11 Antal använda observationer 11 Variansanalys Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1 58.53168 58.53168 56.07 <.0001 Fel 9 9.39559 1.04395 Korrigerad total 10 67.92727 Rot MSE 1.02174 R-kvadrat 0.8617 Beroende medel 5.74545 Just. R-kvadr. 0.8463 Koeff.var. 17.78347 Parameterskattningar Parameter- Standard- Variations- Variabel DF skattning fel t-värde Pr > t inflation Skärning 1 0.98117 0.70693 1.39 0.1986 0 x1 1 0.94941 0.12679 7.49 <.0001 1.00000

3,0 2,5 Frequency 2,0 1,5 1,0 0,5 0,0-1,2 0,0 1,2 2,4 Standardiserad residual 3,6

Modell 3 Beroendevariabel: y Antal lästa observationer 11 Antal använda observationer 11 Variansanalys Summa av Medel- Källa DF kvadrater kvadrat F-värde Sh. > F Modell 1 54.16485 54.16485 35.42 0.0002 Fel 9 13.76242 1.52916 Korrigerad total 10 67.92727 Rot MSE 1.23659 R-kvadrat 0.7974 Beroende medel 5.74545 Just. R-kvadr. 0.7749 Koeff.var. 21.52295 Parameterskattningar Parameter- Standard- Variations- Variabel DF skattning fel t-värde Pr > t inflation Skärning 1 0.60244 0.94115 0.64 0.5381 0 x2 1 1.08795 0.18280 5.95 0.0002 1.00000

Histogram of Standardiserad residual 5 4 Frequency 3 2 1 0-1,2 0,0 1,2 2,4 Standardiserad residual 3,6