sociology Unit B1: Introduction to correlation and regression 3/3 Brendan Halpin May

Relevanta dokument
Öppnar jämförelser för ökad kvalitet i vård och omsorg om äldre? Bilaga Regressionsanalyser

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Exempel 1 på multipelregression

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

10.1 Enkel linjär regression

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

8.1 General factorial experiments

Skrivning i ekonometri torsdagen den 8 februari 2007

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Regressions- och Tidsserieanalys - F3

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Skrivning i ekonometri lördagen den 25 augusti 2007

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Exempel 1 på multipelregression

Regressions- och Tidsserieanalys - F3

Skrivning i ekonometri lördagen den 29 mars 2008

Regressions- och Tidsserieanalys - F4

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F5

Räkneövning 3 Variansanalys

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Del A: Schema för ifyllande av svar nns på sista sidan

Regressions- och Tidsserieanalys - F3

TENTAMEN I MATEMATISK STATISTIK

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Skrivning i ekonometri lördagen den 15 januari 2005

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Regressions- och Tidsserieanalys - F1

Uppgift a b c d e f (vet ej) Poäng

Tentamen Tillämpad statistik A5 (15hp)

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Tentamen i matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Metod och teori. Statistik för naturvetare Umeå universitet

F7 Polynomregression och Dummyvariabler

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Sänkt restaurangmoms Hur många jobb skapades?

Regressions- och Tidsserieanalys - F7

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Multipel Regressionsmodellen

TENTAMEN I STATISTIK B,

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Samhällsvetenskaplig metod, 7,5 hp

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

7.5 Experiment with a single factor having more than two levels

OBS! Vi har nya rutiner.

7.5 Experiment with a single factor having more than two levels

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Tentamen Tillämpad statistik A5 (15hp)

Hjärtsjukvårdens Nationella Kvalitetsregister. Per Albertsson. Ordförande Sektorsrådet i Hjärtsjukvård

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Tentamen i matematisk statistik

Lösningar till SPSS-övning: Analytisk statistik

Tentamen i Statistik, STA A11/STA A14 (8 poäng) 25 augusti 2004, klockan

Tentamen i matematisk statistik

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

Tentamen i matematisk statistik

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Spelar risktoleransen någon roll?

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Tentamen i Matematisk statistik Kurskod S0001M

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 44 poäng.

Examinationsuppgifter del 2

Uppgift a b c d e f (vet ej) Poäng

Laboration 2 multipel linjär regression

Kom igång med Stata. Introduktion

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson

Värderingsrapport. VLT AB:s deltagande i strukturaffären Stockholm den 26 maj 2008

OBS! Vi har nya rutiner.

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Standard Normal Quantiles. Vilken av följande slutsatser kan man dra från qq-plotten?

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Transkript:

Unit B1: Introduction to correlation and regression 3/3 Brendan Halpin Department of Sociology, University of Limerick brendan.halpin@ul.ie May 24 2019

Multicollinearity Topics 1 Multicollinearity 2 Leverage 3 Residuals

Multicollinearity 3 Multicollinearity 1. use http://www.stata-press.com/data/r14/bodyfat (Body Fat). corr * (obs=20) triceps thigh midarm bodyfat triceps 1.0000 thigh 0.9238 1.0000 midarm 0.4578 0.0847 1.0000 bodyfat 0.8433 0.8781 0.1424 1.0000

Multicollinearity 4 Multicollinearity 2. reg bodyfat tricep Source SS df MS Number of obs = 20 F(1, 18) = 44.30 Model 352.269824 1 352.269824 Prob > F = 0.0000 Residual 143.119689 18 7.95109386 R-squared = 0.7111 Adj R-squared = 0.6950 Total 495.389513 19 26.0731323 Root MSE = 2.8198 bodyfat Coef. Std. Err. t P> t [95% Conf. Interval] triceps.8571866.1287808 6.66 0.000.5866282 1.127745 _cons -1.496107 3.319235-0.45 0.658-8.46956 5.477347

Multicollinearity 5 Multicollinearity 3. reg bodyfat thigh Source SS df MS Number of obs = 20 F(1, 18) = 60.62 Model 381.965845 1 381.965845 Prob > F = 0.0000 Residual 113.423669 18 6.30131492 R-squared = 0.7710 Adj R-squared = 0.7583 Total 495.389513 19 26.0731323 Root MSE = 2.5102 bodyfat Coef. Std. Err. t P> t [95% Conf. Interval] thigh.8565467.1100156 7.79 0.000.6254124 1.087681 _cons -23.63449 5.657414-4.18 0.001-35.52028-11.74871

Multicollinearity 6 Multicollinearity 4. reg bodyfat midarm Source SS df MS Number of obs = 20 F(1, 18) = 0.37 Model 10.0516092 1 10.0516092 Prob > F = 0.5491 Residual 485.337904 18 26.9632169 R-squared = 0.0203 Adj R-squared = -0.0341 Total 495.389513 19 26.0731323 Root MSE = 5.1926 bodyfat Coef. Std. Err. t P> t [95% Conf. Interval] midarm.1994287.3266297 0.61 0.549 -.4867949.8856523 _cons 14.68678 9.095926 1.61 0.124-4.423052 33.79661

Multicollinearity 7 Multicollinearity 5. reg bodyfat tricep thigh midarm Source SS df MS Number of obs = 20 F(3, 16) = 21.52 Model 396.984607 3 132.328202 Prob > F = 0.0000 Residual 98.4049068 16 6.15030667 R-squared = 0.8014 Adj R-squared = 0.7641 Total 495.389513 19 26.0731323 Root MSE = 2.48 bodyfat Coef. Std. Err. t P> t [95% Conf. Interval] triceps 4.334085 3.015511 1.44 0.170-2.058512 10.72668 thigh -2.856842 2.582015-1.11 0.285-8.330468 2.616785 midarm -2.186056 1.595499-1.37 0.190-5.568362 1.19625 _cons 117.0844 99.78238 1.17 0.258-94.44474 328.6136

Multicollinearity 8 Multicollinearity 6. estat vif Variable VIF 1/VIF triceps 708.84 0.001411 thigh 564.34 0.001772 midarm 104.61 0.009560 Mean VIF 459.26

Leverage Topics 1 Multicollinearity 2 Leverage 3 Residuals

Leverage 10 Leverage 1. sysuse auto (1978 Automobile Data). reg price weight mpg Source SS df MS Number of obs = 74 F(2, 71) = 14.74 Model 186321280 2 93160639.9 Prob > F = 0.0000 Residual 448744116 71 6320339.67 R-squared = 0.2934 Adj R-squared = 0.2735 Total 635065396 73 8699525.97 Root MSE = 2514 price Coef. Std. Err. t P> t [95% Conf. Interval] weight 1.746559.6413538 2.72 0.008.467736 3.025382 mpg -49.51222 86.15604-0.57 0.567-221.3025 122.278 _cons 1946.069 3597.05 0.54 0.590-5226.245 9118.382

Leverage 11 Leverage 2. dfbeta. predict cd, cooks. su _df* cd _dfbeta_1: dfbeta(weight) _dfbeta_2: dfbeta(mpg) Variable Obs Mean Std. Dev. Min Max _dfbeta_1 74.0032413.1624324 -.2570012 1.14019 _dfbeta_2 74.0026526.1490603 -.4160759.9075188 cd 74.0171081.0526476 2.08e-09.4285067. list make cd _df* if _dfbeta_1>1 make cd _dfbet ~ 1 _dfbet ~ 2 13. Cad. Seville.4285067 1.14019.9075188

Leverage 12 Leverage 3

Residuals Topics 1 Multicollinearity 2 Leverage 3 Residuals

Residuals 14 Residuals. sysuse auto (1978 Automobile Data). reg price weight mpg Source SS df MS Number of obs = 74 F(2, 71) = 14.74 Model 186321280 2 93160639.9 Prob > F = 0.0000 Residual 448744116 71 6320339.67 R-squared = 0.2934 Adj R-squared = 0.2735 Total 635065396 73 8699525.97 Root MSE = 2514 price Coef. Std. Err. t P> t [95% Conf. Interval] weight 1.746559.6413538 2.72 0.008.467736 3.025382 mpg -49.51222 86.15604-0.57 0.567-221.3025 122.278 _cons 1946.069 3597.05 0.54 0.590-5226.245 9118.382. predict res, res. scatter res weight

Residuals 15 Residuals