Regressions- och Tidsserieanalys - F1

Relevanta dokument
Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Regressions- och Tidsserieanalys - F3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F7

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Regressions- och Tidsserieanalys - F4

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

10.1 Enkel linjär regression

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Metod och teori. Statistik för naturvetare Umeå universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

Multipel Regressionsmodellen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning G60 Statistiska metoder

Examinationsuppgifter del 2

Regressions- och Tidsserieanalys - F5

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

F7 Polynomregression och Dummyvariabler

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I MATEMATISK STATISTIK

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

F13 Regression och problemlösning

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Tentamen i matematisk statistik

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

TENTAMEN I STATISTIK B,

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

F11. Kvantitativa prognostekniker

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Skrivning i ekonometri torsdagen den 8 februari 2007

Exempel 1 på multipelregression

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Regressions- och Tidsserieanalys - F8

Tentamen Tillämpad statistik A5 (15hp)

tentaplugg.nu av studenter för studenter

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för D, I, Π och Fysiker

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 4. Kap 5,1-5,3

Tentamen i Matematisk statistik Kurskod S0001M

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 12: Linjär regression

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Skrivning i ekonometri lördagen den 29 mars 2008

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Grundläggande matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen i matematisk statistik

Räkneövning 3 Variansanalys

Kvadratisk regression, forts.

LABORATION 3 - Regressionsanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Räkneövning 5. Sebastian Andersson Statistiska institutionen Uppsala universitet 7 januari För Uppgift 2 kan man med fördel ta hjälp av Minitab.

Läs noggrant informationen nedan innan du börjar skriva tentamen

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Tentamen i Matematisk statistik Kurskod S0001M

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Föreläsning 12: Regression

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Matematisk statistik, Föreläsning 5

Datorövning 1 Enkel linjär regressionsanalys

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Skrivning i ekonometri lördagen den 25 augusti 2007

Följande resultat erhålls (enhet: 1000psi):

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen i Matematisk statistik Kurskod S0001M

Höftledsdysplasi hos dansk-svensk gårdshund

Transkript:

Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25

Regressions- och tidsserieanalys, 7.5 hp Mål: Innehåll: Tillägna sig metodik för att analysera samt tolka statistiska modeller för samband mellan variabler och statistiska modeller för tidsseriedata. Enkel och multipel linjär regressionsanalys Index Efterfrågeanalysmodeller Modeller för tidsseriedata Analys av data med hjälp av statistisk programvara. Wänström (Linköpings universitet) F1 May 4, 2015 2 / 25

Regressions- och tidsserieanalys, 7.5 hp Ansvarig lärare Linda Wänström Examination Projekt Tenta Litteratur linda.wanstrom@liu.se; rum i B-huset, plan 2 (ovanför JAVA) Del 1: Index och efterfrågeanalys Del 2: Tidsserieanalys Inlämning senast 5/6 Onsdag 3/6 kl 8-12 Får ta med: boken (utan anteckningar), miniräknare samt ett eget "formelblad" (A4-sida (fram och bak) där ni själva skriver formler och annat ni tycker är viktigt) Bowerman, O Connel, Koehler & Brooks (2005) 4th ed. Forecasting, time series, and regression. Brooks. Wänström (Linköpings universitet) F1 May 4, 2015 3 / 25

Exempel: IT bland individer 2013 (från SCB s hemsida) Det blir allt vanligare att hämta information från myndigheters webbplatser. Wänström (Linköpings universitet) F1 May 4, 2015 4 / 25

Exempel: Detaljhandelns försäljning, september 2013 (från SCB s hemsida) Försäljningsvolymen ökade med 1,6 procent i september jämfört med samma månad förra året. Uppgifterna är kalenderkorrigerade. Wänström (Linköpings universitet) F1 May 4, 2015 5 / 25

Exempel: Samband mellan storlek och pris på lägenheter 6000 5000 Fitted Line Plot Pris = 1100 + 44,14 KVM S 1208,14 R Sq 36,4% R Sq(adj) 35,0% 4000 Pris 3000 2000 1000 0 40 50 60 70 80 90 KVM 100 110 120 130 Wänström (Linköpings universitet) F1 May 4, 2015 6 / 25

Exempel Antag att vi vill veta om det finns något samband mellan mängden lokalt inriktad annonsering och företags försäljning hur stor försäljning vi kan förvänta oss vid en annonsering på 20 000 kr Wänström (Linköpings universitet) F1 May 4, 2015 7 / 25

Enkel linjär regressionsmodell y = beroende variabel, responsvariabel, undersökningsvariabel x = oberoende variabel, prediktorvariabel, förklaringsvariabel Modellen antar att sambandet mellan x och y kan approximeras med en rät linje Vi kan visuellt inspektera om sambandet ser linjärt ut genom att titta på ett spridningsdiagram (scatter plot) Wänström (Linköpings universitet) F1 May 4, 2015 8 / 25

Exempel: y = försäljning (milj kr), x = annonsering (10000 kr) Distrikt y i x i 1 5.4 5 2 3.8 3 3 10.6 9 4 5.2 3.5 5 4.5 5 6 2.7 2 7 2.5 1.8 8 4.5 4.7 Wänström (Linköpings universitet) F1 May 4, 2015 9 / 25

Spridningsdiagram 12 10 8 Försäljning 6 4 2 0 0 1 2 3 4 5 Annonsering 6 7 8 9 Wänström (Linköpings universitet) F1 May 4, 2015 10 / 25

Enkel linjär regressionsmodell y = β 0 + β 1 x + ɛ β 0 + β 1 x = µ y x är medelvärdet för den beroende variabeln y när värdet på den oberoende variabeln är x β 0 är linjens skärning med y axeln β 1 är linjens lutning ɛ är en felterm Wänström (Linköpings universitet) F1 May 4, 2015 11 / 25

Minskakvadratskattningar för skärning och lutning Vi tar ett stickprov på n värden på x och y för att beräkna skattningar b 0 och b 1 b 1 = SS xy SS xx = = n x i y i i=1 n (x i x) (y i y) i=1 = (x i x) 2 n i=1 ( n n xi 2 i=1 )( n ) x i y i i=1 i=1 n ( n ) 2 x i i=1 n b 0 = y b 1 x Wänström (Linköpings universitet) F1 May 4, 2015 12 / 25

Spridningsdiagram med inritad skattad regressionslinje 12 10 8 Försäljning 6 4 2 0 0 1 2 3 4 5 Annonsering 6 7 8 9 Wänström (Linköpings universitet) F1 May 4, 2015 13 / 25

Summan av de kvadrerade avvikelserna från linjen (SSE) SSE = n ei 2 i=1 = n (y i ŷ i ) 2 i=1 Wänström (Linköpings universitet) F1 May 4, 2015 14 / 25

Minitab-utskrift Regression Analysis: Försäljning versus Annonsering The regression equation is Försäljning = 0,436 + 1,05 Annonsering Predictor Coef SE Coef T P Constant 0,4357 0,6425 0,68 0,523 Annonsering 1,0504 0,1349 7,79 0,000 S = 0,821147 R Sq = 91,0% R Sq(adj) = 89,5% Analysis of Variance Source DF SS MS F P Regression 1 40,914 40,914 60,68 0,000 Residual Error 6 4,046 0,674 Total 7 44,960 Wänström (Linköpings universitet) F1 May 4, 2015 15 / 25

Uppskattningar och prognoser Anpassad regressionslinje ŷ = b 0 + b 1 x ŷ är en punktskattning för medelvärdet för y när värdet på oberoende variabeln är x. ŷ är också en punktskattning för ett enskilt värde på y när värdet på oberoende variabeln är x. Wänström (Linköpings universitet) F1 May 4, 2015 16 / 25

Modellantaganden y = β 0 + β 1 x + ɛ För varje x-värde är medelvärdet för värdena på feltermen noll. Konstant varians. För varje x-värde har värdena på feltermen en konstant varians. Denna varians kallas för σ 2. Normalfördelning. För varje x-värde följer värdena på feltermen en normalfördelning. Oberoende. Alla värden på feltermen är statistisk oberoende av alla andra värden på feltermen. Wänström (Linköpings universitet) F1 May 4, 2015 17 / 25

Variansskattning: Mean Square Error och Standard Error (Standardfel) Om antagandena är uppfyllda och SSE är summan av de kvadrerade avvikelserna från linjen gäller Punktskattning för σ 2 (MSE) är s 2 = SSE n 2 Punktskattning för σ (Standardfel) är s = s 2 Wänström (Linköpings universitet) F1 May 4, 2015 18 / 25

Signifikanstest för lutning och skärning Test för lutning (om antagandena håller) H 0 : β 1 = 0 H a : β 1 = 0 t = b 1 s b1, där s b1 = s SSxx Förkasta H 0 om t > t [α/2](n 2) Test för skärning (om antagandena håller) H 0 : β 0 = 0 H a : β 0 = 0 t = b 0 s b0, Förkasta H 0 om t > t [α/2](n 2) 1 där s b0 = s n + x 2 SS xx Wänström (Linköpings universitet) F1 May 4, 2015 19 / 25

Konfidensintervall för lutning Om antagandena håller är ett 100(1 α)% konfidensintervall för den sanna lutningen β 1 [ b 1 ± t [α/2](n 2) s b1 ] Wänström (Linköpings universitet) F1 May 4, 2015 20 / 25

Distance value Distancevalue = 1 n + (x 0 x) 2 SS xx Wänström (Linköpings universitet) F1 May 4, 2015 21 / 25

Konfidensintervall för medelvärdet för y vid ett specifikt x-värde ŷ = b 0 + b 1 x 0 Om antagandena är uppfyllda är ett 100(1 α)% konfidensitvervall för µ y x0 [ ŷ ± t [α/2](n 2) s ] Distancevalue Wänström (Linköpings universitet) F1 May 4, 2015 22 / 25

Prognosintervall för ett värde på y vid ett specifikt x-värde ŷ = b 0 + b 1 x 0 Om antagandena är uppfyllda är ett 100(1 α)% prognosintervall för y vid x 0 [ ŷ ± t [α/2](n 2) s ] 1 + Distancevalue Wänström (Linköpings universitet) F1 May 4, 2015 23 / 25

Förklaringsgrad: Determinationskoeffi cienten Total variation = Förklarad variation + Oförklarad variation SST = SSR + SSE n (y i y) 2 = n (ŷ i y) 2 + n (y i ŷ i ) 2 i=1 i=1 i=1 r 2 = SSR SST Wänström (Linköpings universitet) F1 May 4, 2015 24 / 25

Korrelationskoeffi cienten Ett mått på hur starkt sambandet mellan y och x är r = ± r 2 r = SS xy SSxx SS yy Wänström (Linköpings universitet) F1 May 4, 2015 25 / 25