Finansiell statistik. Multipel regression. 4 maj 2011

Relevanta dokument
1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Enkel och multipel linjär regression

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Matematisk statistik, Föreläsning 5

Föreläsning 12: Linjär regression

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Regressions- och Tidsserieanalys - F1

Föreläsning 15, FMSF45 Multipel linjär regression

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Stokastiska processer med diskret tid

Regressions- och Tidsserieanalys - F1

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Regressions- och Tidsserieanalys - F4

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Multipel Regressionsmodellen

Kovarians och kriging

Korrelation och autokorrelation

Föreläsning 13: Multipel Regression

Matematisk statistik för B, K, N, BME och Kemister

MVE051/MSG Föreläsning 14

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Föreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression

Regressions- och Tidsserieanalys - F3

F13 Regression och problemlösning

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Formler och tabeller till kursen MSG830

Höftledsdysplasi hos dansk-svensk gårdshund

oberoende av varandra så observationerna är

Bayesiansk statistik, 732g43, 7.5 hp

Grundläggande matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Laboration 4: Lineär regression

Matematisk statistik för B, K, N, BME och Kemister

TAMS65 - Seminarium 4 Regressionsanalys

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Finansiell statistik

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Lycka till!

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

10.1 Enkel linjär regression

STATISTISK ANALYS AV KOMPLEXA DATA

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Regressions- och Tidsserieanalys - F3

Tentamen för kursen. Linjära statistiska modeller. 14 januari

F11. Kvantitativa prognostekniker

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Matematisk statistik KTH. Formelsamling i matematisk statistik

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Linjär regressionsanalys. Wieland Wermke

Härledning av Black-Littermans formel mha allmänna linjära modellen

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Föreläsning 12: Regression

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Tentamen MVE301 Sannolikhet, statistik och risk

Regressionsanalys av lägenhetspriser i Spånga

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

1989, Statistiska centralbyrån ISSN Printed in Sweden Garnisonstryckeriet, Stockholm 1989

Lunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5

1 Förberedelseuppgifter

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Bilttäthet i Stockholms läns kommuner - en statistisk analys av kommunala skillnader

Stockholms Universitet Statistiska institutionen Patrik Zetterberg

AMatematiska institutionen avd matematisk statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Föreläsning 7: Stokastiska vektorer

Transkript:

Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011

Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi är intresserade av. Låt y vara vårt studieobjekt. Låt x 1, x 2,..., x K vara K variabler som möjligen påverkar y. För att undersöka vilka variabler som påverkar y mest och på vilket sätt har vi två viktiga redskap: korrelationsmatrisen beräknad för samtliga variabler y och x 1, x 2,..., x K. Det är den vanliga korrelationen mellan alla par av variabler som har stoppats in i en matris. spridningsdiagram mellan samtliga variabler y och x 1, x 2,..., x K. Vissa program tillhandahåller en s k matrisplot.

Korrelationsmatrisen Stickprovets korrelationsmatris y x 1 x 2 x 3... x K y 1 r y,x1 r y,x2 r y,x3... r y,xk x 1 1 r x1,x 2 r x1,x 3... r x1,x K x 2 1 r x2,x 3... r x2,x K x 3 1... r x3,x K....... x K 1 Korrelationsmatrisen i populationen y x 1 x 2 x 3... x K y 1 ρ y,x1 ρ y,x2 ρ y,x3... ρ y,xk x 1 1 ρ x1,x 2 ρ x1,x 3... ρ x1,x K x 2 1 ρ x2,x 3... ρ x2,x K x 3 1... ρ x3,x K....... x K 1

Exempel på en korrelationmatris: Datamaterialet Vi använder exempel 12.3 (Profit Margins of Savings and Loan Association) på sidan 515 i boken. Variablerna är vinst (Y ), inkomst (X 1 ) och antal kontor (X 2 ). Datamaterialet ges i SAS-utskriften:

Korrelationsmatrisen

Multipel regression Vi har en beroende variabel y och K stycken oberoende variabler x 1, x 2,..., x K. Då ges den multipla regressionsmodellen som y = β 0 + β 1 x 1 + β 2 x 2 + + β K x K + ε där feltermerna ε uppfyller: E (ε t) = 0 (störningsantagandet); modellen är i genomsnitt korrekt. Var (ε t) = σ 2 (homoskedasticitetsantagandet); feltermerna har samma ändliga varians. De stokastiska variablerna ε t är oberoende. (feltermerna korrelerar ej med varandra). ε N(0, σ 2 ); feltermerna ε är normalfördelade. Dessutom ska det inte vara möjligt att någon av de oberoende variablerna x 1, x 2,..., x K kan skrivas som lineärkombination av de andra.

Multipel regression Vi skattar parametrarna β 0, β 1, β 2,..., β K, σ med minsta-kvadrat metoder. De skattade parametrarna betecknas b 0, b 1, b 2,..., b K. (Lägg märke till att σ saknas)

Multipel regression skriven med hjälp av matriser Den multipla regressionsmodellen med K st oberoende variabler y i = β 0 + β 1 x i1 + β 2 x i2 + + β K x ik + ɛ i i = 1,..., n d v s y 1 = β 0 + β 1 x 11 + β 2 x 12 + + β k x 1k + ɛ 1 y 2 = β 0 + β 1 x 21 + β 2 x 22 + + β k x 2k + ɛ 2. y n = β 0 + β 1 x n1 + β 2 x n2 + + β k x nk + ɛ n Vi skriver ekvationssystemet med hjälp av matriser: β y 1 1 x 11 x 12 x 0 1k y 2 = 1 x 21 x 22 x 2k β 1 β 2 + y n 1 x n1 x n2 x nk β k ɛ 1 ɛ 2 ɛ n.

Multipel regression skriven med hjälp av matriser Vi kan alltså skriva modellen som där y = y 1 y 2 y n, β = X = β 0 β 1 β 2 β k y = Xβ + ɛ, 1 x 11 x 1k 1 x 21 x 2k 1 x n1 x nk och ɛ = ɛ 1 ɛ 2 ɛ n.

Multipel regression skriven med hjälp av matriser Minimera S (β) = ɛ ɛ = (y Xβ) (y Xβ) vilket ger normalekvationerna ( X X ) b = X y. Om inversen av matrisen (X X) existerar, så kan vi lösa ekvationen så att vi får: b = ( X X ) 1 X y. Residualerna e i där e = e 1 e 2 e n, ŷ= ŷ 1 ŷ 2 ŷ n e = y ŷ, = Xb = X (X X) 1 X y = Hy, där H = X ( X X ) 1 X.

Normalekvationerna-enkel lineär regression Vi minns ekvationssystemet för att hitta b 0 och b 1. ( n ) n nb 0 + x i b 1 = i=1 ( n ) ( n x i b 0 + ) i=1 xi 2 b 1 = i=1 i=1 i=1 y i n x i y i Vi kan skriva ( n n i=1 x i n i=1 x i n i=1 x i 2 ) ( b0 b 1 ) = ( n i=1 y ) i n i=1 x iy i