Föreläsningsanteckningar till Linjär Regression

Relevanta dokument
Sensorer, effektorer och fysik. Analys av mätdata

Sensorer och elektronik. Analys av mätdata

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

REGRESSIONSANALYS S0001M

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

F15 ENKEL LINJÄR REGRESSION (NCT )

Lycka till och trevlig sommar!

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Något om beskrivande statistik

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Korrelationens betydelse vid GUM-analyser

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Formler och tabeller i statistik

F7 PP kap 4.1, linjära överbestämda ekvationssystem

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Tentamen STA A15 delkurs 1 (10 poäng): Sannolikhetslära och statistisk slutledning 3 november, 2005 kl

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

KONFIDENSINTERVALL FÖR MEDIANEN (=TECKENINTERVALL )

θx θ 1 om 0 x 1 f(x) = 0 annars

Repetition DMI, m.m. Några begrepp. egenskap d. egenskap1

Lösningsförslag till tentamen i 732G71 Statistik B,

Orderkvantiteter i kanbansystem

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

Geodetisk och fotogrammetrisk mätnings- och beräkningsteknik

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Grundläggande matematisk statistik

Enkel linjär regression

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

4.2.3 Normalfördelningen

Linjär regression - kalibrering av en våg

f(x i ) Vi söker arean av det gråfärgade området ovan. Området begränsas i x-led av de två x-värdena där kurvan y = x 2 2x skär y = 0, d.v.s.

Orderkvantiteter vid begränsningar av antal order per år

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Geodetisk och fotogrammetrisk mätnings- och beräkningsteknik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Uppgifter 3: Talföljder och induktionsbevis

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Fyra typer av förstärkare

Variansberäkningar KPI

Föreläsning 2: Punktskattningar

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

================================================

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Formelblad Sannolikhetsteori 1

Flexibel konkursriskestimering med logistisk spline-regression

Introduktion till statistik för statsvetare

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

Borel-Cantellis sats och stora talens lag

Linjär Algebra. Linjära ekvationssystem. Ax = b. Viktiga begrepp. Linjära ekvationssystem. Kolumnerna i A. Exempel. R (A) spänns upp av t.ex.

101. och sista termen 1

Avd. Matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Inledande matematisk analys. 1. Utred med bevis vilket eller vilka av följande påståenden är sana:

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

EKVATIONER MED KOMPLEXA TAL A) Ekvationer som innehåller både ett obekant komplext tal z och dess konjugat z B) Binomiska ekvationer.

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

a) Beräkna E (W ). (2 p)

TAMS15: SS1 Markovprocesser

Tentamen i Linjär Algebra, SF december, Del I. Kursexaminator: Sandra Di Rocco. Matematiska Institutionen KTH

Tillämpad biomekanik, 5 poäng Plan rörelse, kinematik och kinetik

En kvalitetskontroll - Snustillverkaren Fiedler & Lundgren kvalitetstestas Av: Andreas Timglas

LINJÄR ALGEBRA II LEKTION 4

F10 ESTIMATION (NCT )

Tentamen Metod C vid Uppsala universitet, , kl

Föreläsning 12: Linjär regression

Normalfördelningar (Blom Kapitel 8)

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

H1009, Introduktionskurs i matematik Armin Halilovic POLYNOM, POLYNOMDIVISION, ALGEBRAISKA EKVATIONER, PARTIALBRÅKSUPPDELNING. vara ett polynom där a

- Syns den globala uppvärmningen i den svenska snöstatistiken?

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Kontrollskrivning 3 i SF1676, Differentialekvationer med tillämpningar. Tisdag kl 8:15-10

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Tentamen 19 mars, 8:00 12:00, Q22, Q26

Matematisk statistik TMS063 Tentamen

Föreläsning G04: Surveymetodik

Att testa normalitet och heteroskedasticitet i en linjär regressionsmodell

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Stelkroppsdynamik i tre dimensioner Ulf Torkelsson. 1 Tröghetsmoment, rörelsemängdsmoment och kinetisk energi

Transkript:

Föreläsgsateckgar tll Ljär Regresso Kasper K S Aderse 3 oktober 08 Statstsk modell Ofta söks ett sambad y fx mella e förklarade eller oberoede varabel x och e resposvarabel eller beroede varabel y V betrakter här det eklaste fall där y fx α + βx är e ljär fukto De statstska modelle är som följer: V har mätgar x, y,, x, y V betraktar x som e kostat och y som e observato av e stokastsk varabel Y V atar sambadet Y α + βx + ε där ε N0, σ represeterar störge ved :ta mätge Dessuttom atar v att ε,, ε är oberoede Lje y α + βx kallas de teoretska regressoslje Parametrera α och β är okäda och v söker att skatta dessa Om v för x x medelvärdet av x :era ka v skrva teoretska regressoslje på forme y α + βx α + βx +βx βx α + β x x α där α α + βx eller ekvvalet α α βx I stället för att skatta α och β måste v då skatta α och β, detta ger ågot eklare beräkgar Kvadratsummor och korrelatoskoeffcet V för följade kvadratsummor som aväds beräkgara S Y Y S xy x x Y Y x x Y Y x x Y Y x Y x Y Observerade värde av de två ssta summor beteckas S yy och S xy och upfyllar samma formler som ova

Defto: Korrelatoe eller Pearsos korrelatoskoeffcet eller produktmometkorrelatoskoeffcete deferas elgt R S xy S Y Y Sats: Korrelatoskoeffcete uppfyller R Ett perfekt ljärt sambad Y α + βx ger R + om β > 0 och R om β < 0 Iget ljärt sambad motsvarer R 0 3 Skattg av parametrara Avvkelse lodrät led för :ta observatoe ges av Y α β x x då α + β x x är y-värde på le y α + β x x motsvarede x x Dessa avvkelser ka vare båda postva och egatva varför v troducerar kvadratsumma Y α β x x som v söker att göra mst möjlg Detta kallas Mstakvadratmetode och utvecklades av Gauss Sats: Y α β x x α Y + β S xy + S Y Y S xy Q 0 Specelt blr kvadratsumma mst möjlg om α Y och β S xy

Bevs: Y α β x x Y + α + β x x α Y β Y x x + α β x x Y Y +α +β α Y β x x Y +α β x x 0 +α +β α Y β x x Y +β x x Y Y 0 + α + β α Y β x x Y Y S Y Y + Y + α α Y + β β S xy S Y Y + Y + α α Y + β β S xy S xx SxY SxY S Y Y + Y + α α Y + β β S xy + α Y + β S xy Detta bevsar formel Det ssta påståedet är u uppebart + S Y Y S xy 4 Itervallskattg av parametrara Då ε N0, σ fås jvf Sats 6A att Y α + β x x + ε är ormalfördelad Y Nα+β x x, σ Då ε,, ε är oberoede följer också att Y,, Y är oberoede Sats: Puktskattgara α och β är ormalfördelade α σ N α, och β σ N β, Specelt är båda α och β vätevärdesrktga De är äve de effektvasta puktskattgar av α och β Dessutom är α och β är oberoede 3

Bevs: Elgt Sats 6C är α Y Y ormalfördelad med E α EY α + β x x α + β x x α } {{ } 0 och V α V har omskrvge β S xy V Y σ σ σ x x Y Y x x Y x x Y c Y x x Y 0 där c x x edast beror på x:era Elgt Sats 6C är β då ormalfördelad med E β c EY x x α + β x x α x x + 0 β x x β β och V β c V Y x x σ σ x x σ σ V vsar te ssta dele av satse här 4

4 σ käd Sats: Itervallskattgar av α och β med kofdesgrad p ges av I α α σ λ p/, α σ + λ p/ och I β β σ λ p/, β σ + λ p/ där λ p/ är p/-kvatle N0, -fördelge 4 σ okäd Om σ te är käd måste v skatta dea Sats: E vätevärdesrktg puktskattg av σ ges av σ Q 0 S Y Y S xy Sats: Itervallskattgar av α och β med kofdesgrad p ges av I α α t p/ σ, α + t p/ σ och I β β σ t p/, β σ + t p/ där σ fördelge S Y Y S xy och t p/ är p/-kvatle t - Amärkg: Observera att atallet av frhetsgrader är 5 Exempler Exempel: Gvet datamateralet Befolkg 0000, x 0 40 60 90 Vattekosumto per våera 00 l/dag, y 0 3 3 4 Är det rmlgt att tro att det förelgger ett ljärt sambad y α +βx? Bestäm de skattade regressoslje Age tervallskattgar med 95% kofdesgrad av koeffcetera Lösg: V har 4 och beräkg ger x 0 + 40 + 60 + 90 0 y 0 + 3 + 3 + 4 5 5

vlket ger x 0 4 5 och y 5 4 5 För att bestämma kvadratsummora beräkas Herav fås x 0 + 40 + 60 + 90 34 y 0 + 3 + 3 + 4 634 x y 0 0 + 40 3 + 60 3 + 90 4 66 x x 34 0 4 34 S yy y y 634 5 4 009 S xy x y x y 66 0 5 4 6 vlket ger korrelatoskoeffcete r S xy 6 0947 S yy 34 009 Det verkar därfor rmlgt att ata att det fs e ljär relato V får αobs y 5 och βobs Sxy 6 34 0047 Alltså är y α obs + β obs x x 5 + 0047x 5 0 + 0047x Då σ te är käd skattar v dea V får s σobs 009 6 008575 34 Tabell ger t p/ t 005 4307 och sättg ger då I α αobs s ± t p/ 5 ± 4307 008575 0, 5 4 I β β obs ± t p/ s 0047 ± 4307 008575 34 007, 0 Iblad ka också vssa ckeljära sambad hateras geom avädg av e passade trasformato Exempel: Gvet datamateralet 6

x 30 40 50 60 70 y 4 35 9 4 0 Ata att x og y förhåller sg geom y a b x Age puktskattger av a och b Lösg: Sambadet är te ljärt, me avädg av logartmer ger l y l a + l b x Med z l y, α l a och β l b är z α + βx V får x 30 40 50 60 70 z 3738 3555 3367 378 996 Beräkg ger observera att 5 z och S zz te behövs!: 5, 5 x 5, 5 z 6834, 5 x 35 och 5 x z 8309 Detta ger 0 och S xz 86 varav v får αobs z 33668 och β obs Sxz 086 Detta ger z 33668 086x 5 4974 086x Med l a obs α obs 4974 och l b obs β obs 086 fås a obs e α obs 73509 och b obs e β obs 08308, dvs y 73509 08308 x Avrudg ger då y 735 083 x 7