Linjär regression - kalibrering av en våg

Relevanta dokument
= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

θx θ 1 om 0 x 1 f(x) = 0 annars

Grundläggande matematisk statistik

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Enkel och multipel linjär regression

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

F13 Regression och problemlösning

Stickprovsvariabeln har en fördelning / sprindning

Formelblad Sannolikhetsteori 1

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 12: Linjär regression

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Föreläsning 2: Punktskattningar

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för D, I, Π och Fysiker

Grundläggande matematisk statistik

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Kovarians och kriging

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 1: Matematik 7.5 hp

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Avd. Matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Föreläsningsanteckningar till Linjär Regression

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Introduktion till statistik för statsvetare

Matematik. Definition 1 Mängdbeteckningar Tomma mängden Ω Hela utfallsrummet Unionen Snittet C Komplementet A Antalet element i A

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Matematisk statistik KTH. Formelsamling i matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Tillämpad Matematik och statistik för IT-forensik. Del 2: Statistik 7.5 hp

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Tenta i Statistisk analys, 15 december 2004

Tentamentsskrivning: Matematisk Statistik TMA321 1

Tentamen i matematisk statistik

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

TENTAMEN I MATEMATISK STATISTIK

2. Konfidensintervall för skillnaden mellan två proportioner.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Regressions- och Tidsserieanalys - F1

Föreläsning 6, FMSF45 Linjärkombinationer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Lycka till!

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

FORMELSAMLING HT-15 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02. Sannolikhetsteori. Beskrivning av data

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Introduktion till statistik för statsvetare

Tentamen MVE301 Sannolikhet, statistik och risk

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Matematisk statistik TMS063 Tentamen

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Matematisk statistik TMS063 Tentamen

Matematik. Definition 1 Mängdbeteckningar Tomma mängden Ω Hela utfallsrummet Unionen Snittet C Komplementet A Antalet element i A

Föreläsning 13: Multipel Regression

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Regressions- och Tidsserieanalys - F1

= x 1. Integration med avseende på x ger: x 4 z = ln x + C. Vi återsubstituerar: x 4 y 1 = ln x + C. Villkoret ger C = 1.

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

Matematisk statistik för B, K, N, BME och Kemister

4.2.3 Normalfördelningen

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Formel- och tabellsamling i matematisk statistik

oberoende av varandra så observationerna är

10. Konfidensintervall vid två oberoende stickprov

LINKÖPINGS UNIVERSITET EXAM TAMS 15 / TEN 1

Exempel för diskreta och kontinuerliga stokastiska variabler

Tentamen L9MA30, LGMA30

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Kurssammanfattning MVE055

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Föreläsning 15, FMSF45 Multipel linjär regression

F4 Enkel linjär regression.

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Finansiell statistik. Multipel regression. 4 maj 2011

Transkript:

Lijär regressio Saolikhet och statistik Regressiosaalys HT 2008 Uwe.Mezel@math.uu.se http://www.math.uu.se/ uwe/ Samba mella två storheter ofta av itresse:... solarium hucacer... BN växelkurs... rökaet livsläg... vikt av e peel perio av e svägig Mätpukter: x i, y i Lijär regressio: y α + βx Lijär regressio - kalibrerig av e våg Moell för lijär regressio Moell: y i α + βx i + ɛ i är ɛ i N0, σ brus Ey i α + βx i µ i Figur: Moell för lijär regressio x i y i regressiosvariabel målvariabel s.v. Figur: Moell för lijär regressio

uktskattigar för itercept α och lutig β uktskattigar för itercept α och lutig β Moell: y i α + βx i + ɛ i Mista-kvarat-metoe: Qα, β Qα, β ɛ 2 i Miimum y i α βx i 2 Miimum Figur: Moell för lijär regressio Q α 2 Q β 2 y i α βx i 0 x i y i α βx i 0 uktskattigar för itercept α och lutig β Exempel 4.2: Bilirubihalt x och proteikocetratio y i ryggmärgsvätska hos yföa. β S xy och α ȳ β x x i x y i ȳ x i y i x ȳ; S xy För varje x 0 får ma u e skattig för målvariable: µ 0 α + β x 0 Skattig!: α, β och µ 0 är slumpvariabler. Nytt försök: förärae ɛ i y i S xy β, α och µ 0 x i x 2 x 0.4 0.08 0.07 0.26 0.08 0.02 0.03 0.22 0.06 0.23 y 83 65 7 40 35 30 30 28 80 68 x 0.29 0.04 0.3 0.4 0.07 0.05 0.3 0.06 0.05 0.08 y 39 88 2 25 56 98 0 96 73 6 x 0.5 x 2 i 0.370 x 2 i x 2 0.370 20 0.5 2 0.25 ȳ 97.5 y 2 i 2506 S yy y 2 i ȳ 2 2506 20 97.5 2 26299 x i y i 259.79 S xy x i y i x ȳ 259.79 20 0.5 97.5 43.455

Exempel 4.2: Bilirubihalt x och proteikocetratio y i ryggmärgsvätska hos yföa. β S xy 43.455 355.2 lutig 0.25 α ȳ β x 97.5 355.2 0.5 57.5 Skattig för målvariable: µ α + β x 57.5 + 355.2 x För varje givet x ka u e förvätae kocetratioe beräkas. Hur stor är et miimala Q? Vi sökte e värea för α och β som miimerar uttrycket Q: Qα, β y i α βx i 2 Miimum... och ck lösigara α och β. Hur stor är Q 0? Q 0 Qα, β y i α β x i 2 [y i ȳ + β x β x i ] 2 [y i ȳ β x i x] 2... S yy S 2 xy/ S yy β S xy S yy β 2 Skattig β är e lijärkombiatio av y i :a Q 0 aväs för att skatta σ Vi aväe moelle: y i α + βx i + ɛ i me ɛ i N0, σ ML-skattig för σ 2 är Q 0 / Korrigerae ML-skattig: jämför Q ɛ2 i s 2 Q 0 / 2 resp. s Q 0 / 2 väteväresriktigt β S xy x i x y i ȳ x i y i x y i x i ȳ + x ȳ [ [ xi x x i y i x i y i y i ] x y i x ȳ + x ȳ x y i ] c i y i me c i x i x c i ige s.v.!

Skattig α är e lijärkombiatio av y i :a Skattigar α och β är lijärkombiatioer av y i :a α ȳ β x c i x y i x c i y i y i i y i me i c i x i ige s.v.! β α c i y i me c i x i x i y i me i c i x Möjlighet att ra slutsatser se ere Väteväre för skattige β Varias för skattige β E β E c i y i α α α 0 + β x i x + β c i Ey i x i x + β 0 + β x i x c i α + βx i x i ty c i x i x x i x x i x i x x i x ty β väteväresriktigt x i x x 0 V β V c i y i c 2 i V y i xi 2 x σ 2 σ2 S 2 xx x i x 2 σ2 ty V c i y i c 2 i σ 2 x i x 2 oberoee! Variase för β är lite om x-värea är utsprea.

Väteväre och varias för skattige µ 0 Föreligar för skattigara β och µ 0 Skattige för fuktiosväret för x 0 var: µ 0 α + β x 0 E µ 0 E α + β x 0 E i + c i x 0 Y i... α + βx 0 µ 0 väteväresriktigt V µ 0 V α + β x 0 V / + c i x 0 x Y i... σ 2 / + x 0 x 2 / Variase är stor är x 0 ligger lågt ifrå x. För x 0 0 får ma skattige för iterceptet α. β α c i y i me c i x i x i y i me i c i x ɛ i N0, σ... som vi hae atagit y i α + βx i + ɛ i... var moell y i N α + βx i, σ... y i lijärkombiatio av ɛ i Slumpvariablera y i är ormalförelae α, β och µ 0 är också ormalförelae! Förelig för skattigara β och µ 0 Skattigara β och µ 0 är ormalförelae me: E β β V β σ2 me x i x 2 E µ 0 µ 0 V µ 0 σ2 / + x 0 x 2 / Det betyer: β N β, µ 0 N µ 0, σ σ + x 0 x 2 Itervallskattig för lutige β är σ är kä Förelig för β me kä σ 0 : β Nβ, D me D σ 0 β β D Referesvariabel omfattas me kvatilera: λ α/2 < β β λ α/2 D N0, β obs λ α/2 D < β β obs + λ α/2 D Koesitervall me koesgra α: Iβ β obs ± λ α/2 D

Itervallskattig för målvariabel µ 0 är σ är kä Koesitervall för målvariabel µ 0 Förelig för µ 0 me kä σ 0: µ 0 N µ 0, D me D σ 0 + x 0 x 2 µ 0 µ 0 D N0, Referesvariabel omfattas me kvatilera: λ α/2 < µ 0 µ 0 λ α/2 D µ obs λ α/2 D < µ 0 µ obs + λ α/2 D Koesitervall me koesgra α: µ obs ± λ α/2 D Figur: Skattig för målvariabel me koesitervall Itervallskattig för lutige β är σ är okä Är σ okä skattas et me s Q 0 / 2 Referesvariabel: β β tf me s och f 2 Referesvariabel omfattas me kvatilera: t α/2 < β β t α/2 β obs t α/2 < β β obs + t α/2 Koesitervall me koesgra α: Exempel 4.2: Bilirubihalt x och proteikocetratio y. 0.25 S yy 26299 S xy 43.455 β 355.2 Sökes: 95% koesitervall för lutige β: Q 0 S yy S2 xy 26299 43.4552 0.25 0973 s Q 0 / 2 0973/20 2 24.7 S s 24.7 xx 0.25 70.9 t α/2 2 t 0.025 8 2. Iβ β obs ± t α/2 2 355.2 ± 2. 70.9 20, 500 Iβ β obs ± t α/2 2

Itervallskattig för målvariabel µ 0 är σ är okä Är σ okä skattas et me s Q 0 / 2 E referesvariabel är: µ 0 µ 0 t 2 me s + x 0 x 2 Exempel 4.2: Bilirubihalt x och proteikocetratio y. x 0.5 0.25 α 57.5 β 355.2 s 24.7 samma s Q 0 / 2 me aat Sökes: 95% koesitervall för µ 0 är x 0 0.2: Referesvariabel omfattas me kvatilera: t α/2 < µ 0 µ 0 t α/2 µ obs t α/2 < µ µ obs + t α/2 µ 0 α + β x 0 57.5 + 355.2 0.2 29 s + x 0 x 2 24.7 20 + 0.2 0.52 0.25 8.38 Koesitervall me koesgra α: µ obs ±t α/2 2 29±t 0.025 8 8.38 0, 50 µ obs ± t α/2 2 Itervallskattig för β och µ 0 σ kä σ okä β β D N0, β β t 2 D S σ s xx s Q 0 / 2 Sammafattig uktskattig för lutig, itercept och målvariabel uktskattig för σ brus Iβ β ± λ α/2 D Iβ β ± t α/2 Q 0 S yy S 2 xy Väteväre och varias för skattigara β och µ 0 Itervallskattig för lutig och målvariabel me kät σ Itervallskattig för lutig och målvariabel me skatta σ µ 0 µ 0 N0, D D σ + x 0 x 2 µ 0 µ 0 t 2 s + x 0 x 2 S xy x i y i x ȳ µ ± λ α/2 D µ ± t α/2