Lijär regressio Saolikhet och statistik Regressiosaalys HT 2008 Uwe.Mezel@math.uu.se http://www.math.uu.se/ uwe/ Samba mella två storheter ofta av itresse:... solarium hucacer... BN växelkurs... rökaet livsläg... vikt av e peel perio av e svägig Mätpukter: x i, y i Lijär regressio: y α + βx Lijär regressio - kalibrerig av e våg Moell för lijär regressio Moell: y i α + βx i + ɛ i är ɛ i N0, σ brus Ey i α + βx i µ i Figur: Moell för lijär regressio x i y i regressiosvariabel målvariabel s.v. Figur: Moell för lijär regressio
uktskattigar för itercept α och lutig β uktskattigar för itercept α och lutig β Moell: y i α + βx i + ɛ i Mista-kvarat-metoe: Qα, β Qα, β ɛ 2 i Miimum y i α βx i 2 Miimum Figur: Moell för lijär regressio Q α 2 Q β 2 y i α βx i 0 x i y i α βx i 0 uktskattigar för itercept α och lutig β Exempel 4.2: Bilirubihalt x och proteikocetratio y i ryggmärgsvätska hos yföa. β S xy och α ȳ β x x i x y i ȳ x i y i x ȳ; S xy För varje x 0 får ma u e skattig för målvariable: µ 0 α + β x 0 Skattig!: α, β och µ 0 är slumpvariabler. Nytt försök: förärae ɛ i y i S xy β, α och µ 0 x i x 2 x 0.4 0.08 0.07 0.26 0.08 0.02 0.03 0.22 0.06 0.23 y 83 65 7 40 35 30 30 28 80 68 x 0.29 0.04 0.3 0.4 0.07 0.05 0.3 0.06 0.05 0.08 y 39 88 2 25 56 98 0 96 73 6 x 0.5 x 2 i 0.370 x 2 i x 2 0.370 20 0.5 2 0.25 ȳ 97.5 y 2 i 2506 S yy y 2 i ȳ 2 2506 20 97.5 2 26299 x i y i 259.79 S xy x i y i x ȳ 259.79 20 0.5 97.5 43.455
Exempel 4.2: Bilirubihalt x och proteikocetratio y i ryggmärgsvätska hos yföa. β S xy 43.455 355.2 lutig 0.25 α ȳ β x 97.5 355.2 0.5 57.5 Skattig för målvariable: µ α + β x 57.5 + 355.2 x För varje givet x ka u e förvätae kocetratioe beräkas. Hur stor är et miimala Q? Vi sökte e värea för α och β som miimerar uttrycket Q: Qα, β y i α βx i 2 Miimum... och ck lösigara α och β. Hur stor är Q 0? Q 0 Qα, β y i α β x i 2 [y i ȳ + β x β x i ] 2 [y i ȳ β x i x] 2... S yy S 2 xy/ S yy β S xy S yy β 2 Skattig β är e lijärkombiatio av y i :a Q 0 aväs för att skatta σ Vi aväe moelle: y i α + βx i + ɛ i me ɛ i N0, σ ML-skattig för σ 2 är Q 0 / Korrigerae ML-skattig: jämför Q ɛ2 i s 2 Q 0 / 2 resp. s Q 0 / 2 väteväresriktigt β S xy x i x y i ȳ x i y i x y i x i ȳ + x ȳ [ [ xi x x i y i x i y i y i ] x y i x ȳ + x ȳ x y i ] c i y i me c i x i x c i ige s.v.!
Skattig α är e lijärkombiatio av y i :a Skattigar α och β är lijärkombiatioer av y i :a α ȳ β x c i x y i x c i y i y i i y i me i c i x i ige s.v.! β α c i y i me c i x i x i y i me i c i x Möjlighet att ra slutsatser se ere Väteväre för skattige β Varias för skattige β E β E c i y i α α α 0 + β x i x + β c i Ey i x i x + β 0 + β x i x c i α + βx i x i ty c i x i x x i x x i x i x x i x ty β väteväresriktigt x i x x 0 V β V c i y i c 2 i V y i xi 2 x σ 2 σ2 S 2 xx x i x 2 σ2 ty V c i y i c 2 i σ 2 x i x 2 oberoee! Variase för β är lite om x-värea är utsprea.
Väteväre och varias för skattige µ 0 Föreligar för skattigara β och µ 0 Skattige för fuktiosväret för x 0 var: µ 0 α + β x 0 E µ 0 E α + β x 0 E i + c i x 0 Y i... α + βx 0 µ 0 väteväresriktigt V µ 0 V α + β x 0 V / + c i x 0 x Y i... σ 2 / + x 0 x 2 / Variase är stor är x 0 ligger lågt ifrå x. För x 0 0 får ma skattige för iterceptet α. β α c i y i me c i x i x i y i me i c i x ɛ i N0, σ... som vi hae atagit y i α + βx i + ɛ i... var moell y i N α + βx i, σ... y i lijärkombiatio av ɛ i Slumpvariablera y i är ormalförelae α, β och µ 0 är också ormalförelae! Förelig för skattigara β och µ 0 Skattigara β och µ 0 är ormalförelae me: E β β V β σ2 me x i x 2 E µ 0 µ 0 V µ 0 σ2 / + x 0 x 2 / Det betyer: β N β, µ 0 N µ 0, σ σ + x 0 x 2 Itervallskattig för lutige β är σ är kä Förelig för β me kä σ 0 : β Nβ, D me D σ 0 β β D Referesvariabel omfattas me kvatilera: λ α/2 < β β λ α/2 D N0, β obs λ α/2 D < β β obs + λ α/2 D Koesitervall me koesgra α: Iβ β obs ± λ α/2 D
Itervallskattig för målvariabel µ 0 är σ är kä Koesitervall för målvariabel µ 0 Förelig för µ 0 me kä σ 0: µ 0 N µ 0, D me D σ 0 + x 0 x 2 µ 0 µ 0 D N0, Referesvariabel omfattas me kvatilera: λ α/2 < µ 0 µ 0 λ α/2 D µ obs λ α/2 D < µ 0 µ obs + λ α/2 D Koesitervall me koesgra α: µ obs ± λ α/2 D Figur: Skattig för målvariabel me koesitervall Itervallskattig för lutige β är σ är okä Är σ okä skattas et me s Q 0 / 2 Referesvariabel: β β tf me s och f 2 Referesvariabel omfattas me kvatilera: t α/2 < β β t α/2 β obs t α/2 < β β obs + t α/2 Koesitervall me koesgra α: Exempel 4.2: Bilirubihalt x och proteikocetratio y. 0.25 S yy 26299 S xy 43.455 β 355.2 Sökes: 95% koesitervall för lutige β: Q 0 S yy S2 xy 26299 43.4552 0.25 0973 s Q 0 / 2 0973/20 2 24.7 S s 24.7 xx 0.25 70.9 t α/2 2 t 0.025 8 2. Iβ β obs ± t α/2 2 355.2 ± 2. 70.9 20, 500 Iβ β obs ± t α/2 2
Itervallskattig för målvariabel µ 0 är σ är okä Är σ okä skattas et me s Q 0 / 2 E referesvariabel är: µ 0 µ 0 t 2 me s + x 0 x 2 Exempel 4.2: Bilirubihalt x och proteikocetratio y. x 0.5 0.25 α 57.5 β 355.2 s 24.7 samma s Q 0 / 2 me aat Sökes: 95% koesitervall för µ 0 är x 0 0.2: Referesvariabel omfattas me kvatilera: t α/2 < µ 0 µ 0 t α/2 µ obs t α/2 < µ µ obs + t α/2 µ 0 α + β x 0 57.5 + 355.2 0.2 29 s + x 0 x 2 24.7 20 + 0.2 0.52 0.25 8.38 Koesitervall me koesgra α: µ obs ±t α/2 2 29±t 0.025 8 8.38 0, 50 µ obs ± t α/2 2 Itervallskattig för β och µ 0 σ kä σ okä β β D N0, β β t 2 D S σ s xx s Q 0 / 2 Sammafattig uktskattig för lutig, itercept och målvariabel uktskattig för σ brus Iβ β ± λ α/2 D Iβ β ± t α/2 Q 0 S yy S 2 xy Väteväre och varias för skattigara β och µ 0 Itervallskattig för lutig och målvariabel me kät σ Itervallskattig för lutig och målvariabel me skatta σ µ 0 µ 0 N0, D D σ + x 0 x 2 µ 0 µ 0 t 2 s + x 0 x 2 S xy x i y i x ȳ µ ± λ α/2 D µ ± t α/2