Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 2/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 3/23
Konfidensintervall (Kap. 9.1.2 & 9.2.2 & 9.3.2 Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är.95,.99 och.999. Normalfördelad skattning, θ N (θ, V(θ D(θ känd: I θ = θ ± λ α/2 D(θ D(θ okänd: I θ = θ ± t α/2 (fd(θ Normalapproximation, θ N (θ, V(θ (Ex: CGS D(θ känd: I θ = θ ± λ α/2 D(θ D(θ okänd: I θ = θ ± λ α/2 d(θ (alltid λ-kvantil Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 4/23 Konfidensintervall för σ 2 i N ( μ, σ 2 (Kap. 8.1.2 x 1,..., x n observationer av X i N ( μ, σ 2 Ett 1 α konfidensintervall för σ 2 ges av ( Iσ 2 (n 1s 2 (n 1s 2 = χ 2 α/2 (n 1, χ 2 1 α/2 (n 1 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 5/23 Hypotestest Vilken metod? Normalfördelad skattning. σ känd: Vilken som helst. σ okänd: Direktmetoden kräver t-fördelningens fördelningsfunktion. Fördelning där μ = X N (μ, V(μ... enl. CGS. Vilken som helst Bin, Po,... där D(θ innehåller θ. Direktmetoden Går alltid att använda, ibland med normalapproximation. Testkvantitet Kräver normalt normalapproximation. Vid styrkefunktion är det naturligt att utgå från testkvantitet. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 6/23
Testkvantiter Antag att vi vill testa H : θ = θ. Model Skattning T(X D(θ /d(θ kvantil X i N ( μ, σ 2 σ känd μ = X μ μ λ X Bin(n, p X i Po(μ Notera: σ okänd p = X n μ = X D(μ μ μ d(μ p p D (p μ μ D (μ 1. Standardavvikelse/medelfel räknas under H. 2. Bin och Po fallet kräver normalapproximation. 3. α-kvantil om ensidigt, α/2-kvantil om tvåsidigt. σ n s n p (1 p n μ n t(f λ λ Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 7/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 8/23 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor sannolikhet. Hypotestest Om gissningen blev.13, kan rätt värde på den okända storheten ändå vara.1? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar undersöker effekten av olika faktorer (behandlingar? Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 9/23
Enkel linjär regression (Kap. 1 Det verkar finnas ett linjärt samband mellan x och y. 2 Orenhet i färg 18 16 Orenhet y [%] 14 12 ( x i, y i 1 8 2 25 3 35 4 45 Omröringshastighet x [rpm] Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Modell (Kap. 1.2 Vi har n st par av mätvärden (x i, y i, i = 1,..., n där y i är observationer av Y i = α + βx i + ε i där ε i är oberoende av varandra, och ε i N (, σ 2. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 11/23 14 12 1 Observationer Skattad regressionslinje Verklig regressionslinje Fördelning för Yi 8 6 4 2 1 2 3 4 5 6 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 12/23
Parameterskattningarna (Kap. 1.4 1.5 Skattningarna av α, β β = n (x i x(y i ȳ n (x i x 2 α = ȳ β x och s 2 = (σ 2 är s 2 = Q n 2 där Q = Q σ 2 χ2 (n 2 = S xy n N (β, σ2 ( 1n N (α, σ 2 + x2 (y i α β x i 2 = S yy S2 xy Skattningarna α och β är dock inte oberoende av varandra. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 13/23 Räkna ut kvadratsummorna För att räkna ut kvadratsummorna, S yy och S xy kan man ha användning av sambanden = S yy = S xy = n ( n (x i x 2 = n ( n (y i ȳ 2 = x 2 i y 2 i n x 2 nȳ 2 n ( n (x i x(y i ȳ = x i y i n xȳ Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 14/23 Exempel, x-cu-konc. y-absorption Vi har följande 1 par av mätvärden i: 1 2 3 4 5 6 7 8 9 1 x i : 5 5 1 1 15 15 2 2 y i :.5.3.92.84.185.185.329.32.372.336 För att skatta parametrarna i regressionsmodellen behövs n = 1, xi y i = 282.5, xi = 1, x 2 i = 15, yi = 1.877, y 2 i =.5347 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 15/23
Konfidens- och prediktionsintervall För ett givet x-värde, x = x, kan vi skatta Y-s väntevärde med μ = α + β x dvs en punkt på den skattade linjen. Konfidensintervall (Kap. 1.6 Konfidensintervall för linjen, μ, vid x : I μ = α + β x ± t a/2 (n 2 s 1 n + (x x 2 Prediktionsintervall (Kap. 1.7 Prediktionsintervall för en ny mätning, Y(x, vid x : I Y(x = α + β x ± t a/2 (n 2 s 1 + 1 n + (x x 2 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 16/23 Konfidens- och prediktionsintervall.5 Konfidensintervall för µ(x och prediktionsintervall.4.3 Absorption.2.1.1.2 5 5 1 15 2 25 Kopparkoncentration Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 17/23 Om man observerat ett värde y av y, vad blir då x? Man kan lösa ut x ur y = α + β x och får x = y α β Denna skattning är inte normalfördelad, men Delta metoden ger ett approximativt värde på D(x. (Kap. 1.8 för x givet en mätning y, vid x : I x = x ± t s a/2(n 2 β 1 + 1 n + (x x2 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 18/23
.5 då y =.2.4.3 Absorption.2.1.1.2 5 5 1 15 2 25 Kopparkoncentration Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 19/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 2/23 Residualanalys/Modellvalidering (Kap. 1.1 För att undersöka hur bra modellen stämmer kan vi kan studera residualerna, dvs avvikelserna mellan observerade y-värden och den skattade linjen. e i = y i α β x i, i = 1,..., n Dessa är observationer av ε i, och residualerna bör alltså: se ut att komma från en och samma normalfördelning vara oberoende av varandra vara oberoende av alla x i. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 21/23
1 Residualer 1 Residualer mot x 5 5 e e 5 5 1 1 2 3 1:n Probability.99.98.95.9.75.5.25.1.5.2.1 1 1 2 3 x Normal Probability Plot 5 5 Data Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 22/23 Mindre bra residualplottar 1 Residualer, kvadratisk trend Residualer mot x, variansen ökar med x 3 e 5 e 2 1 1 5 1 2 3 1:n 2 1 2 3 x I en modellvalidering bör man även testa H : β = H 1 : β Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 23/23