Matematisk statistik för B, K, N, BME och Kemister Föreläsning 5 Johan Lindström 12 september 216 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 1/23 Repetition Gauss approximation Delta metoden Statistik Översikt Grundläggande begrepp Exempel Konfidensintervall Chi 2-fördelning t-fördelning Intervall för N(mu,sigma2) Ensidiga konfidensintervall Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 2/23 Gauss Delta metoden Repetition Gauss approximation Delta metoden Statistik Översikt Grundläggande begrepp Exempel Konfidensintervall Chi 2-fördelning t-fördelning Intervall för N(mu,sigma2) Ensidiga konfidensintervall Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 3/23
Gauss Delta metoden Linjärisering av g(x) kring punkten μ = E(X) g(x) g(µ) + g (µ)(x µ) g(µ) g(x) µ Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 4/23 Gauss Delta metoden Gauss approximationsformler i en variabel (Kap. 5.2) Y = g(x). Taylorutveckla funktionen g kring μ = E(X) E(Y) g(e(x)) V(Y) g [E(X)] 2 V(X) g(x) g(μ) + (X μ)g (μ) = För en funktion av n variabler fås på samma sätt Y = g(x 1,..., X n ) E(Y) g(e(x 1 ),..., E(X n )) V(Y) ci 2 V(X i ) om X i oberoende där c i = g ( ) E(X 1 ),..., E(X n ) x i Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 5/23 Gauss Delta metoden Delta metoden (CGS + Gaussapproximation) Om X 1, X 2,..., X n är oberoende lika fördelade variabler med E(X i ) = μ, V(X i ) = σ 2 så gäller att g(x n ) N (g(μ), g (μ) ) 2 σ2 n då n stort. Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 6/23
Repetition Gauss approximation Delta metoden Statistik Översikt Grundläggande begrepp Exempel Konfidensintervall Chi 2-fördelning t-fördelning Intervall för N(mu,sigma2) Ensidiga konfidensintervall Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 7/23 Exempel: Kvalitetskontroll Vi kontrollerar n st slumpmässigt utvalda komponenter från ett stort parti och ser om de fungerar. Modell: X =antalet trasiga komponenter X Bin(n, p), där p är andelen trasiga kommponenter. p är okänd en parameter i fördelningen. Möjliga frågeställlningar: 1. Vad är en bra uppskattning av p? 2. Hur stor är osäkerheten i uppskattningen? 3. Vilket intervall tror vi p ligger inom? 4. Hur stort måste n vara för att uppnå en tillräckligt liten osäkerhet? Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 8/23 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev.13, kan rätt värde på den okända storheten ändå vara.1? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar) undersöker effekten av olika faktorer (behandlingar)? Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 9/23
Statistikteori: Grundläggande begrepp (Kap. 7.1) Stickprov Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. Skattning En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. Bra egenskaper för en skattning är Väntevärdesriktig: E(θ ) = θ, inget systematiskt fel. Effektiv: liten varians (osäkerhet) V(θ ). Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 1/23 Exempel: Mätning med slumpmässigt mätfel Antag att vi vill mäta en storhet μ. Om man tar upp n st mätvärden, x 1,..., x n är dessa observationer av X i = μ + ε i = Rätt värde + Mätfel där ε i är ett slumpmässigt mätfel. Bestäm skattningar av 1. Medelvärdet μ n. 2. Variansen ( σ 2). Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 11/23 Variation i observationer ger variation i skattningen Observationer, x jk μ = x j 1 4.83 4.93 5.24 5.12 5.1 4.69 5.62 4.73 5.3 2 5.9 5.13 4.53 4.59 4.7 4.1 4.96 5.26 4.79 3 5.53 5.1 4.34 5.5 5.21 4.43 4.3 4.56 4.82 4 4.48 5.1 4.75 5.17 4.98 5.1 5.82 5.12 5.5 5 5.14 5.1 4.79 5.48 4.7 5.89 5.22 5.91 5.28 6 4.8 5.33 5.22 5.26 4.45 4.12 5.29 5.9 4.95 7 5.2 5.26 5.49 5.6 4.83 5.28 4.38 5.18 5.15 8 4.48 4.81 4.62 4.61 5.4 4.81 4.32 4.41 4.64. Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 12/23
.8 Observationernas fördelning.6.4.2 3 3.5 4 4.5 5 5.5 6 6.5 7 2.5 Skattningarnas fördelning 2 1.5 1.5 3 3.5 4 4.5 5 5.5 6 6.5 7 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 13/23 χ 2 t N(μ, σ 2 ) Ensidiga Repetition Gauss approximation Delta metoden Statistik Översikt Grundläggande begrepp Exempel Konfidensintervall Chi 2-fördelning t-fördelning Intervall för N(mu,sigma2) Ensidiga konfidensintervall Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 14/23 χ 2 t N(μ, σ 2 ) Ensidiga Konfidensintervall (Kap. 7.3) Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är.95,.99 och.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < a 2 (X 1,..., X n ) = 1 α Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 15/23
χ 2 t N(μ, σ 2 ) Ensidiga Andelen 1 α av intervallen täcker rätt värde i långa loppet 1 st 95% konfidensint. för µ i N(µ,2) 1 9 8 7 1 st 95% konfidensint. för µ i N(µ,σ) 1 9 8 7 Intervall nr 6 5 4 Intervall nr 6 5 4 3 3 2 2 1 1.5 1 1.5 2.5 1 1.5 2 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 16/23 χ 2 t N(μ, σ 2 ) Ensidiga χ 2 -fördelning (chi-två) (Kap. 7.2.1) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Tabell 4..6 χ 2 fördelning med f = 1, 3, 5, 15 Om X 1,..., X n N ( μ, σ 2) och oberoende så gäller 1 σ 2 1 σ 2 (X i μ) 2 χ 2 (n) (X i X) 2 χ 2 2 4 6 8 1 12 (n 1).4.2 f = 1 f = 3 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 17/23 χ 2 t N(μ, σ 2 ) Ensidiga Student s t-fördelning (Kap. 7.2.2) X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Tabell 3. Om X N (, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) och speciellt för X i N ( μ, σ 2) där X μ S/ t(n 1) n X = 1 n.4.2 X i och S 2 = 1 n 1 t fördelning med f = 1, 2, 4, 8, f = 1 f = 4 2 2 4 (X i X) 2 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 18/23
χ 2 t N(μ, σ 2 ) Ensidiga Konfidensintervall för μ i N ( μ, σ 2) (Kap. 7.3) x 1,..., x n observationer av X i N ( μ, σ 2) σ 2 känd: σ I μ = x ± λ α/2 n = μ ± λ α/2 D(μ ) σ 2 okänd: I μ = x ± t α/2 (n 1) s n = μ ± t α/2 (f)d(μ ) Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 2/23 χ 2 t N(μ, σ 2 ) Ensidiga Exempel: Sockerinnehåll i betor Sockerbetor har i regel ett sockerinnehåll på 16 18% (enligt Dansukkers hemsida). Anta att sockerinnehållet i en godtycklig beta beskrivas av X i N ( μ, σ 2) med σ 2 okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 x i = 16.8 25 (x i x) 2 = 4.8 Gör ett 95%-konfidensintervall för den förväntade sockerhalten i betlasset. Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 21/23 χ 2 t N(μ, σ 2 ) Ensidiga Konfidensintervall för σ 2 i N ( μ, σ 2) (Kap. 8.1.2) x 1,..., x n observationer av X i N ( μ, σ 2) Ett 1 α konfidensintervall för σ 2 ges av ( ) Iσ 2 (n 1)s 2 (n 1)s 2 = χ 2 α/2 (n 1), χ 2 1 α/2 (n 1) Där s 2 = 1 n 1 (x i x) 2 och χ 2 α/2 (n 1) är χ2 -fördelningens kvantiler. Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 22/23
χ 2 t N(μ, σ 2 ) Ensidiga Ensidiga konfidensintervall (Kap. 7.3.4) Konfidensintervall kan även vara uppåt- eller nedåt begränsade. 1. Ta ena gränsen i ett tvåsidigt konfidensintervall 2. Byt ut α/2 α för att få rätt konfidensgrad 3. Låt den andra gränsen bli så stor/liten som möjligt Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 σ n är Nedåt begränsat intervall: ( x λ α σ n, ) Uppåt begränsat intervall: (, x + λ α σ n ) Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 23/23