Repetition Konfidensintervall I Fördelningar Konfidensintervall II Föreläsning 11, FMSF45 Konfidensintervall Stas Volkov 2017-11-7 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 1/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall II Stickprov & Skattning Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 2/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall II Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) i=1 ) 2 Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskr.) (kont.) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 3/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1(X 1,..., X n ) < θ < a 2(X 1,..., X n ) = 1 α Ett ensidigt konfidensintervall är en skattning a 1 eller a 2 ( ) P a 1(X 1,..., X n ) < θ < = 1 α ( eller ) P < θ < a 2(X 1,..., X n ) = 1 α så att Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 4/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 5/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) α-kvantil, x α En kvantil, x α, till en stokastisk variabel X är en gräns som överskrids med sannolikhet α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α Sats 6.1 Standardiserad normalfördelning Om X N(μ, σ), E(X) = μ, V(X) = σ 2 så är X μ σ N(0, 1) med kvantiler λ α Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 6/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ känd En skattning av μ är: μ = 1 n n i=1 med E(μ ) = μ och D(μ ) = σ n. Enligt Sats 6.1 är μ μ D(μ ) X i N (0, 1). Vi söker nu två tal så att: ( ) P? < μ μ D(μ ) <? = 1 α Konfidensintervallet för μ blir då: I μ = μ ± λ α/2 D(μ ). Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 7/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ okänd Om σ är okänd ersätts D(μ ) med medelfelet: d(μ ) = s s = 1 n (x i x) n n 1 2 i=1 Men, nu är μ μ d(μ ) inte N(0, 1) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 8/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II χ 2 -fördelning (uttalas chi-två ) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Se Tabell 4. Om X 1,..., X n N(μ, σ) och oberoende så gäller 1 n σ 2 (X i μ) 2 χ 2 (n) och 1 n σ 2 (X i X) 2 χ 2 (n 1) i=1 i=1 0.6 χ 2 fördelning med f = 1, 3, 5, 15 0.4 f = 1 0.2 f = 3 0 0 2 4 6 8 10 12 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 9/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Se Tabell 3. Om X N(0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 t fördelning med f = 1, 2, 4, 8, f = 1 f = och speciellt för X i N(μ, σ) 0 4 2 0 2 4 X μ S/ t(n 1) n där X = 1 n n i=1 X i och S 2 = 1 n 1 n i=1 (X i X) 2 =: Q/f, som råkar vara oberoende (förvånande nog!) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 10/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II Student William Sealy Gosset Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 11/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Konfidensintervall för μ i N(μ, σ) x 1,..., x n observationer av X i N(μ, σ) σ känd: σ okänd: I μ = μ ± λ α/2 D(μ ) = x ± λ α/2 σ n I μ = μ ± t α/2 (f) d(μ ) = x ± t α/2 (n 1) s n Kvantilerna ges då av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t(n 1) fördelningens α/2-kvantil (Tabell 3) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 12/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Exempel: Sockerinnehåll i sockerbetor Sockerbetor har i regel ett sockerinnehåll på 16 19 % (enligt Wikipedia). Anta att sockerinnehållet i en godtycklig beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 i=1 x i = 16.8 25 i=1 (x i x) 2 = 4.8 Gör ett 95 %-konfidensintervall för den förväntade sockerhalten i betlasset. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 13/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Konfidensintervall baserade på normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): D(θ ) känd känd I θ = θ ± λ α/2 D(θ ) D(θ ) okänd okänd så skattas med d(θ ) I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 14/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Ex: Konfidensintervall för p då X Bin(n, p) Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 15/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Sammanvägd variansskattning Om vi här { x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N (μ y, σ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 Ett konfidensintervall för μ x μ y blir t.ex. = Q ( ) Q f, σ 2 χ2 (f), f = n x + n y 2 I μx μy = x ȳ ± t α/2 (f) s p 1/n x + 1/n y eftersom μ x μ y = X ) (μ Ȳ N x μ y, σ 1 n x + 1 n y Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 16/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell (observera att paret X i och Y i inte är oberoende!) (Före, efter, och skillnad): x 1... x n obs. av X i N(μ i, σ x ) y 1... y n obs. av Y i N(μ i + Δ, σ y ) z 1 = y 1 x 1... z n = y n x n obs. av Z i = Y i X i N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). Skatta Δ med z och gör konfidensintervall som vanligt för ett stickprov, dvs s I Δ = z ± t α/2 (n 1), n där s 2 = 1 n 1 n (z i z) 2. i=1 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 17/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Stickprov i par? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 18/19
Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Ensidiga konfidensintervall Konfidensintervall kan även vara uppåt eller nedåt begränsade. De konstrueras allmänt genom att Ta ena gränsen i ett tvåsidigt konfidensintervall Byt ut α/2 α för att få rätt konfidensgrad Låt den andra gränsen bli så stor/liten som möjligt σ Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 fås n följande ensidiga konfidensintervall: Nedåt begränsat intervall: ( x λ α σ n, + ) Uppåt begränsat intervall: (, x + λ α σ n ) Ensidiga KI är framförallt användbara vid ensidiga hypotestest. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 19/19