Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall Anna Lindgren 7+8 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 1/19
Stickprov & Skattning Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 2/19
Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) ) 2 Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X1 (x 1 )... p Xn (x n ) L(θ) = f X1 (x 1 )... f Xn (x n ) (diskr.) (kont.) Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 3/19
Repetition N(μ, σ) Konfidensintervall Ett konfidensintervall för parametern θ täcker det sanna värdet på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < a 2 (X 1,..., X n ) = 1 α Ett ensidigt konfidensintervall är en skattning a 1 eller a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < = 1 α eller ( ) P < θ < a 2 (X 1,..., X n ) = 1 α Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 4/19
Repetition N(μ, σ) Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 5/19
Repetition N(μ, σ) α-kvantil, x α En kvantil, x α, till en s.v. X är den gräns som överskrids med slh α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α Sats 6.1 Standardiserad normalfördelning Om X N(μ, σ), E(X) = μ, V(X) = σ 2 så är X μ σ N(0, 1) med kvantiler λ α Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 6/19
Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), σ känd 1. En skattning av μ är: μ = 1 n 2. Med E(μ ) = μ och D(μ ) = σ. n 3. Enligt Sats 6.1 är μ μ D(μ ) n X i N (0, 1). 4. Vi söker nu tal så att: ( ) P? < μ μ D(μ ) <? = 1 α 5. Konfidensintervallet för μ är: I μ = μ ± λ α/2 D(μ ). Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 7/19
Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), σ okänd Om σ är okänd ersätts D(μ ) med medelfelet: d(μ ) = s s = 1 n (x i x) n n 1 2 Men, nu är μ μ d(μ ) inte N(0, 1). Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 8/19
χ 2 t χ 2 -fördelning (chi-två) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Tabell 4. 0.6 χ 2 fördelning med f = 1, 3, 5, 15 Om X 1,..., X n N(μ, σ) och oberoende så gäller 1 σ 2 1 σ 2 n (X i μ) 2 χ 2 (n) n (X i X) 2 χ 2 0 0 2 4 6 8 10 12 (n 1) 0.4 0.2 f = 1 f = 3 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 9/19
χ 2 t Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Tabell 3. Om X N(0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 t fördelning med f = 1, 2, 4, 8, f = 1 f = och speciellt för X i N(μ, σ) där X μ S/ t(n 1) n X = 1 n n X i och S 2 = 1 n 1 0 4 2 0 2 4 n (X i X) 2 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 10/19
χ 2 t Student William Sealy Gosset Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 11/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall för μ i N(μ, σ) x 1,..., x n observationer av X i N(μ, σ) σ känd: I μ = μ ± λ α/2 D(μ ) = x ± λ α/2 σ n σ okänd: I μ = μ ± t α/2 (f) d(μ ) = x ± t α/2 (n 1) s n Kvantilerna ges av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t(n 1)-fördelningens α/2-kvantil (Tabell 3) Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 12/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Exempel: Sockerinnehåll i betor Sockerbetor har i regel ett sockerinnehåll på 16 18 % (enligt Dansukkers hemsida). Anta att sockerinnehållet i en godtyckligt vald beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 x i = 16.8 25 (x i x) 2 = 4.8 Gör ett 95 %-konfidensintervall för den förväntade sockerhalten i betlasset. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 13/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall baserade på normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): D(θ ) känd I θ = θ ± λ α/2 D(θ ) D(θ ) okänd, skattas med d(θ ) I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 14/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ex: Konfidensintervall för p då X Bin(n, p) Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 15/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Sammanvägd variansskattning Om vi har x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N ( μ y, σ ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 = Q f, ( Q σ 2 χ2 (f)) Ett konfidensintervall för μ x μ y blir t.ex. 1 I μx μy = x ȳ ± t α/2 (f) s p + 1 n x n y eftersom μ x μ y = X Ȳ N(μ x μ y, σ 1 n + 1 x n ) y Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 16/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell (observera att paret X i och Y i inte är oberoende!) Före: x 1,..., x n obs. av X i N(μ i, σ x ) Efter: y 1,..., y n obs. av Y i N(μ i + Δ, σ y ) Diff: z 1,..., z n obs. av Z i = Y i X i N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). Skatta Δ med z och gör konfidensintervall som vanligt för ett stickprov, dvs s I Δ = z ± t α/2 (n 1), n där s 2 = 1 n 1 n (z i z) 2. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 17/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 18/19
N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ensidiga konfidensintervall Konfidensintervall kan även vara uppåt eller nedåt begränsade. De konstrueras allmänt genom att 1. Ta ena gränsen i ett tvåsidigt konfidensintervall 2. Byt ut α/2 α för att få rätt konfidensgrad 3. Låt den andra gränsen bli så stor/liten som möjligt Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 ensidiga konfidensintervall Nedåt begränsat intervall: ( x λ α σ n, ) Uppåt begränsat intervall: (, x + λ α σ n fås följande σ n ) Ensidiga konfidensintervall är framförallt användbara vid ensidiga hypotestest. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 19/19