Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Relevanta dokument
Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 11: Mer om jämförelser och inferens

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

9. Konfidensintervall vid normalfördelning

F9 Konfidensintervall

Avd. Matematisk statistik

Föreläsning 12: Linjär regression

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik för D, I, Π och Fysiker

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsningsanteckningar till kapitel 8, del 2

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Lufttorkat trä Ugnstorkat trä

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Föreläsning 4: Konfidensintervall (forts.)

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

TMS136. Föreläsning 10

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Föreläsning 12: Regression

Föreläsning 2, FMSF45 Slumpvariabel

Avd. Matematisk statistik

f(x) = 2 x2, 1 < x < 2.

Matematisk statistik för B, K, N, BME och Kemister

10. Konfidensintervall vid två oberoende stickprov

Mer om konfidensintervall + repetition

Föreläsningsanteckningar till kapitel 9, del 2

Avd. Matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Avd. Matematisk statistik

Avd. Matematisk statistik

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Avd. Matematisk statistik

Avd. Matematisk statistik

Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

FÖRELÄSNING 7:

Avd. Matematisk statistik

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1901: Medelfel, felfortplantning

Stickprovsvariabeln har en fördelning / sprindning

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Avd. Matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Avd. Matematisk statistik

TMS136. Föreläsning 11

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

TMS136. Föreläsning 13

SF1911: Statistik för bioteknik

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Matematisk statistik för D, I, Π och Fysiker

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

TAMS65 - Föreläsning 6 Hypotesprövning

Avd. Matematisk statistik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Avd. Matematisk statistik

Föreläsning 12: Repetition

TAMS65 - Föreläsning 6 Hypotesprövning

FÖRELÄSNING 8:

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsning 17, Matematisk statistik Π + E

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F10 Problemlösning och mer om konfidensintervall

Föreläsning 5: Hypotesprövningar

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

Formler och tabeller till kursen MSG830

Transkript:

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 1/19

Stickprov & Skattning Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 2/19

Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) i=1 ) 2 Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskr.) (kont.) Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 3/19

Repetition N(μ, σ) Konfidensintervall Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < a 2 (X 1,..., X n ) = 1 α Ett ensidigt konfidensintervall är en skattning a 1 eller a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < = 1 α eller ( ) P < θ < a 2 (X 1,..., X n ) = 1 α Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 4/19

Repetition N(μ, σ) Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 5/19

Repetition N(μ, σ) α-kvantil, x α En kvantil, x α, till en stokastisk variabel X är en gräns som överskrids med sannolikhet α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α Sats 6.1 Standardiserad normalfördelning Om X N(μ, σ), E(X) = μ, V(X) = σ 2 så är X μ σ N(0, 1) med kvantiler λ α Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 6/19

Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ känd En skattning av μ är: μ = 1 n med E(μ ) = μ och D(μ ) = σ. n Enligt Sats 6.1 är μ μ D(μ ) n i=1 X i N (0, 1). Vi söker nu två tal så att: ( ) P? < μ μ D(μ ) <? = 1 α Konfidensintervallet för μ blir då: I μ = μ ± λ α/2 D(μ ). Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 7/19

Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ okänd Om σ är okänd ersätts D(μ ) med medelfelet: d(μ ) = s s = 1 n (x i x) n n 1 2 i=1 Men, nu är μ μ d(μ ) inte N(0, 1) Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 8/19

χ 2 t χ 2 -fördelning (uttalas chi-två ) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Se Tabell 4. 0.6 χ 2 fördelning med f = 1, 3, 5, 15 Om X 1,..., X n N(μ, σ) och oberoende så gäller 1 σ 2...men 1 σ 2 n (X i μ) 2 χ 2 (n) i=1 n (X i X) 2 χ 2 0 0 2 4 6 8 10 12 (n 1) i=1 0.4 0.2 f = 1 f = 3 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 9/19

χ 2 t Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Se Tabell 3. Om X N(0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 t fördelning med f = 1, 2, 4, 8, f = 1 f = och speciellt för X i N(μ, σ) 0 4 2 0 2 4 X μ S/ t(n 1) n där X = 1 n n i=1 X i, S 2 = Q/f, Q = n i=1 (X i X) 2, och f = n 1. X och S 2 råkar vara oberoende (förvånande nog!) Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 10/19

χ 2 t Student William Sealy Gosset Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 11/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall för μ i N(μ, σ) x 1,..., x n observationer av X i N(μ, σ) σ känd: I μ = μ ± λ α/2 D(μ ) = x ± λ α/2 σ n σ okänd: I μ = μ ± t α/2 (f) d(μ ) = x ± t α/2 (n 1) s n Kvantilerna ges då av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t(n 1) fördelningens α/2-kvantil (Tabell 3) Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 12/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Exempel: Sockerinnehåll i sockerbetor Sockerbetor har i regel ett sockerinnehåll på 16 19 % (enligt Wikipedia). Anta att sockerinnehållet i en godtycklig beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 i=1 x i = 16.8 25 i=1 (x i x) 2 = 4.8 Gör ett 95 %-konfidensintervall för den förväntade sockerhalten i betlasset. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 13/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall baserade på normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): D(θ ) känd känd I θ = θ ± λ α/2 D(θ ) D(θ ) okänd okänd så skattas med d(θ ) I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 14/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ex: Konfidensintervall för p då X Bin(n, p) Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 15/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Sammanvägd variansskattning Om vi här { x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N ( μ y, σ ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 Ett konfidensintervall för μ x μ y blir t.ex. = Q (där f, Q ) σ 2 χ2 (f) I μx μy = x ȳ ± t α/2 (f) s p 1/n x + 1/n y eftersom μ x μ y = X ) (μ Ȳ N x μ y, σ 1 + 1 nx ny Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 16/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell (observera att paret X i och Y i inte är oberoende!) (Före, efter, och skillnad): x 1... x n obs. av X i N(μ i, σ x ) y 1... y n obs. av Y i N(μ i + Δ, σ y ) z 1 = y 1 x 1... z n = y n x n obs. av Z i = Y i X i N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). Skatta Δ med z och gör konfidensintervall som vanligt för ett stickprov, dvs s I Δ = z ± t α/2 (n 1), n där s 2 = 1 n 1 n (z i z) 2. i=1 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 17/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 18/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ensidiga konfidensintervall Konfidensintervall kan även vara uppåt eller nedåt begränsade. De konstrueras allmänt genom att Ta ena gränsen i ett tvåsidigt konfidensintervall Byt ut α/2 α för att få rätt konfidensgrad Låt den andra gränsen bli så stor/liten som möjligt σ Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 fås följande n ensidiga konfidensintervall: σ Nedåt begränsat intervall: ( x λ α n, + ) ) σ Uppåt begränsat intervall: (, x + λ α n Ensidiga KI är framförallt användbara vid ensidiga hypotestest. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F9: Konfidensintervall 19/19