Föreläsning 11, FMSF45 Konfidensintervall

Relevanta dokument
Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

9. Konfidensintervall vid normalfördelning

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

F9 Konfidensintervall

Avd. Matematisk statistik

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12: Linjär regression

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsningsanteckningar till kapitel 8, del 2

Matematisk statistik för B, K, N, BME och Kemister

Lufttorkat trä Ugnstorkat trä

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Matematisk statistik för B, K, N, BME och Kemister

TMS136. Föreläsning 10

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Föreläsning 2, FMSF45 Slumpvariabel

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

10. Konfidensintervall vid två oberoende stickprov

Föreläsning 12: Regression

Avd. Matematisk statistik

Matematisk statistik för B, K, N, BME och Kemister

f(x) = 2 x2, 1 < x < 2.

Mer om konfidensintervall + repetition

Föreläsningsanteckningar till kapitel 9, del 2

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Avd. Matematisk statistik

Avd. Matematisk statistik

FÖRELÄSNING 7:

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Matematisk statistik KTH. Formelsamling i matematisk statistik

Avd. Matematisk statistik

TMS136. Föreläsning 11

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Avd. Matematisk statistik

Stickprovsvariabeln har en fördelning / sprindning

TMS136. Föreläsning 13

Matematisk statistik för D, I, Π och Fysiker

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Avd. Matematisk statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

FÖRELÄSNING 8:

SF1901: Medelfel, felfortplantning

Avd. Matematisk statistik

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 17, Matematisk statistik Π + E

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Föreläsning 5: Hypotesprövningar

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Formler och tabeller till kursen MSG830

Föreläsning 12: Repetition

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

SF1911: Statistik för bioteknik

Avd. Matematisk statistik

TAMS65 - Föreläsning 6 Hypotesprövning

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Kurssammanfattning MVE055

F10 Problemlösning och mer om konfidensintervall

Statistiska metoder för säkerhetsanalys

Avd. Matematisk statistik

TAMS65 - Föreläsning 6 Hypotesprövning

Transkript:

Repetition Konfidensintervall I Fördelningar Konfidensintervall II Föreläsning 11, FMSF45 Konfidensintervall Stas Volkov 2017-11-7 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 1/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall II Stickprov & Skattning Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 2/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall II Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) i=1 ) 2 Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskr.) (kont.) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 3/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1(X 1,..., X n ) < θ < a 2(X 1,..., X n ) = 1 α Ett ensidigt konfidensintervall är en skattning a 1 eller a 2 ( ) P a 1(X 1,..., X n ) < θ < = 1 α ( eller ) P < θ < a 2(X 1,..., X n ) = 1 α så att Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 4/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 5/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) α-kvantil, x α En kvantil, x α, till en stokastisk variabel X är en gräns som överskrids med sannolikhet α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α Sats 6.1 Standardiserad normalfördelning Om X N(μ, σ), E(X) = μ, V(X) = σ 2 så är X μ σ N(0, 1) med kvantiler λ α Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 6/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ känd En skattning av μ är: μ = 1 n n i=1 med E(μ ) = μ och D(μ ) = σ n. Enligt Sats 6.1 är μ μ D(μ ) X i N (0, 1). Vi söker nu två tal så att: ( ) P? < μ μ D(μ ) <? = 1 α Konfidensintervallet för μ blir då: I μ = μ ± λ α/2 D(μ ). Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 7/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall RepetitionII N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), i fallet σ okänd Om σ är okänd ersätts D(μ ) med medelfelet: d(μ ) = s s = 1 n (x i x) n n 1 2 i=1 Men, nu är μ μ d(μ ) inte N(0, 1) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 8/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II χ 2 -fördelning (uttalas chi-två ) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Se Tabell 4. Om X 1,..., X n N(μ, σ) och oberoende så gäller 1 n σ 2 (X i μ) 2 χ 2 (n) och 1 n σ 2 (X i X) 2 χ 2 (n 1) i=1 i=1 0.6 χ 2 fördelning med f = 1, 3, 5, 15 0.4 f = 1 0.2 f = 3 0 0 2 4 6 8 10 12 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 9/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Se Tabell 3. Om X N(0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 t fördelning med f = 1, 2, 4, 8, f = 1 f = och speciellt för X i N(μ, σ) 0 4 2 0 2 4 X μ S/ t(n 1) n där X = 1 n n i=1 X i och S 2 = 1 n 1 n i=1 (X i X) 2 =: Q/f, som råkar vara oberoende (förvånande nog!) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 10/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall χ 2 t II Student William Sealy Gosset Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 11/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Konfidensintervall för μ i N(μ, σ) x 1,..., x n observationer av X i N(μ, σ) σ känd: σ okänd: I μ = μ ± λ α/2 D(μ ) = x ± λ α/2 σ n I μ = μ ± t α/2 (f) d(μ ) = x ± t α/2 (n 1) s n Kvantilerna ges då av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t(n 1) fördelningens α/2-kvantil (Tabell 3) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 12/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Exempel: Sockerinnehåll i sockerbetor Sockerbetor har i regel ett sockerinnehåll på 16 19 % (enligt Wikipedia). Anta att sockerinnehållet i en godtycklig beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 i=1 x i = 16.8 25 i=1 (x i x) 2 = 4.8 Gör ett 95 %-konfidensintervall för den förväntade sockerhalten i betlasset. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 13/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Konfidensintervall baserade på normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): D(θ ) känd känd I θ = θ ± λ α/2 D(θ ) D(θ ) okänd okänd så skattas med d(θ ) I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 14/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Ex: Konfidensintervall för p då X Bin(n, p) Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 15/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Sammanvägd variansskattning Om vi här { x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N (μ y, σ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 Ett konfidensintervall för μ x μ y blir t.ex. = Q ( ) Q f, σ 2 χ2 (f), f = n x + n y 2 I μx μy = x ȳ ± t α/2 (f) s p 1/n x + 1/n y eftersom μ x μ y = X ) (μ Ȳ N x μ y, σ 1 n x + 1 n y Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 16/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell (observera att paret X i och Y i inte är oberoende!) (Före, efter, och skillnad): x 1... x n obs. av X i N(μ i, σ x ) y 1... y n obs. av Y i N(μ i + Δ, σ y ) z 1 = y 1 x 1... z n = y n x n obs. av Z i = Y i X i N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). Skatta Δ med z och gör konfidensintervall som vanligt för ett stickprov, dvs s I Δ = z ± t α/2 (n 1), n där s 2 = 1 n 1 n (z i z) 2. i=1 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 17/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Stickprov i par? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 18/19

Repetition Konfidensintervall I Fördelningar Konfidensintervall N(μ, σ) Ex II1 Sammanfattning Ex 2 Specialfall Ensidiga konfidensintervall Konfidensintervall kan även vara uppåt eller nedåt begränsade. De konstrueras allmänt genom att Ta ena gränsen i ett tvåsidigt konfidensintervall Byt ut α/2 α för att få rätt konfidensgrad Låt den andra gränsen bli så stor/liten som möjligt σ Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 fås n följande ensidiga konfidensintervall: Nedåt begränsat intervall: ( x λ α σ n, + ) Uppåt begränsat intervall: (, x + λ α σ n ) Ensidiga KI är framförallt användbara vid ensidiga hypotestest. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F11: Konfidensintervall 19/19