Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Relevanta dokument
Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 11: Mer om jämförelser och inferens

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

9. Konfidensintervall vid normalfördelning

F9 Konfidensintervall

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Matematisk statistik för B, K, N, BME och Kemister

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Avd. Matematisk statistik

Föreläsning 12: Linjär regression

Matematisk statistik för D, I, Π och Fysiker

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Lufttorkat trä Ugnstorkat trä

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Matematisk statistik för B, K, N, BME och Kemister

Mer om konfidensintervall + repetition

Föreläsningsanteckningar till kapitel 8, del 2

Föreläsning 12: Regression

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Föreläsningsanteckningar till kapitel 9, del 2

f(x) = 2 x2, 1 < x < 2.

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

10. Konfidensintervall vid två oberoende stickprov

Formel- och tabellsamling i matematisk statistik

Föreläsning 4: Konfidensintervall (forts.)

Avd. Matematisk statistik

TMS136. Föreläsning 10

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Stickprovsvariabeln har en fördelning / sprindning

Avd. Matematisk statistik

Avd. Matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

TMS136. Föreläsning 11

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Avd. Matematisk statistik

FÖRELÄSNING 7:

Avd. Matematisk statistik

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TMS136. Föreläsning 13

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

TAMS65 - Föreläsning 6 Hypotesprövning

Avd. Matematisk statistik

Avd. Matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

FÖRELÄSNING 8:

TAMS65 - Föreläsning 6 Hypotesprövning

F10 Problemlösning och mer om konfidensintervall

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

SF1901: Medelfel, felfortplantning

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Avd. Matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Avd. Matematisk statistik

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Föreläsning 8: Konfidensintervall

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Matematisk statistik 9 hp Föreläsning 3: Transformation och simulering

Föreläsning 17, Matematisk statistik Π + E

Hypotestest och fortsättning av skattningar och konfidensintervall

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Avd. Matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Matematisk statistik för B, K, N, BME och Kemister

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

SF1911: Statistik för bioteknik

Transkript:

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall Anna Lindgren 7+8 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 1/19

Stickprov & Skattning Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 2/19

Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) ) 2 Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X1 (x 1 )... p Xn (x n ) L(θ) = f X1 (x 1 )... f Xn (x n ) (diskr.) (kont.) Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 3/19

Repetition N(μ, σ) Konfidensintervall Ett konfidensintervall för parametern θ täcker det sanna värdet på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < a 2 (X 1,..., X n ) = 1 α Ett ensidigt konfidensintervall är en skattning a 1 eller a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < = 1 α eller ( ) P < θ < a 2 (X 1,..., X n ) = 1 α Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 4/19

Repetition N(μ, σ) Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 5/19

Repetition N(μ, σ) α-kvantil, x α En kvantil, x α, till en s.v. X är den gräns som överskrids med slh α. Den fås som lösning till någon av följande ekvationer. F X (x α ) = 1 α xα f X (x) dx = 1 α x α f X (x) dx = α Sats 6.1 Standardiserad normalfördelning Om X N(μ, σ), E(X) = μ, V(X) = σ 2 så är X μ σ N(0, 1) med kvantiler λ α Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 6/19

Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), σ känd 1. En skattning av μ är: μ = 1 n 2. Med E(μ ) = μ och D(μ ) = σ. n 3. Enligt Sats 6.1 är μ μ D(μ ) n X i N (0, 1). 4. Vi söker nu tal så att: ( ) P? < μ μ D(μ ) <? = 1 α 5. Konfidensintervallet för μ är: I μ = μ ± λ α/2 D(μ ). Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 7/19

Repetition N(μ, σ) Konfidensintervall för μ då X i N (μ, σ), σ okänd Om σ är okänd ersätts D(μ ) med medelfelet: d(μ ) = s s = 1 n (x i x) n n 1 2 Men, nu är μ μ d(μ ) inte N(0, 1). Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 8/19

χ 2 t χ 2 -fördelning (chi-två) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Tabell 4. 0.6 χ 2 fördelning med f = 1, 3, 5, 15 Om X 1,..., X n N(μ, σ) och oberoende så gäller 1 σ 2 1 σ 2 n (X i μ) 2 χ 2 (n) n (X i X) 2 χ 2 0 0 2 4 6 8 10 12 (n 1) 0.4 0.2 f = 1 f = 3 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 9/19

χ 2 t Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Tabell 3. Om X N(0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 t fördelning med f = 1, 2, 4, 8, f = 1 f = och speciellt för X i N(μ, σ) där X μ S/ t(n 1) n X = 1 n n X i och S 2 = 1 n 1 0 4 2 0 2 4 n (X i X) 2 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 10/19

χ 2 t Student William Sealy Gosset Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 11/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall för μ i N(μ, σ) x 1,..., x n observationer av X i N(μ, σ) σ känd: I μ = μ ± λ α/2 D(μ ) = x ± λ α/2 σ n σ okänd: I μ = μ ± t α/2 (f) d(μ ) = x ± t α/2 (n 1) s n Kvantilerna ges av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t(n 1)-fördelningens α/2-kvantil (Tabell 3) Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 12/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Exempel: Sockerinnehåll i betor Sockerbetor har i regel ett sockerinnehåll på 16 18 % (enligt Dansukkers hemsida). Anta att sockerinnehållet i en godtyckligt vald beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 x i = 16.8 25 (x i x) 2 = 4.8 Gör ett 95 %-konfidensintervall för den förväntade sockerhalten i betlasset. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 13/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Konfidensintervall baserade på normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): D(θ ) känd I θ = θ ± λ α/2 D(θ ) D(θ ) okänd, skattas med d(θ ) I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 14/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ex: Konfidensintervall för p då X Bin(n, p) Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300 aprildagarna under perioden 1988 1997 så snöade det under 71 dagar. Antag att olika dagar är oberoende av varandra. Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt vald aprildag i Målilla. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 15/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Sammanvägd variansskattning Om vi har x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N ( μ y, σ ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 = Q f, ( Q σ 2 χ2 (f)) Ett konfidensintervall för μ x μ y blir t.ex. 1 I μx μy = x ȳ ± t α/2 (f) s p + 1 n x n y eftersom μ x μ y = X Ȳ N(μ x μ y, σ 1 n + 1 x n ) y Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 16/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell (observera att paret X i och Y i inte är oberoende!) Före: x 1,..., x n obs. av X i N(μ i, σ x ) Efter: y 1,..., y n obs. av Y i N(μ i + Δ, σ y ) Diff: z 1,..., z n obs. av Z i = Y i X i N(Δ, σ) Vi vill nu skatta effekten av behandlingen (Δ). Skatta Δ med z och gör konfidensintervall som vanligt för ett stickprov, dvs s I Δ = z ± t α/2 (n 1), n där s 2 = 1 n 1 n (z i z) 2. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 17/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Stickprov i par? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 18/19

N(μ, σ) Ex 1 Sammanfattning Ex 2 Specialfall Ensidiga konfidensintervall Konfidensintervall kan även vara uppåt eller nedåt begränsade. De konstrueras allmänt genom att 1. Ta ena gränsen i ett tvåsidigt konfidensintervall 2. Byt ut α/2 α för att få rätt konfidensgrad 3. Låt den andra gränsen bli så stor/liten som möjligt Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 ensidiga konfidensintervall Nedåt begränsat intervall: ( x λ α σ n, ) Uppåt begränsat intervall: (, x + λ α σ n fås följande σ n ) Ensidiga konfidensintervall är framförallt användbara vid ensidiga hypotestest. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F11: Konfidensintervall 19/19