Matematisk statistik för D, I, Π och Fysiker

Relevanta dokument
Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Thomas Önskog 28/

SF1901 Sannolikhetsteori och statistik I

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik för B, K, N, BME och Kemister

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

9. Konfidensintervall vid normalfördelning

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsningsanteckningar till kapitel 8, del 2

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12, FMSF45 Hypotesprövning

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

f(x) = 2 x2, 1 < x < 2.

TMS136. Föreläsning 10

Matematisk statistik för B, K, N, BME och Kemister

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Avd. Matematisk statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Matematisk statistik KTH. Formelsamling i matematisk statistik

F9 Konfidensintervall

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Avd. Matematisk statistik

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Föreläsning 8: Konfidensintervall

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

Formel- och tabellsamling i matematisk statistik

Föreläsning 12: Linjär regression

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Medelfel, felfortplantning

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsningsanteckningar till kapitel 9, del 2

Mer om konfidensintervall + repetition

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

10. Konfidensintervall vid två oberoende stickprov

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

Avd. Matematisk statistik

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Föreläsning 17, Matematisk statistik Π + E

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Lufttorkat trä Ugnstorkat trä

Matematisk statistik för B, K, N, BME och Kemister

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Föreläsning 7. Statistikens grunder.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Avd. Matematisk statistik

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Matematisk statistik för D, I, Π och Fysiker

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Tentamen i Matematisk Statistik, 7.5 hp

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Grundläggande matematisk statistik

Avd. Matematisk statistik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Avd. Matematisk statistik

Grundläggande matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Avd. Matematisk statistik

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Uppgift 1. f(x) = 2x om 0 x 1

1 e (λx)β, för x 0, F X (x) = 0, annars.

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 12: Regression

Avd. Matematisk statistik

TMS136. Föreläsning 11

Föreläsning 7: Punktskattningar

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

Avd. Matematisk statistik

SF1901: Sannolikhetslära och statistik

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

FÖRELÄSNING 7:

Föreläsning 7: Punktskattningar

Kapitel 9 Egenskaper hos punktskattare

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Transkript:

Matematisk statistik för D, I, Π och Fysiker Föreläsning 11 Johan Lindström 13 november 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 1/25 Repetition Stickprov & Skattning Maximum likelihood & Minsta kvadrat Översikt Repetition: Kvantil & N (0, 1) Chi 2-fördelning t-fördelning Intervall för μ i N (μ, σ) Exempel Ensidiga konfidensintervall Jämförelse av två μ Två stickprov Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 2/25 Stickprov & Skattning ML & MK Översikt Repetition Stickprov & Skattning Maximum likelihood & Minsta kvadrat Översikt Repetition: Kvantil & N (0, 1) Chi 2-fördelning t-fördelning Intervall för μ i N (μ, σ) Exempel Ensidiga konfidensintervall Jämförelse av två μ Två stickprov Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 3/25

Stickprov & Skattning ML & MK Översikt Statistikteori, grundläggande begrepp (Kap. 9, 11.1 11.3) Stickprov (Def. 9.1) Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. Punktskattning (Def. 11.1) En punktskattning, θ (x 1,..., x n ), av en observation av den s.v. θ (X 1,..., X n ). θ (x 1,..., x n ) kan också ses som en funktion av ett stickprov eller motsvarande stokastiska variabler. Båda betecknas oftast bara med θ. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 4/25 Stickprov & Skattning ML & MK Översikt En skattning θ är ett tal, en s.v. och en funktion θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 5/25 Stickprov & Skattning ML & MK Översikt Egenskaper hos skattaning (Kap. 11.3) Väntevärdesriktig (Def. 11.2): E(θ ) = θ, inget systematiskt fel. Konsistent (Def. 11.3): P ( θ n θ > ε) 0, n, Bli rätt med många observationer, Medelkvadratfel (Def. 11.4): Medelkvadratfelet Mean Squared Error (MSE) hos en skattning ges av E ( (θ θ) 2) = V(θ ) + E (θ θ) 2 Effektiv (Def. 11.5): Skatntingen θ 1 är effektivare än θ 2 om V ( θ 1) < V ( θ 2 ). Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 6/25

Stickprov & Skattning ML & MK Översikt Maximum likelihood, ML (Kap. 11.5) ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskr.) (kont.) Minsta kvadrat, MK (Kap. 11.6) Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen m.a.p. θ. Q(θ) = n ( x i μ i (θ) ) 2 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 7/25 Stickprov & Skattning ML & MK Översikt Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev 0.013, kan rätt värde på den okända storheten ändå vara 0.01? Styrkefunktion Hur många mätningar måste vi göra för att upptäcka en skillnad mellan 0.013 och 0.01? Regression Hur vet vi om två (eller fler) variabler påverkar varandra? Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 8/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga Repetition Stickprov & Skattning Maximum likelihood & Minsta kvadrat Översikt Repetition: Kvantil & N (0, 1) Chi 2-fördelning t-fördelning Intervall för μ i N (μ, σ) Exempel Ensidiga konfidensintervall Jämförelse av två μ Två stickprov Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 9/25

Repetition χ 2 t N (μ, σ) Ex Ensidiga α-kvantil, x α (Def. 3.17) En kvantil till en s.v. X är en gräns som överskrids med slh. α. F X (x α ) = 1 α f 1 a a x_a x Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 10/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga Normalfördelning (Kap. 3.6c, 6) Φ(x) = F X (x) = x 1 2π e t2 2 dt där Φ(x) räknas ut numeriskt eller fås från tabell. Standardiserad Normalfördelning (Kap. 6.3) Om X N (μ, σ), med E(X) = μ och V(X) = σ 2, så är X μ σ N (0, 1) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 11/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga (Kap. 12.2) Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Ett tvåsidigt konfidensintervall är alltså två skattningar a 1, a 2 så att ( ) P a 1 (X 1,..., X n ) < θ < a 2 (X 1,..., X n ) = 1 α Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 12/25

Repetition χ 2 t N (μ, σ) Ex Ensidiga Andelen 1 α av intervallen täcker rätt värde i långa loppet 100 st 95% konfidensint. för µ i N(µ,2) 100 90 80 70 100 st 95% konfidensint. för µ i N(µ,σ) 100 90 80 70 Intervall nr 60 50 40 Intervall nr 60 50 40 30 30 20 20 10 10 0 0 0.5 1 1.5 2 0 0 0.5 1 1.5 2 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 13/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga χ 2 -fördelning (chi-två) (Def. 6.1) Y χ 2 (f). f kallas antal frihetsgrader. α-kvantil: χ 2 α(f). Tabell 4. 0.6 χ 2 fördelning med f = 1, 3, 5, 15 Om X 1,..., X n N (μ, σ) och oberoende så gäller (Sats 6.6) 1 σ 2 1 σ 2 n (X i μ) 2 χ 2 (n) n (X i X) 2 χ 2 0 0 2 4 6 8 10 12 (n 1) 0.4 0.2 f = 1 f = 3 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 14/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga Student s t-fördelning X t(f). f kallas antal frihetsgrader. α-kvantil: t α (f). Tabell 3. Om X N (0, 1) och Y χ 2 (f) är oberoende gäller X Y/f t(f) 0.4 0.2 (Kap. 12.3a) t fördelning med f = 1, 2, 4, 8, f = f = 1 och speciellt för X i N (μ, σ) där X μ S/ t(n 1) n X = 1 n n X i och S 2 = 1 n 1 0 4 2 0 2 4 n (X i X) 2 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 15/25

Repetition χ 2 t N (μ, σ) Ex Ensidiga för μ i N (μ, σ) (Sats 12.1) x 1,..., x n observationer av X i N (μ, σ) σ känd: σ okänd: σ I μ = x ± λ α/2 n = μ ± λ α/2 D(μ ) I μ = x ± t α/2 (n 1) s n = μ ± t α/2 (f)d(μ ) för σ i N (μ, σ) (Kap 12.3b, F12) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 17/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga Exempel: Sockerinnehåll i betor Sockerbetor har i regel ett sockerinnehåll på 16 18% (enligt Dansukkers hemsida). Anta att sockerinnehållet i en godtycklig beta beskrivas av X i N (μ, σ) med σ okänd. I ett visst betlass undersökte man sockerhalten hos 25 slumpmässigt utvalda betor. 1 25 25 x i = 16.8 25 (x i x) 2 = 4.8 Gör ett 95%-konfidensintervall för den förväntade sockerhalten i betlasset. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 18/25 Repetition χ 2 t N (μ, σ) Ex Ensidiga Ensidiga konfidensintervall (Kap. 12.2) kan även vara uppåt- eller nedåt begränsade. 1. Ta ena gränsen i ett tvåsidigt konfidensintervall 2. Byt ut α/2 α för att få rätt konfidensgrad 3. Låt den andra gränsen bli så stor/liten som möjligt Ex. Om det tvåsidiga intervallet ges av x ± λ α/2 σ n är Nedåt begränsat intervall: ( x λ α σ n, ) Uppåt begränsat intervall: (, x + λ α σ n ) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 19/25

Två stickprov Repetition Stickprov & Skattning Maximum likelihood & Minsta kvadrat Översikt Repetition: Kvantil & N (0, 1) Chi 2-fördelning t-fördelning Intervall för μ i N (μ, σ) Exempel Ensidiga konfidensintervall Jämförelse av två μ Två stickprov Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 20/25 Två stickprov Två stickprov Ex: Järnhalt i jord (Kap. 12.3c) En geokemist är intresserad av att undersöka hur halten av järn varierar i skogsmark. På två lokaler gräver hon 6 resp. 7 gropar, tar ett prov från varje grop och bestämmer sedan järnhalten (mg/g): Lokal I, x i : 23.3 9.0 9.8 19.9 15.0 20.5 Lokal II, y i : 20.8 26.5 18.3 28.6 33.1 21.5 29.3 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan de två lokalerna? Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 21/25 Sammanvägd variansskattning Två stickprov (Kap. 11.7c) Om vi har x 1,..., x nx obs. av X i N (μ x, σ) y 1,..., y ny obs. av Y i N ( μ y, σ ) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 = Q ( ) Q f, σ 2 χ2 (f) Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 22/25

Två stickprov (Kap. 12.3d) Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell: Före: X i N (μ i, σ 1 ) Efter: Y i N (μ i + Δ, σ 2 ) Vi vill nu skatta effekten av behandlingen (Δ). Bilda Z i = Y i X i N (Δ, σ). Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 23/25 Två stickprov eller två stickprov? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts dagligen längs Hornsgatan i Stockholm under vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? Fosfor-halten mäts varje dag i Höjeå uppströms och nedströms från Lunds reningsverk; konfidensintervall för skillnaden? Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 24/25 Två stickprov Ex: Järnhalt i jord () Geokemisten är speciellt intresserad av eventuella skillnader i järnhalten mellan olika nivåer i groparna. Hon tar därför, från 4 olika gropar, ett prov på A-nivå (nära ytan) och ett prov på C-nivå (c:a 1 meter djupt). Området är av mycket heterogen karaktär, dvs troligen varierar järnhalten mycket mellan olika gropar. Grop nr: 1 2 3 4 Nivå A: 19.15 23.35 20.10 16.7 Nivå C: 21.96 27.70 22.93 19.02 z i = y i x i 2.81 4.35 2.83 2.32 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan A- och C-nivårena. Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F11 25/25