Matematisk statistik för B, K, N, BME och Kemister

Relevanta dokument
Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12: Linjär regression

Matematisk statistik för B, K, N, BME och Kemister

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 12: Regression

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 17, Matematisk statistik Π + E

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 11, FMSF45 Konfidensintervall

Thomas Önskog 28/

Föreläsning 15, FMSF45 Multipel linjär regression

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Matematisk statistik för B, K, N, BME och Kemister

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

F13 Regression och problemlösning

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TMS136. Föreläsning 10

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

9. Konfidensintervall vid normalfördelning

Grundläggande matematisk statistik

Formel- och tabellsamling i matematisk statistik

MVE051/MSG Föreläsning 14

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Föreläsning 13: Multipel Regression

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

10. Konfidensintervall vid två oberoende stickprov

Föreläsning 15: Försöksplanering och repetition

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Föreläsningsanteckningar till kapitel 8, del 2

Lycka till!

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Repetitionsföreläsning

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

5 Stokastiska vektorer 9. 6 Multipel regression Matrisformulering MK-skattning av β... 11

FÖRELÄSNING 7:

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 7. Statistikens grunder.

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Enkel och multipel linjär regression

TMS136. Föreläsning 11

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Mer om konfidensintervall + repetition

Föreläsning 15: Faktorförsök

oberoende av varandra så observationerna är

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

1 Förberedelseuppgifter

Laboration 2: Styrkefunktion samt Regression

Tenta i Statistisk analys, 15 december 2004

Repetition 2, inför tentamen

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 7: Punktskattningar

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Föreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression

Statistisk försöksplanering

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

AMatematiska institutionen avd matematisk statistik

F9 Konfidensintervall

Föreläsning 7: Punktskattningar

Kurssammanfattning MVE055

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Avd. Matematisk statistik

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

TAMS65 - Seminarium 4 Regressionsanalys

Föreläsning 12: Repetition

Transkript:

Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 2/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 3/23

Konfidensintervall (Kap. 9.1.2 & 9.2.2 & 9.3.2 Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är.95,.99 och.999. Normalfördelad skattning, θ N (θ, V(θ D(θ känd: I θ = θ ± λ α/2 D(θ D(θ okänd: I θ = θ ± t α/2 (fd(θ Normalapproximation, θ N (θ, V(θ (Ex: CGS D(θ känd: I θ = θ ± λ α/2 D(θ D(θ okänd: I θ = θ ± λ α/2 d(θ (alltid λ-kvantil Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 4/23 Konfidensintervall för σ 2 i N ( μ, σ 2 (Kap. 8.1.2 x 1,..., x n observationer av X i N ( μ, σ 2 Ett 1 α konfidensintervall för σ 2 ges av ( Iσ 2 (n 1s 2 (n 1s 2 = χ 2 α/2 (n 1, χ 2 1 α/2 (n 1 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 5/23 Hypotestest Vilken metod? Normalfördelad skattning. σ känd: Vilken som helst. σ okänd: Direktmetoden kräver t-fördelningens fördelningsfunktion. Fördelning där μ = X N (μ, V(μ... enl. CGS. Vilken som helst Bin, Po,... där D(θ innehåller θ. Direktmetoden Går alltid att använda, ibland med normalapproximation. Testkvantitet Kräver normalt normalapproximation. Vid styrkefunktion är det naturligt att utgå från testkvantitet. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 6/23

Testkvantiter Antag att vi vill testa H : θ = θ. Model Skattning T(X D(θ /d(θ kvantil X i N ( μ, σ 2 σ känd μ = X μ μ λ X Bin(n, p X i Po(μ Notera: σ okänd p = X n μ = X D(μ μ μ d(μ p p D (p μ μ D (μ 1. Standardavvikelse/medelfel räknas under H. 2. Bin och Po fallet kräver normalapproximation. 3. α-kvantil om ensidigt, α/2-kvantil om tvåsidigt. σ n s n p (1 p n μ n t(f λ λ Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 7/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 8/23 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor sannolikhet. Hypotestest Om gissningen blev.13, kan rätt värde på den okända storheten ändå vara.1? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar undersöker effekten av olika faktorer (behandlingar? Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 9/23

Enkel linjär regression (Kap. 1 Det verkar finnas ett linjärt samband mellan x och y. 2 Orenhet i färg 18 16 Orenhet y [%] 14 12 ( x i, y i 1 8 2 25 3 35 4 45 Omröringshastighet x [rpm] Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Modell (Kap. 1.2 Vi har n st par av mätvärden (x i, y i, i = 1,..., n där y i är observationer av Y i = α + βx i + ε i där ε i är oberoende av varandra, och ε i N (, σ 2. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 11/23 14 12 1 Observationer Skattad regressionslinje Verklig regressionslinje Fördelning för Yi 8 6 4 2 1 2 3 4 5 6 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 12/23

Parameterskattningarna (Kap. 1.4 1.5 Skattningarna av α, β β = n (x i x(y i ȳ n (x i x 2 α = ȳ β x och s 2 = (σ 2 är s 2 = Q n 2 där Q = Q σ 2 χ2 (n 2 = S xy n N (β, σ2 ( 1n N (α, σ 2 + x2 (y i α β x i 2 = S yy S2 xy Skattningarna α och β är dock inte oberoende av varandra. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 13/23 Räkna ut kvadratsummorna För att räkna ut kvadratsummorna, S yy och S xy kan man ha användning av sambanden = S yy = S xy = n ( n (x i x 2 = n ( n (y i ȳ 2 = x 2 i y 2 i n x 2 nȳ 2 n ( n (x i x(y i ȳ = x i y i n xȳ Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 14/23 Exempel, x-cu-konc. y-absorption Vi har följande 1 par av mätvärden i: 1 2 3 4 5 6 7 8 9 1 x i : 5 5 1 1 15 15 2 2 y i :.5.3.92.84.185.185.329.32.372.336 För att skatta parametrarna i regressionsmodellen behövs n = 1, xi y i = 282.5, xi = 1, x 2 i = 15, yi = 1.877, y 2 i =.5347 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 15/23

Konfidens- och prediktionsintervall För ett givet x-värde, x = x, kan vi skatta Y-s väntevärde med μ = α + β x dvs en punkt på den skattade linjen. Konfidensintervall (Kap. 1.6 Konfidensintervall för linjen, μ, vid x : I μ = α + β x ± t a/2 (n 2 s 1 n + (x x 2 Prediktionsintervall (Kap. 1.7 Prediktionsintervall för en ny mätning, Y(x, vid x : I Y(x = α + β x ± t a/2 (n 2 s 1 + 1 n + (x x 2 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 16/23 Konfidens- och prediktionsintervall.5 Konfidensintervall för µ(x och prediktionsintervall.4.3 Absorption.2.1.1.2 5 5 1 15 2 25 Kopparkoncentration Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 17/23 Om man observerat ett värde y av y, vad blir då x? Man kan lösa ut x ur y = α + β x och får x = y α β Denna skattning är inte normalfördelad, men Delta metoden ger ett approximativt värde på D(x. (Kap. 1.8 för x givet en mätning y, vid x : I x = x ± t s a/2(n 2 β 1 + 1 n + (x x2 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 18/23

.5 då y =.2.4.3 Absorption.2.1.1.2 5 5 1 15 2 25 Kopparkoncentration Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 19/23 Repetition Inferens för diskret data Konfidensintervall Hypotesprövning Modell Parameterskattningar Exempel Intervall för linjen Residualanalys Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 2/23 Residualanalys/Modellvalidering (Kap. 1.1 För att undersöka hur bra modellen stämmer kan vi kan studera residualerna, dvs avvikelserna mellan observerade y-värden och den skattade linjen. e i = y i α β x i, i = 1,..., n Dessa är observationer av ε i, och residualerna bör alltså: se ut att komma från en och samma normalfördelning vara oberoende av varandra vara oberoende av alla x i. Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 21/23

1 Residualer 1 Residualer mot x 5 5 e e 5 5 1 1 2 3 1:n Probability.99.98.95.9.75.5.25.1.5.2.1 1 1 2 3 x Normal Probability Plot 5 5 Data Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 22/23 Mindre bra residualplottar 1 Residualer, kvadratisk trend Residualer mot x, variansen ökar med x 3 e 5 e 2 1 1 5 1 2 3 1:n 2 1 2 3 x I en modellvalidering bör man även testa H : β = H 1 : β Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 23/23