Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Relevanta dokument
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

SF1901 Sannolikhetsteori och statistik I

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för B, K, N, BME och Kemister

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Föreläsning 7. Statistikens grunder.

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12: Linjär regression

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

f(x) = 2 x2, 1 < x < 2.

Föreläsning 12: Regression

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för B, K, N, BME och Kemister

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

SF1901: Medelfel, felfortplantning

Thomas Önskog 28/

Matematisk statistik för B, K, N, BME och Kemister

9. Konfidensintervall vid normalfördelning

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 8: Konfidensintervall

Föreläsning 5, FMSF45 Summor och väntevärden

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

Mer om konfidensintervall + repetition

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning 6, FMSF45 Linjärkombinationer

Avd. Matematisk statistik

TMS136. Föreläsning 10

Formel- och tabellsamling i matematisk statistik

Avd. Matematisk statistik

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: Sannolikhetslära och statistik

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

F9 Konfidensintervall

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

SF1901 Sannolikhetsteori och statistik I

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Repetitionsföreläsning

Föreläsningsanteckningar till kapitel 8, del 2

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Kap 2. Sannolikhetsteorins grunder

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Grundläggande matematisk statistik

Laboration 4: Intervallskattning och hypotesprövning

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 7: Punktskattningar

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsning 12: Repetition

Avd. Matematisk statistik

Härledning av Black-Littermans formel mha allmänna linjära modellen

Matematisk statistik för B, K, N, BME och Kemister

Grundläggande matematisk statistik

Föreläsning 2, FMSF45 Slumpvariabel

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Föreläsning 15, FMSF45 Multipel linjär regression

MVE051/MSG Föreläsning 7

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

Lektionsanteckningar 11-12: Normalfördelningen

Avd. Matematisk statistik

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Teoretisk statistik. Gunnar Englund Matematisk statistik KTH. Vt 2005

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Avd. Matematisk statistik

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Föreläsning 17, Matematisk statistik Π + E

Punktskattning 1 Ett exempel

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Avd. Matematisk statistik

Transkript:

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20

Översikt Exempel Repetition Exempel Matematisk statistik slumpens matematik Sannolikhetsteori: Hur beskriver man slumpen och slumpmässiga händelser? Slh. för 3 st 1:or på 10 tärningsslag? Givet fördelningen för vågor, hur höga/stora kan de 5 % värsta vågorna vara? Vi observerar ett radioaktivt material med känd halveringstid under 10 mintuer; vilken fördelning kommer det observerade antalet sönderfall att följa? Statistikteori: Vilka slutsatser kan man dra av ett datamaterial? Givet 3 st 1:or på 10 tärningslag, är tärningen rättvis? Givet 10 års mätningar av vågor, vad kan vi säga om fördelningen? Under 10 minuter observerar vi 5 sönderfall, vad är halveringstiden? Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 2/20

Översikt Exempel Repetition Exempel Statistik Från mätningar (insamlad data) dra slutsatser om verkligheten. Vi behöver då en modell för våra mätingar! Ofta innehåller vår modell okända parametrar samt ett antagande om fördelning för observationerna. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 3/20

Översikt Exempel Repetition Exempel Exempel: Kvalitetskontroll Vi kontrollerar n st slumpmässigt utvalda komponenter från ett stort parti och ser om de fungerar. Modell: X =antalet trasiga komponenter X Bin(n, p), där p är andelen trasiga kommponenter. Parametern p är okänd. Möjliga frågeställlningar: 1. Vad är en bra uppskattning av p? 2. Hur stor är osäkerheten i uppskattningen? 3. Vilket intervall tror vi p ligger inom? 4. Hur stort måste n vara för att uppnå en tillräckligt liten osäkerhet? Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 4/20

Översikt Exempel Repetition Exempel Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Regression Om gissningen blev 0.013, kan rätt värde på den okända storheten ändå vara 0.01? Sambandsanalys: hur vet vi om två variabler påverkar varandra? Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 5/20

Översikt Exempel Repetition Exempel Statistikteori, grundläggande begrepp Stickprov Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. Skattning En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. Bra egenskaper för en skattning är Väntevärdesriktig : E(θ ) = θ, inget systematiskt fel. Effektiv: liten varians (osäkerhet) V(θ ). Konsistent: P( θ n θ > ε) 0, n, dvs Blir bättre när vi får fler observationer, Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 6/20

Översikt Exempel Repetition Exempel En skattning θ är både ett tal, en s.v. och en funktion θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 7/20

Översikt Exempel Repetition Exempel Modell för mätning med slumpmässigt mätfel Antag att vi vill mäta en storhet μ. Om man gör n st mätvärden, x 1,..., x n är dessa observationer av X i = μ + ε i = Rätt värde + Mätfel där ε i är ett slumpmässigt mätfel. Ofta antas att ε i är oberoende och Detta ger att våra observationer blir ε i N(0, σ) X i N(μ, σ) Därför ser vi att väntevärdet är den storhet vi försöker mäta upp. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 8/20

Översikt Exempel Repetition Exempel Kom ihåg: väntevärde och varians Väntevärdet anger tyngdpunkten för fördelningen { E(X) = x f X(x) dx kontinuerlig k k p X(k) diskret Variansen anger hur utspridd X är kring sitt väntevärde. ( V(X) = E [X E(X)] 2) = E(X 2 ) E(X) 2 0. Nuttiga formler: ( ) E ai X i + b = a i E(X i ) + b ( ) V a i X i + b = a 2 i V(X i) + 2 a i a j C(X i, X j ) i i i<j }{{} =0 om okorrelerade Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 9/20

Översikt Exempel Repetition Exempel Variation i observationer ger variation i skattningen μ n = 1 n n i=1 X i E(μ n) = μ V(μ n) = σ2 n Stickprov Observationer x jk μ = x j 1 4.83 4.93 5.24 5.12 5.10 4.69 5.62 4.73 5.03 2 5.09 5.13 4.53 4.59 4.70 4.10 4.96 5.26 4.79 3 5.53 5.10 4.34 5.05 5.21 4.43 4.30 4.56 4.82 4 4.48 5.10 4.75 5.17 4.98 5.01 5.82 5.12 5.05 5 5.14 5.10 4.79 5.48 4.70 5.89 5.22 5.91 5.28 6 4.80 5.33 5.22 5.26 4.45 4.12 5.29 5.09 4.95 7 5.20 5.26 5.49 5.60 4.83 5.28 4.38 5.18 5.15 8 4.48 4.81 4.62 4.61 5.04 4.81 4.32 4.41 4.64. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 10/20

Översikt Exempel Repetition Exempel 0.8 Observationernas fördelning 0.6 0.4 0.2 0 3 3.5 4 4.5 5 5.5 6 6.5 7 2.5 Skattningarnas fördelning 2 1.5 1 0.5 0 3 3.5 4 4.5 5 5.5 6 6.5 7 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 11/20

MK ML Exempel Medelfel Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen Q(θ) = n ( x i μ i (θ) i=1 ) 2 med avseende på θ. Bestäm hur väntevärdet beror av θ, E(X i ) = μ i (θ). Sätt upp Q(θ) Derivera Q(θ), sätt lika med noll och lös m.a.p. θ. Det θ som minimerar Q(θ) är MK-skattningen, θ MK. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 12/20

MK ML Exempel Medelfel Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskret) (kontinuerlig) I det diskreta fallet anger L-funktionen: Sannolikheten att få det stickprov som vi fått. Sätt upp L(θ) Logaritmera ln L(θ) maximeras av samma θ som L(θ). Derivera ln L(θ) med avs. på θ, sätt lika med noll och lös för θ. Det θ som maximerar L(θ) är ML-skattningen θ ML. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 13/20

MK ML Exempel Medelfel Exempel: Radon Radonkoncentrationen i inomhusluft kan mätas genom att hänga upp en α-känslig film. Antalet hål i filmen beskrivs av en Poisson-process med X i Po(μK i ) där μ är den okända radonkoncentrationen och K i är kända konstanter som beror på bl.a. filmens känslighet, storlek och exponeringstiden. Radon-data återkommer i lab 4. Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 14/20

MK ML Exempel Medelfel Ex: Normalfördelning Om x 1,..., x n är observationer av X i N(μ, σ) blir ML- och MK-skattningen av μ och en korrigerad ML-skattning av σ 2 μ = x (σ 2 ) = s 2 (x) = 1 n 1 n (x i x) 2 Dessa används även för att skatta väntevärde och varians vid okänd fördelning. Värför korrigerad? E(s 2 (X)) = σ 2 i=1 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 15/20

MK ML Exempel Medelfel Medelfel Om D(θ (X)) = V(θ (X)), dvs. standardavvikelsen av en skattning för θ,, innehåller okända parametrar θ då kan man inte räkna ut ett numeriskt värde på den. Istället stoppar man in skattningar på de okända parametrarna och får medelfelet d(θ ). Exempel: p = X n där X Bin(n, p) så V(X) = np(1 p). ( ) X V(p ) = V = 1 n n 2 V(X) = 1 p(1 p) np(1 p) =, n2 n p(1 p) p så D(p ) = = d(p ) = (1 p ) n n Exempel. μ = X, där X N(μ, σ), σ okänd V(μ ) = σ2 n, d(μ ) = s, där s = 1 n n 1 n (x i x) 2 i=1 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 16/20

MK ML Exempel Medelfel Exempel: två binomialfördelningar Vi har två oberoende observationer: x 1 från X 1 Bin(n 1, p) och x 2 från X 2 Bin(n 2, 2p) där n 1 och n 2 är kända medan p är en okänd parameter (OBS! 0 < p < 1/2). Bestäm MK-skattningen av p. Bestäm ML-skattningen av p. Beräkna skattningarnas värde när n 1 = 5 och x 1 = 2, samt n 2 = 6 och x 2 = 3. Är skattningarna väntesvärderiktiga? Vilken av skattningarna har lägst varians? Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 17/20

MK ML Exempel Medelfel Exempel: två binomialfördelningar Enkelt: skatta p och 2p var för sig: p 1 (x 1) = p = x 1 n 1 = 2 5 = 0.40 2p 2 (x 2) = (2p) = x 2 n 2 = 3 6 = 0.50 p = x 2 2n 2 = 0.25 Vilken är rätt? (Ingen av dem...) Vilken är bäst? (p 1 kan bli > 1/2 som är omöjligt ) V(p p(1 p) 1 ) = = n 1 V(p 2p(1 2p) 2 ) = 2 2 = n 1 p(1 p) ; 5 p(1 2p). 12 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 18/20

MK ML Exempel Medelfel Vikta ihop skattningarna, på olika sätt... p a = p a(x 1, x 2 ) = p 1 + p 2 2 = x 1 n 1 + x 2 2n 2 2 = 2n 2x 1 + n 1 x 2 4n 1 n 2 = 0.325 p b = p b (x 1, x 2 ) = n 1p 1 + n 2p 2 n 1 + n 2 = x 1 + x2 2 n 1 + n 2 = 2x 1 + x 2 2(n 1 + n 2 ) = 0.318 p c = p c(x 1, x 2 ) = p 1 + 2p 2 1 + 2 = x 1 n 1 + x 2 n 2 3 = n 2x 1 + n 1 x 2 3n 1 n 2 = 0.300 p d = p d (x 1, x 2 ) = n 1p 1 + 2n 2p 2 n 1 + 2n 2 = x 1 + x 2 n 1 + 2n 2 = 0.294 Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 19/20

MK ML Exempel Medelfel MK- och ML-skattningar p MK = n 1x 2 + 2n 2 x 1 n 2 1 + 4n2 2 = 0.272 p ML = n 1 + 2n 2 + 2x 1 + x 2 4(n 1 + n 2 ) (n1 + 2n 2 ) 2 + (2x 1 + x 2 ) 2 (4n 1 x 1 + 6n 1 x 2 + 4n 2 x 2 ) = 0.280 4(n 1 + n 2 ) Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 20/20