Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Relevanta dokument
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

SF1901 Sannolikhetsteori och statistik I

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 12: Linjär regression

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

f(x) = 2 x2, 1 < x < 2.

9. Konfidensintervall vid normalfördelning

Matematisk statistik för D, I, Π och Fysiker

SF1901: Medelfel, felfortplantning

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2010

Föreläsning 7. Statistikens grunder.

Matematisk statistik för B, K, N, BME och Kemister

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Föreläsning 11: Mer om jämförelser och inferens

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Föreläsning 8: Konfidensintervall

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12: Regression

Thomas Önskog 28/

Föreläsning 12, FMSF45 Hypotesprövning

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Avd. Matematisk statistik

Formel- och tabellsamling i matematisk statistik

Mer om konfidensintervall + repetition

Föreläsning 6, FMSF45 Linjärkombinationer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 6, Matematisk statistik Π + E

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

Matematisk statistik för D, I, Π och Fysiker

F9 Konfidensintervall

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning 5, FMSF45 Summor och väntevärden

Föreläsning 7: Punktskattningar

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Laboration 4: Intervallskattning och hypotesprövning

Föreläsning 7: Punktskattningar

SF1901 Sannolikhetsteori och statistik I

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Punktskattning 1 Ett exempel

TMS136. Föreläsning 10

Grundläggande matematisk statistik

SF1901: Sannolikhetslära och statistik

Föreläsning 5, Matematisk statistik Π + E

Avd. Matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

Föreläsningsanteckningar till kapitel 8, del 2

Avd. Matematisk statistik

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Laboration 4: Intervallskattning och. Hypotesprövning. 1 Förberedelseuppgifter LABORATION 4 MATEMATISK STATISTIK AK FÖR ED, FMS022, VT02

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Avd. Matematisk statistik

Föreläsning 17, Matematisk statistik Π + E

Grundläggande matematisk statistik

MVE051/MSG Föreläsning 7

Matematisk statistik för D, I, Π och Fysiker

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Repetitionsföreläsning

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Föreläsning 7: Punktskattningar

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Tentamen i Matematisk Statistik, 7.5 hp

Matematisk statistik för B, K, N, BME och Kemister

Härledning av Black-Littermans formel mha allmänna linjära modellen

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Avd. Matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Transkript:

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18

Matematisk statistik slumpens matematik Sannolikhetsteori: Hur beskriver man slumpen och slumpmässiga händelser? Slh. för 3 st 1:or på 10 tärningsslag? Givet fördelningen för vågor, hur höga/stora kan de 5 % värsta vågorna vara? Vi observerar ett radioaktivt material med känd halveringstid under 10 mintuer; vilken fördelning kommer det observerade antalet sönderfall att följa? Statistikteori: Vilka slutsatser kan man dra av ett datamaterial? Givet 3 st 1:or på 10 tärningslag, är tärningen rättvis? Givet 10 års mätningar av vågor, vad kan vi säga om fördelningen? Under 10 minuter observerar vi 5 sönderfall, vad är halveringstiden? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 2/18

Statistik Från mätningar (insamlad data) dra slutsatser om verkligheten. Vi behöver då en modell för våra mätingar! Ofta innehåller vår modell okända parametrar samt ett antagande om fördelning för observationerna. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 3/18

Exempel: Kvalitetskontroll Vi kontrollerar n st slumpmässigt utvalda komponenter från ett stort parti och ser om de fungerar. Modell: X = antalet trasiga komponenter X Bin(n, p), där p är andelen trasiga kommponenter. Parametern p är okänd. Möjliga frågeställlningar: 1. Vad är en bra uppskattning av p? 2. Hur stor är osäkerheten i uppskattningen? 3. Vilket intervall tror vi p ligger inom? 4. Hur stort måste n vara för att uppnå en tillräckligt liten osäkerhet? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 4/18

Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Regression Om gissningen blev 0.013, kan rätt värde på den okända storheten ändå vara 0.01? Sambandsanalys, hur vet vi om två variabler påverkar varandra? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 5/18

Statistikteori, grundläggande begrepp Stickprov Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. Skattning En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. Bra egenskaper för en skattning är Väntevärdesriktig: E(θ ) = θ, inget systematiskt fel. Effektiv: liten varians (osäkerhet) V(θ ). Konsistent: P( θ n θ > ε) 0, får fler observationer. n, dvs Blir bättre när vi Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 6/18

En skattning θ är både ett tal, en s.v. och en funktion θ Tal x 1 x 2 θ (x 1,..., x n) S.V. X 1 X 2 θ (X) X i F(θ) θ Funktion Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 7/18

Modell för mätning med slumpmässigt mätfel Antag att vi vill mäta en storhet μ. Om man gör n st mätvärden, x 1,..., x n är dessa observationer av X i = μ + ε i = Rätt värde + Mätfel där ε i är ett slumpmässigt mätfel. Ofta antas att ε i är oberoende och Detta ger att våra observationer blir ε i N(0, σ) X i N(μ, σ) Vi ser att väntevärdet är den storhet vi försöker mäta upp. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 8/18

Väntevärde och Varians Väntevärdet anger tyngdpunkten för fördelningen { E(X) = x f X(x) dx Kont. k k p X(k) Diskr. Variansen anger hur utspridd X är kring sitt väntevärde. [ ] ) 2 V(X) = E( X E(X) = E(X 2 ) E(X) 2 0. ( ) E ai X i + b = a i E(X i ) + b ( ) V a i X i + b = a 2 i V(X i) + 2 a i a j C(X i, X j ) i i i<j }{{} =0 om okorrelerade Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 9/18

Variation i observationer ger variation i skattningen μ n = 1 n n i=1 X i E(μ n) = μ V(μ n) = σ2 n mätomgång, j Observationer, x jk μ = x j 1 4.83 4.93 5.24 5.12 5.10 4.69 5.62 4.73 5.03 2 5.09 5.13 4.53 4.59 4.70 4.10 4.96 5.26 4.79 3 5.53 5.10 4.34 5.05 5.21 4.43 4.30 4.56 4.82 4 4.48 5.10 4.75 5.17 4.98 5.01 5.82 5.12 5.05 5 5.14 5.10 4.79 5.48 4.70 5.89 5.22 5.91 5.28 6 4.80 5.33 5.22 5.26 4.45 4.12 5.29 5.09 4.95 7 5.20 5.26 5.49 5.60 4.83 5.28 4.38 5.18 5.15 8 4.48 4.81 4.62 4.61 5.04 4.81 4.32 4.41 4.64. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 10/18

0.8 Observationernas fördelning 0.6 0.4 0.2 0 3 3.5 4 4.5 5 5.5 6 6.5 7 2.5 Skattningarnas fördelning 2 1.5 1 0.5 0 3 3.5 4 4.5 5 5.5 6 6.5 7 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 11/18

Radon MK ML Medelfel Fördelning Exempel: Radon Radonkoncentrationen i inomhusluft kan mätas genom att hänga upp en α-känslig film. Antalet hål i filmen beskrivs av en Poisson-process med X i Po(λK i ) där λ är den okända radonkoncentrationen och K i är kända konstanter som beror på bl.a. filmens känslighet, storlek och exponeringstiden. Radon-data återkommer i lab 3. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 12/18

Radon MK ML Medelfel Fördelning Radon (forts.) Vi har hängt upp två radonmätare i ett hus där den ena hängt uppe ett dygn och den andra en hel vecka. Hur ska vi kombinera de två mätningarna för att få en så bra gemensam skattning av radonhalten som möjligt? Modell: Oberoende observationer x 1 = 11 från X 1 Po(λ) resp. x 2 = 73 från X 2 Po(7λ). Skattningar: λ 1 = x 1 = 11.0 resp. λ 2 = x 2 7 = 73 7 = 10.43. Medelvärde: λ = 1 2 (λ 1 + λ 2 ) = x 1 + x 2 /7 = 10.71 2 Vikta med tiden: λ = 1 λ 1 + 7 λ 2 = x 1 + x 2 = 10.5 1 + 7 8 Andra varianter? Vilken variant är bäst? Hur hittar man den? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 13/18

Radon MK ML Medelfel Fördelning Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 14/18

Radon MK ML Medelfel Fördelning Minsta kvadrat-metoden, MK Om E(X i ) = μ i (θ) så fås MK-skattningen av θ genom att minimera förlustfunktionen Q(θ) = n ( x i μ i (θ) i=1 ) 2 m.a.p. θ. Bestäm hur väntevärdet beror av θ, E(X i ) = μ i (θ). Sätt upp Q(θ) Derivera, sätt lika med noll och lös m.a.p. θ. Det θ som minimerar Q(θ) är MK-skattningen, θ MK. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 15/18

Radon MK ML Medelfel Fördelning Maximum likelihood-metoden, ML ML-skattningen av θ fås genom att maximera likelihood-funktionen L(θ; x 1,..., x n ) m.a.p. θ. L(θ) = p X (x 1 )... p X (x n ) L(θ) = f X (x 1 )... f X (x n ) (diskr.) (kont.) I det diskreta fallet anger L-funktionen: Sannolikheten att få det stickprov vi fått. Sätt upp L(θ) Logaritmera ln L(θ) maximeras av samma θ som L(θ). Derivera, sätt lika med noll och lös m.a.p. θ. Det θ som maximerar L(θ) är ML-skattningen θ ML. Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 16/18

Radon MK ML Medelfel Fördelning Medelfel Om standardavvikelsen, D(θ ), för en skattning innehåller okända parametrar kan man inte räkna ut ett numeriskt värde på den. Om vi stoppar in skattningar på de okända parametrarna fås medelfelet d(θ ). Exempel: λ = X 1 + X 2, X 1 Po(λ), X 2 Po(7λ) 8 V(λ ) = V( X 1 + X 2 ) = V(X 1) + V(X 2 ) 8 8 2 = λ + 7λ D(λ ) = λ 8, d(λ ) = λ 8 = 8 2 = λ 8, 10.5 8 = 1.15 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 17/18

Radon MK ML Medelfel Fördelning Skattningens fördelning: CGS? Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 18/18