Grundläggande matematisk statistik

Grudläggade matematisk statistik Puktskattig Uwe Mezel, 2018 uwe.mezel@slu.se; uwe.mezel@matstat.de www.matstat.de Saolikhetsteori: Saolikhetsteori och statistikteori vad vi gjorde t.o.m. u vi hade e give fördelig, t.ex. X ~ N(μ, σ), där µ och σ var käda. utifrå detta beräkades vätevärde, varias, saolikhet, t.ex. P(a < X b) Statistikteori: det verkliga livet vi har ite µ och σ (me möjligtvis e uppfattig över de föreliggade typ av fördelig, alltså t. ex. X ~ N). vi måste skatta μ och σ pga. av ett stickprov puktskattig, itervallskattig iferes: frå mätvärde i stickprovet till skattig för e parameter Stickprovet kallas slumpmässigt om alla mätvärde är oberoede. 2 1

Ituitiva skattigar Normalfördelig: Skattig av µ och σ för ormalfördelig (vi måste alltså veta/gissa att ormalfördelig föreligger). X ~ N(μ, σ) me µ eller/och σ okäda Stickprov: skattig för vätevärde μ = E(X) i e ormalfördelig N(μ, σ) OBS: e skattig beteckas ofta med e stjära, t. ex. μ skattig för variase σ 2 = V(X) i e ormalfördelig N(μ, σ) Biomialfördelig: Ituitiva skattigar Skattig av p för biomialfördelige. Vi måste alltså veta att e biomialfördelig föreligger (vilket är realistiskt t.ex. för mytkast). X ~ Bi, p Stickprov: me p okäd x = atalet lyckade ; = atalet (Beroulli-) försök skattig för slh. att lyckas, p, för Bi(, p) Exempel 1: kasta myt 10 gåger ( = 10), därav 4 lyckade (x = 4) p = x = 4 10 = 0.4 OBS!: kaske var ite stort og? Exempel 2: Opiiosudersökig: 1000 persoer frågas om de skulle välja parti De bästa. 3011 svarar med Ja. Vi skattar adele De bästa -väljare i hela populatioe med ugefär 30%. 2

ҧ 2018-10-03 Skattige som slumpvariabel stickprov 1: stickprov 2: stickprov 3: alla stickprov ger olika തX och S 2 skattigar måste betraktas som slumpvariabler (stora bokstäver)! ҧ o olika umeriska värde för olika stickprov skattige beror av slumpe o det kokreta värdet för e skattig, t.ex. x, är e realisatio av e slumpvariabel തX o observatioera x 1, x 2,, x 3 ses som utfall av oberoede s.v. X 1, X 2,, X 3 som atas ha alla samma fördelig. x = 1 i=1 x i തX = 1 i=1 X i stickprov (små bokstäver) slumpvariabler (stora bokstäver) För Bi: p = x p = X där X ~ Bi, p E p, V p. ka beräkas Skattigar observatioer x 1, x 2,, x 3 oberoede s.v. X 1, X 2,, X 3 empirisk formel (litet x) slumpvariabel (stor X) fördelig Vi ka beräka vätevärde, varias, stadardavvikelse för തX, p, S 2. 3

Egeskaper hos skattigar E skattig borde uppfylla flera krav. De borde vara: o vätevärdesriktigt o kosistet o effektiv defierade egeskaper för skattigar Med hjälp av dessa egskaper ka ma bedöma hur lämpligt e skattig är. Vätevärdesriktighet θ = skattig för θ θ står för e parameter i e fördelig (μ, σ, p, ) När vätvärdesriktighet föreligger, så måste gälla dvs. vätevärdet för skattige stämmer överes med parameter som ska skattas. Ex1: skattig av vätevärdet och variase för e ormalfördelig: Äve om vi ite käer det saa värdet på μ, så vet vi dock att skattiges vätevärde stämmer överes med μ! (det är därför vi måste aväda 1 i ämare!) Ex2: skattig för saolikhete att lyckas i e biomialfördelig: E X för Bi(, p) 4

Vätevärdesriktighet vätevärdesriktig skattig, bra biased skattig, ite bra E vätevärdesriktig skattig θ är väl kocetrerad krig det saa värdet på parameter θ. Skattige ger rätt parametervärde i geomsittet om ma gör ett stort atal försök. 9 Kosistes θ = skattig baserad på observatioer (mätvärde) Ju större, desto midre ska variase hos skattige vara. Om går mot ska variase gå mot oll. Om e skattig är kosistet löar det sig att samla fler observatioer vi får ju midre varias, dvs. midre osäkerhet om skattige ligger ära det saa värdet. Ex 1: skattig för vätevärdet och variase för e ormalfördelig: Låter det kostigt? μ är e slumpvariabel, har alltså e varias! 5

Kosistes Ex 2: skattig för saolikhete att lyckas i e biomialfördelig: skattig för p i Bi(, p) X ~ Bi, p Sammafattig: De ituitiva skattigar för μ, σ, p i N(μ, σ) respektive Bi(, p) är både vätevärdesriktiga och kosisteta. Kosistes Täthetsfuktio för skattig തX f തX x = 5 = 15 = 45 Skattige kocetreras mer och mer krig det saa värdet är stickprovet blir större och större, dvs. är växer. 6

Effektivität E skattig borde ha e så lite varias som möjligt. Stor varias betyder ju stor osäkerhet. Ka ma välja mella olika skattigar borde ma aväda de skattig som har mist varias, alltså de mest effektiva. Exempel: stickprov där Som skattig aväds det aritmetiska medelvärdet av alla 10 observatioer. Som skattig aväds medelvärdet av det största och det mista värdet. μ 1 är mest effektiv Best att hitta: MVUE (https://e.wikipedia.org/wiki/miimum-variace_ubiased_estimator) Effektivität θ är effektivare ä መθ om V θ < V መθ mest effektiv midre effektiv 7

Metoder för att hitta skattigar (. alltså att hitta e formel som aväds på mätvärdea) Det fis olika metoder för att fia ett uttryck för e skattig: a) Mometmetode b) Mista-kvadrat-metode c) Maximum-Likelihood-metode d).. Mometmetode Teoretiska 1:a mometet = Stickprovets 1:a momet E X; θ = 1 i=1 x i beror på parameter som ska skattas geomsitt av alla observatioer (mätvärde) Exempel: Bi(, p) p = x 1 p är parameter som ska skattas p = X 1 bara e observatio (atalet lyckade ) skattig för p i Bi(, p) mer: https://e.wikipedia.org/wiki/method_of_momets_(statistics) 8

Mista-kvadrat-metode Q θ N = i=1 x i E X; θ 2 Mi N mätvärde (stickprov) E X beror av ågo parameter θ Exempel: Bi(, p) X ~ Bi(, p) där p ska skattas E X = p bara ett värde i stickprovet: x 1 Q p = x 1 p 2 Mi dq dp = 2 x 1 p = 0 p = x 1 mer: https://sv.wikipedia.org/wiki/mistakvadratmetode Maximum-Likelihood-Metode blå: histogram över mätvärde röd: täthetsfuktio för olika μ, σ ML_plot.R Ide: välj parametrara så att mätvärdea blir mest plausibla välj de parametrara som ger de tjocka röda kurva. 9

Maximum-Likelihood-Metode stickprov: Likelihood: fuktio av e fördeligsparameter x = x 1, x 2,, x x i käda (mätvärde) ger skattigar för μ ger och μ σ och som σ fuktio som fuktio av av mätvärdea x mätvärde i Parametriska puktskattigar Fördelig Param. Skattig för parameter Metod Blom X ~ N μ, σ μ μ = തX X ~ N μ, σ σ 2 S 2 = 1 1 S xx ML, MK, MM 289 MM, ML 277, 290 X ~ N μ, σ σ S = S 2 ML 291 Am. 7.14 X ~ Po μ μ μ = തX MM, MK, ML 295 X ~ Bi(, p) p p = X X~Hyp N,, m p p = X X ~ Exp λ λ λ = 1 തX ML 293 MM, MK, ML 294 ML 282 X ~ U 0, θ θ θ = + 1 max X i ML 284 തX = X i i=1 i=1 S xx = X i തX 2 10

Parametriska puktskattigar, forts. Fördelig Param. Skattig för parameter Metod Blom μ x μ x = തX ML 289 X ~ N μ x, σ μ y μ y = തY ML 289 Y ~ N μ y, σ σ 2 S 2 = S xx + S yy x 1 + y 1 ML 292 X 1 ~ Bi 1, p X 2 ~ Bi 2, p p p = X 1 + X 2 1 + 2 ML 293 X 1 ~ Po λ t 1 λ λ = X 1 + X 2 X 2 ~ Po λ t t 1 + t 2 2 ML Problem 7.2.19 തX = i=1 X i S xx = X i തX 2 i=1 Medelfelet Medelfelet ger e uppfattig av osäkerhete i skattige (större medelfel större osäkerhet). Ju midre stadardavvikelse för e skattig är, desto bättre skattige. Medelfelet ger ett umeriskt värde för dea stadardavvikelse, det är e skattig av stadardavvikelse. 11

Medelfelet 1. Medelfelet för skattig av µ i N μ, σ : skattig för µ i N(μ, σ) exakt uttryck för skattiges stadardavvikelse, me σ okäd! σ s (σ ersätts med si skattig s) medelfelet, umeriskt värde ka beräkas, approximerig för stadardavvikelse (för skattig av μ i N(μ, σ) med തX ) Medelfelet 2. Medelfelet för skattig av p i Bi, p : skattar p i Bi(, p) exakt, me p okäd (det är parameter vi vill skatta) ersätter p med si skattig medelfelet, umeriskt värde ka beräkas medelfelet för skattig av p i Bi(, p) med p = X Τ 12

Medelfelet för skattig av e proportio Medelfelet... fås geom att ersätta okäda parametrar i formel för stadardavvikelse med deras skattigar: Förd. att skatta estimator N μ, σ µ തX Stadardavv. estimator σ ersätta σ s Medelfelet hos estimator d = s Bi, p p x p 1 p p p p 1 p p = x 13