Grundläggande matematisk statistik

Relevanta dokument
Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Föreläsning 2: Punktskattningar

F10 ESTIMATION (NCT )

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

4.2.3 Normalfördelningen

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

θx θ 1 om 0 x 1 f(x) = 0 annars

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning G04: Surveymetodik

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Formelblad Sannolikhetsteori 1

Datorövning 2 Fördelningar inom säkerhetsanalys

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Föreläsning G70 Statistik A

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Datorövning 2 Fördelningar inom säkerhetsanalys

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

a) Beräkna E (W ). (2 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Id: statistik.tex :48:29Z joa

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Lycka till! I(X i t) 1 om A 0 annars I(A) =

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Introduktion till statistik för statsvetare

Matematisk statistik TMS063 Tentamen

1. Test av anpassning.

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

SAMMANFATTNING TAMS65

Tentamen i Sannolikhetsteori III 13 januari 2000

S0005M V18, Föreläsning 10

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Grundläggande matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Tentamen i matematisk statistik

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Matematisk statistik KTH. Formelsamling i matematisk statistik

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

2. Konfidensintervall för skillnaden mellan två proportioner.

TENTAMEN I MATEMATISK STATISTIK

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Avd. Matematisk statistik

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Borel-Cantellis sats och stora talens lag

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

TMS136: Dataanalys och statistik Tentamen med lösningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

================================================

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

F12 Stickprovsteori, forts

Matematisk statistik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR CDEFI, NANO OCH PI, MAS233, 2004 FMS 012, FMS 022, FMS 121 OCH MAS233

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Lösningsförslag

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Grundläggande matematisk statistik

Linjär regression - kalibrering av en våg

Föreläsning 7. Statistikens grunder.

Grundläggande matematisk statistik

STATISTIK FÖR LÄKARSTUDENTER

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Transkript:

Grudläggade matematisk statistik Puktskattig Uwe Mezel, 2018 uwe.mezel@slu.se; uwe.mezel@matstat.de www.matstat.de Saolikhetsteori: Saolikhetsteori och statistikteori vad vi gjorde t.o.m. u vi hade e give fördelig, t.ex. X ~ N(μ, σ), där µ och σ var käda. utifrå detta beräkades vätevärde, varias, saolikhet, t.ex. P(a < X b) Statistikteori: det verkliga livet vi har ite µ och σ (me möjligtvis e uppfattig över de föreliggade typ av fördelig, alltså t. ex. X ~ N). vi måste skatta μ och σ pga. av ett stickprov puktskattig, itervallskattig iferes: frå mätvärde i stickprovet till skattig för e parameter Stickprovet kallas slumpmässigt om alla mätvärde är oberoede. 2 1

Ituitiva skattigar Normalfördelig: Skattig av µ och σ för ormalfördelig (vi måste alltså veta/gissa att ormalfördelig föreligger). X ~ N(μ, σ) me µ eller/och σ okäda Stickprov: skattig för vätevärde μ = E(X) i e ormalfördelig N(μ, σ) OBS: e skattig beteckas ofta med e stjära, t. ex. μ skattig för variase σ 2 = V(X) i e ormalfördelig N(μ, σ) Biomialfördelig: Ituitiva skattigar Skattig av p för biomialfördelige. Vi måste alltså veta att e biomialfördelig föreligger (vilket är realistiskt t.ex. för mytkast). X ~ Bi, p Stickprov: me p okäd x = atalet lyckade ; = atalet (Beroulli-) försök skattig för slh. att lyckas, p, för Bi(, p) Exempel 1: kasta myt 10 gåger ( = 10), därav 4 lyckade (x = 4) p = x = 4 10 = 0.4 OBS!: kaske var ite stort og? Exempel 2: Opiiosudersökig: 1000 persoer frågas om de skulle välja parti De bästa. 3011 svarar med Ja. Vi skattar adele De bästa -väljare i hela populatioe med ugefär 30%. 2

ҧ 2018-10-03 Skattige som slumpvariabel stickprov 1: stickprov 2: stickprov 3: alla stickprov ger olika തX och S 2 skattigar måste betraktas som slumpvariabler (stora bokstäver)! ҧ o olika umeriska värde för olika stickprov skattige beror av slumpe o det kokreta värdet för e skattig, t.ex. x, är e realisatio av e slumpvariabel തX o observatioera x 1, x 2,, x 3 ses som utfall av oberoede s.v. X 1, X 2,, X 3 som atas ha alla samma fördelig. x = 1 i=1 x i തX = 1 i=1 X i stickprov (små bokstäver) slumpvariabler (stora bokstäver) För Bi: p = x p = X där X ~ Bi, p E p, V p. ka beräkas Skattigar observatioer x 1, x 2,, x 3 oberoede s.v. X 1, X 2,, X 3 empirisk formel (litet x) slumpvariabel (stor X) fördelig Vi ka beräka vätevärde, varias, stadardavvikelse för തX, p, S 2. 3

Egeskaper hos skattigar E skattig borde uppfylla flera krav. De borde vara: o vätevärdesriktigt o kosistet o effektiv defierade egeskaper för skattigar Med hjälp av dessa egskaper ka ma bedöma hur lämpligt e skattig är. Vätevärdesriktighet θ = skattig för θ θ står för e parameter i e fördelig (μ, σ, p, ) När vätvärdesriktighet föreligger, så måste gälla dvs. vätevärdet för skattige stämmer överes med parameter som ska skattas. Ex1: skattig av vätevärdet och variase för e ormalfördelig: Äve om vi ite käer det saa värdet på μ, så vet vi dock att skattiges vätevärde stämmer överes med μ! (det är därför vi måste aväda 1 i ämare!) Ex2: skattig för saolikhete att lyckas i e biomialfördelig: E X för Bi(, p) 4

Vätevärdesriktighet vätevärdesriktig skattig, bra biased skattig, ite bra E vätevärdesriktig skattig θ är väl kocetrerad krig det saa värdet på parameter θ. Skattige ger rätt parametervärde i geomsittet om ma gör ett stort atal försök. 9 Kosistes θ = skattig baserad på observatioer (mätvärde) Ju större, desto midre ska variase hos skattige vara. Om går mot ska variase gå mot oll. Om e skattig är kosistet löar det sig att samla fler observatioer vi får ju midre varias, dvs. midre osäkerhet om skattige ligger ära det saa värdet. Ex 1: skattig för vätevärdet och variase för e ormalfördelig: Låter det kostigt? μ är e slumpvariabel, har alltså e varias! 5

Kosistes Ex 2: skattig för saolikhete att lyckas i e biomialfördelig: skattig för p i Bi(, p) X ~ Bi, p Sammafattig: De ituitiva skattigar för μ, σ, p i N(μ, σ) respektive Bi(, p) är både vätevärdesriktiga och kosisteta. Kosistes Täthetsfuktio för skattig തX f തX x = 5 = 15 = 45 Skattige kocetreras mer och mer krig det saa värdet är stickprovet blir större och större, dvs. är växer. 6

Effektivität E skattig borde ha e så lite varias som möjligt. Stor varias betyder ju stor osäkerhet. Ka ma välja mella olika skattigar borde ma aväda de skattig som har mist varias, alltså de mest effektiva. Exempel: stickprov där Som skattig aväds det aritmetiska medelvärdet av alla 10 observatioer. Som skattig aväds medelvärdet av det största och det mista värdet. μ 1 är mest effektiv Best att hitta: MVUE (https://e.wikipedia.org/wiki/miimum-variace_ubiased_estimator) Effektivität θ är effektivare ä መθ om V θ < V መθ mest effektiv midre effektiv 7

Metoder för att hitta skattigar (. alltså att hitta e formel som aväds på mätvärdea) Det fis olika metoder för att fia ett uttryck för e skattig: a) Mometmetode b) Mista-kvadrat-metode c) Maximum-Likelihood-metode d).. Mometmetode Teoretiska 1:a mometet = Stickprovets 1:a momet E X; θ = 1 i=1 x i beror på parameter som ska skattas geomsitt av alla observatioer (mätvärde) Exempel: Bi(, p) p = x 1 p är parameter som ska skattas p = X 1 bara e observatio (atalet lyckade ) skattig för p i Bi(, p) mer: https://e.wikipedia.org/wiki/method_of_momets_(statistics) 8

Mista-kvadrat-metode Q θ N = i=1 x i E X; θ 2 Mi N mätvärde (stickprov) E X beror av ågo parameter θ Exempel: Bi(, p) X ~ Bi(, p) där p ska skattas E X = p bara ett värde i stickprovet: x 1 Q p = x 1 p 2 Mi dq dp = 2 x 1 p = 0 p = x 1 mer: https://sv.wikipedia.org/wiki/mistakvadratmetode Maximum-Likelihood-Metode blå: histogram över mätvärde röd: täthetsfuktio för olika μ, σ ML_plot.R Ide: välj parametrara så att mätvärdea blir mest plausibla välj de parametrara som ger de tjocka röda kurva. 9

Maximum-Likelihood-Metode stickprov: Likelihood: fuktio av e fördeligsparameter x = x 1, x 2,, x x i käda (mätvärde) ger skattigar för μ ger och μ σ och som σ fuktio som fuktio av av mätvärdea x mätvärde i Parametriska puktskattigar Fördelig Param. Skattig för parameter Metod Blom X ~ N μ, σ μ μ = തX X ~ N μ, σ σ 2 S 2 = 1 1 S xx ML, MK, MM 289 MM, ML 277, 290 X ~ N μ, σ σ S = S 2 ML 291 Am. 7.14 X ~ Po μ μ μ = തX MM, MK, ML 295 X ~ Bi(, p) p p = X X~Hyp N,, m p p = X X ~ Exp λ λ λ = 1 തX ML 293 MM, MK, ML 294 ML 282 X ~ U 0, θ θ θ = + 1 max X i ML 284 തX = X i i=1 i=1 S xx = X i തX 2 10

Parametriska puktskattigar, forts. Fördelig Param. Skattig för parameter Metod Blom μ x μ x = തX ML 289 X ~ N μ x, σ μ y μ y = തY ML 289 Y ~ N μ y, σ σ 2 S 2 = S xx + S yy x 1 + y 1 ML 292 X 1 ~ Bi 1, p X 2 ~ Bi 2, p p p = X 1 + X 2 1 + 2 ML 293 X 1 ~ Po λ t 1 λ λ = X 1 + X 2 X 2 ~ Po λ t t 1 + t 2 2 ML Problem 7.2.19 തX = i=1 X i S xx = X i തX 2 i=1 Medelfelet Medelfelet ger e uppfattig av osäkerhete i skattige (större medelfel större osäkerhet). Ju midre stadardavvikelse för e skattig är, desto bättre skattige. Medelfelet ger ett umeriskt värde för dea stadardavvikelse, det är e skattig av stadardavvikelse. 11

Medelfelet 1. Medelfelet för skattig av µ i N μ, σ : skattig för µ i N(μ, σ) exakt uttryck för skattiges stadardavvikelse, me σ okäd! σ s (σ ersätts med si skattig s) medelfelet, umeriskt värde ka beräkas, approximerig för stadardavvikelse (för skattig av μ i N(μ, σ) med തX ) Medelfelet 2. Medelfelet för skattig av p i Bi, p : skattar p i Bi(, p) exakt, me p okäd (det är parameter vi vill skatta) ersätter p med si skattig medelfelet, umeriskt värde ka beräkas medelfelet för skattig av p i Bi(, p) med p = X Τ 12

Medelfelet för skattig av e proportio Medelfelet... fås geom att ersätta okäda parametrar i formel för stadardavvikelse med deras skattigar: Förd. att skatta estimator N μ, σ µ തX Stadardavv. estimator σ ersätta σ s Medelfelet hos estimator d = s Bi, p p x p 1 p p p p 1 p p = x 13