Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Relevanta dokument
Grundläggande matematisk statistik

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Föreläsning 2: Punktskattningar

F10 ESTIMATION (NCT )

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

θx θ 1 om 0 x 1 f(x) = 0 annars

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

4.2.3 Normalfördelningen

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Formelblad Sannolikhetsteori 1

Datorövning 2 Fördelningar inom säkerhetsanalys

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Datorövning 2 Fördelningar inom säkerhetsanalys

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Föreläsning G04: Surveymetodik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

a) Beräkna E (W ). (2 p)

Föreläsning G70 Statistik A

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Tentamen i matematisk statistik

Linjär regression - kalibrering av en våg

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Matematisk statistik TMS063 Tentamen

Lycka till! I(X i t) 1 om A 0 annars I(A) =

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

S0005M V18, Föreläsning 10

Id: statistik.tex :48:29Z joa

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Tentamen i Sannolikhetsteori III 13 januari 2000

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Introduktion till statistik för statsvetare

TMS136: Dataanalys och statistik Tentamen med lösningar

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Avd. Matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

SAMMANFATTNING TAMS65

2. Konfidensintervall för skillnaden mellan två proportioner.

TENTAMEN I MATEMATISK STATISTIK

Matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Borel-Cantellis sats och stora talens lag

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

1. Test av anpassning.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

SF1901 Sannolikhetsteori och statistik I

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Matematisk statistik KTH. Formelsamling i matematisk statistik

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Thomas Önskog 28/

Lösningsförslag

E ( X ) = (här ska ni skriva en viss bokstav! Vilken? Varför)

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR CDEFI, NANO OCH PI, MAS233, 2004 FMS 012, FMS 022, FMS 121 OCH MAS233

F12 Stickprovsteori, forts

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

2004 Rune Norberg. Måste elimineras! Hur då? Kapitel 9. Variation Olika typer av data Rune Norberg. Kapitel 9

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Föreläsning 7. Statistikens grunder.

Tentamen i matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Transkript:

Skattig / Iferes Saolikhet och statistik Puktskattig Försöket att beskriva e hel populatio pga ågra få mätvärde! Oberservatio = Populatio HT 2008 UweMezel@mathuuse http://wwwmathuuse/ uwe/ Populatio har här e allmä betydelse: Glödlampor: livslägdera av 50 stycke = fördeligsfuktio för alla glödlampor av dea sort Framställig av skruvor: 50 mätade diameter = medelvärde och varias för diametrara av alla skruvor som framställs av e viss maski Skattig / Iferes Vad är det som skattas? Om populatioes fördelig är okäd: Skattig av populatioes medelvärde, varias Om ma har e uppfattig om populatioes fördelig: Skattig av e parameter θ av dea fördelig Figur: Skattig: att dra slutsatser för e hel populatio pga ett stickprov

Skattig av e okäd parameter (tex µ, σ) utgåede frå ett (litet) stickprov Receptet för skattige Skattige för θ måste vara e fuktioe av mätvärdea: = θ (x 1, x 2, x ) Till exempel: = x = 1 x i = max (x 1, x 2, x ) = x (media) Figur: Stickprov och de sökte täthetsfuktioe, som beror av e eller era parametrar = 1/ x Frå stickprovet till stickprovsvariabel Observatioera för θ beror av slumpe Stickprov x 1 x 2 x 3 x 4 x 5 = x 1 213 210 205 211 214 211 2 220 211 222 216 210 216 3 231 221 224 217 215 222 Stickprov styrs av slumpe, adra stickprov ger adra resultat För att få mera realistiska resultat måste ma fudera på vad som kude ha hät umeriskt värde resultat av stickprovet matematisk modell stickprovsvariabel θ

Skattige för θ ses som utfall av e slumpvariabel Stickprov: = θ (x 1, x 2, x ) Exempel: opiiosudersökig = 1000 persoer, x = 350 svarade Ja (ervatio) Sökes: adele Ja-svarare i hela befolkige (populatio)? Stickprovsvariabel: θ = θ (X 1, X 2, X ) Stickprov: p = x/ = 035 Stickprovsvariable: p = X / där X Bi(, p) Observatioera x 1, x ses som utfall av oberoede sv X 1, X som atas ha samma fördelig V (p ) = V (X /) = 1 p (1 p) p (1 p) V (X ) = = 2 2 1/ Geom att beräka fördelige för θ och dess spridig ka ma få e uppfattig av skattiges osäkerhet Vilke skattig ska avädas? Vätevärdesriktig skattig: E (θ ) = θ Exempel: skattig som ite är vätevärdesriktigt Sökes: medelvikte av skar av e viss sort i Österjö Stickprov av 50 skar söm vägas medelvikt Har ätet för stora luckor blir stickprovsmedelvärdet för hög - ma fågar ju bara de stora skar och får därmed ett systematiskt fel

Exempel: opiiosudersökig Vätevärdesriktig skattig: E (θ ) = θ Vi hade X Bi (1000, p) Vilke skattig ska avädas? Kosistes: P ( θ θ > ɛ) 0 om Ju större, desto större saolikhete att skattige θ ligger i ärhete av det saa värdet θ E vätevärdesriktig skattig är kosistet om E (p ) = E (X /1000) = 1 1000 E (X ) = 1 1000 1000 p = p lim V (θ ) = 0 Me vilke skattig går sabbast mot oll? Vilke skattig ska avädas? Eektivitet: V (θ ) < V (ˆθ) Vilke skattig ska avädas? Eektivitet: V (θ ) < V (ˆθ) E skattig med e midre varias (för samma ) är bättre riske är midre att skattige ligger lågt ifrå det saa värdet Två skattigar ka jämföras geom att deera eektivitete: V 1 V 2 = variase av de bättre skattige variase av de sämre skattige < 1

Eektivitet av två skattigar Radioaktivt söderfall Atalet partikler per tidsitervall mätades: Vi har 5 mätigar x 1, x 2, x 3, x 4, x 5 Vi aser dessa värde som utfall av de 5 sv X 1, X 2, X 3, X 4, X 5 Vi vet att X i Po (θ), oberoede me vi käer ite till θ Eektivitet av två skattigara De två skattigar: θ = (X 1 + X 2 + X 3 + X 4 + X 5 ) /5 och ˆθ = X 1 Vätevärdet av de båda stickprovsvariablera: Jämför skattigara = (x 1 + x 2 + x 3 + x 4 + x 5 ) /5 och ˆθ = x 1 E (θ ) = 1 5 E (X 1 + X 2 + X 3 + X 4 + X 5 ) = 1 5 5θ = θ E(ˆθ) = E (X 1 ) = θ Båda skattigara är vätevärdesriktiga Eektivitet av två skattigara De två skattigar: θ = (X 1 + X 2 + X 3 + X 4 + X 5 ) /5 och ˆθ = X 1 Variase av de båda stickprovsvariablera: Skattig av vätevärde och varias Det ka häda att vi har ige uppfattig om de uderliggade fördelige som vara mätvärde kommer ifrå Vi ka ädå skatta medelvärdet och variase V (θ ) = 1 25 V (X 1 + X 2 + X 3 + X 4 + X 5 ) = 1 25 5θ = 1 5 θ V (ˆθ) = V (X 1 ) = θ Skattige är robust - beror ite på ågo (förmodad) fördelig Eektivitäte hos θ relativt ˆθ är 1/5

Skattig av medelvärdet µ Skattig av variase σ 2 (om äve µ är okäd) µ = x = 1 x i = µ = X = 1 X i ( ) σ 2 = s2 = 1 1 (x i x) 2 = ( σ 2) = 1 1 ( ) 2 Xi X Vätevärdet av stickprovsvariabel µ : ( ) E (µ 1 ) = E X i = 1 E (X i ) = 1 µ = µ Varias av stickprovsvariabel µ : V (µ ) = V ( 1 ) X i = 1 2 V (X i ) = 1 2 σ2 = σ 2 / Skattige är vätevärdesriktigt och kosistet Vätevärdet av stickprovsvariabel ( σ 2) : [ (σ 2 E ) ] [ ] 1 ( ) 2 = E Xi X = σ 2 1 Skattige är vätevärdesriktigt - beakta att det delas med ( 1) Stadardavvikelse: σ = s = 1 1 (x i x) 2 (ite exakt vätevärdesriktigt) Hur får ma ett recept för e skattig? Hur får ma ett recept för e skattig? Det s olika metoder för att hitta ett uttryck för e skattig: Mometmetode Mista-kvadrat-metode Maximum-likelihood-metode Metodera behadlas i kurse Iferes Figur: Maximum-likelihood-skattig: Välj parametrara så att mätvärdea blir mest plausibla

Maximum-Likelihood-Skattig p X (x 1 ) p X (x 2 ) p X (x ) L (θ) = f X (x 1 ) f X (x 2 ) f X (x ) Exempel ormalfördelig: L(µ, σ 2 ) = 1 2πσ e (x i µ) 2 /2σ 2 = Hitta µ, σ som gör L maximalt: L µ = 0 L σ = 2 0 diskret kotiuerlig 1 (xi µ) (2πσ 2 e 2 /2σ 2 ) /2 Parametriska puktskattigar Fördelig Par Skattig Metod Referes N(µ, σ) µ µ = X ML Blom, s265 N(µ, σ) σ 2 S 2 = 1 1 S XX ML Blom, s265 N(µ, σ) σ S = S 2 ML Blom, s252 Po(µ) µ µ = X ML Blom, s270 Bi(, p) p p = X / ML Blom, s268 Exp (1/θ) θ θ = X ML Blom, s257 U(0, θ) θ θ = +1 i(x i ) ML Blom, s258 Weibull(b, c) b b = ML Blom, s258 X N(µ 1, σ) µ 1 µ 1 = X ML Blom, s266 Y N(µ 2, σ) µ 2 µ 2 = Ȳ ML Blom, s266 σ 2 S 2 = S XX +S YY (1 1)+(2 1) ML Blom, s266 X = 1 X i S XX = ( ) 2 X i X X c i Medelfelet Opiiosudersökig - e gåg till Varias för skattige p : = 1000 persoer, x = 350 svarade Ja (ervatio) Sökes: adele Ja-svarare i hela befolkige (populatio)? Stickprov: p = x/ = 035 V (p ) = D (p ) = p (1 p) p (1 p) (stadardavvikelse) Stickprovsvariable: p = X / där X Bi(, p) V (p ) = V (X /) = 1 p (1 p) p (1 p) V (X ) = = 2 2 Problem: Vi ka ite räka ut ett umeriskt värde för V (p ) för att vi har ite p!! Skattig av osäkerhete: p = p d (p ) = ( ) p 1 p 035(1 035) = 15% 1000 Vi skattar alltså adele Ja-svarare i befolkige med 35 ± 15% Resultatet ka dock förbättras (det är bara e 68% kodesitervall) - se ästa föreläsig!

Normalfördelig, medelfelet för skattig av µ Skattig för µ: µ = x = µ = X X i N(µ, σ) = X N (µ, ) σ D(µ ) = σ = d(µ ) = s där s = 1 1 (x i x) 2 Sammafattig Stickprov / stickprovsvariabel Vätevärdesriktigt och kosistet skattig Relativ eektivitet av två skattigar Skattig av E och V är fördelige okäd Parametriska skattigar (tabell) Medelfelet Istället för σ aväds dess skattig s som beräkas ur stickprovet