Kapitel 9 Egenskaper hos punktskattare

Relevanta dokument
Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Föreläsning 8: Konfidensintervall

Kapitel 10 Hypotesprövning

SF1901 Sannolikhetsteori och statistik I

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 11: Mer om jämförelser och inferens

C1 Sannolikhetslära och inferens II: Läsanvisningar (6e upplagan)

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Teoretisk statistik. Gunnar Englund Matematisk statistik KTH. Vt 2005

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Kapitel 5 Multivariata sannolikhetsfördelningar

TMS136. Föreläsning 10

Föreläsning 12: Linjär regression

FÖRELÄSNING 7:

9. Konfidensintervall vid normalfördelning

f(x) = 2 x2, 1 < x < 2.

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

Matematisk statistik för D, I, Π och Fysiker

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 11, Matematisk statistik Π + E

SF1901: Medelfel, felfortplantning

SF1901 Sannolikhetsteori och statistik I

Föreläsning 12: Repetition

Formel- och tabellsamling i matematisk statistik

SF1901: Sannolikhetslära och statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 10/ KL

Thomas Önskog 28/

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 7. Statistikens grunder.

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

, för 0 < x < θ; Uppgift 2

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

TMS136. Föreläsning 11

0 om x < 0, F X (x) = c x. 1 om x 2.

Grundläggande matematisk statistik

Samplingfördelningar 1

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Föreläsning 7: Punktskattningar

Föreläsning 15: Försöksplanering och repetition

Avd. Matematisk statistik

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Matematisk statistik för B, K, N, BME och Kemister

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Tentamen MVE301 Sannolikhet, statistik och risk

FÖRELÄSNING 8:

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik TMS064/TMS063 Tentamen

Föreläsning 12: Regression

Matematisk statistik TMS063 Tentamen

Härledning av Black-Littermans formel mha allmänna linjära modellen

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Kurssammanfattning MVE055

Avd. Matematisk statistik

Föreläsning 7: Punktskattningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Repetitionsföreläsning

FACIT: Tentamen L9MA30, LGMA30

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Tentamen MVE300 Sannolikhet, statistik och risk

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Tentamen i Matematisk Statistik, 7.5 hp

F9 SAMPLINGFÖRDELNINGAR (NCT

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

TMS136. Föreläsning 7

Punktskattning 1 Ett exempel

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

SF1901 Sannolikhetsteori och statistik I

Avd. Matematisk statistik

Föreläsning G60 Statistiska metoder

Tentamen MVE302 Sannolikhet och statistik

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Tentamen MVE302 Sannolikhet och statistik

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Lufttorkat trä Ugnstorkat trä

Tentamen MVE301 Sannolikhet, statistik och risk

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar

Några extra övningsuppgifter i Statistisk teori

Transkript:

Sannolikhetslära och inferens II Kapitel 9 Egenskaper hos punktskattare 1

Egenskaper hos punktskattare En skattare är en funktion av stickprovet och således en slumpvariabel. En bedömning av kvaliteten hos en skattare (i avsikt att skatta någon parameter θ) kan därmed göras via dess samplingfördelning. Vanliga kriterier är 1. Väntevärdesriktighet (unbiasedness) 2. Konsistens (consistency) 3. Effektivitet (efficiency) 2

Konsistens Definition. Låt θ vara en punktskattare av parametern θ. Om det för varje ε > 0 gäller att eller ekvivalent sägs θ vara en konsistent punktskattare av θ. Ett ekvivalent påstående är att θ konvergerar i sannolikhet till θ. Vi använder då följande notation. 3

Uppgift 9.26 Låt Y₁,Y₂,,Y n vara olfsv U(0,θ). Visa att θ=y (n) =max(y₁,y₂,,y n ) är en konsistent skattare av θ. Vi måste nu för varje ε>0 visa att I uppgift 6.74 visades att fördelningsfunktionen för Y (n) ges av 4

Uppgift 9.26 Om ε>θ kan Y (n) inte avvika med mer än ε från θ vilket innebär att saken är klar. Svårare blir det då 0<ε θ. varför det följer att 5

Viktiga resultat rörande konsistens Sats 9.1. Låt θ vara en väntevärdesriktig skattare av θ. Då gäller att θ är konsistent om Sats 9.2. Låt θ vara en konsistent skattare av θ och θ en konsistent skattare av θ. Då gäller följande Om g är en reellvärd funktion som är kontinuerlig i θ följer dessutom att 6

Slutskys sats Definition. Låt F n (x) vara fördelningsfunktion för en slumpvariabel X vid stickprovsstorlek n och F(x) fördelningsfunktion för en slumpvariabel Y. Om det för varje x gäller att lim n F n (x) = F(x) sägs X konvergera i fördelning till Y. d p Sats 9.3 (Slutsky). Låt U n Z där Z är N(0,1) och W n 1. Då gäller att 7

Uppgift 9.36 Låt Y vara Bi(n,p) med p okänd. För att skatta p använder vi p=y/n. I uppgift 9.20 såg vi att p är en väntevärdesriktig och konsistent skattare av p med variansen V(p)=pq/n där q=1-p. Enligt Centrala gränsvärdessatsen gäller dessutom att p approximativt är normalfördelad då n är stort vilket betyder att vi kan konstruera ett konfidensintervall för p via pivotkvantiteten Problemet är förstås att p är okänd. Hur löser vi detta problem? 8

Uppgift 9.36 d Enligt CGS gäller att Z n Z där Z är N(0,1). Eftersom p är en konsistent skattare av p gäller att p p. Låter vi q=1-y/n följer av samma anledning att q q. Slutligen följer av Sats 9.3 (Slutsky) att p Av Sats 9.2b följer nu att pq pq vilket innebär att vilket enligt Sats 9.2d leder till slutsatsen att p p 9

Relativ effektivitet Låt θ₁ och θ₂ vara två väntevärdesriktiga skattare av θ. Effektiviteten hos θ₁ relativt θ₂ ges av kvoten 10

Absolut effektivitet Det visar sig att det finns en undre gräns för hur liten varians en väntevärdesriktig skattare kan ha. Låt Y₁,Y₂,,Y n vara olfsv med gemensam täthetsfunktion f(y) som innehåller en okänd parameter θ. Låt θ vara en väntevärdesriktig skattare av θ. Då gäller att I(θ) kallas för Cramér-Rao-gränsen. En skattare θ för vilken det gäller att V(θ)=I(θ) sägs vara effektiv. 11

Uttömmande statistikor (Sufficiency) Hittills har skattare tagits fram baserat på intuition. Vi behöver en mer vetenskaplig metod för att finna bra skattare. En statistika sammanfattar den information som finns i ett stickprov vilket betyder att viss information går förlorad. En statistika som (i viss mening) innehåller all information från stickprovet gällande θ sägs vara en uttömmande statistika för θ. Låt X₁,X₂,,X n ha simultan täthetsfunktion f(x₁,x₂,,x n ). θ sägs vara uttömmande för θ om den betingade fördelningen. inte beror på θ. 12

Likelihoodfunktionen och Faktoriseringssatsen Låt X₁,X₂,,X n ha simultan täthetsfunktion f(x₁,x₂,,x n ) som beror på någon parameter θ. Eftersom täthetens värde beror på θ kan vi konstruera den sk Likelihoodfunktionen. om olfsv. Sats 9.4 (Faktoriseringssatsen). En statistika U är en uttömmande statistika för θ om och endast om där g(u,θ) är en funktion enbart av u och θ, samt att h(x₁,x₂,,x n ) är en funktion som inte beror på θ. 13

Uppgift 9.38 a Låt Y₁,Y₂,,Y n vara olfsv N(μ,σ) med μ okänd (men σ känd). 14

Det gäller alltså att Uppgift 9.38 a där och Följaktligen gäller att Y är en uttömmande statistika för μ. 15

Uppgift 9.49 Låt Y₁,Y₂,,Y n vara olfsv U(0,θ). Vi vill undersöka om är en uttömmande statistika för θ. Dock gäller att vilket innebär att vi inte direkt kan avgöra detta. För att lösa problemet införs en sk indikatorfunktion. 16

Uppgift 9.49 Detta innebär att täthetsfunktionen för U(0,θ) kan skrivas som varför likelihoodfunktionen blir Alltså följer av faktoriseringssatsen att Y (n) är en uttömmande statistika för θ. 17

MVUE och Rao-Blackwell Definition. Den väntevärdesriktiga skattare som har lägst varians sägs vara MVUE (Minimum Variance Unbiased Estimator). Sats (Rao-Blackwell). Låt θ vara en väntevärdesriktig skattare av θ sådan att V(θ)<. Låt vidare U vara en uttömmande statistika för θ. Konstruera nu en ny skattare Då gäller att θ* är en väntevärdesriktig skattare av θ som är minst lika bra som θ, dvs 18

MVUE och minsta uttömmande statistika För att kunna finna MVUE måste vi först finna den minsta uttömmande statistikan, dvs den som bäst sammanfattar stickprovsinformationen angående θ. Sats. Låt U vara en minsta uttömmande statistika för θ och h(u) en funktion av U sådan att Då gäller att h(u) är MVUE av θ. För de allra flesta sannolikhetsfördelningar gäller att den uttömmande statistika som följer via faktoriseringssatsen (Sats 9.4) är en minsta uttömmande statistika. 19

Metod för att finna MVUE för θ 1. Använd faktoriseringssatsen (Sats 9.4) för att finna en uttömmande statistika U för θ. 2. Bestäm E(U). För att finna E(U) måste man eventuellt först finna sannolikhetsfördelningen för U, dvs f U (u) eller p U (u). 3. Modifiera (eventuellt) U via någon funktion h(u) så att E[h(U)]=θ. 20

Uppgift 9.61 (forts. av 9.49) 1. I uppgift 9.49 visades via faktoriseringssatsen att Y (n) är en (minsta) uttömmande statistika för θ. 2. I Exempel 9.1 visades att 3. Således följer att är MVUE av θ. 21

Metod för att finna MVUE för g(θ) Metoden kan även användas för att finna en MVUE för någon funktion g(θ). 4. Eftersom h(u) är en MVUE för θ studeras g(h(u)). 5. g(h(u)) behöver inte vara en väntevärdesriktig skattare av g(θ) men efter vidare modifiering fås W=h*(g(h(U))) där Eftersom W är en funktion av den minsta uttömmande statistikan U följer att W är en MVUE av g(θ). 22

Uppgift 9.64 a Låt Y₁,Y₂,,Y n vara olfsv N(μ,1). Bestäm MVUE av μ 2. 4. Enligt uppgift 9.8a är Y MVUE av μ varför vi studerar (Y) 2 5. Nu gäller dock att varför vi modifierar och får som är MVUE av μ 2. 23

Momentmetoden Typiskt för de flesta sannolikhetsfördelningar är att momenten beror på fördelningens parametrar. Tanken med momentmetoden är att skatta populationsmomentet av ordning k med motsvarande stickprovsmoment. skattas med Momentmetoden ger konsistenta skattare som dock inte alltid är väntevärdesriktiga och inte heller de mest effektiva skattarna. Den stora fördelen med momentmetoden är dess enkelhet. 24

Uppgift 9.69 Låt Y₁,Y₂,,Y n vara olfsv med gemensam täthetsfunktion För att med momentmetoden kunna skatta θ beräknas E(Y). 25

Uppgift 9.69 Enligt momentmetoden ska vi använda Y som skattare av E(Y) varför vi för att finna θ ska lösa ekvationen Eftersom Y är en konsistent skattare av E(Y) följer av Sats 9.2 Faktoriseringssatsen ger att den minsta uttömmande skattaren är U=-ΣlnY i och eftersom θ inte är en funktion av denna är den inte MVUE. 26

Maximum-Likelihood-metoden Likelihoodfunktionen anger sannolikheten/tätheten (eller likelihood) för just detta stickprov som en funktion av θ. En rimlig tanke är att som skattning av θ använda det värde på θ som maximerar sannolikheten/tätheten för detta stickprov. En skattare som använder denna princip sägs vara en Maximum-Likelihood-skattare (ML-skattare). 27

Maximum-Likelihood-metoden Låt X₁,X₂,,X n vara olfsv med en sannolikhetsfördelning som beror på någon parameter θ. Bestäm ML-skattaren för θ. 1. Bestäm den gemensamma sannolikhets-/täthetsfunktionen f(x θ) och bestäm likelihoodfunktionen 2. För att finna det värde på θ som maximerar L(θ) kan vi (vanligtvis) derivera L(θ) och söka nollställe. Oftast är det dock enklare att istället studera lnl(θ) varpå ML-skattaren blir det värde på θ som löser ekvationen 28

Uppgift 9.82 a Låt Y₁,Y₂,,Y n vara olfsv med gemensam täthetsfunktion Eftersom följer att är en (minsta) uttömmande statistika för θ. 29

Uppgift 9.82 b Utifrån den i a-uppgiften bestämda likelihoodfunktionen följer att Derivering med avseende på θ ger att dvs Således gäller att ML-skattaren av θ är 30

Uppgift 9.82 c Utifrån den i a-uppgiften bestämda likelihoodfunktionen följer att Låt x=y r Liknar tätheten för Ga(2,θ). Således gäller att θ är en väntevärdesriktig skattare av θ. Eftersom ML-skattaren dessutom är en funktion av den minsta uttömmande skattaren U följer att den är en MVUE för θ. 31

Maximum-Likelihood-metoden Låt U vara uttömmande för θ. Faktoriseringssatsen (9.4) ger att där g(u,θ) är en funktion enbart av u och θ, samt att h(x₁,x₂,,x n ) är en funktion som inte beror på θ. Maximum för beror således på stickprovet enbart utifrån U. Alltså följer att en ML-skattare alltid är en funktion av U. Om en ML-skattare kan göras väntevärdesriktig är den följaktligen ofta MVUE för den aktuella parametern. 32

Uppgift 9.83 a Låt Y₁,Y₂,,Y n vara olfsv U(0,2θ+1). Bestäm ML-skattaren av θ. Eftersom kan problemet inte lösas på det vanliga sättet. Problemet med att parametern i definitionsområdet löser vi (som tidigare) med hjälp av en indikatorfunktion. Det följer att 33

Alltså fås att Uppgift 9.83 a 1. För att maximera L(θ) minimerar vi uttrycket (2θ+1) n vilket innebär att θ ska väljas så litet som möjligt. 2. Indikatorfunktionen ger begränsningen att 2θ+1 Y (n) ML-skattningen av θ blir således 34

Trevliga egenskaper hos ML-skattare Invariansegenskapen. Låt θ vara ML-skattare för θ och låt t(θ) vara en funktion av θ. Då gäller att är ML-skattare av t(θ). Asymptotisk effektivitet (Avsnitt 9.8, frivilligt). Under vissa (vanligtvis uppfyllda) omständigheter gäller att ML-skattare asymptotiskt uppfyller Cramér-Rao-gränsen. 35

Uppgift 9.83 b Variansen för U(0,2θ+1) är Det följer då att Invariansegenskapen är ML-skattare av V(Y). 36