Föreläsning 7: Punktskattningar

Relevanta dokument
Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Stokastiska vektorer och multivariat normalfördelning

Matematisk statistik för D, I, Π och Fysiker

Kap 2. Sannolikhetsteorins grunder

Föreläsning 6, Matematisk statistik Π + E

Föreläsning 15: Försöksplanering och repetition

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 7: Stokastiska vektorer

Formel- och tabellsamling i matematisk statistik

Stokastiska vektorer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Föreläsning 8: Konfidensintervall

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Kapitel 5 Multivariata sannolikhetsfördelningar

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Föreläsning 5, Matematisk statistik Π + E

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik för D, I, Π och Fysiker

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

SF1901: Sannolikhetslära och statistik

Kurssammanfattning MVE055

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Väntevärde och varians

Föreläsning 12: Linjär regression

Föreläsning 6, FMSF45 Linjärkombinationer

F9 Konfidensintervall

Matematisk statistik KTH. Formelsamling i matematisk statistik

Stokastiska signaler. Mediesignaler

Sannolikhet och statistik XI

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FACIT: Tentamen L9MA30, LGMA30

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

FACIT: Tentamen L9MA30, LGMA30

Mer om konfidensintervall + repetition

2.1 Mikromodul: stokastiska processer

Statistiska metoder för säkerhetsanalys

Formler och tabeller till kursen MSG830

Övning 1 Sannolikhetsteorins grunder

Föreläsning 12: Regression

Demonstration av laboration 2, SF1901

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Tentamen i Matematisk Statistik, 7.5 hp

Repetitionsföreläsning

Föreläsning 11: Mer om jämförelser och inferens

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Matematisk statistik för D, I, Π och Fysiker

FÖRELÄSNING 7:

Kovarians och kriging

Matematisk statistik för D, I, Π och Fysiker

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 5, FMSF45 Summor och väntevärden

Tentamen MVE302 Sannolikhet och statistik

Grundläggande matematisk statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Övning 3 Vecka 4,

SF1901 Sannolikhetsteori och statistik I

Föreläsning 4: Konfidensintervall (forts.)

Matematisk statistik för B, K, N, BME och Kemister

SF1901 Sannolikhetsteori och statistik I

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 12: Repetition

F13 Regression och problemlösning

Thomas Önskog 28/

Sannolikheter och kombinatorik

Några extra övningsuppgifter i Statistisk teori

Teoretisk statistik. Gunnar Englund Matematisk statistik KTH. Vt 2005

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Kompendium om flerdimensionella fördelningar för kursen S0008M Sannolikhetslära och statistik

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistik 1 för biologer, logopeder och psykologer

9. Konfidensintervall vid normalfördelning

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Samplingfördelningar 1

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

FÖRELÄSNING 8:

Föreläsning 5. Kapitel 6, sid Inferens om en population

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Transkript:

Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015

Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska värden till varje utfall i Ω. För diskreta variabler har vi sannolikhetsfunktionen p X,Y (i, j) = P(X = i, Y = j). Där p X,Y (i, j) 0 och i,j p X,Y (i, j) = 1. För kontinuerliga variabler har vi en täthetsfunktion f X,Y (x, y) som är sådan att 1 f X,Y (x, y) 0, 2 f X,Y (x, y)dxdy = 1, och 3 P(a X b och c Y d) = b a d c f X,Y (x, y)dxdy.

Marginalfördelningar Givet en diskret tvådimensionell slumpvariabel (X, Y ) definieras marginalfördelningarna för X och Y som p X (i) = p Y (j) = j= i= p X,Y (i, j) p X,Y (i, j) I det kontinuerliga fallet definieras marginalfördelningarna för X och Y på motsvarande sätt som f X (x) = f Y (y) = f X,Y (x, y)dy f X,Y (x, y)dx

Väntevärden Väntevärde Givet en tvådimensionell slumpvariabel (X, Y ) definieras väntevärdena för X och Y som E(X) = { i= j= ip X,Y (i, j), xf X,Y (x, y)dxdy, i det diskreta fallet i det kontinuerliga fallet och E(Y ) = { i= j= jp X,Y (i, j), yf X,Y (x, y)dxdy, i det diskreta fallet i det kontinuerliga fallet

Väntevärden Notera att vi också kan formulera väntevärdena med marginalfördelningarna för X och Y om vi har beräknat dem först. Till exempel för det diskreta fallet har vi E(X) = = i= j= i= ip X (i) Väntevärden av funktioner ip X,Y (i, j) = i= i j= Väntevärdet av en funktion H(X, Y ) definieras som p X,Y (i, j) E(H(X, Y )) = { i= j= H(i, j)p X,Y (i, j), H(x, y)f X,Y (x, y)dxdy, diskret kontinuerlig

Beroende Oberoende slumpvariabler Två slumpvariabler X och Y sägs vara oberoende om deras täthetsfunktion (eller sannolikhetsfunktion) kan skrivas som produkten av marginalfördelningarna. Det vill säga, för det diskreta fallet p X,Y (i, j) = p X (i)p Y (j) och för det kontinuerliga fallet f X,Y (x, y) = f X (x)f Y (y).

Betingade fördelningar Den betingade fördelningen för X givet Y = y definieras för det kontinuerliga fallet som f X y (x) = f X,Y (x, y), f Y (y) givet att f Y (y) > 0. På motsvarande sätt har vi den betingade fördelningen för Y givet X = x: givet att f X (x) > 0. f Y x (y) = f X,Y (x, y), f X (x) Samma formler gäller för diskreta variabler om vi byter f mot p.

Kovarians Kovarians Kovariansen mellan X och Y definieras som C(X, Y ) = E[(X µ X )(Y µ Y )] där µ X = E(X) och µ Y = E(Y ). Enligt definitionen kan vi skriva kovariansen som C(X, Y ) = { i= j= (i µ X)(j µ Y )p X,Y (i, i), (x µ X)(y µ Y )f X,Y (x, y), diskret, kontinuerlig, Notera att vi har att C(X, X) = V(X).

Korrelation och oberoende Sats Kovariansen kan beräknas som C(X, Y ) = E(XY ) E(X)E(Y ) Sats Om X och Y är oberoende så är C(X, Y ) = 0 och E(XY ) = E(X)E(Y ). Varians av summor För två slumpvariabler X och Y, och två tal a och b har vi V(aX + by ) = a 2 V(X) + b 2 V(Y ) + 2abC(X, Y )

Korrelation och oberoende Korrelation Den så kallade korrelationskoefficienten definieras som ρ(x, Y ) = C(X, Y ) V(X)V(Y ). Detta mått beskriver linjär samvariation mellan X och Y. Vi har att 1 ρ 1. Vi säger att X och Y är okorrelerade om ρ(x, Y ) = 0. Vi har följande samband mellan beroende och korrelation: Om X och Y är oberoende så är de okorrelerade. Om X och Y är okorrelerade så behöver de inte vara oberoende. Dessa samband är naturliga eftersom två slumpvariabler är oberoende om det inte finns någon samvariation alls mellan dem, medan de är okorrelerade om det saknas linjär samvariation.

Korrelation och kausatilitet (I) Korrelation beskriver linjärt beroende mellan två variabler. 1 Korrelation säger inget om orsakssamband (kausalitet)! (men telefoner cancer kanske är troligare än cancer telefoner) Vi kan också ha att all samvariation kan förklaras av en tredje icke uppmätt variabel. 1 Serier från xkcd.com

Korrelation och kausatilitet (II) US spending on science, space, and technology correlates with Suicides by hanging, strangulation and suffocation 2 Correlation: 0.992082 2 Källa: http://www.tylervigen.com/view_correlation?id=1597

Korrelation och kausatilitet (III)

Den tvådimensionella normalfördelningen En vanlig modell för en kontinuerlig tvådimensionell slumpvariabel är den tvådimensionella normalfördelningen. (X, Y ) sägs ha en tvådimensionell normalfördelning om den simultana täthetsfunktionen är 1 f X,Y (x, y) = 2πσ x σ y 1 ρ 2 ( [ (x ) 2 ( ) 2 ( ) ( ) ]) 1 µx y µy x µx y µy exp 2(1 ρ 2 + 2ρ ) σ x här är (µ x, µ y ) och (σ x, σ y ) väntevärdena och standardavvikelserna för X och Y, och ρ är korrelationskoefficienten. σ y σ x σ y Den tvådimensionella normalfördelningen

Ett exempel av fördelningen med ρ = 0.5. Den tvådimensionella normalfördelningen

ρ = 0 Den tvådimensionella normalfördelningen

ρ = 0.5 Den tvådimensionella normalfördelningen

ρ = 0.9 Den tvådimensionella normalfördelningen

Egenskaper Om (X, Y ) har en tvådimensionell normalfördelning är X N(µ x, σ 2 x) Y N(µ y, σ 2 y). Vidare kan den tvådimensionella normalfördelningen endast beskriva linjär samvariation: Om ρ = 0 så är X och Y oberoende. Ett alternativt sätt att skriva täthetsfunktionen är att införa en väntevärdesvektor µ en kovariansmatris Σ µ = ( µx µ y ), Σ = ( σ 2 x σ x σ y ρ σ x σ y ρ σ 2 y ), x = ( ) x. y Vi kan då skriva täthetsfunktionen som ( 1 f X,Y (x, y) = 2π Σ exp 1 ) 2 (x µ)t Σ 1 (x µ), Den tvådimensionella normalfördelningen

Statistikteori Statistikteori

Statistikteori Antag att vi har fått observationer x 1,..., x n från en viss fördelning. Givet dessa observationer, vad kan vi säga om parametrarna i fördelningen? Vi kommer titta på tre olika frågeställningar: punktskattning Vad är ett troligt värde för parametrarna? konfidensintervall Hur säker är denna skattning? För att karakterisera osäkerheten vill vi bilda ett intervall som med hög sannolikhet ska täcka det sanna värdet på parametern. hypotesprövning Undersök hypoteser kring parametrana, till exempel kan vi vilja veta om µ > 0 i en normalfördelning. Statistikteori

Populationer Vi kommer utgå från att vi har ett stickprov av observationer x 1,..., x n som vi vill använda för att få kunskap om en population. Begreppet population kan innebära lite olika saker, vi kan skilja på två typfall: Populationen kan vara en väl avgränsad mängd saker, där vi i teorin räkna upp alla ingående element i en lista. Populationen kan också vara något lite mer abstrakt. Till exempel kan vi ha en process av vilken vi kan göra upprepade mätningar. Populationen här kan tänkas som alla möjliga slumpmässiga försök av denna typ, vilket inte har något konkret avgränsning. Statistikteori Populationer

Stickprov Det är viktigt att vårt stickprov är representativt för populationen, vilket betyder att det är någorlunda typiskt för populationen. Om detta inte är fallet kan vi få systematiska fel i våra skattningar. En matematisk definition av stickprov Ett stickprov av storlek n är n oberoende observationer av en slumpvariabel X. Vi kan alltså skriva stickprovet som observationer av n slumpvariabler X 1,..., X n där alla X i är oberoende och likafördelade. Denna definition täcker fallet med upprepade experiment ovan, och kan oftast ses som en bra approximation i fallet med ändlig population om n är litet i förhållande till storleken på populationen. Statistikteori Populationer