SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

Relevanta dokument
SF1901: Sannolikhetslära och statistik

SF1911: Statistik för bioteknik

SF1901: Sannolikhetslära och statistik

Föreläsning 5, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

SF1901: Sannolikhetslära och statistik

Föreläsning 5, FMSF45 Summor och väntevärden

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

Väntevärde och varians

SF1901: Sannolikhetslära och statistik

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Kap 2. Sannolikhetsteorins grunder

Övning 1 Sannolikhetsteorins grunder

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik

Föreläsningsanteckningar i Matematisk Statistik. Jan Grandell

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Exempel för diskreta och kontinuerliga stokastiska variabler

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

TMS136. Föreläsning 4

Föreläsning 8 för TNIU23 Integraler och statistik

4.1 Grundläggande sannolikhetslära

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

4.2.1 Binomialfördelning

Bengt Ringnér. October 30, 2006

Detta formelblad får användas under både KS2T och KS2D, samt ordinarie tentamen. x = 1 n. x i. with(stats): describe[mean]([3,5]); 4.

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 7: Punktskattningar

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Sannolikhet och statistik XI

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

Matematisk statistik för D, I, Π och Fysiker

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Föreläsning 8, Matematisk statistik Π + E

TAMS79: Föreläsning 6. Normalfördelning

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901 Sannolikhetsteori och statistik I

Föreläsning 2, FMSF45 Slumpvariabel

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Mer om slumpvariabler

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

4 Diskret stokastisk variabel

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Formel- och tabellsamling i matematisk statistik

Kurssammanfattning MVE055

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Föreläsning 6, FMSF45 Linjärkombinationer

Våra vanligaste fördelningar

TAMS79: Matematisk statistik vt 2013

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

SF1901: Sannolikhetslära och statistik

Föreläsning 7: Punktskattningar

Jörgen Säve-Söderbergh

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Föreläsning 4, Matematisk statistik för M

Transformer i sannolikhetsteori

Introduktion till statistik för statsvetare

Grundläggande matematisk statistik

TMS136. Föreläsning 5

TMS136. Föreläsning 5

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

Stokastiska Processer F2 Föreläsning 1: Repetition från grundkursen

Summor av slumpvariabler

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Centrala gränsvärdessatsen (CGS). Approximationer

Statistiska metoder för säkerhetsanalys

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

0 om x < 0, F X (x) = c x. 1 om x 2.

Oberoende stokastiska variabler

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Statistik 1 för biologer, logopeder och psykologer

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Antal ögon Vinst (kr) Detta leder till följande uttryck E(x) = x x p X(x) x f X(x)dx

Satsen om total sannolikhet och Bayes sats

FACIT: Tentamen L9MA30, LGMA30

Transkript:

SF1901: Sannolikhetslära och statistik Föreläsning 5. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski 28.01.2015 Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 1 / 28

Väntevärden Vi ska nu införa begreppet väntevärde för en s.v. Detta är den teoretiska motsvarigheten till begreppet medelvärde för en talföljd. Antag att vi har en lång talföljd x 1,...,x n, där talen är ganska små heltal. Medelvärdet definierades av x = 1 n n x k. k=1 Det kan vara bekvämt att göra omskrivningen x = i f i, i=0 där f i = antalet {k; x k = i}. n Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 2 / 28

Väntevärden När vi diskuterade tolkningen av begreppet sannolikhet, så sa vi att antalet gånger A inträffar n P(A) då n växer. För diskreta s.v. gäller då att f k p X (k) då k. Vi leds av detta till följande definition: Definition Väntevärdet µ för en s.v. X är { k=0 µ = E(X) = kp X(k) xf X(x)dx i diskreta fallet, i kontinuerliga fallet. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 3 / 28

Väntevärden Väntevärden Vi skall alltid anta att k p X (k) < k=0 och x f X (x)dx <. Väntevärdet ger samma information och samma brist på information för den s.v. som medelvärdet ger för en talföljd. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 4 / 28

Väntevärden: tvåpunktsfördelning X säges vara tvåpunktsfördelad om X antar endast två värden a och b. p X (a) = p och p X (b) = 1 p. E(X) = kp X (k) = a p+b (1 p). k=0 E(X) är ett tal mellan a och b eller en konvex kombination av a och b. Om a = 1 och b = 0, är X Bernoulli-fördelad, X Be(p). p för k = 0 p X (k) = 1 p för k = 1 0 för övriga värden på k, vilket ger E(X) = kp X (k) = 1 p+0 (1 p) = p. k=0 Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 5 / 28

Väntevärden Låt oss tänka på tärningskast igen. Hur mycket skulle ni vara villiga att betala för följande spel: Jag kastar en tärning, och ni får lika många kronor som det blir ögon? Vi har { 1 p X (k) = 6 för k = 1,2,3,4,5,6 0 för övriga värden på k, vilket ger med formeln för summan av en aritmetisk serie E(X) = 6 kp X (k) = k=0 k=1k 1 6 = 1 6(6+1) 6 2 = 42 12 = 3.5. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 6 / 28

Väntevärde för Poissonfördelningen E(X) = p X (k) = µk k! e µ, för k = 1,2... k µk k=0 k! e µ = = µ k=1 µ k 1 k µk k=1 k! e µ = (k 1)! e µ = µ i=0 k=1 µ i i! e µ = µ. µ k (k 1)! e µ Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 7 / 28

Väntevärde för exponentialfördelningen = 1 λ { λe λx för x 0, f X (x) = 0 för x < 0. y = λx E(X) = xf X (x)dx = xλe λx dx = x = y/λ 0 dx = dy/λ ye y dy = 1 [ ye y ] 0 λ 0 + 1 e y dy = 0 1 [ e y ] λ 0 λ 0 = 1 λ. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 8 / 28

Väntevärde för exponentialfördelningen Funktionsgraferna i bilden är sl-tätheterna för Exp(1) (i blått) och Exp(2) (i grönt): väntevärdet för Exp(2) = 1/2 < 1 = väntevärdet för Exp(1) 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 9 / 28

Väntevärde för binomialfördelningen = np p X (k) = E(X) = n k=1 = ( ) n p k (1 p) n k, för k = 0,1,...,n. k n k=0 n k=1 k p X (k) = n k k=1 ( ) n p k (1 p) n k k n! (n k)!(k 1)! pk (1 p) n k (n 1)! ((n 1) (k 1))!(k 1)! p(k 1) (1 p) (n 1) (k 1) Variabelbytet j = k 1, j = 0,...,n 1 ger ( n 1 = np j n 1 j=0 ) p j (1 p) (n 1) j = np, ty ( n 1 j )p j (1 p) (n 1) j är sannolikhetsfunktionen för Bin(n 1,p). Det finns ett enklare resonemang. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 10 / 28

Funktioner av stokastiska variabler Om X är en stokastisk variabel. Om g(x) är en reellvärd funktion av x, så är Y = g (X) en stokastisk variabel, eftersom den är en funktion av en stokastisk variabel. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 11 / 28

Väntevärde för Y = g(x) Antag att vi känner förd. för X, och vill beräkna E(Y) där Y = g(x). Följande, skenbart oskyldiga, sats är ordentligt svår att bevisa i det kontinuerliga fallet Sats Väntevärdet för g(x) är { k=0 E(g(X)) = g(k)p X(k) g(x)f X(x)dx i diskreta fallet, i kontinuerliga fallet. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 12 / 28

Väntevärde för Y = g(x) Bevis. Blom m.fl. visar satsen i det diskreta fallet, så vi betraktar det kontinuerliga fallet. Vi begränsar oss dock till fallet då g är strikt växande. Denna begränsning förenklar beviset högst avsevärt. Låt g 1 (x) vara inversen till g. Då gäller F Y (y) = P(Y y) = P(g(X) y) = P(X g 1 (y)) = F X (g 1 (y)) vilket ger f Y (y) = df X(g 1 (y)) dy = F X(g 1 (y)) dg 1 (y) dy = f X (g 1 (y)) dg 1 (y). dy Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 13 / 28

Väntevärde för Y = g(x) Av detta fås E(Y) = yf Y (y)dy = = yf X (g 1 (y)) dg 1 (y) dy dy x = g 1 (y) = dx = dg 1 (y) dy dy = g(x)f X (x)dx. y = g(x) Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 14 / 28

Väntevärde för Y = g(x) Från denna sats följer bl.a. följande: E(h(X)+g(X)) = E(h(X))+E(g(X)) med det viktiga specialfallet Sats E(aX +b) = ae(x)+b. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 15 / 28

Varians Väntevärdet säger ingen om hur X varierar. Betrakta följande: X µ och (X µ) 2 Vi leds nu till följande definition. Definition Variansen σ 2 för en s.v. X är σ 2 = V(X) = E[(X µ) 2 ]. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 16 / 28

Varians Följande räkneregel är mycket användbar: Sats V(X) = E(X 2 ) [E(X)] 2 = E(X 2 ) µ 2. Bevis. V(X) = E[(X µ) 2 ] = E[X 2 + µ 2 2µX] = E[X 2 ]+µ 2 2µE[X] = E(X 2 ) µ 2. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 17 / 28

Varians: tvåpunktsfördelning X antar endast två värden a och b. p X (a) = p och p X (b) = 1 p, vi har sett att µ = E(X) = a p+b (1 p). E(X 2 ) = a 2 p+b 2 (1 p). V(X) = E(X 2 ) µ 2 = a 2 p+b 2 (1 p) a 2 p 2 2abp(1 p) b 2 (1 p) 2 och en viss dos aritmetik ger =... = p(1 p)(a b) 2. D.v.s en växande funktion av avståndet mellan a och b, vilket i detta fall känns som en naturlig egenskap. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 18 / 28

Varians I exemplet med tärningsspel har vi µ = 3.5 = 21 6. Vidare har vi E(X 2 ) = Enligt räkneregeln fås k 2 6 p X (k) = k 21 6 = 91 6 = 15.16 k= k=1 V(X) = 91 6 ( 21 6 ) 2 = 546 441 36 = 2.92. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 19 / 28

Varians Sats V(aX +b) = a 2 V(X). Bevis. V(aX +b) = E[(aX +b E(aX +b)) 2 ] = E[(aX +b aµ b) 2 ] = E[(aX aµ) 2 ] = a 2 E[(X µ) 2 ] = a 2 V(X). Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 20 / 28

Standardavvikelsen Definition Standardavvikelsen σ för en s.v. X är σ = D(X) = V(X). Sats D(aX +b) = a D(X). Allmänt gäller: D rätt sort. V lättare att räkna med. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 21 / 28

Standardisering av en st.v. X X har µ = E[X] och σ 2 = V(X). Sätt Enligt räknereglerna ovan fås = X µ. σ Z def E[Z] = E[X µ] σ = E[X] µ σ = 0. V(Z) = 1 σ 2V(X µ) = 1 σ 2V(X) = 1 σ 2 σ2 = 1. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 22 / 28

Exponentialfördelningen. E(X 2 ) = 0 x 2 λe λx dx = 1 λ 2 y 2 e y dy = part. int. = 2 λ 2 V(X) = 2 λ 2 1 λ 2 = 1 λ 2 D(X) = 1 λ. 0 Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 23 / 28

Poissonfördelningen E(X(X 1)) = = k=2 µ k (k 2)! e µ = µ 2 k(k 1) µk k! e µ = k(k 1) µk k! e µ k=0 k=2 k=2 µ k 2 (k 2)! e µ = µ 2 i=0 µ i i! e µ = µ 2. Detta ger µ 2 = E(X(X 1)) = E(X 2 ) µ, eller E(X 2 ) = µ 2 + µ, vilket ger V(X) = E(X 2 ) µ 2 = µ 2 + µ µ 2 = µ. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 24 / 28

Markovs olikhet Sats (Markovs olikhet) För varje a > 0 och icke-negativ stokastisk variabel Y gäller P(Y a) E(Y). a Bevis. Vi nöjer oss med det kontinuerliga fallet. Vi har E(Y) = 0 yf Y (y)dy = a 0 yf Y (y)dy + yf Y (y)dy yf Y (y)dy a a a f Y (y)dy = a P(Y a). a Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 25 / 28

Tjebysjovs olikhet I Sats (Tjebysjovs olikhet) För varje ε > 0 gäller P( X µ > ε) V(X) ε 2. Bevis. Detta är den enda riktigt djupa satsen i kursen som vi kan bevisa. Vi nöjer oss med det kontinuerliga fallet. Ett alternativt bevis kan ges m.h.a. Markovs olikhet: Vi har V(X) = (x µ) 2 f X (x)dx (x µ) 2 f X (x)dx ε 2 x µ >ε x µ >ε f X (x)dx = ε 2 P( X µ > ε). Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 26 / 28

Tjebysjovs olikhet II (k standardavvikelser) Ersätter vi ε med kσ fås olikheten i Blom m.fl.: Sats (Tjebysjovs olikhet) För varje k > 0 gäller P( X µ > kσ) 1 k 2. Ingenjörsmässig formulering av denna olikhet (i fallet tre standardavvikelser): sannolikheten att data ligger inom intervallet [µ 3σ, µ+3σ] är minst 1 1/9 = 0.89. Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 27 / 28

Tjebysjovs olikhet III (k standardavvikelser) Jan Grandell & Timo Koski () Matematisk statistik 28.01.2015 28 / 28