SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

Relevanta dokument
SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

Väntevärde och varians

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

SF1901: Sannolikhetslära och statistik

Föreläsning 5, Matematisk statistik Π + E

Kap 2. Sannolikhetsteorins grunder

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 7: Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Föreläsning 7: Punktskattningar

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 6, FMSF45 Linjärkombinationer

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 7: Punktskattningar

Stokastiska vektorer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Sannolikhet och statistik XI

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Stokastiska vektorer och multivariat normalfördelning

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

SF1911: Statistik för bioteknik

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Summor av slumpvariabler

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Stokastiska signaler. Mediesignaler

SF1901: Sannolikhetslära och statistik

Övning 1 Sannolikhetsteorins grunder

Föreläsning 7: Stokastiska vektorer

SF1901: Sannolikhetslära och statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

TMS136. Föreläsning 5

Introduktion till statistik för statsvetare

Statistiska metoder för säkerhetsanalys

TMS136. Föreläsning 5

Kurssammanfattning MVE055

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901 Sannolikhetsteori och statistik I

6. Flerdimensionella stokastiska variabler

Mer om konfidensintervall + repetition

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Kapitel 5 Multivariata sannolikhetsfördelningar

Oberoende stokastiska variabler

Grundläggande matematisk statistik

Grundläggande matematisk statistik

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

TMS136. Föreläsning 4

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Demonstration av laboration 2, SF1901

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

2.1 Mikromodul: stokastiska processer

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

TAMS79: Föreläsning 6. Normalfördelning

Transformer i sannolikhetsteori

Matematisk statistik för D, I, Π och Fysiker

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik för D, I, Π och Fysiker

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

Föreläsning 12: Repetition

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

(x) = F X. och kvantiler

TENTAMEN I STATISTIKENS GRUNDER 1

Kovarians och kriging

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

FACIT: Tentamen L9MA30, LGMA30

Kompendium om flerdimensionella fördelningar för kursen S0008M Sannolikhetslära och statistik

F9 Konfidensintervall

Föreläsning 8, FMSF45 Binomial- och Poissonfördelning, Poissonprocess

Föreläsning 11: Mer om jämförelser och inferens

FACIT: Tentamen L9MA30, LGMA30

Transkript:

SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 6 MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. Tatjana Pavlenko 12 september 2017

PLAN FÖR DAGENS FÖRELÄSNING Repetition av begrepp oberoende s.v. (Kap. 4.5) Repetition av begrepp väntevärde och varians för diskreta och kontinuerliga s. v. Flerdimensionella s.v. (Kap. 5.1-5.2) Väntevärde för en funktion av flerdimensionell s.v. (Kap. 5.3, (c) ) Beroendemått: Kovarians och korrelation (Kap. 5.4, (c) ) Summa och linjärkombination: väntevärde och varians. (Kap. 5.5) Stora talens lag (Kap. 5.6)

OBEROENDE S.V. (REP.) Betrakta en tvådimenionell s.v. (X, Y ) Intuitivt: man kan anse att X och Y är oberoende om händelserna {X A} och {Y B} är oberoende för alla mängder A och B. Detta leder oss till följande Def: De s.v. X och Y kallas oberoende om P(X A, Y B) = P(X A)P(Y B) för alla mängder A och B. Sats: De s.v X och Y är oberoende om och endast om eller F X,Y (x, y) = F X (x)f Y (y) för alla x och y, p X,Y (j, k) = p X (j)p Y (k) för alla j och k, för diskreta s.v. f X,Y (x, y) = f X (x)f Y (y) för alla x och y, för kontinuerliga s.v.

FÖRDELNING FÖR MAX OCH MIN (REP.) Sats: Låt X 1 och X 2 vara oberoende s.v. med fördelningsfunktioner F X1 (x) respektive F X2 (x). Definiera U = min(x 1, X 2 ) och V = max(x 1, X 2 ). Då gäller att F U (u) = 1 (1 F X1 (u))(1 F X2 (u)), F V (v) = F X1 (v)f X2 (v). Sats kan vidare utvidgas för fler än två s.v.: Om X 1,..., X n är oberoende och lika fördelade med fördelningsfunktion F X (x) så har Y = min i=1,...,n (X 1,..., X n ) och Z = max i=1,...,n (X 1,..., X n ) fördelningsfunktionerna F Y (y) = 1 (1 F X (y)) n respektive F Z (z) = (F X (z)) n. Bevis och exempel på tavlan.

FÖRDELNING FÖR MAX OCH MIN (REP.) Exempel: Motor. En motor upphör helt att fungera när samtliga 4 cylindrar gått sönder. Antag att cylindrarnas livslängder X i, i = 1,..., 4 (i år) är oberoende och likafördelade Exp(λ) där λ = 1/7, dvs E (X i ) = 7. Låt en s.v. T vara tid tills motorn helt upphör att fungera, då är T = max(x 1,..., X 4 ). Fördelningsfunktion för de enskilda cylindrarna är F Xi (x) = 1 e x/7 (samma för alla i), vilket ger F T (t) = F 4 X i (t) = ( 1 e t/7) 4. Om vi i stället är intresserade av tiden S då motor funktion blir nedsatt pga någon cylinder inte fungerar så får vi S = min(x 1,..., X 4 ) och fördelningsfunktionen för S blir F S (s) = 1 (1 F Xi (s)) 4 = 1 (e s/7 ) 4 = 1 e 4s/7. Minsta av n st. oberoende lika förd. s.v. med Exp(λ) också är Exp-fördelad men Exp(nλ)!

VÄNTEVÄRDE FÖR EN FUNKTION AV FLERDIMENSIONELL S.V. Väntevärde och varians: räkneregler (repetition på tavlan). Sats 5.1 från kap. 5.2 om väntevärde för en funktion av en s.v. kan utvidgas till en funktion av flera s.v. Sats: Låt (X, Y ) vara en tvådimensionell s.v. och g(x, Y ) en reel finktion. Då gäller att E (g(x, Y ))) = j k g(j, k)p X,Y (j, k) g(x, y)f X,Y (x, y) eller om (X, Y ) är diskret respektive kontinuerlig. Intressanta fall är t ex g(x, Y ) = X + Y, g(x, Y ) = X samt g(x, Y ) = XY.

VÄNTEVÄRDE FÖR EN FUNKTION AV FLERDIMENSIONELL S.V. (FORTS.) Sats (väntevärde av en summa): För godtyckliga s.v X och Y gäller att E (X + Y ) = (x + y)f X,Y (x, y)dxdy = = xf X,Y (x, y)dxdy + Det diskreta fallet är helt analogt. = E (X ) + E (Y ). g(x, Y ) = x (respektive g(x, Y ) = y). Det gäller att E (g(x, Y )) = yf X,Y (x, y)dxdy = xf X,Y (x, y)dxdy, dvs man kan beräkna E (X ) och E (Y ) utan att först härleda de marginella fördelningarna!

VÄNTEVÄRDE FÖR EN FUNKTION AV FLERDIMENSIONELL S.V. (FORTS.) Sats (5.3) (Linjäritet av väntevärde): Om X och Y är s.v. med väntevärde E (X ) och E (Y ) och a, b, c är konstanter så gäller att E (ax + by + c) = ae (X ) + be (Y ) + c. Obs! Satsen är helt generellt dvs gäller vid godtyckliga beroende mellan X och Y. Sats (5.4): Om X och Y är oberoende s.v. så gäller att E (XY ) = E (X )E (Y ). Detta utvidgas till fller än två oberoende s.v. X 1,..., X n, se Sats 5.5 E (X 1 X 2... X n ) = E (X 1 )E (X 2 )... E (X n ).

BEROENDEMÅTT När man behandlar tvådimensionella s.v är det viktigt att veta hur de två variablerna påverkar varandra, man brukar tala om beroenden mellan variabler. Hur beroende två s.v. X och Y är kan kvantifieras på olika sätt. Vi inför två närbesläktade beroendemått som beskriver graden av linjärt beroende/samband. Betrakta en tvådimensionell s.v. (X, Y ) med ändliga väntevärden µ X och µ Y och stdavvikelser D(X ) = σ X och D(Y ) = σ Y.

BEROENDEMÅTT: KOVARIANS OCH KORRELATION Def: Kovariansen mellan X och Y, betecknad med C (X, Y ), definieras som C (X, Y ) = E ((X µ X )(Y µ Y )). Tolkning av C (X, Y ). Samband mellan X och Y s variation. Exempel på tavlan. Räkneregler för kovarianser: X, Y, Z är s.v., a, b, c, d konstanter. C (X, X ) = V (X ), C (X, Y ) = C (Y, X ), C (ax + b, cy + d) = acc (X, Y ), C (X + Y, Z ) = C (X, Z ) + C (Y, Z ). Allmänt: Kovariansen är bilinjär (dvs linjär i både argument). C ( i a i X i, j b j Y j ) = i a i b j C (X i, Y j ). j

BEROENDEMÅTT: KOVARIANS OCH KORRELATION Def: Korrelationskoefficienten ρ(x, Y ) definieras som ρ(x, Y ) = C (X, Y ) D(X )D(Y ) = C (X, Y ) σ X σ Y. Korrelationskoefficienten ρ(x, Y ) för en tvådimensionell s.v. är dimensionslös och satisfierar 1 ρ(x, Y ) 1.

BEROENDEMÅTT: KOVARIANS OCH KORRELATION (FORTS.) Stas (5.8), beräkning a kovarians: Följande samband gäller C (X, Y ) = E (XY ) E (X )E (Y ) = E (XY ) µ X µ Y. Sats: Om X och Y är oberoende så är de också okorrelerade. Bevis: E (XY ) = E (X )E (Y ) för ober. X, Y C (X, Y ) = 0. Omvändningen till satsen gäller inte! Okorrelerade s.v är inte nödvändigtvis oberoende. Exempel på tavlan. Kovariansen är viktig för att förstå variation i summor av s.v.

LINJÄRKOMBINATION Kovariansen är viktig för att förstå variation i summor av s.v. Sats 5.3 kan utvidgas till fler än två s.v. Låt oss se på linjärkombination a 1 X 1 + a 2 X 2 +... a n X n + b av n s.v. X 1,..., X n, a 1, a 2,..., a n, b är konstanterna. Sats (5.11): För alla X 1,..., X n gäller ( n ) n E a i X i + b = a i E (X i ) + b, i=1 i=1 ( n ) n V a i X i + b = ai 2 V (X i ) + 2 a j a k C (X j, X k ). i=1 i=1 1 j<k n Ex på tavla!

LINJÄRKOMBINATION (FORTS.) Följdsats (5.11.1): För oberoende X 1,..., X n gäller ( n ) n E a i X i + b = a i E (X i ) + b, i=1 i=1 ( n ) n V a i X i + b = ai 2 V (X i ). i=1 i=1 Följdsats (5.11.3): Om X 1,..., X n är oberoende s.v, var och en med väntevärdet µ och std σ, och n X = (X 1 +... X n )/n i=1 är deras aritmetiska medelvärde, så gäller att E ( X ) = µ, V ( X ) = σ 2 /n, D( X ) = σ/ n.

STORA TALENS LAG. Stora talens lag är ett av de viktigaste resultaten inom sannolikhetsteorin. Denna lag, först formulerad av den schweiziske matematikern Jacob Bernoulli (1654 1705), utsäger att aritmetiska medelvärdet av flera oberoende s.v. med samma väntevärde µ ligger nära µ, bara antalet är tillräckligt stort.

STORA TALENS LAG (FORTS.) FIGUR: Jacob Bernoulli grundlade sannolikhetsläran med den postumt utgivna Ars Conjectandi (Konsten att gissa (1713)) där de stora talens lag presenteras för första gången.

STORA TALENS LAG. Sats: Låt X 1, X 2,... vara en följd av oberoende (likafördelade) s.v., alla med samma väntevärde E (X i ) = µ och std D(X i ) = σ <. Låt X n = 1 n (X 1 +... X n ) vara medelvärdet av de n första variablerna. Då gäller, för godtyckligt ε > 0, att P ( X n µ > ε) 0 då n. Detta säger att s.v X n, bestående av medelvärdet av de n s.v. X 1,..., X n har en fördelning som koncentrerar sig runt µ = E (X i ).

STORA TALENS LAG (FORTS.) FIGUR: Fördelningen för medelvärdet X n = (X 1 +... X n )/n, där de enskilda observationerna är Po(1), för n = 1, 10, 100 och 1000. Den diskreta fördelningen koncentreras alltmer runt värdet 1, dvs väntevärdet.

STORA TALENS LAG (FORTS.) Tolkning: medelvärde är en bra uppskattning av väntevärde! Stora talens lag är en av grundstenarna inom empirisk vetenskap. Om man gör många oberoende observationer av någon s.v., t ex hållfastheten hos en metall, blodtrycket hos patienter behandlade med en ny medicin, eller livslängden hos personer i ett försäkringskollektiv. Då kommer medelvärdena av dessa observationer att ligga nära det sanna väntevärdet. Om vi inte vet det sanna väntevärdet kan vi gissa, eller skatta väntevärdet med medelvärdet. Detta förhållande är en viktig ingridiens i staistik delen av kursen.