SF1901 Sannolikhetsteori och statistik I

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH MER ON VÄNTEVÄRDE OCH VARIANS. KOVARIANS OCH KORRELATION. STORA TALENS LAG. STATISTIK.

SF1901: Sannolikhetslära och statistik. Flera stokastiska variabler.

SF1901: Sannolikhetslära och statistik

Föreläsning 6, Matematisk statistik Π + E

Matematisk statistik 9 hp Föreläsning 6: Linjärkombinationer

SF1901: Sannolikhetslära och statistik

Föreläsning 5, Matematisk statistik 7.5hp för E Linjärkombinationer

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 5, FMSF45 Summor och väntevärden

Matematisk statistik för D, I, Π och Fysiker

SF1901: Sannolikhetslära och statistik

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik 9hp Föreläsning 5: Summor och väntevärden

Föreläsning 5, Matematisk statistik Π + E

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 6, FMSF45 Linjärkombinationer

Föreläsning 7: Punktskattningar

Stokastiska vektorer

Väntevärde och varians

SF1901: SANNOLIKHETSTEORI OCH FLERDIMENSIONELLA STOKASTISKA STATISTIK VARIABLER. Tatjana Pavlenko. 8 september 2017

Kap 2. Sannolikhetsteorins grunder

Föreläsning 7: Punktskattningar

SF1901 Sannolikhetsteori och statistik I

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 6 Väntevärden Korrelation och kovarians Stora talens lag. Jörgen Säve-Söderbergh

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1911: Statistik för bioteknik

Stokastiska vektorer och multivariat normalfördelning

2 x dx = [ x ] 1 = 1 ( 1 (1 0.9) ) 100 = /

Summor av slumpvariabler

Föreläsning 7: Punktskattningar

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Stokastiska signaler. Mediesignaler

Övning 1 Sannolikhetsteorins grunder

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Föreläsning 7: Stokastiska vektorer

FINGERÖVNINGAR I SANNOLIKHETSTEORI MATEMATISK STATISTIK AK FÖR I. Oktober Matematikcentrum Matematisk statistik

(x) = F X. och kvantiler

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

TAMS79: Föreläsning 4 Flerdimensionella stokastiska variabler

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Matematisk statistik för B, K, N, BME och Kemister

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

SF1901: Sannolikhetslära och statistik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

SF1901 Sannolikhetsteori och statistik I

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

FACIT: Tentamen L9MA30, LGMA30

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

SF1901 Sannolikhetsteori och statistik I

SF1901: Sannolikhetslära och statistik

TAMS79: Föreläsning 6. Normalfördelning

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Kurssammanfattning MVE055

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1901: Sannolikhetslära och statistik

Statistiska metoder för säkerhetsanalys

LINKÖPINGS UNIVERSITET EXAM TAMS 79 / TEN 1

Sannolikhet och statistik XI

F7 forts. Kap 6. Statistikens grunder, 15p dagtid. Stokastiska variabler. Stokastiska variabler. Lite repetition + lite utveckling av HT 2012.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Bengt Ringnér. September 20, Detta är föreläsningsmanus på lantmätarprogrammet LTH vecka 5 HT07.

Matematisk statistik 9 hp Föreläsning 4: Flerdim

Grundläggande matematisk statistik

TMS136. Föreläsning 4

Bengt Ringnér. October 30, 2006

Grundläggande matematisk statistik

Kovarians och kriging

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Formel- och tabellsamling i matematisk statistik

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Matematisk statistik för D, I, Π och Fysiker

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

TENTAMEN I STATISTIKENS GRUNDER 1

FACIT: Tentamen L9MA30, LGMA30

Kapitel 5 Multivariata sannolikhetsfördelningar

Transformer i sannolikhetsteori

2.1 Mikromodul: stokastiska processer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

TMS136. Föreläsning 5

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Oberoende stokastiska variabler

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Lektionsanteckningar 11-12: Normalfördelningen

Sannolikheter och kombinatorik

Föreläsning 12: Repetition

4 Diskret stokastisk variabel

Demonstration av laboration 2, SF1901

Föreläsning 15: Försöksplanering och repetition

Introduktion till statistik för statsvetare

Matematisk statistik TMS064/TMS063 Tentamen

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Transkript:

SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29

Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 2 / 29

Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 3 / 29

Varians och standardavvikelse för stokastiska variabler Variansen för en stokastisk variabel X definieras som V(X ) = E[(X µ X ) 2 ], där µ X = E(X ), dvs. (k µ X ) 2 p X (k) om X är diskret, V(X ) = k (x µ X ) 2 f X (x) dx om X är kontinuerlig. Variansen mäter hur mycket X avviker från E(X ) i medeltal och ger sålunda ett mått på fördelningens spridning. Ibland betecknas variansen även som σ 2 X. Man visar enkelt att V(X ) = E(X 2 ) E(X ) 2. Exempel! 4 / 29

Flerdimensionella s.v. En n-dimensionell s.v. (X 1,... X n ) är en R n -värd funktion definierad på ett utfallsrum Ω. Den simultana fördelningsfunktionen definieras i detta fall som F X1,...,X n (x 1,..., x n ) = P(X 1 x 1,..., X n x n ), (x 1,..., x n ) R n. 5 / 29

Flerdimensionella sannolikhets- och täthetsfunktioner Funktionen p X,Y (j, k) = P(X = j, Y = k), j, k {0, 1, 2,...} kallas sannolikhetsfunktionen för den diskreta tvådimensionella s.v. (X, Y ). Om det finns en icke-negativ funktion f X,Y (x, y) sådan att P((X, Y ) A) = A f X,Y (x, y) dx dy för alla A sägs den tvådimensionella s.v. (X, Y ) vara kontinuerlig. Funktionen f X,Y (x, y) kallas täthetsfunktionen för (X, Y ). Motsvarande definitioner gäller i det flerdimensionella fallet. 6 / 29

Oberoende s.v. Definition De s.v. X och Y kallas oberoende om för alla mängder A och B. Det visade sig att P(X A, Y B) = P(X A)P(Y B) X och Y oberoende F X,Y (x, y) = F X (x)f Y (y) { p X,Y (j, k) = p X (j)p Y (k) för alla j, k (disk. fallet), f X,Y (x, y) = f X (x)f Y (y) för alla x, y (kont. fallet). 7 / 29

Fördelning av maximum och minimum Det visade sig tämligen enkelt att bestämma fördelningsfunktionerna för Z + = max{x 1, X 2,..., X n } och Z = min{x 1, X 2,..., X n } då X i :na var oberoende och likafördelade med täthets- och fördelningsfunktion f resp. F Dessa gavs av resp. F Z+ (z) = (F (z)) n f Z+ (z) = n(f (z)) n 1 f (z), F Z (z) = 1 (1 F (z)) n f Z (z) = n(1 F (z)) n 1 f (z). 8 / 29

Exempel: en kedja är inte starkare än sin svagaste länk Påfrestningen (enhet kn) som en länk tål är en stokastisk variabel som är Rayleighfördelad med täthetsfunktionen f X (x) = 1 4 xe x2 /8, x > 0. Vad är sannolikheten att en kedja som består av 4 länkar brister om den utsätts för belastningen 0.5 kn? svar: 1 e 1/8 0.12 9 / 29

Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 10 / 29

Varians för affin transformation av en s.v. Exempel! Med hjälp av definitionen av varians visar man enkelt följande. Sats För alla s.v. X och konstanter a och b gäller att E(aX + b) = ae(x ) + b, V(aX + b) = a 2 V(X ), D(aX + b) = a D(X ). OBS! Konstanten b bidrar inte till variansen. 11 / 29

Väntevärde för en funktion av flerdimensionell s.v. Låt (X, Y ) vara en tvådimensionell s.v. och g : R 2 R en reellvärd funktion. Sätt Z = g(x, Y ). Då gäller följande. Sats g(j, k) p X,Y (j, k) E(Z) = j,k g(x, y) f X,Y (x, y) dx dy R 2 om (X, Y ) är diskret, om (X, Y ) är kontinuerlig. Motsvarande gäller i det flerdimensionella fallet. Som vi ska se i det följande kan ovan sats användas för att erhålla ett generellt resultat för det viktiga fallet då X och Y är oberoende och g(x, Y ) = XY. 12 / 29

Väntevärde för produkt av oberoende s.v. Sats Om X och Y är oberoende gäller att E(XY ) = E(X )E(Y ). OBS! Resultatet gäller i allmänhet inte om X och Y beroende. Ovan resultat kan generaliseras till fler än två s.v. Sats Om X 1, X 2,..., X n är oberoende gäller att E(X 1 X 2 X n ) = E(X 1 )E(X 2 ) E(X n ). 13 / 29

Väntevärde för linjärkombination av s.v. Låt X 1,..., X n vara s.v. och betrakta en linjärkombination a 1 X 1 + a 2 X 2 +... + a n X n + b = n a i X i + b, i=1 där konstanterna a 1,..., a n och b kan vara positiva eller negativa tal. Följande sats visas på samma sätt som den föregående och gäller även om X i :na är beroende. Sats För alla s.v. X 1,..., X n och konstanter a 1,..., a n, b gäller att ( n ) n E a i X i + b = a i E(X i ) + b. i=1 i=1 14 / 29

Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 15 / 29

Exempel: täthetsfunktion för oberoende/beroende s.v. f X, Y 0.4 0.3 0.2 0.1 f X, Y 0.4 0.3 0.2 0.1 0 3 2 1 0 y 1 2 3 3 2 1 x 0 1 2 3 0 3 2 1 0 y 1 2 3 3 2 1 x 0 1 2 3 (a) Oberoende variabler (b) Beroende variabler 16 / 29

Beroendemått Ett beroendemått sammanfattar, i ett enda tal, hur två s.v. X och Y samvarierar. Vi kommer att diskutera två vanliga och närbesläktade beroendemått, nämligen kovarians och korrelation. 17 / 29

Kovarians Kovariansen mellan två s.v. X och Y definieras som C(X, Y ) = E[(X µ X )(Y µ Y )]. Notera att C(X, X ) = E[(X µ X ) 2 ] = V(X ). Vidare ger symmetri att C(X, Y ) = C(Y, X ). Om någon av variablerna är konstant blir C(X, Y ) = 0. Intuition: kovariansen bör bli positiv om det finns en tendens att (X µ X )(Y µ Y ) är positiv, dvs. att variablerna avviker åt samma håll från sina respektive väntevärden, negativ om det finns en tendens att (X µx )(Y µ Y ) är negativ, dvs. att variablerna avviker åt olika håll från sina respektive väntevärden. 18 / 29

Kovarians (forts.) Följande sats är ofta användbar vid beräkningar. Sats Speciellt gäller följande. C(X, Y ) = E(XY ) E(X )E(Y ). Sats X och Y är oberoende C(X, Y ) = 0 OBS! Omvändningen är inte sann i allmänhet! Exempel? 19 / 29

Korrelation Korrelationskoefficienten för X och Y definieras som ρ(x, Y ) = C(X, Y ) D(X )D(Y ). Notera att korrelationskoefficienten är dimensionslös. Man kan visa att C(X, Y ) D(X )D(Y ), vilket medför att 1 ρ(x, Y ) 1. Man kan även visa att ρ(x, Y ) = 1 om och endast om X och Y är linjärt beroende, dvs. Y = ax + b för konstanter a och b; mer specifikt gäller då att a > 0 ρ(x, Y ) = 1 och a < 0 ρ(x, Y ) = 1. 20 / 29

Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 21 / 29

Varians för summor Vi såg tidigare att E(X + Y ) = E(X ) + E(Y ) för alla (även beroende) s.v. X och Y. I motsvarande uttryck för variansen tillkommer dock en term som motsvaras av kovariansen: Sats För alla s.v. X och Y gäller att V(X + Y ) = V(X ) + V(Y ) + 2C(X, Y ). I specialfallet då X och Y är oberoende, vilket implicerar att C(X, Y ) = 0, blir således V(X + Y ) = V(X ) + V(Y ). 22 / 29

Varians för linjärkombination Följande sats utvidgar ovan resultat för kovarians för summa av två s.v. till en godtycklig linjärkombination. Sats För alla s.v. X 1,..., X n och konstanter a 1,..., a n, b gäller att ( n ) n V a i X i + b = ai 2 V(X i ) + 2 a j a k C(X j, X k ). i=1 i=1 1 j<k n I specialfallet då alla X i :na är oberoende blir alla kovarianser noll, och man erhåller ( n ) n V a i X i + b = ai 2 V(X i ). i=1 i=1 OBS! Konstanten b bidrar ej till variansen. 23 / 29

Väntevärde och varians för medelvärde Vi låter nu X 1,..., X n vara oberoende s.v. med gemensamt väntevärde µ och standardavvikelse σ. Beteckna medelvärdet med X = 1 n X i. n i=1 Med hjälp av ovan satser erhålls ( n ) E( X ) = 1 n E X i = 1 n i=1 och, då X i :na är oberoende, ( ) ( 1 2 n ) V( X ) = V X i = n i=1 n E(X i ) = 1 }{{} n nµ = µ =µ i=1 ( ) 1 2 n n i=1 V(X i ) = }{{} =σ 2 1 n σ2. 24 / 29

Väntevärde och varians för medelvärde (forts.) Som förväntat gäller att E( X ) = µ. Märkvärdigare är att variansen är omvänt proportionell mot n enligt V( X ) = 1 n σ2 D( X ) = 1 σ. n Det förefaller alltså som om fördelningen för X blir mer och mer koncentrerad kring dess väntevärde µ när n ökar. Detta beskrivs närmare av stora talens lag. 25 / 29

Stora talens lag Sats Låt X 1, X 2,..., X n vara oberoende och likafördelade s.v. med gemensamt väntevärde µ och låt X = 1 n n X i. i=1 Då gäller, för varje ε > 0, P ( X µ ε ) 0 då n. Exempel med tärningskast! 26 / 29

Upprepade tärningskast 3.8 Medelvaerde 3.6 3.4 3.2 Frekvens 3 2.8 2.6 2.4 2.2 2 0 100 200 300 400 500 600 Antal kast Figur: Medelvärde X av upprepade tärningskast. Rödstreckad linje indikerar väntevärdet µ = E(X ) = 3.5. 27 / 29

Stora talens lag Stora talens lag är ett fundamentalt resultat i matematisk statistik. Tolkning: medelvärdet är en bra uppskattning av väntevärdet när n är stort! Om vi inte känner väntevärdet kan vi alltså gissa, eller skatta, väntevärdet med hjälp av medelvärdet. Detta kommer att vara av stor vikt när man skall kalibrera en slumpmodell med hjälp av observerad data. Stora talens lag är därför en grundsten i empiriska vetenskaper. Detta kommer vi att diskutera vidare i inferensdelen av kursen. 28 / 29

Nästa föreläsning Normalfördelningen, mer om linjärkombinationer av oberoende normalfördelade s.v., centrala gränsvärdessatsen. 29 / 29