SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29
Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 2 / 29
Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 3 / 29
Varians och standardavvikelse för stokastiska variabler Variansen för en stokastisk variabel X definieras som V(X ) = E[(X µ X ) 2 ], där µ X = E(X ), dvs. (k µ X ) 2 p X (k) om X är diskret, V(X ) = k (x µ X ) 2 f X (x) dx om X är kontinuerlig. Variansen mäter hur mycket X avviker från E(X ) i medeltal och ger sålunda ett mått på fördelningens spridning. Ibland betecknas variansen även som σ 2 X. Man visar enkelt att V(X ) = E(X 2 ) E(X ) 2. Exempel! 4 / 29
Flerdimensionella s.v. En n-dimensionell s.v. (X 1,... X n ) är en R n -värd funktion definierad på ett utfallsrum Ω. Den simultana fördelningsfunktionen definieras i detta fall som F X1,...,X n (x 1,..., x n ) = P(X 1 x 1,..., X n x n ), (x 1,..., x n ) R n. 5 / 29
Flerdimensionella sannolikhets- och täthetsfunktioner Funktionen p X,Y (j, k) = P(X = j, Y = k), j, k {0, 1, 2,...} kallas sannolikhetsfunktionen för den diskreta tvådimensionella s.v. (X, Y ). Om det finns en icke-negativ funktion f X,Y (x, y) sådan att P((X, Y ) A) = A f X,Y (x, y) dx dy för alla A sägs den tvådimensionella s.v. (X, Y ) vara kontinuerlig. Funktionen f X,Y (x, y) kallas täthetsfunktionen för (X, Y ). Motsvarande definitioner gäller i det flerdimensionella fallet. 6 / 29
Oberoende s.v. Definition De s.v. X och Y kallas oberoende om för alla mängder A och B. Det visade sig att P(X A, Y B) = P(X A)P(Y B) X och Y oberoende F X,Y (x, y) = F X (x)f Y (y) { p X,Y (j, k) = p X (j)p Y (k) för alla j, k (disk. fallet), f X,Y (x, y) = f X (x)f Y (y) för alla x, y (kont. fallet). 7 / 29
Fördelning av maximum och minimum Det visade sig tämligen enkelt att bestämma fördelningsfunktionerna för Z + = max{x 1, X 2,..., X n } och Z = min{x 1, X 2,..., X n } då X i :na var oberoende och likafördelade med täthets- och fördelningsfunktion f resp. F Dessa gavs av resp. F Z+ (z) = (F (z)) n f Z+ (z) = n(f (z)) n 1 f (z), F Z (z) = 1 (1 F (z)) n f Z (z) = n(1 F (z)) n 1 f (z). 8 / 29
Exempel: en kedja är inte starkare än sin svagaste länk Påfrestningen (enhet kn) som en länk tål är en stokastisk variabel som är Rayleighfördelad med täthetsfunktionen f X (x) = 1 4 xe x2 /8, x > 0. Vad är sannolikheten att en kedja som består av 4 länkar brister om den utsätts för belastningen 0.5 kn? svar: 1 e 1/8 0.12 9 / 29
Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 10 / 29
Varians för affin transformation av en s.v. Exempel! Med hjälp av definitionen av varians visar man enkelt följande. Sats För alla s.v. X och konstanter a och b gäller att E(aX + b) = ae(x ) + b, V(aX + b) = a 2 V(X ), D(aX + b) = a D(X ). OBS! Konstanten b bidrar inte till variansen. 11 / 29
Väntevärde för en funktion av flerdimensionell s.v. Låt (X, Y ) vara en tvådimensionell s.v. och g : R 2 R en reellvärd funktion. Sätt Z = g(x, Y ). Då gäller följande. Sats g(j, k) p X,Y (j, k) E(Z) = j,k g(x, y) f X,Y (x, y) dx dy R 2 om (X, Y ) är diskret, om (X, Y ) är kontinuerlig. Motsvarande gäller i det flerdimensionella fallet. Som vi ska se i det följande kan ovan sats användas för att erhålla ett generellt resultat för det viktiga fallet då X och Y är oberoende och g(x, Y ) = XY. 12 / 29
Väntevärde för produkt av oberoende s.v. Sats Om X och Y är oberoende gäller att E(XY ) = E(X )E(Y ). OBS! Resultatet gäller i allmänhet inte om X och Y beroende. Ovan resultat kan generaliseras till fler än två s.v. Sats Om X 1, X 2,..., X n är oberoende gäller att E(X 1 X 2 X n ) = E(X 1 )E(X 2 ) E(X n ). 13 / 29
Väntevärde för linjärkombination av s.v. Låt X 1,..., X n vara s.v. och betrakta en linjärkombination a 1 X 1 + a 2 X 2 +... + a n X n + b = n a i X i + b, i=1 där konstanterna a 1,..., a n och b kan vara positiva eller negativa tal. Följande sats visas på samma sätt som den föregående och gäller även om X i :na är beroende. Sats För alla s.v. X 1,..., X n och konstanter a 1,..., a n, b gäller att ( n ) n E a i X i + b = a i E(X i ) + b. i=1 i=1 14 / 29
Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 15 / 29
Exempel: täthetsfunktion för oberoende/beroende s.v. f X, Y 0.4 0.3 0.2 0.1 f X, Y 0.4 0.3 0.2 0.1 0 3 2 1 0 y 1 2 3 3 2 1 x 0 1 2 3 0 3 2 1 0 y 1 2 3 3 2 1 x 0 1 2 3 (a) Oberoende variabler (b) Beroende variabler 16 / 29
Beroendemått Ett beroendemått sammanfattar, i ett enda tal, hur två s.v. X och Y samvarierar. Vi kommer att diskutera två vanliga och närbesläktade beroendemått, nämligen kovarians och korrelation. 17 / 29
Kovarians Kovariansen mellan två s.v. X och Y definieras som C(X, Y ) = E[(X µ X )(Y µ Y )]. Notera att C(X, X ) = E[(X µ X ) 2 ] = V(X ). Vidare ger symmetri att C(X, Y ) = C(Y, X ). Om någon av variablerna är konstant blir C(X, Y ) = 0. Intuition: kovariansen bör bli positiv om det finns en tendens att (X µ X )(Y µ Y ) är positiv, dvs. att variablerna avviker åt samma håll från sina respektive väntevärden, negativ om det finns en tendens att (X µx )(Y µ Y ) är negativ, dvs. att variablerna avviker åt olika håll från sina respektive väntevärden. 18 / 29
Kovarians (forts.) Följande sats är ofta användbar vid beräkningar. Sats Speciellt gäller följande. C(X, Y ) = E(XY ) E(X )E(Y ). Sats X och Y är oberoende C(X, Y ) = 0 OBS! Omvändningen är inte sann i allmänhet! Exempel? 19 / 29
Korrelation Korrelationskoefficienten för X och Y definieras som ρ(x, Y ) = C(X, Y ) D(X )D(Y ). Notera att korrelationskoefficienten är dimensionslös. Man kan visa att C(X, Y ) D(X )D(Y ), vilket medför att 1 ρ(x, Y ) 1. Man kan även visa att ρ(x, Y ) = 1 om och endast om X och Y är linjärt beroende, dvs. Y = ax + b för konstanter a och b; mer specifikt gäller då att a > 0 ρ(x, Y ) = 1 och a < 0 ρ(x, Y ) = 1. 20 / 29
Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer och stora talens lag (Kap. 5.5 5.6) 21 / 29
Varians för summor Vi såg tidigare att E(X + Y ) = E(X ) + E(Y ) för alla (även beroende) s.v. X och Y. I motsvarande uttryck för variansen tillkommer dock en term som motsvaras av kovariansen: Sats För alla s.v. X och Y gäller att V(X + Y ) = V(X ) + V(Y ) + 2C(X, Y ). I specialfallet då X och Y är oberoende, vilket implicerar att C(X, Y ) = 0, blir således V(X + Y ) = V(X ) + V(Y ). 22 / 29
Varians för linjärkombination Följande sats utvidgar ovan resultat för kovarians för summa av två s.v. till en godtycklig linjärkombination. Sats För alla s.v. X 1,..., X n och konstanter a 1,..., a n, b gäller att ( n ) n V a i X i + b = ai 2 V(X i ) + 2 a j a k C(X j, X k ). i=1 i=1 1 j<k n I specialfallet då alla X i :na är oberoende blir alla kovarianser noll, och man erhåller ( n ) n V a i X i + b = ai 2 V(X i ). i=1 i=1 OBS! Konstanten b bidrar ej till variansen. 23 / 29
Väntevärde och varians för medelvärde Vi låter nu X 1,..., X n vara oberoende s.v. med gemensamt väntevärde µ och standardavvikelse σ. Beteckna medelvärdet med X = 1 n X i. n i=1 Med hjälp av ovan satser erhålls ( n ) E( X ) = 1 n E X i = 1 n i=1 och, då X i :na är oberoende, ( ) ( 1 2 n ) V( X ) = V X i = n i=1 n E(X i ) = 1 }{{} n nµ = µ =µ i=1 ( ) 1 2 n n i=1 V(X i ) = }{{} =σ 2 1 n σ2. 24 / 29
Väntevärde och varians för medelvärde (forts.) Som förväntat gäller att E( X ) = µ. Märkvärdigare är att variansen är omvänt proportionell mot n enligt V( X ) = 1 n σ2 D( X ) = 1 σ. n Det förefaller alltså som om fördelningen för X blir mer och mer koncentrerad kring dess väntevärde µ när n ökar. Detta beskrivs närmare av stora talens lag. 25 / 29
Stora talens lag Sats Låt X 1, X 2,..., X n vara oberoende och likafördelade s.v. med gemensamt väntevärde µ och låt X = 1 n n X i. i=1 Då gäller, för varje ε > 0, P ( X µ ε ) 0 då n. Exempel med tärningskast! 26 / 29
Upprepade tärningskast 3.8 Medelvaerde 3.6 3.4 3.2 Frekvens 3 2.8 2.6 2.4 2.2 2 0 100 200 300 400 500 600 Antal kast Figur: Medelvärde X av upprepade tärningskast. Rödstreckad linje indikerar väntevärdet µ = E(X ) = 3.5. 27 / 29
Stora talens lag Stora talens lag är ett fundamentalt resultat i matematisk statistik. Tolkning: medelvärdet är en bra uppskattning av väntevärdet när n är stort! Om vi inte känner väntevärdet kan vi alltså gissa, eller skatta, väntevärdet med hjälp av medelvärdet. Detta kommer att vara av stor vikt när man skall kalibrera en slumpmodell med hjälp av observerad data. Stora talens lag är därför en grundsten i empiriska vetenskaper. Detta kommer vi att diskutera vidare i inferensdelen av kursen. 28 / 29
Nästa föreläsning Normalfördelningen, mer om linjärkombinationer av oberoende normalfördelade s.v., centrala gränsvärdessatsen. 29 / 29