F3: Slumpvariaber och fördelningar
Diskret Kontinuerlig Slumpvariabler Slumpvariabler = stokastiska variabler = random variables = s.v. Heter ofta X, Y, T. Diskreta kan anta ändligt eller uppräkneligt oändligt många värden, t.ex. mynt-/sedelvalörer, antal, N A (t), etc. Kontinuerliga kan anta oändligt många värden i ett intervall, t.ex. tiden mellan två jordbävningar, T, etc. Vi behöver ett antal sätt att beskriva variationen hos en s.v.
Diskret Kontinuerlig Diskret s.v.: Sannolikhetsfunktion Sannolikhetsfunktionen anger hur sannolikt varje enskilt värde är: p k = P(X = k), k =, 1, 2,... Ex: Jordbävningar (Poissonfördelning) N A (t) = antal jordbävningar i intervallet [, t] Po(l A t). p k = P(N A (t) = k) = e l At (l At) k, k =, 1, 2,... k!
Diskret Kontinuerlig Ex: Översvämningsår (Binomialfördelning) X = antal år det blir översvämning av n = 3 år. p = P(översvämning ett visst år) = 1/2, ober. X Bin(n, p) = Bin(3, 1/2) ( ) n p k = P(X = k) = p k (1 p) n k, k =, 1, 2,..., n k ( ) 3 p 1 = P(X = 1) = ( 1 1 2 )1 (1 1 2 )29 =.34.4 Sannolikhetsfunktion Bin(3,.5).3.2.1 5 1 15 2 25 3
Diskret Kontinuerlig Diskret s.v.: Fördelningsfunktion Fördelningsfunktionen (distribution function) anger hur sannolikt det är att få något som är högst lika med varje enskilt värde: F(x) = P(X x), < x < = k x p k Detta blir en stegfunktion. F(x) p k k x
Diskret Kontinuerlig Ex: X Bin(3, 1/2) Sannolikheten att vi får högst k år (av 3) med översvämning: F(2) = P(X 2) = p k = p + p 1 + p 2 =.81 k 2 F(2.5) = P(X 2.5) = p k = p + p 1 + p 2 =.81(!) k 2.5 1 Fördelningsfunktion Bin(3,.5).8.6.4.2 5 1 15 2 25 3
Diskret Kontinuerlig Kontinuerlig s.v.: Täthetsfunktion Täthetsfunktion = frekvensfunktion = probability-density function f(x) anger inte sannolikheten för ett enskilt värde eftersom P(X = x) = men den är proportionell mot slh att ligga i närheten av x: P(x 1 2 dx < X < x + 1 dx) f(x) dx 2.8 täthetsfunktion.6 dx f(x).4.2.5 1 1.5 2 2.5 3 3.5 4 x
Diskret Kontinuerlig Slh med hjälp av täthetsfunktion P(a < X < b) = P(a X b) = b a f(t) dt.8 arean = P(1 < X < 1.5).6 f(x).4.2.5 1 1.5 2 2.5 3 3.5 4 x
Diskret Kontinuerlig Kont. s.v.: Fördelningsfunktion Fördelningsfunktionen för en kontinuerlig s.v. definieras på samma sätt som för en diskret s.v. men beräknas m.h.a. en integral: F(x) = P(X x) = x f(t) dt.8 arean = P(X 1).6 f(x).4.2.5 1 1.5 2 2.5 3 3.5 4 x 1 F(1) = P(X 1).8 F(x).6.4.2.5 1 1.5 2 2.5 3 3.5 4 x
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Vanliga fördelningar i risk-analys Binomialfördelning Beteckning: X Bin(n, p) Exempel: antalet översvämningsår under ett decennium antal gånger ett gränsvärde överskrids under en mätserie.7 Bin(1,.1).7 Bin(1,.8).6.6.5.5.4.4.3.3.2.2.1.1 1 2 3 4 5 6 7 8 9 1 1 2 3 4 5 6 7 8 9 1 Publicerad postumt 1713 av Jacob (James/Jacques) Bernoulli (1655 175), schweizisk matematiker.
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Normalfördelning Beteckning: X N(m, s 2 ) Exempel: mätfel hos ett instrument som gränsfördelning för summan av slumpvariabler.4.3 Normalfördelningar N(, 1 2 ) N(, 2 2 ) N(2, 1.5 2 ).2.1 6 4 2 2 4 6 8 Introducerad 1738 av Abraham de Moivre (1667 1754), fransk matematiker. Vidareutvecklad 189 av Carl Friedrich Gauss (1777 1855), tysk matematiker.
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Lognormalfördelning Beteckning: ln(x) N(m, s 2 ) Exempel: koncentration av svaveldioxid i luften vid en mätpunkt koncentration av fosfor i ett vattendrag årsnederbörd av snö 1.4 1.2 1.8 Lognormalfördelningar logn(, 1 2 ) logn(, 2 2 ) logn(1, 1 2 ).6.4.2.5 1 1.5 2 2.5 3 3.5 4 Mitten av 18-talet?
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Poissonfördelning Beteckning: X Po(m) Exempel: antalet partiklar som sönderfaller från ett radioaktivt ämne under en minut antalet jordskalv i Kalifornien under de senaste decennierna.3.25.2.15.1.5 Po(2) Po(1).3.25.2.15.1.5 5 1 15 2 5 1 15 2 Introducerad 1837 av Siméon Denis Poisson (1781 184), fransk matematiker och fysiker.
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Exponentialfördelning Beteckning: X Exp(m) Exempel: tidpunkten mellan två händelser i en Poissonprocess livslängden hos en elektrisk komponent en jordbävnings Richter-magnitud 2 1.5 Exponentialfördelningar Exp(.5) Exp(1) Exp(3) 1.5.5 1 1.5 2 2.5 3 3.5 4 4.5 5 Nämnd 1931 som ett specialfall av Gammafördelningen som introducerades 1895 av Karl Pearson (1857 1936), engelsk matematiker.
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Rektangelfördelning (Likformig fördelning) Beteckning: X R(a, b) Exempel: felet vid avrundning av tal 2 1.5 R(, 1) R( 1, 2) R(3, 3.6) Rektangelfördelningar 1.5 2 1 1 2 3 4 Döptes 1937 som ett specialfall av Beta-fördelningen som beskrevs av Karl Pearson innan 1911.
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Weibullfördelning Exempel: styrkan hos ett material spricktillväxt i aluminiummaterial modellering av utmattningsfenomen 1.4 1.2 1 Weibullfördelningar Weib(2, 1) = Exp(2) Weib(1, 2) = Rayleigh(1) Weib(1,.8).8.6.4.2.5 1 1.5 2 2.5 3 3.5 4 4.5 5 Introducerad 1939 av Waloddi Weibull (1887 1979) professor i Maskinelement på KTH. Rayleigh-fördelningen uppfanns 188 av John William Strutt, 3rd Baron Rayleigh (1842 1919), engelsk fysiker och Nobelpristagare (194 för upptäckten av Argon.)
Bin Normal Lognorm Poisson Exp Rekt Weib Gumb Gumbelfördelning Exempel: maximala lasten på ett system/konstruktion.4.3 Gumbelfördelningar Gumb(1, 1) Gumb(2, 2) Gumb(3, 4).2.1 8 6 4 2 2 4 6 8 1 12 Uppkallad efter Emil J. Gumbel (1891 1966) professor i Matematisk statistik i Heidelberg.
Väntevärde Median Varians Standardavvikelse Räkneregler Lägesmått för en s.v. Väntevärde Väntevärdet E(X) = m = tyngdpunkten: x p x, E(X) = k x f(x) dx Ex: Exponential T = antal år mellan successiva jordbävningar Exp(2): E(T) = x f(x) dx = = [ x e x/2] + x 1 2 e x/2 dx e x/2 dx = [ 2e x/2] = 2 år
Väntevärde Median Varians Standardavvikelse Räkneregler Median Medianen x.5 = mittersta värdet: P(X > x.5 ) =.5. Ex: Exponential T Exp(2): 1.5 = f(t) dt = x.5 x.5 2 e t/2 dt = [ e t/2] = e x.5/2 x.5 x.5 = 2 ln.5 = 2 ln 2 1.386 år Kvantil Mer generellt a-kvantilen x a uppfyller P(X > x a ) = a. Finns tabellerad för vissa fördelningar, t.ex. x.25 = l.25 = 1.96 för X N(, 1 2 ).
Väntevärde Median Varians Standardavvikelse Räkneregler Spridningsmått för en s.v. Varians Variansen V(X) = s 2 = tröghetsmomentet: ( (x m) 2 p k, V(X) = E (X m) 2) = k (x m) 2 f(x) dx = E(X 2 ) m 2 Ex: Exponential T Exp(2): V(T) = E(T 2 ) m 2 = x 2 1 2 e x/2 dx m 2 =... = 8 2 2 = 4 år 2
Väntevärde Median Varians Standardavvikelse Räkneregler Standardavvikelse Standardavvikelsen D(X) = s = V(X) Ex: Exponential T Exp(2): D(T) = V(T) = 4 = 2 år. Variationskoefficient Variationskoefficienten R(X) = D(X)/E(X) anger hur stor spridningen är i förhållanden till värdenas storlek. Saknar enhet och anges ofta i procent. Används bara för positiva s.v. Ex: Exponential T Exp(2): R(T) = D(T)/E(T) = 2/2 = 1 = 1 %.
Väntevärde Median Varians Standardavvikelse Räkneregler Räkneregler för väntevärden och varianser E(aX + b) = ae(x) + b V(aX + b) = a 2 V(X) E(X + Y) = E(X) + E(Y) V(X + Y) = V(X) + V(Y) om X och Y är oberoende Dessa regler gäller för ALLA slumpvariabler oavsett fördelning! Om X och Y är normalfördelade gäller dessutom att fördelningen för summan också är normalfördelad.
Väntevärde Median Varians Standardavvikelse Räkneregler Ex: Medelvärden Om vi har n ober. s.v. X 1,..., X n med E(X i ) = m och V(X i ) = s 2 så gäller att E( X) = E( 1 n (X 1 +... + X n )) = 1 n (E(X 1) +... + E(X n )) = 1 n nm = m V( X) = V( 1 n (X 1 +... + X n )) = 1 n 2 (V(X 1) +... + V(X n )) = 1 n 2 ns2 = s2 n D( X) = V( X) = s n Om X i N(m, s 2 ) så gäller dessutom att X N(m, s2 n ).