1/22 Summor av slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 8/2 2013
2/22 Dagens föreläsning Väntevärde och varians Vanliga kontinuerliga fördelningar Parkeringsplatsproblemet Räkneregler för väntevärden Räkneregler för varianser Fördelningen för summor av slumpvariabler
Kontinuerliga slumpvariabler Alla icke-negativa funktioner f (x) som är sådana att f (x)dx = 1 är täthetsfunktioner. Exempel: vi hittade en funktion f (x) som beskrev fördelningen för ett kompositmaterials hållfasthet och kunde använda den för att räkna ut sannolikheter. Exempel: en buss går var 10:e minut. Man går till busshållsplatsen på måfå. Om X är tiden man får vänta så är f (x) = 1/10 för 0 x < 10. X sägs vara likformigt fördelad eller rektangelfördelad på intervallet 0 till 10. För kontinuerliga slumpvariabler är man ofta intresserad av fördelningsfunktionen F (x) = P(X x) = x f (x)dx. Observera att det för alla slumpvariabler X gäller att P(a < X b) = F (b) F (a). 3/22
4/22 Väntevärde och varians För en diskret slumpvariabel X är väntevärdet E[X ] = k k p(k) och variansen V[X ] = k (k µ)2 p(k). För en kontinuerlig slumpvariabel X med täthetsfunktion f (x) är: Väntevärdet: E[X ] = x x f (x)dx. Även här betecknas väntevärdet µ och tolkas som det genomsnittliga eller förväntade värdet på X. Variansen: V[X ] = x (x µ)2 f (x)dx. Som tidigare betecknas variansen ofta σ 2 och tolkas som ett mått på spridningen/osäkerheten/variationen för X. Som tidigare gäller att E[g(X )] = x g(x)f (x)dx och att V[X ] = E[X 2 ] (E[X ]) 2. Se bussexempel på tavlan!
5/22 Likformig fördelning (rektangelfördelning) Om slumpvariabeln X antar alla värden i ett interval (a, b) med samma sannolikhet så sägs X vara likformigt fördelad på intervallet. Exempel: hur länge man får vänta på bussen. Kodbeteckning: X Re(a, b). Täthetsfunktionen är en rektangel: Se bild på tavlan! För likformig fördelning gäller att E[X ] = (a + b)/2 V [X ] = (b a) 2 /12 Se bussexempel på tavlan! f (x) = 1 b a, a x b.
Tid mellan händelser Hur lång tid går det mellan det att man tänder en glödlampa och att den går sönder? (Hur lång är livslängden?) Hur lång tid går det mellan att två samtal ankommer till en telefon? Hur lång tid går det mellan två jordskalv? Hur lång tid går det mellan två driftstopp i en fabrik? Hur lång tid går det mellan två mål i en fotbollsmatch? 6/22
7/22 Exponentialfördelningen Vi såg tidigare hur Weibullfördelningen kan användas för att modellera hållfasthet. Den används också för exempelvis vindhastigheter och livslängder. Det viktigaste (och matematiskt enklaste) specialfallet av Weibullfördelningen är exponentialfördelningen, som ofta används för att modellera tider mellan händelser som inträffar med en konstant intensitet. Slumpvariabeln X är exponentialfördelad med parameter a, betecknat X Exp(a) om dess täthetsfunktion är f (x) = 1 a e x/a, för x 0. För exponentialfördelningen gäller att E[X ] = a V [X ] = a 2
0.0 0.2 0.4 0.6 0.8 1.0 Exponentialfördelningens täthetsfunktion Exp(1/2) Exp(1) Exp(2) Exp(5) 0 1 2 3 4 5 x 8/22
Exponentialfördelningen och jordbävningar Seismologer anser att tiden mellan japanska jordbävningar kan anses vara exponentialfördelad. Låt X vara tiden i år till nästa skalv med en magnitud på minst 7,0 på Richterskalan. Antag att X Exp(4/3). Vad är P(X > 1)? Se tavlan! 9/22
Hur många parkeringsplatser? Ett företag ska bygga 100 nya lägenheter. Utifrån erfarenhet från liknande områden vet man att sannolikheten är 25 % att ett hushåll inte har någon bil, 50 % att ett hushåll har en bil och 25 % att ett hushåll har två bilar. Hur många bilar kan man förvänta sig att hushållen har tillsammans? Hur många parkeringsplatser ska man bygga vid bostäderna för att sannolikheten att alla hushålls bilar får plats ska vara 95 %? Antag att man av utrymmesskäl inte får plats med fler än 75 parkeringsplatser. Hur stor är då sannolikheten att hushållens bilar får plats? Se tavlan! 10/22
11/22 Räkneregler för väntevärden Låt X och Y vara slumpvariabler och a, b, c vara givna konstanter. Då är E[aX + by + c] = ae[x ] + be[y ] + c. Exempel: Om E[X ] = 5 och E[Y ] = 10 så är E[X + Y ] = E[X ] + E[Y ] = 5 + 10 = 15. Om spel 1 i genomsnitt ger 5 kr i vinst och spel 2 i genomsnitt ger 10 kr i vinst så är den genomsnittliga vinsten av spelen tillsammans 15 kr. E[X ] = 5, E[Y ] = 10, a = 2, b = 1 och c = 25 så är E[2X + Y 25] = 2 5 + 10 25 = 5. Om det kostar 25 kr att spela spel 1 två gånger och spel 2 en gång så förlorar man i genomsnitt 5 kr.
12/22 Räkneregler för väntevärden Mer allmänt kan vi låta X 1, X 2,..., X n vara slumpvariabler och a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n = n a i X i. i=1 Vi har då följande räkneregel: E[S n ] = a 1 E[X 1 ] + a 2 E[X 2 ] +... + a n E[X n ] = n a i E[X i ] i=1 Se parkeringsplatsexempel på tavlan!
13/22 Oberoende slumpvariabler Vi har tidigare definierat att två händelser A och B är oberoende om P(A B) = P(A) P(B). Två slumpvariabler X och Y kallas oberoende om P({X x} {Y y}) = P(X x) P(Y y) för alla värden på x och y. Många beräkningar blir betydligt enklare när man jobbar med oberoende slumpvariabler. När man redovisar problem på kursen så är det viktigt att poängtera när man utnyttjar att slumpvariabler är oberoende!
14/22 Räkneregler för oberoende slumpvariabler Låt X 1, X 2,..., X n vara oberoende slumpvariabler och c, a 1, a 2,..., a n vara givna konstanter. Inför slumpvariabeln S n = a 1 X 1 + a 2 X 2 +... + a n X n + c = n a i X i + c. i=1 Vi har då följande räkneregel: V[S n ] = a 2 1V[X 1 ] + a 2 2V[X 2 ] +... + a 2 nv[x n ] = n ai 2 V[X i ] i=1 Se parkeringsplatsexempel på tavlan! Kan vi säga något om fördelningen för S n?
15/22 Normalfördelningen Den fördelning som är allra vanligast vid modellering av slumpfenomen kallas normalfördelningen. Den används bland mycket annat för att modellera mätfel, brus, variation i storlek, olika finansvariabler och kvantmekaniska fenomen. Slumpvariabeln X är normalfördelad med parametrar µ och σ, betecknat X N(µ, σ 2 ) om dess täthetsfunktion är f (x) = 1 σ /2σ2 e (x µ)2, för < x <. 2π För normalfördelningen gäller att E[X ] = µ V [X ] = σ 2 och P(µ 2σ X µ + 2σ) 0.95.
0.0 0.1 0.2 0.3 0.4 Normalfördelningens täthetsfunktion N(0,1) N(2,1) N(0,2) N(0,5) 4 2 0 2 4 x 16/22
17/22 Att räkna med normalfördelningen Exempel. Vikten X på en sorts bläckfisk är N(5, 2)-fördelad. Vad är P(X 6)? Om X N(µ, σ 2 ) så gäller att X µ σ N(0, 1) och därmed kan man alltid översätta problem som rör N(µ, σ 2 ) till problem med N(0, 1). Av den anledningen så finns tabeller över Φ(x) = P(X x) om X N(0, 1). Vi kommer att använda dem på räkneövningarna. Se exempel på tavlan!
18/22 Räkneregler för normalfördelningen Antag att X N(µ X, σ 2 X ) och Y N(µ Y, σ 2 Y ). Då gäller att ax + b N(aµ X + b, a 2 σ 2 X ) och om X och Y är oberoende så är X + Y N(µ X + µ Y, σ 2 X + σ2 Y ). Summor av normalfördelade slumpvariabler är normalfördelade! Se exempel på tavlan!
19/22 Centrala gränsvärdessatsen (CGS) Låt X 1, X 2,..., X n vara oberoende slumpvariabler som alla har samma fördelning, med väntevärde µ och varians σ 2 <. Då gäller för stora n att är approximativt normalfördelad: där µ y = nµ och σ 2 Y = nσ2. Y = X 1 + X 2 +... + X n Y N(µ y, σ 2 Y ) Se parkeringsplatsexempel på tavlan!
20/22 Centrala gränsvärdessatsen för medelvärden I många situationer är man intresserad av X = 1 n (X 1 + X 2 +... + X n ). Det följer ur centrala gränsvärdessatsen att då n är stort så är X N (µ, σ2 ) n Då n så får vi att variansen σ2 n 0. Vad innebär det?
21/22 Stora talens lag Vi betraktar X = 1 n (X 1 + X 2 +... + X n ). Antag att slumpvariablerna X 1,..., X n är oberoende och har samma väntevärde µ. Man kan då visa att ( ) P X µ då n = 1, vilket vi tolkar som att medelvärdet X ligger nära µ då antalet observationer n är stort. Resultatet kallas stora talens lag och är en av de stora satserna inom sannolikhetsteorin och vetenskap i allmänhet.
22/22 Sammanfattning Viktiga fördelningar: likformig fördelning, exponentialfördelning, normalfördelning. E[aX + by + c] = ae[x ] + be[y ] + c. Om X och Y är oberoende så är V[aX + by + c] = a 2 V[X ] + b 2 V[Y ]. Centrala gränsvärdessatsen: Summor av likafördelade oberoende slumpvariabler är approximativt normalfördelade. Stora talens lag: Då antalet observationer n är stort så ligger medelvärdet X nära väntevärdet µ.