Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 28-9-3 Normalfördelningen, X N(µ, σ) f(x) = e (x µ)2 2σ 2, < x < 2π σ.4 N(2,).35.3.25.2.5..5 2 2 3 4 5 6 Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge.4 N(2,) streckad, N(,) heldragen.35.3.25.2.5..5 4 3 2 2 3 4 5 6
σ bestämmer normalfördelningens spridning.4 N(,.5) streckad, N(,) heldragen.35.3.25.2.5..5 6 4 2 2 4 6 För alla värden på µ och σ gäller:.4 ca 67% inom sigmagränserna.3.2. 4 3 2 2 3 4 5 6 ca 95% inom 2 sigmagränserna.4.3.2. 4 3 2 2 3 4 5 6 ca 99% inom 3 sigmagränserna.4.3.2. 4 3 2 2 3 4 5 6 P (µ σ X µ + σ).67 P (µ 2σ X µ + 2σ).95 P (µ 3σ X µ + 3σ).99
Normalfördelningen standardisering X N(µ, σ) X µ σ N(, ).4 N(,).35.3.25.2.5 N(2,2)..5 4 2 2 4 6 8 Standardiserad normalfördelning - kvantiler λ α P (X λ α ) = α.4 N(,).35.3.25.2.5..5 4 3 2 2 3 4
EXEMPEL: Vid bestämning av kvicksilverhalten i ett reningsverks avloppsvatten används en metod som anses ge upphov till ett mätfel, X, som är normalfördelat med väntevärde och en varians.9. En bestämning, Y, kan uttryckas som Y = µ+x där µ är vattnets kvicksilverhalt. (a) Antag att µ =.35, vad är sannolikheten att den avlästa mätningen blir negativ? (b) För vilka värden på kvicksilverhalten µ ger metoden ett negativt värde med minst sannolikheten.5? (c) Man gör två bestämningar Y och Y 2 av kvicksilverhalten i ett vattenprov. Antag att µ =.35. Beräkna sannolikheten att medelvärdet av bestämningarna, Y = Y +Y 2 2 är negativt.
Viktiga räkneregler för väntevärden och varianser: E(aX + b) = ae(x) + b V (ax + b) = a 2 V (X) E(X + X 2 ) = E(X ) + E(X 2 ) V (X + X 2 ) = V (X ) + V (X 2 ) om X och X 2 är oberoende Dessa regler gäller för ALLA stokastiska variabler oavsett fördelning! Om X och X 2 är normalfördelade gäller dessutom att fördelningen för summan också är normalfördelad. VIKTIGA SPECIALFALL: X, X 2,... X n oberoende och alla X i N(µ, σ). och n X i N(nµ, nσ) i= X = n n X i N(µ, i= σ n )
EXEMPEL: Årliga mängden regn i ett avrinningsområde varierar enligt en normalfördelning med väntevärde mm och standardavvikelse 2 mm. Antag att regnmängderna olika år är oberoende. Som en approximativ modell för relationen mellan regnmängd, X, och avrinningen Y antar man att Y = +.4X (a) Vad är sannolikheten att regnmängden ett år understiger 9 mm? (b) Vilken regnmängd överstigs i 5 % av åren? (c) Vad är sannolikheten att avrinningen ett år överstiger 6 mm?
EXEMPEL (koldioxid i avgaser): I en undersökning mätte man mängden koldioxid (g/km) hos personbilar i trak. Den mängd en bil släpper ut varierar enligt en slumpvariabel som har väntevärde µ och varians σ 2. Från undersökningen uppskattade man att µ var ungefär 2.8 (g/km) och att σ 2 var ungefär 7.6. Vid en km lång sträcka i ett bostadsområde har man satt ett gränsvärde på.2 kg för den totala mängd koldioxid som kommer från bilars avgaser under en timme. (a) Om det kommer 8 bilar under en timme, vad är sannolikheten att gränsvärdet överskrids? Anta normalfördelning. (b) Hur många bilar kan man acceptera om sannolikheten att gränsvärdet överstigs får högst vara.5? Anta normalfördelning. (c) Antag nu att man inte anser sig veta något om hur koldioxidmängden är fördelad. Hur görs då beräkningarna i (a) och (b)?
SIMULERING: Stämmer det att medelvärdet av normalfördelade s.v. är normalfördelade? Nedan visas fördelningen av det simulerade medelvärdet av n normalfördelade observationer..25 n=.4 n=2.2.5..5.3.2. 5 5 5 5.5.4.3.2. n=5 5 5.8.6.4.2 n=25 5 5 EXEMPEL: Kasta en tärning n gånger och notera poängsumman. Nedan visas simulerad fördelning för poängsumman vid olika värden på n..2 n=.2 n=2.5.5...5.5 2 3 4 5 6 2 3 4 5 6 7 8 9 2.2 n=5.8 n=..8.6.6.4.4.2.2 2 3 4 2 4 6 8
EXEMPEL: Notera livslängden hos n komponenter, livslängden antas exponentialfördelad med väntevärde. Nedan visas simulerad fördelning för medelvärdet av de n komponenternas livslängder. n=.8 n=3.8.6.6.4.4.2.2 2 4 6 2 3 4.4 n= 2.5 n=25.2 2.8.5.6.4.2.5.5 2 2.5.5.5.5 2
CENTRALA GRÄNSVÄRDESSATSEN Antag att x,..., x n är oberoende observationer från en fördelning (vilken som helst) med väntevärde µ och varians σ 2. Om n är tillräckligt stort gäller att X N(µ, σ n ) eller ekvivalent n X i N(nµ, nσ) i= dvs stickprovsmedelvärdet (eller summan) får en approximativ normalfördelning oavsett vilken fördelning stickprovet x,..., x n är hämtat från.
VANLIGA FÖRDELNINGAR FÖR MILJÖDATA NORMALFÖRDELNINGEN Beteckning: X N(µ, σ) Exempel: mätfel hos ett instrument Al-halt i jordprover längden hos 2-åriga män i Sverige blodtrycket hos en person (varierar mellan mättillfälle) SOM GRÄNSFÖRDELNING FÖR SUMMAN AV SLUMPVARIABLER LOGNORMALFÖRDELNING Beteckning: ln(x) N(µ, σ) Exempel: koncentration av svaveldioxid i luften vid en mätpunkt mängden niobium i alkalisk lava koncentration av fosfor i ett vattendrag EXPONENTIALFÖRDELNING Beteckning: X Exp(λ) Exempel: livslängden hos en elektrisk komponent en jordbävnings Richter-magnitud koncentration av en förorening i vatten
REKTANGELFÖRDELNING (Likformig fördelning) Beteckning: X R(a, b) Exempel: väntetiden vid en busshållplats felet vid avrundning av tal BINOMIALFÖRDELNING Beteckning: X Bin(n, p) Exempel: antalet översvämningsår under ett decennium antal gånger ett gränsvärde överskrids under mätperioden antal bilar av n studerade som icke uppfyller ett visst miljökrav antalet studerande i en grupp om som klarar tentan POISSONFÖRDELNING Beteckning: X Po(λ) Exempel: antalet partiklar som sönderfaller från ett radioaktivt ämne under en minut antalet bilar som passerar i en glest trakerad vägkorsning under minuter antalet jordskalv i Kalifornien under de senaste decenniet
X diskret X kontinuerlig Sannolikhetsförd. p(x) = P (X = x) f(x) Fördelningsfunktion F (x) = P (X x) Väntevärde E(X) = µ F (x) = [x] k= p(x) F (x) = x f(t)dt E(X) = x= xp(x) E(X) = xf(x)dx Varians V (X) = σ 2 = E[(X µ) 2 ] förväntad kvadratisk avvikelse från väntevärdet Standardavvikelse D(X) = σ = V (X) Sannolikhetsfunktion för X Po(2.5).8 Täthetsfunktion för X N(3.5,.5) P(X=k)=p(k).25.2.5..5 2 3 4 5 6 7 8 9 k f(x).6.4.2 2 4 6 x Fördelningsfunktion för X Po(2.5) Fördelningsfunktion för X N(3.5,.5).8.8 F(x)=P(X<=x).6.4.2 F(x).6.4.2 2 4 6 8 x 2 4 6 x