Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1
Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande en normalfördelning Allmänt gäller att en standardiserad s.v. är en s.v. med väntevärde 0 och sd 1 Om ξ är N(µ, σ) och η=(ξ -µ)/ σ, så gäller att η är N(0, 1) Ex. 6.1, sid 156-157 2
Sats 6 B och Sats 6 C Summor av oberoende Normal F är också Normal F Ex. 6.3, sid 159 Ex. 6.5, sid 161 3
Sats 6 D Om ξ 1, ξ 2,, ξ n är oberoende och alla ξ i är N(µ, σ) samt ξ = 1 n n i= 1 ξ i Så gäller ξ är N( μ, σ ) n 4
Samplingfördelningen Statistika varierar från urval till urval Detta betyder att statistika är en slumpvariabel En samplingfördelning är en sannolikhetsfördelning för en statistika Vid upprepade sampling, vet vi vilka värden som kan antas av stickprovsmedelvärdet och sannolikheten för dessa olika värden 5
Exempel Population: 3,5,2,1 (N = 4) Ta ett stickprov med n=3 (utan återläggning) Möjliga urval urval 3, 3, 5, 5, 2 3, 3, 5, 5, 1 3, 3, 2, 2, 1 5, 5, 2, 2, 1 x 10 / 3 = 3.33 9 / 3 = 3 6 / 3 = 2 8/ 3 = 2.67 1/4 p( x) 2 3 x Varje x har samma sannolikhetsvärde = 1/4 6
Exempel Population: 1,2,3,4,5 (N = 5) Ta ett stickprov med n = 2 (med återläggning) x p(x) 1 0.2 2 0.2 3 0.2 4 0.2 5 0.2 1 2 3 4 5 x E(ξ) = µ = 3 Varians = σ 2 = 2,5 Standardavvikelse = σ = 1,58 7
Exempel Urval x Urval 1, 1 1 3, 4 3,5 1, 2 1,5 3, 5 4 1, 3 2 4, 1 2,5 1, 4 2,5 4, 2 3 1, 5 3 4, 3 3,5 2, 1 1,5 4, 4 4 2, 2 2 4, 5 4,5 2, 3 2,5 5, 1 3 2, 4 3 5, 2 3,5 2, 5 3,5 5, 3 4 3, 1 2 5, 4 4,5 3, 2 2,5 5, 5 5 3, 3 3 E( X ) = μ = 3 Varians x = σ 2 X Standardavvikelse = σ frekvens p(x) 1 1 0,04 1,5 2 0,08 2 3 0,12 2,5 4 0,16 3 5 0,20 3,5 4 0,16 4 3 0,12 4,5 2 0,08 5 1 0,04 25 = 1,042 X = 1,0206 8
Exempel x 1 2 3 4 5 1 2 3 4 5 x Originala fördelningen Samplingfördelningen n = 2 9
Exempel Samma medelvärde! x 1 2 3 4 5 1 2 3 4 5 Originala fördelningen Samplingfördelningen n=2 x Mindre varians Mer klockformad x 1 2 3 4 5 1 2 3 4 5 Samplingfördelningen n=3 Samplingfördelningen n=4 x 10
Centrala gränsvärdessatsen (CGS) Samma medelvärde! Population n = 2 n = 30 Mindre varians Mer klockformad μ x μ x μ x μ x 11
Centrala gränsvärdessatsen (CGS) Slutsatsen som kan dras från tidigare exempel: Oavsett formen på den populationsfördelning som ett slumpmässigt stickprov hämtas från, så går fördelningen för stickprovsmedelvärdet mot normalfördelningen då stickprovsstorleken (n) ökar Hur stort stickprov som behövs för att normalfördelningen skall kunna användas som en approximativ modell? Tumregel: I de flesta fall är normalfördelningen en tillräckligt god approximation vid n 30 Sats 6 E 12
Centrala gränsvärdessatsen (CGS) Centrala gränsvärdessatsen är även tillämpbar på summor av oberoende slumpvariabler vid stora stickprov oavsett hur populationens fördelning ser ut Som konsekvens av CGS så har vi följande ξ är approx N(nµ, nσ 2 ) Ex. 6.9, sid 169 13
Fördelningen för stickprovsmedelvärdet Om vi samplar från en normalfördelning är stickprovsmedelvärdet alltid normalfördelat oavsett stickprovsstorlek Om vi samplar från någon annan fördelning är stickprovsmedelvärdet approximativt normalfördelat om n är tillräckligt stort (n 30) 14
Stickprovsmedelvärdets väntevärde och varians Låt n vara stickprovsstorleken och låt µ och σ 2 vara medelvärdet och variansen i den population vi samplar ur ( ) Väntevärde (medelvärde): E ξ = μ Varianse: Standardavvikelse: V ( ) 2 2 σ ξ = σ = ξ n Medelfelet = σ ξ = σ n 15
Beräkningar av sannolikheter med hjälp av CGS Vi Vi utgick utgick ifrån ifrån den den normalfördelning som som då dåξ följde följde och och transformerade oss oss till till standardnormalfördelningen, vi vi kan kan utifrån utifrån detta detta bilda bilda vårt vårt η-värde för för ξ enligt enligt denna denna formel formel η Beräkna sannolikheterna med med hjälp hjälpav avtabellen = ξ σ / μ Ex: Ett slumpmässigt urval, n = 16 från en normalfördelningen med μ = 10 och σ = 8. n ξ μ P( ξ < 12) = P( < σ / n = P( η < 1) = 0,8413 12 10 ) 8 / 16 16
Normalfördelningen som approximation till Binomial Vi ska titta på normalfördelningen som en approximation av binomialfördelningen Då n är stort kan normalfördelningen användas som approximation till binomial Ju mer p avviker från 0.50 desto större n krävs för god approximation. Tumregel: np( 1 p) > 10 17
Exempel n=3 n=20 p(x) 0,4 0,3 0,2 0,1 p(x) 0,2 0,15 0,1 0,05 0 0 1 2 3 Antal lyckade utfall 0 2 4 6 8 10 12 14 16 18 20 Antal lyckade utfall 18
Normalfördelningen som approximation till Binomial Om ξ är Bin (n, p) och tumregeln är uppfylld, så kan vi som approximativ modell använda normalfördelningen med µ= npoch σ 2 =np(1-p) Anledningen till att man vill approximera fördelningar med en normalfördelningen är att man vill förenkla räknearbetet P( a ξ b) P a np np(1 p) η b np np(1 p) 19
Kontinuitetskorrektion En detalj som komplicerar approximationen är att binomialfördelningen är diskret medan normalfördelningen är kontinuerlig Om en variabel är normalfördelad är sannolikheten att variabeln antar ett visst värde alltid lika med noll, vilket ju inte gäller för en binomialfördelad variabel 20
Kontinuitetskorrektion (med halvkorrektion) Lösning: att använda halvkorrektionen P(ξ=a) approximeras med ytan under normalfördelningens kurva i intervallet (a-0,5, a+0,5) P( a ξ b) P a 0,5 np np(1 p) η b + 0,5 np np(1 p) 21
Exempel Antar att ξ är binomialfördelad med n = 50 och p = 0,40. Med hjälp av normal approximation Beräkna P(ξ 10) n = 50 p =.4 (1-p) =.6 np(1-p) = 12>10 Beräkna μ = np = 50(0,4) = 20 normal approximationen är ok! σ = np(1 p) = 50(0,4)(0,6) = 3,46 22
Exempel P( ξ 10) P( η 10,5 20 ) 3,46 = P( η 2.74) = 0,0031 23