Fiasiell Statistik (GN, 7,5 hp,, HT 008) Föreläsig 4 (del ) Pukt- och itervallskattig (LLL Kap 10) Departmet of Statistics (Gebreegus Ghilagaber, PhD, Associate Professor) Fiacial Statistics (Basic-level course, 7,5 ECTS, Autum 008) 1 Defiitioer Ett estimator av ett populatiosparameter är ett stokastisk variabel som beror på iformatioe i ett stickprov... vars värde ger e approximatio till de okäd parameter Ett specifikt värde på estimator kallas för skattig eller estimat (eg. estimate)
Pukt- och itervallskattigar Puktskattig är ett estaka ummer, Itervallskattig (kofidesitervall) ger iformatio om puktskattiges variabilitet Lägre Kofidesgräs Puktskattig Övre Kofidesgräs Kofidesitervalles vidd Puktskattigar Vi ka skatta ett Populatios parameter Medelvärde Med ett stickprovs statistika (puktskattig) x Proportio P pˆ Varias S
Öskade Egeskaper hos puktskattigar: Vätevärderiktighet Ett estimator ˆ är vätevärderiktigt (vvr) estimator för ett parameter θ om vätevärde (eller medelvärde), av ˆ är θ: E( ˆ) = Exempel: Stickprovsmedelvärdet, x, är vvr estimator av Stickprovsvariase, s, är vvr estimator av Stickprovsproportio, pˆ, är vvr estimator P ˆ är vvr estimator, ˆ är INTE vvr: 1 Vätevärderiktighet ˆ 1 ˆ ˆ
Bias Låt ˆ vara ett estimator av θ: Bias i ˆ och θ: är skillade mella vätevärde av Bias( ˆ) = E( ˆ) ˆ För vvr estimatorer är Bias = 0 Öskade Egeskaper hos puktskattigar: Kosistes Låt ˆ vara ett estimator av θ: ˆ är kosistet estimator av θ om variase av ˆ miskar är stickprovsstorleke ökar (dvs. om skillade mella E( ˆ) och θ miskar är ökar) Kosistes öskas är ma ite ka hitta ett vvr estimator.
Öskade Egeskaper hos puktskattigar: Effektivitet Ata att vi har fler vvr estimatorer för θ Det mest effektiv estimator (eller mista varias vvr estimator) för θ är det estimator med mista varias. Låt 1 och vara två vvr estimatorer of θ, baserade på samma atal observatioer: ˆ ˆ är mer effektiv ä om 1 ˆ ˆ Var( ˆ 1) < Var( ˆ ) De relativa effektivitet av 1 (med avseede på ) defiieras som: ˆ Relativ Effektivitet = Var( ˆ ) Var( ˆ 1) ˆ Kofidesitervall & Kofidesivå Om P(a < θ < b) = 1 - α kallas itervalle frå a till b för ett 100(1 - α)% kofidesitervall för θ. (1 - α) är itervallets kofidesivå (α är mella 0 och 1) Vid upprepad urval av stickprov frå populatioe, och kostruktio av kofidesitervall för varje stickprov, 100(1 - α)% av itervallera täcker (iefattar) de saa värde på parameter θ Kofidesitervallet beräkat på så sätt skrivs som a < θ < b med 100(1 - α)% kofides.
Estimatiosprocess Populatio (medelvärde,, är okäd) Stickprov Medelvärde X = 50 Jag är 95% säker (cofidet) att ligger mella 40 & 60. Stickprov Geeral Formell Geeral formell för alla kofidesitervaller är: Puktskattig ± (trovärdighetsfaktor)(stadardavvikelse) Värdet på trovärdighetsfaktor beror på öskad kofidesivå.
Kofidesitervaller Populatios- Medelvärde Kofidesitervaller Populatios- Proportio Populatios- Varias Käd Okäd Kofidesitervall för är är käd Atagade Populatiosvariase är käd Populatioe är ormalfördelad om populatioe ite är ormalfördelad, aväd stor stickprovstorlek (så att kua aväda CGS) Kofidesitervalle skattas som: x z / < < x + z / där trovärdighetsfaktor, z α/, är z-värdet i stadard ormalfördelige som har yta (saolikhete) α/ till höger.
Felmargiale (Margi of Error = ME) Kofidesitervalle, x z / < < x + z / ka också skrivas som x ±ME där ME är felmargiale (margi of error) ME = z / Itervallsvidde, w, är lika med två gåger felmargiale. Felmargiale (ME) ME = z / Felmargiale (ME) miskar om populatiosstadardavvikelse ka miskas ( ) Stickprovsstorleke ka ökas ( ) Kofidesivå ka miskas (1 α)
Att hitta trovärdighetsfaktor, z α/ Ata vi vill ett 95% kofidesitervall: 1 α =.95.05 = =.05 Z eheter: X eheter: z = -1.96 z = 1.96 Lägre Kofidesgräse 0 Puktskattig Hitta z.05 = 1.96 frå tabelle för stadard ormalfördelig Valiga kofidesivå Kofidesivå som aväds ofta är 90%, 95%, och 99% Kofidesivå 80% 90% 95% 98% 99% 99.8% 99.9% övre Kofidesgräse Kofideskoefficiet, 1 α.80.90.95.98.99.998.999 Z α/ -värde 1.8 1.645 1.96.33.575 3.08 3.7
Itervaller & Kofidesivå Sampligsfördelige för stickprovmedelvärde Itervaller sträcker frå x z till x + z α / 1 α α/ = x x 1 x Kofidesitervaller x 100(1-α)% av de kostruerade itervaller täcker ; 100(α)% täcker ite. Exempel Ett stickprov på 11 strömkretsar (eg. circuits) frå e stor ormalfördelad populatio har geomsittlig resistes på.0 ohms. Vi vet frå tidigare studie att populatios stadardavvikelse är 0.35 ohms. Kostruera ett 95% kofidesitervall för populatioes geomsittlig resistes.
Exempel (forts..) Lösig: x ± z =.0 ± 1.96 (.35/ 11) =.0 ±.068 1.993 < <.4068 Exempel: Tolkig Vi är 95% säker (cofidet) att de saa geomsittlig resistes för populatioe är mella 1.993 och.4068 ohms De saa geomsittliga resistes för populatioe ka vara iom itervallet 1.993 och.4068 eller ej, me 95% av alla itervaller som kostrueras på så sätt (med = 11) täcker de.
Kofidesitervaller Populatios- Medelvärde Kofidesitervaller Populatios- Proportio Populatios- Varias Käd Okäd (Studet s) t-fördelig Ata ett stickprov på observatioer med medelvärde x och stadardavvikelse s frå ormalfördelad populatio med medelvärde Då gäller att variabel x t = s/ följer t-fördelig med ( - 1) frihetsgrader.
Kofidesitervall för är är okäd Om populatios stadardavvikelse är ökäd, vi ka ersätta de med stickprovs stadardavvikelse, s Detta iför extra osäkerhet eftersom s ka variera frå ett stickprov till ett aat. Därför aväder vi t-fördelige istället av ormalfördelige Kofidesitervall för är är okäd Atagade Populatiosstadardavvikelse är okäd Populatioe är ormalfördelad om populatioe ite är ormalfördelad, aväd stor stickprovsstorlek (for att kua aväda CGS) Aväd t-fördelige Kofidesitervalle skattas som: S x t -1, x t / < < + -1, / där t -1, / är värdet på t-fördelige med -1 frihetsgrader som har yta (saolikhet) α/ till höger: P(t t ) 1 > 1, / = / S
t-fördelige Obs: t Z är ökar Stadard Normal ( = t med stor df) t-fördeligar är bell-shaped symetriska, och har medelvärde 0, me har större varias (bredare svas) ä ormal. t (df = 13) t (df = 5) 0 t t-fördelige Yta i övre svase df.10.05.05 1 3.078 6.314 1.706 Låt: = 3 df = - 1 = α =.10 α/ =.05 1.886.90 4.303 3 1.638.353 3.18 α/ =.05 Dessa är t-värde (ite saolikheter) för olika kombiatioer av yta (slh) och frihetsgrader 0.90 t
Värde på t-fördelige (i jämförelse med Z-värde) Kofides- t t t Z ivå (10 df.) (0 df.) (30 df.).80 1.37 1.35 1.310 1.8.90 1.81 1.75 1.697 1.645.95.8.086.04 1.960.99 3.169.845.750.575 Obs: t Z är ökar Exempel Ett slumpmässigt urval på = 5 har x = 50 och s = 8. Skatta 95% kofidesitervall for d.f. = 1 = 4, så t 1, / = t4,.05 = Kofidesitervalle skattas som S t -1, / 8 50 (.0639) 5 46.698.0639 S < x + t -1, 8 < 50 + (.0639) 5 < 53.30 x < / < <
Kofidesitervaller Populatios- Medelvärde Kofidesitervaller Populatios- Proportio Populatios- Varias Käd Okäd Kofidesitervall för Populatiosproportio, P Itervallskattig (kofidesitervall) för populatiosproportioe (P) ka beräkas geom att ta häsy till osäkerhet krig stickprovsproportioe ( pˆ )
Kofidesitervall för Populatiosproportio, P Vi mis att om stickprovsstorleke är stor ka fördelige för stickprovproportioe ( pˆ ) approximeras med ormalfördelig med stadardavvikelse P(1 P) När P är okäd ka vi approximera stadardavvikelse med: P = pˆ (1 p) ˆ Kofidesitervall för Populatiosproportio, P Övre och lägre gräsera till populatiosproportioe beräkas eligt: p(1 ˆ p) ˆ p ˆ z P pˆ z / < < + / p(1 ˆ p) ˆ där z α/ är värdet på stadard ormalfördelig för motsvarade kofidesivå pˆ är stickprovsproportioe är stickprovsstorleke
Exempel Ett slumpmässigt urval av 100 studeter visar att 5 är västerhad. Kostruera ett 95% kofidesitervall för de saa proportioe västerhad. 5 100 Exempel Ett slumpmässigt urval av 100 studeter visar att 5 är västerhad. Kostruera ett 95% kofidesitervall för de saa proportioe västerhad. p(1 ˆ p) ˆ p ˆ z / < P < pˆ + z / 1.96.5(.75) 100 0.1651 < < P P < < 5 100 0.3349 + 1.96 p(1 ˆ p) ˆ.5(.75) 100
Exempel: Tolkig Vi är 95% säker (cofidet) att de saa procet västerhad är mella 16.51% ad 33.49%. De saa proportio västerhad ka vara iom itervallet 0.1651 to 0.3349 eller ej, me 95% av alla itervaller som kostrueras på så sätt (med = 100) täcker de. Kofidesitervaller Populatios- Medelvärde Kofidesitervaller Populatios- Proportio Populatios- Varias Käd Okäd
Kofidesitervall för Populatiosvariase Populatios- Varias Mål: Skatta kofidesitervall för populatiosvariase, Kofidesitervalle bygger på Stickprovsvariase, s Atagade: populatioe är is ormalfördelad Kofidesitervall för Populatiosvariase Populatios Varias De stokastiska variabel χ 1 ( 1)s = χ 1, α följer Chi-två fördelig med ( 1) frihetsgrader Observera att Chi-två fördelig ka ite ata egative värde. Detta iebär att värdet på Chi-två 1, α beteckar värdet för vilket χ P( ) 1 > 1, =
Kofidesitervall för Populatiosvariase Populatios Varias 100(1 - α)% kofidesitervall för populatiosvariase skattas eligt: ( 1)s 1, / < < ( 1)s 1,1- / Exempel Vi testar hästighet hos datorprocessor och samlar följade data (i Mhz): # datorer 17 medelvärde 3004 (Mhz) Stadard avv. 74 (Mhz) Ata att populatioe är ormalfördelad. Bestäm 95% kofidesitervall för x
Att hitta Chi-två värdea = 17 iebär att så chi-två fördelige har ( 1) = 16 frihetsgrader α = 0.05 iebär att vi letar efter Chi-två värdea med yta 0.05 i udre resp. övre svase: 1, / = 16, 0.05 = 8.85 1,1- / = 16, 0.975 = 6.91 saolikhet / =.05 saolikhet / =.05 χ 16 = 6.91 χ 16 = 8.85 χ 16 Beräka Kofidesitervalle 95% kofidesitervalle blir ( 1)s ( 1)s < < 1, / 1,1- / (17 1)(74) 8.85 < 3037 < (17 1)(74) < 6.91 < 1683 Om vi koverterar till stadardavvikelse, vi är 95% säker att populatios stadardavvikelse CPUhästighet ligger mella 55.1 och 11.6 Mhz.