Fiasiell Statistik (GN, 7,5 hp,, HT 008) Föreläsig 4 (del 1) Sampligfördeligar (LLL Kap 8) Departmet of Statistics (Gebreegus Ghilagaber, PhD, Associate Professor) Fiacial Statistics (Basic-level course, 7,5 ECTS, Autum 008) 1 Sampligfördeligar Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?)
Sampligfördelige för ett stickprovs-medelvärde Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?) Sampligfördelige för ett stickprovs-medelvärde Ata att vi har ett populatio Populatiosstorlek: N4 Stokastisk variabel,, är idivides ålder Varde på : 18, 0,, 4 (år) A B C D
Sampligfördelige för ett stickprovs-medelvärde Beskrivade mått för Populatiosfördelige: P() i N.5 18 + 0 + + 4 1 4 (i N ).36 0 18 0 4 A B C D Likformigfördelig Sampligfördelige för ett stickprovs-medelvärde Alla möjliga stickprov med storlek : 1 :a :a Observatio Obs 18 0 4 18 18,18 18,0 18, 18,4 0 0,18 0,0 0, 0,4,18,0,,4 4 4,18 4,0 4, 4,4 16 möjliga stickprov med storlek (med återläggig) 16 Stickprovsmedelvärde 1:a :a Observatio Obs 18 0 4 18 18 19 0 1 0 19 0 1 0 1 3 4 1 3 4
Sampligfördelige för ett stickprovsmedelvärde 16 Stickprovsmedelvärde 1:a :a Observatio Obs 18 0 4 18 18 19 0 1 0 19 0 1 0 1 3 4 1 3 4 P().3..1 0 _ Fördelige av Stickprovsmedelvärde 18 19 0 1 3 4 (ite lägre likformig) _ Sampligfördelige för ett stickprovsmedelvärde Beskrivade mått för stickprovsfördelige: : 18 + 19 + 1+ + 4 E() L 1 16 N i (i ) N (18-1) + (19-1) + L+ (4-1) 16 1.58
P().3. Sampligfördelige för ett stickprovsmedelvärde Populatio N 4 1.36 P().3. _ 1 1.58 Stickprov.36.1.1 0 18 0 4 A B C D 0 18 19 0 1 3 4 _ Vätevärde & Stadardfel för stickprovsmedelvärde Låt 1,,... vara ett slumpmässigt urval frå ett populatio: Stickprovsmedelvärde av dessa observatioer defiieras eligt Olika stickprov med samma storlek ka ge olika stickprovsmedelvärde Medelvärde (vätevärde) av stickprovsmedelvärde är dock samma som populatiosmedevärde: Spridige av stickprovsmedelvärde mätts av stickprovsmedelvärdes stadardavvikelse och kallas för stadard fel: Vad häder till stadard felet är blir större? Vad iebär det? 1 i 1 i
Om Stadardfel för stickprovsmedelvärde: korrektio för ädlig populatio urval är uta återläggig (e idivid ka ite vara med mer ä e gåg) stickprovsstorleke är stor i förhållade till populatios storleke ( är större ä 5% av N) då tillämpar vi korrektio för ädlig populatio och justerar stadard felet för stickprovsmedelvärde eligt N N Var( ) N 1 N 1 Prova med eemplet på ålder (N 4, ) uta återläggig Z-värde för stickprovetsfördelig Z-värdet för är ( ) ( Z ) eller Z ( ) ( ) N N 1 där: stickprovsmedelvärde populatiosmedelvärde populatios stadardavvikelse stickprovsstorlek N populatiosstorlek
Sampligfördelige: egeeskaper Populatioe ormalfördelad (dvs. Stickprovsmedelvärde är vätevärderiktigt) ormalfördelad (med samma medelvärde me midre varias) Sampligfördelige: egeeskaper är ökar, större Stickprovsstorlek miskar midre stickprovsstorlek
När Populatio är ite Normal Då ka ma aväda Cetrala gräsvärdesatse Cetrala gräsvärdesatse: Stickprovsmedelvärdet,, ka betraktas som e approimativt ormalfördelad stokastisk variabel, är är tillräckligt stort, oavsett vad populatioe har för fördelig. ~ N ( µ, ) Z ( ) ~ N (0, 1) Vad meas med tillräckligt stort? Valig tumregel: 30. På grud av cetrala gräsvärdessatse blir ormalfördelige e viktig fördelig i måga olika sammahag. Cetrala gräsvärdesatse är ökar blir stickprovsfördelige för medelvärdet approimativt ormal oavsett populatiosfördelige.
När Populatio är ite Normal Sampligfördelige: Populatiosfördelige Lägesmått Spridigsmått Stickprovsfördelige (går mot ormal är ökar) midre större Eempel Slumpmässigt stickprov av storlek 36 frå e populatio med medelvärde µ 8 och varias σ 9. Vad är saolikhete att få ett stickprovsmedelvärde som är mella 7.8 och 8.?
Eempel (forts.) Äve om populatioe ite är ormalfördelad ka vi aväda CGS eftersom 36 > 30 det betyder att sampligfördelige för är approimativt ormal med medelvärde 8 och stadardavvikelse 3 36 0.5 Eempel (forts..) P(7.8 < < 8.) 7.8 P 3 P(-0.5-8 < 36 < Z < - 8 8. - 8 < 3 36 0.5) 0.3830 Stickprovsfördelige Populatiosfördelige???????????? Stickprov Stadard Normal fördelig Stadardisera 7.8 8. -0.5 0.5 8 8 0 z.1915 +.1915 Z
Sampligfördelige för ett stickprovsproportio Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?) Populatio Proportio, P P proportio (adel) i populatioe med ågo egeskap Stickprovsproportio ( ) ger ett skattig av P: 0 1 # i stickprovet med egeskape stickprovsstorleke # i stickprovet med egeskape (# success) har biomialfördelig, me ka approimeras med ormalfördelige är P(1 P) > 9
Sampligfördelige för P Normal approimatio: Läges- och spridigsmått: P( P) ˆ.3..1 0 Stickprovsfördelige 0..4.6 8 1 ˆ och p Var ( ) Var E( P) ^ P(1 P) (där P populatio proportio) Z-Värde för Proportio Stadardisera till ett Z-värde geom: P Z P P(1 P)
Eempel Om det saa proportio av väljare som är för valsedel A är P 0.4, vad är saolikhete att ett stickprov på 00 ger ett stickprovsproportio mella 0.40 och 0.45? dvs: om P.4 och 00, vad är P(.40.45)? Eempel (forts..) om P.4 och 00, vad är P(.40.45)? P(1 P).4(1.4) 00 P ˆ.03464 Kovertera till stadard ormal:.40.40.45.40 P(.40 P ˆ.45) P Z.03464.03464 P(0 Z 1.44)
Eempel (forts..) om P.4 och 00, vad är P(.40.45)? Aväd tabelle för stadard ormal: P(0 Z 1.44).451 Sampligfördelige Stadardiserade Normalfördelige.451 stadardisera.40.45 0 1.44 Z Sampligfördelige för ett stickprovsvarias Sampligfördeligar Sampligfördelige för ett stickprovsmedelvärde Sampligfördelige för ett stickprovsproportio Sampligfördelige för e stickprovsvarias (?)
Stickprovsvarias Låt 1,,..., vara ett slumpmässigt urval frå e populatio. Stickprovsvariase defiieras eligt s 1 1 i 1 Stickprovs stadardavvikelse är s s ( ) Stickprovsvariase ka variera mella olika stickprov av samma storlek frå samma populatio i 1 ( i 1 i 1 ) Sampligfördelige för varias Sampligfördelige för s har medelvärde σ E(s ) om populatioe är ormal är sampligfördeliges varias 4 σ Var(s ) 1 om populatioe är ormal, gäller det att σ (-1)s σ har ett χ (Chi-två) fördelig med 1 frihetsgrader
χ fördelige (Chi-square distributio) Chi-två fördelige tillhör ett familj av fördeligar som styrs av frihetsgrader: Frihetsgrader (d.f.) 1 0 4 8 1 16 0 4 8 χ 0 4 8 1 16 0 4 8 χ 0 4 8 1 16 0 4 8 χ d.f. 1 d.f. 5 d.f. 15 Frihetsgrade (d. f.) Idé: # observatioer som är fria att variera efter stickprovsmedevärdet är beräkat. Eempel: medelvärde av 3 siffror är 8.0 Låt 1 7 och 8. Vad blir 3? Om medelvärdet skall vara 8 måste 3 vara lika med 9 (dvs, 3 är ite fri att variera) Därför är frihetsgrade ( 3, frihetsgrade 1 3 1 ) Detta betyder att av siffrora ka ata vilke värde som helst me de tredje är ite fri att variera om medelvärdet måste vara ett givet värde (här 8)
Chi-square: Eempel Ett kylskåp måste hålla valt temperatur med litet variatio. Specifikatioer kräver för ett stadardavvikelse ite större ä 4 grader (varias på 16 grader ). Ett stickprov på 14 kylskåp ska testas Om stadardavvikelse för populatioe är 4, vad är övre gräse (K) för stickprovsvariase så att saolikhete att överstiga dea gräs, är midre ä 0.05? Chi-square: Eempel (forts.) ( 1)s σ är chi-två fördelad med ( 1) 13 frihetsgrader Aväd tabelle för chi-två fördelige (Tabell A5, LLL) med yta på 0.05 i övre svase: χ 13.36 (α.05 och 14 1 13 d.f.) saolikhet α.05 χ 13.36 χ
Chi-square: Eempel (forts.) χ 13.36 (α.05 med 14 1 13 d.f.) Därför: P(s ( 1)s > K) P 16 > 13 ( 1)K eller.36 16 (.36)(16) så att K 7.5 (14 1) 0.05 (där 14) Om s frå ett stickprov på 14 observatioer är större ä 7.5, fis det stark bevis att påstå att populatiosvariase överstiger 16.