Föreläsig 5 732G70 Statistik A
Egeskaper hos stickprovsstatistikora Stickprovsmedelvärde Stickprovssumma Stickprovsadel Lägesmått Spridig Medelfel EX VarX 2 2 E X Var X E P Var P X X 1 1 P Eftersom respektive i allmähet är okäda skattas de med s respektive p. Exempel stickprovssumma: Flygbolag räkar med att medelvikte på e passagerare är 80 kg med e stadardavvikelse om 5 kg. E viss flygplastyp rymmer 290 passagerare. Totalvikte blad dessa 290 passagerare är exempel på e stickprovssumma. 2
De stora tales lag Ju större stickprov vi drar, desto mer lika blir stickprovsstatistikora populatiosparametrara 3
Percet Sampligfördelig Hur ofta kommer vårt stickprovsmedelvärde att överesstämma med populatiosmedelvärdet, om vi skulle dra måga OSU ur samma populatio? Exempel: Vi studerar ett företag med 100 aställda, och vi är itresserade av medelikomste blad de aställda. Företagets aställda utgör alltså vår populatio, och med hjälp av företagets ekoomiavdelig ka vi faktiskt plocka fram löeivå för samtliga 100 aställda vid e viss tidpukt. Vi åskådliggör löefördelige vid företaget i ett histogram: 35 30 25 Ur löestatistike bestäms medellöe vid företaget till = 24265 kr 20 15 Histogrammet visar tydligt att populatioe lö för de aställda vid företaget ite ka betraktas som ormalfördelad! 10 5 0 10 20 30 40 Ikomst (tkr) 50 60 Vilke medellö skulle ett stickprov ge? 4
Sampligfördelig (forts) Låt oss u göra ett teoretiskt experimet: vi drar 50 oberoede stickprov om storleke = 10, beräkar de 50 stickprovsmedelvärdea och åskådliggör stickprovsmedelvärdea i ett histogram. Följade resultat erhålles. x 24381 kr Notera beteckige för medelvärde av medelvärde 19.5 21.0 22.5 24.0 25.5 27.0 Medelvärde Ikomst i stickprovet (tkr) (tkr) 28.5 30.0 5
Sampligfördelig (forts) Experimetet upprepas för 50 oberoede stickprov om storleke = 20: x 24324 kr 22 23 24 Medelvärde Ikomst i stickprovet (tkr) (tkr) 25 26 6
Sampligfördelig (forts) Slutlige upprepas experimetet för 50 oberoede stickprov om storleke = 30: x 24299 kr 21.6 22.8 24.0 25.2 Medelvärde Ikomst i stickprovet (tkr) (tkr) 26.4 7
Sampligfördelig (forts) Fördelige för stickprovsmedelvärdea kallas för e urvalsfördelig. Urvalsfördelige är alltså e förteckig över vilka värde vi ka förväta oss få i vårt urval, och hur ofta de ka förvätas förekomma. Vi ka betrakta urvalsfördelige som e uppskattig av de fördelig som skulle fås om vi åskådliggjorde stickprovsmedelvärdea för samtliga möjliga stickprov av e viss storlek ur populatioe, vilket kallas för e sampligfördelig. 8
Cetrala gräsvärdessatse sampligfördelige blir mer och mer lik e ormalfördelig (trots att populatioe som stickprove drogs ur ite alls var ormalfördelad!) är stickprovsstorleke ökar sampligfördeliges medelvärde hamar allt ärmare populatiosmedelvärdet är stickprovsstorleke ökar Cetrala gräsvärdessatse säger Sampligfördelige för summor eller medelvärde av oberoede slumpvariabler med samma fördelig är approximativt ormalfördelad om är tillräckligt stort Valig tumregel: 30 9
Fördelig för lijära variabeltrasformatioer Lijära variabeltrasformatioer av ormalfördelade slumpvariabler är också ormalfördelade Iebörde i detta är att sampligfördelige för medelvärde, summor och adelar beräkade på observatioer som följer ormalfördelige, geom att de dragits ur e populatio som är ormalfördelad, också är ormalfördelade, och detta oavsett stickprovets storlek. 10
Stickprovsstatistikors fördelig Om 30 gäller, tack vare cetrala gräsvärdessatse oavsett vilke fördelig populatioe som stickprovet dragits ur har, att Stickprovsmedelvärdet X N ; X X Stickprovssumma X N X ; X Om < 30 krävs att populatioe som stickprovet dragits ur är ormalfördelad. Då gäller fortfarade ovaståede formler eftersom lijära variabeltrasformatioer av ormalfördelade slumpvariabler också är ormalfördelade. 11
Stickprovsstatistikors fördelig (forts) För e stickprovsadel där X = atalet eheter i stickprovet med studerad egeskap gäller, givet att p(1-p) > 5, att P N P ; P 1 P Detta motiveras eligt följade: X beteckar atalet eheter i stickprovet med studerad egeskap, eller med adra ord atalet lyckade delförsök blad de totalt delförsök som stickprovet utgör. Givet att populatioe som stickprovet har dragits ur är tillräckligt stor gäller då att X är biomialfördelad. Frå kapitel 4 käer vi att biomialfördelige kovergerar mot ormalfördelige är är tillräckligt stor, och att ormalfördeligsapproximatio av biomialfördelige är möjlig om 1 5 Vi skattar de okäda populatiosadele med P, och sätter alltså som tumregel att sampligfördelige för e stickprovsadel går att betrakta som approximativt ormalfördelad om p 1 p 5 X 12
Exempel E grossist importerar 500-grams påsar med ris i partier om 10000 påsar. Grossiste kotrollerar de leveraser om 10000 påsar ma mottar geom att kotrollväga ett slumpmässigt urval om 50 påsar ur varje parti. Vid e viss leveras uppmäts geomsittsvikte till 496.7 gram blad 50 slumpmässigt utvalda påsar. Beräka saolikhete att få e geomsittsvikt blad 50 slumpmässigt valda påsar som är 496.7 gram eller lägre, givet att det är sat att geomsittsvikte per påse i hela partiet är 500 gram och stadardavvikelse mella påsar är 10.0 gram, vilket leveratöre hävdar. Vad är saolikhete för att de sammalagda vikte blad de 50 slumpmässigt valda påsara överstiger 25.2 kg, givet att det är sat att geomsittsvikte per påse i hela partiet är 500 gram och stadardavvikelse mella påsar är 10.0 gram? 13
Kapitel 6 Iferes om e populatio Sid 151-185
Puktskattig och itervallskattig Statistisk iferes om populatiosmedelvärde Puktskattig: att aväda e stickprovsstatistika som e uppskattig av motsvarade populatiosparameter Dock: stickprovsstatistikor är slumpvariabler och atar olika värde för varje stickprov. Hur ska vi hatera de osäkerhete? Vi börjar med att göra två atagade: 1. stickprovet är draget som ett OSU. Detta garaterar oberoede mella observatioera, vilket är de egeskap vi eftersöker här. 2. sampligfördelige för stickprovsmedelvärdet ka betraktas som ormalfördelad Om stickprovet är stort (eligt tumregel beståede av mist 30 eheter) ka vi tillämpa cetrala gräsvärdessatse (kapitel 5), vilke säger att sampligfördelige för summor eller medelvärde av oberoede slumpvariabler med samma fördelig är approximativt ormalfördelad om är tillräckligt stort. Om stickprovet är litet, eligt tumregel färre ä 30 eheter, krävs att populatioe som stickprovet dragits ur ka betraktas som ormalfördelad. Ett OSU draget ur e ormalfördelad populatio ger, som vi har lärt oss i kapitel 5, att sampligfördelige för stickprovsmedelvärdet också blir ormalfördelad, och detta oavsett stickprovets storlek. 15
Puktskattig och itervallskattig Statistisk iferes om populatiosmedelvärde Om krave är uppfyllda ka vi bilda ett kofidesitervall för populatiosmedelvärdet: vi lägger ett osäkerhetsitervall krig puktskattige vilket tillåter oss att med e viss säkerhet säga att de okäda populatiosparameter täcks av itervallet. 16
Dubbelsidigt kofidesitervall för populatiosmedelvärde är σ är okäd Givet att stickprovet är draget som ett OSU sampligfördelige för stickprovsstatistika ka betraktas som ormalfördelad bildas ett dubbelsidigt kofidesitervall för populatiosmedelvärdet µ eligt x t 1;1 / 2 s där värdet på t hämtas ur t-fördelige (Appedix B) 17
t-fördelige t-fördelige aväds för att lösa likade typer av problem som ormalfördelige, me lämpar sig är stickprovet är relativt litet och populatiosstadardavvikelse är okäd. t-fördelige är precis som ormalfördelige symmetrisk. t-fördelige defiieras av atalet frihetsgrader, eller eklare uttryckt atalet oberoede bitar av iformatio. Atalet frihetsgrader bestäms av hur mycket data ma har och hur måga bitar av iformatio som de statistiska metodik ma aväder sig av kräver. E viktig egeskap hos t-fördelige är att de ärmar sig (kovergerar mot) ormalfördelige är atalet frihetsgrader ökar. E valig tumregel är att betrakta t-fördelige som approximativt ormalfördelad om stickprovet består av 30 eheter eller fler. Frihetsgrader 5 50 5000 18-5 -4-3 -2-1 0 1 2 3 4 5
Exempel Ett slumpmässigt urval om 40 studeter vid Liköpigs uiversitet ger medelålder 21.2 år och stadardavvikelse 4.4 år. Bestäm ett itervall som med 95 procets säkerhet täcker de saa medelålder blad studerade vid Liköpigs uiversitet. 19
Ekelsidiga kofidesitervall för populatiosmedelvärde är är okäd Nedåt begräsat kofidesitervall: Uppåt begräsat kofidesitervall: 1 x t 1; 1 x t 1; Exempel: Styrelse i e bostadsrättsföreig får i klagomål på att golvvärme i badrumme är för låg. Ma drar ett OSU om 30 badrum blad de omkrig 400 badrum som fis i föreiges fastigheter och mäter golvvärme där. Medeltemperature beräkas till 21 grader och stadardavvikelse till 1.6 grader. Eergimydighete rekommederar att golvvärme ska ligga på mist 20 grader för att ma ska udkomma problem med fuktskador. Föreligger risk för fuktskador i föreiges badrum? s s 20
Kofidesitervall för populatiosadel Givet att 1. stickprovet är draget som ett OSU 2. det gäller att p(1-p) > 5 bildas dubbelsidigt kofidesitervall för populatiosadele π eligt p 1 p p z1 / 2 där värdet på z hämtas ur ormalfördeligstabelle (Appedix B) Nedåt begräsat kofidesitervall: p1 p p z1 Uppåt begräsat kofidesitervall: p z 1 p 1 p 21
Exempel I e hälsoekät tillfrågades 100 slumpmässigt utvalda aställda vid ett stort företag om huruvida ma regelbudet motioerar eller ej. Svar erhölls frå 84 aställda och av dessa svarade 65 ja. Bestäm ett 95-procetigt kofidesitervall för adele av de aställda vid det stora företaget som regelbudet motioerar. 22