Karlstads universitet Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 4 mars 006, kl. 09.00-13.00 Tillåtna hjälpmedel: Bifogad formel- och tabellsamling (skall returneras) samt miniräknare. Ansvarig lärare: Leif Ruckman, 0705-75961 Övrigt: Varje uppgift kan ge max 10p. Lösningar skall utansvårighet kunna följas. Införda beteckningar skall förklaras. För betget Godkänd krävs minst 30 p och för Väl godkänd krävs 45 p. Uppgift 1. En hälsoklubb har noterat att 30% av de medlemmar de värvar är kraftigt överviktiga. Vid en kampanj värvade man 500 medlemmar. Låt X = Antal värvade medlemmar som är kraftigt överviktiga. a) Vilken fördelning följer X? Motivera! b) Vad är sannolikheten att mer än 174 av de 500 värvade medlemmarna är kraftigt överviktiga? Uppgift. Ett amerikanskt försäkringsbolag har konstaterat att deras kunder (hushåll) köper försäkringar för mellan $400 och $3800 per år. Beloppet kan anses följa en likformig kontinuerlig fördelning (rektangel, uniform). a) Beräkna µ och tolka resultatet verbalt. b) Beräkna och tolka resultatet verbalt. c) Vad är sannolikheten att ett slumpmässigt valt hushåll spenderar mer än $500 på försäkringar? d) Vad är sannolikheten att 16 slumpmässigt valda hushåll i genomsnitt spenderar mer än $500 på försäkringar? Uppgift 3. Låt X vara binomialfördelad med parametrarna 4 respektive 0.7. 1 Låt Y = X.8 a) Illustrera sannolikhetsfördelningen för Y grafiskt.
b) Beräkna E(Y) = µ. c) Beräkna. d) Beräkna P(Y > µ ) Uppgift 4. I kursboken definieras sampling error och sampling distribution of the sample mean. Förklara vad dessa begrepp innebär. Uppgift 5. Ett skeppsvarv har 50 svetsare anställda. 30 av dessa väljs slumpmässigt ut i ett stickprov. Av de utvalda hade 18 stcken betg från en avslutad svetsarutbildning. Beräkna ett 95% konfidensintervall för andelen svetsare som har betg från en avslutad svetsarutbildning. Tolka resultatet i ord. Uppgift 6. En hamburgerkedja påstår att den genomsnittliga väntetiden att få sin mat är mindre än 3 minuter. Ett slumpmässigt urval om 50 kunder visade ett genomsnitt på.75 minuter och en standardavvikelse på 1 minut. Ger detta resultat tillräckligt stöd för hamburgerkedjans påstående? Utred genom att göra ett lämpligt hpotestest på 5%-nvån. Ge en verbal slutsats och förklara vad som menas med 5%-nivån.
Lösningar till tentamen i statistik 060304, STAA13, deltenta. Uppgift 1. a) Antingen är man kraftigt överviktig eller ej. De nvärvades vikter antas oberoende av så vi har 500 oberoende upprepningar där sannolikheten att lckas i varje enskilt försök (värvning) är 0.3. X är därmed Bin(n=500, π=0.3). b) nπ och n(1-π) är båda större än 5 så X är approximativt normalfördelad med µ=np=500. 0.3=150 personer och = n π 1 π = 500 0.3 0.7 = 105 = 10. personer. P Uppgift. ( ) 5 X µ 174.5 150 10.5 ( X > 174 ) = P > = P( Z >.39) = P( Z.39) = 0. 0084 400 + 3800 a) µ = = 100$. I genomsnitt handlar deras kunder försäkringar för 100$ per år. ( ) 3800 400 b) = = 963333 = 981,5$. Spridningen i populationen är 981.5$. 1 Detta kan ungefärligen tolkas som att beloppen som hushållen handlar försäkringar för är spridda mellan 400 och 3800 med ett gensnittligt avstånd till µ på 981.5. 3800 500 c) X=Belopp ~Re(400, 3800) P ( X > 500 ) = = 0. 384 3800 400 d) Tumregeln att n > 30 är inte uppflld, men då X är rektangel verkar CGS även vid mcket små 981.5 stickprov så X är approximativt normal E( X ) = µ = 100, x = = = 45. 375 n 4 X µ 500 100 P( X > 500 ) = P > = P( Z > 1.63) = P( Z 1.63) = 0. 0516 / n 45.375 Uppgift 3. X 1.8 p(x) = p() Beräknas från tabell Y = X 0-0.3571 0.0081 1-0.5556 0.0837-0.0081 = 0.0756-1.5 0.3483-0.0837 = 0.646 3 5 0.7599-0.3483 = 0.4116 4 0.8333 1-0.7599 = 0.401
a) b) c) E( Y ) = µ = p( ) = 1.5 0.646 0.5556 0.0756 0.3571 0.0081+ 0.8333 0.401+ + 5 0.4116 = 1.884 = p µ + 0.8333 ( ) = ( 1.5) 0.645 + ( 0.5556) 0.0756 + ( 0.3571) 0.401+ 5 0.4116 1.884 = 7.35 0.0081+ = = 7.35 =.71 d) P(Y > µ ) = P(Y > 1.884) = P(Y = 5) = 0.4116 Uppgift 4. Sampling error = Urvalsfel, skillnaden mellan urvalets statistika och motsvarande populationsparameter. Sampling distribution of the sample mean = Sannolikhetsfördelningen för alla möjliga stickprovsmedelvärden vid en given stickprovsstorlek.
Uppgift 5. N=50, n=30 x=18 p=x/n = 18/30 Urval ur ändlig population. n 30 och n/n = 30/50 = 0.1. CGS (variant) bör fungera bra och vi gör ett konfidensintervall som bgger på approximativ normalfördelning. 18 1 18 30 30 50 30 ± 1.96 0.6 ± 0.17 [0.43, 0.77] 95% 30 9 50 Med ca 95% säkerhet ligger andelen av de 50 svetsarna som har betg från en avslutad svetsarutbildning mellan 0.43 och 0.77. Uppgift 6. X = Väntetid tills man får sin mat. Påstående som man vill bevisa och som således hamnar i mothpotesen: µ < 3 n = 50 x =. 75 s = 1 H 0 : µ 3 H 1 : µ < 3 Signifikansnivå: α = 5% X µ Testfunktion: Z = s / n Z är approximativt normal (0, 1) enligt CGS då vi har ett slumpmässigt urval med n=50 (> 30) Kritiskt område: Förkasta nollhpotesen om Z obs < -1.645.75 3 Resultat: Z obs = = 1. 77 < -1.645. H 0 förkastas! 1/ 50 Slutsats: På 5% signifikansnivå visar testet att den genomsnittliga väntetiden understiger 3 minuter. Med 5% signifikansnivå menas att det är 5% risk att förkasta en korrekt nollhpotes.