Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00 Examiner: Xiangfeng Yang (Tel: 070 2234765). Please answer in ENGLISH if you can. a. Allowed to use: a calculator, Formelsamling och tabeller för TAIU06 Matematisk statistik. b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. 1 (3 points) English Version In the production of a type of building element, two types of errors A and B may appear in the manufactured units. We know that P (A) = 0.1, P (B) = 0.2 and P (A B) = 0.05. Find the probability that a manufactured unit have (1.1). (1p) at least one error, (1.2). (1p) the error A but not the error B, (1.3). (1p) exactly one of the errors A and B. Solution. (1.1) (1.2) (1.3) P (A B) = P (A) + P (B) P (A B) = 0.1 + 0.2 0.05 = 0.25. P (A B ) = P (A) P (A B) = 0.1 0.05 = 0.05. P (A B or A B) = P (A B ) + P (A B) = 0.05 + P (B) P (A B) = 0.05 + 0.2 0.05 = 0.2. 2 (3 points) Suppose that a random variable X has the probability function as follows X 1 2 3 4 5 p(x) 0.1 c 1 0.15 0.25 c 2 (2.1). (1p) If one knows P (X < 3) = 0.5, find the values c 1 =? and c 2 =? (2.2). (1p) Find the mean E(X) and the variance V ar(x). (2.3). (1p) Find the conditional probability P (X 2 X 4). Solution. (2.1). First 0.1 + c 1 + 0.15 + 0.25 + c 2 = 1, thus c 1 + c 2 = 0.5. From P (X < 3) = 0.5, we know that 0.1 + c 1 = 0.5. Therefore c 1 = 0.4, which implies c 2 = 0.1. (2.2) µ = E(X) = 1 0.1 + 2 0.4 + 3 0.15 + 4 0.25 + 5 0.1 = 2.85. σ 2 = V ar(x) = E(X 2 ) µ 2 = 1 2 0.1 + 2 2 0.4 + 3 2 0.15 + 4 2 0.25 + 5 2 0.1 2.85 2 = 9.55 2.85 2 = 1.4275. (2.3). P (X 2 X 4) = P (2 X 4) P (X 4) = c 1 + 0.15 + 0.25 0.1 + c 1 + 0.15 + 0.25 = 0.8 0.9 = 0.8889. Page 1/3
3 (3 points) There are 40 students in an elementary statistics class. On the basis of years of experience, the instructor knows that the time needed to grade a randomly chosen first examination paper is a random variable with an expected value of 6 min and a standard deviation of 6 min. If grading times are independent and the instructor begins grading at 6:50 P.M. and grades continuously, what is the probability that he is through grading before the 11:00 P.M. TV news begins? (Hint: apply Central Limit Theorem). Solution. Let X j = grading time for the j-th examination, j = 1,..., 40. From the conditions we know that X 1,..., X 40 are independent and all have a mean µ = E(X j ) = 6 and a standard deviation σ = 6. We find the probability as follows P (he is through grading before the 11:00 P.M) = P (X 1 +... + X 40 250 minutes) = P ( X 1 +... + X 40 40 = P ( X 6 6/ 40 25/4 6 6/ 40 ) = P (N(0, 1) 0.26) = 0.6026. 250 40 ) = P ( X 25/4) 4 (3 points) The random variable X takes values 0, 1, 2, 3. One did 4096 independent observations of X and got Observation 0 1 2 3 Antal 1764 1692 552 88 Test the hypothesis with a significance level 1% that X is a Binomial distribution Bin(3, 1 4 ), that is, H 0 : p 1 = P (X = 0), p 2 = P (X = 1), p 3 = P (X = 2), p 4 = P (X = 3). Solution. p 1 = P (Bin(3, 1 4 ) = 0) = 27/64,..., p 4 = P (Bin(3, 1 ) = 3) = 1/64. 4 4 (y i np i ) 2 T S = = 11.5, C = (χ 2 np 4 1,α, + ) = (11.35, + ). i i=1 Since T S C, reject H 0, namely, it is not Binomial distribution Bin(3, 1 4 ). 5 (3 points) In order to compare the efficacy of two different antihypertensive medications, we tested two groups with these two different medicines, where there are ten patients in each group. Blood pressure was measured after a month. Results: Sample mean x i Sample standard deviation s i Medicin 1: 21.1 7.26 Medicin 2: 10.8 5.23 Model: We have two independent samples from N(µ i, σ 2 ), i = 1, 2. (5.1). (1p) If σ is known and σ = 6, construct a 95% confidence interval for µ 1. (5.2). (2p) If σ is unknown, construct a 95% confidence interval for µ 1 µ 2. Solution. (5.1). Since σ = 6 is known, the CI is I µ1 = x 1 z α/2 σ 6 = 21.1 1.96 = (17.38, 24.82). n 10 Page 2/3
(5.2). where I µ1 µ 2 = ( x 1 x 2 ) t n1+n 2 2,α/2 s 1 n 1 + 1 n 2 = 10.3 2.101 6.327 0.447 = (4.355, 16.245) s 2 = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 = 40.03. 6 (3 points) We are interested in the true smoking rate p of all people in Sweden. A sample of 541 people is selected, and there are 120 people who are smokers. We want to answer the following question: Is there evidence for concluding that more than 20% people in Sweden smoke? (6.1). (1p) Write down appropriate hypotheses H 0 and H 1. (6.2). (2p) Is H 0 rejected with a level 0.05? Solution. (6.1). H 0 : p = 20% vs H a : p > 20%. (6.2) We can calculate the observed significance level as follows P (Bin(541, 0.2) 120) = 1 P (Bin(541, 0.2) 119) = 1 P (N(541 0.2, 541 0.2 (1 0.2)) 119 + 0.5) = 1 P (N(108.2, 86.56)) 119.5) 119.5 108.2 = 1 P (N(0, 1)) ) 86.56 = 1 P (N(0, 1)) 1.24) = 1 0.8925 = 0.1075. Since the observed significance level is NOT smaller than α = 0.05, we do NOT reject H 0. Page 3/3
Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 augusti 2015, kl. 8-12 Examinator: Xiangfeng Yang (Tel: 070 2234765). Vänligen svara på ENGELSKA om du kan. a. Tillåtna hjälpmedel: en räknare, Formelsamling och tabeller för TAIU06 Matematisk statistik. b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5. 1 (3 poäng) Svensk version Vid tillverkning av en typ av byggelement kan två slags fel A och B föreligga hos de tillverkade enheterna. Man vet att P (A) = 0.1, P (B) = 0.2 och P (A B) = 0.05. Beräkna sannolikheten att en tillverkad enhet har (1.1). (1p) åtminstone något av felen, (1.2). (1p) felet A men inte felet B, (1.3). (1p) exakt ett av felen A och B. 2 (3 poäng) Antag att en stokastisk variabel X har en sannolikhetsfunktion X 1 2 3 4 5 p(x) 0.1 c 1 0.15 0.25 c 2 (2.1). (1p) Om man vet P (X < 3) = 0.5, beräkna värdena c 1 =? and c 2 =? (2.2). (1p) Beräkna väntevärdet E(X) och variansen V ar(x). (2.3). (1p) Beräkna den betingade sannolikheten P (X 2 X 4). 3 (3 poäng) Det finns 40 elever i en elementär statistik klass. På grundval av många års erfarenhet, vet instruktören att den tid som behövs för att gradera en slumpmässigt vald första tentamen är en stokastisk variabel med ett väntevärd på 6 min och en standardavvikelse på 6 min. Om betygstider är oberoende och instruktören börjar gradering på 6:50 P.M. och graderar kontinuerligt, vad är sannolikheten att han avslutar gradering innan 11:00 P.M. TV-nyheter börjar? (Ledning: använd centrala gränsvärdessatsen). 4 (3 poäng) Den s.v. X antar värdena 0, 1, 2, 3. Man gjorde 4096 oberoende observationer av X och fick Observation 0 1 2 3 Antal 1764 1692 552 88 Pröva på signifikansnivån 1% hypotesen att X är Binomial fördelning Bin(3, 1 4 ), d.v.s. 5 (3 poäng) H 0 : p 1 = P (X = 0), p 2 = P (X = 1), p 3 = P (X = 2), p 4 = P (X = 3). För att jämföra effekten hos två olika blodtryckssänkande mediciner behandlas två grupper om vardera tio patienter med de olika medicinerna. Efter en månad mättes sänkningen av blodtrycket. Resultat: Page 1/2
Medelvärde x i Stickprovsstand.avvik s i Medicin 1: 21.1 7.26 Medicin 2: 10.8 5.23 Modell: Vi har två oberoende stickprov från N(µ i, σ 2 ), i = 1, 2. (5.1). (1p) Om σ är känd och σ = 6, konstruera ett 95% konfidensintervall för µ 1. (5.2). (2p) Om σ är okänd, konstruera ett 95% konfidensintervall för µ 1 µ 2. 6 (3 poäng) Vi är intresserade av verkliga andelen rökare p för alla människor i Sverige. Ett stickprov av 541 personer väljs, och det finns 120 personer som är rökare. Vi vill svara på följande fråga: Finns det belägg för slutsatsen att mer än 20% människor i Sverige röker? (6.1). (1p) Skriv lämpliga hypoteser H 0 och H 1. (6.2). (2p) Förkasta H 0 med nivån 0.05? Page 2/2