Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and table collection edited by MAI. b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. 1 (3 points) A random variable X has the probability mass funtion English Version X 1 1 f(x).3.6.1 (1.1). (1p) Find the probability P (X )? (1.2). (1p) Find the mean µ = E(X) of the random variable X. (1.3). (1p) Find the variance σ 2 = V (X) of the random variable X. Solution. (1.1). P (X ) =.3 +.6 =.9. (1.2). µ = E(X) = ( 1).3 +.6 + 1.1 =.2. (1.3). σ 2 = V (X) = E(X 2 ) (E(X)) 2 = ( 1) 2.3 + 2.6 + 1 2.1 (.2) 2 =.36. 2 (3 points) The number of customers to a company during a day can be assumed to be a random variable with the following probability mass function:.1 för x =.2 för x = 1 P (X = x) =.3 för x = 2.3 för x = 3.1 för x = 4 The number of customers can be assumed to be independent in different days. Calculate the probability that there are at least 8 customers during 5 days. (Hint: use the central limit theorem). Solution. Let {,..., X 5 } be the customers of these 5 days. From CLT, it follows P ( +... + X 5 8) = P ( X 8/5) = P ( X µ σ/ n 8/5 µ σ/ ) P (N(, 1) 3.11) n = P (N(, 1) 3.11) =.9991. Where n = 5 µ =.1 + 1.2 +... + 4.1 = 2.1 σ 2 = 2.1 + 1 2.2 +... + 4 2.1 (2.1) 2 1.29 σ 1.14. Page 1/3
3 (3 points) Suppose that the distribution of a population has the probability density function f(x) = θ 2 xe θx om < x < ; where θ > is an unknown parameter. A sample {x 1, x 2,..., x n } from this population is now given. (3.1). (1.5p) Find a point estimate ˆθ MM of θ using the Method of Moments. (3.2). (1.5p) Find a point estimate ˆθ ML of θ using the Maximum-Likelihood method. Solution. (3.1). By the Method of Moments, the first equation is E(X) = x. E(X) = x θ 2 xe θx dx = = 2 θ. By solving E(X) = x, we have ˆθ MM = 2 x. (3.2). By the Maximum-Likelihood method, we write the likelihood function as L(θ) = f(x 1 ) f(x 2 )... f(x n ) = θ 2n (x 1... x n )e θ(x1+x2+...+xn). Maximizing L(θ) is equivalent to maximize ln L(θ) where d ln L(θ) ln L(θ) = 2n ln(θ) + ln(x 1... x n ) θ(x 1 + x 2 +... + x n ). By dθ =, we have 2n θ (x 1 + x 2 +... + x n ) =, therefore ˆθ ML = 2 x. (The second derivative d2 ln L(θ) dθ < which yields that ˆθ 2 ML is indeed a maximal point) 4 (3 points) One has seven observations from X N(µ 1, σ), and nine observations from Y N(µ 2, 2σ). grupper observationer 1. 1.4 8.7 9.9 9. 9.2 1.4 8.8 2. 11.3 12.7 12.1 9.4 9.8 13.4 11. 12.6 1.9 (4.1). (2p) Construct a (two-sided) 95% confidence interval for σ. (Hint: let Z = Y 2, then Z N(µ 2/2, σ). (4.2). (1p) Test the hypotheses with a significance level α = 5%: H : µ 1 = 1 versus H 1 : µ 1 < 1. Solution. (4.1). According to the data, we get x = 9.49 and s 2 X =.54. Let Z = Y 2, then we have observations from Z are: 11.3/2, 12.7/2, 12.1/2, 9.4/2, 9.8/2, 13.4/2, 11./2, 12.6/2, 1.9/2. Thus we get z = 5.73 and s 2 Z =.46. Since population standard deviation σ is related to two populations X, Z, the confidence interval for σ 2 is Where Therefore the confidence interval for σ is I σ 2 = ( (n X + n Z 2)s 2 χ 2 α/2 (n X + n Z 2), (n X + n Z 2)s 2 χ 2 1 α/2 (n ) = (.26 1.22). X + n Z 2) n X = 7 n Z = 9 (4.2). Since σ is unknown, the rejection region is s 2 = (n X 1)s 2 X + (n Z 1)s 2 Z n X + n Z 2 χ 2 α/2 (n X + n Z 2) = 26.13 χ 2 1 α/2 (n X + n Z 2) = 5.62. I σ = (.51, 1.1). =.49 (, t α (n X + n Z 2)) = (, 1.76). The test statistic is x µ s/ n = 9.49 1.49/ 7 = 1.93. Because the test statistic is in the rejection region, we reject H. Page 2/3
5 (3 points) People studied the life time of a certain component and started to use 15 components at the same time. After 1 time units, 15 componens worked. After 2 time units 65 components worked and after 3 time units 3 components worked. Prove by χ 2 - test with significance level α = 5% on the hypothesis H : the life time of a component is Exp(2). Solution. Let X be the life time of the certain component, then we have the following: where T S = goups X < 1 1 < X < 2 2 < X < 3 X > 3 N i 45 4 35 3 p i.39.24.15.22 np i 59. 35.8 21.7 33.5 p 1 = 1 4 (N i np i ) 2 i=1 Since T S C, reject H, namely, it is not Exp(2). n = 15 N 1 = 15 15 = 45, N 2 =... 1 2 exp x 2 dx,..., p4 = 3 1 2 exp x 2 dx np i = 12.33, C = (χ 2.5(4 1 ), + ) = (7.82, + ). 6 (3 points) The normal random vector X = X 2 has a mean vector and a covariance matrix 1 respective 25 (6.1). (.5p) Is and X 2 are independent? Why? (6.2). (.5p) Is and are independent? Why? (6.3). (2p) Find P (X 2 > ). 1 8 8 1 1. 1 8 Solution. (6.1). and X 2 are NOT independent since their covariance is not but 8. (6.2). and are independent since they are normal distributions and their covariance is. (6.3). We can write X 2 as X 2 = A X 2, where the matrix A = ( 1 1 ). Thus the mean vector for X 2 is The variance for X 2 is So X 2 N(1, 4), then we get µ X2 = Aµ X = 1. V X2 = AC X A = 4. P (X 2 > ) = P (X 2 > ) = P (N(, 1) > 1 4 ) = Φ(1.58) =.9429. Page 3/3
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 juni 217, kl. 14-18 Examinator: Zhenxia Liu (Tel: 7 89528). Vänligen svara på ENGELSKA om du kan. a. Tillåtna hjälpmedel är en räknare, formel -och tabellsamling utgiven av MAI. b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5. 1 (3 poäng) En stokastisk variabel X har sannolikheten Svensk version X 1 1 f(x).3.6.1 (1.1). (1p) Beräkna sannolikheten P (X )? (1.2). (1p) Beräkna väntevärdet µ = E(X) för den stokastiska variabeln X. (1.3). (1p) Beräkna variansen σ 2 = V (X) för den stokastiska variabeln X. 2 (3 poäng) Antalet kunder till en firma under en dag är en stokastisk variabel med följande sannolikhetsfunktion:.1 för x =.2 för x = 1 P (X = x) =.3 för x = 2.3 för x = 3.1 för x = 4 Antalet kunder under olika dagar kan anses oberoende. Beräkna sannolikheten för att minst 8 kunder tas emot av firman under 5 dagar. (Ledning: använd centrala gränsvärdessatsen). 3 (3 poäng) Antag att fördelningen för en population har täthetsfunktionen f(x) = θ 2 xe θx om < x < ; där θ > är en okänd parameter. {x 1, x 2,..., x n } är ett stickprov från populationen. (3.1). (1.5p) Hitta en punktskattning ˆθ MM av θ genom att använda momentmetoden. (3.2). (1.5p) Hitta en punktskattning ˆθ ML av θ genom att använda Maximum-Likelihood-metoden. 4 (3 poäng) Man har sju observationer frå X N(µ 1, σ), och nio observationer från Y N(µ 2, 2σ). (4.1). (1p) Pröva på nivån α = 5%: grupper observationer 1. 1.4 8.7 9.9 9. 9.2 1.4 8.8 2. 11.3 12.7 12.1 9.4 9.8 13.4 11. 12.6 1.9 H : µ 1 = 1 mot H 1 : µ 1 < 1. (4.2). (2p) Konstruera ett (tvåsidiga) 95% konfidensintervall för σ. (Ledning: låt Z = Y 2, då Z N(µ 2/2, σ). Page 1/2
5 (3 poäng) Man studerade livslängden hos en viss typ av komponenter och började använda samtidigt 15 komponenter. Efter 1 tidsenheter fungerade 15 komponenter, efter 2 tidsenheter 65 komponenter och efter 3 tidsenheter 3 komponenter. Pröva med χ 2 - test på nivån α = 5% hypotesen 6 (3 poäng) H : livslängden hos en komponent är Exp(2). Den stokastiska variabeln X = X 2 har en tredimensionell normalfördelning med väntevärdesvektor och kovariansmatris 1 8 1 respektive 8 1 1. 25 1 8 (6.1). (.5p) Är och X 2 oberoende? Varför? (6.2). (.5p) Är och oberoende? Varför? (6.3). (2p) Beräkna P (X 2 > ). Page 2/2