Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00 Examiner: Xiangfeng Yang (Tel: 070 2234765). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and table collection edited by MAI. b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. 1 (3 points) English Version Using a certain method, one get a measurement Y = 1 + X, where the random variable X has a probability density function f(x) = 3(1 x2 ), for 1 x 1. 4 (1.1). (1p) Find the mean µ = E(Y ) of Y. (1.2). (2p) Find the standard deviation σ Y of Y. Solution. (1.1) E(X) = 1 1 xf(x)dx =... = 0. Thus (1.2) E(Y ) = E(1 + X) = 1 + E(X) = 1 + 0 = 1. V (X) = E(X 2 ) 0 2 = 1 1 x 2 f(x)dx 0 2 =... = 0.2. Thus V (Y ) = V (1 + X) = V (X) = 0.2. σ Y = V (Y ) = 0.2 = 0.447. 2 (3 points) The following data sets represent a sample from a Poisson distribution X P o(µ), where the mean µ is unknown. In the sample the observations are: {6, 5, 10, 8}. (2.1). (1p) Find a point estimate ˆµ MM of µ using the Method of Moments. (2.2). (2p) Find a pont estimate ˆµ ML of µ using Maximum-Likelihood method. Solution. (2.1). For Method of Moments, the first equation is E(X) = x. The mean E(X) can be calculated as E(X) = µ. By solving E(X) = x, we have µ = x which yields ˆµ MM = x = 6+5+10+8 4 = 7.25. (2.2). For the Maximum-Likelihood method, we write the likelihood function as L(µ) = e µ µ x1 x 1! e µ µ x2 x 2! e µ µ x3 x 3! e µ µ x4 x 4! = e 4µ µ x1+...+x4. x 1!... x 4! Page 1/4
Maximizing L(µ) is equivalent to maximize ln L(µ) where ln L(µ) = 4µ + (x 1 +... + x 4 ) ln µ ln(x 1!... x 4!). d ln L(µ) By dµ = 0, we have µ = x, therefore ˆµ ML = x = 7.25. (The second derivative d2 ln L(µ) dµ < 0 yields that ˆµ 2 ML is indeed a maximal point) 3 (3 points) A dice has been tossed for 120 times with the following result: Outcome: 1 2 3 4 5 6 Frequency: 15 27 18 12 25 23 Do the results show that the dice is unbalanced? In this case, some number will appear more often than others in the long run. Answer this question by, with a significance level 5%, testing the hypothesis (χ 2 ) H 0 : p i = 1/6, i = 1,..., 6. Solution. The test statistic is The rejection region i Since T S / C, don t reject H 0. T S = 6 i=1 (N i np i ) 2 np i = 8.8. C = (χ 2 6 1,α, ) = (11.07, ). 4 (3 points) In the analysis of chloride, samples are taken at the top and bottom of a container with the following results (in %): Top: 26.32 26.38 26.33 26.39 Bottom: 26.28 26.25 26.38 Assume that these two samples are taken from two independent populations N(µ 1, σ 1 ) and N(µ 2, σ 2 ). (4.1). (1p) If σ 1 = σ 2 = σ are unknown, find a 95% confidence interval for σ. (4.2). (1p) If σ 1 = σ 2 = σ are unknown, find a 95% confidence interval for µ 1 µ 2. (4.3). (1p) Test the hypotheses with a significance level α = 0.01 : Solution. It can be easily computed that H 0 : µ 1 = µ 2 against H 1 : µ 1 µ 2. x = 26.355, s x = 0.0351; ȳ = 26.303, s y = 0.0681. Thus the combined sample standard deviation is s = (n s 2 1 1)s 2 x + (n 2 1)s 2 y = = 0.00256 = 0.051. n 1 + n 2 2 (4.1) (4.2) (4.3) Since T S / C, don t reject H 0. I σ 2 = ( (n 1 + n 2 2)s 2 χ 2 α/2 (n 1 + n 2 2), (n 1 + n 2 2)s 2 χ 2 1 α/2 (n ) = (0.000997, 0.0154). 1 + n 2 2) I µ1 µ 2 = ( x ȳ) t α/2 (n 1 + n 2 2) s 1 n 1 + 1 n 2 = 0.052 0.1 = ( 0.048, 0.152). ( x ȳ) 0 T S = = 1.335. 1 s n 1 + 1 n 2 C = (, t α/2 (n 1 + n 2 2)) (t α/2 (n 1 + n 2 2), + ) = (, 4.03) (4.03, + ). Page 2/4
5 (3 points) The raw material for a given drug can be produced in a biological process. The final product from this process is a solution whose content of the active substance is a random variable which is normally distributed with mean 31 and standard deviation 1.25. (5.1). (1p) Find P (30 X 32), where X is the content of the active substance in the solution from one production process. (5.2). (2p) To get more consistent quality, one try to mix solutions of n production processes. The content of active substance then becomes a random variable X = X1+X2+...+Xn n. How should one choose n if one wants that the condition P (30 X 32) = 0.95 is satisfied? Solution. (5.1) P (30 X 32) = P ((30 µ)/σ (X µ)/σ (32 µ)/σ) = P ((30 31)/1.25 N(0, 1) (32 1)/1.25) = 0.58. (5.2) From the table, 0.95 = P (30 X 32) = P ( 30 µ σ/ n X µ σ/ n 32 µ σ/ n ) = P ( 1 1.25/ n N(0, 1) 1 1.25/ n ). thus n = (1.96 1.25) 2 = 6. 1 1.25/ n = 1.96, 6 (3 points) In studies of the crickets, it has been found that the frequency of the wing movements grows with temperature. A model for this is: Y = β 0 + β 1 x + ε, ε N(0, σ), where x = temperature in F and y = number of oscillations per second. For 15 different temperatures x, the wing frequencies y are measured. The results are: Regression Analysis: y versus x The regression equation is y = 25.2 + 3.29 x Predictor Coef SE Coef T P Constant 25.23 10.06 2.51 0.026 x 3.2911 0.6012 5.47 0.000 Analysis of Variance Source DF SS MS F P Regression 1 439.29 439.29 29.97 0.000 Residual Error 13 190.55 14.66 Total 14 629.84 (6.1). (1p) Estimate σ. (6.2). (1p) Find a 95% confidence interval for β 1. (6.3). (1p) Test the hypotheses with a significance level α = 0.01, H 0 : β 1 = 0 against H 1 : β 1 > 0. Solution. (6.1). σ ˆσ = s = s 2 = SS E /(n k 1) = 190.55/13 = 14.658 = 3.83. (6.2). I β1 = ˆβ 1 t 0.025 (15 2) se(β 1 ) = 3.2911 2.16 0.6012 = (1.99, 4.59). (6.3). T S = ˆβ 1 0 se(β 1 ) = 3.2911 0 = 5.47, 0.6012 Page 3/4
Since T S C, reject H 0. C = (t α (n 2), + ) = (t 0.01 (15 2), + ) = (2.65, + ). Page 4/4
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 juni 2015, kl. 14-18 Examinator: Xiangfeng Yang (Tel: 070 2234765). Vänligen svara på ENGELSKA om du kan. a. Tillåtna hjälpmedel är en räknare, formel -och tabellsamling utgiven av MAI. b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5. 1 (3 poäng) Svensk version Vid användning av en viss mätmetod får man ett mätvärde Y = 1 + X, där den s.v. X har täthetsfunktion (1.1). (1p) Bestäm väntevärdet µ = E(Y ) av Y. (1.2). (2p) Bestäm standardavvikelsen σ Y av Y. 2 (3 poäng) f(x) = 3(1 x2 ), för 1 x 1. 4 Följande datamaterial utgör ett stickprov från en Poisson fördelning X P o(µ), där väntevärdet µ är okänd. I stickprovet har man observerade värden: {6, 5, 10, 8}. (2.1). (1p) Hitta en punktskattning ˆµ MM av µ genom att använda momentmetoden. (2.2). (2p) Hitta en punktskattning ˆµ ML av µ genom att använda Maximum Likelihood-metoden. 3 (3 poäng) En tärning har kastats 120 gånger med nedanstående resultat: Utfall: 1 2 3 4 5 6 Frekvens: 15 27 18 12 25 23 Tyder resultatet på att tärning är obalanserad, så att den i det långa loppet ger vissa utfall oftare än andra? Besvara frågan genom att på nivån 5% pröva (χ 2 ) H 0 : p i = 1/6, i = 1,..., 6. 4 (3 poäng) Vid analys av kloridprov tagna längst upp och längst ned i en behållare erhölls följande (i %): Längst upp: 26.32 26.38 26.33 26.39 Längst ned: 26.28 26.25 26.38 Anta att de två mätserierna är oberoende stickprov på N(µ 1, σ 1 ) och N(µ 2, σ 2 ). (4.1). (1p) Om σ 1 = σ 2 = σ okända, bilda ett 95% konfidensintervall för σ. (4.2). (1p) Om σ 1 = σ 2 = σ okända, bilda ett 95% konfidensintervall för µ 1 µ 2. (4.3). (1p) Pröva hypotesen vid signifikansnivån α = 0.01 : H 0 : µ 1 = µ 2 mot H 1 : µ 1 µ 2. Page 1/2
5 (3 poäng) Råvaran till ett visst läkemedel framställs i en biologisk process. Slutprodukten från denna process är en lösning, vars halt av den aktiva substansen är en stokastisk variabel, som är normalfördelad med väntevärde 31 och standardavvikelse 1.25. (5.1). (1p) Beräkna P (30 X 32), där X är halten av den aktiva substansen i lösningen från en tillverkningsomgång. (5.2). (2p) För att få jämnare kvalitet tänker man blanda lösningar från n tillverkningsomgångar. Halten av den aktiva substansen blir då en stokastisk variabel X = X 1+X 2+...+X n n. Hur ska man välja n om man vill att villkoret P (30 X 32) = 0.95 ska vara uppfyllt? 6 (3 poäng) Vid studier av syrsor har man funnit att frekvensen av vingrörelser växer med temperaturen. En modell för detta är: Y = β 0 + β 1 x + ε, ε N(0, σ), där x = temperatur i F och y = antal svängningar per sekund. I femton temperaturkammare med skilda temperaturer x uppmättes vingfrekvensen y. Analyserna från Minitab är: Regression Analysis: y versus x The regression equation is y = 25.2 + 3.29 x Predictor Coef SE Coef T P Constant 25.23 10.06 2.51 0.026 x 3.2911 0.6012 5.47 0.000 Analysis of Variance Source DF SS MS F P Regression 1 439.29 439.29 29.97 0.000 Residual Error 13 190.55 14.66 Total 14 629.84 (6.1). (1p) Skatta σ. (6.2). (1p) Bilda ett 95% konfidensintervall för β 1. (6.3). (1p) Pröva hypotesen vid signifikansnivån α = 0.01, H 0 : β 1 = 0 mot H 1 : β 1 > 0. Page 2/2