Kurskod: TAMS24 / Provkod: TEN 25-8-7 (8: - 2:) Examinator/Examiner: Xiangfeng Yang (Tel: 7 2234765). Please answer in ENGLISH if you can. a. You are permitted to bring: a calculator; formel -och tabellsamling i matematisk statistik (from MAI); TAMS24: Notations and Formulas (by Xiangfeng Yang) b. Scores rating: 8- points giving rate 3;.5-4.5 points giving rate 4; 5-8 points giving rate 5.. (3 points) English English Version The surface roughness was determined for four different materials used for encapsulation. Results are: Material surface roughness x i s i Type.5.55.55.36.49.898 Type 2.3.7.25.8.56.2.267.665 Type 3.2.28.2.2.8 Type 4..6.3.424 Assume that these four samples are from independent normal distributions with a same variance σ 2. (.). (.5p) Construct a confidence interval for σ 2 with confidence coefficient.95. (.2). (.5p) If we assume that σ is known and σ =., then is it reasonable to conclude that µ > µ 4? Answer the question by constructing an appropriate confidence interval with confidence coefficient.95. Solution. (.). s 2 = (n )s 2 +... + (n 4 )s 2 4 n +... + n 4 4 ( ) (n +... + n 4 4)s 2 I σ 2 = χ 2 α/2 (n +... + n 4 4), (n +... + n 4 4)s 2 χ 2 α/2 (n = +... + n 4 4) =.6. ( ).6 2.93,.6 = (.83,.462). 3.8 (.2). There are two ways to solve the problem. The first one is: I µ µ 4 = ( x x 4 ) λ α/2 σ + n n 4 = (.49.3).96. 4 + =.36.7 = (.9,.53). 2 The second one (which is better) is one-sided CI: Both ways suggest µ > µ 4. I µ µ 4 = (, ( x x 4 ) + λ α σ n + n 4 ) =... 2. (3 points) English The random variable X is Rayleigh-distributed if it has a probability density function f X (x) = x a e x2 2a, for x, where a is an unknown positive parameter. One has a sample {x,..., x n } from this distribution. (2.). (p) Find a point estimate â ML of a using Maximum Likelihood-method. (2.2). (p) Is â ML unbiased? (2.3). (p) Find a point estimate â MM of a using method of moments. Page /4
Solution. (2.). L(a) = x a x 2 e x n 2a... a x 2 e n 2a = x... x n a n e x 2 +...+x2 n 2a. Thus = ln L(a) gives We can then solve for a and obtain ln L(a) = ln(x... x n ) n ln(a) x2 +... + x 2 n. 2a n/a + x2 +... + x 2 n 2a 2 =. â ML = x2 +... + x 2 n. 2n The second derivative test can prove that this is indeed a maximum. (2.2). We can compute Thus that is, â ML is unbiased. (2.3). E(X 2 ) = x 2 x a 2 e x /(2a) dx =... = 2a. E(ÂML) = E( X2 +... + Xn 2 ) = n 2a/(2n) = a, 2n E(X) = It now follows from E(X) = x that â MM = 2 x 2 /π. x x a 2 e x /(2a) dx =... = πa/2. 3. (3 points) English Extensive experience shows that if a certain disease is treated in the traditional way, then the probability p that the patient recovers is only.6. Now there is a new medicine against the disease. In a treatment experiment, there were 68 recovered out of patients using this new medicine. (3.). (2p) Is H rejected with a significance level α =.5? H : p =.6 versus H : p >.6. (3.2). (p) For the test in (3.), what is the power if p =.8? Solution. (3.). Since T S / C, don t reject H. (3.2). T S = ˆp p p ( p )/n = 68/.6 =.63..6(.6)/ C = (λ α, + ) = (.645, + ). h(.8) = P (reject H when H is wrong and p =.8) ˆp p = P ( >.645 when p =.8) p ( p )/n ˆp p (need to change p ( p )/n to ˆp p ˆp p since N(, )) p( p)/n p( p)/n = P ( ˆp p + p p p( p)/n ˆp p = P ( >.645 p( p)/n p( p) >.645 when p =.8) p ( p ) p ( p ) p( p) p p p( p)/n when p =.8) = P (Z > 2.985) =.9986. Page 2/4
4. (3 points) English Assume that X, X 2 and X 3 are independent standard normal random variables N(, ). The random vector Y = Y Y 2 Y 3 is defined as Y = X + X 2, Y 2 = X + X 3, Y 3 = X 2 + X 3. (4.). (2p) Determine the mean vector and the covariance matrix for Y (4.2). (p) Find P (2Y > Y 2 + 2). Solution. (4.). It is known that Thus for Y = AX with we have (4.2). X X = X 2, µ X =, C X =. X 3 µ Y = Aµ Y = A =,, C Y = AC Y A T = 2 2. 2 P (2Y > Y 2 + 2) = P (2X + 2X 2 > X + X 3 + 2) = P (X + 2X 2 X 3 > 2) = P (N(, 6) > 2) = P (N(, ) > 2/ 6) =.7939 =.26. 5. (3 points) English In a study, one observes the time (y) until a stimulus causes a reaction of the nerve fibers in a muscle. One suspect that the reaction time depends on the age (x ) and possibly also the gender (x 2 = for woman and x 2 = for man). Now we have 2 observations, and the data has be analyzed by two models Modell : Y = β + β x + β 2 x 2 + ε, Modell 2 : Y = β + β x + β 2 x 2 + β 3 x 2 + ε, where ε and ε are independent N(, σ) with the following results. Note that the parameters β i and are different in these two models. Model : Estimated regression line: y = 2.24 +.55x 3.85x 2 2.2376 3.2.553.777 2-3.853 2.9775 Degrees of freedom Sum of squares REGR 2 67.6 RES 8 572.7 TOT 2 28.3 Modell 2: Estimated regression line: y = 92.89 +.58x.x 2.3x 2 92.899 9.4.58.4623 2 -.8.52 3 -.362 2.97 Degrees of freedom Sum of squares REGR 3 739.2 RES 7 44. TOT 2 28.3 (5.). (.5p) In Model, is there any useful explanatory variable? or both variables are useless? Perform appropriate tests with a level.5. (5.2). (.5p) Does Model 2 give a better description of the data than Model? Perform appropriate tests or confidence intervals with a level.5. Page 3/4
Solution. (5.). H : β = β 2 =, H : at least one β i, i =, 2. T S = SS R/2 SS E /8 = 25.26, C = (F.5(2, 8), + ) = (3.55, + ). Since T S C, reject H. Yes, there must be some useful explanatory variable! (5.2). H : β 2 =, H : β 2. Method (F -test): T S = (SS() E SS(2) E )/ Since T S C, reject H, namely, Model 2 is better. Method 2 (t-test): SS (2) E /7 = 5.7, C = (F.5 (, 7), + ) = (4.45, + ). T S = ˆβ 2 d( ˆβ 2 ) = 2.27, C = (, t α/2(7)) (t α/2 (7), + ) = (, 2.) (2., + ). Since T S C, reject H, namely, Model 2 is better. 6. (3 points) English The random variable X takes values,, 2, 3. One did 496 independent observations of X and got Observation 2 3 Antal 764 692 552 88 Test the hypothesis with a significance level % that X is a Binomial distribution Bin(3, 4 ). Solution. p = P (Bin(3, 4 ) = ) = 27/64,..., p 4 = P (Bin(3, ) = 3) = /64. 4 4 (N i np i ) 2 T S = =.5, C = (χ 2 np α(4 ), + ) = (.35, + ). i i= Since T S C, reject H, namely, it is not Binomial distribution Bin(3, 4 ). Page 4/4
. (3 poäng) Svenska Svensk Version Ytojämnheten har bestämts fär fyra olika material som används för inkapsling. Resultat är: Material Ytojämnhet x i s i Typ.5.55.55.36.49.898 Typ 2.3.7.25.8.56.2.267.665 Typ 3.2.28.2.2.8 Typ 4..6.3.424 Anta att datamaterialet härrör från oberoende normalfördelning med samma varians σ 2. (.). (.5p) konstruera ett konfidensintervall för σ 2 och med konfidensgraden.95. (.). (.5p) Om vi antar att σ är känd och σ =., förefaller det troligt att µ > µ 4? Besvara frågan genom att konstruera ett lämpligt konfidensintervall med konfidensgraden.95. 2. (3 poäng) Svenska Den s.v. X ä Rayleigh-fördelad med täthetsfunktionen f X (x) = x a e x2 2a, för x, där a är okänd positiv parameter. Man har ett stickprov {x,..., x n } från denna fördelning. (2.). (p) Hitta en punktskattning â ML av a genom att använda Maximum Likelihood-metoden. (2.2). (p) Är â ML väntevärdesriktig? (2.3). (p) Hitta en punktskattning â MM av a genom att använda momentmetoden. 3. (3 poäng) Svenska Lång erfarenhet visar att om en viss sjukdom behandlas på traditionellt sätt, så är sannolikheten p att patienten tillfrisknar bara.6. I en inledande studie för en ny medicin mot den aktuella sjukdomen har man behandlat patienter och 68 av dem blev friska. (3.). (2p) Förkasta H på nivån α =.5? (3.2). (p) Vilken styrka har testet i (3.) för p =.8? H : p =.6 mot H : p >.6. 4. (3 poäng) Svenska Antag att X, X 2 och X 3 är oberoende standard normalfördelad N(, ). Den stokastiska variabeln Y = Y är Y = X + X 2, Y 2 = X + X 3, Y 3 = X 2 + X 3. (4.). (2p) Bestäm väntevärdesmatris och kovariansmatris för Y (4.2). (p) Beräkna P (2Y > Y 2 + 2). 5. (3 poäng) Svenska Vid en studie undersökte man tiden (y) tills en stimulans åstadkommer en reaktion hos nervtrådarna i en muskel. Man misstänker att reaktionstiden beror på försökspersonens ålder (x ) och möjligen också kön (x 2 = för kvinna och x 2 = för man). Nu har vi 2 observationer, och data har analyserats enligt två modeller Modell : Y = β + β x + β 2 x 2 + ε, Modell 2 : Y = β + β x + β 2 x 2 + β 3 x 2 + ε, där ε och ε är oberoende N(, σ) med följande resultat. Observera att det är olika parametrar β i och i de två modellerna. Y 2 Y 3 Page /2
Modell : Skattad regressionslinje: y = 2.24 +.55x 3.85x 2 2.2376 3.2.553.777 2-3.853 2.9775 Frihetsgrader Kvadratsumma REGR 2 67.6 RES 8 572.7 TOT 2 28.3 Modell 2: Skattad regressionslinje: y = 92.89 +.58x.x 2.3x 2 92.899 9.4.58.4623 2 -.8.52 3 -.362 2.97 Frihetsgrader Kvadratsumma REGR 3 739.2 RES 7 44. TOT 2 28.3 (5.). (.5p) I Modell, gör någon förklaringsvariabel nytta eller är båda meningslösa? Genomför lämpligt test på nivån.5. (5.2). (.5p) Ger Modell 2 en bättre beskrivning av datamaterialet än Modell? Genomför lämpligt test eller konfidensintervall på nivån.5. 6. (3 poäng) Svenska Den s.v. X antar värdena,, 2, 3. Man gjorde 496 oberoende observationer av X och fick Observation 2 3 Antal 764 692 552 88 Pröva på signifikansnivån % hypotesen att X är Binomial fördelning Bin(3, 4 ). Page 2/2