Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 01 June 2015, 8:00-12:00 Examiner: Xiangfeng Yang (Tel: 070 2234765). Please answer in ENGLISH if you can. a. Allowed to use: a calculator, Formelsamling och tabeller för TAIU06 Matematisk statistik. b. Scores rating: 8-11 points giving rate 3; 11.5-14.5 points giving rate 4; 15-18 points giving rate 5. 1 (3 points) English Version On an island in the Pacific 40% of the inhabitants have a skin disease which is related to psoriasis. It has been found that the concentration of the enzyme NZ2 is extremely low in these inhabitants with such disease. However, healthy persons could also have low enzyme NZ2 concentration. Studies show that 32% of the islanders have both skin disease and low enzyme NZ2 concentration (below a specified limit). Furthermore, we know that 38% of the islanders have low enzyme NZ2 concentration. (1.1). (1p) What is the probability that a randomly selected islander neither carries the skin disease nor has low enzyme NZ2 concentration? (1.2). (1p) What is the probability that an islander with low enzyme NZ2 concentration carries the skin disease? (1.3). (1p) What is the probability that a healthy islander has normal enzyme NZ2 concentration level (which is above the specified limit)? Solution. For the conditions, we know (1.1) (1.2) (1.3) P (disease low) = 32%, P (disease) = 40%, P (low) = 38%. P (disease low ) = 1 P (disease low) = 1 (P (disease) + P (low) P (disease low)) = 1 (40% + 38% 32%) = 54%. P (disease low) = P (disease low) P (low) P (low disease ) = P (low disease ) P (disease ) = 32%/38% = 0.84. = (from (1.1)) = 54%/(1 40%) = 0.9. 2 (3 points) The breaking strength X (with some unit) for metalon fibers have a probability density function f(x) = 4x 3, 0 < x < 1. (2.1). (1p) Find the mean E(X) and the variance V ar(x) for X. (2.2). (1p) Calculate the probability that the breaking strength of a fiber is less than 0.5. (2.3). (1p) One selects 12 fibers randomly. What is the probability that at least one fiber has a breaking strength less than 0.5? Page 1/4
Solution. (2.1) (2.2) (2.3) V ar(x) = µ = E(X) = 1 0 P (X < 0.5) = 1 0 x 4x 3 dx =... = 0.8. x 2 4x 3 dx µ 2 =... = 4/6 0.8 2 = 0.0267. 0.5 0 4x 3 dx =... = 0.5 4 = 0.0625. P (at lease one < 0.5) = 1 P (all 0.5) = 1 (P (one 0.5)) 12 = 1 (1 P (X < 0.5)) 12 = 1 (1 0.0625) 12 = 0.54. 3 (3 points) In an area there are a lot of flowers which are white, red or pink. We randomly pick up 100 flowers and get flowers frequency y i white 20 red 24 pink 56 Use χ 2 -test to test the following hypothesis with a significance level α = 0.05 H 0 : P (white flower) = 1/4; P (red flower) = 1/4; P (pink flower) = 1/2. Solution. The test statistic is T S = 3 (y i np i ) 2 = 1.76 np i where y 1 = 20, p 1 = 1/4; y 2 = 24, p 2 = 1/4; y 3 = 56, p 3 = 1/2. The rejection region is Since T S / C, don t reject H 0. i=1 C = (χ 2 3 1,α, ) = (χ 2 2,0.05, ) = (5.991, ). 4 (3 points) In the analysis of chloride, samples are taken at the top and bottom of a container with the following results (in %): Top: 26.32 26.38 26.33 26.39 Bottom: 26.28 26.25 26.38 Assume that these two samples are taken from two independent populations N(µ 1, σ 2 1) and N(µ 2, σ 2 2). Find a 95% confidence interval for µ 1 µ 2 under the following conditions: (4.1). (1.5p) σ 1 = 0.02 and σ 2 = 0.03. (4.2). (1.5p) σ 1 = σ 2 unknown. Solution. It can be easily computed that x = 26.355, s x = 0.0351; ȳ = 26.303, s y = 0.0681. Thus the combined sample standard deviation is s = (n s 2 1 1)s 2 x + (n 2 1)s 2 y = = 0.00256 = 0.051. n 1 + n 2 2 Page 2/4
(4.1) (4.2) I µ1 µ 2 = ( x ȳ) z α/2 I µ1 µ 2 = ( x ȳ) t n1+n 2 2,α/2 s σ 2 1 n 1 + σ2 2 n 2 = 0.052 0.0392 = (0.0128, 0.0912). 1 n 1 + 1 n 2 = 0.052 0.1 = ( 0.048, 0.152). 5 (3 points) The number of radiation particles coming from a radioactive source during a time interval of length t is assumed to be P o(λt), where λ is the number per second. During an interval of length 5 seconds, there are 14 radiation particles detected. Test the hypotheses H 0 : λ = 1.52 against H 1 : λ > 1.52 with a significance level α = 0.05. Solution. The observed significance level is P (X 14) = 1 P (X 13) = 1 P (P o(1.52 5) 13) = 1 P (P o(7.6) 13) = (table2) = 1 0.9762 = 0.0238. Since the observed significance level is < α, reject H 0. 6 (3 points) In studies of the crickets, it has been found that the frequency of the wing movements grows with temperature. A model for this is: y = α + β x + ε, ε N(0, σ 2 ), where x = temperature i F and y = number of oscillations per second. For 15 different temperatures x, the wing frequencies y are measured. The results are: x = 16.65, ȳ = 80.04, S xx = 40.558, S yy = 629.832, S xy = 133.476. (6.1). (1p) Find the estimated regression line y = ˆα + ˆβ x. (6.2). (1p) Test the hypotheses with a significance level α = 0.05, (6.3). (1p) Find a 95% confidence interval for β. H 0 : β = 0 against H 1 : β 0. Solution. (6.1) ˆβ = S xy /S xx = 133.476/40.558 = 3.29. ˆα = ȳ hatβ x = 80.04 3.29 16.65 = 25.26. y = 25.26 + 3.29 x. (6.2) The test statistic is where T S = ˆβ 0 ˆσ/ 3.29 = S xx 3.83/ 40.558, ˆσ 2 = 1 n 2 (S yy S2 xy S xx ) = 14.66, Page 3/4
and The rejection region is ˆσ = ˆσ 2 = 3.83. where n = 15. Since T S C, reject H 0. (6.3) C = (, t n 2,α/2 ) (t n 2,α/2, + ) = (, 2.16) (2.16, + ) I β = ˆβ t n 2,α/2 ˆσ Sxx = 3.29 1.3 = (1.99, 4.59). Page 4/4
Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 01 juni 2015, kl. 8-12 Examinator: Xiangfeng Yang (Tel: 070 2234765). Vänligen svara på ENGELSKA om du kan. a. Tillåtna hjälpmedel: en räknare, Formelsamling och tabeller för TAIU06 Matematisk statistik. b. Betygsgränser: 8-11 poäng ger betyg 3; 11.5-14.5 poäng ger betyg 4; 15-18 poäng ger betyg 5. 1 (3 poäng) Svensk version På en ö i Oceanien lider 40% av invånarna av en hudsjukdom som är besläktad med psoriasis. Man har funnit att halten av enzymet NZ2 är extremt låg hos många av de drabbade. Dock förekommer låga halter även hos friska personer. Studier visar att 32% av öborna har såväl sjukdom som låg halt av NZ2 (ligger under en specificerad gräns). Vidare vet man att 38% av befolkningen har nämnda låga enzymhalt. (1.1). (1p) Vad är sannolikheten för att en på måfå vald öbo varken bär på sjukdomen eller har låg enzymhalt? (1.2). (1p) Vad är sannolikheten att en öbo med låg enzymhalt bär på sjukdomen? (1.3). (1p) Vad är sannolikheten att en frisk öbo har normal enzymhalt (ligger ovanför den specificerade gränsen)? 2 (3 poäng) Brottstyrkan X (i viss enhet) för metalonfibrer har täthetsfunktionen f(x) = 4x 3, 0 < x < 1. (2.1). (1p) Bestäm väntevärde E(X) och varians V ar(x) för X. (2.2). (1p) Beräkna sannolikheten att brottstyrkan hos en fiber understiger 0.5. (2.3). (1p) Man väljer ut 12 fibrer slumpmässigt. Vad är sannolikheten att minst en fiber har en brottstyrka som understiger 0.5? 3 (3 poäng) I ett omr de finns det en hel del blommor som är vita, röda eller rosa. Vi hämtar slumpmässigt upp 100 blommor och få blommor frekvens y i vita 20 röda 24 rosa 56 Pröva med ett χ 2 -test på nivån α = 0.05 hypotesen H 0 : P (vit blomma) = 1/4; P (röd blomma) = 1/4; P (rosa blomma) = 1/2. 4 (3 poäng) Vid analys av kloridprov tagna längst upp och längst ned i en behållare erhölls följande (i %): Längst upp: 26.32 26.38 26.33 26.39 Längst ned: 26.28 26.25 26.38 Anta att de två mätserierna är oberoende stickprov på N(µ 1, σ 2 1) och N(µ 2, σ 2 2). Bilda ett 95% konfidensintervall för µ 1 µ 2 under följande förutsättningar: (4.1). (1.5p) σ 1 = 0.02 och σ 2 = 0.03. (4.2). (1.5p) σ 1 = σ 2 men okända. Page 1/2
5 (3 poäng) Antalet partiklar en radioaktiv strålningskälla utsänder under ett tidsintervall av längden t antas vara P o(λt), där λ är antalet per sekund. Under ett intervall av längden 5 sekunder har 14 utsända partiklar registrerats. Pröva hypotesen vid signifikansnivån α = 0.05. H 0 : λ = 1.52 mot H 1 : λ > 1.52 6 (3 poäng) Vid studier av syrsor har man funnit att frekvensen av vingrörelser växer med temperaturen. En modell för detta är: y = α + β x + ε, ε N(0, σ 2 ), där x = temperatur i F och y = antal svängningar per sekund. I femton temperaturkammare med skilda temperaturer x uppmättes vingfrekvensen y. Resultat: x = 16.65, ȳ = 80.04, S xx = 40.558, S yy = 629.832, S xy = 133.476. (6.1). (1p) Bestäm den skattade regressionslinjen y = ˆα + ˆβ x. (6.2). (1p) Pröva hypotesen vid signifikansnivån α = 0.05, (6.3). (1p) Bilda ett 95% konfidensintervall för β. H 0 : β = 0 mot H 1 : β 0. Page 2/2