UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för teknologer, MSTA33, p Statistik för kemister, MSTA19, p TENTAMEN 2004-06-03 TENTAMEN I MATEMATISK STATISTIK Statistik för teknologer, poäng Skrivtid: 9.00-1.00 Tillåtna hjälpmedel: utdelad tabellsamling, valfri miniräknare med nollställt minne, egenhändigt författat formelblad (A4-format). Studenterna får behålla tentamensuppgifterna. Betygsgränser (teknologer):. poäng för 3, 14 poäng för 4 och 17. poäng för. Betygsgränser (kemister):. poäng för G och 1.7 poäng för VG. 1. För att förhindra snatteri har en affär infört att kunderna vägs på en våg vid affärens ingång och på en annan våg strax innan utgången. Om vikten vid utgången överstiger vikten vid ingången med mer än 20 gram uppmanas kunden att återvända till affären för att lätta på sin vikt. Om däremot differensen (utgångsvikt ingångsvikt) understiger 20 gram släpps kunden fram till kassan. Antag att båda vågarna har ett slumpmässigt fel som är normalfördelat med väntevärde 0 och standardavvikelse 6 gram samt att felen vid olika vägningar är oberoende. a) Vad är sannolikheten att en oskyldig kund, som inte har snattat något, ändå får en viktdifferens som överstiger 20 gram? (1. p) b) Vad är sannolikheten att en person som snattat en chokladbit som väger 30 gram, fastnar i kontrollen? (1. p) Lösning uppgift 1: a) Låt X = ingångsvikt och Y = utgångsvikt. 2 Y X N(0, 6 2 + 6 ). Y X 20 P ( Y X > 20) = P( > ) = 1 Φ(2,36) = 1 0,99086 0,009. 72 72 b) (30, 6 2 2 Y X 20 30 Y X N + 6 ). P ( Y X > 20) = P( > ) = 1 Φ( 1,18) = Φ(1,18) 0,881. 72 72 2. Anta att SARS (svår akut respiratorisk sjukdom) orsakar feber i 9 fall av 0. I en viss population vet man också att en på 7 individer har SARS och att en på 00 individ har feber. a) Om en individ i populationen inte har SARS, vad är då sannolikheten att denna individ är feberfri? (1 p) b) Vad är sannolikheten att en individ i populationen både har SARS och är feberfri? (1 p)
c) Om en individ i denna population har feber, vad är då sannolikheten att det är SARS som orsakar den. (1 p) Lösning uppgift 2: Vi har P(SARS) = -7, P(Feber) = - 3, P(Feber SARS) = 0.9. P(Feber SARS) = P(Feber SARS) P(SARS) = -7 0.9 Vi kan fylla i detta i en korstabell: SARS Ej SARS totalt Feber 0.9* -7-3 Ej Feber totalt -7 1 De tomma rutorna i korstabellen kan vi nu fylla i: SARS Ej SARS totalt Feber 0.9* -7-3 -0.9* -7-3 Ej Feber (1-0.9)* - 7 1- -3 -(1-1- -3 0.9)* -7 totalt -7 1- -7 1 a) P(ej Feber ej SARS) = P(ej Feber ej SARS) /P(ej SARS) = 1- -3 -(1-0.9)* -7 /1- -7 = 0.34889. b) P(SARS ej Feber) = (1-0.9)* -7. c) P(SARS Feber) = P(SARS Feber) / P(Feber) = 0.9* -7 / -3 = 9.* -. 3. Tio individer har deltagit i ett program för att stimulera viktminskning. Deras vikt före och efter deltagandet i programmet redovisas i tabellen nedan. Om vi antar att den i:te individens vikt före behandling är 2 N( µ i, σ1 ), i = 1,2,..., och efter behandlingen 2 N( µ i + d, σ2 ), i = 1,2,..., a) bestäm ett 9%-igt konfidensintervall för d. (2 p) b) Har viktminskningsprogrammet någon effekt? (1 p) Individ Vikt före Vikt efter 1 64 62 2 84 80 3 71 72 4 6 98 89 6 63 63 7 67 68 8 77 74 9 6 82 81
Lösning uppgift 3: a) Paired T for Vikt efter - Vikt före N Mean StDev SE Mean Vikt efter 70.0000 11.246 3.90 Vikt före 71.7000 13.814 4.2948 Difference -1.70000 3.09300 0.97809 9% CI for mean difference d: (-3.91260; 0.1260) b) Eftersom 0 finns i intervallet ovan kan vi inte förkasta H 0 :Programmet har ingen effekt Alternativt kan detta testas med T-Test: T-Value = -1.74 P-Value = 0.116 4. Antag att X har följande diskreta sannolikhetsfördelning 1/ 3 för x = 1,2,3 p (x) = 0 annars X observeras n=36 gånger och medelvärdet beräknas. Bestäm approximativt sannolikheten att medelvärdet är större än 2.1 men mindre än 2.. (3 p) Lösning uppgift. 4: Utnyttja CGS, dvs medelvärdet är ungefär N(µ, σ 2 /n) om n 30. µ = 1*1/3 +2*1/3 + 3*1/3 = 2 σ 2 = (1-2) 2 *1/3 + (2-2) 2 *1/3 +(3-2) 2 *1/3 = 2/3 P(2.1 < medelvärdet < 2.) = [standardiserar] P((2.1-2)/ sqrt((2/3)/36) < Z < (2.-2)/sqrt((2/3)/36)) = P(0.73 < Z < 3.67) = Φ(3.67) - Φ(0.73) = 1-0.7673 = 0.2327. En ny policy för sjuka skall införas inom ett stort företag. För att undersöka inställningen till denna policy gjordes en stickprovsundersökning med följande resultat: Positiv Negativ Vet ej Män 23 6 6 Kvinnor 42 36 8 Är reaktionen på den nya policyn oberoende av arbetstagarnas kön? (3 p)
Lösning uppgift : 1 2 3 All 1 23 6 6 3 18.80 12.1 4.0 3.00 2 42 36 8 86 46.20 29.8 9.9 86.00 All 6 42 14 121 6.00 42.00 14.00 121.00 Chi-Square = 7.019; DF = 2; P-Value = 0.030 Ho: förkastas på % nivån men ej på 1%-nivån 6. Man har bestämt draghållfastheten hos provkroppar av stål för två olika legeringar och fått följande data: Legering A 13 1 18 113 131 144 141 Legering B 111 128 82 1 99 132 Antag att båda våra observationsserier är normalfördelade med samma varians. a) Skatta median och medelvärde för respektive legering samt skatta legeringarnas gemensamma standardavvikelse. (1 p) b) Testa, med ett tvåsidigt test på signifikansnivån en procent, hypotesen att det inte är någon skillnad i draghållfasthet hos de bägge legeringarna. (1 p) c) Antag att observationerna inte är normalfördelade och genomför ett test som motsvarar hypotesen i b) ovan. (1 p) Lösning uppgift 6: a) Variable N Mean Median A 7 13.71 141.00 B 6 8.83 6.00 Pooled StDev = 18.7768 b) Two-sample T for Hållfasthet Legering N Mean StDev SE Mean A 7 13.7 18.7 7.1 B 6 8.8 18.9 7.7
Difference = mu (A) - mu (B) Estimate for difference: 26.88 T-Test of difference = 0 (vs not =): T-Value = 2.7 P-Value = 0.026 DF = 11 Vi förkastar inte på 1%-nivån och inte på 2%-nivån c) Signifikansnivå 2% Rangsumman för legering B är 27. Tabellens intervall med n 1 =6 och n 2 =7 är [2, 9] H 0 förkastas inte 7. Vid ett försök ville man testa om det är någon skillnad i avkastningen av raps för 3 olika sorters gödningsmedel (A, B och C). Till varje gödningsmedel användes tio provrutor där raps. För att kunna avgöra om gödningsmedlen har någon effekt på avkastningen användes också tio provrutor utan gödning. Man slumpade ut vilka provrutor som skull användas till respektive gödningsmedel/ingen gödning. Avkastningen från de olika provrutorna framgår av tabellen nedan. Ingen A B C 60,2 6,4 66,9 71,7 69,3 6, 71,3 63,1 8,3 66,4 63,1 61,3 66,1 68,8 67,9 68,4 64,8 71,4 6, 71,1 62,9 69,1 67,6 6, 61,6 72,1 72, 6,9 63,3 68,8 67,2 62, 60,9 60,7 68,7 71,8 60,2 6,9 62,0 7,9 MINITAB-utskrift: One-way ANOVA: Avkastning versus gödsling Source DF SS MS F P gödsling 3 168,0 6,0 4,02 0,014 Error 36 01,4 13,9 Total 39 669,3 S = 3,732 R-Sq = 2,% R-Sq(adj) = 18,8% Individual 9% CIs For Mean Based on Pooled StDev Level N Mean StDev A 67,41 3,348 (---------*--------) B 67,27 3,247 (--------*---------) C 67,726 4,818 (---------*--------) Ingen 62,74 3,277 (---------*---------) 62, 6,0 67, 70,0
Pooled StDev = 3,732 Tukey 9% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of gödsling Individual confidence level = 98,93% gödsling = A subtracted from: gödsling Lower Center Upper B -4,636-0,140 4,36 (--------*--------) C -4,18 0,311 4,807 (--------*--------) Ingen -9,17-4,660-0,164 (--------*--------) -,0 0,0,0,0 gödsling = B subtracted from: gödsling Lower Center Upper C -4,04 0,41 4,947 (--------*--------) Ingen -9,017-4,20-0,024 (--------*--------) -,0 0,0,0,0 gödsling = C subtracted from: gödsling Lower Center Upper Ingen -9,468-4,972-0,47 (--------*--------) -,0 0,0,0,0 Plots for Avkastning Normal Probability Plot of the s 99 s Versus the Fitted Values Percent 90 0 0 1 - - 0-64 66 Fitted Value 68,0 Histogram of the s s Versus the Order of the Data Frequency 7,,0 2, 0,0-6 -4-2 0 2 4 6 8 0-1 1 20 2 30 Observation Order 3 40
Test for Equal Variances for Avkastning A B Bartlett's Test Test Statistic 2, P-Value 0,2 Levene's Test Test Statistic 1,44 P-Value 0,247 gödsling C Ingen 2 3 4 6 7 8 9 9% Bonferroni Confidence Intervals for StDevs 11 a) Redogör för idén bakom det F-test man gör i variansanalys. Vilka antaganden skall vara uppfyllda för att man skall kunna göra test med variansanalys? (1 p) b) Verkar dessa antaganden vara uppfyllda i detta fall (motiver)? (1 p) c) Om antagandena vid ensidig variansanalys är uppfyllda, vilka slutsatser kan man dra från analysen ovan på signifikansnivån % (motivera)? (1 p) Lösning uppg. 7: a) Modell Y ij = µ i + ε ij = µ + τ i + ε ij N(m i, σ), j = 1,2,3,4,n i, i = 1,2,3,. (samma varians) Idén bakom test av H 0 : µ 1 = µ 2 = µ 3 = µ 4 : Bilda en variansskattning av σ 2 som är väntevärdesriktig oavsett om H 0 är sann eller falsk. Bilda en annan skattning som bara är väntevärdesriktig om H 0 är sann. Bilda kvoten mellan dessa, om kvoten blir stor i förhållande till ett tyder det på att H 0 är falsk (den andra skattningen skattar något annat än bara σ 2. b) analys ser OK ut. c) F-testet styrker att det finns en skillnad mellan de fyra gödningsalternativen (p-värdet 0.014 <%). Tukey s test ger att A, B och C statistiskt skiljer sig ifrån ingen gödsling.