Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser: 12-15,75 p ger betyget 3, 16-19,75 ger betyget 4, 20-24 ger betyget 5. VIKTIGT! Lösningarna ska presenteras på ett sådant sätt att beräkningar och resonemang blir lätta att följa. Avsluta varje lösning med ett tydligt svar i de fall där det är möjligt.
Sid 2 (7) Uppgift 1 a) Nämn en kontinuerlig och en diskret fördelning. (2p) b) Vad är skillnaden mellan kontinuerliga och diskreta fördelningar? Uppgift 2 Vid införandet av ett nytt produktionsprotokoll gjordes en undersökning om andelen felaktigt tillverkade produkter har förändrats. Andelen felaktigt tillverkade produkter var innan bytet av protokoll uppskattat till 2% (från ett stickprov på 500 enheter). Efter bytet togs ett nytt stickprov om 600 observationer och man fann då att 8 stycken var felaktiga. Analysen gav följande utskrift. Test and CI for Two Proportions Sample X N Sample p 1 10 500 0,020000 2 8 600 0,013333 Difference = p (1) - p (2) Estimate for difference: 0,00666667 95% lower bound for difference: -0,00619330 Test for difference = 0 (vs > 0): Z = 0,85 P-Value = 0,197 a) Vilken slutsats kan dras från utskriften? b) Vilken fördelning förutsätter vi att antalet defekta i respektive stickprov har? c) Vad hade testets p-värde blivit om vi använt en tvåsidig mothypotes? Motivera. Uppgift 3 15 vuxna män i åldrarna 35 till 50 år deltog i en studie för att se hur motion och kostvanor påverkade kolesterolvärdena i blodet. Kolesterolhalten mättes hos var och en innan de började med lätt motion och kost med lite fett, samt tre månader efter att programmet startat. Följande data och resultat erhölls: Person nr i 1 2 3 4 5 6 7 8 9 10 Före xi 265 240 258 295 251 245 287 314 260 279 Efter yi 229 231 227 240 238 241 234 256 247 239 Person nr i 11 12 13 14 15 Före xi 283 240 238 225 247 Efter yi 246 218 219 226 233
Sid 3 (7) Paired T-Test and CI: Före; Efter Paired T for Före - Efter N Mean StDev SE Mean Före 15 261,80 24,96 6,45 Efter 15 234,93 10,48 2,71 Difference 15 26,87 19,04 4,92 95% lower bound for mean difference: 18,21 a) Kan man med utskriften ovan på signifikansnivån 5% säkerställa att kolesterolhalten sänks med motion och fettsnål kost? Motivera. b) Anta att man inte kan anta normalfördelning. Nämn ett alternativt ickeparametriskt test som kan användas i detta fall. c) Vad är nackdelen med att använda testet i b) om data är normalfördelat? Uppgift 4 Vad står bokstäverna i DMAIC för? Förklara kortfattat vad de olika delarna innebär. (3 p) Uppgift 5 Man vill avgöra om en metalltråd är gjord av ren koppar eller ej genom att undersöka trådens resistans. Teoretiska beräkningar ger att trådens resistans är 55 m om den är gjord av ren koppar. Om mätapparaturen vet man att den ger ett mätresultat som kan betraktas som N(, )-fördelat, där är den sanna resistansen och är mätfelets (okända) standardavvikelse. Man gör 8 mätningar av resistansen och får resultatet: One-Sample T: C1 Test of μ = 55 vs 55 53,7 55,1 56,1 51,9 54,2 52,3 55,2 50,8 Variable N Mean StDev SE Mean 95% CI T P C1 8 53,663 1,845 0,652 (?;?) -2,05 0,079 a) Kommer ett 95% konfidensintervall att täcka värdet 55 m? Motivera. (1,5p) b) Förklara vad som menas med SE Mean i utskriften. (1,5p)
Sid 4 (7) Uppgift 6 Vid en studie av preparat mot klåda gavs fem försökspersoner fyra olika preparat (A, B, C och D) vardera varefter de utsattes för klimedel på huden. Tiden (sekunder) tills klådan upphörde mättes. Följande resultat erhölls: Person Preparat 1 2 3 4 5 A 206 241 280 255 175 B 105 103 135 102 130 C 188 143 113 225 176 D 125 350 169 155 299 I MINITAB analyserades datamaterialet som en randomiserad blockdesign och följande utskrift erhölls: General Linear Model: Tid versus Person; Preparat Method Factor coding (-1; 0; +1) Factor Information Factor Type Levels Values Person Random 5 1; 2; 3; 4; 5 Preparat Fixed 4 A; B; C; D Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Person 4 5862 1465 0,37 0,827 Preparat 3 43764 14588 3,66 0,044 Error 12 47837 3986 Total 19 97463 Model Summary S R-sq R-sq(adj) R-sq(pred) 63,1383 50,92% 22,29% 0,00%
Sid 5 (7) Comparisons for Tid Tukey Pairwise Comparisons: Response = Tid, Term = Preparat Tukey Simultaneous Tests for Differences of Means Difference of Preparat Difference SE of Simultaneous Adjusted Levels of Means Difference 95% CI T-Value P-Value B - A -119,0 39,9 (-237,6; -0,4) -2,98 0,049 C - A -65,0 39,9 (-183,6; 53,6) -1,63 0,400 D - A -14,4 39,9 (-133,0; 104,2) -0,36 0,983 C - B 54,0 39,9 ( -64,6; 172,6) 1,35 0,550 D - B 104,6 39,9 ( -14,0; 223,2) 2,62 0,091 D - C 50,6 39,9 ( -68,0; 169,2) 1,27 0,599 Individual confidence level = 98,83% a) Vilka antaganden görs vid en sådan variansanalys? Finns det någonting i residualplottarna ovan som motsäger något av antagandena? b) Vilka slutsatser kan man dra, på signifikansnivån 5%, från variansanalysen ovan om alla modellantaganden är uppfyllda (motivera)? c) I variansanalysen ovan är försöksperson satt som en slumpmässig (random) effekt. Redogör för vad som menas med slumpmässiga effekter.
Sid 6 (7) Uppgift 7 Iden med styrdiagram är att med jämna tidsmellanrum ta ut ett eller flera enheter ur produktionen och mäta kritiska mått på dessa. a) Beskriv vilka antaganden som skall vara uppfyllda för att man skall kunna säga att sannolikheten är 0,0027 att få ett falskt larm"? b) Vad ska gälla för processen när man praktiskt skapar ett styrdiagram? c) I vilken DMAIC-fas är det särskilt lämpligt att använda styrdiagram. Motivera även varför detta är lämpligt. Uppgift 8 En ingenjör upptäckte att hon genom att tillsätta små mängder av en lösning vid tillverkningen av en viss sorts batterier, kunde förlänga batteriernas livslängder. Hon experimenterade med några olika halter av tillsatsen och fick följande resultat Halt tillsats 0 0 1 1 2 2 3 3 4 4 Livslängd (h) 29,7 29,9 30,9 30,4 31,1 30,8 31,1 31,1 32,2 31,8 Hon anpassade en enkel linjär regressionsmodell i MINITAB och fick följande resultat. Regression Analysis: Livslängd versus Tillsats Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Regression 1 4,7045 4,70450 61,15 0,000 Tillsats 1 4,7045 4,70450 61,15 0,000 Error 8 0,6155 0,07694 Lack-of-Fit 3 0,3455 0,11517 2,13 0,215 Pure Error 5 0,2700 0,05400 Total 9 5,3200 Model Summary S R-sq R-sq(adj) R-sq(pred) 0,277376 88,43% 86,98% 82,06% Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 29,930 0,152 197,00 0,000 Tillsats 0,4850 0,0620 7,82 0,000 1,00
Sid 7 (7) Regression Equation Livslängd = 29,930 + 0,4850 Tillsats a) Anta att alla modellantaganden är uppfyllda. Testa på lämpligt sätt om det finns ett linjärt samband mellan halt av tillsats och livslängd. Använd signifikansnivån 5%. Ange vilken hypotes som testas och vilken slutsats som kan dras. b) Punktskatta den förväntade livslängden för ett batteri med tillsatsen 5 (samma enhet som i analysen). Varför är det riskabelt att använda den skattning du tagit fram? c) Beräkna residualen för den tredje observationen (x = 1, y = 30,9).