Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4. Cumulative Distribution Function Poisson with mean = 4 x P( X <= x ) 0,095782 Probability Density Function Poisson with mean = 4 x P( X = x ) 2 0,46525 a) Vad är P(X 2)? P(X 2) = P(X ) + P(X = 2) = 0,095782 + 0,46525 = 0,238 b) Vad är P(X 2)? P(X 2) = - P(X ) = 0,095782 = 0,908 Uppgift 2 I ett företag som tillverkar brytare för högspänning överväger man att modifiera de gamla modellerna så att man får färre mekaniska delar och högre tillförlitlighet. Det är dock viktigt att brytarnas prestanda inte försämras (utan helst blir något bättre). De viktigaste egenskaperna hos brytarna är hur länge de är öppna respektive slutna ( Open times respektive Close times ). Dessa har toleransgränserna 8 och 26 respektive 90 och 05 ms. Ett försök gjordes där tider (i ms) mättes för såväl gamla (Bas) som modifierade (Mod) brytare. Följande resultat erhölls när materialet analyserades i Minitab.
Sid 2 (7) Two-Sample T-Test and CI: BasOpen; ModOpen Two-sample T for BasOpen_ vs ModOpen_ N Mean StDev SE Mean BasOpen 38 23,02 0,807 0,3 ModOpen 0 22,462 0,923 0,29 Difference = mu (BasOpen) - mu (ModOpen) Estimate for difference: 0,559 95% CI for difference: (-0,035;,53) T-Test of difference = 0 (vs not =): T-Value =,89 P-Value = 0,065 DF = 46 Both use Pooled StDev = 0,8308 Two-Sample T-Test and CI: BasClose; ModClose Two-sample T for BasClose vs ModClose N Mean StDev SE Mean BasClose 38 99,64,89 0,3 ModClose 0 96,85 2,2 0,67 Difference = mu (BasClose_) - mu (ModClose_) Estimate for difference: 2,79 95% CI for difference: (,98; 4,384) T-Test of difference = 0 (vs not =): T-Value = 3,79 P-Value = 0,002 DF = 3 a) Vilka hypoteser testar man och vilka slutsatser kan man dra från testen? Motivera. Man testar H0: µ = µ2 mot H: µ µ2, där µ och µ2 betecknar de förväntade tiderna med den gamla respektive den modifierade modellen. Motsvarande test utförs för såväl tiderna för Open som för Closed. Nollhypoteserna förkastas på 5% signifikansnivå om p-värdena understiger 0,05. I första fallet (Open) är p = 0,065 och vi kan då alltså inte säkerställa någon skillnad i förväntade tider (även om det var nära). I det andra fallet är p = 0,002 och vi förkastar då att de förväntade tiderna är identiska. Eftersom medelvärdet för den modifierade modellen är lägre än för den gamla drar vi slutsatsen att den modifierade modellen ger kortare förväntad tid för Closed. b) I de två testen ovan är det ett antagande som skiljer sig åt. Vilket är det? I det första testet har vi antagit att varianserna (och därmed standardavvikelserna) är identiska i hos de gamla och de modifierade modellerna. Vi använder oss då av en gemensam ( poolad ) skattning. I det andra testet har vi inte antagit lika varianser, utan skattar dem separat och kräver därmed större skillnad mellan medelvärdena för att förkasta H0.
Sid 3 (7) Uppgift 3 Fortsättning från Uppgift 2. I utskrifterna nedan används ett alternativt sätt att analysera materialet. Mann-Whitney Test and CI: BasOpen; ModOpen N Median BasOpen 38 22,925 ModOpen 0 22,585 Point estimate for ETA-ETA2 is 0,445 95, Percent CI for ETA-ETA2 is (-0,80;,30) W = 985,5 Test of ETA = ETA2 vs ETA not = ETA2 is significant at 0,704 The test is significant at 0,703 (adjusted for ties) Mann-Whitney Test and CI: BasClose; ModClose N Median BasClose 38 99,620 ModClose 0 96,220 Point estimate for ETA-ETA2 is 2,735 95, Percent CI for ETA-ETA2 is (,30;4,249) W = 060,0 Test of ETA = ETA2 vs ETA not = ETA2 is significant at 0,00 The test is significant at 0,00 (adjusted for ties) a) Vilka slutsatser kan man dra från dessa utskrifter? Slutsatserna blir desamma som i föregående uppgift. Vi kan inte förkasta H0 i det första testet (p = 0,704 > 0,05), men i det andra (p = 0,00 < 0,05). b) Vilket antagande är det man måste göra i Uppgift 2, men inte här? För dessa test krävs inget normalfördelningsantagande. c) Beskriv kort i ord hur detta test (Mann-Whitney) genomförs. Man slår ihop alla mätvärden och rangordnar dem i storleksordning. Därefter beräknas rangsumman för det ena stickprovet. Om summan är liten (stor) tyder det på att den aktuella fördelningen är lokaliserad till vänster (höger) om fördelningen i den andra gruppen, dvs medianen i den population för vilken rangsumman beräknats är mindre (större) än i den andra populationen. Vad som är litet (stort) bestäms med hjälp av kombinatoriska beräkningar och kan slås upp i tabell eller beräknas med statistisk programvara.
Sid 4 (7) Uppgift 4 Fortsättning från Uppgift 2 och 3. Vid tillverkning av de nya modifierade brytarna har man successivt tagit ut sådana ur produktionen och mätt de intressanta tiderna. I bilden nedan illustreras 30 stycken Open times. I-MR Chart of ModOpen Individual Value 24,0 22,5 2,0 9,5 UCL=23,575 _ X=20,84 8,0 4 7 0 3 6 Observation 9 22 25 28 LCL=8,06 3 UCL=3,359 Moving Range 2 MR=,028 0 LCL=0 4 7 0 3 6 Observation 9 22 25 28 a) Efter ca 3 observationer verkar något hända i processen och vid den 5:e slås larm. Beskriv vad man kan utläsa ur graferna om vilken förändring som sker. Genomsnittsnivån sänks, I-diagrammet visar. Däremot verkar inte spridningen förändras (MR-diagrammet). b) Om man har upprepade mätningar vid varje tidpunkt kan man skatta standardavvikelsen i processen m.h.a. dessa. Hur bär man sig åt för att skatta spridningen som visas i MR-diagrammet i detta fall då man endast har en mätning vid varje tidpunkt? Man beräknar absolutbeloppet av differensen mellan två på varandra följande mätvärden (mr). En skattning av processens standardavvikelse erhålls genom att bestämma medelvärdet av differenserna och dividera denna med lämplig konstant (finns i tabell).
Sid 5 (7) Uppgift 5 Vid en undersökning av hur vulktemperaturen påverkar draghållfastheten hos syntetiskt gummi, gjordes försök med 3 olika temperaturer. Följande draghållfastheter uppmättes. Temp Draghållfasthet 25 C 2,0 2,7 2,26 2,06 2,8 2, 40 C 2,7 2,09 2,0 2,02 2,05 2,03 55 C 2,09 2, 2,0 2,09 2,08 2,2 En ANOVA-körning i Minitab gav följande resultat. One-way ANOVA: 25C; 40C; 55C Source DF SS MS F P Factor 2 0,0092 0,0046,2 0,327 Error 5 0,05730 0,00382 Total 7 0,0665 S = 0,068 R-Sq = 3,85% R-Sq(adj) = 2,36% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+--------- +---- 25C 6 2,37 0,0902 (---------*----------) 40C 6 2,0767 0,0557 (---------*----------) 55C 6 2,0983 0,047 (----------*---------) -----+---------+---------+--------- +---- 2,050 2,00 2,50 2,200 Pooled StDev = 0,068 a) Vilken hypotes testar man med hjälp av ANOVA-tabellen och vad blir resultatet om man genomför testet på 5% signifikansnivå i detta fall? H0: µ = µ2 = µ3, dvs förväntad draghållfasthet lika för de tre temperaturerna. Eftersom p-värdet är 0,327 > 0,05 kan vi inte förkasta H0, dvs vi kan inte påvisa någon skillnad i hållfasthet för olika temperaturer.
Sid 6 (7) En residualanalys visade följande. Residual Plots for 25C; 40C; 55C 99 Normal Probability Plot Versus Fits Percent 90 50 0-0, 0,0 Residual 0, Residual 0,0 0,05 0,00-0,05-0,0 2,070 2,085 2,00 2,5 Fitted Value 2,30 Histogram 8 Frequency 6 4 2 0-0,0-0,05 0,00 0,05 Residual 0,0 0,5 b) Det finns något i residualanalysen som tyder på att det inte är så lyckat att använda ANOVA. Vad är det? Bilden till höger antyder att variansen skiljer sig åt för de olika temperaturerna. Detta strider mot grundantagandet att varianserna är lika. Uppgift 6 Vad står bokstäverna i DMAIC för? Förklara kortfattat vad de olika momenten innebär. Define Measure Analyze Improve Control. För beskrivningar, se kavlitetsfilmerna på kurshemsidan. Uppgift 7 Beskriv det s.k. kvalitetshuset och dess byggstenar. Se kvalitetsfilm på kurshemsidan.
Sid 7 (7) Uppgift 8 Kvaliteten Y (mätt i given enhet) av en viss tillverkad destillationsprodukt påverkas linjärt av hur länge den lagras. Anta att avvikelserna i kvalitet från det linjära sambandet kan anses normalfördelade med väntevärde 0 och okänd standardavvikelse. För att undersöka det linjära sambandet gjordes kvalitetsmätningar på olika exemplar lagrade exakt 2, 4, 6, 8, 0 och 2 år. Motsvarande kvalitetsvärden blev 39,6, 45,8, 50,7, 58,9, 63, och 7,2. En enkel linjär regressionsmodell anpassades i Minitab och följande utskrift erhölls. The regression equation is Kvalitet = 33, + 3,2 Tid 6 cases used Predictor Coef SE Coef T P Constant 33,0733 0,9229 35,84 0,000 Tid 3,57 0,85 26,30 0,000 S = 0,99343 R-Sq = 99,4% R-Sq(adj) = 99,3% a) Hur många kvalitetsenheter kan man förvänta sig att en produkt ökar om man förlänger lagringstiden med 5 år? beta-koefficienten talar om hur stor förväntad förändring vi har för ett år. Om vi multiplicerar denna med 5 för vi motsvarande för 5 år: 5 3,57 = 5,58 kvalitetsenheter. b) Skatta så bra som möjligt utgående från den anpassade modellen, den förväntade kvaliteten för en produkt som lagrats i 7 år. Vi substituerar in x = 7 i den skattade regressionsmodellen och får 33,0733 + 3,57 7 = 54,88 kvalitetsenheter. c) Hur stor andel av variationen i kvalitet kan hänföras till andra orsaker än lagringstid? Förklaringsgraden R 2 = 99,4%. Denna talar om hur stor andel av den totala variationen i kvalitet som kan förklaras av lagringstid. Det innebär att endast 00 99,4 = 0,6% av totala variationen kan förklaras av andra orsaker.