Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Relevanta dokument
Tentamen i matematisk statistik

Tentamen i matematisk statistik

Tentamen i matematisk statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Metod och teori. Statistik för naturvetare Umeå universitet

7.5 Experiment with a single factor having more than two levels

Statistik för teknologer, 5 poäng Skrivtid:

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i matematisk statistik

7.3.3 Nonparametric Mann-Whitney test

Examinationsuppgifter del 2

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Räkneövning 3 Variansanalys

Följande resultat erhålls (enhet: 1000psi):

TENTAMEN I MATEMATISK STATISTIK

7.5 Experiment with a single factor having more than two levels

Regressions- och Tidsserieanalys - F4

Exempel 1 på multipelregression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Skrivning i ekonometri lördagen den 29 mars 2008

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Skrivning i ekonometri torsdagen den 8 februari 2007

10.1 Enkel linjär regression

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Tentamen i Matematisk statistik Kurskod S0001M

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Exempel 1 på multipelregression

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

TENTAMEN I STATISTIK B,

Regressions- och Tidsserieanalys - F7

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i Matematisk statistik Kurskod S0001M

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Regressions- och Tidsserieanalys - F1

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Regressions- och Tidsserieanalys - F1

2.1 Minitab-introduktion

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Regressions- och Tidsserieanalys - F3

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Styr- och kontrolldiagram ( )

Kontrolldiagram hjälper oss att skilja mellan två olika typer variation, nämligen akut och kronisk variation.

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i Matematisk statistik Kurskod S0001M

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

8.1 General factorial experiments

Skrivning i ekonometri lördagen den 15 januari 2005

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Skrivning i ekonometri lördagen den 25 augusti 2007

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 12: Regression

tentaplugg.nu av studenter för studenter

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Parade och oparade test

Gamla tentor (forts) ( x. x ) ) 2 x1

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Matematisk statistik Kurskod S0001M

3.1 Beskrivande statistik

Läs noggrant informationen nedan innan du börjar skriva tentamen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

Statistisk försöksplanering

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Läs noggrant informationen nedan innan du börjar skriva tentamen

Transkript:

Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4. Cumulative Distribution Function Poisson with mean = 4 x P( X <= x ) 0,095782 Probability Density Function Poisson with mean = 4 x P( X = x ) 2 0,46525 a) Vad är P(X 2)? P(X 2) = P(X ) + P(X = 2) = 0,095782 + 0,46525 = 0,238 b) Vad är P(X 2)? P(X 2) = - P(X ) = 0,095782 = 0,908 Uppgift 2 I ett företag som tillverkar brytare för högspänning överväger man att modifiera de gamla modellerna så att man får färre mekaniska delar och högre tillförlitlighet. Det är dock viktigt att brytarnas prestanda inte försämras (utan helst blir något bättre). De viktigaste egenskaperna hos brytarna är hur länge de är öppna respektive slutna ( Open times respektive Close times ). Dessa har toleransgränserna 8 och 26 respektive 90 och 05 ms. Ett försök gjordes där tider (i ms) mättes för såväl gamla (Bas) som modifierade (Mod) brytare. Följande resultat erhölls när materialet analyserades i Minitab.

Sid 2 (7) Two-Sample T-Test and CI: BasOpen; ModOpen Two-sample T for BasOpen_ vs ModOpen_ N Mean StDev SE Mean BasOpen 38 23,02 0,807 0,3 ModOpen 0 22,462 0,923 0,29 Difference = mu (BasOpen) - mu (ModOpen) Estimate for difference: 0,559 95% CI for difference: (-0,035;,53) T-Test of difference = 0 (vs not =): T-Value =,89 P-Value = 0,065 DF = 46 Both use Pooled StDev = 0,8308 Two-Sample T-Test and CI: BasClose; ModClose Two-sample T for BasClose vs ModClose N Mean StDev SE Mean BasClose 38 99,64,89 0,3 ModClose 0 96,85 2,2 0,67 Difference = mu (BasClose_) - mu (ModClose_) Estimate for difference: 2,79 95% CI for difference: (,98; 4,384) T-Test of difference = 0 (vs not =): T-Value = 3,79 P-Value = 0,002 DF = 3 a) Vilka hypoteser testar man och vilka slutsatser kan man dra från testen? Motivera. Man testar H0: µ = µ2 mot H: µ µ2, där µ och µ2 betecknar de förväntade tiderna med den gamla respektive den modifierade modellen. Motsvarande test utförs för såväl tiderna för Open som för Closed. Nollhypoteserna förkastas på 5% signifikansnivå om p-värdena understiger 0,05. I första fallet (Open) är p = 0,065 och vi kan då alltså inte säkerställa någon skillnad i förväntade tider (även om det var nära). I det andra fallet är p = 0,002 och vi förkastar då att de förväntade tiderna är identiska. Eftersom medelvärdet för den modifierade modellen är lägre än för den gamla drar vi slutsatsen att den modifierade modellen ger kortare förväntad tid för Closed. b) I de två testen ovan är det ett antagande som skiljer sig åt. Vilket är det? I det första testet har vi antagit att varianserna (och därmed standardavvikelserna) är identiska i hos de gamla och de modifierade modellerna. Vi använder oss då av en gemensam ( poolad ) skattning. I det andra testet har vi inte antagit lika varianser, utan skattar dem separat och kräver därmed större skillnad mellan medelvärdena för att förkasta H0.

Sid 3 (7) Uppgift 3 Fortsättning från Uppgift 2. I utskrifterna nedan används ett alternativt sätt att analysera materialet. Mann-Whitney Test and CI: BasOpen; ModOpen N Median BasOpen 38 22,925 ModOpen 0 22,585 Point estimate for ETA-ETA2 is 0,445 95, Percent CI for ETA-ETA2 is (-0,80;,30) W = 985,5 Test of ETA = ETA2 vs ETA not = ETA2 is significant at 0,704 The test is significant at 0,703 (adjusted for ties) Mann-Whitney Test and CI: BasClose; ModClose N Median BasClose 38 99,620 ModClose 0 96,220 Point estimate for ETA-ETA2 is 2,735 95, Percent CI for ETA-ETA2 is (,30;4,249) W = 060,0 Test of ETA = ETA2 vs ETA not = ETA2 is significant at 0,00 The test is significant at 0,00 (adjusted for ties) a) Vilka slutsatser kan man dra från dessa utskrifter? Slutsatserna blir desamma som i föregående uppgift. Vi kan inte förkasta H0 i det första testet (p = 0,704 > 0,05), men i det andra (p = 0,00 < 0,05). b) Vilket antagande är det man måste göra i Uppgift 2, men inte här? För dessa test krävs inget normalfördelningsantagande. c) Beskriv kort i ord hur detta test (Mann-Whitney) genomförs. Man slår ihop alla mätvärden och rangordnar dem i storleksordning. Därefter beräknas rangsumman för det ena stickprovet. Om summan är liten (stor) tyder det på att den aktuella fördelningen är lokaliserad till vänster (höger) om fördelningen i den andra gruppen, dvs medianen i den population för vilken rangsumman beräknats är mindre (större) än i den andra populationen. Vad som är litet (stort) bestäms med hjälp av kombinatoriska beräkningar och kan slås upp i tabell eller beräknas med statistisk programvara.

Sid 4 (7) Uppgift 4 Fortsättning från Uppgift 2 och 3. Vid tillverkning av de nya modifierade brytarna har man successivt tagit ut sådana ur produktionen och mätt de intressanta tiderna. I bilden nedan illustreras 30 stycken Open times. I-MR Chart of ModOpen Individual Value 24,0 22,5 2,0 9,5 UCL=23,575 _ X=20,84 8,0 4 7 0 3 6 Observation 9 22 25 28 LCL=8,06 3 UCL=3,359 Moving Range 2 MR=,028 0 LCL=0 4 7 0 3 6 Observation 9 22 25 28 a) Efter ca 3 observationer verkar något hända i processen och vid den 5:e slås larm. Beskriv vad man kan utläsa ur graferna om vilken förändring som sker. Genomsnittsnivån sänks, I-diagrammet visar. Däremot verkar inte spridningen förändras (MR-diagrammet). b) Om man har upprepade mätningar vid varje tidpunkt kan man skatta standardavvikelsen i processen m.h.a. dessa. Hur bär man sig åt för att skatta spridningen som visas i MR-diagrammet i detta fall då man endast har en mätning vid varje tidpunkt? Man beräknar absolutbeloppet av differensen mellan två på varandra följande mätvärden (mr). En skattning av processens standardavvikelse erhålls genom att bestämma medelvärdet av differenserna och dividera denna med lämplig konstant (finns i tabell).

Sid 5 (7) Uppgift 5 Vid en undersökning av hur vulktemperaturen påverkar draghållfastheten hos syntetiskt gummi, gjordes försök med 3 olika temperaturer. Följande draghållfastheter uppmättes. Temp Draghållfasthet 25 C 2,0 2,7 2,26 2,06 2,8 2, 40 C 2,7 2,09 2,0 2,02 2,05 2,03 55 C 2,09 2, 2,0 2,09 2,08 2,2 En ANOVA-körning i Minitab gav följande resultat. One-way ANOVA: 25C; 40C; 55C Source DF SS MS F P Factor 2 0,0092 0,0046,2 0,327 Error 5 0,05730 0,00382 Total 7 0,0665 S = 0,068 R-Sq = 3,85% R-Sq(adj) = 2,36% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+--------- +---- 25C 6 2,37 0,0902 (---------*----------) 40C 6 2,0767 0,0557 (---------*----------) 55C 6 2,0983 0,047 (----------*---------) -----+---------+---------+--------- +---- 2,050 2,00 2,50 2,200 Pooled StDev = 0,068 a) Vilken hypotes testar man med hjälp av ANOVA-tabellen och vad blir resultatet om man genomför testet på 5% signifikansnivå i detta fall? H0: µ = µ2 = µ3, dvs förväntad draghållfasthet lika för de tre temperaturerna. Eftersom p-värdet är 0,327 > 0,05 kan vi inte förkasta H0, dvs vi kan inte påvisa någon skillnad i hållfasthet för olika temperaturer.

Sid 6 (7) En residualanalys visade följande. Residual Plots for 25C; 40C; 55C 99 Normal Probability Plot Versus Fits Percent 90 50 0-0, 0,0 Residual 0, Residual 0,0 0,05 0,00-0,05-0,0 2,070 2,085 2,00 2,5 Fitted Value 2,30 Histogram 8 Frequency 6 4 2 0-0,0-0,05 0,00 0,05 Residual 0,0 0,5 b) Det finns något i residualanalysen som tyder på att det inte är så lyckat att använda ANOVA. Vad är det? Bilden till höger antyder att variansen skiljer sig åt för de olika temperaturerna. Detta strider mot grundantagandet att varianserna är lika. Uppgift 6 Vad står bokstäverna i DMAIC för? Förklara kortfattat vad de olika momenten innebär. Define Measure Analyze Improve Control. För beskrivningar, se kavlitetsfilmerna på kurshemsidan. Uppgift 7 Beskriv det s.k. kvalitetshuset och dess byggstenar. Se kvalitetsfilm på kurshemsidan.

Sid 7 (7) Uppgift 8 Kvaliteten Y (mätt i given enhet) av en viss tillverkad destillationsprodukt påverkas linjärt av hur länge den lagras. Anta att avvikelserna i kvalitet från det linjära sambandet kan anses normalfördelade med väntevärde 0 och okänd standardavvikelse. För att undersöka det linjära sambandet gjordes kvalitetsmätningar på olika exemplar lagrade exakt 2, 4, 6, 8, 0 och 2 år. Motsvarande kvalitetsvärden blev 39,6, 45,8, 50,7, 58,9, 63, och 7,2. En enkel linjär regressionsmodell anpassades i Minitab och följande utskrift erhölls. The regression equation is Kvalitet = 33, + 3,2 Tid 6 cases used Predictor Coef SE Coef T P Constant 33,0733 0,9229 35,84 0,000 Tid 3,57 0,85 26,30 0,000 S = 0,99343 R-Sq = 99,4% R-Sq(adj) = 99,3% a) Hur många kvalitetsenheter kan man förvänta sig att en produkt ökar om man förlänger lagringstiden med 5 år? beta-koefficienten talar om hur stor förväntad förändring vi har för ett år. Om vi multiplicerar denna med 5 för vi motsvarande för 5 år: 5 3,57 = 5,58 kvalitetsenheter. b) Skatta så bra som möjligt utgående från den anpassade modellen, den förväntade kvaliteten för en produkt som lagrats i 7 år. Vi substituerar in x = 7 i den skattade regressionsmodellen och får 33,0733 + 3,57 7 = 54,88 kvalitetsenheter. c) Hur stor andel av variationen i kvalitet kan hänföras till andra orsaker än lagringstid? Förklaringsgraden R 2 = 99,4%. Denna talar om hur stor andel av den totala variationen i kvalitet som kan förklaras av lagringstid. Det innebär att endast 00 99,4 = 0,6% av totala variationen kan förklaras av andra orsaker.