2.1 Minitab-introduktion Betrakta följande mätvärden (observationer): 9.07 11.83 9.56 7.85 10.44 12.69 9.39 10.36 11.90 10.15 9.35 10.11 11.31 8.88 10.94 10.37 11.52 8.26 11.91 11.61 10.72 9.84 11.89 7.46 11.57 8.56 8.23 9.08 9.16 8.01 10.56 8.90 12.14 8.10 6.78 11.01 15.13 9.99 10.19 7.66 11.94 8.27 10.86 9.22 7.74 9.69 9.58 10.16 5.16 11.37
2.1 Minitab-introduktion Antag att mätvärdena är successiva observationer på en vikt som mäts i en tillverkningsprocess. 17,5 I Chart of Vikt 15,0 UCL=15,88 Individual Value 12,5 10,0 7,5 _ X=9,93 5,0 LCL=3,98 1 6 11 16 21 26 31 Observation 36 41 46 Stat Control Charts Variables Charts for Individuals Individuals
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum Vikt 50 9.929 1.760 3.099 5.160 10.050 15.130 Låt x 1,x 2,, x n beteckna ovanstående n mätvärden (här är n = 50). Medelvärde (Mean) - Summan av alla mätvärden delat med antalet mätvärden n. x = i=1 n xi = 496.47 = 9.929 n 50 Teoretiskt antar vi att det finns en sann viktnivå µ, kallad väntevärde, som vi vill ha kunskap om (se kap 4). Om tillverkningsprocessen är stabil och under kontroll bör detta medelvärde ligga nära väntevärdet µ. Stat Basic Statistics Display Descriptive Statistics
2.1 Minitab-introduktion 17,5 I Chart of Vikt (10 mätvärden) 15,0 UCL=15,98 Individual Value 12,5 10,0 7,5 _ X=10,32 5,0 LCL=4,67 1 2 3 4 5 6 7 8 9 10 Observation Stat Control Charts Variables Charts for Individuals Individuals
2.1 Minitab-introduktion I Chart of Vikt (20 mätvärden) 15,0 UCL=15,32 Individual Value 12,5 10,0 _ X=10,38 7,5 5,0 1 3 5 7 9 11 13 15 17 19 LCL=5,43 Observation Stat Control Charts Variables Charts for Individuals Individuals
2.1 Minitab-introduktion I Chart of Vikt (30 mätvärden) 15,0 UCL=14,94 Individual Value 12,5 10,0 7,5 _ X=10,07 5,0 LCL=5,20 1 4 7 10 13 16 19 22 25 28 Observation Stat Control Charts Variables Charts for Individuals Individuals
2.1 Minitab-introduktion I Chart of Vikt (40 mätvärden) 15,0 UCL=15,66 Individual Value 12,5 10,0 7,5 _ X=10,06 5,0 LCL=4,46 1 5 9 13 17 21 25 29 33 37 Observation Stat Control Charts Variables Charts for Individuals Individuals
2.1 Minitab-introduktion 17,5 I Chart of Vikt (50 mätvärden) 15,0 UCL=15,88 Individual Value 12,5 10,0 7,5 _ X=9,93 5,0 LCL=3,98 1 6 11 16 21 26 31 36 41 46 Observation Stat Control Charts Variables Charts for Individuals Individuals
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum Vikt (10 värden) 10 10,324 1,474 2,172 7,850 10,255 12,690 Vikt (20 värden) 20 10,375 1,333 1,778 7,850 10,365 12,690 Vikt (30 värden) 30 10,067 1,441 2,076 7,460 10,130 12,690 Vikt (40 värden) 40 10,062 1,703 2,901 6,780 10,130 15,130 Vikt (50 värden) 50 9,929 1,760 3,099 5,160 10,050 15,130 Medelvärdet förändras när vi tar med olika många mätvärden. Ju fler mätvärden desto mer information får vi och därför bör medelvärdet bli en bättre uppskattning av väntevärdet µ (den sann viktnivå ). Skulle vi kunna ta oändligt många mätvärden skulle medelvärdet x sammanfalla med väntevärdet µ. Stat Basic Statistics Display Descriptive Statistics
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum Vikt 50 9.929 1.760 3.099 5.160 10.050 15.130 Median - Det i storleksordning mittersta värdet. Om det finns två mittersta värden avses medelvärdet av dessa. Medelvärde och median är s k lägesmått och säger oss ungefär hur stora mätvärden vi kan förvänta oss.
Lägesmåttet säger inget om hur mätvärdena sprider sig. Till detta har vi spridningsmått. Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum Vikt 50 9.929 1.760 3.099 5.160 10.050 15.130 Variationsvidd (Range): R = x max - x min. Detta är ett enkelt spridningsmått som blir ineffektivt om vi har många mätvärden. Det utnyttjas främst då n < 10. I exemplet: R = 15.130 5.160 = 9.97
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum vikt 50 9.929 1.760 3.099 5.160 10.050 15.130 Ett mer effektivt och vanligare använt spridningsmått är: Stickprovs-standardavvikelse (Sample Standard Deviation): Mäter mätvärdenas förhållande (avstånd) till medelvärdet genom uttrycket s = n i=1 X i X 2 n 1
Individual Value Plot of Vikt x i x 5,0 7,5 10,0 Vikt 12,5 15,0 s = n i=1 X i X 2 n 1 =1.760
5,0 7,5 Individual Value Plot of Vikt 10,0 Vikt 12,5 15,0 2.2 Beskrivande statistik Tolkning av s: Om man gör nya mätningar bör ungefär 95% av dessa ligga i ett intervall av längd 4s = Individual 4*1.76 Value = 7.04 Plot of och Viktcentrerad runt x = 9.93. x ± 2s = 9.93 ± 2 1.76 = 9.93 ± 3.52 = (6.41, 13.45) 5,0 7,5 10,0 Vikt 12,5 15,0
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum vikt 50 9.929 1.760 3.099 5.160 10.050 15.130 Ett annat relaterat spridningsmått är: Stickprovs-variansen (Sample Variance): s 2 = i=1 n X i X 2 n 1 (vars enhet är variabelns enheten i kvadrat, t ex kg 2 )
Descriptive Statistics Variable Count Mean StDev Variance Minimum Median Maximum Vikt (10 värden) 10 10,324 1,474 2,172 7,850 10,255 12,690 Vikt (20 värden) 20 10,375 1,333 1,778 7,850 10,365 12,690 Vikt (30 värden) 30 10,067 1,441 2,076 7,460 10,130 12,690 Vikt (40 värden) 40 10,062 1,703 2,901 6,780 10,130 15,130 Vikt (50 värden) 50 9,929 1,760 3,099 5,160 10,050 15,130 På samma sätt som för medelvärdet förändras stickprovstandardavvikelsen (stickprovs-variansen) när vi tar med olika många mätvärden. Skulle vi kunna ta oändligt många mätvärden skulle stickprovstandardavvikelsen (stickprovs-variansen) sammanfalla med den så kallade sanna standardavvikelsen s (sanna variansen s 2 ). Stat Basic Statistics Display Descriptive Statistics
En annan visuell bild av hur datamaterialet sprider sig kring medelvärdet ges av diagrammet Histogram. Histogram of Vikt 12 10 Frequency 8 6 4 2 0 6 8 10 Vikt 12 14 Graph Histogram
Boxplot är ytterligare en annan visuell bild på hur datamaterialet sprider sig, men här kring medianen (se kap 3.1.3). Graph Boxplot
Via Help i Minitab kan man t.ex. få information om utskrifter. Graph Boxplot
Brushing är en teknik för att identifiera mätvärden i grafer (se kap 3.1.4). Är det bara ett mätvärde räcker det med att bara peka på det. Höger-klicka på grafen Brush
Jämförelse av olika stickprov Histogram of Vikt; Vikt2; Vikt3; Vikt4 Vikt 4 8 12 Vikt2 16 20 30 20 10 Frequency 30 Vikt3 Vikt4 0 20 10 0 4 8 12 16 20 Graph Histogram
Dotplot of Vikt; Vikt2; Vikt3; Vikt4 Vikt Vikt2 Vikt3 Vikt4 2,5 5,0 7,5 10,0 Data 12,5 15,0 17,5 20,0 Graph Histogram
Descriptive Statistics: Vikt; Vikt2; Vikt3; Vikt4 Variable N Mean StDev Variance Median Vikt 50 9,929 1,760 3,099 10,050 Vikt2 50 15,143 1,786 3,190 15,069 Vikt3 50 10,488 3,329 11,080 10,379 Vikt4 50 5,073 0,764 0,583 5,097 Dotplot of Vikt; Vikt2; Vikt3; Vikt4 Vikt Vikt2 Vikt3 Vikt4 2,5 5,0 7,5 10,0 Data 12,5 15,0 17,5 20,0 Graph Histogram
Individual Value Plot of Vikt; Vikt2; Vikt3; Vikt4 20 15 Data 10 5 Vikt Vikt2 Vikt3 Vikt4 Graph Individual Value Plot
Boxplot of Vikt; Vikt2; Vikt3; Vikt4 20 15 Data 10 5 Vikt Vikt2 Vikt3 Vikt4 Graph Boxplot
Descriptive Statistics: Skev Variable N Mean StDev Variance Median Skev 50 15,05 16,80 282,09 10,48 Histogram of Skev 25 20 Frequency 15 10 5 0 0 20 40 Skev 60 80 100 Graph Histogram
En sammanställning av beskrivande statistik kan erhållas genom Stat Basic Statistics Graphical Summary Summary Report for Vikt Anderson-Darling Normality Test A-Squared 0,24 P-Value 0,771 Mean 9,9294 StDev 1,7603 Variance 3,0988 Skewness 0,050000 Kurtosis 0,888347 N 50 6 8 10 12 14 Minimum 5,1600 1st Quartile 8,8000 Median 10,0500 3rd Quartile 11,3250 Maximum 15,1300 95% Confidence Interval for Mean 9,4291 10,4297 95% Confidence Interval for Median 9,3073 10,4794 95% Confidence Interval for StDev 1,4705 2,1936 95% Confidence Intervals Mean Median 9,2 9,4 9,6 9,8 10,0 10,2 10,4
3.2 Bivariat och multivariat data Vi ska betrakta två eller flera variabler som beror på varandra. 130 Scatterplot of Vikt vs Längd 120 110 100 Vikt 90 80 70 60 50 1,5 1,6 1,7 1,8 1,9 Längd Graph Scatterplot Relativt starkt positivt beroende (ju längre desto tyngre)
3.2 Bivariat och multivariat data Korrelation är ett mått på hur starkt det linjära beroendet är (betecknas ofta med r, formel hittas i kap 3.2.2). Correlation: Längd; Vikt Pearson correlation of Längd and Vikt = 0,645 130 Scatterplot of Vikt vs Längd 120 110 100 Vikt 90 80 70 60 50 1,5 1,6 1,7 Längd 1,8 1,9 Stat Basic Statistics Correlation Graph Scatterplot
3.2 Bivariat och multivariat data
3.2 Bivariat och multivariat data Correlation: Längd; Vikt Pearson correlation of Längd and Vikt = 0,306 (män) Pearson correlation of Längd and Vikt = 0,447 (kvinnor) Data Split Worksheet, Graph Scatterplot Stat Basic Statistics Correlation
3.2 Bivariat och multivariat data Correlation: Längd; Vikt; BMI Längd Vikt Vikt 0,645 BMI 0,143 0,844 Matrix Plot of Längd; Vikt; BMI BMI = Vikt(kg) Längd 2 (m 2 ) 60 90 120 1,9 1,7 Längd 1,5 120 Vikt 90 60 40 30 BMI 20 1,5 1,7 1,9 20 30 40 Calc Calculator, Graph Matrix Plot Stat Basic Statistics Correlation
3.2 Bivariat och multivariat data Matrix Plot of Längd; Vikt; BMI 60 90 120 1,9 Kön Kvinna Man 1,7 Längd 1,5 120 Vikt 90 60 40 30 BMI 20 1,5 1,7 1,9 20 30 40 Graph Matrix Plot
3.3.1 Pareto-diagram Paretodiagram Analys med hjälp av ett paretodiagram är ett effektivt sätt att hitta de största förbättringsmöjligheterna i en process. Hittar man de få väsentliga orsakerna kan man med relativt små insatser åstadkomma stora förbättringar. Paretodiagrammet används när man kan dela upp data i kategorier, t ex reklamationer fördelade på olika feltyper, olika typer av kundklagomål, felkostnader fördelade på olika delsystem. Man talar om "the vital few and the trivial many" eller 80-20 regeln (20% av kategorierna bidrar med 80% av variationen). Graph Matrix Plot
3.3.1 Pareto-diagram Stat Quality Tools Pareto Chart (MINITAB data: EXH_QC.MTW)