7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. Försöksplan: För att hitta en optimal inblandning gjordes ett planerat försök på 5 nivåer hos faktorn inblandning, 15%, 20%, 25%, 30%, 35%. På varje nivå gjordes 5 upprepningar, vilket innebär att hela försöket bestod av 25 observationer. 1
7.5 Experiment with a single factor having Dessa genomfördes i slumpmässig ordning och följande resultat erhölls: Observationsnummer Inblandning 1 2 3 4 5 Medel Varians 15 7 7 15 11 9 9.8 11.20 20 12 17 12 18 18 15.4 9.80 25 14 18 18 19 19 17.6 4.30 30 19 25 22 19 23 21.6 6.80 35 7 10 11 15 11 10.8 8.20 15.04 8.06 2
7.5 Experiment with a single factor having Individual Value Plot of Dragstyrka 25 20 Dragstyrka 15 10 5 15 20 25 30 35 Inblandning 3
7.5 Experiment with a single factor having Låt oss införa begreppet modell: Y ij = μ + α i + ε ij, j = 1, 2,, n, i = 1, 2,, a, a i=1 α i = 0 α i = effekten av faktornivå i (de fem valda inblandningarna är faktornivåer) ε ij antas vara oberoende och normalfördelade med väntevärde 0 och varians σ 2. N = n a är det totala antalet observationer. Observera att vi antar att variansen är lika för alla faktornivåer. 4
7.5 Experiment with a single factor having 5
7.5 Experiment with a single factor having Medelvärdet av alla observationer är 15.04. Det borde vara en bra skattning av μ. Vi kan dessutom bilda medelvärde av observationerna inom varje grupp. Dessa medelvärden kallas Fits och uppskattar μ + α i. Dvs. Fits minus medelvärdet av alla observationer skattar α i. Så kallade Residualer ges av observation minus Fit och kan ses som skattningar av mätfelen ε ij. Residualerna bör följaktligen bete sig som N(0, σ 2 )-observationer. 6
7.5 Experiment with a single factor having Y ij = μ + α i + ε ij 15.04 + Fits 15.04 + Residualer Obs (Y ij ) Fits α i Fits-15.04 Residualer = Y ij - Fits 7, 7, 15, 11, 9 9.8-5,24-2.8, -2.8, 5.2, 1.2, -0.8 12, 17, 12, 18, 18 15.4 0.36-3.4, 1.6, -3.4, 2.6, 2.6 14, 18, 18, 19, 19 17.6 2.56-3.6, 0.4, 0.4, 1.4, 1.4 19, 25, 22, 19, 23 21.6 6.56-2.6, 3.4, 0.4, -2.6, 1.4 7, 10, 11, 15, 11 10.8-4.24-3.8, -0.8, 0.2, 4.2, 0.2 medelvärden Summerar till noll Alla residualer summerar till noll 7
7.5 Experiment with a single factor having a 4 6.56 a 1-5.24 a 2 0.36 a 3 2.56 15.04 a 5-4.24 Stat ANOVA Main Effects Plot... 8
7.5.2 The fixed effects model Modell: Y ij = μ + α i + ε ij, j = 1, 2,, n, i = 1, 2,, a, ε ij är N(0, σ 2 ) a i=1 α i = 0 och Hypotes: H 0 : α 1 = α 2 = = α a = 0. H 1 : Åtminstone ett α i 0. Detta är en s.k. fixed effects model eftersom vi vill enbart uttala oss om de a studerade faktornivåerna. 9
7.5.2 The fixed effects model Stat ANOVA One-way... 10
7.5.2 The fixed effects model Analys av residualer (modellverifiering), Stat ANOVA One-way... 11
7.5.2 The fixed effects model Modellverifiering ska göras före vi drar slutsatser från statistiska analyser. Normal probability plot och Histogram (graferna på vänster sida) används för att verifiera Normalfördelningsantagandet. Den övre högra används för att försöka avgöra om antagandet om lika varians är uppfyllt. Variationen i Y-led bör vara lika i hela grafen, inga mönster bör uppträda. Nedre högra kan användas om vi har mätt i tidsordning. Då kan vi utnyttja grafen för att försöka avgöra om mätningarna är oberoende av varandra 12
7.5.2 The fixed effects model Test om varianserna är lika för de olika faktornivåerna (se kap 7.8): H 0 : Varianserna är lika för alla nivåer H 1 : Varianserna skiljer sig åt mellan åtminstone två nivåer Stat ANOVA Test for Equal Variances... 13
7.5.2 The fixed effects model Individual Value Plot of Dragstyrka vs Inblandning 25 20 Dragstyrka 15 10 5 15 20 25 30 35 Inblandning Är variationen inom stickprov lika stor? 14
7.5.2 The fixed effects model Test for Equal Variances: Dragstyrka vs Inblandning Multiple comparison intervals for the standard deviation, α = 0,05 15 20 Multiple Comparisons P-Value 0,860 Levene s Test P-Value 0,863 Inblandning 25 30 35 1 2 3 4 5 6 7 8 9 10 If intervals do not overlap, the corresponding stdevs are significantly different. Vi kan inte påvisa att varianserna skiljer sig åt. 15
7.5.2 The fixed effects model Först när vi verifierat att modellantagandena är uppfyllda kan vi gå vidare och tolka analysresultaten. One-way ANOVA: Dragstyrka versus Inblandning Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Inblandning 5 15; 20; 25; 30; 35 16
7.5.2 The fixed effects model Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 Model Summary S R-sq R-sq(adj) R-sq(pred) 2,83901 74,69% 69,63% 60,46% Means Inblandning N Mean StDev 95% CI 15 5 9,80 3,35 ( 7,15; 12,45) 20 5 15,40 3,13 ( 12,75; 18,05) 25 5 17,600 2,074 (14,952; 20,248) 30 5 21,60 2,61 ( 18,95; 24,25) 35 5 10,80 2,86 ( 8,15; 13,45) Pooled StDev = 2,83901 17
7.5.2 The fixed effects model Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 SS(Inblandning) = 475.8 = variationen mellan faktornivåernas medelvärden (bör vara nära noll om det inte är någon skillnad mellan nivåerna). SS(Error) = 161.2 = variationen inom varje faktornivå (beskriver den sanna slumpvariationen). SS(Total) = 637.0 = total variation SS(Inblandning) + SS(Error) = SS(Total) 18
7.5 Experiment with a single factor having Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 19
7.5.2 The fixed effects model Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 MS(Error) = 161.2/20 = 8.060 = skattning av observationernas varians σ 2, betecknas ofta MSE (Mean Square Error). MS(Inblandning) = 475.8/4 = 118.940 = skattning av observationernas varians σ 2 om H 0 : α 1 = α 2 = = α a = 0 är sann, dvs om faktorn inblandning inte har någon effekt. Skattar σ 2 + n a 2 i=1 αi. a 1 F-value = MS(Inblandning)/ MS(Error) = 118.940/ 8.060 = 14.76. Om H 0 är sann bör F-värdet vara nära ett! 20
7.5.2 The fixed effects model Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 Om H 0 är sann skattar MS(Inblandning) och MS(Error) samma sak, dvs den sanna variansen σ 2. Kvoten F bör då vara nära ett. H 0 förkastas för stora värden på F, dvs då p-värdet är mindre än signifikansnivån Fördelningen som kvoten F antar är en s.k. F-fördelning (om H 0 är sann). Eftersom p-värdet = 0.000 kan vi påvisa att dragstyrkan beror på inblandningens storlek. 21
7.5.2 The fixed effects model Model Summary S R-sq R-sq(adj) R-sq(pred) 2,83901 74,69% 69,63% 60,46% S = MS(Error), dvs en skattning av den sanna standardavvikelsen σ. R-sq = SS(Inblandning)/SS(Total) (andelen av den totala variationen som beskrivs av faktornivåernas effekter) Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Inblandning 4 475,8 118,940 14,76 0,000 Error 20 161,2 8,060 Total 24 637,0 R 2 = 475.8 637.0 = 0.7469 22
7.5.2 The fixed effects model Means Inblandning N Mean StDev 95% CI 15 5 9,80 3,35 ( 7,15; 12,45) 20 5 15,40 3,13 ( 12,75; 18,05) 25 5 17,600 2,074 (14,952; 20,248) 30 5 21,60 2,61 ( 18,95; 24,25) 35 5 10,80 2,86 ( 8,15; 13,45) Pooled StDev = 2,83901 Konfidensintervallen anger var vi tror att de sanna dragstyrkan är för de olika inblandningarna. 23
7.5.2 The fixed effects model 25 Interval Plot of Dragstyrka 95% CI for the Mean 20 Dragstyrka 15 10 5 15 20 25 30 35 Inblandning Individual standard deviations were used to calculate the intervals. Stat ANOVA Interval Plot... 24
7.5.2 The fixed effects model Som vi såg i ANOVA-tabellen tidigare så förkastas H 0. Det betyder att någon eller några av α 1,, α 5 skiljer sig från noll (åtminstone 2 inblandningar skiljer sig åt). Genom s k Post-hoc test kan vi avgöra var skillnaderna ligger. Varför gör man inte parvisa test (här totalt 10 test) på en gång? 25
7.5.2 The fixed effects model Varför jämför vi inte alla parvisa behandlingar med Student s t-test? Ett skäl: Om noll-hypotesen är sann är sannolikhet a att vi i varje t-test dra fel slutsats. signifikansnivå Ju fler jämförelser desto större risk att dra åtminstone en felaktig slutsats. Om faktorn har fem nivåer behöver vi 10 jämförelser för att kunna skilja dom åt. Om a = 0.05 i varje jämförelse, då kommer den gemensamma signifikansnivån (risken att dra någon fel slutsats) vara ungefär 1 0.95 10 = 0.40. Om det inte finns någon skillnad är sannolikheten 40% att vi påvisar en icke existerande skillnad. 26
7.5.2 The fixed effects model Vi kan korrigera signifikansnivån a på de enskilda testen så att vi garanterat inte gör fel med större sannolikhet än a. 27
7.5.2 The fixed effects model Tukey Simultaneous Tests for Differences of Means Difference Difference SE of Adjusted of Levels of Means Difference 95% CI T-Value P-Value 20-15 5,60 1,80 ( 0,23; 10,97) 3,12 0,039 25-15 7,80 1,80 ( 2,43; 13,17) 4,34 0,003 30-15 11,80 1,80 ( 6,43; 17,17) 6,57 0,000 35-15 1,00 1,80 ( -4,37; 6,37) 0,56 0,980 25-20 2,20 1,80 ( -3,17; 7,57) 1,23 0,737 30-20 6,20 1,80 ( 0,83; 11,57) 3,45 0,019 35-20 -4,60 1,80 ( -9,97; 0,77) -2,56 0,116 30-25 4,00 1,80 ( -1,37; 9,37) 2,23 0,210 35-25 -6,80 1,80 (-12,17; -1,43) -3,79 0,009 35-30 -10,80 1,80 (-16,17; -5,43) -6,01 0,000 Individual confidence level = 99,28% Signifikansnivå vi varje enskilt test är 0.72 Här finner vi att inblandning 15 skiljer sig från inblandningarna 20, 25 och 30, inblandning 20 skiljer sig från 30, inblandning 25 från inblandning 35, samt inblandning 30 från inblandning 35. 28
7.5.2 The fixed effects model Tukey Pairwise Comparisons Grouping Information Using the Tukey Method and 95% Confidence Inblandning N Mean Grouping 30 5 21,60 A 25 5 17,60 A B 20 5 15,40 B C 35 5 10,80 C D 15 5 9,80 D Means that do not share a letter are significantly different. Vi fann att inblandning 15 skiljer sig från 20, 25 och 30, inblandning 20 skiljer sig från 30, inblandning 25 från 35, inblandning 30 från inblandning 35. Svårt att gruppera 29
7.5.3 The random effects model Anta att man är intresserad av att studera ett stort antal faktornivåer (oändligt många teoretiskt). Av praktiska skäl kan vi inte observera alla dessa nivåer utan väljer slumpmässigt ut ett antal faktornivåer som vi sedan observerar. Modell: Y ij = μ + α i + ε ij, j = 1, 2,, n, i = 1, 2,, a, α i = effekten av slumpmässigt vald faktornivå i, antas vara oberoende och normalfördelade med väntevärde 0 och varians σ a 2. ε ij antas vara oberoende och normalfördelade med väntevärde 0 och varians σ 2. 30
7.5.3 The random effects model Hypotes: H 0 : σ a 2 = 0. H 1 : σ a 2 0 Om σ a 2 = 0 betyder det att faktornivåerna (alla) inte skiljer sig åt. Detta är en s.k. random effects model. Till skillnad från fixed effects model så vill man här uttala sig om alla tänkbara faktornivåer, inte ett begränsat antal. 31
7.5.3 The random effects model Exempel. Man vill undersöka om olika batcher av råvarumaterial påverkar avkastningen (gram) i en viss process. Sex slumpmässigt utvalda batcher observerades. På varje batch gjordes fem mätningar (replikat). Batch 1 Batch 2 Batch 3 Batch 4 Batch 5 Batch 6 1545 1540 1595 1445 1595 1520 1440 1555 1550 1540 1630 1455 1440 1490 1605 1595 1515 1450 1520 1560 1510 1465 1635 1480 1580 1495 1560 1545 1625 1445 32
7.5.3 The random effects model 1650 Boxplot of Avkastning 1600 Avkastning 1550 1500 1450 B1 B2 B3 B4 B5 B6 Batchnummer 33
7.5.3 The random effects model Stat ANOVA Balanced ANOVA... 34
7.5.3 The random effects model Stat ANOVA Balanced ANOVA... 35
7.5.3 The random effects model ANOVA: Avkastning versus Batchnummer Factor Type Levels Values Batchnummer random 6 B1; B2; B3; B4; B5; B6 Analysis of Variance for Avkastning Source DF SS MS F P Batchnummer 5 52124 10425 4,53 0,005 Error 24 55230 2301 Total 29 107354 S = 47,9713 R-Sq = 48,55% R-Sq(adj) = 37,84% Vi finner att det finns en signifikant skillnad mellan olika batcher. Observera att vi uttalar oss om alla möjliga batcher, inte enbart de sex vi har studerat här. 36
7.5.3 The random effects model Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model) 1 Batchnummer 1625 2 (2) + 5 (1) 2 Error 2301 (2) Stat ANOVA Balanced ANOVA... 37
7.5.3 The random effects model Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model) 1 Batchnummer 1625 2 (2) + 5 (1) 2 Error 2301 (2) 1625 är en skattning av σ a 2. 2301 är en skattning av σ 2. I Minitab symboliserar (1) σ a 2 och (2) σ 2 1 MS(Batch) = 10425 = σ 2 + 5σ a 2 2 MS(Error) = 2301 = σ 2 Detta ger σ a 2 = MS(Batch) σ2 5 = 10425 2301 5 = 1624.8. 38
7.5.3 The random effects model Om vi analyserar detta som en fixed effects model, vad blir resultatet/tolkningen då? Då kommer vi bara att kunna uttala oss om dessa sex batcher, dvs att de batcher vi studerat skiljer sig åt. Vi kan inte dra några generellare slutsatser som gäller alla batcher av denna typ. 39
ANOVA generellt Under Stat ANOVA finns ett stort urval av olika ANOVAmöjligheter. 40
7.5.4 The Kruskal-Wallis test Vi kan även analysera dragstyrkan utan att anta normalitet. Som för tidigare icke-parametriska test så baseras testet på rangsummor. Kruskal-Wallis Test: Dragstyrka versus Inblandning Kruskal-Wallis Test on Dragstyrka Inbland. N Median Ave Rank Z 15 5 9,000 5,5-2,55 20 5 17,000 13,2 0,07 25 5 18,000 17,0 1,36 30 5 22,000 22,6 3,26 35 5 11,000 6,7-2,14 Overall 25 13,0 H = 18,84 DF = 4 P = 0,001 H = 19,06 DF = 4 P = 0,001 (adjusted for ties) Vi kan förkasta hypotesen att stickproven kommer från samma population eftersom p = 0.001 och är mindre än 5%. Vi styrker att dragstyrkan är olika för de fem inblandningarna. Stat Nonparametrics Kruskal-Wallis... 41