Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter. För att utreda detta fick de tre laboranterna (A, B, C) vardera göra fem bestämningar av kopparhalten (slumpmässig ordning) med var och en av metoderna (I-IV). Låt oss analysera detta där vi har två fixa faktorer vi vill testa. 1
Modell: Y ijk = m + a i + b j + e ijk, i = 1, 2,, a, j = 1, 2,, b, e ijk N(0, s 2 ) k = 1, 2,,n. Samma modell som vid block-försöket bortsett att vi antar att b också är en faktor som vi vill testa. Inte bara blocka bort den skillnad som faktor b kan bidra med. Hypoteser: H 0 : a 1 = = a a = 0 H 0 : b 1 = = b b = 0 2
Descriptive Statistics: Kopparhalt Variable N Mean Kopparhalt 60 49,983 ------- Descriptive Statistics: Kopparhalt Variable Metod N Mean Kopparhalt I 15 48,400 II 15 50,600 III 15 49,933 IV 15 51,000 ------- Descriptive Statistics: Kopparhalt Variable Laborant N Mean Kopparhalt A 20 50,700 B 20 50,250 C 20 49,000 Stat Basic Statistics Display Descriptive Statistics 3
Stat ANOVA Main Effects Plot 4
Descriptive Statistics: Kopparhalt Results for Metod = I Variable Laborant N Mean Kopparhalt A 5 49,00 B 5 48,800 C 5 47,400 Results for Metod = II Variable Laborant N Mean Kopparhalt A 5 51,600 B 5 50,600 C 5 49,600 Results for Metod = III Variable Laborant N Mean Kopparhalt A 5 50,200 B 5 50,000 C 5 49,600 Results for Metod = IV Variable Laborant N Mean Kopparhalt A 5 52,000 B 5 51,600 C 5 49,400 Stat Basic Statistics Display Descriptive Statistics 5
Stat ANOVA Interactions Plot 6
Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 58,850 19,617 6,34 0,001 Laborant 2 31,033 15,517 5,01 0,010 Error 54 167,100 3,094 Lack-of-Fit 6 7,100 1,183 0,35 0,903 Pure Error 48 160,000 3,333 Total 59 256,983 Vi finner att det både finns en metod-effekt och en laborant-effekt. Stat ANOVA General Linear Model Fit General Linear Model 7
Antag att data ser ut på följande sätt. Samspel!!! Metod-effekten verkar vara olika för de olika laboranterna! Tyder på samspel!
Modell: Y ijk = m + a i + b j + (ab) ij + e ijk, i = 1, 2,, a, e ijk N(0, s 2 ) Samspelseffekt mellan Metod och Laborant j = 1, 2,, b, k = 1, 2,,n. Hypoteser: (1) H 0 : (ab) 11 = = (ab) ab = 0. (2) H 0 : a 1 = = a a = 0 (2) H 0 : b 1 = = b b = 0 9
Om hypotesen H 0 : (ab) 11 = = (ab) ab = 0 inte förkastas och vi tror på att det inte finns ett samspel kan vi gå vidare och testa de övriga hypoteserna (huvudeffekterna). Om det då finns en signifikant huvudeffekt kan vi göra parvisa jämförelser. 10
Låt oss betrakta datamaterialet som inte har samspel. 11
Test for Equal Variances: Kopparhalt vs Metod; Laborant Multiple comparison intervals for the standard deviation, α = 0,05 Metod I II Laborant A B C A B C Multiple Comparisons P-Value 0,893 Levene s Test P-Value 0,958 III A B C IV A B C 0 2 4 6 8 10 12 14 16 If intervals do not overlap, the corresponding stdevs are significantly different. Stat ANOVA Test for Equal Variances 12
Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 58,850 19,617 5,88 0,002 Laborant 2 31,033 15,517 4,65 0,014 Metod*Laborant 6 7,100 1,183 0,35 0,903 Error 48 160,000 3,333 Total 59 256,983 Vi har inte ett signifikant samspel. Däremot är både metod och laborant signifikanta. Vi kan gå vidare med parvisa jämförelser. Vi kan ej påvisa samspel! 13
Tukey Pairwise Comparisons: Response = Kopparhalt, Term = Metod Grouping Information Using the Tukey Method and 95% Confidence Metod N Mean Grouping IV 15 51,0000 A II 15 50,6000 A III 15 49,9333 A B I 15 48,4000 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference of Metod Difference SE of Simultaneous Adjusted Levels of Means Difference 95% CI T-Value P-Value II - I 2,200 0,667 ( 0,428; 3,972) 3,30 0,010 III - I 1,533 0,667 (-0,239; 3,306) 2,30 0,112 IV - I 2,600 0,667 ( 0,828; 4,372) 3,90 0,002 III - II -0,667 0,667 (-2,439; 1,106) -1,00 0,750 IV - II 0,400 0,667 (-1,372; 2,172) 0,60 0,932 IV - III 1,067 0,667 (-0,706; 2,839) 1,60 0,388 Individual confidence level = 98,94% 14
Tukey Pairwise Comparisons: Response = Kopparhalt, Term = Laborant Grouping Information Using the Tukey Method and 95% Confidence Laborant N Mean Grouping A 20 50,70 A B 20 50,25 A B C 20 49,00 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference of Laborant Difference SE of Simultaneous Adjusted Levels of Means Difference 95% CI T-Value P-Value B - A -0,450 0,577 (-1,846; 0,946) -0,78 0,717 C - A -1,700 0,577 (-3,096; -0,304) -2,94 0,014 C - B -1,250 0,577 (-2,646; 0,146) -2,17 0,088 Individual confidence level = 98,06% 15
Om däremot hypotesen H 0 : (ab) 11 = = (ab) ab = 0 förkastas har vi samspel och testen av huvudeffekterna har ingen praktisk betydelse. Vad man kan göra är att antingen göra parvisa jämförelser (Tukey s) mellan alla faktorkombinationer (här 66 st) eller dela upp datamaterialet i mindre bitar och analysera dessa. Här skulle vi t.ex. kunna dela upp datamaterialet i tre delar, en för varje laborant. Sedan kan vi testa skillnader mellan metoder för varje laborant. Låt oss betrakta datamaterial med samspel 16
Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 84,18 28,061 9,76 0,000 Laborant 2 20,80 10,400 3,62 0,034 Metod*Laborant 6 53,87 8,978 3,12 0,012 Error 48 138,00 2,875 Total 59 296,85 Vi har samspel! Vi kan nu t.ex. jämföra Metod inom varje Laborant. Stat ANOVA General Linear Model 17
Results for: kopparhalt fem obs samspel.mtw(laborant = A) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 92,55 30,850 11,22 0,000 Error 16 44,00 2,750 Total 19 136,55 Results for: kopparhalt fem obs samspel.mtw(laborant = B) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 20,55 6,850 3,11 0,056 Error 16 35,20 2,200 Total 19 55,75 Data Split Worksheet Stat ANOVA One-Way 19
Results for: kopparhalt fem obs samspel.mtw(laborant = C) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 24,95 8,317 2,26 0,120 Error 16 58,80 3,675 Total 19 83,75 Vi finner att det enbart finns en Metodeffekt för Laborant A. Här kan vi sedan gå vidare med Tukey s test för att avgöra vilka metoder som skiljer sig åt hos Laborant A. Vi kunde även ha valt att splitta på Metod och jämfört Laborant. Data Split Worksheet Stat ANOVA One-Way 20
8.1.4 Random effects model Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra olika metoder (en stor mängd av metoder existerar) att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets laboranter genomför sina uppgifter. För att utreda detta slumpades tre laboranterna ut (A, B, C) som vardera göra fem bestämningar av kopparhalten (slumpmässig ordning) med var och en av fem slumpmässigt valda metoder (I-IV). I detta fall vill vi testa skillnader mellan Metoder respektive Laboranter. Både Metod och Laborant betraktas som random faktorer. Resultatet generaliseras till alla Metoder respektive Laboranter. 21
8.2.1 2 2 factorial experimental designs De flesta processer beror på flera (kontrollerbara) faktorer, t.ex. temperatur, tryck, tid,. Inom många industriella tillämpningar är man intresserad av hur en responsvariabel påverkas av förändringar i ett antal faktorer. För att t.ex. kunna styra (förbättra, optimera) en process behöver man ha vetskapen om sambandet mellan dessa faktorer och responsvariabeln. y = f(x 1,, x m ) Genom att systematiskt variera faktornivåerna kan man på ett kostnadseffektivt sätt hitta optimum hos responsvariabeln. Inom Försöksplanering (Design of Experiments, DOE) finns en mängd olika varianter på försöksdesigner. Valet av design beror mycket på hur många faktorer man vill studera och vilka resurser man har. 22
8.2.1 2 2 factorial experimental designs Faktoriellt försök: Anta att vi har en responsvariabel Y och flera förklarande variabler X 1, X 2. De förklarande variablerna är kontrollerbara, dvs vi kan bestämma vilka nivåer dessa skall ha. De förklarande variablerna mäts vanligtvis på två nivåer och betraktas som faktorer. Betecknas ofta A, B, C, Målet är att hitta den kombination av faktornivåer som optimerar Y (på ett så kostnadseffektivt sätt som möjligt). 2 k faktoriellt försök = k faktorer som alla mäts på 2 nivåer. 3 k faktoriellt försök = k faktorer som alla mäts på 3 nivåer. 23
8.2.1 2 2 factorial experimental designs Exempel: Betrakta en kemisk process där Y = verkningsgraden (%). Faktorer: A: X 1 = reaktionstid (h) B: X 2 = temperatur (ºF) I nuläget körs processen med X 1 = 1.7 h och X 2 = 155 ºF vilket ger en verkningsgrad på 75%. Faktorerna A och B varieras på två nivåer vardera: A hög = 1.7 + 0.5 = 2.2 h B hög = 155 + 10 = 165 ºF A låg = 1.7 0.5 = 1.2 h B låg = 155 10 = 145 ºF 24
8.2.1 2 2 factorial experimental designs Verkningsgraden mäts för alla kombinationer av faktornivåerna, dvs 2 2 = 4 st. Vi genomför då ett 2 2 faktoriellt försök. B hög B låg Medel A hög 58 % 69 % 63.5% A låg 82 % 56 % 69 % Medel 70 % 62.5 % 66.25 % Huvudeffekter: Här beror t.ex. A-effekten på vilken nivå B-effekten är på. B hög : A-effekt = 58-82 = -24 % B låg : A-effekt = 69 56 = 13 % Faktorerna A och B samvarierar, dvs vi har samspel. Samspelseffekten: (13-(-24))/2 = 18.5 % A-effekt (tid)= 63.5 69 = -5.5 % B-effekt (temp) = 70 62.5 = 7.5 % Dessa bör vara relativt lika om inget samspel föreligger 25
8.2.1 2 2 factorial experimental designs Stat DOE Factorial Create Factorial Design 26
8.2.1 2 2 factorial experimental designs 1-1 B hög B låg Medel 1 A hög 58 % 69 % 63.5% -1 A låg 82 % 56 % 69 % Medel 70 % 62.5 % 66.25 % Stat DOE Factorial Create Factorial Design 27
8.2.1 2 2 factorial experimental designs -5.5% -24% 26% -11% 7.5% 13% Stat DOE Factorial Factorial Plots 28
8.2.1 2 2 factorial experimental designs För att kunna testa samspelseffekter måste vi ha replikat. Anta att vi observerade följande: tid temp B hög B låg Medel A hög 57 %, 59 % 68 %, 70 % 63.5% A låg 81 %, 83 % 55 %, 57 % 69 % Medel 70 % 62.5 % 66.25 % I och med att kolumnmedelvärdena och radmedelvärdena är oförändrade så kvarstår alla effekter. 29
8.2.1 2 2 factorial experimental designs Factorial Regression: verkningsgrad versus tid; temp Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Model 3 857,500 285,833 142,92 0,000 Linear 2 173,000 86,500 43,25 0,002 tid 1 60,500 60,500 30,25 0,005 temp 1 112,500 112,500 56,25 0,002 2-Way Interactions 1 684,500 684,500 342,25 0,000 tid*temp 1 684,500 684,500 342,25 0,000 Error 4 8,000 2,000 Total 7 865,500 Model Summary S R-sq R-sq(adj) R-sq(pred) 1,41421 99,08% 98,38% 96,30% Vi kan påvisa ett samspel! Stat DOE Factorial Analyze Factorial Design 30
8.2.1 2 2 factorial experimental designs Coded Coefficients Term Effect Coef SE Coef T-Value P-Value VIF Constant 66,250 0,500 132,50 0,000 tid -5,500-2,750 0,500-5,50 0,005 1,00 temp 7,500 3,750 0,500 7,50 0,002 1,00 tid*temp -18,500-9,250 0,500-18,50 0,000 1,00 Regression Equation in Uncoded Units verkningsgrad = 66,250-2,750 tid + 3,750 temp - 9,250 tid*temp Modell: Y medel = Overall mean + coeff tid *tid + coeff temp *temp + coeff tid*temp, *tid*temp där tid och temp är 1 vid hög och -1 vid låg. T.ex. om både tid och temp är hög får vi Y medel = 66.25 + (-2.75)*1 + 3.75*1 + (-9.25)*1*1 = 58 om tid är hög och temp är låg får vi Y medel = 66.25 + (-2.75)*1 + 3.75*(-1) + (-9.25)*1*(-1) = 69 31
8.2.1 2 2 factorial experimental designs 32