Föreläsning 15: Faktorförsök Matematisk statistik Chalmers University of Technology Oktober 17, 2016
Ensidig variansanalys Vi vill studera om en faktor A påverkar en responsvariabel. Vi gör totalt N = a i=1 n i mätningar vid a olika faktornivåer: Nivå 1 2 a y 11 y 12 y a1 y 12 y 12 y a2...... y 1n1 y 2n2 y ana Medel: ȳ 1 ȳ 2 ȳ a Ansätt modell y ij = µ + α i + ε ij, där ε ij N(0, σ 2 ) Vi vill nu testa H 0 :α 1 = α 2 = = α a = 0 H 1 :α i α j för några i, j Variansanalys
Variansanalystabell Variansanalys bygger på att vi kan dela upp den totala variationen i den uppmätta datan, a n i SS T ot = (y ij ȳ) 2 i=1 j=1 i två komponenter: SS T ot = SS E + SS A SS E är variationen för datan inom varje faktornivå: a n i SS E = (y ij ȳ i ) 2 i=1 j=1 SS A är variationen mellan faktornivåerna: a SS A = n i (ȳ i ȳ) 2 i=1 Variansanalys
Variansanalystabell Bilda motsvarande medelkvadratsummor MS E = SS E N a, MS A = SS A a 1 Om H 0 är sann så är dessa båda väntevärdesriktiga skattningar av σ 2. Om H 0 inte är sann borde MS A vara större än MS E. Bilda F = MS A /MS E som är F (a 1, N a)-fördelad om H 0 är sann. Vi gör alltså hypotestestet med ett vanligt F-test. Informationen sammanfattas i en ANOVA-tabell: Variation Kvadratsumma Frihetsgrader Medelkvadratsumma Teststorhet Faktor A SS A = ij (ȳ i ȳ) 2 f A = a 1 MS A = SS A /f A MS A /MS E Residual SS E = ij (y ij ȳ i ) 2 f E = i n i a MS E = SS E /f E Total SS T ot = SS E + SS A f = i n i 1 Variansanalys
Tvåsidig variansanalys Vi vill nu studera två faktorer, A och B, samtidigt. Vi gör totalt abn mätningar vid a olika faktornivåer för A och b olika nivåer för B. Ansätt modell y ij = µ + α i + β j + (αβ) ij + ε ij, där ε ij N(0, σ 2 ) och (αβ) ij modellerar en möjlig samspelseffekt mellan A och B. Vi vill testa tre saker 1 Finns det någon samspelseffekt: H 0 : (αβ) ij = 0 för alla ij? 2 Huvudeffekt för A: H 0 : α 1 = α 2 = = α a = 0? 3 Huvudeffekt för B: H 0 : β 1 = β 2 = = β b = 0? Variansanalys
Uppdelning av variationen Inför följande medelvärden: 1 Total medelväde: ȳ = 1 abn a i=1 b j=1 n k=1 y ijk. 2 Medel då A är på nivå α i : ȳ i = 1 bn b j=1 n k=1 y ijk. 3 Medel då B är på nivå β j : ȳ j = 1 an a i=1 n k=1 y ijk. 4 Medel då A och B är på nivåer α i och β j : ȳ ij = 1 n n k=1 y ijk. Vi kan nu dela upp den totala variationen i fyra termer: SS T ot = SS E + SS A + SS B + SS AB Variation för datan inom varje faktornivå: a b n SS E = (y ijk ȳ ij ) 2 i=1 j=1 k=1 Variation av huvudeffekterna: a SS A = nb (ȳ i ȳ) 2, SS B = na i=1 b (ȳ j ȳ) 2 j=1 Variansanalys
Tabell för tvåsidig variansanalys Variation Kvadratsumma Frihetsgrader Medelkvadrat Teststorhet Faktor A SS A f A = a 1 MS A = SS A /f A MS A /MS E Faktor B SS B f B = b 1 MS B = SS B /f B MS B /MS E Faktor AB SS AB f AB = f A f B MS AB = SS AB /f AB MS AB /MS E Residual SS E f E = ab(n 1) MS E = SS E /f E Total SS T ot abn 1 För att utföra de tre hypotesttesterna använder vi att: 1 Om ingen samvariation: MS AB /MS E F (f AB, f E ). 2 Om ingen effekt av faktor A: MS A /MS E F (f A, f E ). 3 Om ingen effekt av faktor B: MS B /MS E F (f B, f E ). Utför respektive hypotestest genom att jämföra respektive teststorhet med kritiskt värde i F-fördelingen. Variansanalys
Analys för fler faktorer Vi kan göra variansanalys också för fler faktorer (Se Sektion 14.2). Problemet är att beräkningarna blir väldigt jobbiga då vi ökar antalet faktorer. En populär typ av försök är 2 k -försök k faktorer testas på två nivåer vardera. Dessa typer av försök är mycket vanliga i försöksplanering. För dessa typer av försök kan vi använda tekniker från linjär regression för att förenkla beräkningarna. För mer avancerade metoder, se kursen i försöksplanering. Faktorförsök
2 3 -försök Försök Medel µ A B C AB AC BC ABC (1) ȳ 111 + - - - + + + - a ȳ 211 + + - - - + + + b ȳ 121 + - + - - - - + ab ȳ 221 + + + - + - - - c ȳ 112 + - - + + - - + ac ȳ 212 + + - + - - - - bc ȳ 122 + - + + - + + - abc ȳ 222 + + + + + + + + Huvudeffekter: A, B, C Samspelseffekter AB, AC, BC, ABC Med θ = Effekt, I θ = (θ ± t α/2 (2 3 (n 1))s/ 2 3 n Faktorförsök
Yates schema Vid räkning för hand på ett 2 k -försök kan beräkningarna underlättas avsevärt genom att använda Yates schema: 1 Skriv effekterna i standardordning i en kolumn (tex för k = 3: (1), a, b, ab, c, ac, bc, abc) 2 Skriv ner motsvarande medelvärden i en ny kolumn. 3 Bilda en ny kolumn (1) där första hälften av värdena är alla parsummor av värden i föregående kolumn, och där andra hälften av värdena är alla pardifferenser. 4 Bilda en ny kolumn (2) genom att upprepa Steg 3, fortsätt med detta tills kolumn (k) bildats. 5 Dela talen i kolumn (k) med 2 k n för att få skattningarna. Faktorförsök
Yates schema (exempel) Steg 1: Steg 2: a 546 - - - - - b 557 - - - - - ab 581 - - - - - c 567 - - - - - ac 579 - - - - - bc 597 - - - - - b 557 - - - - - ab 581 - - - - - c 567 - - - - - ac 579 - - - - - bc 597 - - - - - Steg 3: Steg 4: ab 581 - - - - - c 567 - - - - - ac 579 - - - - - bc 597 - - - - - c 567 - - - - - ac 579 - - - - - bc 597 - - - - - Faktorförsök
Yates schema (exempel) Steg 5: Steg 6: c 567 24 - - - - ac 579 - - - - - bc 597 - - - - - c 567 24 - - - - ac 579 24 - - - - bc 597 - - - - - Steg 3: Steg 4: c 567 24 - - - - ac 579 24 - - - - bc 597 12 - - - - c 567 24 - - - - ac 579 24 - - - - bc 597 12 - - - - abc 609 12 - - - - Faktorförsök
Yates schema (exempel) Steg 5: Steg 6: (1) 522 1068 2206 - - - c 567 24 - - - - ac 579 24 - - - - bc 597 12 - - - - abc 609 12 - - - - (1) 522 1068 2206 - - - a 546 1138 2352 - - - c 567 24 - - - - ac 579 24 - - - - bc 597 12 - - - - abc 609 12 - - - -... Fortsätt på samma sätt... Resultat: (1) 522 1068 2206 4558 ˆµ 569.75 a 546 1138 2352 72  9 b 557 1146 48 130 ˆB 16.25 ab 581 1206 24 0 AB ˆ 0 c 567 24 70 146 Ĉ 18.25 ac 579 24 60-24 AC ˆ -3 bc 597 12 0-10 BC ˆ -1.25 abc 609 12 0 0 ABC ˆ 0 Faktorförsök