8.1 General factorial experiments

Relevanta dokument
7.5 Experiment with a single factor having more than two levels

Tentamen i matematisk statistik

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Tentamen i matematisk statistik

Metod och teori. Statistik för naturvetare Umeå universitet

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

7.5 Experiment with a single factor having more than two levels

TENTAMEN I MATEMATISK STATISTIK

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

10.1 Enkel linjär regression

Räkneövning 3 Variansanalys

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Skrivning i ekonometri torsdagen den 8 februari 2007

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Skrivning i ekonometri lördagen den 29 mars 2008

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Följande resultat erhålls (enhet: 1000psi):

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Tentamen i matematisk statistik

Exempel 1 på multipelregression

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Exempel 1 på multipelregression

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Statistik för teknologer, 5 poäng Skrivtid:

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Skrivning i ekonometri lördagen den 15 januari 2005

Examinationsuppgifter del 2

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

Tentamen i matematisk statistik

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3

Skrivning i ekonometri lördagen den 25 augusti 2007

Regressions- och Tidsserieanalys - F3

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen Tillämpad statistik A5 (15hp)

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Experiment med två faktorer. Treatment Population. Balanced och ortogonal design. Graph of means. Table of means

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Regressions- och Tidsserieanalys - F4

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

TAMS38 Försöksplanering och biostatistik, 4 p / 6 hp Tentamen tisdagen den 12 januari 2016 kl

Tentamen i matematisk statistik

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Tentamen i Matematisk statistik, S0001M, del 1,

Regressions- och Tidsserieanalys - F7

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

OBS! Vi har nya rutiner.

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Lösningar till SPSS-övning: Analytisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Samhällsvetenskaplig metod, 7,5 hp

Sconesbakning. Sofi Bergdahl Anna Kers Johanna Nyberg Josefin Persson

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

OBS! Vi har nya rutiner.

Forsknings- och undersökningsmetodik Skrivtid: 4h

TENTAMEN I STATISTIK B,

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

3.1 Beskrivande statistik

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

sociology Unit B1: Introduction to correlation and regression 3/3 Brendan Halpin May

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamensresultat anslås (anslagstavla och kursportal) senast 3 veckor efter tentamen.

Regressions- och Tidsserieanalys - F5

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F1

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Regressions- och Tidsserieanalys - F1

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 08 June 2015, 14:00-18:00. English Version

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

2.1 Minitab-introduktion

ANOVA Mellangruppsdesign

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

OBS! Vi har nya rutiner.

Transkript:

Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra fyra olika metoder att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets tre laboranter genomför sina uppgifter. För att utreda detta fick de tre laboranterna (A, B, C) vardera göra fem bestämningar av kopparhalten (slumpmässig ordning) med var och en av metoderna (I-IV). Låt oss analysera detta där vi har två fixa faktorer vi vill testa. 1

Modell: Y ijk = m + a i + b j + e ijk, i = 1, 2,, a, j = 1, 2,, b, e ijk N(0, s 2 ) k = 1, 2,,n. Samma modell som vid block-försöket bortsett att vi antar att b också är en faktor som vi vill testa. Inte bara blocka bort den skillnad som faktor b kan bidra med. Hypoteser: H 0 : a 1 = = a a = 0 H 0 : b 1 = = b b = 0 2

Descriptive Statistics: Kopparhalt Variable N Mean Kopparhalt 60 49,983 ------- Descriptive Statistics: Kopparhalt Variable Metod N Mean Kopparhalt I 15 48,400 II 15 50,600 III 15 49,933 IV 15 51,000 ------- Descriptive Statistics: Kopparhalt Variable Laborant N Mean Kopparhalt A 20 50,700 B 20 50,250 C 20 49,000 Stat Basic Statistics Display Descriptive Statistics 3

Stat ANOVA Main Effects Plot 4

Descriptive Statistics: Kopparhalt Results for Metod = I Variable Laborant N Mean Kopparhalt A 5 49,00 B 5 48,800 C 5 47,400 Results for Metod = II Variable Laborant N Mean Kopparhalt A 5 51,600 B 5 50,600 C 5 49,600 Results for Metod = III Variable Laborant N Mean Kopparhalt A 5 50,200 B 5 50,000 C 5 49,600 Results for Metod = IV Variable Laborant N Mean Kopparhalt A 5 52,000 B 5 51,600 C 5 49,400 Stat Basic Statistics Display Descriptive Statistics 5

Stat ANOVA Interactions Plot 6

Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 58,850 19,617 6,34 0,001 Laborant 2 31,033 15,517 5,01 0,010 Error 54 167,100 3,094 Lack-of-Fit 6 7,100 1,183 0,35 0,903 Pure Error 48 160,000 3,333 Total 59 256,983 Vi finner att det både finns en metod-effekt och en laborant-effekt. Stat ANOVA General Linear Model Fit General Linear Model 7

Antag att data ser ut på följande sätt. Samspel!!! Metod-effekten verkar vara olika för de olika laboranterna! Tyder på samspel!

Modell: Y ijk = m + a i + b j + (ab) ij + e ijk, i = 1, 2,, a, e ijk N(0, s 2 ) Samspelseffekt mellan Metod och Laborant j = 1, 2,, b, k = 1, 2,,n. Hypoteser: (1) H 0 : (ab) 11 = = (ab) ab = 0. (2) H 0 : a 1 = = a a = 0 (2) H 0 : b 1 = = b b = 0 9

Om hypotesen H 0 : (ab) 11 = = (ab) ab = 0 inte förkastas och vi tror på att det inte finns ett samspel kan vi gå vidare och testa de övriga hypoteserna (huvudeffekterna). Om det då finns en signifikant huvudeffekt kan vi göra parvisa jämförelser. 10

Låt oss betrakta datamaterialet som inte har samspel. 11

Test for Equal Variances: Kopparhalt vs Metod; Laborant Multiple comparison intervals for the standard deviation, α = 0,05 Metod I II Laborant A B C A B C Multiple Comparisons P-Value 0,893 Levene s Test P-Value 0,958 III A B C IV A B C 0 2 4 6 8 10 12 14 16 If intervals do not overlap, the corresponding stdevs are significantly different. Stat ANOVA Test for Equal Variances 12

Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 58,850 19,617 5,88 0,002 Laborant 2 31,033 15,517 4,65 0,014 Metod*Laborant 6 7,100 1,183 0,35 0,903 Error 48 160,000 3,333 Total 59 256,983 Vi har inte ett signifikant samspel. Däremot är både metod och laborant signifikanta. Vi kan gå vidare med parvisa jämförelser. Vi kan ej påvisa samspel! 13

Tukey Pairwise Comparisons: Response = Kopparhalt, Term = Metod Grouping Information Using the Tukey Method and 95% Confidence Metod N Mean Grouping IV 15 51,0000 A II 15 50,6000 A III 15 49,9333 A B I 15 48,4000 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference of Metod Difference SE of Simultaneous Adjusted Levels of Means Difference 95% CI T-Value P-Value II - I 2,200 0,667 ( 0,428; 3,972) 3,30 0,010 III - I 1,533 0,667 (-0,239; 3,306) 2,30 0,112 IV - I 2,600 0,667 ( 0,828; 4,372) 3,90 0,002 III - II -0,667 0,667 (-2,439; 1,106) -1,00 0,750 IV - II 0,400 0,667 (-1,372; 2,172) 0,60 0,932 IV - III 1,067 0,667 (-0,706; 2,839) 1,60 0,388 Individual confidence level = 98,94% 14

Tukey Pairwise Comparisons: Response = Kopparhalt, Term = Laborant Grouping Information Using the Tukey Method and 95% Confidence Laborant N Mean Grouping A 20 50,70 A B 20 50,25 A B C 20 49,00 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference of Laborant Difference SE of Simultaneous Adjusted Levels of Means Difference 95% CI T-Value P-Value B - A -0,450 0,577 (-1,846; 0,946) -0,78 0,717 C - A -1,700 0,577 (-3,096; -0,304) -2,94 0,014 C - B -1,250 0,577 (-2,646; 0,146) -2,17 0,088 Individual confidence level = 98,06% 15

Om däremot hypotesen H 0 : (ab) 11 = = (ab) ab = 0 förkastas har vi samspel och testen av huvudeffekterna har ingen praktisk betydelse. Vad man kan göra är att antingen göra parvisa jämförelser (Tukey s) mellan alla faktorkombinationer (här 66 st) eller dela upp datamaterialet i mindre bitar och analysera dessa. Här skulle vi t.ex. kunna dela upp datamaterialet i tre delar, en för varje laborant. Sedan kan vi testa skillnader mellan metoder för varje laborant. Låt oss betrakta datamaterial med samspel 16

Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 84,18 28,061 9,76 0,000 Laborant 2 20,80 10,400 3,62 0,034 Metod*Laborant 6 53,87 8,978 3,12 0,012 Error 48 138,00 2,875 Total 59 296,85 Vi har samspel! Vi kan nu t.ex. jämföra Metod inom varje Laborant. Stat ANOVA General Linear Model 17

Results for: kopparhalt fem obs samspel.mtw(laborant = A) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 92,55 30,850 11,22 0,000 Error 16 44,00 2,750 Total 19 136,55 Results for: kopparhalt fem obs samspel.mtw(laborant = B) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 20,55 6,850 3,11 0,056 Error 16 35,20 2,200 Total 19 55,75 Data Split Worksheet Stat ANOVA One-Way 19

Results for: kopparhalt fem obs samspel.mtw(laborant = C) One-way ANOVA: Kopparhalt versus Metod Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Metod 3 24,95 8,317 2,26 0,120 Error 16 58,80 3,675 Total 19 83,75 Vi finner att det enbart finns en Metodeffekt för Laborant A. Här kan vi sedan gå vidare med Tukey s test för att avgöra vilka metoder som skiljer sig åt hos Laborant A. Vi kunde även ha valt att splitta på Metod och jämfört Laborant. Data Split Worksheet Stat ANOVA One-Way 20

8.1.4 Random effects model Exempel: Vid ett tillfälle ville man på ett laboratorium jämföra olika metoder (en stor mängd av metoder existerar) att bestämma kopparhalten i malmprover. Man är även intresserad av hur laboratoriets laboranter genomför sina uppgifter. För att utreda detta slumpades tre laboranterna ut (A, B, C) som vardera göra fem bestämningar av kopparhalten (slumpmässig ordning) med var och en av fem slumpmässigt valda metoder (I-IV). I detta fall vill vi testa skillnader mellan Metoder respektive Laboranter. Både Metod och Laborant betraktas som random faktorer. Resultatet generaliseras till alla Metoder respektive Laboranter. 21

8.2.1 2 2 factorial experimental designs De flesta processer beror på flera (kontrollerbara) faktorer, t.ex. temperatur, tryck, tid,. Inom många industriella tillämpningar är man intresserad av hur en responsvariabel påverkas av förändringar i ett antal faktorer. För att t.ex. kunna styra (förbättra, optimera) en process behöver man ha vetskapen om sambandet mellan dessa faktorer och responsvariabeln. y = f(x 1,, x m ) Genom att systematiskt variera faktornivåerna kan man på ett kostnadseffektivt sätt hitta optimum hos responsvariabeln. Inom Försöksplanering (Design of Experiments, DOE) finns en mängd olika varianter på försöksdesigner. Valet av design beror mycket på hur många faktorer man vill studera och vilka resurser man har. 22

8.2.1 2 2 factorial experimental designs Faktoriellt försök: Anta att vi har en responsvariabel Y och flera förklarande variabler X 1, X 2. De förklarande variablerna är kontrollerbara, dvs vi kan bestämma vilka nivåer dessa skall ha. De förklarande variablerna mäts vanligtvis på två nivåer och betraktas som faktorer. Betecknas ofta A, B, C, Målet är att hitta den kombination av faktornivåer som optimerar Y (på ett så kostnadseffektivt sätt som möjligt). 2 k faktoriellt försök = k faktorer som alla mäts på 2 nivåer. 3 k faktoriellt försök = k faktorer som alla mäts på 3 nivåer. 23

8.2.1 2 2 factorial experimental designs Exempel: Betrakta en kemisk process där Y = verkningsgraden (%). Faktorer: A: X 1 = reaktionstid (h) B: X 2 = temperatur (ºF) I nuläget körs processen med X 1 = 1.7 h och X 2 = 155 ºF vilket ger en verkningsgrad på 75%. Faktorerna A och B varieras på två nivåer vardera: A hög = 1.7 + 0.5 = 2.2 h B hög = 155 + 10 = 165 ºF A låg = 1.7 0.5 = 1.2 h B låg = 155 10 = 145 ºF 24

8.2.1 2 2 factorial experimental designs Verkningsgraden mäts för alla kombinationer av faktornivåerna, dvs 2 2 = 4 st. Vi genomför då ett 2 2 faktoriellt försök. B hög B låg Medel A hög 58 % 69 % 63.5% A låg 82 % 56 % 69 % Medel 70 % 62.5 % 66.25 % Huvudeffekter: Här beror t.ex. A-effekten på vilken nivå B-effekten är på. B hög : A-effekt = 58-82 = -24 % B låg : A-effekt = 69 56 = 13 % Faktorerna A och B samvarierar, dvs vi har samspel. Samspelseffekten: (13-(-24))/2 = 18.5 % A-effekt (tid)= 63.5 69 = -5.5 % B-effekt (temp) = 70 62.5 = 7.5 % Dessa bör vara relativt lika om inget samspel föreligger 25

8.2.1 2 2 factorial experimental designs Stat DOE Factorial Create Factorial Design 26

8.2.1 2 2 factorial experimental designs 1-1 B hög B låg Medel 1 A hög 58 % 69 % 63.5% -1 A låg 82 % 56 % 69 % Medel 70 % 62.5 % 66.25 % Stat DOE Factorial Create Factorial Design 27

8.2.1 2 2 factorial experimental designs -5.5% -24% 26% -11% 7.5% 13% Stat DOE Factorial Factorial Plots 28

8.2.1 2 2 factorial experimental designs För att kunna testa samspelseffekter måste vi ha replikat. Anta att vi observerade följande: tid temp B hög B låg Medel A hög 57 %, 59 % 68 %, 70 % 63.5% A låg 81 %, 83 % 55 %, 57 % 69 % Medel 70 % 62.5 % 66.25 % I och med att kolumnmedelvärdena och radmedelvärdena är oförändrade så kvarstår alla effekter. 29

8.2.1 2 2 factorial experimental designs Factorial Regression: verkningsgrad versus tid; temp Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Model 3 857,500 285,833 142,92 0,000 Linear 2 173,000 86,500 43,25 0,002 tid 1 60,500 60,500 30,25 0,005 temp 1 112,500 112,500 56,25 0,002 2-Way Interactions 1 684,500 684,500 342,25 0,000 tid*temp 1 684,500 684,500 342,25 0,000 Error 4 8,000 2,000 Total 7 865,500 Model Summary S R-sq R-sq(adj) R-sq(pred) 1,41421 99,08% 98,38% 96,30% Vi kan påvisa ett samspel! Stat DOE Factorial Analyze Factorial Design 30

8.2.1 2 2 factorial experimental designs Coded Coefficients Term Effect Coef SE Coef T-Value P-Value VIF Constant 66,250 0,500 132,50 0,000 tid -5,500-2,750 0,500-5,50 0,005 1,00 temp 7,500 3,750 0,500 7,50 0,002 1,00 tid*temp -18,500-9,250 0,500-18,50 0,000 1,00 Regression Equation in Uncoded Units verkningsgrad = 66,250-2,750 tid + 3,750 temp - 9,250 tid*temp Modell: Y medel = Overall mean + coeff tid *tid + coeff temp *temp + coeff tid*temp, *tid*temp där tid och temp är 1 vid hög och -1 vid låg. T.ex. om både tid och temp är hög får vi Y medel = 66.25 + (-2.75)*1 + 3.75*1 + (-9.25)*1*1 = 58 om tid är hög och temp är låg får vi Y medel = 66.25 + (-2.75)*1 + 3.75*(-1) + (-9.25)*1*(-1) = 69 31

8.2.1 2 2 factorial experimental designs 32