LMA201/LMA521: Faktorförsök

Relevanta dokument
LKT325/LMA521: Faktorförsök

LMA201/LMA521: Faktorförsök

LKT325/LMA521: Faktorförsök

Föreläsning 15: Faktorförsök

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

LKT325/LMA521: Faktorförsök

LMA521: Statistisk kvalitetsstyrning

Föreläsning 7. Statistikens grunder.

LMA201/LMA522: Faktorförsök

LMA522: Statistisk kvalitetsstyrning

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Diskussionsproblem för Statistik för ingenjörer

Matematisk statistik LKT325 Tentamen med lösningar

Föreläsning 7: Punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

LMA201/LMA521: Faktorförsök

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Lektionsanteckningar 11-12: Normalfördelningen

FÖRELÄSNING 8:

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12: Regression

Matematisk statistik för B, K, N, BME och Kemister

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Statistisk försöksplanering

Föreläsning 7: Punktskattningar

Föreläsning 12: Linjär regression

FÖRELÄSNING 7:

F13 Regression och problemlösning

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 7: Punktskattningar

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tillämpad matematisk statistik LMA522 (maskin/mekatroniks kurs) Tentamen

Tillämpad matematisk statistik LMA521 Tentamen

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

F9 SAMPLINGFÖRDELNINGAR (NCT

Några extra övningsuppgifter i Statistisk teori

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8: Konfidensintervall

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Examinationsuppgifter del 2

MVE051/MSG Föreläsning 7

10. Konfidensintervall vid två oberoende stickprov

MVE051/MSG Föreläsning 14

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Statistisk försöksplanering

TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder

Föreläsning G60 Statistiska metoder

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LMA521: Statistisk kvalitetsstyrning

Mer om konfidensintervall + repetition

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

LINKÖPINGS UNIVERSITET EXAM TAMS 27 / TEN 2

Matematisk statistik för B, K, N, BME och Kemister

LMA522: Statistisk kvalitetsstyrning

TMS136. Föreläsning 10

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 12, FMSF45 Hypotesprövning

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i Matematisk statistik Kurskod S0001M

Matematisk statistik för D, I, Π och Fysiker

Formel- och tabellsamling i matematisk statistik

Föreläsning 4. Kapitel 5, sid Stickprovsteori

bli bekant med summor av stokastiska variabler.

Sidor i boken f(x) = a x 2 +b x+c

4 Diskret stokastisk variabel

F9 Konfidensintervall

Mer om slumpvariabler

Tentamen för kursen. Linjära statistiska modeller. 13 januari

, s a. , s b. personer från Alingsås och n b

Laboration 2: Styrkefunktion samt Regression

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

TENTAMEN MÅNDAGEN DEN 22 OKTOBER 2012 KL a) Bestäm P(ingen av händelserna inträffar). b) Bestäm P(exakt två av händelserna inträffar).

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

Matematisk statistik för B, K, N, BME och Kemister

Samplingfördelningar 1

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TMS136. Föreläsning 7

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Statistik 1 för biologer, logopeder och psykologer

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

AMatematiska institutionen avd matematisk statistik

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Transkript:

Föreläsning 1

Innehåll Försöksplanering Faktorförsök med två nivåer Skattning av eekterna. Diagram för huvudeekter Diagram för samspelseekter Paretodiagram

Den här veckan kommer tillägnas faktorförsök. En annan bok: Försöksplanering - Faktorförsök av Ulla Dahlbom. Den lilla lila boken.

Statistik kan användas för att undersöka hur olika faktorer (x) påverkar någon given storhet (y ). Om faktorerna är det enda som påverkar y och man kan mäta dessa exakt så är det inte någon slump inblandad. Problemet är då enbart av matematisk natur och statistik behövs inte. I verkligheten är dock detta antagande sällan sant. Mätningar är inexakta och det nns oftast ytterligare faktorer som man inte känner till eller kan mäta. Utan kontroll över mätfelen och de gömda faktorerna så beter sig den uppmätta storheten slumpmässigt.

Eftersom slump är inblandat så modelleras storheten som en slumpvariabel (Y ). Man kan då observera slumpvariabel betingat på olika värden hos de kända faktorerna, (Y x). Om man bara har diskreta värden hos faktorerna (nivåer) så kan man dela upp observerad data i grupper. En grupp för varje unik uppsättning av nivåer hos faktorerna. Exempel Y (0, ): Tiden det tar för :ans spårvagn att åka sin rutt. x 1 : Tiden på dagen ({ 'morgon', 'dag', 'kväll' }) x : Väderlek ({ 'sol', 'regn' }) Antal grupper: 3 = 6.

I exemplet med spårvagnen så kan man fråga sig om sannolikhetsfördelningen för dessa 6 olika grupper är olika och i så fall på vilket sätt? Ofta nöjer man sig med att ta reda på om väntevärdena är olika och vilken grupp som ger det bästa eller värsta värdet (den kortaste eller längsta tiden i exemplet med spårvagnen). Exempel Är E [Y x 1 = morgon, x = sol] < E [Y x 1 = dag, x = regn]?

Planerade försök För att få tillgång till observationer av storheten man är intresserad av så kan man göra på två sätt. Planerat försök: Man kontrollerar själv nivåerna på faktorerna för varje mätning av storheten. Observationsstudie: Man observerar storheten och antecknar vilka nivåer faktorerna hade under observationen. Kan man välja så är data från ett planerat försök att föredra eftersom man kan balansera antalet observationer i varje grupp samt hindra att någon okänd faktor, som också påverkar Y, systematiskt stör slutsatsen. Nackdelen är att ett planerat försök kräver möjlighet att kontrollera nivåerna samt oftast innebär en större arbetsinsats/kostnad.

Faktorförsök Den här veckan kommer vi lära oss planera faktorförsök med två nivåer. D.v.s. hur vi skall utföra ett planerat försök då faktorerna bara kan anta två möjliga nivåer. Då vi endast tänker oss två nivåer per faktor så kan man koda dessa som 'låg nivå'( 1) och 'hög nivå' (+1). Man tänker sig sedan att väntevärdet, µ x, för Y x kan modelleras som funktion av faktornivåerna med parametrar β = [β a, β b, β ab, β c,...]. Exempel: Två faktorer E[Y x] = µ x = β 0 + β a x a + β b x b + β ab x a x b

Termen β a motsvarar hur Y påverkas då faktor A byter nivå om man medelvärdesbildar mellan båda nivåerna på faktor B. Alltså om man tittar på slumpvariabeln Y (x a,x b = 1)+Y (x a,x b =+1). På samma sätt så är β b påverkan av faktor B om man medelvärdesbildar bort faktor A. Termen β ab är en samspelseekt. β ab förklarar hur de två faktorerna tillsammans förstärker eller motverkar den påverkan som redan givits av β a - och β b -eekterna.

Det kan kanske vara lättare att förstå vad β-termerna egentligen symboliserar ifall man beskriver dem på omvänt sätt istället. Låt µ (k,l) = µ (x a = k, x b = l). β 0 = µ ( 1, 1) + µ (+1, 1) + µ ( 1,+1) + µ (+1,+1) β a = µ (+1, 1) + µ (+1,+1) β b = µ ( 1,+1) + µ (+1,+1) β ab = µ (+1,+1) + µ ( 1, 1) µ ( 1, 1) + µ ( 1,+1) µ ( 1, 1) + µ (+1, 1) µ ( 1,+1) + µ (+1, 1)

Målet med ett planerat försök är ofta att upptäcka bästa eller värsta kombinationen av faktorer för ett önskat resultat. Det kan t.ex. vara hur man skall ställa in produktionsprocessen i en fabrik, hur man skall äta och träna för att göra ett bra resultat i en tävling eller vad som är de mest optimala parametrarna i ett inbyggt elektriskt system. Om β a > 0 så innebär det t.ex. att om man låter faktor A vara hög så kommer väntevärdet av Y i genomsnitt vara större än om faktor A är låg. På samma sätt för faktor B. Det kan dock vara så att sampselseekten gör det mer eektivt att låta faktor B vara låg om det är så att samspelseekten är negativ och β a + β b + β ab < β a β b β ab.

Mer än två faktorer? Fungerar på exakt samma sätt. Man behöver nu en parameter för varje faktor (K st om vi antar K faktorer) samt en parameter för varje samspel. Samspel kan vara allt från två-faktorsamspel till ( K K ) K-faktorsamspel. Alltså nns det k= k möjliga samspel. µ x =β 0 + β a x a + β b x b + β c x c +... + β ab x a x b + β ac x a x c + β bc x b x c +... + β abc x a x b x c + β bcd x b x c x d +...

När man utför de planerade försöken kommer man nu få ett antal olika mätningar. Antag att vi gör minst en mätning för varje grupp av samlade nivåer. Vi har då redan kunskapen för att göra punktskattningar av β-parametrarna eftersom vi vet hur man gör punktskattningar av väntevärden. T.ex. eftersom E [Y (+1, +1)] + E [Y (+1, 1)] β a = E [Y ( 1, +1)] + E [Y ( 1, 1)] så är vår punktskattning av β a givet datan (låt oss kalla den l a ) l a =l a + l a = ˆµ (+1,+1) + ˆµ (+1, 1) ˆµ ( 1,+1) + ˆµ ( 1, 1), där ˆµ (+1,+1) = 1 n (+1,+1) n(+1,+1) i=1 y i,(+1,+1), n (+1,+1) är antalet mätningar i grupp (+1, +1) och y i,(+1,+1) är den i:te mätningen i grupp (+1, +1).

På samma sätt så kan vi punktskatta alla andra β-parametrar. Försök nr A B AB Resultat 1 - - + ȳ 1 = + - - ȳ = 3 - + - ȳ 3 = 3 + + + ȳ = Se på tabellen vilka y - värden som skall vara positiva och negativa för respektive eekt.

På samma sätt så kan vi punktskatta alla andra β-parametrar. Försök nr A B AB Resultat 1 - - + ȳ 1 = + - - ȳ = 3 - + - ȳ 3 = 3 + + + ȳ = Se på tabellen vilka y - värden som skall vara positiva och negativa för respektive eekt. l 0 = + + 3 + l a = + l b = 3 + l ab = + + 3 + + 3 = 3.5 = 3 3.5 = 0.5 = 3.5 3 = +0.5 =.5 = +1.5

Som ni ser så kommer skattningar av eekterna att bero på era av mätvärdena ȳ i. Detta stabiliserar skattningen (precis som när vi räknar ut ett stickprovsmedelvärde) fastän om man kanske bara gjort en mätning för varje grupp. Detta skulle ju inte varit fallet om man skattade µ ( 1, 1) direkt som ȳ 1.

Försök nr A B AB Resultat 1 - - + ȳ 1 = + - - ȳ = 3 - + - ȳ 3 = 3 + + + ȳ = ȳ 1 är här stickprovsmedelvärdet av alla mätningar gjorda med uppsätningen av faktornivåer (-1, -1) osv. Om det är mer än en mätning för varje uppsättning faktornivåer, kom ihåg att välja ut när mätningarna sker i experimentet slumpmässigt. Alltså, gör inte alla mätningar för (-1,-1) efter varandra utan slumpa ut ordningen. Detta minskar risken att något systematiskt fel av misstag inkluderas i analysen.

Diagram för huvudeekter y Man kan rita ut huvudeekterna i ett diagram för att lättare få känsla för vad eekterna är när faktorn är låg resp. hög. För faktor A ritar man då ut l a - och l a +-värdena på y-axeln och motsvarande 1 och +1 på x-axeln. Man fortsätter därefter med faktor B, C, etc på samma sätt. 3. 3.3 3. 3.5 3.6 3.7 3.8 l l+ l x l+ l ( 1) X_a (+1) ( 1) X_b (+1) ( 1) X_c (+1) l+ I den här guren ser man att faktor A:s huvudeffekt har störst påverkan eftersom det är störst skillnad mellan l + och l för faktor A. Dessutom ser vi att det är en positiv påverkan då l + > l. (B och C:s huvudeekter påverkar negativt.)

Diagram för samspelseekter Man kan även rita ut diagram för samspelseekterna. Är man t.ex. intresserad av samspelseekten β ab så kan man rita ett streck mellan medelvärdet inom grupperna där faktor B är låg respektive hög då faktor A är låg respektive hög. 0 5 30 35 0 5 50 A+ A A A+ I den här guren ser man att det existerar ett samspel eftersom linjerna inte är parallella mot varandra. µ x = β 0 + β a x a + β b x b + β ab x a x b ( 1) X_b (+1)

Paretodiagram För att tydligt kunna se storleken på de uppskattade eekterna så kan man rita upp ett Paretodiagram. 0.0 0.5 1.0 1.5.0 1.5 0.5 0.5 Rangordna eekterna i storleksordning utan hänsyn till tecken. Rita in staplarna (störst till vänster och sedan i avtagande ordning). AxB A B Figur: Paretodiagram över de uppskattade eekterna från exemplet ovan.

Paretodiagram I boken ritar de dem liggande. AxB 1.5 A 0.5 B 0.5 0.0 0.5 1.0 1.5.0 Figur: Paretodiagram över de uppskattade eekterna från exemplet ovan.

Sammanfattning Vi vill utföra planerade faktorförsök för att ta reda på hur en viss storhet påverkas av förändringar i bakomliggande faktorer. Vi bryr oss nu bara om hur väntevärdet förändras då faktorerna skiftas mellan höga och låga nivåer. Om vi har K olika faktorer så kommer vi behöva göra minst K olika mätningar för att uppskatta alla eekter i vår modell. Vid mer än en mätning för varje nivåuppsättning så välj ut ordningen på mätföljden slumpmässigt. Då undviker man att få med eventuella systematiska fel. Visualisera de skattade eekterna med diagram.

Exempel Försök nr A B C AB BC AC ABC Resultat 1 - - - + + + - y1 = [3.7,.8] + - - - + - + y = [.8,.8] 3 - + - - - + + y3 = [18.7, 17.1] + + - + - - - y = [13.5, 1.1] 5 - - + + - - + y5 = [10.1, 11.7] 6 + - + - - + - y6 = [8.8, 9.3] 7 - + + - + - - y7 = [17.7, 16.9] 8 + + + + + + + y8 = [0., 0.]

Försök nr A B C AB BC AC ABC Resultat 1 - - - + + + - ȳ1 = 3.5 + - - - + - + ȳ =.80 3 - + - - - + + ȳ3 = 17.9 + + - + - - - ȳ = 13.8 5 - - + + - - + ȳ5 = 10.9 6 + - + - - + - ȳ6 = 9.05 7 - + + - + - - ȳ7 = 17.30 8 + + + + + + + ȳ8 = 0.10 l 0 = 3.5 +.80 + 17.9 + 13.8 + 10.9 + 9.05 + 17.30 + 0.10 8 = 9.6 l a =.80 + 13.8 + 9.05 + 0.10 3.5 + 17.9 + 10.9 + 17.30 = 5.

Försök nr A B C AB BC AC ABC Resultat 1 - - - + + + - ȳ1 = 3.5 + - - - + - + ȳ =.80 3 - + - - - + + ȳ3 = 17.9 + + - + - - - ȳ = 13.8 5 - - + + - - + ȳ5 = 10.9 6 + - + - - + - ȳ6 = 9.05 7 - + + - + - - ȳ7 = 17.30 8 + + + + + + + ȳ8 = 0.10 l b = 17.9 + 13.8 + 17.3 + 0.1 3.5 +.8 + 10.9 + 9.05 = 5.8 l c = 10.9 + 9.05 + 17.3 + 0.1 3.5 +.8 + 17.9 + 13.8 = 0.60

Försök nr A B C AB BC AC ABC Resultat 1 - - - + + + - ȳ1 = 3.5 + - - - + - + ȳ =.80 3 - + - - - + + ȳ3 = 17.9 + + - + - - - ȳ = 13.8 5 - - + + - - + ȳ5 = 10.9 6 + - + - - + - ȳ6 = 9.05 7 - + + - + - - ȳ7 = 17.30 8 + + + + + + + ȳ8 = 0.10 l ab = 3.5 + 13.8 + 10.9 + 0.1.8 + 17.9 + 9.05 + 17.3 = 5.5 l bc = 3.5 +.8 + 17.3 + 0.1 17.9 + 13.8 + 10.9 + 9.05 = 6.55

Försök nr A B C AB BC AC ABC Resultat 1 - - - + + + - ȳ1 = 3.5 + - - - + - + ȳ =.80 3 - + - - - + + ȳ3 = 17.9 + + - + - - - ȳ = 13.8 5 - - + + - - + ȳ5 = 10.9 6 + - + - - + - ȳ6 = 9.05 7 - + + - + - - ȳ7 = 17.30 8 + + + + + + + ȳ8 = 0.10 l ac = 3.5 + 17.9 + 9.05 + 0.1.8 + 13.8 + 10.9 + 17.3 =.13 l abc =.8 + 17.9 + 10.9 + 0.1 3.5 + 13.8 + 9.05 + 17.3 =.3

0 6 8 6.6 5. 5.3 5..1. 0.6 BxC A B AxB AxC AxBxC C Figur: Paretodiagram.

0 5 10 15 l l+ l l+ l l+ ( 1) X_a (+1) ( 1) X_b (+1) ( 1) X_c (+1) Figur: Diagram för huvudeekter.

0 5 10 15 0 B C+ B C B+C B+C+ B+C : medelvärdet av alla ȳ i där faktor B är hög och faktor C är låg. Samspelseekten är tydlig då linjerna inte är parallella. Att vinkeln är stor mellan linjerna visar att samspelseekten är stor. ( 1) X_b (+1) (a) Samspelsgraf för BxC.