LKT325/LMA521: Faktorförsök

Relevanta dokument
LMA201/LMA521: Faktorförsök

LMA201/LMA522: Faktorförsök

TMS136. Föreläsning 10

Lösningsförslag till Matematisk statistik LKT325 Tentamen

FÖRELÄSNING 8:

TMS136. Föreläsning 13

LMA522: Statistisk kvalitetsstyrning

LMA521: Statistisk kvalitetsstyrning

Lektionsanteckningar 11-12: Normalfördelningen

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 Konfidensintervall

FÖRELÄSNING 7:

Föreläsning 12: Linjär regression

LKT325/LMA521: Faktorförsök

TMS136. Föreläsning 11

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 11: Mer om jämförelser och inferens

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

TMS136. Föreläsning 7

Statistik 1 för biologer, logopeder och psykologer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Demonstration av laboration 2, SF1901

SF1901 Sannolikhetsteori och statistik I

LMA201/LMA521: Faktorförsök

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

LMA201/LMA521: Faktorförsök

F10 Problemlösning och mer om konfidensintervall

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Föreläsning 7: Punktskattningar

Mer om konfidensintervall + repetition

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

MVE051/MSG Föreläsning 14

Datorövning 1: Fördelningar

Föreläsning 6: Hypotestester (forts.)

Statistisk försöksplanering

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

FACIT: Tentamen L9MA30, LGMA30

Grundläggande matematisk statistik

Föreläsning 12: Regression

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

LKT325/LMA521: Faktorförsök

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

TMS136. Föreläsning 4

Sannolikheter och kombinatorik

Statistisk försöksplanering

Föreläsning 4. Kapitel 5, sid Stickprovsteori

4 Diskret stokastisk variabel

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

1.1 Diskret (Sannolikhets-)fördelning

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Studietyper, inferens och konfidensintervall

FACIT: Tentamen L9MA30, LGMA30

Tentamen i Tillämpad matematisk statistik för MI3 den 1 april 2005

Uppgift 1. f(x) = 2x om 0 x 1

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning G60 Statistiska metoder

Introduktion till statistik för statsvetare

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

7.5 Experiment with a single factor having more than two levels

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Experimentella metoder 2014, Räkneövning 1

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Föreläsning 7: Punktskattningar

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Föreläsning 4: Konfidensintervall (forts.)

Lösningsförslag till Tillämpad matematisk statistik LMA521, Tentamen

Kapitel 4. Kontinuerliga slumpvariabler och deras sannolikhetsfördelningar. Sannolikhetslära och inferens II

F13 Regression och problemlösning

Industriell matematik och statistik, LMA /14

, s a. , s b. personer från Alingsås och n b

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 15: Faktorförsök

Övningstenta för MSG830

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Matematisk statistik för B, K, N, BME och Kemister

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Föreläsning 5. Kapitel 6, sid Inferens om en population

SF1901 Sannolikhetsteori och statistik I

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Transkript:

Föreläsning 2

Innehåll Referensfördelning Referensintervall Skatta variansen 1 Flera mätningar i varje grupp. 2 Antag att vissa eekter inte existerar 3 Normalfördelningspapper

Referensfördelning Hittills har vi bara brytt oss om vår skattning av väntevärdena. Vi vet sedan tidigare i kursen att skattningen av väntevärdet i alla praktiska tillämpningar kommer skilja sig från det sanna väntevärdet pga slumpen. Detta innebär bl.a. att faktorer som egentligen inte har någon påverkan kommer ha en skattad eekt som är skild från noll. Hur skall vi veta om vår skattade eekt är en verklig eekt eller bara mätbrus?

Tanken är att vi antar att vi känner till vilken typ av sannolikhetsfördelning som mätbruset följer. I den här kursen kommer vi bara anta att mätbruset är normalfördelat. Detta är ofta ett rimligt antagande (men inte alltid). Referensfördelning Sannolikhetsfördelningen för en skattad eekt (t.ex. l a ), om faktorn egentligen inte har någon eekt. Denna sannolikhetsfördelning kan uppkomma på grund av mätbrus i utrustningen eller på grund av störande faktorer som vi inte har någon kontroll över.

Från början brukar man varken veta vilka faktorer som är signikanta eller referensfördelningen. Om vi antar normalfördelning (och samma varians, σ 2, för alla mätgrupper) så behöver vi bara känna till, σ 2, för att kunna skapa ett kondensintervall.

Från början brukar man varken veta vilka faktorer som är signikanta eller referensfördelningen. Om vi antar normalfördelning (och samma varians, σ 2, för alla mätgrupper) så behöver vi bara känna till, σ 2, för att kunna skapa ett kondensintervall. Var[l a ] =Var + Var [ ˆµ ] (+1, 1,...) + ˆµ (+1,+1,...) +... 2 N [ ˆµ ] ( 1, 1,...) + ˆµ ( 1,+1,...) +... 2 N ( ) = 4 σ 2 + σ2 +... N 2 n n = 4 Nσ 2 N 2 n = 4σ2 Nn, där N är antal olika grupper och n är antal mätningar inom varje grupp.

Om referensfördelningen är normalfördelad så kommer de skattade eekterna, i de fall då inga riktiga eekter existerar, vara normalfördelade med N(0, 4σ2 Nn ). Kondensintervall kan beräknas såsom vi är vana vid: l a ± Z α/2 2σ Nn Tricket till att avgöra om den skattade eekten skall anses signikant eller inte är alltså huruvida kondensintervallet inkluderar 0 eller inte. Är 0 inkluderat kan vi inte utesluta att eekten egentligen inte existerar och det bara var mätbrus som gav oss ett värde skilt från 0. Vi får exakt samma slutsats om vi istället centrerar intervallet i 0 och tittar på vilka skattade eekter som är inkluderat i intervallet eller inte. Vi kallar det då istället för referensintervall.

Om vi nu inte känner till σ 2, vilket man sällan gör. Hur skall vi då göra för att avgöra vilka eekter som är signikanta eller inte? Låt oss titta på tre olika metoder. Var och en har sitt eget användningsområde.

Metod I: Flera mätningar i varje grupp Även om vi inte känner till σ 2 så kan vi skatta den med s 2 (det här känner vi igen från kapitlet om kondensintervaller). Om vi har era mätningar i varje grupp av faktornivåer: Räkna ut s 2 för varje grupp (låt s 2 vara den skattade variansen från i mätningarna i grupp i ). Det går då att slå ihop skattningarna med formeln: s 2 = i(n i 1)s 2 i i (n i 1). Referensintervallet kan sedan beräknas med hjälp av t-fördelningen såsom vi lärt oss, ( 0 ± t α/2 ν = ) 2s (n i 1). Nn i

Exempel Nr A B C AB BC AC ABC Resultat s 2 1 - - - + + + - y1 = [3.7, 2.8] s1 2 = 0.405 2 + - - - + - + y2 = [4.8, 4.8] s2 2 = 0.0 3 - + - - - + + y3 = [18.7, 17.1] s3 2 = 1.28 4 + + - + - - - y4 = [13.5, 14.1] s4 2 = 0.18 5 - - + + - - + y5 = [10.1, 11.7] s5 2 = 1.28 6 + - + - - + - y6 = [8.8, 9.3] s6 2 = 0.125 7 - + + - + - - y7 = [17.7, 16.9] s7 2 = 0.320 8 + + + + + + + y8 = [0.4, 0.2] s8 2 = 0.18

Exempel Nr A B C AB BC AC ABC Resultat s 2 1 - - - + + + - y1 = [3.7, 2.8] s1 2 = 0.405 2 + - - - + - + y2 = [4.8, 4.8] s2 2 = 0.0 3 - + - - - + + y3 = [18.7, 17.1] s3 2 = 1.28 4 + + - + - - - y4 = [13.5, 14.1] s4 2 = 0.18 5 - - + + - - + y5 = [10.1, 11.7] s5 2 = 1.28 6 + - + - - + - y6 = [8.8, 9.3] s6 2 = 0.125 7 - + + - + - - y7 = [17.7, 16.9] s7 2 = 0.320 8 + + + + + + + y8 = [0.4, 0.2] s8 2 = 0.18 s 2 = 1 s2 1 + 1 s2 2 +... 8 = 0.405 + 0 + 1.28 +... 8 = 0.47125 t 0.05/2 (ν = 8) 2s = 2.306 2 0.47125 = 2.306 0.343 = 0.79233 8 2 16

0 2 4 6 8 6.6 5.4 5.3 5.2 4.1 2.4 0.6 BxC A B AxB AxC AxBxC C Figur: Paretodiagram med referensintervall med skattad s 2.

Metod II: Antag icke-existerande eekter Metod I är bäst att använda då vi faktiskt har era mätningar i varje grupp. Vanligtvis kostar dock mätningar tid och pengar så vad skall man göra då man bara har råd med en mätning per grupp?

Metod II: Antag icke-existerande eekter Metod I är bäst att använda då vi faktiskt har era mätningar i varje grupp. Vanligtvis kostar dock mätningar tid och pengar så vad skall man göra då man bara har råd med en mätning per grupp? Antag att du känner till att några eekter egentligen inte existerar. Genom att behandla skattningarna av dessa eekter som olika utfall från referensfördelningen, N(0, 4σ2 ), så kan man sedan Nn skatta σ 2. s 2 = Nn 4 i J l 2 i N J, här är J mängden av grupper som vi inte tror har någon eekt och N J är antal grupper i J. Märk väl att vi inte delar på N J 1 utan bara på N J.

Metod III: Normalfördelningspapper Den sista varianten är en grask metod där vi använder oss av ett s.k. normalfördelningspapper. Med hjälp av ett sådant diagram så kan man identiera ifall mycket av datan ser ut att följa samma normalfördelning. Det går även att se vilka datapunker som inte verkar följa samma fördelning. Det här låter ju bra eftersom endast eekter skattade från referensfördelningen borde följa samma normalfördelning. Alla andra eekter borde inte se ut att komma från en gemensam fördelning

Diagram där man på y- axeln har skrivit ut sannolikheter med ett avstånd emellan som kommer ge en rak linje för en normalfördelning. (a) Normalfördelningspapper

Man kan använda ett sådant diagram för att avgöra om mätningar verkar komma från en normalfördelning eller inte. Man kan även skatta väntevärde samt standardavvikelse för normalfördelad data. Sortera mätningarna från minsta till största. Sortera deras värden som x-axeln i diagrammet, x i blir värdet på den mätning som var nummer i i ordningen från minst till störst. Skatta empiriska fördelningsfunktionen genom att ge varje mätning en sannolikhet beroende på dess plats i den sorterade ordningen, p i = i 0.5 k. Är datan normalfördelad skall punkterna (x i, p i ) nu ligga (approximativt) på en linje.

Vi kan använda ett normalfördelningsdiagram för att avgöra vilka skattade eekter som är signikanta. Först skattar vi alla eekter. Sedan sorterar vi dessa eekter och räknar ut motsvarande sannolikhetsvärde så att vi kan rita in dem i normalfördelningsdiagrammet. Vi tittar sedan på vilka punkter som ser ut att ligga på en linje och drar ett streck genom dessa. De punkter som inte ligger nära linjen anser vi är signikanta eekter då de inte ser ut att följa referensfördelningen.

Exempel i x i p i 1 2.46 0.033 2 2.52 0.100 3 3.46 0.167 4 5.99 0.233 5 7.45 0.3 6 9.02 0.367 7 9.14 0.433 8 9.98 0.500 9 10.18 0.567 10 11.21 0.633 11 12.34 0.70 12 13.44 0.767 13 14.23 0.833 14 15.98 0.90 15 20.48 0.967

Exempel i x i p i 1 2.46 0.033 2 2.52 0.100 3 3.46 0.167 4 5.99 0.233 5 7.45 0.3 6 9.02 0.367 7 9.14 0.433 8 9.98 0.500 9 10.18 0.567 10 11.21 0.633 11 12.34 0.70 12 13.44 0.767 13 14.23 0.833 14 15.98 0.90 15 20.48 0.967

Exempel i x i p i 1 2.46 0.033 2 2.52 0.100 3 3.46 0.167 4 5.99 0.233 5 7.45 0.3 6 9.02 0.367 7 9.14 0.433 8 9.98 0.500 9 10.18 0.567 10 11.21 0.633 11 12.34 0.70 12 13.44 0.767 13 14.23 0.833 14 15.98 0.90 15 20.48 0.967

Exempel Väntevärdet skattas genom att ta det x-värde på det gröna strecket som motsvarar y-värdet 0.5. I det här fallet motsvarar det ungefär 9. Datan i det här exemplet är genererad slumpmässigt. För en riktig referensfördelning borde väntevärdet vara nära 0.

Exempel Standardavvikelsen skattas genom att ta skillnaden mellan x-värdena där det gröna strecket korsar de tjocka streckade horisontella linjerna och dela med 4. s 19+1 = 5. 4

Vi vet att referensfördelningen skall ha väntervärdet 0. Vi kan använda den kunskapen när vi ritar ut vårt streck i normalfördelningsdiagrammet. Tips: anpassa streck för referensfördelningen Det anpassade strecket skall gå igenom punkten som har x-värdet 0 och y-värdet 50%. Strecket skall passa så bra som möjligt till de skattade eekterna omkring x = 0 då dessa är minst och därför troligast tillhör referensfördelningen.

Fördelen med normalfördelningsdiagrammet är att vi inte behöver antaga vilka faktorer som är eektlösa och att vi inte heller kräver många olika mätningar inom samma grupp. Nackdelen är att tolkningen av normfördelningsdiagrammet är subjektiv (vad är tillräckligt långt från linjen och hur skall man välja linjen så den passar så bra som möjligt ihop med punkterna).

Fördelen med normalfördelningsdiagrammet är att vi inte behöver antaga vilka faktorer som är eektlösa och att vi inte heller kräver många olika mätningar inom samma grupp. Nackdelen är att tolkningen av normfördelningsdiagrammet är subjektiv (vad är tillräckligt långt från linjen och hur skall man välja linjen så den passar så bra som möjligt ihop med punkterna). En annan nackdel är att normalfördelningsdiagrammet är ett väldigt långt ord. Men inte lika långt som: nordvästersjökustartilleriygspaningssimulatoranläggningsmaterielunderhållsuppföljningssystemdiskussionsinläggsförberedelsearbeten som tydligen skall vara svenskans längsta ord.

Sammanfattning Eftersom slumpen är inblandad så kommer inte skattade eekter vara exakt samma som riktiga eekter. Om vi känner till referensfördelningen så kan vi sätta en gräns för hur stor en skattad eekt måste vara för att vi skall tro att skattningen har någon signikans. Vi antar normalfördelning hos referensfördelningen och antar att variansen är samma för alla mätgrupper. Variansen kan skattas på tre olika sätt. 1 Skatta variansen i varje grupp och slå ihop dem. 2 Antag att några eekter inte existerar och skatta variansen med hjälp av dessa. 3 Rita ut de skattade eekterna på ett normalfördelningspapper och se vilka punkter som verkar ligga ungefär på ett streck.