Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 5 & 14 oktober 2015 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 1/27 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 2/27 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 3/27
rättning Rättning pågår, resultat kommer skickas ut under onsdagen. Skicka in pdf-filer! Redovisa räkningarna I 2b) transformera innan ni räknar (c är ju inte normalfördelad) I 2c) summa av många ger normal enligt CGS (motivera), många här är antalet veckor som ni summerar över (inte antalet observationer). Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 4/27 Projekt rättning Tre nivåer: Godkännt Komplettering/mindre rättning (redovisa på laboration). Underkänt (ny rapport) Generöst med komplettering. Lämna in en ny rapport (bifoga den gamla) om: Ni är underkända. Ny rapport lämnas senast fredag 2015-11-06. Om ni inte rättar projektet är ni välkomna 2016 och gör då det årets projekt! Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 5/27 Undersökningar Experiment Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 6/27
Undersökningar Experiment (Kap. 12.1) Vi skiljer på två typer av statistiska undersökningar. Deskriptiv undersökning Syftar till att beskriva egenskaper hos en population. Analytisk undersökning Syftar till att undersöka effekter av olika förklarande variabler eller faktorer på en population. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 7/27 Undersökningar Experiment Analytisk undersökning (Kap. 12.1) Analytisk undersökning kan vidare delas upp i två huvudtyper Observationsstudie Ett antal objekt observeras tillsammans med en behandling. Vi har ingen möjlighet att påverka behandlingen. Kontrollerat experiment Behandlingen av olika objekt kan kontrolleras och bestäms på förhand Faktorer Variabler som vi kan styra i experimentet Kovariater Variabler som kan mätas men inte styras. Övriga variabler Kallas på engelska confounding factors Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 8/27 Undersökningar Experiment Kontrollerat experiment (Kap. 12.1.5) Det finns flera olika metoder för att uppnå ett så bra experiment som möjligt: Randomiseras för att förhindra systematiska fel Homogen population Mindre varians för det lättare att upptäcka effekter, men kan hindra generella slutsatser. Blockindela Dela upp experimentet i grupper och randomisera inom grupperna. Efterjustering Tar hänsyn till kovariater. Replikat Minskar osäkerheten. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 9/27
Undersökningar Experiment 2 k -försök (Kap. 12.2) I ett 2 k -försök har man k faktorer som alla kan varieras på 2 nivåer. Teckenschema för 2 2 -försök (Kap. 12.3) Försök Respons μ A B AB A och B låg (1) μ 11 + - - + A hög a μ 21 + + - - B hög b μ 12 + - + - A och B hög ab μ 22 + + + + Enkel effekt Effekten av en faktor om den andra faktorn är fix. Huvudeffekt Effekten av en faktor för alla värden på den andra faktorn. Samspelseffekten Skillnaden mellan de enkla effekterna. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 10/27 : 2 2 -försök Undersökningar Experiment Man vill undersöka hur olika typer av konstgödsel påverkar avkastningen från en vete-odling. Två olika gödsel, ett kväve och ett fosfor baserat, testas och avkastningen (ton/ha) mäts. Ja 4.5 6 Kväve (N) Nej 4 5 Nej Ja Fosfor (P) Bestäm 1. De enkla effekterna av fosfor 2. Huvudeffekterna 3. Samspelseffekterna Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 11/27 : 2 2 -försök Kväve (N) 1. De enkla effekterna av fosfor Undersökningar Experiment Ja 4.5 6 Nej 4 5 Nej Ja Fosfor (P) P(N = Nej) = 5 4 = 0.5 2 P(N = Ja) = 6 4.5 = 0.75 2 2. Huvudeffekterna 4 4.5 + 5 + 6 0.5 + 0.75 P = = 0.625 = 4 2 4 + 4.5 5 + 6 N = = 0.375 4 3. Samspelseffekterna NP = 4 4.5 5 + 6 = 0.125 4 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 12/27
Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 13/27 för 2 2 -försök (Kap. 12.3.1) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijk = μ ij + ε ijk, i = 1, 2; j = 1, 2; k = 1,..., n och felen antas vara oberoende ε ijk N ( 0, σ 2). Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 14/27 : 2 2 -försök I odlings exemplet ovan görs två ( replikat ) ( för varje ) faktor 3.50 5.27 Ja Kväve (N) ( 3.76 ) ( 6.30 ) 3.59 4.37 Nej 3.97 6.03 Nej Ja Fosfor (P) 1. Skatta huvud- och samspelseffekter. 2. Skatta variansen. 3. Gör 95%-konfidensintervall för huvud- och samspelseffekter. 4. Gör 95%-konfidensintervall för variansen σ 2. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 15/27
Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 16/27 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 17/27 för 2 2 -försök (Kap. 12.3.2) Givet observationer y ijk μ ij = ȳ ij = 1 n n y ijk, k=1 Â = ȳ 11 + ȳ 21 ȳ 12 + ȳ 22 2 2, s 2 ij = 1 n ( 2 yijk ȳ ij ), n 1 k=1 s 2 = s2 11 + s2 21 + s2 12 + s2 22 2 2. Övriga effekter ( μ, B och ÂB) fås från skattningarna μ ij Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 18/27
Konfidensintervall för 2 2 -försök Givet n replikat blir konfidensintervallen för effekterna I = ± t α/2 (2 2 s (n 1)) 22 n Där är någon av A, B eller AB. Eftersom variansen för (t.ex.) skattningen  ges av ) ( ) ȳ11 + ȳ V ( = V 21 ȳ 12 + ȳ 22 4 = 1 ) (V(ȳ 11 ) 4 2 + V(ȳ 21 ) + V(ȳ 12 ) + V(ȳ 22 ) = σ2 4n = σ2 2 2 n Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 19/27 Upgf. 1, 2004-10-19 I ett 2 2 -faktorförsök vill man studera hur utbytet påverkas av tryck och temperatur. Man har gjort tre replikat. Försöksresultatet blev Tryck Högt μ 12 = 45.8, s2 12 = 1.235 μ 22 = 49.2, s2 22 = 0.103 Lågt μ 11 = 48.2, s2 11 = 0.335 μ 21 = 48.8, s2 21 = 1.431 Låg Hög Temp. 1. Verkar det finnas något samspel? Motivera med hjälp av tabellen. 2. Skatta huvud- och samspelseffekter och avgör vilka som är signifikanta på 5% nivå. 3. Gör ett 95% konfidensintervall för variansen. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 20/27 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 21/27
2 3 -försök I ett 2 3 -försök har man en tredje faktor C som kan varieras mellan två nivåer (låg/hög). för 2 3 -försök (Kap. 12.4) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijkl = μ ijk + ε ijkl, i = 1, 2; j = 1, 2; k = 1, 2; l = 1,..., n och felen antas vara oberoende ε ijkl N ( 0, σ 2). Respons för varje försök kan delas upp i huvud- och samspelseffekter. μ ijk = μ ± A ± B ± C(±)(±)AB(±)(±)AC(±)(±)BC(±)(±)(±)ABC Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 22/27 Vid ett försök studerades hur utbytet påverkades av A Temperatur på nivåerna 160, 180 ( C) B Katalysatorkoncentration 20, 40 (%) C Typ av katalysator I, II Faktorer Obs. Försök A B C y ijk1 y ijk2 ȳ ijk s 2 ijk (1) 160 20 I 59 61 60 2 a 180 20 I 74 70 72 8 b 160 40 I 53 55 54 2 ab 180 40 I 69 67 68 2 c 160 20 II 50 54 52 8 ac 180 20 II 82 84 83 2 bc 160 40 II 46 44 45 2 abc 180 40 II 79 81 80 2 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 23/27 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 24/27
CGS (Kap. 4.5) Om X 1, X 2,..., X n är oberoende likafördelade stokastiska variabler med E(X i ) = μ, V(X i ) = σ 2 så är n i=1 ( X i N nμ, nσ 2) då n stort (n ) 1. Om Y = n X i gäller Y N ( nμ, nσ 2) i=1 2. Om X n = 1 n n ( ) X i gäller X n N μ, σ2 n i=1 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 25/27 : CGS Man gör n oberoende mätningar, x 1, x 2, x n, av en stokastisk variabel X. Mätningarna betraktas som observationer. Vilka av följande påståenden är sanna? 100 mätningar från X kommer vara approximativt normalfördelade enligt CGS. Summan av 100 mätningar från X kommer vara approximativt normalfördelade enligt CGS. Medelvärdet av 100 mätningar från X kommer vara approximativt normalfördelade enligt CGS. Medelvärdet av 5 mätningar från X kommer vara approximativt normalfördelade enligt CGS. Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 26/27 Vad gör man sen? Mer statistik! För B, K & N: FMS210/KLGN10 Kemometri försöksplanering och multivariat analys (ges av Livsmedelsteknologi, periodiserad) FMS072 Försöksplanering LP4 FMSN30 Linjär och logistisk regression LP4 För BME: FMSF10 Stationära stokastiska processer LP1 FMSF15 Markovprocesser LP1 FMS051 Tidsserieanalys LP2 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 27/27