Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 2/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Multipel reg. Intervall Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 3/32
Multipel reg. Intervall Multipel linjär regression (Kap. 11.2) Modellen y i = β β 1 x 1i... β p x pi ε i, kan skrivas på matrisform som Y = Xβ E ( ε i N, σ 2) oberoende där Y och E är n 1-vektorer, β en (p 1) 1-vektor och X en n (p 1)-matris y 1 1 x 11 x p1 β y 2 y =., X = 1 x 21 x p2......, β = β 1.,E = y n 1 x 1n x pn β p ε 1. ε n Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 4/32 Multipel reg. Intervall Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 5/32 Multipel reg. Intervall Skattning av β och σ 2 (Kap. 11.3 11.4) MK-skattningar av β,..., β p (elementen i β) blir β = (X X) 1 X Y V (β ) = σ 2 (X X) 1 och skattning av σ 2 är s 2 = där residualkvadratsumman ges av Q = Q n (p 1) n ( yi β β 1 x 1i... βpx ) 2 pi i=1 = Y Y β X Y Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 6/32
Multipel reg. Intervall Konfidensintervall för β i och μ (x ) (Kap. 11.4 11.5) Konfidensintervall för β i blir alltså I βi = βi ± t a/2 (n p 1) d(βi ) Där d(βi ) är d(βi element(ii) ) = s i (X X) 1 Ett konfidensintervall för μ Y (x ) blir μ Y (x ) = β k i=1 β i x i ( 1 I μy (x ) = μ Y (x ) ± t a/2 (n p 1) s x X X) x Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 7/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 8/32 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev.13, kan rätt värde på den okända storheten ändå vara.1? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar) undersöker effekten av olika faktorer (behandlingar)? Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 9/32
Hypotestest Tolkning Årsmedelvärdet av kvävedioxid i utomhusluft bör inte överstiga 4 μg/m 3 (Miljökvalitetsnorm, 26 1 1). I en större svensk stad vill man undersöka om gränsvärdet överskrids och ett antal mätningar av NO 2 görs. Gatukontoret (som måste vidta åtgärder om normen överskrids) anser att man bör testa H : μ = 4 μg/m 3 mot H 1 : μ > 4 μg/m 3 Miljöförvaltningen anser däremot att ett lämpligt test är H : μ = 4 μg/m 3 mot H 1 : μ < 4 μg/m 3 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 11/32 Statistiska undersökningar (Kap. 12.1) Vi skiljer på två typer av statistiska undersökningar. Deskriptiv undersökning Syftar till att beskriva egenskaper hos en population. : av medelvärde, varians Konfidensintervall för medelvärde, sannolikheter, etc. nalytisk undersökning Syftar till att undersöka effekter av olika förklarande variabler eller faktorer på en population. : Stickprov i par Regression Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 12/32 Problem med observationsstudier 1. Vid en undersökning av sjösäkerhet upptäcks ett positivt samband mellan försäljning av rosevin och antalet drunkningstillbud. 2. Man finner ett (positivt) samband mellan familjers utbildningsnivå och risken för Downs syndrom hos barnen. 3. Suppose you re trying to help the military decide how best to armor their planes for future bombing runs. They let you look over the planes that made it back, and you note that some areas get shot heavily, while other areas hardly get shot at all. So, you decide to increase the armor on the areas that get shot. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 13/32
Kontrollerat experiment (Kap. 12.1.5) Det finns flera olika metoder för att uppnå ett så bra experiment som möjligt: Randomiseras för att förhindra systematiska fel Homogen population Mindre varians för det lättare att upptäcka effekter, men kan hindra generella slutsatser. Blockindela Dela upp experimentet i grupper och randomisera inom grupperna. Efterjustering Tar hänsyn till kovariater. Replikat Minskar osäkerheten. Flerfaktorförsök För att upptäcka samspelseffekter. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 14/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 15/32 2 2 -försök Modell Faktorförsök (Kap. 12.2 12.4) Undersöker hur en responsvariabel påverkas av olika faktorer när de varieras på olika nivåer. Ex: Effekten av en kemiskreaktion som funktion av temperatur och koncentration av en katalysator. 1 En faktor i taget 1 Samspelseffekter Koncentration.5 Koncentration.5 25 5 75 1 Temperatur 25 5 75 1 Temperatur Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 16/32
2 2 -försök Modell 2 k -försök (Kap. 12.2) I ett 2 k -försök har man k faktorer som alla kan varieras på 2 nivåer. Det enklaste fallet är ett 2 2 -försök (Kap. 12.3) I ett 2 2 -försök har man 2 faktorer som alla kan varieras på 2 nivåer. 2 2 -försök: Koncentration Hög μ 12 μ 22 Låg μ 11 μ 21 Låg Hög Temperatur Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 17/32 2 2 -försök 2 2 -försök Modell B Hög μ 12 μ 22 Låg μ 11 μ 21 Låg Hög Enkel effekt Effekten av en faktor om den andra faktorn är fix. Huvudeffekt Effekten av en faktor för alla värden på den andra faktorn. Samspelseffekten Skillnaden mellan de enkla effekterna. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 18/32 2 2 -försök Modell Teckenschema för 2 2 -försök Försök μ B B och B låg (1) μ 11 - - hög a μ 21 - - B hög b μ 12 - - och B hög ab μ 22 Teckenschema för 2 3 -försök i formelsamlingen. För 2 2 -försök använd endast de rader och kolumer med (1), a, b, och ab. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 19/32
2 2 -försök Effekter 2 2 -försök Modell 6 3 B B 6 3 B B 6 3 B B 6 6 6 3 B 3 B 3 B Om responsändringen för en faktor inte beror på nivån av andra faktorn är faktorerna additiva, och det finns inget samspel. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 2/32 : 2 2 -försök 2 2 -försök Modell Man vill undersöka hur olika typer av konstgödsel påverkar avkastningen från en vete-odling. Två olika gödsel, ett kväve och ett fosfor baserat, testas och avkastningen (ton/ha) mäts. Ja 4.5 6 Kväve (N) Nej 4 5 Nej Ja Fosfor (P) Bestäm 1. De enkla effekterna av fosfor 2. Huvudeffekterna 3. Samspelseffekterna Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 21/32 2 2 -försök Modell Modell för 2 2 -försök (Kap. 12.3.1) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijk = μ ij ε ijk, i = 1, 2; j = 1, 2; k = 1,..., n och felen antas vara oberoende ε ijk N (, σ 2). Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 22/32
: 2 2 -försök 2 2 -försök Modell I odlings exemplet ovan görs två ( replikat ) ( för varje ) faktor 3.5 5.27 Ja Kväve (N) ( 3.76 ) ( 6.3 ) 3.59 4.37 Nej 3.97 6.3 Nej Ja Fosfor (P) 1. Skatta huvud- och samspelseffekter. 2. Skatta variansen. 3. Gör 95%-konfidensintervall för huvud- och samspelseffekter. 4. Gör 95%-konfidensintervall för variansen σ 2. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 23/32 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 24/32 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 25/32
2 2 -försök Modell för 2 2 -försök (Kap. 12.3.2) Givet observationer y ijk μ ij = ȳ ij = 1 n n y ijk, k=1  = ȳ 11 ȳ 21 ȳ 12 ȳ 22 2 2, s 2 ij = 1 n ( 2 yijk ȳ ij ), n 1 k=1 s 2 = s2 11 s2 21 s2 12 s2 22 2 2. Övriga effekter ( μ, B och ÂB) fås från skattningarna μ ij Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 26/32 2 2 -försök Modell Konfidensintervall för 2 2 -försök Givet n replikat blir konfidensintervallen för effekterna I = ± t α/2 (2 2 s (n 1)) 22 n Där är någon av, B eller B. Eftersom variansen för (t.ex.) skattningen  ges av ) ( ) ȳ11 ȳ V ( = V 21 ȳ 12 ȳ 22 4 = 1 ) (V(ȳ 11 ) 4 2 V(ȳ 21 ) V(ȳ 12 ) V(ȳ 22 ) = σ2 4n = σ2 2 2 n Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 27/32 Upgf. 1, 24-1-19 2 2 -försök Modell I ett 2 2 -faktorförsök vill man studera hur utbytet påverkas av tryck och temperatur. Man har gjort tre replikat. Försöksresultatet blev Tryck Högt μ 12 = 45.8, s2 12 = 1.235 μ 22 = 49.2, s2 22 =.13 Lågt μ 11 = 48.2, s2 11 =.335 μ 21 = 48.8, s2 21 = 1.431 Låg Hög Temp. 1. Verkar det finnas något samspel? Motivera med hjälp av tabellen. 2. Skatta huvud- och samspelseffekter och avgör vilka som är signifikanta på 5% nivå. 3. Gör ett 95% konfidensintervall för variansen. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 28/32
Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 29/32 2 3 -försök Modell I ett 2 3 -försök har man en tredje faktor C som kan varieras mellan två nivåer (låg/hög). Modell för 2 3 -försök (Kap. 12.4) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijkl = μ ijk ε ijkl, i = 1, 2; j = 1, 2; k = 1, 2; l = 1,..., n och felen antas vara oberoende ε ijkl N (, σ 2). för varje försök kan delas upp i huvud- och samspelseffekter. μ ijk = μ ± ± B ± C(±)(±)B(±)(±)C(±)(±)BC(±)(±)(±)BC Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 3/32 Modell Vid ett försök studerades hur utbytet påverkades av Temperatur på nivåerna 16, 18 ( C) B Katalysatorkoncentration 2, 4 (%) C Typ av katalysator I, II Faktorer Obs. Försök B C y ijk1 y ijk2 ȳ ijk s 2 ijk (1) 16 2 I 59 61 6 2 a 18 2 I 74 7 72 8 b 16 4 I 53 55 54 2 ab 18 4 I 69 67 68 2 c 16 2 II 5 54 52 8 ac 18 2 II 82 84 83 2 bc 16 4 II 46 44 45 2 abc 18 4 II 79 81 8 2 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 31/32
Vad gör man sen? Mer statistik! För B, K & N: KLGN1 Kemometri (ges av Livsmedelsteknologi) FMSF65 Försöksplanering LP4 FMSN3 Linjär och logistisk regression LP4 För BME: FMSF1 Stationära stokastiska processer LP1 FMSF15 Markovprocesser LP1 FMSN45 Tidsserieanalys LP2 FMSN3 Linjär och logistisk regression LP4 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 32/32