Matematisk statistik för B, K, N, BME och Kemister

Relevanta dokument
Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 15: Faktorförsök

Matematisk statistik för D, I, Π och Fysiker

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Lycka till!

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 15, FMSF45 Multipel linjär regression

Statistisk försöksplanering

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Föreläsning 12: Linjär regression

Statistisk försöksplanering

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 13: Multipel Regression

AMatematiska institutionen avd matematisk statistik

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik, Föreläsning 5

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 15: Försöksplanering och repetition

Enkel och multipel linjär regression

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 7: Punktskattningar

Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik KTH. Formelsamling i matematisk statistik

Föreläsning 7: Punktskattningar

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Föreläsning 12: Regression

Föreläsning 7: Punktskattningar

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

LMA201/LMA521: Faktorförsök

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Föreläsningsanteckningar till kapitel 8, del 2

MVE051/MSG Föreläsning 14

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Grundläggande matematisk statistik

TAMS65 - Seminarium 4 Regressionsanalys

Föreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

oberoende av varandra så observationerna är

Föreläsning 11, Matematisk statistik Π + E

Föreläsning G60 Statistiska metoder

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

KURSPROGRAM HT-18 MATEMATISK STATISTIK AK FÖR D, I OCH PI, FMSF45 & MASB03

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 11, FMSF45 Konfidensintervall

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Matematisk statistik för D, I, Π och Fysiker

F13 Regression och problemlösning

Finansiell statistik. Multipel regression. 4 maj 2011

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

TMS136. Föreläsning 10

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

SF1901 Sannolikhetsteori och statistik I

Tenta i Statistisk analys, 15 december 2004

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Tentamen för kursen. Linjära statistiska modeller. 17 februari

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Formel- och tabellsamling i matematisk statistik

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

Föreläsning 14: Försöksplanering

Tillämpad matematisk statistik LMA521 Tentamen

Höftledsdysplasi hos dansk-svensk gårdshund

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Mer om konfidensintervall + repetition

TAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65

Examinationsuppgifter del 2

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Tentamen för kursen. Linjära statistiska modeller. 20 mars

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Matematisk statistik for B, K, N, BME och Kemister. Matematisk statistik slumpens matematik. Beskriva Data Florence Nightingale. Forel.

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Transkript:

Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 2/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Multipel reg. Intervall Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 3/32

Multipel reg. Intervall Multipel linjär regression (Kap. 11.2) Modellen y i = β β 1 x 1i... β p x pi ε i, kan skrivas på matrisform som Y = Xβ E ( ε i N, σ 2) oberoende där Y och E är n 1-vektorer, β en (p 1) 1-vektor och X en n (p 1)-matris y 1 1 x 11 x p1 β y 2 y =., X = 1 x 21 x p2......, β = β 1.,E = y n 1 x 1n x pn β p ε 1. ε n Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 4/32 Multipel reg. Intervall Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 5/32 Multipel reg. Intervall Skattning av β och σ 2 (Kap. 11.3 11.4) MK-skattningar av β,..., β p (elementen i β) blir β = (X X) 1 X Y V (β ) = σ 2 (X X) 1 och skattning av σ 2 är s 2 = där residualkvadratsumman ges av Q = Q n (p 1) n ( yi β β 1 x 1i... βpx ) 2 pi i=1 = Y Y β X Y Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 6/32

Multipel reg. Intervall Konfidensintervall för β i och μ (x ) (Kap. 11.4 11.5) Konfidensintervall för β i blir alltså I βi = βi ± t a/2 (n p 1) d(βi ) Där d(βi ) är d(βi element(ii) ) = s i (X X) 1 Ett konfidensintervall för μ Y (x ) blir μ Y (x ) = β k i=1 β i x i ( 1 I μy (x ) = μ Y (x ) ± t a/2 (n p 1) s x X X) x Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 7/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 8/32 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev.13, kan rätt värde på den okända storheten ändå vara.1? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar) undersöker effekten av olika faktorer (behandlingar)? Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 9/32

Hypotestest Tolkning Årsmedelvärdet av kvävedioxid i utomhusluft bör inte överstiga 4 μg/m 3 (Miljökvalitetsnorm, 26 1 1). I en större svensk stad vill man undersöka om gränsvärdet överskrids och ett antal mätningar av NO 2 görs. Gatukontoret (som måste vidta åtgärder om normen överskrids) anser att man bör testa H : μ = 4 μg/m 3 mot H 1 : μ > 4 μg/m 3 Miljöförvaltningen anser däremot att ett lämpligt test är H : μ = 4 μg/m 3 mot H 1 : μ < 4 μg/m 3 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 11/32 Statistiska undersökningar (Kap. 12.1) Vi skiljer på två typer av statistiska undersökningar. Deskriptiv undersökning Syftar till att beskriva egenskaper hos en population. : av medelvärde, varians Konfidensintervall för medelvärde, sannolikheter, etc. nalytisk undersökning Syftar till att undersöka effekter av olika förklarande variabler eller faktorer på en population. : Stickprov i par Regression Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 12/32 Problem med observationsstudier 1. Vid en undersökning av sjösäkerhet upptäcks ett positivt samband mellan försäljning av rosevin och antalet drunkningstillbud. 2. Man finner ett (positivt) samband mellan familjers utbildningsnivå och risken för Downs syndrom hos barnen. 3. Suppose you re trying to help the military decide how best to armor their planes for future bombing runs. They let you look over the planes that made it back, and you note that some areas get shot heavily, while other areas hardly get shot at all. So, you decide to increase the armor on the areas that get shot. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 13/32

Kontrollerat experiment (Kap. 12.1.5) Det finns flera olika metoder för att uppnå ett så bra experiment som möjligt: Randomiseras för att förhindra systematiska fel Homogen population Mindre varians för det lättare att upptäcka effekter, men kan hindra generella slutsatser. Blockindela Dela upp experimentet i grupper och randomisera inom grupperna. Efterjustering Tar hänsyn till kovariater. Replikat Minskar osäkerheten. Flerfaktorförsök För att upptäcka samspelseffekter. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 14/32 Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 15/32 2 2 -försök Modell Faktorförsök (Kap. 12.2 12.4) Undersöker hur en responsvariabel påverkas av olika faktorer när de varieras på olika nivåer. Ex: Effekten av en kemiskreaktion som funktion av temperatur och koncentration av en katalysator. 1 En faktor i taget 1 Samspelseffekter Koncentration.5 Koncentration.5 25 5 75 1 Temperatur 25 5 75 1 Temperatur Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 16/32

2 2 -försök Modell 2 k -försök (Kap. 12.2) I ett 2 k -försök har man k faktorer som alla kan varieras på 2 nivåer. Det enklaste fallet är ett 2 2 -försök (Kap. 12.3) I ett 2 2 -försök har man 2 faktorer som alla kan varieras på 2 nivåer. 2 2 -försök: Koncentration Hög μ 12 μ 22 Låg μ 11 μ 21 Låg Hög Temperatur Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 17/32 2 2 -försök 2 2 -försök Modell B Hög μ 12 μ 22 Låg μ 11 μ 21 Låg Hög Enkel effekt Effekten av en faktor om den andra faktorn är fix. Huvudeffekt Effekten av en faktor för alla värden på den andra faktorn. Samspelseffekten Skillnaden mellan de enkla effekterna. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 18/32 2 2 -försök Modell Teckenschema för 2 2 -försök Försök μ B B och B låg (1) μ 11 - - hög a μ 21 - - B hög b μ 12 - - och B hög ab μ 22 Teckenschema för 2 3 -försök i formelsamlingen. För 2 2 -försök använd endast de rader och kolumer med (1), a, b, och ab. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 19/32

2 2 -försök Effekter 2 2 -försök Modell 6 3 B B 6 3 B B 6 3 B B 6 6 6 3 B 3 B 3 B Om responsändringen för en faktor inte beror på nivån av andra faktorn är faktorerna additiva, och det finns inget samspel. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 2/32 : 2 2 -försök 2 2 -försök Modell Man vill undersöka hur olika typer av konstgödsel påverkar avkastningen från en vete-odling. Två olika gödsel, ett kväve och ett fosfor baserat, testas och avkastningen (ton/ha) mäts. Ja 4.5 6 Kväve (N) Nej 4 5 Nej Ja Fosfor (P) Bestäm 1. De enkla effekterna av fosfor 2. Huvudeffekterna 3. Samspelseffekterna Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 21/32 2 2 -försök Modell Modell för 2 2 -försök (Kap. 12.3.1) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijk = μ ij ε ijk, i = 1, 2; j = 1, 2; k = 1,..., n och felen antas vara oberoende ε ijk N (, σ 2). Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 22/32

: 2 2 -försök 2 2 -försök Modell I odlings exemplet ovan görs två ( replikat ) ( för varje ) faktor 3.5 5.27 Ja Kväve (N) ( 3.76 ) ( 6.3 ) 3.59 4.37 Nej 3.97 6.3 Nej Ja Fosfor (P) 1. Skatta huvud- och samspelseffekter. 2. Skatta variansen. 3. Gör 95%-konfidensintervall för huvud- och samspelseffekter. 4. Gör 95%-konfidensintervall för variansen σ 2. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 23/32 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 24/32 2 2 -försök Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 25/32

2 2 -försök Modell för 2 2 -försök (Kap. 12.3.2) Givet observationer y ijk μ ij = ȳ ij = 1 n n y ijk, k=1  = ȳ 11 ȳ 21 ȳ 12 ȳ 22 2 2, s 2 ij = 1 n ( 2 yijk ȳ ij ), n 1 k=1 s 2 = s2 11 s2 21 s2 12 s2 22 2 2. Övriga effekter ( μ, B och ÂB) fås från skattningarna μ ij Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 26/32 2 2 -försök Modell Konfidensintervall för 2 2 -försök Givet n replikat blir konfidensintervallen för effekterna I = ± t α/2 (2 2 s (n 1)) 22 n Där är någon av, B eller B. Eftersom variansen för (t.ex.) skattningen  ges av ) ( ) ȳ11 ȳ V ( = V 21 ȳ 12 ȳ 22 4 = 1 ) (V(ȳ 11 ) 4 2 V(ȳ 21 ) V(ȳ 12 ) V(ȳ 22 ) = σ2 4n = σ2 2 2 n Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 27/32 Upgf. 1, 24-1-19 2 2 -försök Modell I ett 2 2 -faktorförsök vill man studera hur utbytet påverkas av tryck och temperatur. Man har gjort tre replikat. Försöksresultatet blev Tryck Högt μ 12 = 45.8, s2 12 = 1.235 μ 22 = 49.2, s2 22 =.13 Lågt μ 11 = 48.2, s2 11 =.335 μ 21 = 48.8, s2 21 = 1.431 Låg Hög Temp. 1. Verkar det finnas något samspel? Motivera med hjälp av tabellen. 2. Skatta huvud- och samspelseffekter och avgör vilka som är signifikanta på 5% nivå. 3. Gör ett 95% konfidensintervall för variansen. Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 28/32

Repetition Multipel linjär regression Konfidensintervall Försöksplanering Tolkning av hypotesprövning Statistiska undersökningar Observationsstudier Kontrollerade experiment Faktorförsök 2 2-försök Modell för 2 2-försök 2 3-försök Modell Modell Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 29/32 2 3 -försök Modell I ett 2 3 -försök har man en tredje faktor C som kan varieras mellan två nivåer (låg/hög). Modell för 2 3 -försök (Kap. 12.4) Vid n mätningar (replikat) av varje faktorkombination ges varje observation av y ijkl = μ ijk ε ijkl, i = 1, 2; j = 1, 2; k = 1, 2; l = 1,..., n och felen antas vara oberoende ε ijkl N (, σ 2). för varje försök kan delas upp i huvud- och samspelseffekter. μ ijk = μ ± ± B ± C(±)(±)B(±)(±)C(±)(±)BC(±)(±)(±)BC Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 3/32 Modell Vid ett försök studerades hur utbytet påverkades av Temperatur på nivåerna 16, 18 ( C) B Katalysatorkoncentration 2, 4 (%) C Typ av katalysator I, II Faktorer Obs. Försök B C y ijk1 y ijk2 ȳ ijk s 2 ijk (1) 16 2 I 59 61 6 2 a 18 2 I 74 7 72 8 b 16 4 I 53 55 54 2 ab 18 4 I 69 67 68 2 c 16 2 II 5 54 52 8 ac 18 2 II 82 84 83 2 bc 16 4 II 46 44 45 2 abc 18 4 II 79 81 8 2 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 31/32

Vad gör man sen? Mer statistik! För B, K & N: KLGN1 Kemometri (ges av Livsmedelsteknologi) FMSF65 Försöksplanering LP4 FMSN3 Linjär och logistisk regression LP4 För BME: FMSF1 Stationära stokastiska processer LP1 FMSF15 Markovprocesser LP1 FMSN45 Tidsserieanalys LP2 FMSN3 Linjär och logistisk regression LP4 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 32/32