LÖSNINGAR TILL Matematisk statistik Tentamen: 2015 08 18 kl 8 00 13 00 Matematikcentrum FMS 086 Matematisk statistik för B, K, N och BME, 7.5 hp Lunds tekniska högskola MASB02 Matematisk statistik för kemister, 7.5 hp Lunds universitet 1. Vi inför beteckningarna A, B, C för öl som kommer från de tre olika bryggerierna, samt M för mörkt öl. Enligt uppgiften har vi följande sannolikheter: PA = PB = PC = 1 3 PM A = 0.7 PM B = 0.21 PM C = 1 0.25 = 0.75 a Satsen om total sannolikhet ger b Bayes formel ger PM = PM APA + PM BPB + PM CPC = 0.7 + 0.21 + 0.75 1 3 = 0.42 PA M = PA M PM = PM APA PM = 0.7 1 3 0.42 0.2381 2. Beteckna den i:te observationen av humle sort j som, y ij. Där i = 1,..., n j och j anger humlesort enligt: 1 Amarillo, 2 Challenger eller 3 Saaz. a En lämplig normalfördelningsmodell med samma varians, men olika medelvärden, är nu y i1 N μ 1, σ 2 y i2 N μ 2, σ 2 y i3 N μ 3, σ 2 b Den poolade varians skattningen ges av sp 2 = n 1 1s1 2 + n 2 1s2 2 + n 3 1s3 2 n 1 1 + n 2 1 + n 3 1 5 1 0.4 + 4 1 0.5 + 7 1 0.2 = 5 1 + 4 1 + 7 1 0.3308 c Skattningen av andelen α-syra i Challenger-humlen mätningarna är i vikt-%, d.v.s. i andelar ges av μ 2 = y i2 = 1 n 2 y i2 = 6.10 n 2 i=1 med varians och medelfel Vμ 2 = σ2 n 2 dμ 2 = s p n2. Ett konfidensintervall fås nu som t-kvantil eftersom variansen är skattad, och med frihetsgrader som tar hänsyn till den poolade variansen I μ2 = μ 2 ± t 0.025 n 1 + n 2 + n 3 3 dμ 2 = μ 2 ± t 0.025 13 = 6.1 ± 2.1604 0.5751 4 = 5.4788, 6.7212 s p n2
3. a Skattning av huvud- och samspelseffekter är A = μ 11 + μ 21 μ 12 + μ 22 2 2 = 0.75 B = μ 11 μ 21 + μ 12 + μ 22 2 2 = 2.25 AB = μ 11 μ 21 μ 12 + μ 22 2 2 = 1.25 b Vi ansätter en model där observationerna är y ijk = μ ij + ε ijk, i = 1, 2; j = 1, 2; k = 1,..., n med oberoende och normalfördelade fel, ε ijk N 0, σ 2, och n = 3 observationer per faktorkombination. Den poolade variansskattningen är s 2 = s2 11 + s2 21 + s2 12 + s2 22 2 2 = 2.9950 med f = 2 2 n 1 = 8 frihetsgrader, och medelfelet för respektive effekt är deffekt = s 2.9950 2 2 n = 4 3 = 0.4996 Ett konfidensintervall för respektive effekt ges av I effekt = effekt ± t 0.005 f deffekt = effekt ± 3.3554 0.4996 = effekt ± 1.6763, och effekterna är signifikanta om effekt > 1.6763 intervaller kommer då inte att innehålla 0. Huvudeffekt B är signifikant. c Den nya processen ger en signifikant ökning av mängden fermenterbart socker. Det finns ingen signifikant effekt av ekologisk odling, vare sig i huvud- och samspelseffekterna. 4. a Låt y i N μ, σ 2 vara mätningarna av vattenhårdheten. Vi vill testa H 0 : μ = 2 mot H 1 : μ > 2 på signifikansnivån α = 0.05. Skattningar av μ och σ 2 är μ = y = 3.08 s 2 = 1 3 1 och medelfelet för μ är: dμ = s 3 = 0.6154 3 yi y 2 = 1.3161 s = 1.3161 = 1.0659 i=1 En teststorhet för det ensidiga testet ges av T = μ μ 0 dμ = 3.08 2 0.6154 = 1.755 Vilket jämförs med t 0.05 3 1 = 2.92 och H 0 kan inte förkastas. b Med spektrometern blir mätningarna y i N μ, σ 2 med känt σ 2. Vi vill nu bestämma σ mätfel/mätnoggrannhet så att testet ovan d.v.s. samma test som i a, med n = 3, H 0 : μ = 2 mot H 1 : μ > 2 och α = 0.05 slår larm med 99.9% säkerhet om det sanna värdet är 3 dh. Vi behöver alltså bestämma σ 2 så att styrkefunktionen uppfyller Pförkasta H 0 μ = 3 = 0.999
Vi har nu att känt σ ger λ-kvantil μ μ 0 Pförkasta H 0 μ = 3 = P dμ > λ 0.05 μ N 3, σ2 3 = P μ σ > μ 0 + λ 0.05 3 = P μ 3 σ 3 > μ 0 3 + λ 0.05 σ 3 }{{} c Med standardiseringen av sannolikheten ovan söker vi nu c så att PX > c = 0.999 om X N0, 1, vilket ger c = λ 0.001. Detta ger μ 0 3 σ 3 + λ 0.05 = λ 0.001 eller, efter förenkling σ = μ 0 3 3 = 1 3 λ 0.001 λ 0.05 3.0902 1.6449 = 0.3658 σ 2 = 0.1338 c Om man instället utför en mätning blir den enda förändringen att n = 1 istället för n = 3 och svaret i b ändras till σ = 1 1 3.0902 1.6449 = 0.2112 σ 2 = 0.0446 5. a y i skillnaden i vatten in i processen och slutlig mängd öl ut kan också ses som förlusten eller vattenåtgången spill vid bryggningen. β 0 : Vid en bryggning helt utan malt och kokning försvinner 0.18 hektoliter vatten dvs en, kanske inte helt rimlig, ökning. Detta kan tolkas som de allmäna förlusterna oavsett vad man gör i övrigt. β 1 : Mängden vatten som försvinner tas upp av malten. Varje 100 kg malt tar alltså upp 0.4269 100 liter vatten eller 0.4269 l vatten per kg malt. β 2 : Mängden vatten som koker bort avdunstar per minut av koktid. Under varje minut koker alltså 0.0523 100 liter vatten bort eller 5.23 l/min. b Konfidens intervall för regressionskoefficienterna ges som I βi = β i ± t α/2 dβ i Q 0 s 2 = n p + 1 = 0.0411 10 3 = 0.0059 dβi = s lämpligt diagonal element i X T X 1 Vilket för de tre parametrarna ger: I β0 = β 0 ± t 0.025 7 s 21.3 = 1.0186, 0.6538 I β1 = β 1 ± t 0.025 7 s 1.28 = 0.2219, 0.6319 I β2 = β 2 ± t 0.025 7 s 0.0070 = 0.0371, 0.0675 Vi ser att β 1 och β 2 är signifikanta, d.v.s. att både malt-mängd och koktid påverkar vattenåtgången. Eftesom β 0 är inte signifikant är de allmäna förlusterna väsentligen 0.
c Här söks ett prediktionsintervall för en framtida bryggning med 3.5 100-tals kg malt och 90 minuters koktiden x 0 = [1 3.5 90] T. Vi noterar att formeln för prediktionsintervall inte finns i formelsamlingen men genom att jämföra med formler för vanlig linjärregression eller komma ihåg vad som händer har vi att I μy x 0 = μ Y x 0 ± t α/2 s 1 + x 0T X T X 1 x 0 Med följande värden vilket ger μ Y x 0 = β 0 + 3.5 β 1 + 90 β 2 = 6.0187 x 0 T X T X 1 x 0 = 0.49 d μ Y x 0 = s 1 + x 0T X T X 1 x 0 = 0.0766 1 + 0.49 = 0.0935 t α/2 = t0.025 7 = 2.3646 I μy x 0 = 5.7976, 6.2399 6. a Linjärkombinationen av normalvariabler är fortfarande normalfördelad och vi har EZ = 2 EX 3 EY + 5 = 2 3 3 2 + 5 = 17 VZ = 2 2 VX + 3 2 VY + V5 = 4 0.5 2 + 9 1 + 0 = 10 vilket ger Z N17, 10. b Eftersom summan av sannolikheterna måste vara 1 har vi att 4 1 p X k = c 2 + 1 4 + 1 8 + 1 = c 15 16 16 = 1 k=1 c = 16 15 För väntevärdet har vi EX = 4 k=1 k p X k = 1 c 2 + 2 c 4 + 3 c 8 + 4 c 16 = c 13 8 = 26 15 = 1.7333 c i Styrkefunktionens värde i μ = 3 d.v.s. vid H 0 ges av h3 = Pförhasta H 0 om H 0 sann = α = 0.01. Notera också att μ 1 eftersom det är en sannolikhet. Den blå kurvan nedan är den tvåsidiga styrkefunktionen. ii Den ensidiga styrkan kommer att upptäcka om μ är stor. Man bör notera att: 1 vi fortfarade har h3 = 0.01 och 2 ett ensidigt test kommer ha större möjlighet högre värde på hμ att upptäcka förändringar eftersom man bara tittar på en typ av fall. Den röda kurvan nedan är den ensidiga styrkefunktionen. 1 0.75 0.5 0.25 0 0 1 2 3 4 5 6
d Test med direkt metoden ger p-värdet som Pvad vi fick eller längre från H 0 H 0 = Px 1 = p X 0 + p X 1 8 = p 0 0 01 p 0 0 8 8 + p 1 1 01 p 0 0 8 1 = 0.0352 där p 0 = 0.5. Testet kan förkastas på signifikansnivå 5% men inte på 1% eller förkasta på nivån 3.52%. e Vi ansätter samma modell som i 2 y i1 N μ 1, σ 2 y i2 N μ 2, σ 2 y i3 N μ 3, σ 2 där vi har den i:te observationen från lantbruket 1, 2 eller 3. i En poolad varians skattning har f = n 1 1 + n 2 1 + n 3 1 = 10 frihetsgrader. ii Standard formeln för konfidensintervall hos σ 2 ger s 2 p f s 2 p f 0.375 10 0.375 10 I σ 2 = Χ0.025 2 f, Χ1 0.25 2 f =, = 0.1831, 1.1549 20.4823 3.2470