Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Föreläsning 6 Johan Lindström 13 september 2017 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 1/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 2/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 3/22

Stickprov (Kap. 7.1) Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. (Kap. 7.1) En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. En skattning är: 1. En funktion från observationer till ett tal. 2. En stokastisk variabel. 3. Ett tal. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 4/22 för μ i N ( μ, σ 2) (Kap. 7.3) x 1,..., x n observationer av X i N ( μ, σ 2) σ 2 känd: σ I μ = x ± λ α/2 n = μ ± λ α/2 D(μ ) σ 2 okänd: I μ = x ± t α/2 (n 1) s n = μ ± t α/2 (f)d(μ ) Där kvantilerna ges av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t-fördelningens α/2-kvantil (Tabell 3) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 5/22 för σ 2 i N ( μ, σ 2) (Kap. 8.1.2) x 1,..., x n observationer av X i N ( μ, σ 2) Ett 1 α konfidensintervall för σ 2 ges av ( ) Iσ 2 (n 1)s 2 (n 1)s 2 = χ 2 α/2 (n 1), χ 2 1 α/2 (n 1) Där s 2 = 1 n 1 n (x i x) 2 och χ 2 α/2 (n 1) är χ2 -fördelningens kvantiler (Tabell 4) i=1 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 6/22

: Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 7/22 : Järnhalt i jord () (Kap. 7.7) En geokemist är intresserad av att undersöka hur halten av järn varierar i skogsmark. På två lokaler gräver hon 6 resp. 7 gropar, tar ett prov från varje grop och bestämmer sedan järnhalten (mg/g): Lokal I, x i : 23.3 9.0 9.8 19.9 15.0 20.5 Lokal II, y i : 20.8 26.5 18.3 28.6 33.1 21.5 29.3 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan de två lokalerna? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 8/22 Sammanvägd variansskattning (Kap. 7.4) Om vi har x 1,..., x nx y 1,..., y ny obs. av X i N (μ x, σ 2) obs. av Y i N (μ y, σ 2) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 = Q ( ) Q f, σ 2 χ2 (f) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 9/22

(Kap. 7.8) Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell: Före: X i N ( μ i, σ 2 ) 1 Efter: Y i N ( μ i + Δ, σ 2 ) 2 Vi vill nu skatta effekten av behandlingen (Δ). Bilda Z i = Y i X i N ( Δ, σ 2). Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 10/22 eller två stickprov? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 11/22 : Järnhalt i jord () Geokemisten är speciellt intresserad av eventuella skillnader i järnhalten mellan olika nivåer i groparna. Hon tar därför, från 4 olika gropar, ett prov på A-nivå (nära ytan) och ett prov på C-nivå (c:a 1 meter djupt). Området är av mycket heterogen karaktär, dvs troligen varierar järnhalten mycket mellan olika gropar. Grop nr: 1 2 3 4 Nivå A: 19.15 23.35 20.1 16.7 Nivå C: 21.96 27.7 22.93 19.02 z i = y i x i 2.81 4.35 2.83 2.32 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan A- och C-nivårena. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 12/22

: Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 13/22 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev 0.013, kan rätt värde på den okända storheten ändå vara 0.01? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar) undersöker effekten av olika faktorer (behandlingar)? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 14/22 (Kap. 7.5) H 0 förkastas om observationerna, θ, avviker för mycket från nollhypotesen θ 0. Testa nollhypotesen H 0 : θ = θ 0 mot mothypotesen (tex) H 1 : θ θ 0 på nivån α; felrisken α ges av α = P(H 0 förkastas trots att den är sann) För mycket beror på osäkerheten i skattningen, D(θ ), samt felrisken α. Normalt är α = 0.05, 0.01 eller 0.001. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 15/22

Olika metoder för att utföra hypotestest 1. Direktmetoden eller P-värde (Def. 7.35) Antag att H0 är sann Räkna ut P-värdet p = P(Få det vi fått eller värre) Om p < α förkastas H 0 2. Konfidensmetoden (Kap. 7.5.2) Gör ett konfidensintervall med konfidensgraden 1 α och förkasta H 0 på nivån α om intervallet ej täcker θ 0. Intervallen skall, beroende på H 1, vara Test H 1 : θ < θ 0 H 1 : θ θ 0 H 1 : θ > θ 0 Intervall: uppåt begr tvåsidigt nedåt begr 3. Testkvantitet T(X) och kritiskt område C (Kap. 7.5.3) Förkasta H 0 om testskvantiteten hamnar i det kritiska området. C och T skall väljas så att α = P(T(X) C) = P( Förkasta H 0 om H 0 är sann ) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 16/22 Bra och dåliga hypotestest Hypotestest på nivån α H 0 förkastas (tillfördel för H 1 ) med sannolikhet α då (trots att) H 0 är sann. Kan vi konstruera ett test som inte använder data? Hur beter sig ett perfekt (idealt) test? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 17/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 18/22

& Felrisker (Kap. 7.6) Användas för att avgöra hur bra testet skiljer H 0 från H 1. h(θ) = P( Förkasta H 0 om θ är rätt värde ) Typ 1 fel: Typ 2 fel: α = P(H 0 förkastas om H 0 sann) β = P(H 0 förkastas ej om H 0 ej sann) Vi ser att α = h(θ 0 ). Om rätt värde på θ är θ 1 fås β = 1 h(θ 1 ). Naturens okända sanning H 0 sann H 1 sann Vårt H 0 förk. ej β Beslut H 0 förkastas α Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 19/22 empel: Rattonykterhet Gränsen för rattonykterhet är 0.2. Antag att mätvärdet vid en mätning, x i, är X i = μ + ε i där μ är den sanna alkoholhalten och ε i är oberoende, N ( 0, 0.04 2) -fördelade mätfel. För att avgöra om en person är skyldig till rattonykterhet kan man testa hypotesen H 0 : μ = 0.2 mot H 1 : μ > 0.2 på nivån α = 0.001. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 20/22 1. Ange i ord vad felrisken α = P(Förkasta H 0 om H 0 är sann) innebär i hypotestestet ovan. 2. Om man gjort n = 3 mätningar och fått medelalkoholhalten till x = 0.24, skall man då dömas? 3. Hur högt kan det uppmätta medelvärdet, baserat på tre mätningar, vara utan att man döms? 4. Bestäm styrkefunktionen för testet. Dvs h(μ) = P(H 0 förkastas om μ är det sanna värdet) 5. Om den sanna alkoholhalten är 0.25, vad är då sannolikheten att inte dömas. 6. Hur många mätningar behöver göras för att man med högst β = 20% slh skall frikännas om man har 0.25. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 21/22

för testet av promillehalt (H 0 : μ = 0.2) h(µ) = P(Förkasta H 0 ) 1 0.8 0.6 0.4 0.2 n = 3, σ = 0.04 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ n fördubblad resp. σ halverad 1 0.8 0.6 0.4 0.2 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ Den okända sanningen Nykter Olovligt påverkad Mätresultat μ = x Säkerhetsmarginal Kritiskt område Slutsats från test Frikänns Döms μ 0 0.2 0.27 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 22/22