Matematisk statistik för B, K, N, BME och Kemister

Relevanta dokument
Föreläsning 12, FMSF45 Hypotesprövning

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11, Matematisk statistik Π + E

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 11, FMSF45 Konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Thomas Önskog 28/

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Föreläsning 11: Mer om jämförelser och inferens

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik KTH. Formelsamling i matematisk statistik

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

9. Konfidensintervall vid normalfördelning

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Avd. Matematisk statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Extrauppgifter - Statistik

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Föreläsning 5: Hypotesprövningar

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Föreläsning 17, Matematisk statistik Π + E

10. Konfidensintervall vid två oberoende stickprov

Föreläsningsanteckningar till kapitel 8, del 2

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

TMS136. Föreläsning 11

Laboration 4: Hypotesprövning och styrkefunktion

TMS136. Föreläsning 13

Avd. Matematisk statistik

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

TMS136. Föreläsning 10

Föreläsning 12: Linjär regression

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 5. Kapitel 6, sid Inferens om en population

Avd. Matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Avd. Matematisk statistik

Lufttorkat trä Ugnstorkat trä

Avd. Matematisk statistik

Extrauppgifter i matematisk statistik

MVE051/MSG Föreläsning 14

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

F9 Konfidensintervall

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Avd. Matematisk statistik

Föreläsning 12: Regression

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

MATEMATISK STATISTIK AK FÖR F, E, D, I, C, Π; FMS 012 FÖRELÄSNINGSANTECKNINGAR I

F13 Regression och problemlösning

Kapitel 10 Hypotesprövning

f(x) = 2 x2, 1 < x < 2.

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Repetition 2, inför tentamen

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

8 Inferens om väntevärdet (och variansen) av en fördelning

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

σ 12 = 3.81± σ n = 0.12 n = = 0.12

FÖRELÄSNING 8:

SF1901 Sannolikhetsteori och statistik I

Hypotestest och fortsättning av skattningar och konfidensintervall

Avd. Matematisk statistik

Avd. Matematisk statistik

Föreläsning 15: Faktorförsök

Stickprovsvariabeln har en fördelning / sprindning

Uppgift 1. f(x) = 2x om 0 x 1

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Transkript:

Matematisk statistik för B, K, N, BME och Kemister Föreläsning 6 Johan Lindström 13 september 2017 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 1/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 2/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 3/22

Stickprov (Kap. 7.1) Ett stickprov, x 1, x 2,..., x n, är observationer av s.v. X 1,..., X n från någon fördelning X i F(θ) där θ är en okänd parameter. (Kap. 7.1) En skattning av θ, θ (x 1,..., x n ) är en observation av den s.v. θ (X 1,..., X n ). Båda betecknas oftast bara med θ. En skattning är: 1. En funktion från observationer till ett tal. 2. En stokastisk variabel. 3. Ett tal. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 4/22 för μ i N ( μ, σ 2) (Kap. 7.3) x 1,..., x n observationer av X i N ( μ, σ 2) σ 2 känd: σ I μ = x ± λ α/2 n = μ ± λ α/2 D(μ ) σ 2 okänd: I μ = x ± t α/2 (n 1) s n = μ ± t α/2 (f)d(μ ) Där kvantilerna ges av: λ α/2 är N(0, 1)-fördelningens α/2-kvantil (Tabell 2) t α/2 (n 1) är t-fördelningens α/2-kvantil (Tabell 3) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 5/22 för σ 2 i N ( μ, σ 2) (Kap. 8.1.2) x 1,..., x n observationer av X i N ( μ, σ 2) Ett 1 α konfidensintervall för σ 2 ges av ( ) Iσ 2 (n 1)s 2 (n 1)s 2 = χ 2 α/2 (n 1), χ 2 1 α/2 (n 1) Där s 2 = 1 n 1 n (x i x) 2 och χ 2 α/2 (n 1) är χ2 -fördelningens kvantiler (Tabell 4) i=1 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 6/22

: Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 7/22 : Järnhalt i jord () (Kap. 7.7) En geokemist är intresserad av att undersöka hur halten av järn varierar i skogsmark. På två lokaler gräver hon 6 resp. 7 gropar, tar ett prov från varje grop och bestämmer sedan järnhalten (mg/g): Lokal I, x i : 23.3 9.0 9.8 19.9 15.0 20.5 Lokal II, y i : 20.8 26.5 18.3 28.6 33.1 21.5 29.3 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan de två lokalerna? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 8/22 Sammanvägd variansskattning (Kap. 7.4) Om vi har x 1,..., x nx y 1,..., y ny obs. av X i N (μ x, σ 2) obs. av Y i N (μ y, σ 2) kan den gemensamma variansen σ 2 skattas med s 2 p = (n x 1)s 2 x + (n y 1)s 2 y n x 1 + n y 1 = Q ( ) Q f, σ 2 χ2 (f) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 9/22

(Kap. 7.8) Vid många mätsituationer är det vanligt att man mäter före och efter en behandling på n inbördes olika föremål. Modell: Före: X i N ( μ i, σ 2 ) 1 Efter: Y i N ( μ i + Δ, σ 2 ) 2 Vi vill nu skatta effekten av behandlingen (Δ). Bilda Z i = Y i X i N ( Δ, σ 2). Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 10/22 eller två stickprov? Blodtrycket hos ett antal patienter mäts förre och efter behandling med blodtryckssänkande medicin; konfidensintervall för sänkningen? Luftkvaliteten mäts längs Hornsgatan i Stockholm vintern 2009 (dubbdäck fortfarande tillåtna) och 2010 (efter dubbdäcksförbud); konfidensintervall för skillnaden i luftkvalitet? ph-värdet möts varje dag i Höjeå förre och efter Lunds reningsverk; konfidensintervall för skillnaden? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 11/22 : Järnhalt i jord () Geokemisten är speciellt intresserad av eventuella skillnader i järnhalten mellan olika nivåer i groparna. Hon tar därför, från 4 olika gropar, ett prov på A-nivå (nära ytan) och ett prov på C-nivå (c:a 1 meter djupt). Området är av mycket heterogen karaktär, dvs troligen varierar järnhalten mycket mellan olika gropar. Grop nr: 1 2 3 4 Nivå A: 19.15 23.35 20.1 16.7 Nivå C: 21.96 27.7 22.93 19.02 z i = y i x i 2.81 4.35 2.83 2.32 Ange en lämplig modell och gör ett konfidensintervall för skillnaden i järnhalt mellan A- och C-nivårena. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 12/22

: Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 13/22 Statistikteori översikt Punktskattning Hur gör man en bra gissning av en okänd storhet? Hur vet man att den är bra? Intervallskattning Hitta istället ett intervall som täcker den okända storheten med en given (stor) sannolikhet. Hypotestest Om gissningen blev 0.013, kan rätt värde på den okända storheten ändå vara 0.01? Regression Hur vet vi om två variabler påverkar varandra? Försöksplanering & Faktorförsök Hur konstruerar man studier som på bäst sätt (minst antal mätningar) undersöker effekten av olika faktorer (behandlingar)? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 14/22 (Kap. 7.5) H 0 förkastas om observationerna, θ, avviker för mycket från nollhypotesen θ 0. Testa nollhypotesen H 0 : θ = θ 0 mot mothypotesen (tex) H 1 : θ θ 0 på nivån α; felrisken α ges av α = P(H 0 förkastas trots att den är sann) För mycket beror på osäkerheten i skattningen, D(θ ), samt felrisken α. Normalt är α = 0.05, 0.01 eller 0.001. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 15/22

Olika metoder för att utföra hypotestest 1. Direktmetoden eller P-värde (Def. 7.35) Antag att H0 är sann Räkna ut P-värdet p = P(Få det vi fått eller värre) Om p < α förkastas H 0 2. Konfidensmetoden (Kap. 7.5.2) Gör ett konfidensintervall med konfidensgraden 1 α och förkasta H 0 på nivån α om intervallet ej täcker θ 0. Intervallen skall, beroende på H 1, vara Test H 1 : θ < θ 0 H 1 : θ θ 0 H 1 : θ > θ 0 Intervall: uppåt begr tvåsidigt nedåt begr 3. Testkvantitet T(X) och kritiskt område C (Kap. 7.5.3) Förkasta H 0 om testskvantiteten hamnar i det kritiska området. C och T skall väljas så att α = P(T(X) C) = P( Förkasta H 0 om H 0 är sann ) Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 16/22 Bra och dåliga hypotestest Hypotestest på nivån α H 0 förkastas (tillfördel för H 1 ) med sannolikhet α då (trots att) H 0 är sann. Kan vi konstruera ett test som inte använder data? Hur beter sig ett perfekt (idealt) test? Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 17/22 : Rattonykterhet Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 18/22

& Felrisker (Kap. 7.6) Användas för att avgöra hur bra testet skiljer H 0 från H 1. h(θ) = P( Förkasta H 0 om θ är rätt värde ) Typ 1 fel: Typ 2 fel: α = P(H 0 förkastas om H 0 sann) β = P(H 0 förkastas ej om H 0 ej sann) Vi ser att α = h(θ 0 ). Om rätt värde på θ är θ 1 fås β = 1 h(θ 1 ). Naturens okända sanning H 0 sann H 1 sann Vårt H 0 förk. ej β Beslut H 0 förkastas α Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 19/22 empel: Rattonykterhet Gränsen för rattonykterhet är 0.2. Antag att mätvärdet vid en mätning, x i, är X i = μ + ε i där μ är den sanna alkoholhalten och ε i är oberoende, N ( 0, 0.04 2) -fördelade mätfel. För att avgöra om en person är skyldig till rattonykterhet kan man testa hypotesen H 0 : μ = 0.2 mot H 1 : μ > 0.2 på nivån α = 0.001. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 20/22 1. Ange i ord vad felrisken α = P(Förkasta H 0 om H 0 är sann) innebär i hypotestestet ovan. 2. Om man gjort n = 3 mätningar och fått medelalkoholhalten till x = 0.24, skall man då dömas? 3. Hur högt kan det uppmätta medelvärdet, baserat på tre mätningar, vara utan att man döms? 4. Bestäm styrkefunktionen för testet. Dvs h(μ) = P(H 0 förkastas om μ är det sanna värdet) 5. Om den sanna alkoholhalten är 0.25, vad är då sannolikheten att inte dömas. 6. Hur många mätningar behöver göras för att man med högst β = 20% slh skall frikännas om man har 0.25. Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 21/22

för testet av promillehalt (H 0 : μ = 0.2) h(µ) = P(Förkasta H 0 ) 1 0.8 0.6 0.4 0.2 n = 3, σ = 0.04 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ n fördubblad resp. σ halverad 1 0.8 0.6 0.4 0.2 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ Den okända sanningen Nykter Olovligt påverkad Mätresultat μ = x Säkerhetsmarginal Kritiskt område Slutsats från test Frikänns Döms μ 0 0.2 0.27 Johan Lindström - johanl@maths.lth.se FMSF70/MASB02 F6 22/22