Föreläsning 12, FMSF45 Hypotesprövning

Relevanta dokument
Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för B, K, N, BME och Kemister

TAMS65 - Föreläsning 6 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Föreläsning 11, FMSF45 Konfidensintervall

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Matematisk statistik för B, K, N, BME och Kemister

Thomas Önskog 28/

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 5: Hypotesprövningar

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

9. Konfidensintervall vid normalfördelning

TMS136. Föreläsning 13

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

F9 Konfidensintervall

Föreläsningsanteckningar till kapitel 9, del 2

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 11: Mer om jämförelser och inferens

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

SF1901 Sannolikhetsteori och statistik I

Föreläsning 5. Kapitel 6, sid Inferens om en population

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

10. Konfidensintervall vid två oberoende stickprov

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

TMS136. Föreläsning 11

Avd. Matematisk statistik

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Matematisk statistik för D, I, Π och Fysiker

TMS136. Föreläsning 10

Avd. Matematisk statistik

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

FÖRELÄSNING 7:

Matematisk statistik KTH. Formelsamling i matematisk statistik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Föreläsning 11, Matematisk statistik Π + E

Mer om konfidensintervall + repetition

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Hypotestest och fortsättning av skattningar och konfidensintervall

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 17, Matematisk statistik Π + E

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Repetition 2, inför tentamen

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Laboration 4: Hypotesprövning och styrkefunktion

Hur man tolkar statistiska resultat

Om statistisk hypotesprövning

Föreläsningsanteckningar till kapitel 8, del 2

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

FÖRELÄSNING 8:

Lufttorkat trä Ugnstorkat trä

Repetitionsföreläsning

Konfidensintervall, Hypotestest

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Formel- och tabellsamling i matematisk statistik

Datorövning 3 Hypotesprövning och styrka

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Avd. Matematisk statistik

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Övningstentamen 2 Uppgift 1: Uppgift 2: Uppgift 3: Uppgift 4: Uppgift 5: Uppgift 6: i ord

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Föreläsning 6: Hypotestester (forts.)

Avd. Matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Introduktion till statistik för statsvetare

Matematisk statistik för D, I, Π och Fysiker

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Avd. Matematisk statistik

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

Extrauppgifter - Statistik

Föreläsning 15, FMSF45 Multipel linjär regression

Avd. Matematisk statistik

Föreläsning 12: Repetition

Tenta i Statistisk analys, 15 december 2004

Transkript:

Föreläsning 12, FMSF45 Hypotesprövning Stas Volkov 2017-11-14 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 1/1

Konfidensintervall Ett konfidensintervall för en parameter θ täcker rätt värde på θ med sannolikheten 1 α. 1 α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och 0.999. Intervall för normal(approximation) Om θ N(θ, D(θ )) eller θ N(θ, D(θ )): Om D(θ ) känd: I θ = θ ± λ α/2 D(θ ) Om D(θ ) okänd, skattas med d(θ ): I θ = θ ± t α/2 (f) d(θ ) om d(θ ) innehåller σ = s = I θ = θ ± λ α/2 d(θ ) annars Q f Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 2/1

Exempel: Fosforhalt Man har mätt fosforhalten (μg/l) i en viss sjö n = 4 gånger: 92.7 110.9 101.4 122.9 Vi antar att mätningarna är oberoende observationer av X i N(μ, σ) där μ är den sanna fosforhalten i sjön. Vi vet att σ = 16 och skattar μ = x = 106.975. Om fosforhalten i en sjö överstiger 100 μg/l klassas sjön som hypertrof (övergödd). Kan vi påstå att sjön är övergödd, baserat på dessa fyra mätningar? Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 3/1

Hypotesprövning H 0 förkastas om observationerna, θ, avviker för mycket från nollhypotesen θ 0. Testa nollhypotesen H 0 : θ = θ 0 mot mothypotesen (t.ex.) H 1 : θ θ 0 på nivån α; signifikansnivån (felrisken) α ges av α = P(H 0 förkastas, givet att den är faktiskt sann) För mycket beror på osäkerheten i skattningen, D(θ ), samt på signifikansnivån α. Normalt är α = 0.05, 0.01 eller 0.001. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 4/1

Mothypoteser (ekvivalent Alternativ hypoteser) De vanligaste mothypoteserna är H 1 : θ θ 0 då H 0 förkastas om θ avviker för långt från θ 0 både uppåt och nedåt. H 1 : θ < θ 0 då H 0 förkastas om θ är tillräckligt mycket mindre än θ 0. H 1 : θ > θ 0 då H 0 förkastas om θ är tillräckligt mycket större än θ 0. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 5/1

Olika metoder för att utföra hypotestest 1. Direktmetoden eller P-värde Antag att H 0 är sann Räkna ut P-värdet p = P(Få det vi fått eller värre ) Förkasta H 0 om p < α 2. Konfidensmetoden. Gör ett konfidensintervall med konfidensgraden 1 α och förkasta H 0 på nivån α om intervallet ej täcker θ 0. Intervallen skall, beroende på H 1, vara Test H 1 : θ < θ 0 H 1 : θ θ 0 H 1 : θ > θ 0 Intervall: uppåt begr tvåsidigt nedåt begr 3. Testkvantitet T(X) och kritiskt område C Förkasta H 0 om testkvantiteten hamnar i det kritiska området. C och T skall väljas så att α = P(T(X) C) = P(Förkasta H 0, givet H 0 är sann) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 6/1

Exempel: Fosforhalt(igen) Stickprov x 1,..., x n från X N(μ, σ) där n = 4, σ = 16 och μ = x = 106.975. Hypoteser: H 0 : μ = 100 H 1 : μ > 100 dvs H 0 förkastas om μ är tillräckligt mycket > 100. Hur långt från 100 kan man förvänta sig att medelvärdet kan hamna om väntevärdet är 100? = Kritiskt område Är 106.975 orimligt långt från 100? = Direktmetoden Är 100 ett rimligt väntevärde om skattningen blev 106.975? = Konfidensintervall Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 7/1

Lämplig procedur för lösningar: Modell: Vad är slumpmässigt och vilken fördelning kan det ha? Sätt upp en lämplig modell. Skattning: Vilken parameter är vi intresserade av, vad i den är okänt och hur skattar vi det? Egenskaper: Vad har skattningen för egenskaper? Problemet: Formulera och lös problemet. Slutsats: Svara på frågan. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 8/1

Fosfor: 1. Modell: Vi har n = 4 oberoende observationer x 1,..., x n från X i = fosformätning nr. i N(μ, σ) där σ = 16 är känd. 2. Skattning: Vi skattar μ med μ = x = 106.975. 3. Egenskaper: ( Vi har ) att μ = X σ N μ, = N n ( μ, 16 4 ) = N(μ, 8). 4. Problemet: Vi vill testa H 0 : μ = 100 mot H 1 : μ > 100 på signifikansnivån (t.ex.) α = 0.05. ( ) Om H 0 är sann så gäller att μ σ N μ 0, = N(100, 8). n Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 9/1

4. (forts): Lösning m.h.a. direktmetoden. P-värdet för testet blir p = P(få det vi fått eller värre om H 0 är sann) = P( X > x μ = μ 0 ) = P( X > 106.975 μ = 100) ) ( ) ( x μ0 106.975 100 = 1 Φ σ/ = 1 Φ n 8 1 Φ(0.87) 0.19 Eftersom p = 0.19 α = 0.05 kan H 0 kan inte förkastas på signifikansnivån 5 %. Lösning med hjälp av konfidensintervall:... Lösning med hjälp av kritiskt område:... 5. Slutsats: Nej, vi kan inte påstår att sjön är övergödd. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 10/1

Normalfördelning, θ N (θ, D(θ )), H 0 : θ = θ 0 Testkvantitet: T = θ θ 0 D(θ ), D(θ ) känd T = θ θ 0 d(θ ), D(θ ) okänd och σ = s = Förkasta H 0 om (kritiska områden) Q f H 1 : θ < θ 0 H 1 : θ θ 0 H 1 : θ > θ 0 D(θ ) känd T < λ α T > λ α/2 T > λ α D(θ ) okänd T < t α (f) T > t α/2 (f) T > t α (f) Jämför kvantiler λ α eller t α med konfidensintervallen. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 11/1

Styrkefunktion & Felrisker Styrkefunktion Används för att avgöra hur bra testet skiljer H 0 från H 1. h(θ) = P(Förkasta H 0 om θ är rätt värde) Typ 1 fel: Typ 2 fel: α = P(H 0 förkastas om H 0 sann) β = P(H 0 förkastas ej om H 0 ej sann) Naturens okända sanning H 0 sann H 1 sann Vårt H 0 förk. ej β beslut H 0 förkastas α Vi ser att α = h(θ 0 ). Om rätt värde på θ är θ 1 fås β = 1 h(θ 1 ). Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 12/1

Felrisker Antag n = 5 observationer från en N (μ, 1) fördelning. Om vi vill testa H 0 : μ = 1 H 1 : μ > 1 blir fördelningen för μ då H 0 är sann respektive om μ = 2. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 13/1

Exempel: Rattonykterhet Gränsen för rattonykterhet är 0.2. Antag att mätvärdet vid en mätning, x i, är X i = μ + ε i där μ är den sanna alkoholhalten och ε i är oberoende, N(0, 0.04)-fördelade mätfel. För att avgöra om en person är skyldig till rattonykterhet kan man testa hypotesen H 0 : μ = 0.2 mot H 1 : μ > 0.2 på nivån α = 0.001. Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 14/1

1. Ange i ord vad felrisken α = P(Förkasta H 0 om H 0 är sann) innebär i hypotestestet ovan. 2. Om man gjort n = 3 mätningar och fått medelalkoholhalten till x = 0.24, skall man då dömas? 3. Hur högt kan det uppmätta medelvärdet, baserat på 3 mätningar, vara utan att man döms? 4. Bestäm styrkefunktionen för testet. Dvs. få reda på h(μ) = P(H 0 förkastas om μ är det sanna värdet) 5. Om den sanna alkoholhalten är 0.25, vad är då sannolikheten att inte dömas? 6. Hur många mätningar behöver göras för att man med högst β = 20% sannolikhet skall frikännas om man har 0.25. (Dvs bestäm n så att h(0.25) 1 β, där β = 0.2.) Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 15/1

Styrkefunktion för testet av promillehalt (H 0 : μ = 0.2) h(µ) = P(Förkasta H 0 ) 1 0.8 0.6 0.4 0.2 n = 3, σ = 0.04 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ 1 0.8 0.6 0.4 0.2 n fördubblad resp. σ halverad 0 0.1 0.2 0.3 0.4 faktisk alkoholhalt µ Den okända sanningen Nykter Olovligt påverkad Mätresultat μ = x Säkerhetsmarginal Kritiskt område Slutsats från test Frikänns Döms μ 0 0.2 0.27 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F12: Hypotestest 16/1