TAMS65 - Föreläsning 6 Hypotesprövning

Relevanta dokument
TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning 12, FMSF45 Hypotesprövning

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 5: Hypotesprövningar

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

TAMS65 - Föreläsning 8 Test av fördelning χ 2 -test

Thomas Önskog 28/

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Laboration 4: Hypotesprövning och styrkefunktion

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 5. Kapitel 6, sid Inferens om en population

TAMS65 - Föreläsning 12 Test av fördelning

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Matematisk statistik KTH. Formelsamling i matematisk statistik

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

TAMS65 - Föreläsning 12 Test av fördelning

Föreläsningsanteckningar till kapitel 9, del 2

Matematisk statistik för D, I, Π och Fysiker

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TMS136. Föreläsning 11

Konfidensintervall, Hypotestest

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Avd. Matematisk statistik

Repetition 2, inför tentamen

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Lufttorkat trä Ugnstorkat trä

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister

Avd. Matematisk statistik

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Kapitel 10 Hypotesprövning

Formel- och tabellsamling i matematisk statistik

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

10. Konfidensintervall vid två oberoende stickprov

Statistik 1 för biologer, logopeder och psykologer

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

TMS136. Föreläsning 10

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Avd. Matematisk statistik

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

σ 12 = 3.81± σ n = 0.12 n = = 0.12

9. Konfidensintervall vid normalfördelning

Om statistisk hypotesprövning

Föreläsning 11, FMSF45 Konfidensintervall

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Avd. Matematisk statistik

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Extrauppgifter i matematisk statistik

Avd. Matematisk statistik

Föreläsning G60 Statistiska metoder

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Hur man tolkar statistiska resultat

Extrauppgifter - Statistik

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 12: Repetition

Avd. Matematisk statistik

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Avd. Matematisk statistik

F10 Problemlösning och mer om konfidensintervall

Matematisk statistik för B, K, N, BME och Kemister

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

TMS136. Föreläsning 13

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

SF1901 Sannolikhetsteori och statistik I

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

LÖSNINGAR TILL P(A) = P(B) = P(C) = 1 3. (a) Satsen om total sannolikhet ger P(A M) 3. (b) Bayes formel ger

Tentamen i Sannolikhetslära och statistik, TNK069, , kl 8 13.

Transkript:

TAMS65 - Föreläsning 6 Hypotesprövning Martin Singull Matematisk statistik Matematiska institutionen

Innehåll Exempel Allmän beskrivning P-värde Binomialfördelning Normalapproximation TAMS65 - Fö6 1/33

När man bildar konfidensintervall, vill man dra slutsatser om intressanta parametrar från sin data. Detta är egentligen inget annat än något som kallas signifikanstest eller hypotesprövning. Alltså, i vissa fall kan man genomföra signifikanstestet med hjälp av konfidensintervall (konfidensmetoden), men det finns också särskilda mer direkta metoder. Vi börjar med ett exempel. TAMS65 - Fö6 2/33

Exempel a) På en viss ort har man en bakgrundsstrålning som är sådan att antalet registrerade partiklar under t timmar med en viss utrustning är Po(6t), där 6 är den normala strålningsintensiteten. Man gör regelbundna mätningar med t = 5 timmar. Bestäm en gräns C som kan användas för att larma om förhöjd strålning men så att man sällan får falsklarm, d.v.s. sådan att P(X > C) 0.05, där C är ett heltal (så litet som möjligt) och X är antalet registrerade partiklar i en mätning. b) Anta att strålningsintensiteten har ökat till 9 i samband med ett mindre radioaktivt utsläpp. Beräkna sannolikheten att man vid nästa rutinmätning får ett värde större än C, vilket leder till larm om förhöjd radioaktivitet. Är Du nöjd med sannolikheten? TAMS65 - Fö6 3/33

Lösning a) Under 5 timmar kan vi förvänta oss 30 partiklar. Vidare har vi den s.v. ( X Po(30) approx. N 30, ) 30 som ger ( ) C 30 P(X > C) = 1 P(X C) 1 Φ och 30 ( ) ( ) C 30 C 30 1 Φ 0.05 Φ 0.95 30 30 C 30 30 1.645 C 39.01 välj C = 39. TAMS65 - Fö6 4/33

b) Nu har vi att Y Po(45) approx. N ( 45, ) 45 ( ) C 45 P(Y > C) = 1 P(Y C) 1 Φ = /C = 39/ 45 = 1 Φ( 0.894) = Φ(0.894) 0.81. Detta är egentligen ett hypotesprövningsproblem! TAMS65 - Fö6 5/33

Vid rutinmätningarna prövar man mot H 0 : λ = 6 (allt normalt) H 1 : λ > 6 (förhöjd strålning) Som teststorhet väljer vi x och H 0 förkastas om x > C (larm). Villkoret P(X > C om H 0 är sann ) = 0.05 = α ger C = 39. Alltså vi väljer C så att man ganska sällan larmar i onödan. Å andra sidan vill man att en förhöjning ska leda till larm, så P(Y > C om λ = 9) = 0.81 som kallas styrkan för λ = 9. Det är alltså bra att den här sannolikheten är stor. TAMS65 - Fö6 6/33

Praktiskt fall: Vid en rutinmätning av strålningen under 5 timmar fick man 42 registrerade partiklar. Skall man larma? Ja, eftersom 42 > 39. Sannolikheten att vi nu larmar i onödan är alltså α = 0.05. TAMS65 - Fö6 7/33

Allmän beskrivning Vi har observerade värden x 1,..., x n (ibland är n = 1) av oberoende s.v. X 1,..., X n, vars täthetsfunktion eller sannolikhetsfunktion innehåller en okänd parameter θ. Vi vill pröva nollhypotesen (eng. null hypothesis) H 0 : θ = θ 0 d.v.s. att parametern θ har ett bestämt värde θ 0, mot någon mothypotes H 1 (eng. alterantive hypothesis). TAMS65 - Fö6 8/33

För att pröva H 0 mot H 1 konstruerar man en teststorhet (eng. test statistic) t(x 1,..., x n ) och ett kritiskt område (eng. critical region) C. H 0 förkastas om t(x 1,..., x n ) C, och då drar vi slutsatsen att H 1 gäller. Valet av C beror på H 1 och på signifikansnivån (eng. significance level) α = P(H 0 förkastas om H 0 är sann ) = P(t(X 1,..., X n ) C om H 0 är sann), där H 1 inverkar genom att man väljer C så att teststorheten får en benägenhet att hamna i C om mothypotesen H 1 är sann. TAMS65 - Fö6 9/33

Styrkan (eng. power) för ett värde θ 1 (i H 1 ) är P(H 0 förkastas om θ 1 är det sanna värdet ) = = P(t(X 1,..., X n ) C om θ 1 är det sanna värdet). Styrkefunktionen (eng. power function) ges av h(θ) = P(H 0 förkastas om θ är det sanna värdet) = P(t(X 1,..., X n ) C om θ är det sanna värdet). Fel av typ I: Att förkasta H 0 då den är sann. Signifikansnivån α = risken för fel av typ I. Fel av typ II: Att inte förkasta H 0, då den är falsk. TAMS65 - Fö6 10/33

P-värde Ofta så redovisar man sitt testresultat som ett så kallat P-värde, där P = sannolikheten, då H 0 är sann, att få ett minst lika extremt värde på teststorheten som det man observerat. Ett lågt P-värde tyder på kraftig avvikelse från H 0 H 0 förkastas P < α. (Alternativ definition: P-värdet är den lägsta signifikansnivå vid vilken H 0 kan förkastas.) Det är ofta inte så lätt att räkna ut P-värdet, men det brukar finnas i datorutskrifter. TAMS65 - Fö6 11/33

Exempel, forts. Vi har x = 42 som är observation av X Po(30) om H 0 är sann. Stora värden på x tyder på att H 1 gäller. Alltså P = P(X 42 om H 0 är sann) = 1 P(X < 42 om H 0 är sann) = 1 P(X 41 om X Po(30)) ( ) 41 30 1 Φ = 1 Φ(2.01) 0.0228. 30 Det är osannolikt att få så hög strålning när H 0 är sann. P < 0.05 H 0 förkastas. TAMS65 - Fö6 12/33

En- och tvåsidiga test Vi begränsar oss tills vidare till fallet att teststorheten är en växande funktion av en punktskattning ˆθ. 1 H 1 : θ θ 0 ; H 0 förkastas om t(x 1,..., x n ) a. Konfidensmetoden: Gör nedåt / uppåt begränsat konfidensintervall för θ. H 0 förkastas då θ 0 I θ. Konfidensgrad = 1 α. 2 H 1 : θ θ 0 ; H 0 förkastas om t(x 1,..., x n ) < b 1 eller t(x 1,..., x n ) > b 2. α 2 = P(t(X 1,..., X n ) < b 1 om θ = θ 0 ) α 2 = P(t(X 1,..., X n ) > b 2 om θ = θ 0 ) Konfidensmetoden: Gör tvåsidigt konfidensintervall etc. Regel: Mothypotesen H 1 är det man vill visa och nollhypotesen H 0 det man tror är falskt, men hypoteserna skall formuleras innan man sett mätresultaten. TAMS65 - Fö6 13/33

Teststorhet Beslut Yttrande t C H 0 förkastas Vi har funnit en signi- (till förmån för H 1 ) fikant avvikelse från H 0 på nivån α. Med felrisk α kan vi hävda att H 1 gäller. t C H 0 förkastas ej Ingen signifikant av- (kan H 0 accepteras?!?) vikelse från H 0, nivån α. H 0 kan vara sann. (jfr. ex. med hästen) TAMS65 - Fö6 14/33

Exempel - Binomialfördelning test av p = p 0 Vad väljer du? Någon påstår att 30% av svenska ungdomar, 15 30 år, föredrar Iphone framför Android och vi tror absolut att det är fler. Vi gör en undersökning. Av 10 slumpmässigt valda personer säger 7 att de föredrar Iphone. Skulle vi kunna få ett så här extremt resultat av en slump eller kan vi med någon säkerhet hävda att mer än 30% föredrar Iphone. TAMS65 - Fö6 15/33

Låt p = andelen som föredrar Iphone bland svenska ungdomar, 15 30 år. Vi har x = 7 som är observationer av X Bin(10, p), då populationen är stor. Vi vill pröva på signifikansnivån högst 5%. H 0 : p = 0.3 mot H 1 : p > 0.3, Valet av H 1 beror på att vi i förväg trodde att p > 0.3. Vi har ˆp = x 10 = 0.7 Teststorhet: x TAMS65 - Fö6 16/33

Det är rimligt att förkasta H 0 om ˆp är stor, d.v.s. om x a, eftersom E(X ) = np som blir 0.3n om H 0 är sann och större än 0.3n om H 1 är sann. Den kritiska gränsen a är ett heltal sådant att 0.05 P(X a om H 0 är sann) = P(X a om p = 0.3) Bin(10, 0.3)-tabell ger a = 6 eftersom Slutsats: Vi har x = 7 > 6. H 0 förkastas. Med felrisk 5% (4.73%) kan vi påstå att p > 0.3. TAMS65 - Fö6 17/33

Styrkefunktionen ges av h(p) = P(H 0 förkastas om p är rätta värdet) = P(X 6 om p är rätta värdet) 10 ( ) 10 = p k (1 p) 10 k k k=6 }{{} se tabell Man vill att h(p) skall vara stor för p-värden i mothypotesen. Tabell ger p 0.1 0.3 0.5 0.7 0.9 h(p) 0.0001 0.0473 0.3770 0.8497 0.9984 Notera att h(0.3)= signifikansnivån. TAMS65 - Fö6 18/33

Tolkning: Om p = 0.5 och vi frågar 10 personer, så är sannolikheten för resultatet H 0 förkastas bara 0.377. Däremot är h(0.7) hyfsat stor. h(0.7) kallas testets styrka för p = 0.7. Styrkeberäkningar är särskilt intressanta när man planerar en undersökning. Anm. Om n ˆp ˆq varit större än 10 så hade vi kunnat pröva H 0 genom att göra ett nedåt begränsat konfidensintervall för p och förkasta H 0 om 0.3 I p. TAMS65 - Fö6 19/33

Normalapprox vid binomialfördelning Vi har x som är observation av X Bin(n, p). Vi vill pröva på nivån α. H 0 : p = p 0 mot H 1 : p p 0 Om np 0 q 0 > 10, så gäller (se Fö5) då H 0 sann, att Teststorhet: z = ˆp p 0 p0 q 0 /n P = X ) (p n approx. N p0 q 0 0, n TAMS65 - Fö6 20/33

Den s.v. Z approx. N(0, 1) då H 0 är sann ( under H 0 ). När ska vi förkasta H 0? Betrakta hypoteserna och teststorheten igen H 0 : p = p 0 mot H 1 : p p 0 z = ˆp p 0 p0 q 0 /n TAMS65 - Fö6 21/33

H 0 förkastas om z < a eller z > a. TAMS65 - Fö6 22/33

Anm. 1 Även då man utnyttjar normalapproximation kan man i binomialfördelningsfallet utnyttja x som teststorhet. Anm. 2 Då normalapproximation är tillåten kan vi ju pröva H 0 med hjälp av ett konfidensintervall, men då är det svårare att beräkna styrkan. TAMS65 - Fö6 23/33

Ex. - Poissonapproximation vid binomialfördelning Vid avdelningen för kvalitetskontroll hos läkemedelsföretaget Astra i Södertälje har man bland de kvinnliga anställda undersökt hur ofta dessa fött barn, som varit döda eller missbildade. 14 sådana barn föddes under 1970-talet vid sammanlagt 97 förlossningar. Riksgenomsnittet för andelen döda eller missbildade barn är 4%. Undersök med hjälp av ett lämpligt test på nivån 1% om sannolikheten att föda missbildade eller döda barn är större än 4% för kvinnor anställda hos Astra. TAMS65 - Fö6 24/33

TAMS65 - Fö6 25/33

Normalapproximation allmänt Med hjälp av ett eller flera stickprov har vi tagit fram en punktskattning ˆθ och den s.v. Θ är approx. N(θ, D). Vi vill nu pröva Teststorhet ˆθ θ 0 z = D ˆθ θ 0 d H 0 : θ = θ 0. om D känd då H 0 sann, om D okänd, där d är en skattning av D som gäller då H 0 är sann. Den s.v. Z är approx. N(0, 1) om H 0 är sann. Ensidigt eller tvåsidigt test beror på mothypotesen. Notera att teststorheten är väldigt lik hjälpvariabeln för konstruktion av I θ. Man kan säga att teststorheten är hjälpvariabeln under H 0 (d.v.s. när H 0 är sann). TAMS65 - Fö6 26/33

Två Binomialfördelningar Vi har x som är en observation av X Bin(n 1, p 1 ) och y som är en observation av Y Bin(n 2, p 2 ). Vi vill pröva mot på nivån α. H 0 : p 1 = p 2 p 1 p 2 = 0, H 1 : p 1 p 2 p 1 p 2 0, Vi har från tidigare den s.v. P 1 P 2 (p 1 p 2 ) p1 q 1 n 1 + p 2q 2 n 2 P1 = P 2 under H 0 ( 1 pq + 1 ), n 1 n 2 där p 1 = p 2 = p och q = 1 p. TAMS65 - Fö6 27/33

Under H 0 (p 1 = p 2 = p) kan vi skatta p (intuitivt!?) med ˆp = x + y n 1 + n 2, vilket man också kan visa är ML-skattningen (alltså konsistent). Som teststorhet väljer vi nu z = ˆp 1 ˆp 2 ( 1 ˆp ˆq + 1 ), n 1 n 2 där ˆq = 1 ˆp. För s.v. Z gäller att under H 0 så Z approx. N(0, 1). TAMS65 - Fö6 28/33

För att genomföra det testet ovan kan det vara lättare att konstruera ett tvåsidigt konfidensintervall för p 1 p 2 med konfidensgraden 1 α och förkasta H 0 om 0 I p1 p 2. Då använder vi hjälpvariabeln (från Fö5) P 1 P 2 (p 1 p 2 ) P1 Q1 + P 2 Q2 n 1 n 2 approx. N(0, 1) och fortsätter som vanligt. TAMS65 - Fö6 29/33

Ex. - Normalapprox vid två binomialfördelning Vid tillverkning av en viss sorts enheter kan det uppstå defekter. Man har två maskiner för tillverkningen och önskar undersöka deras defektsannolikheter. Man tillverkar därför 1 000 enheter med varje maskin och observerar härvid 10 respektive 20 defekta enheter. Testa på nivån 5 % att maskinerna har lika defektsannolikheter mot att det finns skillnad mellan dem. TAMS65 - Fö6 30/33

TAMS65 - Fö6 31/33

Sammanfattning Vi har diskuterat de grundläggande begreppen vid hypotesprövning och tillämpat ideerna vid binomialfördelning och Poissonfördelning. 1 Vi har en observation x av X Bin(n, p) och vill pröva H 0 : p = p 0, där p 0 är ett givet värde. Teststorhet: x. 2 Vi har en observation y av Y Po(λt) och vill pröva H 0 : λ = λ 0 där λ 0 är ett givet värde. Teststorhet: y. TAMS65 - Fö6 32/33

För vilka värden på teststorheten som nollhypotesen ska förkastas beror på mothypotesen. Om normalapproximation är tillåten finns det alternativa teststorheter, men de båda på sidan ovan fungerar även då. Man ofta kan pröva en hypotes med hjälp av ett konfidensintervall. Man ser på mothypotesen vilken sorts intervall man ska göra. TAMS65 - Fö6 33/33

http://courses.mai.liu.se/gu/tams65/