SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Relevanta dokument
SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning 12, FMSF45 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Thomas Önskog 28/

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Föreläsning 5: Hypotesprövningar

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Föreläsningsanteckningar till kapitel 9, del 2

Matematisk statistik KTH. Formelsamling i matematisk statistik

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 11: Mer om jämförelser och inferens

Matematisk statistik för B, K, N, BME och Kemister

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest

Lufttorkat trä Ugnstorkat trä

Avd. Matematisk statistik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

SF1901 Sannolikhetsteori och statistik I

Matematisk statistik för B, K, N, BME och Kemister

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Avd. Matematisk statistik

Avd. Matematisk statistik

Statistik 1 för biologer, logopeder och psykologer

TMS136. Föreläsning 11

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Avd. Matematisk statistik

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Kapitel 10 Hypotesprövning

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014

FÖRELÄSNING 8:

9. Konfidensintervall vid normalfördelning

SF1901 Sannolikhetsteori och statistik I

F3 Introduktion Stickprov

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Avd. Matematisk statistik

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Avd. Matematisk statistik

Om statistisk hypotesprövning

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Föreläsning G60 Statistiska metoder

Avd. Matematisk statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Del I. Uppgift 1 Låt X och Y vara stokastiska variabler med följande simultana sannolikhetsfunktion: p X,Y ( 2, 1) = 1

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Föreläsning 4: Konfidensintervall (forts.)

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Konfidensintervall, Hypotestest

Avd. Matematisk statistik

SF1901: Medelfel, felfortplantning

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Matematisk statistik för D, I, Π och Fysiker

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Föreläsning 9, Matematisk statistik 7.5 hp för E Konfidensintervall

Formel- och tabellsamling i matematisk statistik

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

Matematisk statistik för B, K, N, BME och Kemister

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

TMS136. Föreläsning 13

Avd. Matematisk statistik

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 12: Regression

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK MER OM KONFIDENSINTERVALL. HYPOTESPRÖVNING. Jan Grandell & Timo Koski

Matematisk statistik för B, K, N, BME och Kemister

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Föreläsning 6: Hypotestester (forts.)

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Avd. Matematisk statistik

2. Test av hypotes rörande medianen i en population.

Föreläsning 11, FMSF45 Konfidensintervall

8 Inferens om väntevärdet (och variansen) av en fördelning

F9 Konfidensintervall

Parade och oparade test

Transkript:

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 12. MER HYPOTESPRÖVNING. χ 2 -TEST Jan Grandell & Timo Koski 25.02.2016 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 1 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. signifikant*, signifikant**, signifikant*** Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. signifikant*, signifikant**, signifikant*** p -värden Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. signifikant*, signifikant**, signifikant*** p -värden Styrkefunktion Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. signifikant*, signifikant**, signifikant*** p -värden Styrkefunktion ensidiga test Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

INNEHÅLL Hypotesprövning och konfidensmetoden; exempel på tvåsidga test Hypotesprövning: allmänt Nollhypotes,mothypotes, Teststorhet (testvariabel), Kritiskt område, Signifikansnivå. signifikant*, signifikant**, signifikant*** p -värden Styrkefunktion ensidiga test χ 2 -test (inledning) Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 2 / 46

HYPOTESPRÖVNING: FRÅN PÅSTÅENDE TILL PROCEDUR Vi har ett påstående om t.ex. ett populationsmedelvärde. EXEMPEL Vid rökning omvandlas nikotin till cotinin, en metabolite av nikotin, som kan mätas. Det påstås att den genomsnittliga nivån av cotinin hos alla rökare är 200.0 ng/ml. Vi kollar nivån av cotinin hos n rökare, och får cotininvärdena x 1,...,x n. Vi använder en statistisk procedur för att checka om påståendet om medelnivån 200.0 kan anses vara förenlig med dessa mätdata. Procedur: inför en statistisk modell, teststorhet, kritiskt område, beslutsregel, signifikansnivå och använd rare event principle Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 3 / 46

STATISTISK HYPOTESPRÖVNING: RARE EVENT RULE If, under a given assumption, the probability of an observed event is very small, we conclude that the assumption is likely not correct. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 4 / 46

STATISTISK HYPOTESPRÖVNING X 1,X 2,...,X n är oberoende och N(µ, σ)-fördelade, där µ och σ är okända. H 0 : µ = µ 0 mot H 1 : µ = µ 0 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 5 / 46

TVÅSIDIGA TEST X 1,X 2,...,X n är oberoende och N(µ, σ)-fördelade, där µ och σ är okända. H 0 : µ = µ 0 mot H 1 : µ = µ 0 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 6 / 46

HYPOTESPRÖVNING Här verkar det rimligt att utgå från t(x 1,...,X n ) = X µ 0 S/ n, som under H 0 är t(n 1)-fördelad, och att förkasta H 0 om t(x 1,...,x n ) är för stor. Vi får då α = P( t(x 1,...,X n ) > c om H 0 sann), vilket ger c = t α/2 (n 1). Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 7 / 46

HYPOTESPRÖVNING: LITE ALGEBRA Kritiska området är alltså t(x 1,...,x n ) > t α/2 (n 1) Fall (A): { t(x1,...,x n ) > t α/2 (n 1) om t(x 1,...,x n ) > 0 (A) t(x 1,...,x n ) > t α/2 (n 1) om t(x 1,...,x n ) < 0 (B) t(x 1,...,x n ) > t α/2 (n 1) x µ 0 s/ n > t α/2(n 1) x µ 0 > t α/2 (n 1)s/ n µ 0 < x t α/2 (n 1)s/ n P.s.s. fås i fallet (B) att µ 0 > x +t α/2 (n 1)s/ n Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 8 / 46

HYPOTESPRÖVNING & KONFIDENSINTERVALL Testet kan alltså utföras så att man bestämmer ett konfidensintervall och ser efter om det hypotetiska värdet µ 0 ligger utanför eller innanför detta; i det förra fallet förkastas H 0, inte i det senare. Bilda ett konfidensintervall I µ = ( x t α/2 (f)s/ n, x +t α/2 (f)s/ n ), f = n 1 och förkasta H 0 om I µ µ 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 9 / 46

HYPOTESPRÖVNING: SAMMANFATTNING AV EXEMPLET X 1,X 2,...,X n är oberoende och N(µ, σ)-fördelade, µ och σ okända. H 0 : µ = µ 0 mot H 1 : µ = µ 0. Bilda ett konfidensintervall I µ = ( x t α/2 (f)d, x +t α/2 (f)d ) och förkasta H 0 om I µ µ 0. Detta verkar rimligt. I µ ger ju de troliga värdena på µ, och om µ 0 inte hör dit, så bör ju H 0 förkastas. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 10 / 46

EX. STICKPROV I PAR H 0 : = 0 mot H 1 : = 0. I = z ± λ α/2 σ/ n om σ känd och I = z ±t α/2 (n 1)s/ n om σ okänd. Förkasta H 0 om I 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 11 / 46

HYPOTESPRÖVNING: EXEMPEL En forskare mäter en storhet θ som på grund av ett mätfel är N(0, σ), och får värdet x, dvs. x är således en observation från N(θ, σ). Forskaren vill pröva en viss hypotes Signifikansnivån skall vara 0.05. H 0 : θ = 2.0. Som testvariabel väljs det erhållna mätvärdet x (= t(x)). Kritiska området blir (se föreläsning 10) Om x 2.0 1.96 σ förkasta H 0 Om x 2.0 < 1.96 σ förkasta ej H 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 12 / 46

HYPOTESPRÖVNING OCH KONFIDENSINTERVALL Men (x 1.96σ,x +1.96σ) är ett tvåsidigt 95 % konfidensintervall för θ. Testet kan alltså utföras så att man bestämmer konfidensintervallet och ser efter om det hypotetiska värdet θ 0 ligger utanför eller innanför detta; i det förra fallet förkastas H 0, inte i det senare. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 13 / 46

HYPOTESPRÖVNING Låt oss betrakta den allmänna situationen, dvs.: Vi har en uppsättning data x 1,x 2,...,x n som ses som utfall av s.v. X 1,X 2,...,X n. Dessa variabler antages vara oberoende och likafördelade och deras gemensamma fördelning beror av en okänd parameter θ. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 14 / 46

HYPOTESPRÖVNING: NOLLHYPOTES, MOTHYPOTES En hypotes är en mängd av θ-värden. Formaliserat betyder detta att vi vill testa en nollhypotes H 0 : θ H 0 mot ett alternativ (eller en mothypotes) H 1 : θ H 1. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 15 / 46

HYPOTESPRÖVNING: TESTSTORHET Att testa H 0 är detsamma som att avgöra om våra data är förenliga med H 0. Om H 0 ej är sann vill vi förkasta H 0 till förmån för H 1. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 16 / 46

HYPOTESPRÖVNING: TESTSTORHET Att testa H 0 är detsamma som att avgöra om våra data är förenliga med H 0. Om H 0 ej är sann vill vi förkasta H 0 till förmån för H 1. Vi bildar därför en teststorhet t = t(x 1,...,x n ) Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 16 / 46

HYPOTESPRÖVNING: TESTSTORHET Att testa H 0 är detsamma som att avgöra om våra data är förenliga med H 0. Om H 0 ej är sann vill vi förkasta H 0 till förmån för H 1. Vi bildar därför en teststorhet t = t(x 1,...,x n ) och ett kritiskt område C. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 16 / 46

HYPOTESPRÖVNING: SIGNIFIKANSNIVÅ Test: Förkasta H 0 om t C. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 17 / 46

HYPOTESPRÖVNING: SIGNIFIKANSNIVÅ Test: Förkasta H 0 om t C. t bestäms av situationen och C av signifikansnivån (eller felrisken) α: signifikansnivån = α P(H 0 förkastas om H 0 sann) = P(T(X 1,...,X n ) C om H 0 sann). Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 17 / 46

HYPOTESPRÖVNING: SIGNIFIKANSNIVÅ Man arbetar med flera signifikansnivå er samtidigt, t.ex. med nivåerna 0.05, 0.01 och 0.001. Kodbeteckningarna signifikant*, signifikant** respektive signifikant*** är för att markera att ett resultat är signifikant på en nivå (men inte för ett lägre α-värde bland dessa tre). Med denna symbolik betyder alltså signifikant* att α = 0.05 ger signifikans men inte α = 0.01, alltså inte heller α = 0.001. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 18 / 46

HYPOTESPRÖVNING: p-värdet Lå t oss betrakta ett test sådant att hypotesen H 0 förkastas om testvariabeln t = t obs = t(x) är stor. Vi förutsätter också att stickprovsvariabeln t(x) har en given känd sannolikhetsfördelning under H 0. p-värdet eller observerade signifikansnivån är sannolikheten p = P ( t(x) t(x) ), beräknad under förutsättningen att H 0 är sann. Om p-värdet är tillräckligt litet förkastas H 0 ; vi tror alltså inte på H 0 om testresultatet är osannolikt då H 0 är sann. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 19 / 46

HYPOTESPRÖVNING: STYRKEFUNKTION Med risknivån garderar vi oss således mot felet att förkasta H 0 då H 0 är sann. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 20 / 46

HYPOTESPRÖVNING: STYRKEFUNKTION Med risknivån garderar vi oss således mot felet att förkasta H 0 då H 0 är sann. Vi bör välja H 0 så att detta är det allvarligaste felet. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 20 / 46

HYPOTESPRÖVNING: STYRKEFUNKTION Med risknivån garderar vi oss således mot felet att förkasta H 0 då H 0 är sann. Vi bör välja H 0 så att detta är det allvarligaste felet. Det andra möjliga felet är att ej förkasta H 0 då H 0 är falsk. Vi bildar styrkefunktionen h(θ) = P(H 0 förkastas) om θ är det sanna värdet. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 20 / 46

HYPOTESPRÖVNING h(θ) = P(H 0 förkastas) om θ är det sanna värdet. För θ H 0 gäller således att h(θ) α. Ett test är bra om h(θ) är stor då θ H 1. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 21 / 46

HYPOTESPRÖVNING OCH STYRKEFUNKTION För att få något bestämt ta σ = 0.04 Antag forskaren vill pröva hypotesen H 0 : θ = 2.0. Låt den alternativa hypotesen vara H 1 : θ 1.9 eller θ 2.1. Forskaren är angelägen om att verkligen förkasta H 0 om θ skulle avvika så mycket från 2.0 som H 1 anger. Vi undersöker hur stor sannolikheten är att forskaren gör detta. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 22 / 46

HYPOTESPRÖVNING OCH STYRKEFUNKTION Vi tergår til exemplet ovan: Testet lyder ju nu: Förkasta H 0 om x 2.0 > 1.96 0.04. Alltså blir h(θ) = P( X 2.0 > 1.96 0.04) om X N(θ,0.04). Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 23 / 46

HYPOTESPRÖVNING OCH STYRKEFUNKTION Den komplementära sannolikheten att X ligger mellan gränserna 2.0±1.96 0.04: ( ) ( ) 2.0+1.96 0.04 θ 2.0 1.96 0.04 θ 1 h(θ) = Φ Φ 0.04 0.04 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 24 / 46

HYPOTESPRÖVNING OCH STYRKEFUNKTION varav ( h(θ) = 1 Φ 1.96+ 2.0 θ 0.04 ) ( + Φ 1.96+ 2.0 θ 0.04 ). Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 25 / 46

STYRKEFUNKTION (TVÅSIDIGT TEST). Denna styrkefunktion har har minimum (= 0.05, vilket är den fastställda signifikansnivån) för θ = 2.0 och att den är ungefär 0.70 eller däröver för θ-värden inom H 1. Styrkan är inte särskilt stor, det finns två utvägar att förbättra den: att öka mätprecisionen dvs. minska σ eller utföra experiment med flera observationer. 1 0.8 0.6 0.4 0.2 h(θ) 1.9 2 2.1 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 26 / 46

PRÖVNING AV SAMMANSATTA HYPOTESER Om H 0 omfattar flera θ-värden kommer sannolikheten P(H 0 förkastas), om H 0 är sann, att bli beroende av vilket θ-värde inom H 0 som är det rätta, d.v.s. vår gamla beskrivning av α fungerar inte längre. Därför sätter vi i stället α = max θ H 0 h(θ). Vi låter denna högsta felrisk vara den på förhand bestämda signifikansnivån. Om vi tar t.ex. α = 0.01, är risken att vi förkastar H 0, om H 0 är sann, högst lika med 0.01. Problemet är alltså att komma underfund med för vilket θ H 0 som felrisken är störst, och det brukar vara lätt. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 27 / 46

ETT TEST TILL Ett mynt ger krona med den okända sannolikheten p. Man vill pröva H 0 : p = 1/2 mot H 1 : p = 1/2. Myntet kastas n = 30 gånger, varvid krona kommer upp x = 5 gånger. Fixera signifikansnivån till 0.01. Vi skall förkasta H 0 om x a eller x b. a och b väljs så att, om H 0 sann, P(X a) 0.005, P(X b) 0.005. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 28 / 46

ETT TEST TILL En tabell över binomialfördelningen ger a = 7, b = 30 7 = 23. ( P(X a) = P(X b) = 0.0026 signifikansnivån är 0.0052) I det angivna fallet föreligger alltså signifikans på den valda nivån, ty x 7. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 29 / 46

ETT TEST TILL Låt oss som övning alternativt använda P-värdet (jämför ovan). P/2 = 5 i=0 ( ) 30 (1 i ( 1 i 2) 2 ) 30 i varav P = 0.00032. Resultatet är så ledes signifikant***, och vi förkastar alltså hypotesen att myntet är välgjort. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 30 / 46

ENSIDIGA TEST X 1,X 2,...,X n är oberoende och N(µ, σ)-fördelade, där µ och σ är okända. H 0 : µ = µ 0 mot H 1 : µ > µ 0 eller µ < µ 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 31 / 46

ENSIDIGA TEST Låt oss anta att stort värde på µ är en önskad egenskap. Det kan vara naturligt att vi gör en åtgärd, t.ex. köper någon ny utrustning, som bör öka värdet på µ. Det är naturligt att vi endast vill köpa denna nya utrustning om vi är någolunda säkra på att den verkligen ger ett högre värde på µ än µ 0 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 32 / 46

ENSIDIGA TEST Det är då naturligt att testa H 0 : µ = µ 0 mot H 1 : µ > µ 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 33 / 46

ENSIDIGA TEST Testet blir då att vi förkastar H 0 om t(x 1,...,x n ) är för stor, eller mera precist om t > t α (n 1) eller om x > µ 0 +t α (n 1)s/ n. Tolkningen är att vi kräver, för att förkasta H 0, att x är tillräckligt mycket större än µ 0 för att det inte ska vara troligt att skillnaden är slumpmässig. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 34 / 46

ENSIDIGA TEST Givetvis skulle vi mycket väl kunna vilja påstå att µ = µ 0, och då skulle vi ju vilja testa H 0 : µ = µ 0 mot H 1 : µ = µ 0. Detta går inte, eftersom inga observationer i världen skulle kunna få oss att förkasta detta H 0. Den som gör ett test, vill därför ofta att H 0 ska förkastas. Det är nog detta som gör att begreppet signifikant misstolkas. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 35 / 46

χ 2 -TEST χ 2 -testet är ett så kallat goodness of fit 1 -test Den enklaste situationen: Ett försök kan utfalla på r olika sätt: A 1,A 2,...,A r. Låt x 1,x 2,...,x r vara antalet gånger som alternativen A 1,A 2,...,A r förekommer i n försök. 1 En källa översätter detta som anpassningsgrad. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 36 / 46

χ 2 -TEST Låt p 1,p 2,...,p r vara givna sannolikheter, dvs r i=1 p i = 1. Vi vill testa H 0 : P(A i ) = p i för i = 1,...,r mot H 1 : ej alla P(A i ) = p i. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 37 / 46

χ 2 -TEST För att göra detta bildar vi Q obs = r (x i np i ) 2. i=1 np i Man kan visa att Q är approximativt χ 2 (r 1)-fördelad under H 0. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 38 / 46

χ 2 -TEST För att göra resultatet troligt, betraktar vi r = 2. Då gäller, med X = X 1 och p = p 1 att Q = (X 1 np 1 ) 2 np 1 + (X 2 np 2 ) 2 np 2 = (X np)2 np + (n X n(1 p))2 n(1 p) = (X np)2 np + Eftersom X är Bin(n,p) så gäller att följer att (X np)2 np(1 p) är appr. χ2 (1). (X np))2 n(1 p) = (X np)2 np(1 p). X np är appr. N(0,1). Således np(1 p) Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 39 / 46

χ 2 -TEST Vi gör nu följande test: Förkasta H 0 om Q obs > χ 2 α(r 1). Om n är stort, har detta test approximativt signifikansnivån α. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 40 / 46

χ 2 -TEST Det går inte att generellt ange hur stort n skall vara för att approximationen skall vara tillfredsställande. Som tumregel brukar man använda: Tillse att insatta värden på np j är minst lika med 5. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 41 / 46

χ 2 -TEST: KAST MED EN TÄRNING Vid 96 kast med en tärning erhölls följande antal ettor, tvåor, etc: 15, 7, 9, 20, 26, 19. Man önskar pröva om tärningen kan antas vara symmetrisk. Hypotesen H 0 blir alltså H 0 : P(A 1 ) = 1/6,...,P(A 6 ) = 1/6. χ 2 -metoden kan användas, ty alla np j = 96 1/6 = 16 och är alltså tillräckligt stora. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 42 / 46

χ 2 -TEST: KAST MED EN TÄRNING Man får Q obs = (15 16)2 16 + (7 16)2 16 + (20 16)2 16 + (9 16)2 16 + (26 16)2 16 + (19 16)2 16 = 16.0. Antalet frihetsgrader är f = r 1 = 6 1 = 5. Eftersom Q obs något överstiger χ 2 0.01 (5) = 15.1 kan man påstå att tärningen inte är symmetrisk: Resultatet är signifikant**. Med dator erhålls P = P(Q > 16.0) 0.0068 då Q är χ 2 (5). Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 43 / 46

χ 2 -TEST MED SKATTNING AV PARAMETRAR Ofta vill vi låta sannolikheterna p 1,p 2,...,p r bero av en okänd parameter θ = (θ 1,...,θ s ), och testa hypotesen och för något värde på θ. H 0 : P(A i ) = p i (θ), för i = 1,...,r, Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 44 / 46

χ 2 -TEST MED SKATTNING AV PARAMETRAR Skattar vi θ med ML-metoden, och bildar Q obs = r (x i np i (θobs ))2 i=1 np i (θobs ), så är Q approximativt χ 2 (r s 1)-fördelad under H 0. Detta resultat kallas ibland för stora χ 2 -satsen. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 45 / 46

χ 2 -TEST MED SKATTNING AV PARAMETRAR: ANTALET FRIHETSGRADER Grundregeln är att antalet frihetsgrader fås av antalet fria kvadratsummor antalet skattade parametrar. Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 46 / 46