SF1901: SANNOLIKHETSLÄRA OCH STATISTIK MER OM KONFIDENSINTERVALL. HYPOTESPRÖVNING. Jan Grandell & Timo Koski 19.02.2015



Relevanta dokument
Statistik för bioteknik SF1911 Föreläsning 11: Hypotesprövning och statistiska test del 2. Timo Koski

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

This exam consists of four problems. The maximum sum of points is 20. The marks 3, 4 and 5 require a minimum

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

TAMS65 - Föreläsning 6 Hypotesprövning

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

TAMS65 - Föreläsning 6 Hypotesprövning

7.5 Experiment with a single factor having more than two levels

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Föreläsning 12, FMSF45 Hypotesprövning

10. Konfidensintervall vid två oberoende stickprov

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Statistik för bioteknik SF1911 CBIOT3 Föreläsning 9: Modellbaserad data-analys Timo Koski

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

7.3.3 Nonparametric Mann-Whitney test

Tentamen MVE301 Sannolikhet, statistik och risk

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Föreläsningsanteckningar till kapitel 9, del 2

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Tentamen MVE301 Sannolikhet, statistik och risk

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Föreläsning 11: Mer om jämförelser och inferens

Kurskod: TAMS11 Provkod: TENB 12 January 2015, 08:00-12:00. English Version

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Kurskod: TAMS11 Provkod: TENB 28 August 2014, 08:00-12:00. English Version

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Kurskod: TAMS11 Provkod: TENB 07 April 2015, 14:00-18:00. English Version

Tentamen MVE302 Sannolikhet och statistik

Kurskod: TAMS24 / Provkod: TEN (8:00-12:00) English Version

Tentamen MVE301 Sannolikhet, statistik och risk

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1911: Statistik för bioteknik

S0005M, Föreläsning 2

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Laboration 4: Hypotesprövning och styrkefunktion

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik för B, K, N, BME och Kemister

Gamla tentor (forts) ( x. x ) ) 2 x1

Tentamen i matematisk statistik

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Normalfördelning. Modeller Vi har alla stött på modeller i olika sammanhang. Ex:

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

F3 Introduktion Stickprov

FÖRELÄSNING 8:

TAMS28 DATORÖVNING VT1

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 5: Hypotesprövningar

Följande resultat erhålls (enhet: 1000psi):

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest

Föreläsning 7: Punktskattningar

Tentamen MVE301 Sannolikhet, statistik och risk

F ξ (x) = f(y, x)dydx = 1. We say that a random variable ξ has a distribution F (x), if. F (x) =

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Tentamen MVE300 Sannolikhet, statistik och risk

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Statistik för teknologer, 5 poäng Skrivtid:

Tentamen MVE302 Sannolikhet och statistik

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

, s a. , s b. personer från Alingsås och n b

Konfidensintervall, Hypotestest

TMS136. Föreläsning 11

TAMS65 - Föreläsning 12 Test av fördelning

Tentamen MVE301 Sannolikhet, statistik och risk

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Isometries of the plane

Föreläsning 12: Regression

Uppgift 1. Produktmomentkorrelationskoefficienten

Föreläsning 4: Konfidensintervall (forts.)

Thomas Önskog 28/

Tentamen MVE300 Sannolikhet, statistik och risk

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

English Version. 1 x 4x 3 dx = 0.8. = P (N(0, 1) < 3.47) = =

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamen i matematisk statistik

Calculate check digits according to the modulus-11 method

2. Test av hypotes rörande medianen i en population.

Hur skriver man statistikavsnittet i en ansökan?

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 7: Punktskattningar

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Matematisk statistik för B, K, N, BME och Kemister

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Transkript:

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 11. MER OM KONFIDENSINTERVALL. HYPOTESPRÖVNING Jan Grandell & Timo Koski 19.02.2015 Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 1 / 53

INNEHÅLL Konfidensintervall för skillnaden mellan två väntevärden Två stickprov konfidensintervall för skillnaden mellan två väntevärden µ 1 µ 2 i N(µ 1, σ 1 ) och N(µ 2, σ 2 ) med kända σ 1 och σ 2. konfidensintervall för skillnaden mellan två väntevärdenmellan µ 1 µ 2 i N(µ 1, σ 1 ) och N(µ 2, σ 2 ) med okända σ 1 och σ 2. Stickprov i par/matched Pairs Hypotesprövning: inledande exempel & Hypotesprövningens beståndsdelar Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 2 / 53

SAMMANFATTNING (FRÅN TIDIGARE) SATS Låt x 1,...,x n vara ett slumpmässigt stickprov från N(µ, σ) där µ är okänt. Då är I µ = ( x λ α/2 D, x + λ α/2 D) om σ är känt (D = σ/ n) samt I µ = ( x t α/2 (f)d, x +t α/2 (f)d ) om σ är okänt (d = s/ n, f = n 1) ett tvåsidigt konfidensintervall för µ med konfidensgraden 1 α. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 3 / 53

TVÅ STICKPROV, KONFIDENSINTERVALL FÖR SKILLNAD MELLAN VÄNTEVÄRDEN. Normalfördelning Modell: X 1,X 2,...,X n1 är N(µ 1, σ 1 ) (stickprov 1) Y 1,Y 2,...,Y n2 är N(µ 2, σ 2 ) (stickprov 2) där alla Xen och Yna är oberoende. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 4 / 53

TVÅ STICKPROV, KONFIDENSINTERVALL FÖR SKILLNAD MELLAN VÄNTEVÄRDEN. a) σ 1 och σ 2 kända Vi vill nu skaffa oss ett konfidensintervall för µ 1 µ 2. En naturlig skattning av µ 1 µ 2 är X Y. Eftersom den är en linjärkombination av oberoende normalfördelade variabler, så gäller att är N(0, 1)-fördelad. (X Y) (µ 1 µ 2 ) σ 2 1 n 1 + σ2 2 n 2 Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 5 / 53

TVÅ STICKPROV, KONFIDENSINTERVALL FÖR SKILLNAD MELLAN VÄNTEVÄRDEN. Av detta leds vi till I µ1 µ 2 = x y ± λ α/2 σ 2 1 n 1 + σ2 2 n 2. Om σ 1 = σ 2 = σ reduceras detta till att (X Y) (µ 1 µ 2 ) σ 1 + 1 n1 n2 är N(0, 1)-fördelad och 1 I µ1 µ 2 = x y ± λ α/2 σ + 1. n 1 n 2 Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 6 / 53

TVÅ STICKPROV, KONFIDENSINTERVALL FÖR SKILLNAD MELLAN VÄNTEVÄRDEN. b)σ 1 = σ 2 = σ okänd Vi betraktar nu fallet då σ 1 = σ 2 = σ, men där σ är okänd. Detta skattas med s där s 2 är den sammanvägda stickprovsvariansen. Man kan visa att man skall välja s 2 = (n 1 1)s 2 1 +(n 2 1)s 2 2 n 1 +n 2 2 och att (X Y) (µ 1 µ 2 ) S 1 n 1 + 1 n 2 är t(n 1 +n 2 2)-fördelad. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 7 / 53

TVÅ STICKPROV, KONFIDENSINTERVALL FÖR SKILLNAD MELLAN VÄNTEVÄRDEN. Vi får I µ1 µ 2 = x y ±t α/2 (n 1 +n 2 2)s 1 n 1 + 1 n 2. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 8 / 53

SAMMANFATTNING (1) SATS Låt x 1,...,x n1 och y 1,...,y n2 vara slumpmässiga, av varandra oberoende stickprov från N(µ 1, σ 1 ) respektive N(µ 2, σ 2 ). Om σ 1 och σ 2 är kända så är I µ1 µ 2 = ( x ȳ λ α/2 D, x ȳ + λ α/2 D) ett tvåsidigt konfidensintervall för µ 1 µ 2 med konfidensgraden 1 α; här är D = σ1 2/n 1 + σ2 2/n 2. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 9 / 53

SAMMANFATTNING SATS Om σ 1 = σ 2 = σ där σ är okänt så är I µ1 µ 2 = ( x ȳ t α/2 (f)d, x ȳ +t α/2 (f)d) ett tvåsidigt konfidensintervall för µ 1 µ 2 med konfidensgraden 1 α; här är d = s 1/n 1 +1/n 2 där f = (n 1 1)+(n 2 1). Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 10 / 53

TWO SAMPLES = TVÅ STICKPROV In an experiment designed to test the effectiviness of paroxetine for treating bipolar depression, subjects were measured using the Hamilton Depression scale with results as follows: Placebo group n 1 = 43 x = 21.57,s 1 = 3.87 Paroxenite treatment group n 2 = 33 y = 20.38,s 2 = 3.91 Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 11 / 53

TWO SAMPLES We assume that we have independent samples and normal distributions. We must assume this, we have just summaries of data, no chance of looking at histograms or boxplots. We insert data in pooling (sammanvägning) s 2 = (n 1 1)s 2 1 +(n 2 1)s 2 2 n 1 +n 2 2 = (43 1) 3.872 +(33 1) 3.91 2 43+33 2 = 15.11 We choose α = 0.05. The quantiles are found from the t-distribution with 43+33 2 = 74 degrees of freedom. This gives us t 0.025 = 1.993 (by >>tinv(0.975, 74) in Matlab). Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 12 / 53

TWO SAMPLES; THE CONFIDENCE INTERVAL COMPUTED t 0.025 (74) = 1.993 s 2 = (43 1) 3.872 +(33 1) 3.91 2 43+33 2 = 15.11 1 I µ1 µ 2 = x y ±t α/2 (n 1 +n 2 2)s + 1 n 1 n 2 1 = (21.57 20.38)±1.993 15.11 43 + 1 33 = 1.19±1.7930 = [ 0.603,2.938] Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 13 / 53

TVÅ STICKPROV FÖR PAROXETINE; KONFIDENSINTERVALL MED KONFIDENS GRAD 0.95 I µ1 µ 2 = [ 0.603,2.938] Men vad säger detta för oss? Vilken kunskap om paroxetine har de givna data gett oss i form av detta konfidensintervall? Vi kommer att få ett svar med hjälp av teorin om hypotesprövning. Men först ett fall till. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 14 / 53

MATCHED PAIRS/STICKPROV I PAR We shall deal with a testing situation that is treacherously close to the comparison of two means (=två stickprov) above. We present this by an example. Suppose that we want to test the effectiveness of a low-fat diet. The weight of n subjects is measured before and after the diet. The results are x 1,...,x n and y 1,...,y n, respectively. Obviously x i and y i would be dependent, but the samples corresponding to different subjects are independent. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 15 / 53

MATCHED PAIRS We have Diet Subject 1 2... n weight before diet x 1 x 2... x n weight after diet y 1 y 2... y n Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 16 / 53

MATCHED PAIRS Let us assume x j for the jth subject is a sample from N(µ j, σ 1 ) and y j a sample from N(µ j +, σ 2 ). is the population mean difference for all matched pairs. is the population parameter for the effectiveness of the low-fat diet. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 17 / 53

MATCHED PAIRS There is, as in case of two means, two series of observations. But the model for two means (=två stickprov) is inapplicable, the pairs x j,y j are now matched to each other, (two measurements of the weight of one and the same person). The data consists of n matched pairs. The unknown parameters are µ 1,...,µ n, σ 1, σ 2 och. µ 1,...,µ n reflect differences between subjects, whereas reflects the systematic difference between the weights before and after the low fat diet. If < 0 then the weight after diet is in average lower than before the diet. Note that σ 1 and σ 2 can be different. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 18 / 53

STICKPROV I PAR Det är lämpligt att utgå från ett praktiskt problem. Antag först att två personer A och B utför upprepade mätningar på ett och samma objekt. Om antalet mätningar är lika, får vi då mätvärden x 1,...,x n respektive y 1,...,y n, vilka kan betraktas som två oberoende stickprov. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 19 / 53

STICKPROV I PAR Om normalfördelning föreligger och personerna arbetar med samma (okända) precision, kan vi med den föregående analysen (två stickprov) avgöra t.ex. hur stor den systematiska skillnaden µ 1 µ 2 är mellan personerna. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 20 / 53

STICKPROV I PAR Nu antar vi i stället att varje person utför en mätning på vart och ett av n olika objekt. De erhållna mätvärdena kan skrivas Person Objekt 1 2... n A x 1 x 2... x n B y 1 y 2... y n Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 21 / 53

STICKPROV I PAR Det föreligger liksom förut två serier av mätvärden, men den tidigare modellen är oanvändbar, eftersom skillnader kan föreligga mellan objekten, alldeles oavsett om det föreligger skillnader mellan personerna eller ej. Tydligen hänger observationerna ihop på något sätt parvis, eftersom de två och två härrör från samma objekt. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 22 / 53

STICKPROV I PAR En i många fall realistisk modell är följande. Värdet x j för det j:te objektet antas komma från en normalfördelning N(µ j, σ 1 ) och y j från en annan fördelning N(µ j +, σ 2 ). Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 23 / 53

STICKPROV I PAR Man har då okända parametrar µ 1,...,µ n, σ 1, σ 2 och. Olikheter mellan µ 1,...,µ n avspeglar olikheter mellan objekten, medan anger den systematiska skillnaden mellan B:s och A:s mätningar. Om > 0 är B:s värden i genomsnitt större än A:s. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 24 / 53

STICKPROV I PAR Vi har alltså här antagit att det systematiska felet är oberoende av objektets verkliga värde, vilket kan vara realistiskt om det inte är för stora skillnader mellan objekten. Observera också att personerna inte behöver arbeta med samma precision (σ 1 och σ 2 tillåts vara olika). Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 25 / 53

STICKPROV I PAR Vanligen är man mest intresserad av. För att få kunskap härom använder man ett trick, som bäst belyses av ett exempel. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 26 / 53

EXEMPEL PÅ STICKPROV I PAR På ett bryggeri gör man varje dag analyser av alkoholhalten i öl. Dessa analyser utförs av två kemister A och B. Man vill undersöka om det finns någon systematisk skillnad mellan As och Bs mätningar. Varje dag, under n dagar låter man A och B, oberoende av varandra, analysera samma prov. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 27 / 53

EXEMPEL PÅ STICKPROV I PAR Vi leds då till följande modell: X 1,X 2,...,X n är N(µ i, σ A ) (As analyser) Y 1,Y 2,...,Y n är N(µ i +, σ B ) (Bs analyser) där alla Xen och Yna är oberoende. Vi menar här att X i är N(µ i, σ A )-fördelad och att Y i är N(µ i +, σ B )-fördelad. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 28 / 53

EXEMPEL FORTS. Tricket är nu att bilda Z i = Y i X i som är N(, σ)-fördelad, med ( ) σ = σ 2A + σ2b 2Cov. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 29 / 53

EXEMPEL FORTS. Vi har nu återfört problemet till fallet med ett stickprov, och kan ge konfidensintervall för på samma sätt som vi gjorde för µ, dvs. I = z ± λ α/2 σ/ n om σ känd och om σ okänd, där I = z ±t α/2 (n 1)s/ n s 2 = 1 n 1 n i=1 (z i z) 2. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 30 / 53

HYPOTESPRÖVNING Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 31 / 53

HYPOTESPRÖVNING David Salsburg: The Lady Tasting Tea. How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman Co, New York 2001. Denna populärvetenskapliga bok innehåller mycket mer än enbart hypotesprövning. I själva verket behandlas allt som ingår i denna kurs på ett underhållande vis. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 32 / 53

HYPOTESPRÖVNING Vi kommer att formulera en rätt så abstrakt svit av begrepp och modeller. Därför börjar vi med ett exempel. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 33 / 53

HYPOTESPRÖVNING: ESP En person påstår att hen har extrasensory perception (ESP), som yttrar sig i förmåga att med förbundna ögon avgöra om krona eller klave kommer upp vid kast med ett mynt. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 34 / 53

HYPOTESPRÖVNING: ESP Låt p vara den okända sannolikheten att hen svarar rätt vid ett sådant kast. Man kastar ett symmetriskt mynt 12 gånger och med ledning av antalet korrekta svar x pröva vad som kallas nollhypotesen H 0 : p = 1/2 (som innebär att personen bara gissar). Modellen: För varje p gäller att x är en observation av X Bin(12,p) och speciellt, om H 0 är sann, att X Bin(12,1/2). Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 35 / 53

HYPOTESPRÖVNING: ESP En procedur: Förkasta H 0, d.v.s påstå att personen har ESP, om x är tillräckligt stort, säg om x a, men inte annars. Storheten a bör bestämmas så att sannolikheten är liten att H 0 förkastas om H 0 skulle vara sann. Därigenom garderar vi oss mot att påstå att personen har ESP om detta inte är sant. Angivna sannolikhet kallar vi felrisken eller signifikansnivån (ofta 0.05, 0.01 och 0.001) Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 36 / 53

HYPOTESPRÖVNING: ESP Börja med felrisken 0.05; vi säger vi att felrisken skall vara ca (men inte mer än) 0.05. Dvs. P(X a), om p = 1/2, bör vara ca 0.05, ty om x a i detta fall kommer vi felaktigt att påstå att H 0 är falsk, d.v.s att personen har ESP. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 37 / 53

HYPOTESPRÖVNING: ESP P(X a) = 12 i=a ( ) 12 (1 ) 12 0.05. (1) i 2 För att lösa denna ekvation i a kan man pröva sig fram. 12 11 10 9 0.00024 0.00293 0.01611 0.05371 För a = 10 blir summan 0.016 och närmare 0.05 kan man inte komma, eftersom man inte vill överskrida detta tal. Om personen svarar rätt minst 10 gånger bör man alltså påstå att han har ESP, men inte annars. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 38 / 53

HYPOTESPRÖVNING: ESP Om man sänker felrisken från 0.05, först till 0.01, sedan till 0.001 : Felrisk 0.05 a = 10 0.01 11 0.001 12 I det sista fallet måste vi alltså kräva helt riktigt svar. Vi ser att det inte går att minska felrisken hur mycket som helst; skulle man vara så rädd för felaktigt uttalande att man vill ha en felrisk på, säg, 10 6, måste man kasta myntet mer än 12 gånger. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 39 / 53

HYPOTESPRÖVNING: BEGREPP I SAMBAND MED EXEMPLET OM ESP X Bin(12,p): en testvariabel, x observerat värde på X x a: ett kritiskt område (ett ensidigt test) H 0 : p = 1/2 nollhypotes Beslutsregel: Förkasta H 0 om observationen hamnar i kritiskt område. Bestäm a så att P(X a) = α, α = felrisk, signifikansnivå. P(X a) = 12 i=a( 12 i ) ( 1 2) 12 om H0 sann. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 40 / 53

HYPOTESPRÖVNING: ALTERNATIV HYPOTES Nytt påstående: Jag kan i nio fall av tio svara rätt. Detta är en mothypotes (hypotes mot H 0 ) H 0 : p = 1/2 H 1 : p = 9/10 Tag α = 0.05. Förkasta H 0 om x 10. ( ) i ( ) 12 i h(0.9) = P(X 10) = 12 i=10( 12 i ) 9 1 10 10 Detta är sannolikheten för att H 0 förkastas om p = 9/10 sant. (=TESTETS STYRKA.) ) i ( 12 i h(p) = 12 i=10( 12 i (p 1 p) ) kallas testets styrkefunktion. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 41 / 53

HYPOTESPRÖVNING: ESP Du kan själv testa din egen förmåga för ESP med Rhines och Zeners test, som är ungefär som ovan men har fem symboler och räknar signifikans med t -fördelning (jfr. nedan). Se: http://www.scientificpsychic.com/esp/esptest.html Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 42 / 53

Vi avslutar denna föreläsning genom att ta fram de generiska beståndsdelarna av varje tillfälle av hypotesprövning/statistiskt test samt tänket i statistiska test- Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 43 / 53

Rare Event Rule If, under a given assumption, the probability of an observed event is very small, we conclude that the assumption is likely not correct. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 44 / 53

THE BASICS OF A STATISTICAL TEST DEFINITION In statistics, a hypothesis is a claim or statement about a property of a population. A hypothesis test ( or a significance test) is a standard procedure for checking a claim about a property of a population. Example of a hypothesis: In genetics, G. Mendel claims that under certain circumstances, the percentage of the offspring peas with yellow pods is 25 %. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 45 / 53

HYPOTESPRÖVNING A hypothesis is a claim or statement about a property of a population. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 46 / 53

LEARNING OUTCOMES Standard procedure contains: null hypothesis, alternative hypothesis, test statistic, significance level, critical value, decision rule, proceed assuming null hypothesis is true, with the logic of the rule of rare event. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 47 / 53

THE INDIVIDUAL COMPONENTS OF A STATISTICAL TEST Given a claim identify a statistical model for your population and the null hypothesis and the alternative hypothesis. Given a claim and sample data, compute the value of the test statistic Given significance level, identify the critical values. Given a value of a test statistic, identify significance level, identify the p-value. We shall now explain what this, excluding for the moment p-value, is. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 48 / 53

THE STRUCTURE AND LOGIC A STATISTICAL TEST: NULL AND ALTERNATIVE HYPOTHESIS The null hypothesis (denoted by H o ) is a statement that the value of a population parameter (such as proportion, mean, standard deviation) is equal to some claimed value. Examples: H 0 : p = 0.5 H 0 : µ = 0.86 We assume that H 0 is true and reach a conclusion either to reject H 0 or fail to reject H 0. The alternative hypothesis (denoted by H 1 ) is a statement that the value of a population parameter is somehow different from the null hypothesis. H 1 : p > 0.5 H 1 : p < 0.5 H 1 : p = 0.5 Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 49 / 53

THE STRUCTURE AND LOGIC A STATISTICAL TEST: TEST STATISTIC The test statistic is a value computed from the sample data and it is used to make the decision about the rejection of the null hypothesis. The test statistic is used to for determining whether there is significant evidence against the null hypothesis. Examples: Test statistic (=testvariabel) for proportion: z = p p. Test statistic for mean: z = x µ σ or t = x µ s n n. pq n Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 50 / 53

THE STRUCTURE AND LOGIC OF A STATISTICAL TEST: A STATISTICAL TEST: CRITICAL REGION, SIGNIFICANCE LEVEL The critical region (or rejection region) is the set of all values of the test statistic that cause us to reject the null hypothesis. The significance level denoted by α is the probability that the test statistic will fall in the critical region when the null hypothesis is actually true. Common choices of α are 0.05, 0.01 and 0.10. A critical value is any value that separates the critical region, where we reject the null hypothesis, from the values of the test statistic that do not lead to rejection of the null hypothesis. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 51 / 53

TWO-TAILED, LEFT-TAILED, RIGHT-TAILED The tails in a density curve are the regions bounded by critical values. Some hypothesis tests are two-tailed, some are right-tailed and some are left-tailed. Two-tailed test: the critical region in two parts, significance level is a sum of two areas under the density curve. The significance level is divied equally between the two tails. Left-tailed test: the critical region in the left tail of the density curve. Right-tailed test: the critical region in the right tail of the density curve. Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 52 / 53

HYPOTESPRÖVNING Hypotesprövning: allmänt Nollhypotes,mothypotes Teststorhet (testvariabel) Kritiskt område, Signifikansnivå, Styrkefunktion Tvåsidiga test Hypotesprövning och konfidensintervall Jan Grandell & Timo Koski () Matematisk statistik 19.02.2015 53 / 53