F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Relevanta dokument
χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

2. Test av hypotes rörande medianen i en population.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

F9 SAMPLINGFÖRDELNINGAR (NCT

TMS136. Föreläsning 13

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistik 1 för biologer, logopeder och psykologer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

TMS136. Föreläsning 11

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Hur man tolkar statistiska resultat

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

, s a. , s b. personer från Alingsås och n b

Föreläsning G60 Statistiska metoder

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

F3 Introduktion Stickprov

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

F22, Icke-parametriska metoder.

TAMS65 - Föreläsning 6 Hypotesprövning

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Konfidensintervall, Hypotestest

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TAMS65 - Föreläsning 6 Hypotesprövning

Avd. Matematisk statistik

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Föreläsning 11: Mer om jämförelser och inferens

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 5: Hypotesprövningar

TMS136. Föreläsning 10

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

FÖRELÄSNING 8:

8 Inferens om väntevärdet (och variansen) av en fördelning

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Thomas Önskog 28/

Kapitel 10 Hypotesprövning

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4: Konfidensintervall (forts.)

Om statistisk hypotesprövning

Parade och oparade test

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

9. Konfidensintervall vid normalfördelning

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I STATISTIKENS GRUNDER 2

Hypotestest och fortsättning av skattningar och konfidensintervall

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Stockholms Universitet Statistiska institutionen Termeh Shafie

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Samplingfördelningar 1

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Lufttorkat trä Ugnstorkat trä

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Aktivitetsuppgifter i kurs 602 Ekonomisk statistik, del 2, våren 2006

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Avd. Matematisk statistik

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

FÖRELÄSNING 7:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Avd. Matematisk statistik

Tenta i Statistisk analys, 15 december 2004

Föreläsning 12, FMSF45 Hypotesprövning

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Industriell matematik och statistik, LMA /14

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Hur skriver man statistikavsnittet i en ansökan?

Studietyper, inferens och konfidensintervall

Avd. Matematisk statistik

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Laboration 4: Hypotesprövning och styrkefunktion

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Transkript:

Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H 1 : P > P 0 ; H 1 : P <P 0 där P är den okända proportionen i populationen, och P 0 är ett visst numeriskt värde. Stickprovsproportionen Pˆ är ju en väntevärdesriktig skattning av P. Med ett testförfarande vill vi avgöra: Ligger det observerade värdet på Pˆ så långt ifrån talet P 0 att vi har anledning att förkasta H 0? Eller har vi inte funnit anledning att förkasta H 0? 1

Om stickprovet är tillräckligt stort [tumregel: np(1-p) > 9] används testvariabeln Z = Pˆ P0 P0 (1 P0 ) n som är (approx.) fördelad som N(0; 1), då H 0 är sann. Ifall vi t.ex. valt signifikansnivån 5%, så blir förkastelsegränserna: H 1 H 0 förkastas om P P 0 Z obs > 1,96 P < P 0 Z obs < -1,645 P > P 0 Z obs > 1,645 (Och analogt för annat val av signifikansnivå.)

Ex.: I ett slumpmässigt urval på n = 100 personer är det 65 stycken som tycker på ett visst sätt. Ger stickprovsdata stöd för påståendet att mer än halva populationen tycker på detta sätt? Hypoteser: H 0 : P = 0,5 (eller H 0 : P 0,5) H 1 : P > 0,5 Sign.-nivå: α = 0,05 Testvariabel: Z = Pˆ P0 P0 (1 P0 ) n Beslutsregel: H 0 förkastas om Z obs > 1,645. 0,51 0,5 Resultat: Z obs = = 1,45 < 1,645 0,5 0,5 100 Slutsats: H 0 kan inte förkastas på 5% signifikansnivå. Det är inte statistiskt säkerställt (på 5% signifikansnivå) att P > 0,5. 3

Hypotesprövning för en varians Under förutsättning att vi har ett stickprov från en normalfördelning kan vi, med användning av χ - fördelningen, pröva en hypotes rörande värdet på populationsvariansen σ, H 0 : σ = σ 0 Stickprovsvariansen s är ju en vvr skattning av populationsvariansen σ. Vi frågar oss: Ligger den observerade stickprovsvariansen s så långt ifrån 0 talet σ att vi kan förkasta H 0? Eller har vi inte funnit skäl att förkasta H 0? Den testvariabel som används är: χ ( n 1) = σ 0 s Förkastelsegränser bestäms från Tabell 7 över χ - fördelningen (med n-1 frihetsgrader). 4

Vid t.ex. signifikansnivån 5% och 0 frihetsgrader blir förkastelsegränserna: H 1 H 0 förkastas om σ σ χ 9,59 eller χ > 34, 17 0 0 0 obs obs obs σ < σ χ < 10, 85 σ > σ χ > 31, 41 < obs Ex.: En maskin fyller marmelad i burkar. Varje burk skall innehålla 450 gram, men i praktiken varierar vikten lite från burk till burk. Vikten kan ses som en normalfördelad stokastisk variabel med standardavvikelsen 8. Man planerar att köpa en ny maskin, ifall denna ger mindre variation från burk till burk. Efter kontrollvägning av 30 burkar från den nya maskinen finner man att de har en standardavvikelse på 6,6. Ger den nya maskinen mindre standardavvikelse än den gamla? Pröva på 1% signifikansnivå. 5

Låt σ = variansen (okänd) hos den nya maskinen. Hypoteser: H 0 : σ = 64 (nya mask. ej bättre) H 1 : σ < 64 (nya mask. bättre) Sign.-nivå: 0,01 ( n 1 Testvariabel: χ = σ ) Frihetsgrader: n-1 = 9 0 s Beslutsregel: H 0 förkastas om χ obs< 14,6 9 6,6 Resultat: χ obs = = 19, 74 > 14,6 64 Slutsats: H 0 kan inte förkastas på 1 % signifikansnivå. Vi har inte funnit att den nya maskinen ger signifikant lägre standardavvikelse. 6

Hypotesprövning med p-värde Ett annat sätt att presentera resultatet av en hypotesprövning är att redovisa ett s.k. p-värde. Detta värde utgör svar på frågan: Om H 0 vore sann, hur stor skulle då slh vara att få ett minst lika extremt värde på testvariabeln som det vi faktiskt har observerat? Ju lägre p-värde, desto starkare stöd för mothypotesen, gentemot nollhypotesen. Statistiska programpaket (som t.ex. Minitab) brukar i regel redovisa p-värde. När ett hypotesprövningsresultat presenteras i form av ett p-värde, så kan varje läsare dra sina egna slutsatser utifrån detta, beroende på vilken signifikansnivå läsaren väljer att använda. Om vi i förväg har bestämt oss för signifikansnivån 5%, så skall vi förkasta H 0 så snart vi får ett p-värde som är mindre än 0,05. Om vi i stället har bestämt oss för signifikansnivån 1%, så skall vi förkasta H 0 så snart vi får ett p-värde som är mindre än 0,01, osv. Vi behöver inte beräkna värdet på testvariabeln. Det räcker att se på p- värdet. 7

Tolkning: p-värdet = den lägsta signifikansnivå vid vilken H 0 kan förkastas. Säg att vi testar nollhypotesen, H 0 :µ =µ 0, mot en ensidig mothypotes, H 1 :µ > µ 0, med hjälp av testvariabeln Z. Det är höga värden på Z som ger stöd åt H 1 (gentemot H 0 ). Vi beräknar då p-värdet som slh (under H 0 ) att få ett minst lika högt värde på Z som det värde, Z obs, som vi faktiskt har observerat. Eftersom Z (under H 0 ) är fördelat som N(0; 1), blir p-värdet = P(Z Z obs H 0 sann) = 1 Φ(Z obs ) Säg att vi i stället testar nollhypotesen, H 0 :µ =µ 0, mot en tvåsidig mothypotes, H 1 :µ µ 0. Både mycket höga och mycket låga värden på testvariabeln Z ger nu stöd åt H 1 (gentemot H 0 ). p-värdet blir då p-värdet = slh att (under H 0 ) få ett Z-värde, som ligger minst lika långt från värdet 0 som Z obs gör = [1 Φ( Z obs )] 8

Ex.: Stickprov på n = 70 obs. från population med okänd fördelning och okänd varians. Testa H 0 : µ = 13 500 H 1 : µ > 13 500 Stickprov: x = 14 100 och s = 1 900. Testvariabel: = x µ s n Z 0 14100 13500 Obs. Z-värde: Z obs = =, 64 1900 70 H 0 förkastas när vi får högt värde på Z. När H 0 är sann, så är Z (approx.) N(0; 1). p-värde = P(Z,64 H 0 sann) 1- Φ(,64) = 1-0,9959 = 0,0041 < 0,01 Vi förkastar H 0 på signifikansnivån 1%. (Ända ner till signifikansnivån 0,41% skulle vi förkasta H 0, men inte på lägre signifikansnivåer.) Starkt stöd för H 1, gentemot H 0. 9

Ex.: Som tidigare, men med H 1 :µ 13 500, alltså tvåsidig mothypotes. Samma testvariabel som nyss. Både mycket höga och mycket låga värden på Z ger nu anledning att förkasta H 0. Stickprov: x = 14 100 och s = 1 900. Obs. Z-värde: Z obs =,64 p-värde = P(Z,64 H 0 sann) + + P(Z -,64 H 0 sann) [1 - Φ(,64)] = 0,0041 = 0,008 < 0,01 Vi förkastar H 0 på signifikansnivån 1%. (Ända ner till signifikansnivån 0,8% skulle vi förkasta H 0, men inte på lägre signifikansnivåer.) Även här starkt stöd för H 1, gentemot H 0. 10

Hypotesprövning konfidensintervall Test av hypotesen H 0 :µ=µ 0 mot en tvåsidig mothypotes H 1 :µ µ 0 kan utföras med hjälp av ett konfidensintervall för µ. Det gäller nämligen att: H 0 :µ =µ 0 förkastas (på signifikansnivå α) om och endast om konfidensintervallet för µ (med konfidensnivå 1-α) inte innehåller talet µ 0. I stället för att beräkna värdet på en testvariabel kan vi alltså konstruera ett 95% konfidensintervall för µ och se efter om talet µ 0 ligger inom detta intervall eller ej. (Signifikansnivå = 5%) Ex.: Vi har fått ett 95% k.i. för µ: 64,8 < µ < 67,3. Pröva på 5% signifikansnivå H 0 : µ = 65 mot H 1 : µ 65. Eftersom talet 65 ligger inom intervallet, kan nollhypotesen inte förkastas. (95% k.i. = mängden av alla µ-värden, som inte skulle ha förkastats vid test med sign.-nivå 0,05.) 11

OBS Likheten konfidensintervall hypotesprövning gäller i de flesta fall. Dock inte exakt vid proportioner (eller differenser mellan proportioner). Konfidensintervall: Pˆ ± z Pˆ(1 n Pˆ) Hypotesprövning: z = Pˆ P0 P0 (1 P0 ) n 1

Styrkan hos ett test Önskvärda egenskaper hos ett testförfarande: Slh att förkasta H 0 när H 0 är sann skall vara liten. Slh att förkasta H 0 när H 0 är falsk skall vara stor. I de testmetoder som gåtts igenom fixeras den första sannolikheten ovan till ett lågt värde, α, som kallas för testets signifikansnivå (ofta α = 0,01; α = 0,05; α = 0,10). Hur är det med den andra sannolikheten, den som vi vill skall vara stor? Den kallas för testets styrka, och kan beräknas för olika parametervärden som ingår i mothypotesen. Ex.: (NCT sid. 356) Vi tänker skaffa oss ett stickprov på n = 16 observationer från en normalfördelad population med känd standardavvikelse σ = 0,1. Vi skall pröva H 0 : µ = 5 mot H 1 : µ > 5. Vi tänker använda standardtestet med testvariabeln Z 5 = x 0,1/ 16 13

Signifikansnivån skall vara 5%, dvs vi kommer att förkasta H 0, ifall vi får Z obs > 1,645. Om H 0 är sann, så har vi alltså 5% risk att ändå förkasta H 0 (fel av typ I). Hur stor är slh att förkasta H 0, ifall det sanna värdet på µ är lika med 5,05? Dvs. hur stor är testets styrka, ifall µ = 5,05? H 0 kommer att förkastas, om vi får X 5 > 1,645 0,1/ 16 vilket är detsamma som att X > 0,1 5 + 1,645 = 16 5,041 Testets styrka, ifall µ = 0,05, blir alltså P ( X > 5,041 µ = 5,05) = 5,041 5,05 = 1 Φ( ) 0,1/ 16 = 1 Φ(-0,36) = Φ(0,36) = 0,6406 14

OBS När µ = 5,05 så gäller ju att X är normalfördelad N(5,05; 0,01/16). Styrkeberäkningen kan åskådliggöras i figuren nedan. 18 16 14 1 10 8 6 4 0 4,90 Samplingförd. för stickprovsmedelv. 4,95 5,00 5,05 5,10 Stickprovsmedelvärde 5,15 my = 5,00 my = 5,05 15

Kommentarer om hypotesprövning Hypotesprövningstänkandet har ibland kritiserats. Måste användas med viss eftertanke. Att icke-förkasta en nollhypotes innebär inte att det är fritt fram att tro att den är sann. Det finns antagligen många andra hypoteser, som inte heller skulle ha förkastats, ifall man hade prövat dem. När en nollhypotes icke-förkastas, så innebär det bara att den inte är klart oförenlig med det observerade utfallet i stickprovet. Statistisk signifikans är inte detsamma som praktisk signifikans. Även små, och i praktiken betydelselösa, avvikelser från nollhypotesen kommer att upptäckas om antalet observationer är tillräckligt stort. Mycket stora stickprov leder nästan alltid till att nollhypotesen förkastas. Varför? I verkligheten är modeller, teorier, hypoteser aldrig riktigt korrekta. Om antalet observationer är tillräckligt stort, kommer testet till sist att (som just nämnts) upptäcka även mycket små avvikelser från nollhypotesen. 16