F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H 1 : P > P 0 ; H 1 : P <P 0 där P är den okända proportionen i populationen, och P 0 är ett visst numeriskt värde. Stickprovsproportionen Pˆ är ju en väntevärdesriktig skattning av P. Med ett testförfarande vill vi avgöra: Ligger det observerade värdet på Pˆ så långt ifrån talet P 0 att vi har anledning att förkasta H 0? Eller har vi inte funnit anledning att förkasta H 0? 1

Om stickprovet är tillräckligt stort [tumregel: np(1-p) > 9] används testvariabeln Z = Pˆ P0 P0 (1 P0 ) n som är (approx.) fördelad som N(0; 1), då H 0 är sann. Ifall vi t.ex. valt signifikansnivån 5%, så blir förkastelsegränserna: H 1 H 0 förkastas om P P 0 Z obs > 1,96 P < P 0 Z obs < -1,645 P > P 0 Z obs > 1,645 (Och analogt för annat val av signifikansnivå.)

Ex.: I ett slumpmässigt urval på n = 100 personer är det 65 stycken som tycker på ett visst sätt. Ger stickprovsdata stöd för påståendet att mer än halva populationen tycker på detta sätt? Hypoteser: H 0 : P = 0,5 (eller H 0 : P 0,5) H 1 : P > 0,5 Sign.-nivå: α = 0,05 Testvariabel: Z = Pˆ P0 P0 (1 P0 ) n Beslutsregel: H 0 förkastas om Z obs > 1,645. 0,51 0,5 Resultat: Z obs = = 1,45 < 1,645 0,5 0,5 100 Slutsats: H 0 kan inte förkastas på 5% signifikansnivå. Det är inte statistiskt säkerställt (på 5% signifikansnivå) att P > 0,5. 3

Hypotesprövning för en varians Under förutsättning att vi har ett stickprov från en normalfördelning kan vi, med användning av χ - fördelningen, pröva en hypotes rörande värdet på populationsvariansen σ, H 0 : σ = σ 0 Stickprovsvariansen s är ju en vvr skattning av populationsvariansen σ. Vi frågar oss: Ligger den observerade stickprovsvariansen s så långt ifrån 0 talet σ att vi kan förkasta H 0? Eller har vi inte funnit skäl att förkasta H 0? Den testvariabel som används är: χ ( n 1) = σ 0 s Förkastelsegränser bestäms från Tabell 7 över χ - fördelningen (med n-1 frihetsgrader). 4

Vid t.ex. signifikansnivån 5% och 0 frihetsgrader blir förkastelsegränserna: H 1 H 0 förkastas om σ σ χ 9,59 eller χ > 34, 17 0 0 0 obs obs obs σ < σ χ < 10, 85 σ > σ χ > 31, 41 < obs Ex.: En maskin fyller marmelad i burkar. Varje burk skall innehålla 450 gram, men i praktiken varierar vikten lite från burk till burk. Vikten kan ses som en normalfördelad stokastisk variabel med standardavvikelsen 8. Man planerar att köpa en ny maskin, ifall denna ger mindre variation från burk till burk. Efter kontrollvägning av 30 burkar från den nya maskinen finner man att de har en standardavvikelse på 6,6. Ger den nya maskinen mindre standardavvikelse än den gamla? Pröva på 1% signifikansnivå. 5

Låt σ = variansen (okänd) hos den nya maskinen. Hypoteser: H 0 : σ = 64 (nya mask. ej bättre) H 1 : σ < 64 (nya mask. bättre) Sign.-nivå: 0,01 ( n 1 Testvariabel: χ = σ ) Frihetsgrader: n-1 = 9 0 s Beslutsregel: H 0 förkastas om χ obs< 14,6 9 6,6 Resultat: χ obs = = 19, 74 > 14,6 64 Slutsats: H 0 kan inte förkastas på 1 % signifikansnivå. Vi har inte funnit att den nya maskinen ger signifikant lägre standardavvikelse. 6

Hypotesprövning med p-värde Ett annat sätt att presentera resultatet av en hypotesprövning är att redovisa ett s.k. p-värde. Detta värde utgör svar på frågan: Om H 0 vore sann, hur stor skulle då slh vara att få ett minst lika extremt värde på testvariabeln som det vi faktiskt har observerat? Ju lägre p-värde, desto starkare stöd för mothypotesen, gentemot nollhypotesen. Statistiska programpaket (som t.ex. Minitab) brukar i regel redovisa p-värde. När ett hypotesprövningsresultat presenteras i form av ett p-värde, så kan varje läsare dra sina egna slutsatser utifrån detta, beroende på vilken signifikansnivå läsaren väljer att använda. Om vi i förväg har bestämt oss för signifikansnivån 5%, så skall vi förkasta H 0 så snart vi får ett p-värde som är mindre än 0,05. Om vi i stället har bestämt oss för signifikansnivån 1%, så skall vi förkasta H 0 så snart vi får ett p-värde som är mindre än 0,01, osv. Vi behöver inte beräkna värdet på testvariabeln. Det räcker att se på p- värdet. 7

Tolkning: p-värdet = den lägsta signifikansnivå vid vilken H 0 kan förkastas. Säg att vi testar nollhypotesen, H 0 :µ =µ 0, mot en ensidig mothypotes, H 1 :µ > µ 0, med hjälp av testvariabeln Z. Det är höga värden på Z som ger stöd åt H 1 (gentemot H 0 ). Vi beräknar då p-värdet som slh (under H 0 ) att få ett minst lika högt värde på Z som det värde, Z obs, som vi faktiskt har observerat. Eftersom Z (under H 0 ) är fördelat som N(0; 1), blir p-värdet = P(Z Z obs H 0 sann) = 1 Φ(Z obs ) Säg att vi i stället testar nollhypotesen, H 0 :µ =µ 0, mot en tvåsidig mothypotes, H 1 :µ µ 0. Både mycket höga och mycket låga värden på testvariabeln Z ger nu stöd åt H 1 (gentemot H 0 ). p-värdet blir då p-värdet = slh att (under H 0 ) få ett Z-värde, som ligger minst lika långt från värdet 0 som Z obs gör = [1 Φ( Z obs )] 8

Ex.: Stickprov på n = 70 obs. från population med okänd fördelning och okänd varians. Testa H 0 : µ = 13 500 H 1 : µ > 13 500 Stickprov: x = 14 100 och s = 1 900. Testvariabel: = x µ s n Z 0 14100 13500 Obs. Z-värde: Z obs = =, 64 1900 70 H 0 förkastas när vi får högt värde på Z. När H 0 är sann, så är Z (approx.) N(0; 1). p-värde = P(Z,64 H 0 sann) 1- Φ(,64) = 1-0,9959 = 0,0041 < 0,01 Vi förkastar H 0 på signifikansnivån 1%. (Ända ner till signifikansnivån 0,41% skulle vi förkasta H 0, men inte på lägre signifikansnivåer.) Starkt stöd för H 1, gentemot H 0. 9

Ex.: Som tidigare, men med H 1 :µ 13 500, alltså tvåsidig mothypotes. Samma testvariabel som nyss. Både mycket höga och mycket låga värden på Z ger nu anledning att förkasta H 0. Stickprov: x = 14 100 och s = 1 900. Obs. Z-värde: Z obs =,64 p-värde = P(Z,64 H 0 sann) + + P(Z -,64 H 0 sann) [1 - Φ(,64)] = 0,0041 = 0,008 < 0,01 Vi förkastar H 0 på signifikansnivån 1%. (Ända ner till signifikansnivån 0,8% skulle vi förkasta H 0, men inte på lägre signifikansnivåer.) Även här starkt stöd för H 1, gentemot H 0. 10

Hypotesprövning konfidensintervall Test av hypotesen H 0 :µ=µ 0 mot en tvåsidig mothypotes H 1 :µ µ 0 kan utföras med hjälp av ett konfidensintervall för µ. Det gäller nämligen att: H 0 :µ =µ 0 förkastas (på signifikansnivå α) om och endast om konfidensintervallet för µ (med konfidensnivå 1-α) inte innehåller talet µ 0. I stället för att beräkna värdet på en testvariabel kan vi alltså konstruera ett 95% konfidensintervall för µ och se efter om talet µ 0 ligger inom detta intervall eller ej. (Signifikansnivå = 5%) Ex.: Vi har fått ett 95% k.i. för µ: 64,8 < µ < 67,3. Pröva på 5% signifikansnivå H 0 : µ = 65 mot H 1 : µ 65. Eftersom talet 65 ligger inom intervallet, kan nollhypotesen inte förkastas. (95% k.i. = mängden av alla µ-värden, som inte skulle ha förkastats vid test med sign.-nivå 0,05.) 11

OBS Likheten konfidensintervall hypotesprövning gäller i de flesta fall. Dock inte exakt vid proportioner (eller differenser mellan proportioner). Konfidensintervall: Pˆ ± z Pˆ(1 n Pˆ) Hypotesprövning: z = Pˆ P0 P0 (1 P0 ) n 1

Styrkan hos ett test Önskvärda egenskaper hos ett testförfarande: Slh att förkasta H 0 när H 0 är sann skall vara liten. Slh att förkasta H 0 när H 0 är falsk skall vara stor. I de testmetoder som gåtts igenom fixeras den första sannolikheten ovan till ett lågt värde, α, som kallas för testets signifikansnivå (ofta α = 0,01; α = 0,05; α = 0,10). Hur är det med den andra sannolikheten, den som vi vill skall vara stor? Den kallas för testets styrka, och kan beräknas för olika parametervärden som ingår i mothypotesen. Ex.: (NCT sid. 356) Vi tänker skaffa oss ett stickprov på n = 16 observationer från en normalfördelad population med känd standardavvikelse σ = 0,1. Vi skall pröva H 0 : µ = 5 mot H 1 : µ > 5. Vi tänker använda standardtestet med testvariabeln Z 5 = x 0,1/ 16 13

Signifikansnivån skall vara 5%, dvs vi kommer att förkasta H 0, ifall vi får Z obs > 1,645. Om H 0 är sann, så har vi alltså 5% risk att ändå förkasta H 0 (fel av typ I). Hur stor är slh att förkasta H 0, ifall det sanna värdet på µ är lika med 5,05? Dvs. hur stor är testets styrka, ifall µ = 5,05? H 0 kommer att förkastas, om vi får X 5 > 1,645 0,1/ 16 vilket är detsamma som att X > 0,1 5 + 1,645 = 16 5,041 Testets styrka, ifall µ = 0,05, blir alltså P ( X > 5,041 µ = 5,05) = 5,041 5,05 = 1 Φ( ) 0,1/ 16 = 1 Φ(-0,36) = Φ(0,36) = 0,6406 14

OBS När µ = 5,05 så gäller ju att X är normalfördelad N(5,05; 0,01/16). Styrkeberäkningen kan åskådliggöras i figuren nedan. 18 16 14 1 10 8 6 4 0 4,90 Samplingförd. för stickprovsmedelv. 4,95 5,00 5,05 5,10 Stickprovsmedelvärde 5,15 my = 5,00 my = 5,05 15

Kommentarer om hypotesprövning Hypotesprövningstänkandet har ibland kritiserats. Måste användas med viss eftertanke. Att icke-förkasta en nollhypotes innebär inte att det är fritt fram att tro att den är sann. Det finns antagligen många andra hypoteser, som inte heller skulle ha förkastats, ifall man hade prövat dem. När en nollhypotes icke-förkastas, så innebär det bara att den inte är klart oförenlig med det observerade utfallet i stickprovet. Statistisk signifikans är inte detsamma som praktisk signifikans. Även små, och i praktiken betydelselösa, avvikelser från nollhypotesen kommer att upptäckas om antalet observationer är tillräckligt stort. Mycket stora stickprov leder nästan alltid till att nollhypotesen förkastas. Varför? I verkligheten är modeller, teorier, hypoteser aldrig riktigt korrekta. Om antalet observationer är tillräckligt stort, kommer testet till sist att (som just nämnts) upptäcka även mycket små avvikelser från nollhypotesen. 16