Stat. teori gk, vt 006, JW F0 ICKE-PARAMETRISKA TEST (NCT 13.1, 13.3-13.4) Or dlista till NCT Nonparametric Sign test Rank Teckentest Icke-parametrisk Teckentest Rang Teckentestet är formellt ingenting annat än ett test av nollhypotesen att π 0,5. Det nya är nu att testet kan användas i vissa situationer som vi inte har behandlat tidigare, varvid testet brukar kallas för teckentest. Situationerna är följande: 1. Test av skillnad mellan två populationer, när vi har parvist beroende (matchade) observationer och låg datanivå (nominal- eller ordinalskala). Vi ser först på teckentestet mer allmänt: Population (stor): varje objekt i populationen har antingen ett plustecken eller ett minustecken. π proportionen plustecken i populationen. Det numeriska värdet på π är okänt. Vi har ett slumpmässigt stickprov av n objekt från populationen. S antalet plustecken i stickprovet. Vi vill testa H 0 : π 0,5. Om H 0 är sann, så är S Bin(n; π 0,5), varav följer bl.a. att E(S H 0 sann) nπ n 0,5 Hur skall vi pröva H 0? Vi skiljer mellan fallen med stort och litet stickprov.. Tes t av hypotes rörande medianen i en population. 1 Litet stickprov, dvs n 0. Beräkna p-värde. Vid H 1 :π > 0,5: p-värde P(S S ob s π 0,5) Vid H 1 :π < 0,5: p-värde P(S S ob s π 0,5) Vid H 1 :π 0,5: p-värde P(S minst lika extremt som Sob s π 0,5) Minst lika extremt som S obs betyder: minst lika långt från 0,5n som S ob s (åt båda hållen). p-värden får vi med hjälp av Tab. eller 3 i NCT. Ex.: Sju personer (slumpmässigt utvalda från en viss population) fick sätta betyg på två diskmedel, A och B, på en skala från 1 till 10 (1 lägsta betyg, 10 högsta betyg). Person Diskm. 1 3 4 5 6 7 A 6 8 7 8 7 8 5 B 5 9 7 6 5 7 4 Vi frågar: Är det någon skillnad i preferens mellan de två diskmedlen i populationen? Här är det fråga om parvist beroende observationer. En typ av test som vi tidigare använt i liknande fall går ut på att man bildar en differens för varje person och testar om de observerade differenserna kan tänkas komma från en population av differenser med medelvärdet 0. Men ett sådant test är inte lämpligt här, därför att: Litet stickprov kräver normalfördelad population av differenser. Knappast uppfyllt här. Data är på ordinalskalenivå. Inte meningsfullt att beräkna medelvärden och varianser. Gör så här i stället: Se för varje person efter om personen tyckte att A var bättre än B eller tvärtom. Person Diskm. 1 3 4 5 6 7 A 6 8 7 8 7 8 5 B 5 9 7 6 5 7 4 Tecken + - 0 + + + + + betyder att A föredras framför B. - betyder att B föredras framför A. 0 betyder att båda anses likvärdiga 3 4
Nollorna (s.k. ties ) stryks (om de inte är alltför många). Vi räknar därför bara på de 6 återstående (n6). Låt S antal plus (S ob s5). Hypoteser: H 0 : π 0,5 där π är andelen i populationen, som föredrar A framför B (bland dem som har preferenser). Om H 0 är sann, så är S Bin(6; 0,5), med E(S H0 sann) nπ 6 0,5 3 Vid exempelvis signifikansnivån 5%, så kan vi inte förkasta nollhypotesen. Dvs. vi kan inte statistiskt påvisa (på 5% signifikansnivå) att något av diskmedlen föredras framför det andra i populationen. OBS Om vi i stället har en ensidig mothypotes, t.ex. att π > 0,5 (vad betyder det?), så får vi p-värde P(S 5 H 0 sann) 0,109 > 0,05 Så vi kan inte förkasta H 0 då heller. Dvs. vi kan inte påvisa att A föredras framför B i populationen. Ett observerat värde på S, som ligger långt från det under H 0 förväntade värdet 3 är en indikation på att H 0 inte är korrekt. (Mothypotesen är tvåsidig.) Eftersom S ob s 5, blir p-värde P(S 1 eller S 5 H 0 sann) P(S 1 H 0 sann) [Varför?] 0,109 [Tabell 3] 0,18 5 6 Stort stickprov, dvs. n > 0. Vi beräknar p-värden enligt samma princip som vid litet stickprov, med skillnaden att binomialfördelningen, Bin(n; 0,5), nu approximeras med en normalfördelning, N(µ n 0,5; n 0,5). I följande exempel används halvkorrektion. Ex.: Ett slumpmässigt utvalt stickprov på 100 barn får prova och jämföra två nya glassorter, Peanut Butter Ripple och Bubblegum Surprise. 56 föredrog BPR, 40 föredrog BS och 4 föredrog inte någon framför den andra. Är det någon skillnad i preferens mellan de två glassorterna i populationen? Vi stryker ties och räknar på n 96 observationer. Låt S antal PBR antal plus. Hypoteser: H 0 : π 0,5 där π är andelen i populationen, som föredrar PBR framför BS (bland dem som har preferenser). Om H 0 är sann, så är S Bin(96; 0,5), med E(S H 0 sann) nπ 96 0,5 48 Var (S H 0 sann) nπ(1-π) 96 0,5 4 Observerat värde på S, som ligger långt från det under H 0 förväntade värdet 48 är en indikation på att H 0 inte är korrekt. (Mothypotesen är tvåsidig.) Eftersom S ob s 56, blir p-värdet P(S 40 eller S 56 H 0 sann) P(S 40 H 0 sann) [Varför?] 40 + 0,5 48 Φ ( ) 4 Φ(-1,53) 0,0630 0,16 H 0 kan inte förkastas på 5% sign.-nivå. Ingen signifikant skillnad i fråga om preferens för de två glassorterna. 7 8
Alternativt kunde vi ha gjort så här (på samma sätt som vi gjort tidigare vid hypotesprövning av en proportion vid stora stickprov, och utan halvkorrektion): H 0 : π 0,5 (56/96) 0,5 1,63 0,5 0,5 96 H 0 kan inte förkastas på 5 % signifikansnivå.) Teckentestet kan också användas för att pröva en hypotes om en populationsmedian. Tillvägagångssättet framgår av följande exempel. Ex.: Pröva om medianinkoms ten i en stor population kan tänkas vara större än 10 000 kr. I ett slumpmässigt stickprov på 18 personer från populationen finner man att 14 stycken har en inkomst över 10 000, och 4 stycken en inkomst en inkomst under 10 000. Låt π andelen personer i populationen med inkomst mindre än 10 000. H 0 : π 0,5 (dvs. pop.-med. 10 000) H 1 : π < 0,5 (dvs. pop.-med. > 10 000) Låt S antalet personer i stickprovet med inkomst mindre än 10 000. Om H 0 är sann, så är S Bin(18; 0,5), och då är E(S H 0 sann) nπ 18 0,5 9 Lågt värde på S ob s ger anledning att förkasta H 0 till förmån för H 1. Vi har fått S ob s 4, och p- värdet blir p-värde P(S 4 H 0 sann) 0,015 [Tab. 3] H 0 förkastas på 5% (men inte på 1%) signifikansnivå. 9 10 Vid stora stickprov approximeras binomialfördelningen på vanligt sätt med eormalfördelning. Ex.: Slumpmässigt urval av 100 personer. 6 av dessa har en inkomst mindre än 180 000. Är populationens medianinkomst mindre än 180 000 kr? Låt π andelen personer i populationen med inkomst mindre än 180 000. H 0 : π 0,5 (dvs. pop.-med. 180 000) H 1 : π > 0,5 (dvs. pop.-med. < 180 000) Låt S antalet personer i stickprovet med inkomst mindre än 180 000. Om H 0 är sann, så är S Bin(100; 0,5), och då är Högt värde på S ob s ger anledning att förkasta H 0 till förmån för H 1. Vi har fått S ob s 6, och p- värdet blir p-värde P(S 6 H 0 sann) 1 P(S 61 H 0 sann) 61,5 50 1 Φ( ) 5 1 - Φ(,3) 0,0107 Eftersom p-värdet < 0,05, förkastas H 0 på 5% signifikansnivå (men inte på 1% signifikansnivå). E(S H 0 sann) nπ 100 0,5 50 Var (S H 0 sann) nπ(1-π) 100 0,5 5 11 1
Mann-Whitneys -test Oberoende stickprov från två olika populationer. Vi observerar värden på en kvantitativ variabel i vardera stickprovet. Stickprov 1: n 1 observationer från population 1 Stickprov : n observationer från population Om n 1 och n är stora kan vi testa ifall µ1 µ, dvs. ifall populationerna har samma medelvärde. (Testvariabel ) Om stickproven är små men kommer från populationer som är normalfördelade med lika varians, kan vi också testa ifall populationerna har samma medelvärde. (Testvariabel t ) x y ; s s x y + x y t x y 1 1 s p ( + ) x y Men om stickproven är s må och kommer från ickenormalfördelade populationer? Då kan vi använda Mann-Whitneys -test. Fast då är det egentligen något annorlunda hypoteser man testar: H 0 : De två populationerna har lika fördelning. H 1 : Den ena populationens fördelning är förskjuten i förhållande till den andra (men har för övrigt samma form). OBS Inga antaganden om vilken form fördelningarna har. Bara att fördelningarna har lika form i båda populationerna (fast kanske förskjutna i förhållande till varandra). (Ett annat test av samma hypoteser är Wilcoxons rangsummatest, som är helt likvärdigt med Mann- Whitneys -test. Båda leder alltid till samma resultat och är egentligen bara två olika sätt att göra samma sak.) 13 14 Mann-Whitneys beräknas på följande sätt: 1. Slå ihop båda stickproven och storleksordna alla n 1 +n observationer i det kombinerade stickprovet (från minsta till största värdet).. Låt den minsta observationen få rangtalet 1, den näst minsta rangtalet osv. till den största, som får rangtalet n 1 +n. (Om flera observationer har samma värde, så får de samma rangtal, nämligen medelvärdet av de rangtal de skulle ha fått ifall man kunnat skilja dem åt.) 3. Beräkna R 1 summan av rangtalen i stickprovet från population 1. 4. Beräkna såsom: ( n + R1 Testvariabeln i Mann-Whitneys test är: µ n där 1 n µ E( 0 sann) H n ( + n 1 Var( H 0 sann) Om både n 1 > 10 och n > 10, så är approximativt fördelad som N(0; 1), ifall H 0 är sann. Beslutsregeln vid 95% signifikansnivå är: H 1 : Pop. förskjuten uppåt H 0 förkastas om Z ob s < -1,645 H 1 : Pop. förskjuteeråt H 0 förkastas om Z ob s > 1,645 H 1 : Pop. förskjuten uppåt eller neråt H 0 förkastas om Z ob s > 1,96 15 16
Ex.: n 1 10 studenter slumpm. utvalda från kurs A och n 1 från kurs B tillfrågas om antal studietimmar per vecka. Är det någon skillnad mellan de båda kurserna i fråga om medianantalet studietimmar per vecka (givet att fördelningarna i övrigt har samma form)? Data: A 10 6 8 10 1 13 11 9 5 11 B 13 17 14 1 10 9 15 16 11 8 9 7 Storleksordna alla observationer och beräkna R 1. Timmar, storleksordnade Rangtal Kurs Rangtal, kurs A 5 1 A 1 6 A 7 3 B 8 4,5 A 4,5 8 4,5 B 9 7 A 7 9 7 B 9 7 B 10 10 A 10 10 10 A 10 10 10 B 11 13 A 13 11 13 A 13 11 13 B 1 15,5 A 15,5 1 15,5 B 13 17,5 A 17,5 13 17,5 B 14 19 B 15 0 B 16 1 B 17 B Summa 93,5R 1 17 18 Hypoteser: H 0 : Samma fördelning i båda pop. H 1 : Skillnad i fråga om läge (Tvåsidig mothypotes) Sign.-nivå: 5% Testvariabel: µ Beslutsregel: H 0 förkastas om Z ob s > 1,96. Resultat: ( + R µ 10 11 10 1 + 93,5 1 1 10 1 1 60 81,5 1 ( + n 1 10 1 3 30 1 Z obs 81,5 60 1,4 30 H 0 kan inte förkastas på 5% signifikansnivå. 19