Grundläggande matematisk statistik

Relevanta dokument
F22, Icke-parametriska metoder.

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 6

2. Test av hypotes rörande medianen i en population.

7.3.3 Nonparametric Mann-Whitney test

Grundläggande matematisk statistik

Grundläggande matematisk statistik

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Hypotestestning och repetition

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

7.5 Experiment with a single factor having more than two levels

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistik för teknologer, 5 poäng Skrivtid:

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Tentamen i Matematisk statistik Kurskod S0001M

F3 Introduktion Stickprov

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

FÖRELÄSNING 8:

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Parade och oparade test

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen i Dataanalys och statistik för I den 28 okt 2015

Statistik 1 för biologer, logopeder och psykologer

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Lösningsförslag till Matematisk statistik LKT325 Tentamen

TMS136. Föreläsning 13

Formler och tabeller till kursen MSG830

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Grundläggande matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Föreläsningsanteckningar till kapitel 9, del 2

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Hur man tolkar statistiska resultat

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

8 Inferens om väntevärdet (och variansen) av en fördelning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

10. Konfidensintervall vid två oberoende stickprov

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Tentamen MVE300 Sannolikhet, statistik och risk

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen i Matematisk statistik Kurskod S0001M

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

Lektionsanteckningar 11-12: Normalfördelningen

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen MVE301 Sannolikhet, statistik och risk

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

9. Konfidensintervall vid normalfördelning

Föreläsning 12: Regression

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

F10 Problemlösning och mer om konfidensintervall

Tentamen MVE302 Sannolikhet och statistik

Grundläggande matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Laboration 4 Statistiska test

4 Diskret stokastisk variabel

Laboration 4 Statistiska test Del I: Standardtest Del II: Styrkefubktion

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Matematisk statistik LKT325 Tentamen med lösningar

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

TMS136. Föreläsning 11

Gamla tentor (forts) ( x. x ) ) 2 x1

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Finansmatematik II Kapitel 4 Tillväxt och risk


Matematisk statistik för B, K, N, BME och Kemister

Kvalitetsredovisning och verksamhetsplan för fritidshemmet Duvhöken, Sammilsdalskolan f-6

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Medicinsk statistik II

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Fakta. Naturvetenskap i Bumper Cars. NaturligtVis. Fysiklabbar på Powerland. Bumper Cars.

Ledtrådar till utvalda uppgifter för NDAB01, vt2011, 17 januari 2011.

Stickprovsvariabeln har en fördelning / sprindning

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Tentamen MVE302 Sannolikhet och statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Experimentella metoder 2014, Räkneövning 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen MVE301 Sannolikhet, statistik och risk

Förslag till ändrade rutiner för statliga ålderspensionsavgifter

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

Introduktion till statistik för statsvetare

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Transkript:

Density Grundläggande matematisk statistik Icke-parametriska test Uwe Menzel, 018 www.matstat.de Icke-parametriska metder Parametriska metder Fördelningen för ppulatinen sm stickprvet tgs ifrån är känd så nära sm på ett antal parametrar, t.ex: N med kända μ ch/eller σ Icke-parametriska metder Vill helst ha test med samma förmåga men utan antaganden m den underliggande fördelningen! (eftersm antagandena är icke uppfyllda) 0,0 0,15 μ, σ? 0,10 0,05 0,00-5,0 -,5 0,0,5 5,0 7,5 1

Lcatin Shift parametrisk t.ex -S t-test ickeparametrisk När behövs ett icke-parametrisk test? När förutsättningarna för ett parametriskt test är inte uppfyllda: -Sample t-test: det krävs att de underliggande ppulatinerna är nrmalfördelade One-Way ANOVA: kräver (ungefär) nrmalfördelning för alla grupper, dessutm (ungefär) hmgena varianser Om det är svårt att kvantifiera data rdinalskalr (strleksrdning finns, men differenser saknar betydelse: t.ex. strlek av T-tröjr, betyg i sklan: A, B, C, ) sådana data kan dck rangrdnas Hur pass bra fungerar icke-parametriska test? Nästan så bra sm parametriska test m nrmalfördelning ch andra förutsättningar föreligger styrkan (pwer, 1 β) fta mindre jämfört med parametriska test Är fta bättre när förutsättningarna (nrmalfördelning sv.) inte är uppfyllda

Vilket test ersätts med vilket? ppulatin nrmalfördelad 1-Sample T-test (1-Sample Z-test) Paired T-test ppulatin inte nrmalfördelad 1-Sample Sign test 1-Sample Wilcxn test Matched Pairs Sign test Wilcxn-Signed Rank test allmän fördelning R: SIGN.test symmetrisk fördelning 1-Sample Sign test på differenserna 1-Sample Wilcxn på differenserna -Sample T-test Mann-Whitney U-test R: wilcx.test One-Way ANOVA Kruskal-Wallis test R: kruskal.test One-Sample Sign test Syfte: kan testa m medianen för en ppulatin är lika med ett hyptetiskt värde m nllhyptesen stämmer brde ungefär hälften av alla värden ur ett stickprv vara större än det hyptetiska värdet, andra hälften brde vara mindre antalet värden sm är större än den hyptetiska medianen m 0 brde alltså vara binmialfördelad med p = 1 Τ (när H 0 är sann): X ~ Bin n, 0.5 Slumpvariabel: X = antalet värden sm är större än den hyptetiska medianen m 0 under H 0 : X ~ Bin n, 0.5 n = antalet mätvärden Nllhypteser ch alternativer hypteser: Fall 1 Fall Fall 3 H 0 m = m 0 m < m 0 m > m 0 H a m m 0 m > m 0 m < m 0 p-värde p = P X min x, n x p = P X x p = P X x 3

One-Sample Sign test P-värde, fall : H 0 förkastas m x är str. H a m > m 0 p = P X x X = antalet värden > m 0 Exempel: Låt ss anta att vi fick 0 mätvärden (n = 0), därav 17 större än den hyptetiska medianen, dvs. x = 17. m 0 Här verkar det vara sannlikt att den hyptetiska medianen m 0 stämmer. p = P X x = P X 17 där X ~ Bin 0, 0.5 ( under H 0 ) p = P X 17 = 1 P X 16 = 1 F X 16 = 1 0.9987 = 0.0013 tabell Facit: P-värdet är mindre än α = 0.05, vi förkastar H 0, dvs. vi förkastar antagandet att p = 0.5 ch därmed att m 0 är medianen för den underliggande fördelningen. Vi accepterar däremt den alternativa hyptesen m > m 0 (det sanna värdet på medianen måste vara större än vad hyptesen säger). 4

One-Sample Sign test P-värde, fall 3: H 0 förkastas m x är liten. H a m < m 0 p = P X x X = antalet värden > m 0 Exempel: Låt ss anta att vi fick 0 mätvärden (n = 0), därav 5 större än den hyptetiska medianen, dvs. x = 5. Här verkar det vara sannlikt att den hyptetiska medianen m 0 stämmer. p = P X x = P X 5 där X ~ Bin 0, 0.5 ( under H 0 ) p = P X 5 = F X 5 = 0.007 tabell m 0 Facit: P-värdet är mindre än α = 0.05, vi förkastar H 0, dvs. vi förkastar antagandet att p = 0.5 ch därmed att m 0 är medianen för den underliggande fördelningen. Vi accepterar däremt den alternativa hyptesen m < m 0 (det sanna värdet på medianen måste vara mindre än vad hyptesen säger). 5

One-Sample Sign test P-värde, fall 1: H 0 förkastas m x är mycket liten eller mycket str (tvåsidigt test). H a m m 0 p = P X max x, n x + P X min x, n x Exempel 1: = P X min x, n x (eftersm p = 0.5) Låt ss anta att vi fick 0 mätvärden (n = 0), därav 1 större än den hyptetiska medianen, dvs. x = 1. m 0 Här är det svårt att se m den hyptetiska medianen m 0 kan stämma. p = P X max x, n x + P X min x, n x där X ~ Bin 0, 0.5 p = P X 1 + P X 8 = 1 P X 11 + P X 8 = 1 F X 11 + F X 8 = 1 0.7483 + 0.517 = 0.5034 Facit: P-värdet är större än α = 0.05, vi förkastar inte nllhyptesen att p = 0.5 ch att m 0 är medianen för den underliggande fördelningen. Det är helt möjligt att nllhyptesen stämmer. 6

One-Sample Sign test P-värde, fall 1: H 0 förkastas m x är mycket liten eller mycket str (tvåsidigt test). H a m m 0 p = P X max x, n x + P X min x, n x Exempel : = P X min x, n x (eftersm p = 0.5) Låt ss anta att vi fick 0 mätvärden (n = 0), därav 17 större än den hyptetiska medianen, dvs. x = 17. m 0 Här verkar det vara sannlikt att den hyptetiska medianen m 0 stämmer. p = P X max x, n x + P X min x, n x där X ~ Bin 0, 0.5 p = P X 17 + P X 3 = 1 P X 16 + P X 3 = 1 F X 16 + F X 3 = 1 0.9987 + 0.0013 = 0. 006 Facit: P-värdet är mindre än α = 0.05, vi förkastar H 0, dvs. vi förkastar antagandet att m 0 är medianen för den underliggande fördelningen. Vi accepterar däremt den alternativa hyptesen m m 0 (sanna värdet på medianen måste vara någt annat än vad hyptesen säger). 7

One-Sample Sign test Fråga: vill möss ha en egen spegel? 16 möss med varsin bur sm har ett rum med spegel ch ett rum utan spegel i vilket rum uppehöll sig musen mest: mus 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 med x x x utan x x x x x x x x x x x x x Sherwin, C.M. 004. Mirrrs as ptential envirnmental enrichment fr individually hused labratry mice. Appl. Anim. Behav. Sci. 87: 95-103. H 0 : p = 0.5 ; H a : p 0.5 (tvåsidigt test) x = 3 (bservatin) X ~ Bin(16, 0.5) ( under H 0 ) p = P X 3 + P X 13 = P X 3 + 1 P X 1 = F X 3 + 1 F X 1 = 0.0106 + 1 0.9894 = 0.01 Facit: Nllhyptesen förkastas. H 0 (p = 0.5) betyder ju att sannlikheten att musen finns där är lika str för båda rummen. Mus föredrar... att inte ha någn spegel. 8

Prbability One-Sample Sign test Distributin Distributin under Plt H 0 Binmial; n=16; p=0,5 0,0 0,15 0.0106 + 0.0106 = 0.01 0,10 0,05 0,00 0,0106 3 13 0,0106 Att det bserverade värdet kmmer upp är alltså mycket sannlikt m vi antar att H 0 stämmer. P-värde: Sannlikheten att erhålla det bserverade värdet, eller ännu mera extrema värden, givit att nllhyptesen stämmer. Om stickprvet är strt (n>5): One-Sample Sign test X ~ Bin(n, 0.5) under H 0 X ~ AsN n Τ, 1 Τ n (nrmalapprximtin) Z = X n ~ N 0, 1 1 n Variabeln Z måste vara standard-nrmal fördelad m H 0 stämmer. En bservatin av Z brde alltså ligger bra på täthetsfunktinen för N(0, 1). Om denna bservatin däremt ligger i svansen av denna täthetsfunktin förkastar vi nllhyptesen. Den kritiska reginen är alltså (se appendixet för härledning): Ω krit = z λα Τ för tvåsidigt test (H a : p 0.5) Ω krit = z λ α för ensidigt test med H a : p > 0.5) Ω krit = z λ α för ensidigt test med H a : p < 0.5) 9

One-Sample Wilcxn test Syfte testar m medianen för en ppulatin är lika med ett hyptetiskt värde m 0 skillnad till Sign-testet: fördelningen för den underliggande ppulatinen måste vara symmetrisk Exempel: Se stickprvet x i i tabellen, klumn 1: Fråga: Är medianen lika med nll? Beräkning av testvariabeln: Vi rangrdnar x i (se tabell, R i = rang ) (rang 1 = minsta) Om vi t.ex. testar m m 0 = 0 summeras alla ranger sm tillför psitiva x i ch alla ranger sm tillför negativa x i. Vi räknar alltså ut följande värden: W + = σ i R i + (summa över ranger sm tillhör psitiva x i ) W = σ i R i (summa över ranger sm tillhör negativa x i ) W + = 3 + 8 + 5 = 16 W = 6 + 9 + 4 + + 10 + 11 + 1 + 7 + 1 + 13 = 75 x i x i R i -3,1 3,1 6-6,3 6,3 9 1, 1, 3 -,0,0 4-1,0 1,0-7, 7, 10 5,6 5,6 8,, 5-1,0 1,0 11-1,3 1,3 1-5,3 5,3 7-0,1 0,1 1-3,4 3,4 13 One-Sample Wilcxn test Idèn bakm 1-S Wilcxn testet: Om medianen av en symmetrisk fördelning är 0 brde W + ch W vara ungefär lika stra (se bild till vänster: W = 5 ; W + = 30) Att t. ex. alla negativa värden i ett stickprv har stra abslutvärden ch alla psitiva värden i stickprvet har låga abslutvärden är däremt sannlikt (se bild till höger: W = 15 ; W + = 40) H 0 förkastas när många höga ranger tillhör psitiva värden ch många låga ranger tillhör negativa värden - eller tvärtm. H 0 förkastas alltså m det finns en str skillnad mellan W + ch W, vilket ckså betyder att en av dem är låg. sm testvariabel används W = min W +, W i Kritisk regin: Ω krit = W < W 0 (H 0 förkastas för små värden av testvariabeln) W = 10 + 8 + 7 + 3 + = 30 W + = 1 + 4 + 5 + 6 + 9 = 5 W = 6 + 7 + 8 + 9 + 10 = 40 W + = 1 + + 3 + 4 + 5 = 15 sannlikt sannlikt m 0 = 0 m 0 = 0 10

One-Sample Wilcxn test Tabell över W 0 (kritiska värden) One-Sample Wilcxn test Om stickprvet är strt (n>5) Z = W+ μ ~ N(0, 1) är standard-nrmal σ μ = 1 n n + 1 väntevärdet för testvariabel W + ( under H 0 : hälften av den ttala rangsumman ) σ = n n + 1 n + 1 4 varians för testvariabel W + Ω krit = z > λ ( för tvåsidigt test ) α större än - vi testar ju W + 11

Wilcxn-Signed Rank test för parade stickprv två parade stickprv (t. ex. före/efter ) finns det en förskjutning ( lcatin shift ) mellan båda fördelningar eller är de identiska (H 0 )? praktiskt taget detsamma sm One-Sample Wilcxn test Exempel: aluminiumhalt av träd i en förrenad areal i augusti månad ch nvember månad Laureysens, I., R. Blust, L. De Temmerman, C. Lemmens and R. Ceulemans. 004. Clnal variatin in heavy metal accumulatin and bimass prductin in a pplar cppice culture. I. Seasnal variatin in leaf, wd and bark cncentratins. Envirn. Pllutin 131: 485-494. Wilcxn-Signed Rank test för parade stickprv de absluta differenserna ( Δ i ) rangrdnas R i (rang 1 = minsta) beräkna W + ch W igen: W + = σ i R i + W = σ i R i W + = 3 + 8 + 5 = 16 W =6+9+4++10+11+1+7+1+13=75 Aug Nv Δ i Δ i R i 8,1 11, -3,1 3,1 6 10,0 16,3-6,3 6,3 9 16,5 15,3 1, 1, 3 13,6 15,6 -,0,0 4 9,5 10,5-1,0 1,0 8,3 15,5-7, 7, 10 18,3 1,7 5,6 5,6 8 13,3 11,1,, 5 7,9 19,9-1,0 1,0 11 8,1 0,4-1,3 1,3 1 8,9 14, -5,3 5,3 7 1,6 1,7-0,1 0,1 1 13,4 36,8-3,4 3,4 13 1

Wilcxn-Signed Rank test för parade stickprv Idè bakm testet: Om båda fördelningar var identiska brde ungefär hälften av de parvisa differenserna vara psitiva ch den andra hälften vara negativa Dessutm brde psitiva ch negativa differenser av samma strlek vara lika sannlika Vi förväntar ss alltså, under H 0, att alla psitiva differenser får ungefär samma rangsumma sm alla negativa differenser Vi genmför alltså ett 1-S Wilcxn test för de parvisa differenserna (ganska lika det parade t-testet) W + = σ i R i + (summa över ranger sm tillhör psitiva x i ) W = σ i R i (summa över ranger sm tillhör negativa x i ) W + = 3 + 8 + 5 = 16 W =6+9+4++10+11+1+7+1+13=75 Testvariabel: W = min W +, W i Kritisk regin: Ω krit = W < W 0 (H 0 förkastas för små värden av testvariabeln Syftet: Mann-Whitney U-test H 0 : två berende (icke-parade) stickprv kmmer från identiska ppulatiner H a : det finns en förskjutning mellan ppulatinerna ( lcatin shift ) mtsvarar Student s t-test för icke-nrmalfördelade ppulatiner Exempel: två stickprv A ch B: x A = 5, 6, 7, 31 ch x B = 8, 9, 3, 35 Beräkning av testvariabeln (U): rdnar alla värden enligt deras strlek (minsta först) räknar hur många värden av A kmmer före varje B-värdet U B räknar hur många värden av B kmmer före varje A-värdet U A värde 5 6 7 8 9 31 3 35 Från stickprv: A A A B B A B B bidrag till U 3 3 4 4 3 värden från stickprv A kmmer före detta B 4 värden från stickprv A kmmer före detta B 13

Beräkning av testvariabeln (U): Mann-Whitney U-test räknar hur många värden av A kmmer före varje B-värdet U B räknar hur många värden av B kmmer före varje A-värdet U A värde 5 6 7 8 9 31 3 35 Från stickprv: A A A B B A B B bidrag till U B 3 3 4 4 3 värden från stickprv A kmmer före detta B U B = 3 + 3 + 4 + 4 = 14 4 värden från stickprv A kmmer före detta B värde 5 6 7 8 9 31 3 35 Från stickprv: A A A B B A B B bidrag till U A 0 0 0 värden från stickprv B 0 värden från stickprv B kmmer före detta A kmmer före detta a U A = 0 + 0 + 0 + = Beräkning av testvariabeln (U): Mann-Whitney U-test U = min U A, U B Kritiska mrådet: mycket små värden för testvariabeln U tyder på en skillnad mellan fördelningarna för ppulatin A respektive ppulatin B det kritiska värdet (U 0 ) fas ur en tabell Ω krit = U < U 0 Förutsättningar ch styrka: berende slumpmässiga stickprv (lite) mindre styrka jämfört med Student s t-test ifall ppulatinerna är nrmalfördelade större styrka än Student s t-test för många andra fördelningar 14

Mann-Whitney U-test U hänger ihp med W (Wilcxn): n 1, n stickprvsstrlekar värde 5 6 7 8 9 31 3 35 stickprv A A A B B A B B bidrag till U B 3 3 4 4 bidrag till U A 0 0 0 Rang (Wilcxn) 1 3 4 5 6 7 8 W W U U U A B A B A = 1+ + 3+ 6 = 1 = 4 + 5 + 7 + 8 = 4 ( n + 1) n1 1 = n1 n + n = n1 n + + U = n n = 16 B 1 ( n + 1) W A W B Wilcxns rangsumma 0 = 16 + 1 = 14 0 = 16 + 4 = sammanhang mellan U ch W Denna frmler används fta i praktiken (beräkning av W verkar vara enklare). Mann-Whitney U-test Om stickprvet är strt (n>5) Z = U μ U σ U ~ N(0, 1) är standard-nrmal μ U = n 1 n väntevärdet för testvariabel U σ U = n 1 n n 1 + n + 1 1 standardavvikelse för testvariabel U Ω krit = z > λα ( för tvåsidigt test ) Alternativa namn för Mann-Whitney U-test: Mann Whitney Wilcxn test Wilcxn rank-sum test Wilcxn Mann Whitney test 15

Syfte: Kruskal-Wallis test används istället för One-Way ANOVA ifall ppulatinerna inte är N-fördelade flera ppulatiner (treatments) jämförs (antalet ppulatiner = k) H 0 : alla k ppulatiner har samma fördelning H a : minst två ppulatiner har förskjutna fördelningar ( lcatin shift föreligger) Beräkning av testvariabeln: alla n = n 1 + n + + n k bservatiner rangrdnas (n i = antalet värden i grupp i) R i summa av alla ranger för stickprv i ഥR i = R i n i തR = 1 n n + 1 n k V = i=1 medelvärdet av alla ranger för stickprv i = n + 1 medelvärdet av alla ranger n i ഥR i തR mtsvarar SST i ANOVA: m H 0 gäller är alla ഥR i (ch തR) ungefär lika V liten k Ri n n+1 = summa av alla ranger = summa av n första naturliga tal 1 V H = n n + 1 = 1 n n + 1 3 n + 1 testvariabel, liten under H n 0 i i=1 Beräkning av testvariabeln: Kruskal-Wallis test V = n i ഥR i തR m H 0 gäller är alla ഥR i (ch തR) ungefär lika V liten H = k i=1 k Ri 1 V n n + 1 = 1 n n + 1 i=1 n i 3 n + 1 testvariabel, liten under H 0 Kritiska mrådet: Om H 0 gäller är testvariabeln H ungefär χ - fördelad, m alla n i är dessutm tillräckligt stra ( 5). H 0 förkastas m H (alltså även V) är str, i så fall avviker ju gruppmedelvärdena ഥR i mycket från det gemensamma medelvärdet തR. Ω krit = H > χ α f f = k 1 16

Kruskal-Wallis test Experiment: Vi vill veta m temperaturförhöjningen av havsvattnet i närheten av ett kärnkraftverk har ett inflytande på fiskarnas vikt: Vikten av fisk 38 F 4 F 46 F 50 F 15 14 17 4 1 8 18 16 6 1 13 18 16 19 0 19 5 4 1 17 3 x_38 = c(, 4, 16, 18, 19) x_4 = c(15, 1, 6, 16, 5, 17) kruskal_wallis.r x_46 = c(14, 8, 1, 19, 4, 3) x_50 = c(17, 18, 13, 0, 1) weight = c(x_38, x_4, x_46, x_50) temp = c( rep(38, length(x_38)), rep(4, length(x_4)), rep(46, length(x_46)), rep(50, length(x_50))) fish = data.frame(weight = weight, temp = temp) bxplt(weight ~ temp, data = fish) kruskal.test(weight ~ temp, data = fish) # Kruskal-Wallis rank sum test # Kruskal-Wallis chi-squared =.0404, df = 3, p-value = 0.5641 Appendix Icke-parametriska test Uwe Menzel, 018 uwe.menzel@slu.se ; uwe.menzel@matstat.de www.matstat.de 17

One-Sample Sign test Härledning av det kritiska värdet för H a : p > 0. 5 m stickprvet är strt (n>5): X ~ Bin(n, 0.5) X ~ AsN m nllhyptesen H 0 stämmer n Τ, 1 Τ n m H 0 stämmer (nrmalapprximtin) Z = X n 1 n ~ N 0, 1 m H 0 stämmer Det kritiska värdet ω α tas fram genm att lösa: P X > ω α H 0 sann = α (α förvald) när x > ω α förkastas H 0 ; α = P(fel typ I) One-Sample Sign test Härledning av det kritiska värdet för H a : p > 0. 5 m stickprvet är strt (n>5): Det kritiska värdet ω α tas fram genm att lösa: P X > ω α H 0 sann = α (α förvald) mfrma i parantesen P X n ω α n > = α 1 n 1 n P X n 1 n > λ α = α detta gäller för att termen till vänster i parantesen är N(0,1)-fördelad (kvantildefinitin) Jämförelse av båda ekvatiner ger: ω α n 1 n = λ α alltså: ω α = n + λ α 1 n kritiska värdet för H a: p > 0.5 18

One-Sample Sign test Härledning av det kritiska värdet för H a : p > 0. 5 m stickprvet är strt (n>5): ω α = n + λ α 1 n kritiska värdet för H a: p > 0.5 H 0 förkastas m x > ω α, alltså m x > n + λ α 1 n H 0 förkastas alltså m x n 1 n > λ α H 0 förkastas alltså m z > λ α för H a : p > 0.5 z = x n 1 teststatistika för sign-test, H 0 : p = 0.5 n One-Sample Sign test Härledning av det kritiska värdet för H a : p > 0. 5 m stickprvet är strt (n>5): ω α = n + λ α 1 n kritiska värdet för H a: p > 0.5 På ett liknande sätt erhåller vi: ω α = n λ α 1 n kritiska värdet för H a: p < 0.5 ω α = n ± λ α 1 n kritiska värden för H a: p 0.5 Sammanfattning kritiska mråden för sign test, strt stickprv: Ω krit = z λα Τ för tvåsidigt test (H a : p 0.5) Ω krit = z λ α för ensidigt test med H a : p > 0.5) Ω krit = z λ α för ensidigt test med H a : p < 0.5) 19