Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

Relevanta dokument
Fördelningen för populationen som stickprovet togs ifrån är känd så nära som på ett antal parametrar, t.ex: N med okända

4.2.3 Normalfördelningen

Sensorer, effektorer och fysik. Analys av mätdata

Något om beskrivande statistik

Sensorer och elektronik. Analys av mätdata

Kontingenstabell (Korstabell) 2. Oberoende-test. Stickprov beror av slumpen. Vad vi förvf. är r oberoende: kriterier är r oberoende: kriterier

Korrelationens betydelse vid GUM-analyser

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

Orderkvantiteter vid begränsningar av antal order per år

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Föreläsningsanteckningar till Linjär Regression

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

Fyra typer av förstärkare

Tentamen STA A15 delkurs 1 (10 poäng): Sannolikhetslära och statistisk slutledning 3 november, 2005 kl

Lycka till och trevlig sommar!

Orderkvantiteter i kanbansystem

Normalfördelningar (Blom Kapitel 8)

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

b) Om du nu hade oturen att du köpt en trasig dator, vad är sannolikheten att den skulle ha tillverkats i Litauen?

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Centrala gränsvärdessatsen

Lösningsförslag till tentamen i 732G71 Statistik B,

1. Test av anpassning.

Variansberäkningar KPI

Slumpvariabler (Stokastiska variabler)

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Genomsnittligt sökdjup i binära sökträd

F15 ENKEL LINJÄR REGRESSION (NCT )

Datorövning 2 Fördelningar inom säkerhetsanalys

Tentamen i Matematisk statistik för V2 den 28 maj 2010

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

4.2.3 Normalfördelningen

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

101. och sista termen 1

Introduktion till statistik för statsvetare

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Medelvärde. Repetition. Median. Standardavvikelse. Frekvens. Normerat värde. z = x x

FÖRSÖKSPLANERING. och utvärdering av försöksresultat med den matematiska statistikens metoder. av Jarl Ahlbeck

REGRESSIONSANALYS S0001M

Grundläggande matematisk statistik

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Armin Halilovic: EXTRA ÖVNINGAR. ) De Moivres formel ==================================================== 2 = 1

a) Beräkna E (W ). (2 p)

TMS136: Dataanalys och statistik Tentamen med lösningar

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Flexibel konkursriskestimering med logistisk spline-regression

Test av anpassning, homogenitet och oberoende med χ 2 - metod

0 Testvariabel t, x s n. Lite historia om t-testett. testet. Ett stickprov: Hur räknar r. testet. ett stickprov

Begreppet rörelsemängd (eng. momentum) (YF kap. 8.1)

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

================================================

Kap. 1. Gaser Ideala gaser. Ideal gas: För en ideal gas gäller: Allmänna gaslagen. kraft yta

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Digital signalbehandling Fönsterfunktioner

Formler och tabeller i statistik

Mätbar vetskap om nuläget och tydliga målbilder om framtiden. Genomför en INDICATOR självvärdering och nulägesanalys inom tre veckor

Att testa normalitet och heteroskedasticitet i en linjär regressionsmodell

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Borel-Cantellis sats och stora talens lag

Föreläsning 10: Kombinatorik

Datorövning 2 Fördelningar inom säkerhetsanalys

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Föreläsning G04: Surveymetodik

Prisuppdateringar på elementär indexnivå - jämförelser mot ett superlativt index

Föreläsning G70 Statistik A

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Lösningar och kommentarer till uppgifter i 1.1

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i matematisk statistik, Statistisk Kvalitetsstyrning, MSN320/TMS070 Lördag , klockan Lärare: Jan Rohlén

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Lösning till TENTAMEN

Grundläggande matematisk statistik

1. BERÄKNING AV GRÄNSVÄRDEN ( då x 0 ) MED HJÄLP AV MACLAURINUTVECKLING. n x

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

F10 ESTIMATION (NCT )

Variansanalys ANOVA. Idé. Experiment med flera populationer. Beteckningar. Beteckningar. ANOVA - ANalysis

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Egna funktioner. Vad är sin? sin är namnet på en av många inbyggda funktioner i Ada (och den återfinns i paketet Ada.Numerics.Elementary_Functions)

En kvalitetskontroll - Snustillverkaren Fiedler & Lundgren kvalitetstestas Av: Andreas Timglas

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

Transkript:

Icke-parametrska test Icke-parametrska metoder Parametrska metoder Fördelge för populatoe som stckprovet togs frå är käd så ära som på ett atal parametrar, t.ex: N med okäda och Icke-parametrska metoder Vll helst ha samma test me uta atagade om de uderlggade fördelge!,,5,? Pcture from: http://www.statstcsu.fo Desty,,5, -5, -,5,,5 5, 7,5 uwe.mezel@math.uu.se Locato Shft parametrsk t.ex -S t test ckeparametrsk När r behövs ett cke-parametrsk test? Om förutsättgar för parametrska test te är uppfyllda: -Sample t-test: kräver ormalfördelg för de uderlggade populatoera Oe-ay NOV: kräver ormalfördelg för alla grupper, homogea varaser Om det är svårt att kvatfera data ordalskalor (storleksordg fs, me dffereser sakar betydelse: t.ex storlek av T-tröjor) dessa data ka dock ragordas Hur pass bra fugerar cke- parametrska test? Vlket test ersätts med vlket? populato ormalfördelad populato te ormalfördelad Nästa så bra som parametrska test om ormalfördelg och adra förutsättgar förelgger styrka ka vara mdre jämfört med parametrska test Är ofta bättre om förutsättgara (ormalfördelg osv.) te är uppfyllda -Sample t-test (-Sample z-test) Pared t-test -Sample Sg test -Sample lcoxo test Matched Pars Sg test lcoxo-sged Rak test allmä fördelg symmetrsk fördelg -Sample Sg test på dfferesera -Sample lcoxo på dfferesera -Sample t-test Ma-htey -test Oe-ay NOV Kruskal-alls test

) Oe-Sample Sg test prövar om medae för e fördelg är lka med ett hypotetskt värde om ollhypotese stämmer borde ugefär hälfte av alla värde ur ett stckprov vara större ä det hypotetska värdet, adra hälfte borde vara mdre resultatet av ett stckrov ka skrvas så här: + + = + - + = + - = = + = + + - + + + = = + + med adra ord: saolkhete att ett värde är större ä det hypotetska borde vara p=.5 Oe-Sample Sg test p P( X ~ ) H : p.5 H : p.5 eller a Testvarabel: M atalet värde som är större ä ~ M (,.5) krt : mycket p.5 uder H eller stora eller mycket små värde för M p värdet elgt bomalfördelge p P( X M ) P( X M ) p.5 sdgt Vll möss m ha e ege spegel? 6 möss med vars bur som har ett rum med och ett rum uta spegel vlket rum uppehöll sg muse mest? mus 5 6 7 8 9 5 6 med x x x uta x x x x x x x x x x x x x Sherw, C.M.. Mrrors as potetal evrometal erchmet for dvdually housed laboratory mce. ppl. m. ehav. Sc. 87: 95-. Vll möss m ha e ege spegel? H : p.5 stckprov : M p P P 6,.5 uder H M PM M PM.6.989. M H : p.5 Nollhypotese förkastas pga. ltet p-värde. Mus föredrar... att te ha ågo spegel. a tvåsdgt test tvåsdgt test geetskt förädrad mus,,5 Tvåsdgt test Dstrbuto Dstrbuto uder Plot H omal; =6; p=,5,6 +,6 =, Mtab Stat / Noparametrcs / -Sample Sg Probablty,,5,,6,6 Det värdet f fck är dock mycket osaolkt uder H P-värdet är saolkhete för det värdet v fck geom stckprovet eller mera extrema (mera osaolka) värde. egatv sffer för de som föredrade spegel tvåsdgt

Resultat Sg Test for Meda: C räkar bara hur måga som är större ä och hur måga som är mdre ä Sg test of meda =, versus ot =, N elow Equal bove P Meda C 6,, Nollhypotese förkastas pga. ltet p-värde. Mus föredrar... att te ha ågo spegel. Om atalet värdev är r stort (>5) omalfördelge ka approxmeras med ormalfördelge M (, p), p~ sn p, p p M N, M z N, uder H uder H är M så här fördelad (p=.5) z, som är kostruerad av M, måste därför vara stadard-ormalfördelad. krt z tvåsdgt v förkastar H om z verkar te vara N(,)-fördelad. Mer om Oe-Sample Sg testet Förutsättgar: slumpmässgt stckprov, som valgt Om fördelge är ormalfördelad är ett Oe-Sample t-test mera effektvt. (t-testet käer ju tll avstådet av varje mätvärde tll ollhypotese...) Har två matvärde samma storlek, alltså samma rag (s.k. tes ), tlldelas båda medelvärdet av rage Mätvärde med samma storlek som de hypotetska medae goreras ( = -värde), förmskas motsvarade + + = + - + = + - = = + = + + - + + + = = + + - 7 ) -Sample lcoxo test prövar om medae för e fördelg är lka med ett hypotetskt värde gör detsamma som Sg test, me fördelge av de uderlggade populatoe måste vara symmetrsk ragordg räkas ut, som för måga cke-parametrska test Exempel: V har följade värde: -, -6,, -, -, -7, 5,6, -, -, -5, -, -, Är medae lka med oll? bsolutvärdea ragordas: Om v t.ex prövar om = summeras alla rag dess tllhörade värde är större ä och alla rag dess tllhörade värde är mdre ä : m, krt R R 8 5 6 6 9 7 75 tabell 6 lower tal upper tal tvåsdgt värde abs rag -,, 6-6, 6, 9,, -,, -,, -7, 7, 5,6 5,6 8,, 5 -,, -,, -5, 5, 7 -,, -,, Idè bakom -S S lcoxo testet H : Om medae av e symmetrsk fördelg var borde + och - vara ugefär lka stora. H förkastas är t.ex måga höga rag tllhör postva värde och måga låga rag tllhör egatva värde OS!: H förkastas om testvarabel har ett lågt värde!... eftersom =m( +, - ) =5 osaolkt att det blr så om fördelge är symmetrsk =

lcoxo test - tabell Mtab Stat / Noparametrcs / -Sample lcoxo eräkas med hjälp av kombatork tvåsdgt Results for: metal_s Resultat Mtab Stat / Noparametrcs / -Sample lcoxo lcoxo Sged Rak Test: Dff Test of meda =, versus meda ot =, N for lcoxo Estmated N Test Statstc P Meda Dff 6,, -, Nollhypotese förkastas. Medae skljer sg sgfkat frå. tvåsdgt Jag vll veta om medae av ett mätfel är oll (eller om det fs ett systematskt fel) Resultat lcoxo Sged Rak Test: fel Test of meda =, versus meda ot =, N for lcoxo Estmated N Test Statstc P Meda fel 9,,6,75 H förkastas te (P>.5). Medae ka vara oll. Ett systematskt fel ka te bevsas. Om atalet värdev är r stort (>5) sn E, V V E z V krt E z tvåsdgt der H : hälfte av de totala ragsumma större ä stämmer, v testar ju +

C) lcoxo-sged Rak test förf parade stckprov två parade stckprov (t. ex före/efter) Fs e förskjutg ( locato shft ) mella båda fördelgar eller är de detska (H ) praktskt taget detsamma som Oe-Sample lcoxo test, se ere Exempel: alumumhalt av träd e föroread areal august måad och ovember måad Laureyses, I., R. lust, L. De Temmerma, C. Lemmes ad R. Ceulemas.. Cloal varato heavy metal accumulato ad bomass producto a poplar coppce culture. I. Seasoal varato leaf, wood ad bark cocetratos. Evro. Polluto : 85-9. Ragorda de absoluta dfferesera! ug Nov Dff abs rag 8,, -,, 6, 6, -6, 6, 9 6,5 5,,,,6 5,6 -,, 9,5,5 -,, 8, 5,5-7, 7, 8,,7 5,6 5,6 8,,,, 5 7,9 9,9 -,, 8,, -,, 8,9, -5, 5, 7,6,7 -,,, 6,8 -,, Idè bakom testet Om båda fördelgar var detska borde ugefär hälfte av de parvsa dfferesera vara postva och de adra hälfte vara egatva Dessutom borde postva och egatva dffereser av samma storlek vara lka saolka V förvätar oss alltså, uder H, att alla postva dffereser får samma ragsumma som alla egatva dffereser V geomför alltså ett -S lcoxo test för de parvsa dfferesera (gaska lka Pared t-test) Testvarabel: samma som för f r -S lcoxo m, krt R R 8 5 6 6 9 7 75 tabell 6 lower tal upper tal tvåsdgt rag 6 9 8 5 7 Mtab Kör Oe-Sample lcoxo på dfferesera! Mtab Stat / Noparametrcs / -Sample lcoxo Calc / Calculator Dfferes tll C C = dfferes

Resultat lcoxo Sged Rak Test: Dff Test of meda =, versus meda ot =, N for lcoxo Estmated N Test Statstc P Meda Dff 6,, -, D) Ma-htey -test H : kommer två oberoede (cke-parade) stckprov frå detska fördelgar? H a : det fs e förskjutg ( locato shft ) motsvarar Studet s t-test för cke-ormala PDF Exempel: två stckprov och : 5 6 7 : 8 9 5 Ma ordar alla värde elgt deras storlek och räkar hur måga värde av kommer före varje -värdet Ma-htey -test Testvarabel för f r -testet värde 5 6 7 8 9 5 sample u u u u u u u u eller bdrag tll värde frå stckprov kommer före detta värde frå stckprov kommer före detta u u u u u u u u eller Mycket höga eller mycket små värde för tyder på e skllad mella fördelgara för populato respektve populato, som här: värde 5 6 7 8 9 5 sample bdrag tll Krtska området Mycket höga eller mycket små värde för tyder på e skllad mella fördelgara för populato respektve populato two taled : m krt, oe taled : krt med P med P tabell o o tabell Ma-htey htey s s häger h hop med lcoxo s s rak sum I praktke aväds ofta dea formel.

häger h hop med värde 5 6 7 8 9 5 sample bdrag tll rag 5 6 7 8 Mtab Stat / Noparametrcs / Ma-htey 6 5 7 8 6 6 6 v utgår frå lcoxos ragsumma som förut Resultat Ma-htey Test ad CI: ; N Meda 6,5,5 Pot estmate for ET-ET s -,5 97, Percet CI for ET-ET s (-9,998;,998) =, Test of ET = ET vs ET ot = ET s sgfcat at, Om atalet värdev är r stort (>5) m z m krt z tvåsdgt N, ( uta"tes" ) meda H förkastas te, p för stort Ige sgfkat skllad, fördelgara ka vara detska. Förutsättgar ttgar och styrka Oberoede slumpmässga stckprov (Lte) mdre styrka jämfört med Studet s t fall populatoera är ormalfördelade Större styrka ä Studet s t för måga adra fördelgar E) Kruskal-alls test Ekvvalet tll Oe-ay NOV talet populatoer (treatmets) = k H : alla k populatoer är detska H a : mst två populatoer har olka postoer ( locato shft ) Kräver te ormalfördelade populatoer Recept: lada alla = + +... k observatoer och ragorda frå tll

Kruskal-alls test lada alla = + +... k observatoer och ragorda frå tll R summa av alla rag för stckprov R R R V k V H R R testvarabel lkar V: medelvärdet över alla rag motsvarar SST k medelvärdet över alla rag R för grupp NOV Summa över alla rag H gäller alla R ugefär lka V lte V k Krtska området V H R R motsvarar SST k R NOV testvarabel H förkastas om H (alltså äve V) är stor, så fall avvker ju gruppmedelvärdea frå det gemesamma medelvärdet. Om H gäller är testvarabel H ugefär -fördelad, om alla är tllräcklgt stora (5). Nollhypotese förkastas om H är stor: H ( f ) f k upper tal krt Vkte av fsk Expermet: V vll veta om temperaturförhöjge av havsvattet ärhete av ett kärkraftverk har ett flytade på fskaras vkt: Vkte av fsk 8 F F 6 F 5 F 5 7 8 8 6 6 8 6 9 9 5 7 Mtab Stat / Noparametrcs / Kruskal-alls Stacked data Resultat Kruskal-alls Test: vkt versus temp temp N Meda ve Rak Z 8 5 9,,6, 6 9,,5, 6 6,,, 5 5 8, 8, -, Overall,5 df=k- H =, DF = P =,566 H =, DF = P =,56 (adjusted for tes) Nollhypotese (ge förskjutg) ka te förkastas. Ige sgfkat effekt av vattets temperatur på vkte ka bevsas.