Grundläggande matematisk statistik

Relevanta dokument
KTH/ICT IX1501:F7 IX1305:F2 Göran Andersson Statistik: Skattningar

Grundläggande matematisk statistik

HYPOTESPRÖVNING. De statistiska metoderna som används för att fatta denna typ av beslut baseras på två komplementära antaganden om populationen.

Grundläggande matematisk statistik

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Tillåtna hjälpmedel: Eget handskrivet formelblad (A4), utdelad tabellsamling, miniräknare med tömt minne Studenterna får behålla tentamensuppgifterna

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

APPROXIMATION AV SERIENS SUMMA MED EN DELSUMMA OCH EN INTEGRAL

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

a) Beräkna E (W ). (2 p)

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

Matematisk statistik KTH. Formelsamling i matematisk statistik

Stokastiska variabler

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

UPPSKATTNING AV INTEGRALER MED HJÄLP AV TVÅ RIEMANNSUMMOR. Med andra ord: Vi kan approximera integralen från båda sidor

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Datorövning 2 Fördelningar inom säkerhetsanalys

Formelsamling för Finansiell Statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

S0005M V18, Föreläsning 10

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Datorövning 2 Fördelningar inom säkerhetsanalys

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Induktion och Binomialsatsen. Vi fortsätter att visa hur matematiska påståenden bevisas med induktion.

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Analys av polynomfunktioner

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

ANOVA I: Kap 14. Åldersgrupper -30 år år 51- år. Totalt n k N = 9 X k X = s k s = 8.

F10 ESTIMATION (NCT )

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Formelblad Sannolikhetsteori 1

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n = grad( P(

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Ekvationen (ekv1) kan beskriva vågutbredning, transversella svängningar i en sträng och andra fysikaliska förlopp.

Multiplikationsprincipen

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

4.2.3 Normalfördelningen

1. Test av anpassning.

Reliabilitet och validitet. Föreläsningsanteckningar till: F7 undersökningsdesign F8 konfidensintervall F9 hypotesprövning

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Föreläsning G04: Surveymetodik

= (1 1) + (1 1) + (1 1) +... = = 0

Föreläsning 2: Punktskattningar

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

F15 ENKEL LINJÄR REGRESSION (NCT )

Grundläggande matematisk statistik

Matematisk statistik

Reliabilitet och validitet

Tentamen i Envariabelanalys 1

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Jag läser kursen på. Halvfart Helfart

Betygsgränser: För (betyg Fx).

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Introduktion till statistik för statsvetare

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Kontrollskrivning 2 till Diskret Matematik SF1610, för CINTE1, vt 2019 Examinator: Armin Halilovic Datum: To Σ p P/F Extra Bonus

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Jag läser kursen på. Halvfart Helfart

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Borel-Cantellis sats och stora talens lag

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

INGENJÖRSMATEMATISK FORMELSAMLING

θx θ 1 om 0 x 1 f(x) = 0 annars

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Avd. Matematisk statistik

Binomialsatsen och lite kombinatorik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Uppsala Universitet Matematiska Institutionen Bo Styf. Att repetera.

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

REGULJÄRA SPRÅK (8p + 6p) 1. DFA och reguljära uttryck (6 p) Problem. För följande NFA över alfabetet {0,1}:

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

TMS136: Dataanalys och statistik Tentamen med lösningar

Föreläsning G70 Statistik A

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Transkript:

ҧ Grudläggade matemati tatiti Hypotetet II Uwe Mezel, 07 uwe.mezel@lu.e; uwe.mezel@mattat.de www.mattat.de Syfte o o T-tet för ett ticprov ( Oe-ample t-tet ) tetar e hypote för vätevärdet μ i e ormalfördelad populatio tadardavviele σ är oäd o ollhypote: H 0 : μ = μ 0 o ett ticprov xҧ ob (putattig för μ) ( oe-ample tet ) σ oäd ticprov attig för σ x = i= x i attig för μ

ҧ ҧ ҧ Tetvariabelmetode Om ollhypotee μ = μ 0 gäller är X i ~ N μ 0, σ och därför σ തX μ 0 തX~ N μ 0, σ ~ N(0,) Om σ är oäd (och erätt med attige S) får vi itället: X T = ത μ 0 ~ t(f) S Studet t - fördelig f = (frihetgrader) E obervatio av lumpvariabel T beteca med ett litet t: t = x ob μ 0 obervatio, om framgår av ticprovet ( xҧ ob,, ) och ollhypotee (μ 0 ) Detta värde aväd om tettatitia ( tatitic ) i T-tetet. t = x ob μ 0 Tetvariabelmetode tettatitia för T-tet för ett ticprov. H 0 : μ = μ 0 I föreläige F hade vi beräat det ritia värdet ω för de alterativa hypotee H a : μ > μ 0 geom att löa evatioe P തX > ω H 0 a Vi fic löige ω = μ 0 + t = (där är de förvalda aolihete för ett fel typ I). Nollhypotee förata om xҧ ob > ω, dv. om xҧ ob > μ 0 + t H 0 förata alltå om x ob μ 0 > t H 0 förata alltå om (e ocå appedixet) eidigt tet; H a : μ > μ 0 t > t eidigt tet; H a : μ > μ 0

Tetvariabelmetode H 0 förata om t > t eidigt tet; H a : μ > μ 0 t( ) Kritit område, igifiaivå : f X x Om obervatioe t hamar i det ritia området (röd), å förata ollhypotee. OBS: På bilde är torlee av de ritia regioe överdrive. t ( ) H 0 förata ite om t ligger här H 0 förata om t ligger här Aaloga lutater a ma äve dra för de adra alterativa hypoteer Kritia område σ oäd H 0 : μ = μ 0 (ollhypote) tatitia Om t Ω (ritit område för igifiaivå ) förata H 0 H a tet Ω μ > μ 0 eidigt t > t (f) H a tet Ω μ < μ 0 eidigt t < t (f) H a tet Ω μ μ 0 tvåidigt t > t (f) 3

T-tet: tetvariabelmetode σ oäd H 0 : μ = μ 0 (ollhypote) tatitia:. Nollhypote H 0 : μ = μ 0. Alterativ hypote H a : μ μ 0 eller μ > μ 0 eller μ < μ 0 3. Slå fat igifiaivå, t. ex. = 0.05 4. Beräa tatitia värde: 5. Förata H 0 om t ligger i det ritia området Ω : t (f) = vatil för t-fördelig med f frihetgrader (tabell) T-tet, exempel: vita blodceller Atalet vita blodceller per ml blod ho fria vuxa är ormalfördelad med μ 0 = 7500 (mätt ho miljotal mäior, a därför ae om aa populatioparameter) Har atroauter amma geomittliga ocetratio av vita blodceller? Sticprov: 730, 6845, 7055, 735, 700, 7450, 7750, 7950, 7340, 750 xҧ ob = 730.5 ; = 330.0964 (e atroauter.r ). Nollhypote H 0 : μ = μ 0 = 7500. Alterativ hypote H a : μ μ 0 (vi har ige aig till vilet håll μ a avvia) 3. Sigifiaivå = 0.05 4. Beräa tatitia värde: 5. Förata H 0 om t ligger i det ritia området Ω : Statitia t ligger ite i det ritia området. Vi föratar ite ollhypotee. Vi a ite påtå att atroauter har e ocetratio av vita blodceller om avvier frå jordpopulatioe. 4

Diretmetode (beräig av p-värdet) σ oäd H 0 : μ = μ 0 (ollhypote) H a : μ > μ 0 ഥx ob p F T t = fördeligfutio för Studet t, frihetgrader H a : μ < μ 0 p ഥx ob H a : μ μ 0 ഥx ob > μ 0 t > 0 p ഥx ob p Om ഥx ob < μ 0 förädra beräige lite, med amma reultat (om t aväd) T-tet med R?t.tet # help x=c(3., 3, 30.4, 3, 3., 3., 30.3, 9.6, 30.5, 30.8) H a : μ > μ 0 ഥx ob p t.tet(x, alterative = "greater", mu = 30, cof.level = 0.95) H a : μ < μ 0 p ഥx ob t.tet(x, alterative = le", mu = 30, cof.level = 0.95) H a : μ μ 0 p ഥx ob p t.tet(x, alterative = two.ided", mu = 30, cof.level = 0.95) # t = 3.708, df = 9, p-value = 0.004899 H o förata 5

T-tet för två ticprov ( Two-ample t-tet ) Syfte: o tetar om två oberoede, ormalfördelade populatioer uppviar ett vit hypoteti illad Δμ mella dera vätevärde (met teta om Δμ 0 = 0) o Nollhypote: H 0 : μ x μ y = Δμ 0 ( Δμ 0 met 0, alltå H 0 : μ x = μ y ) o två ticprov xҧ ob ; തy ob ; x ; y (putattigar) σ x oäd ticprov σ y oäd ticprov attigar för σ x,y Tetvariabelmetode A) Vi atar att tadardavvielera är oäda me lia σ x = σ y = σ (ituatioe vi reda hade för itervallattig, e föreläig). uder H 0 : f = x + y frihetgrader tettatitia här atog H 0 : Δμ 0 = 0 (μ x = μ y ) pooled tadard deviatio t(f) Kritia område, igifiaivå : (eidiga tet aalogt, e formelamlig på mattat.de) 6

Tetvariabelmetode B) Vi atar att tadardavvielera är oäda och olia σ x σ y (Welch tet, Smith-Satterthwaite tet) uder H 0 : här atog H 0 : Δμ = 0 tettatitia här atog H 0 : Δμ = 0 (μ x = μ y ) frihetgrader, avruda (er) om ite heltal t(f) Kritia område, igifiaivå : T-tet för parade ticprov pero A B C D E F G H före 78. 66.9 74.3 7.5 90.9 78.3 68.4 7.5 efter 79. 67.0 77. 73.3 9.0 78. 68.4 7.9 beräa oäd fördelig för medelvärdet av Z i Nollhypote H 0 : Δμ = μ 0 ( oftat μ 0 = 0 ; dv. hypote: ige illad) uder H 0 : 7

T-tet, parade ticprov, tetvariabelmetode tettatitia atar Δμ 0 = 0 H 0 : Δμ = 0 (defiitio t -vatil) t(f) Kritia område, igifiaivå : (eidiga tet aalogt, e formelamlig på mattat.de) T-tet för parade ticprov, ammafattig båda σ oäd H 0 : Δμ = 0 (ollhypote) tatitia:. Nollhypote H 0 : Δμ = 0 (eller μ = μ 0 ). Alterativ hypote H a : μ 0 eller μ > 0 eller μ < 0 3. Betäm igifiaivå, t. ex. = 0.05 4. Beräa tatitia värde: 5. Förata H 0 om t ligger i det ritia området Ω : (eidiga tet aalogt, e formelamlig på mattat.de) 8

T-tet med R e t.ex. http://www.tatmethod.et/tat/ttet.html Några exemple: ett ticprov, H 0 : μ = μ 0 ; H a : μ μ 0 t.tet(x, alterative = "two.ided", mu = 7500, cof.level = 0.95) två ticprov, amma variaer, H 0 : μ x = μ y ; H a : μ x μ y t.tet(x, y, alterative = "two.ided", mu = 0, var.equal = TRUE, cof.level = 0.95) två ticprov, olia variaer, H 0 : μ x = μ y ; H a : μ x μ y t.tet(x, y, alterative = "two.ided", mu = 0, var.equal = FALSE, cof.level = 0.95) två parade ticprov, H 0 : μ = 0; H a : μ 0 t.tet(x, y, alterative = "two.ided", paired = TRUE, mu = 0, cof.level = 0.95) Att teta om X, Y är ormalfördelade: hit(y, col="red") # hitogram, borde ugefär e ut om e ormalfördelig qqorm(y); qqlie(y, col = ) # putera borde ugefär vara på e rätt lije tet: ad.tet (library(ortet) ;.tet ; hapiro.tet ANOVA Syfte o t-tet: tetar om ormalfördelade populatioer har amma vätevärde o ANOVA: tetar om fler ä ormalfördelade populatioer har amma vätevärde o För att teta detta aväd variaera (!) (ANalyi Of VAriace) o tadardavvielera oäda, me de måte vara (ugefär) lia! o ollhypote: H 0 : μ = μ = = μ ( ticprov) o alterativ hypote: mit ett lihettece gäller ite o tetet äger igetig om vile/vila vätevärde avvier därför behöv ett å allad pot-hoc tet fler ä populatioer 9

ANOVA fler ä populatioer Tetet utför geom att aalyera variaera (ANalyi Of VAriace)) Mätvärde för tre grupper: grupp grupp3 pridig mella grupper grupp pridig iom e grupp pridig iom e grupp ituitivt: gruppera är olia om pridige mella grupper är betydligt törre ä pridigara iom gruppera ANOVA ituitivt: gruppera är olia om pridigara mella grupper är betydligt törre ä pridigera iom gruppera grupp grupp grupp3 troligtvi ige igifiat illad mella medelvärde (H 0 a ite förata), må illader a ebart bero på lumpe. grupp grupp grupp3 populatioer har troligtvi ite amma medelvärde (H 0 förata), illadera a vara igifiata. 0

ҧ ANOVA Sum of Square aväd för att mäta pridige: S xx = x i i= x x 8 x xҧ x 3 x 5 x 0 Sum of Square aväd för att beriva pridige (proportioellt till ticprovvariae). Det fi flera orter om aväd för att geomföra ANOVA ANOVA Total Sum of Square i Total SS = Y ij തY i= j=

ANOVA Sum of Square for Treatmet SST = i തY i തY i= ANOVA Sum of Square for Error i SSE = Y ij തY i i= j=

ANOVA: att dela upp variatioe Total SS = SST + SSE i i= j= Y ij തY = i i= i തY i തY + Y ij തY i i= j= Total SS = Total Sum of Square SST = Sum of Square for Treatmet SSE = Sum of Square for Error atalet grupper (populatioer) i atalet värde i grupp i ANOVA: tetvariabelmetode SST = i തY i തY ummerar grupper SST ~ χ ( ) i= i SSE = Y ij തY i i= j= SSE ~ χ ( ) ummerar över gruppera och mätvärde i varje grupp uder H 0 : F = SST ~ F, SSE tetvariabel F-fördelig med frihetgrader i täljare ( umerator degree of freedom ) frihetgrader i ämare ( deomiator ) Tetvariabel F blir deto törre ju mer ågo grupp medelvärde avvier frå de adra (SST blir törre). Vi föratar alltå ollhypotee om e obervatio av F blir törre ä repetive vatil (jämför härledige för T-tetet): 3

ANOVA: tetvariabelmetode F ~ F, P F > ω H 0 a = P F > F, = ω = F, f X x X ~ F, Kritit område, igifiaivå : Om obervatioe F hamar i det ritia området (röd), å förata ollhypotee. Förutättigara: o X i ~ N (räcet om ugefär N) o σ i = σ (måte ugefär gälla) o oberoede ticprov = 0.05 F, : vatilera för F-fördelig, med rep. frihetgrader Oe-way ANOVA: tetvariabelmetode. Hypote H 0 : μ = μ =... =. Sigifiaivå: = 0.05 3. Sticprov 4. Tetvariabel 5. Förata H 0 om SST = i തY i തY i= i SSE = Y ij തY i i= j= SST F = ~ F, SSE Fler alterativa hypoteer fi ite; atige är alla vätevärde lia eller ite. 4

ANOVA SST och SSE a ocå beräa med hjälp av medelvärdea och tadardavvielera: i SST = SSE = Y i S ( Y Y ) i i Y = i= + + i ( Yij Yi ) = ( i ) Si i= j= i i giva i= Y + Y + + Y + Dea uttryc behöv är ma ite har jälva mätvärdea, uta bara ticprovtorleara, medelvärdea och tadardavvielera (eller variaera). Oe-way ANOVA: Atagade Oberoede obervatioer i de olia gruppera. Normalfördelade populatioer. ANOVA fugerar oftat bra uta att detta är väl uppfyllt. Homogea variaer. Samma pridig i de olia gruppera. Vid amma atal obervatioer i varje grupp är ANOVA gaa oäligt för brott mot detta. Levee tet, Bartlett tet a aväda för att olla om variaera är lia Vilet medelvärde avvier? Vill vi veta detta måte vi öra ett pothoc tet (bara om H 0 i ANOVA föratade) t. ex. Tuey tet Tuey tet gör parvia jämföreler, me på ett peciellt ätt: orretur för multiple compario umulativ igifiaivå (för alla tet) 5

ANOVA: räeexempel med 4 grupper A B C D 65 75 59 94 87 69 78 89 73 83 67 80 79 8 6 88 8 7 83 69 79 76 90 = 6 Y = 75.67 SST = MST = = 7 Y + Y + 3 Y3 + 4 Y Y = + + + i i= SST df = 6 3 Y = 78.43 i ( Yi Y ) = 7.6 SSE = ( Yij Yi ) SST = = 37.5 3 = 4 4 4 Y = 70.83 3 4 Y = 87.75 4 79 = = 77.35 3 MSE = i= j= SSE df = 96.6 SSE = = 63.0 F = rit MST MSE = 37.5 = = 3.77 63.0 F F (, ) = F F0.05( 3,9) = F 3.3 ANOVA: räeexempel med 4 grupper, alterativ A B C D 65 75 59 94 87 69 78 89 73 83 67 80 79 8 6 88 8 7 83 69 79 76 90 A B C D 6 7 6 4 x 75,67 78,43 70,83 87,75 66,67 50,6 9,77 33,58 Y + Y + 3 Y3 + 4 Y4 79 Y = = = 77.35 + + + 3 SST = i ( Yi Y ) i= = 6 ( 75.67 77.35) + 7 ( 78.43 77.35) + 6 ( 70.83 77.35) + 4 ( 87.75 77.35) = 6.93 + 8.65 + 55. + 43.64 = 7.8 SST 7.8 MST = = = 37.6 3 SSE = ( i ) Si i= ( alterativ formel) = 5 66.67 + 6 50.6 + 5 9,77 + 3 33,58 = 333.35 + 303.7 + 458.85 + 00.74 96.66 SSE 96.66 MSE = = = 63 9 3 4 MST 37.6 F = = = 3.77 MSE 63.0 rit = F F (, ) = F F0.05( 3, 9) = F 3.3 6

ANOVA: räeexempel med 4 grupper, fort. 0,8 0,7 0,6 0,5 0,4 F; df=3; df=9 rit = F F = 3.77 3.3 0,3 0, 0, 0,0 0 3,3 0,05 Tetvariabel F överrider det ritia värdet (3 umerator och 9 deomiator frihetgrader). Nollhypotee förata därför. Mit ett medelvärde avvier frå de adra (igifiaivå = 0.05) ANOVA med R data(iectspray) level(iectspray$pray) ummary(iectspray$cout) boxplot(cout ~ pray, data = IectSpray, col="gree") #. futio oeway.tet oeway.tet(cout ~ pray, data = IectSpray) # amma varia I alla grupper? bartlett.tet(cout ~ pray, data = IectSpray) # ite lia problem! # ice-parametrit tet: rual.tet(cout ~ pray, data = IectSpray) #. aa futio för ANOVA: aov aov.out = aov(cout ~ pray, data = IectSpray) ummary(aov.out) TueyHSD(aov.out) # pot-hoc tet plot(tueyhsd(aov.out)) # parvi differe igifiat illad om KI:et ite går över oll e aova_ms0065.r e ocå http://www.tatmethod.et/tat/aova.html 7

Appedix Hypotetet II Uwe Mezel, 08 uwe.mezel@lu.e ; uwe.mezel@mattat.de www.mattat.de Defiitio för Studet t-fördelig "Studet : peudoym om aväd av William Goet Förutättigara: o Z ~N 0, tadard ormal W~χ (ν) chi-vadrat, ν frihetgrader o Z och W oberoede Om Z och W har ovatåede fördeligar, å har följade vot e t- fördelig: t-fördelig, ν frihetgrader täthetfutio 8

Studet t-fördelig: härledig: tatitia är t-fördelade o Z ~N 0, tadard ormal W~χ (ν) chi-vadrat, ν frihetgrader o Z och W oberoede Kvatiler för t- fördelige T df 6 N(0,) -3 - - 0 3 4 5 f tor lite illad till N(0,) Större pridig (tail) för T pga. törre oäerhet vi vet ju ite σ och måte atta det (med ). 9

Symmetri och fördeligfutio Om täthetfutioe är ymmetri rig oll (t. ex. N, T ) gäller för fördeligfutioe att: F t = F(t) f T x F t -t 0 t F(t) T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ > μ 0 Om ollhypotee H 0 : μ = μ 0 gäller är X i ~ N(μ 0, σ). തX μ 0 ~ t( ) om σ atta med S f T x T ~ t( ) Det ritia värdet ω ta fram geom att löa: P തX > ω H 0 a = ( förvald) är x ҧ > ω förata H 0 ; = P(fel typ I) P തX ω = omforma i paratee X P ത μ 0 ω μ 0 S = X P ത μ 0 t S = μ 0 ω Ω detta gäller allmät för att terme till väter i paratee är t-fördelad med frihetgrader (vatildefiitio) 0

ҧ ҧ X P ത μ 0 ω μ 0 S H 0 förata alltå om T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ > μ 0 = X P ത μ 0 t S = H 0 förata om x ҧ > ω, alltå om x μ 0 > t jämförele av båda evatioer ger: ω μ 0 = t ω = μ 0 + t x ҧ > μ 0 + t H 0 förata alltå om t > t för H a : μ > μ 0 t = x μ 0 tettatitia för T-tet, ett ticprov. H 0 : μ = μ 0 T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ < μ 0 Om ollhypotee H 0 : μ = μ 0 gäller är X i ~ N(μ 0, σ). തX μ 0 ~ t( ) om σ atta med S f T x T ~ t( ) Det ritia värdet ω ta fram geom att löa: P തX < ω H 0 a = ( förvald) är x ҧ < ω förata H 0 ; = P(fel typ I) P തX ω = omforma i paratee X P ത μ 0 ω μ 0 S = X P ത μ 0 t S = Ω ω detta gäller allmät för att terme till väter i paratee är t-fördelad med frihetgrader (vatildefiitio) μ 0

ҧ ҧ X P ത μ 0 ω μ 0 S H 0 förata alltå om T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ < μ 0 = X P ത μ 0 t S = H 0 förata om x ҧ < ω, alltå om x μ 0 < t jämförele av båda evatioer ger: ω μ 0 = t ω = μ 0 t x ҧ < μ 0 t H 0 förata alltå om t < t för H a : μ < μ 0 t = x μ 0 tettatitia för T-tet, ett ticprov. H 0 : μ = μ 0 T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ μ 0 Om ollhypotee H 0 : μ = μ 0 gäller är X i ~ N(μ 0, σ). തX μ 0 ~ t( ) om σ atta med S De ritia värde ω, ta fram geom att löa: f T x T ~ t( ) P തX < ω തX > ω H 0 a = P ω < തX ω = P ω < തX ω = P ω μ 0 < ത X μ 0 ω μ 0 S = ω μ 0 ω P X t < ത μ detta gäller allmät för att terme till 0 t S = väter i paratee är t-fördelad med frihet- grader (vatildefiitio)

ҧ ҧ ҧ T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ μ 0 P ω μ 0 X < ത μ 0 ω μ 0 S P X t < ത μ 0 S = t = båda evatioer jämför (e ere) termer till väter: termer till höger: ω μ 0 ω μ 0 = t ω = μ 0 t = t ω = μ 0 + t T-tet, tetvariabelmetode Härledig av det ritia värdet för H a : μ μ 0 ω = μ 0 t ω = μ 0 + t H 0 förata om x ҧ < ω eller om x ҧ > ω, alltå om x ҧ < μ 0 t x μ 0 < t eller om eller om x ҧ > μ 0 + t x μ 0 > t t < t eller om t > t H 0 förata alltå om t > t Τ för H a : μ μ 0 t = x μ 0 tettatitia för T-tet, ett ticprov. H 0 : μ = μ 0 3

ҧ T-tet, tetvariabelmetode Kritia område, T-tet, ett ticprov, ammafattig t = x μ 0 tettatitia H 0 : μ = μ 0 H a tet ritit område μ > μ 0 eidigt Ω = t > t H a tet ritit område μ < μ 0 eidigt Ω = t < t H a tet ritit område μ μ 0 tvåidigt Ω = t > t Uder H 0 gäller: SSE = i= F-tet, fördelig för tetvariabel ( ) i S i = ( ) S ( ) S ( ) + + + S df = df = df = ( ) SST ( Y Y ) ( ) = i i i= atalet Z -fördelade SST ( ) SST MST ( ) F = = = F, MSE SSE SSE ( ) ( ) ( ) 4