Kontingenstabell (Korstabell) 2. Oberoende-test. Stickprov beror av slumpen. Vad vi förvf. är r oberoende: kriterier är r oberoende: kriterier

Relevanta dokument
1. Anpassningstest. Chi-Square test. Multinomial experiment. Multinomial experiment. Vad gör g r ett anpassningstest?

Parametriska metoder. Icke-parametriska metoder. parametriska test. Icke-parametriska test. Location Shift. Vilket test ersätts med vilket?

Väntevärde för stokastiska variabler (Blom Kapitel 6 och 7)

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Variansanalys ANOVA. Idé. Experiment med flera populationer. Beteckningar. Beteckningar. ANOVA - ANalysis

KONFIDENSINTERVALL FÖR MEDIANEN (=TECKENINTERVALL )

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Medelvärde. Repetition. Median. Standardavvikelse. Frekvens. Normerat värde. z = x x

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

1. Test av anpassning.

Fördelningen för populationen som stickprovet togs ifrån är känd så nära som på ett antal parametrar, t.ex: N med okända

Stokastiska variabler

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

4.2.3 Normalfördelningen

D 45. Orderkvantiteter i kanbansystem. 1 Kanbansystem med två kort. Handbok i materialstyrning - Del D Bestämning av orderkvantiteter

Korrelationens betydelse vid GUM-analyser

Orderkvantiteter vid begränsningar av antal order per år

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Sensorer, effektorer och fysik. Analys av mätdata

Sensorer och elektronik. Analys av mätdata

Föreläsningsanteckningar till Linjär Regression

F9 Hypotesprövning. Statistikens grunder 2 dagtid. p-värden. Övning 1 från F8

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Borel-Cantellis sats och stora talens lag

Något om beskrivande statistik

SOS HT Punktskattningar. Skattning från stickprovet. 2. Intuitiva skattningar. 3. Skattning som slumpvariabel. slump.

Postadress: Internet: Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Sverige.

Föreläsning G04: Surveymetodik

TMS136: Dataanalys och statistik Tentamen med lösningar

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

TENTAMEN I MATEMATISK STATISTIK. Statistik för lärare, 5 poäng

F15 ENKEL LINJÄR REGRESSION (NCT )

SAMMANFATTNING AV KURS 602 STATISTIK (Newbold kapitel [7], 8, 9, 10, 13, 14)

Fyra typer av förstärkare

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i Envariabelanalys 1

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Orderkvantiteter i kanbansystem

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

= α. β = α = ( ) D (β )= = 0 + β. = α 0 + β. E (β )=β. V (β )= σ2. β N β, = σ2

Introduktion till statistik för statsvetare

Lösningsförslag till tentamen i 732G71 Statistik B,

Induktion och Binomialsatsen. Vi fortsätter att visa hur matematiska påståenden bevisas med induktion.

Väntevärde, standardavvikelse och varians Ett statistiskt material kan sammanfattas med medelvärde och standardavvikelse (varians), och s.

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Jag läser kursen på. Halvfart Helfart

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Tentamen i Matematisk statistik för V2 den 28 maj 2010

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

101. och sista termen 1

Grundläggande matematisk statistik

F10 ESTIMATION (NCT )

En utvärdering av två olika sätt att skatta fördelningen till stickprovsmedelvärden från olikfördelade data - normalapproximation kontra resampling

Tentamen Metod C vid Uppsala universitet, , kl

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Uppgift 1. Produktmomentkorrelationskoefficienten

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Ekvationen (ekv1) kan beskriva vågutbredning, transversella svängningar i en sträng och andra fysikaliska förlopp.

REGRESSIONSANALYS S0001M

3-fastransformatorn 1

4.2.3 Normalfördelningen

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

1. a Vad menas med medianen för en kontinuerligt fördelad stokastisk variabel?

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Sannolikhetslära. c 2015 Eric Järpe Högskolan i Halmstad

Lösningar och kommentarer till uppgifter i 1.1

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Analys av polynomfunktioner

Lösningar till SPSS-övning: Analytisk statistik

Tentamen i matematisk statistik

Linköpings tekniska högskola IKP/Mekaniksystem Mekanisk värmeteori och strömningslära. Exempeltentamen 3. strömningslära, miniräknare.

= (1 1) + (1 1) + (1 1) +... = = 0

f(x i ) Vi söker arean av det gråfärgade området ovan. Området begränsas i x-led av de två x-värdena där kurvan y = x 2 2x skär y = 0, d.v.s.

Kombinatorik. Torbjörn Tambour 21 mars 2015

z Teori z Hypotesgenerering z Observation (empirisk test) z Bara sanningen : Inga falska teser z Hela sanningen : Täcker alla sanna teser

Centrala gränsvärdessatsen

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

Betygsgränser: För (betyg Fx).

Datorövning 2 Fördelningar inom säkerhetsanalys

Lycka till och trevlig sommar!

Föreläsning G70 Statistik A

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

UPPSKATTNING AV INTEGRALER MED HJÄLP AV TVÅ RIEMANNSUMMOR. Med andra ord: Vi kan approximera integralen från båda sidor

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Transkript:

. Oberoede-test Kotgestabell (Korstabell) Oberoedet av två rterer för lassfato udersöes xempel: V vll veta om röadet är beroede av ö V tar ett stcprov ur befolge (=50) och lassfcera persoera elgt dessa två rterer: Kv. M. R 0 30 50 R * 80 0 00 00 50 50 V har 00 vor, 0 av de röar. V har 50 mä. 30 av de röar. Totalt röar 50 av 50. Kv. M. R 0 30 R * 80 0 Varje perso hamar exat e cell. uwe.mezel@gepat.uu.se Om röadet är oberoede av ö: v förvätar oss att det fs samma adel röare blad vor som blad mä! Här är det så: Det fs totalt 0% röare (50 av 50, ssta olum). Det är ocså 0% av vora och 0% av mä som röar! Vad v förvf rvätar oss om båda b rterer är r oberoede: Vad v förvf rvätar oss om båda b rterer är r oberoede: Kv. M. R 0 30 50 R * 80 0 00 00 50 50 Kv. M. R a b R R * c d R K K Oberoedet räver: 0 50 00 50 30 50 50 50 Allmät: a K b K vor mä K a K b K a K b R K c R K d Kv. M. R a b R R * c d R K K detsamma gäller ocså för adele ce-röare Förvätade värde v varje cell om båda rterer är r oberoede: Kv. M. R K R K R R R R * K R K R K K Stcprov beror av slumpe tt mer realstst stcprov. tt sådat stcprov a uppstå äve vd oberoedet:.. stcprovet avver ju te mycet frå de förvätade värde: Kv. M. R 4 6 50 R * 76 4 00 00 50 50 Kv. M. R 0 30 50 R * 80 0 00 00 50 50

tt aat stcprov Test för f r oberoedet tt stcprov som avver mycet frå de förvätade värde. V msstäer att båda rterer är te oberoede.... ty stcprovet avver ju mycet frå de förvätade värde: Kv. M. R 4 46 50 R * 96 04 00 00 50 50 Kv. M. R 0 30 50 R * 80 0 00 00 50 50 Nollhypotes: oberoedet Nollhypotese förastas om stcprovet avver för mycet frå de förvätade värde, om det är osaolt att ett sådat stcprov ommer tll ståd uder H 0 Ige: Var går gräse? Vlet värde får sllade maxmalt ha för att bbehålla ollhypotese? (Hur mäter jag sllade överhuvudtaget?) v behöver e fördelg för sllade, dvs. saolhete att e vss sllad uppstår uder H 0! Om dea sllad är osaol, förastar v H 0. summa som mäter sllade observed values O expected values Fördelge av dea testvarabel a ma räa ut, gvet att ollhypotese gäller (och att är stor) Ch- Square fördelge Lte förvrrade: testvarabel allas av ågo aledg, och de är ocså -fördelad. Atalet frhetsgrader och rtst område för f r oberoede-testet r=atalet råder c=atalet olumer df rt r c är postv och v förastar ollhypotese om de är stor upper tal test. Observed Kv. M. xpected (H 0 ) Kv. M. Resultat R 4 6 50 R * 76 4 00 R 0 30 50 R * 80 0 00,6,4 Ch-Square; df= 00 50 50 O 00 50 50 4 0 6 30 76 80 4 0 0.67 summa över alla celler 30 80 0 Desty,,0 0,8 0,6 0,4 0, 0,0 0 =.67 3,84 0,05 rt 3.84 0.05 H 0 förastas te. Röadet a vara oberoede av ö.

Mtab Stat / Tables / Ch-Square Test Ch-Square Test: M; K Mtab results xpected couts are prted below observed couts Ch-Square cotrbutos are prted below expected couts M K Total 4 6 50 0,00 30,00 0,800 0,533 76 4 00 80,00 0,00 0,00 0,33 observed expected Total 00 50 50 Ch-Sq =,667; DF = ; P-Value = 0,97 Sammafattg oberoede-test A A * B O O R B * O 3 O 4 R K K O rt K K R K 3 R K 4 A A * B R B * 3 4 R K K summa över alla celler df df r c Förutsättgarttgar bara om är stor har summa e -fördelg 5 varje cell slumpmässgt stcprov (som valgt) A A * B R B * 3 4 R K K alla 5 Ite lmterad tll x tabeller! Föredrar två muräarter ola mljöer er? xpermet: det räades hur ofta ma såg två muräarter ett vsst område Belze. Det oterades vla arter sågs vle mljö. Youg, R.F., ad H.. W. 003. Actvty patters, det, ad shelter ste use for two speces of moray eels, Gymothorax morga ad Gymothorax vcus, Belze. Copea 003: 44-55. Föredrar två muräarter ola mljöer er? Observatoer morga vcus gräs 7 6 43 sad 99 67 66 gräs 64 6 45 490 344 834

O Observed ad expected 43 344 / 834 morga vcus gräs 7 6 43 sad 99 67 66 gräs 64 6 45 490 344 834 df rt morga vcus gräs 4.8 00. 43 sad 97.5 68.5 66 gräs 49.7 75.3 45 490 344 834 O 7 4.8 6 00. 99 97.5 4.8 00. 67 68.5 64 49.7 6 75.3 68.5 49.7 75.3.75.49 0.03 0.033 0.89.67 6.6 r ( c ) df 0.05 5.99 97.5 O rt Resultat 6.6 df 5.99 H 0 förastas. Ola arter föredrar ola mjöer. Atalet frhetsgrader var : Om ma fyller (godtyclga) celler x3-tabelle, följer alla adra automatst (om margalfördelgar är gva). Testa gära det!! Det är lättare ä sudou... 0.05 Mtab Stat / Tables / Ch-Square Test Results for: eel Ch-Square Test: art; art xpected couts are prted below observed couts Ch-Square cotrbutos are prted below expected couts art art Total 7 6 43 4,77 00,3,74,48 99 67 66 97,53 68,47 0,0 0,03 observed expected 3 64 6 45 49,70 75,30 0,89,66 samma resultat som förut... H 0 förastas Total 490 344 834 Ch-Sq = 6,6; DF = ; P-Value = 0,044 Chsquare.MPJ Om < 5 (small sample sze) Fsher s xact test (för orstabeller) beror te på ormalapproxmato H 0 som förut: ge assozato mella båda egesaper Cell-värdea (uder H 0 ) orstabelle följer e hypergeometrs fördelg xempel: Jag atar att röadet är oberoede av ö (H 0 ). Jag tar ett stcprov av 5 persoer, därav 5 röare och 0 vor (det måste vara ät). Hur stor är saolhete att ha vlga röare detta stcprov? Kv. M. R 5 R * 0 0 5 5 Fsher s s xact test Fsher s xact test räar ut hur saolt e vss ofgurato är (margalsummora gva): Kv. M. R a b a+b R * c d c+d a+c b+d e vss ofgurato av a,b,c,d p a b a a c c d c... och dess saolhet uder H 0

Fsher s s xact test: p-värdetp p-värdet: saolhet för de observerade tabelle plus slh:a för alla täbara äu mera extrema (mera ojäm-fördelade, mdre saola) tabeller mera extrema = mdre saolheter täbar heter att r- och -summora måste bbehållas! om p-värdet är ltet förasta H 0, ty det är osaolt att få ett sådat tabell uder H 0 Att räa r Fsher s s xact test räe-tesvt, atalet täbara tabeller växer sabbt med tabelles storle (dvs. med atalet rader och olumer) Mtab: bara x tabeller web-ste för större tabeller (max. 6x6): http://www.physcs.csbsju.edu/stats/exact_nrow_ncolumn_form.html Mtab- stort stcprov Stat / Tables / Cross Tabulato ad Ch-Square Fsher är gömd här Results Large Sample Tabulated statstcs: smoe; geder Usg frequeces cout Rows: smoe Colums: geder F M All o 5 6 yes 4 35 59 All 35 40 75 Cell Cotets: Cout Pearso Ch-Square = 3,985; DF = ; P-Value = 0,046 Lelhood Rato Ch-Square = 4,035; DF = ; P-Value = 0,045 välj Fsher s xact Test här, ma a doc te bestämma vle alteratv hypotes ma vll ha (oe-taled / two-taled) Fsher's exact test: P-Value = 0,054 Mtab- ltet stcprov Stat / Tables / Cross Tabulato ad Ch-Square Fsher är gömd här Results Small Sample Results for: smoe_smallsample Rows: smoe Colums: geder F M All o 5 0 5 yes 7 9 All 7 7 4 Cell Cotets: Cout ltet stcprov Pearso Ch-Square =,60; DF = ; P-Value = 0,07 Lelhood Rato Ch-Square = 3,966; DF = ; P-Value = 0,046 * NOT * cells wth expected couts less tha 5 Fsher's exact test: P-Value = 0,7 välj Fsher s xact Test här

Hypergeometrsa fördelgef Appedx N 3 b 5 3 atalet ulor ura atalet blå ulor ura stcprovets storle Ma drar ulor. Hur stor är slh. att få blåa? Hyp N, b, P b N b 5 8 3 N 3 3 Hypergeometrsa fördelgef Mtab Hyp P N, b, Hyp3, 5, 3 b N b 5 8 3 N 3 3 5 8 0 3 8 P 0 0.958 3 3 3 5 8 70 P 0.4895 3 43 3 5 8 P 0.797 3 3 5 8 3 0 P 3 0. 0396 3 3 N b Mtab Graph / Vew Probablty 0,5 0,4 Dstrbuto Plot Hypergeometrc; N=3; b=5; =3 0,0 0,5 Dstrbuto Plot Hypergeometrc; N=00; M=40; =30 b Probablty 0,3 0, 0, 0,0 0 3 4 Probablty 0,0 0,05 0,00 0,53 0 4 0,5 Shaded area, x-value=0: Mtab gör det så att saolhetera på båda sdor är ugefär la stora