χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest

Relevanta dokument
SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1901 Sannolikhetsteori och statistik I

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

TAMS65 - Föreläsning 6 Hypotesprövning

TAMS65 - Föreläsning 6 Hypotesprövning

TAMS65 - Föreläsning 12 Test av fördelning

TAMS65 - Föreläsning 8 Test av fördelning χ 2 -test

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Avd. Matematisk statistik

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

TAMS65 - Föreläsning 12 Test av fördelning

Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version

Jämförelse av två populationer

faderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

FÖRELÄSNING 8:

SF1901: Medelfel, felfortplantning

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

b) Beräkna sannolikheten att en mottagen nolla har sänts som en nolla. (7 p)

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

Tentamen MVE301 Sannolikhet, statistik och risk

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Avd. Matematisk statistik

Föreläsning 11: Mer om jämförelser och inferens

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Lufttorkat trä Ugnstorkat trä

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Matematisk statistik för B, K, N, BME och Kemister

Föreläsning 5: Hypotesprövningar

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 17 August 2015, 8:00-12:00. English Version

Avd. Matematisk statistik

Avd. Matematisk statistik

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 15 August 2016, 8:00-12:00. English Version

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Avd. Matematisk statistik

7.5 Experiment with a single factor having more than two levels

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Avd. Matematisk statistik

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen MVE300 Sannolikhet, statistik och risk

0 om x < 0, F X (x) = c x. 1 om x 2.

Avd. Matematisk statistik

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen MVE302 Sannolikhet och statistik

SF1901: Sannolikhetslära och statistik. Mer om Approximationer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Uppgift 1. f(x) = 2x om 0 x 1

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Statistisk utvärdering av antagningen till Polishögskolan

Föreläsning 12: Regression

Avd. Matematisk statistik

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

Statistik för teknologer, 5 poäng Skrivtid:

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Tentamen MVE301 Sannolikhet, statistik och risk

8 Inferens om väntevärdet (och variansen) av en fördelning

Formler och tabeller till kursen MSG830

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

Exempel på tentamensuppgifter

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Faderns blodgrupp Sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Thomas Önskog 28/

Tentamen MVE300 Sannolikhet, statistik och risk

Avd. Matematisk statistik

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

TMS136: Dataanalys och statistik Tentamen

TMS136. Föreläsning 13

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

Metod och teori. Statistik för naturvetare Umeå universitet

Följande resultat erhålls (enhet: 1000psi):

Matematisk statistik 9.5 hp, HT-16 Föreläsning 11: Konfidensintervall

Kapitel 10 Hypotesprövning

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Transkript:

STATISTIK FÖR BIOTEKNIK FÖRELÄSNING 12. χ 2 -TEST OCH LIKNANDE Jan Grandell & Timo Koski 04.12.2017 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 1 / 40

INNEHÅLL χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 2 / 40

χ 2 -TEST χ 2 -testet är ett så kallat goodness of fit -test. Den enklaste situationen: Ett försök kan utfalla på r olika sätt: A 1, A 2,..., A r. Låt x 1, x 2,..., x r vara antalet gånger som alternativen A 1, A 2,..., A r förekommer i n försök. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 3 / 40

χ 2 -TEST Låt p 1, p 2,..., p r vara givna sannolikheter, dvs r i=1 p i = 1. Vi vill testa H 0 : P(A i ) = p i för i = 1,..., r mot H 1 : ej alla P(A i ) = p i. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 4 / 40

χ 2 -TEST För att göra detta bildar vi teststatistikan Q obs = r (x i np i ) 2. i=1 np i Man kan visa att Q är approximativt χ 2 (r 1)-fördelad under H 0. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 5 / 40

χ 2 -FÖRDELNING: HUR UPPSTÅR DEN? X 1, X 2,..., X n, X i N (0, 1), oberoende. Observera att X 2 1 +... + X 2 n > 0. X 2 1 + X 2 2 +... + X 2 n χ 2 (n). Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 6 / 40

SKEWNESS TO THE RIGHT X χ 2 (k) E (X ) = k Median(X ) k ( ) 3 1 2 9k Mode = max(k 2, 0). I.e., Mode <Median < Mean Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 7 / 40

χ 2 -TEST För att göra resultatet (d.vs. Q är approximativt χ 2 (r 1)-fördelad) troligt, betraktar vi r = 2. Då gäller, med X = X 1 och p = p 1 att Q = (X 1 np 1 ) 2 np 1 + (X 2 np 2 ) 2 np 2 = (X np)2 np + (n X n(1 p))2 n(1 p) = (X np)2 np + Eftersom X är Bin(n, p) så gäller att följer att (X np)2 np(1 p) är appr. χ2 (1). (X np))2 n(1 p) = (X np)2 np(1 p). X np är appr. N(0, 1). Således np(1 p) Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 8 / 40

χ 2 -TEST Vi gör nu följande test: Förkasta H 0 om Q obs > χ 2 α(r 1). Om n är stort, har detta test approximativt signifikansnivån α. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 9 / 40

χ 2 -FÖRDELNING P(X > χ 2 α(f )) = α, där X χ 2 (f ). Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 10 / 40

χ 2 -TEST The critical region and decision are one-tailed: Reject H o if Otherwise you fail to reject H o Q > χ 2 α(r 1). If n is large, the approximative level of significance is α. Practical requirement is that all np j 5. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 11 / 40

χ 2 -TEST Det går inte att generellt ange hur stort n skall vara för att approximationen skall vara tillfredsställande. Som tumregel brukar man använda: Tillse att insatta värden på np j är minst lika med 5. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 12 / 40

χ 2 -TEST: KAST MED EN TÄRNING Vid 96 kast med en tärning erhölls följande antal ettor, tvåor, etc: 15, 7, 9, 20, 26, 19. Man önskar pröva om tärningen kan antas vara symmetrisk. Hypotesen H 0 blir alltså H 0 : P(A 1 ) = 1/6,..., P(A 6 ) = 1/6. χ 2 -metoden kan användas, ty alla np j = 96 1/6 = 16 och är alltså tillräckligt stora. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 13 / 40

χ 2 -TEST: KAST MED EN TÄRNING Man får Q obs = (15 16)2 16 (7 16)2 (9 16)2 + + 16 16 (20 16)2 (26 16)2 + + 16 16 + (19 16)2 16 = 16.0. Antalet frihetsgrader är f = r 1 = 6 1 = 5. Eftersom Q obs något överstiger χ 2 0.01 (5) = 15.1 kan man påstå att tärningen inte är symmetrisk: Resultatet är signifikant**. Med dator erhålls P = P(Q > 16.0) 0.0068 då Q är χ 2 (5). Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 14 / 40

χ 2 -TEST MED SKATTNING AV PARAMETRAR Ofta vill vi låta sannolikheterna p 1, p 2,..., p r bero av en okänd parameter θ = (θ 1,..., θ s ), och testa hypotesen och för något värde på θ. H 0 : P(A i ) = p i (θ), för i = 1,..., r, Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 15 / 40

χ 2 -TEST MED SKATTNING AV PARAMETRAR Skattar vi θ med ML-metoden, och bildar Q obs = r (x i np i (θobs ))2 i=1 np i (θobs ), så är Q approximativt χ 2 (r s 1)-fördelad under H 0. Detta resultat kallas ibland för stora χ 2 -satsen. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 16 / 40

χ 2 -TEST MED SKATTNING AV PARAMETRAR: ANTALET FRIHETSGRADER Grundregeln är att antalet frihetsgrader fås av antalet fria kvadratsummor antalet skattade parametrar. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 17 / 40

EXEMPEL: DE SMÅ TALENS LAG En händelse av låg frekvens i en stor population följer en Poissonfördelning. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 18 / 40

EXEMPEL: DE SMÅ TALENS LAG I en klassisk datamängd undersöktes antalet ihjälsparkade soldater vid 14 tyska armékårer från 1875 till 1894 (20 år). De 14 20 = 280 rapporterna fördelade sig som i tabellen. Antal döda Antal rapporter Andel 0 144 0.5143 1 91 0.3250 2 32 0.1143 3 11 0.0393 4 2 0.0071 5 0 0 Summa 280 1 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 19 / 40

Die Gesamtstärke eines Armeekorps (=armekår) im deutschen Heer betrug 1554 Offiziere, 43.317 Mann, 16.934 Pferde und 2933 Fahrzeuge. Totalt omkom 1 91 + 2 32 + 3 11 + 4 2 = 196 soldater under tjugo år i 14 armekårer. Således var det en mycket sällsynt händelse att bli ihjälsparkad av en häst. De små talens lag En händelse av låg frekvens i en stor population följer en Poissonfördelning. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 20 / 40

DE SMÅ TALENS LAG Totalt omkom 1 91 + 2 32 + 3 11 + 4 2 = 196 soldater. Test om data verkar komma från en Po(θ)-fördelning med θ = θ obs = 196/280 = 0.7. Vi gör nu indelningen A 1 = 0 döda A 2 = 1 död, A 3 = 2 döda samt A 4 = 3 eller fler döda. Vi klumpar ihop eftersom vi vill få minst 5 i alla kategorier. Po(0.7)-fördelningen ger p 1 = e 0.7 = 0.4966, p 2 = 0.7e 0.7 = 0.3476, p 3 = 0.72 2 e 0.7 = 0.1217, p 4 = 1 p 1 p 2 p 3 = 1 1.945e 0.7 = 0.0341. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 21 / 40

DE SMÅ TALENS LAG Detta ger de förväntade frekvenserna och 280 p 1 = 139.0, 280 p 2 = 97.3, 280 p 3 = 34.1, 280 p 4 = 9.6 Q obs = (144 139.0)2 139.0 + (91 97.3)2 97.3 + (32 34.1)2 34.1 + (13 9.6)2 9.6 1.95 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 22 / 40

DE SMÅ TALENS LAG Q är approximativt χ 2 (4 1 1) = χ 2 (2) om H 0 : data kommer från Poisson-fördelning är sann. Vi har χ 2 0.05 (2) = 5.99 så H 0 förkastas inte på nivån 5 %. Slutsatsen är alltså att data på intet sätt strider mot på ståendet att antalet ihjälsparkade soldater per år och armékår är Poisson-fördelat. Om vi på förhand hade velat testa om data kom från just Po(0.7)-fördelningen hade vi jämfört med χ 2 0.05 (3) = 7.81. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 23 / 40

DE SMÅ TALENS LAG L. Bortkiewicz published a book (in German) The Law of Small Numbers in 1898. In this he was the first to note that events with low frequency in a large population followed a Poisson distribution even when the probabilities of the events varied. A striking example was the number of soldiers killed by horse kicks per year per Prussian army corps. Fourteen corps were examined, each for twenty years. For over half the corps-year combinations there were no deaths from horse kicks; for the other combinations the number of deaths ranged up to four. Presumably the risk of lethal horse kicks varied over years and corps, yet the over-all distribution was remarkably well fitted by a Poisson distribution. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 24 / 40

DE SMÅ TALENS LAG: A DIFFERENT STORY The Poisson distribution was discovered through observation of the process of fermentation in beer at the Guinness company. The t-statistic is a measure of how much confidence can be placed in judgments made from small samples. W.S. Gossett invented that measure to enable the quality of brews to be monitored in a cost- effective manner. The scholars behind the stout; Financial Times 27 December 2005 http://www.johnkay.com/in action/422 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 25 / 40

HOMOGENITETSTEST Vi återgår nu till exemplet i början, med ett försök som kan utfalla på r olika sätt: A 1, A 2,..., A r. Antag nu att vi har s försöksserier om n 1,..., n s försök vardera. Låt x ij vara antalet gånger som alternativet A j förkommer i ite försöksserien. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 26 / 40

HOMOGENITETSTEST Antag att s serier utförts med följande resultat: Serie Absoluta frekvenser för Antal försök A 1 A 2... A r 1 x 11 x 12... x 1r n 1 2 x 21 x 22... x 2r n 2..... s x s1 x s2... x sr n s Summa x 1 x 2... x r n Som framgår av tabellen indikerar en punkt i index en summation. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 27 / 40

HOMOGENITETSTEST Vi anser att serierna är homogena om hypotesen H 0 : P(A i ) = p i, för i = 1,..., r i alla serierna. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 28 / 40

HOMOGENITETSTEST För att testa H 0 bildar vi där Q obs = p j s r i=1 j=1 (x ij n i pj )2 n i pj, = (p j ) obs = s i=1 x ij s i=1 n i. Man kan visa att Q är approximativt χ 2 ((r 1)(s 1))-fördelad under H 0. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 29 / 40

HOMOGENITETSTEST Frihetsgraderna fås på följande sätt: antalet fria kvadratsummor antalet skattade parametrar = s (r 1) (r 1) = (r 1)(s 1). Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 30 / 40

OBEROENDETEST Vi tar nu ett stickprov om n enheter, där varje enhet klassifiseras efter två egenskaper, A och B. Vi kan skriva detta i en kontingenstabell, lik den tabell vi hade i hogenitetstestet. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 31 / 40

OBEROENDETEST & KONTINGENSTABELL Antag att s serier utförts med följande resultat: Serie Absoluta frekvenser för Antal försök Egenskap A 1 A 2... A r Total B 1 x 11 x 12... x 1r x 1 B 2 x 21 x 22... x 2r x 2... B s x s1 x s2... x sr x s Total x 1 x 2... x r n Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 32 / 40

OBEROENDETEST Vi vill nu testa hypotesen För att testa H 0 bildar vi där H 0 : P(A j B i ) = P(A j )P(B i ), för alla i och j. Q = s i=1 p i = (p i ) obs = x i n r j=1 (x ij npi p j )2 och np i p j, p j = (p j) obs = x j n. Man kan även här visa att Q är approximativt χ 2 ((r 1)(s 1))-fördelad under H 0. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 33 / 40

OBEROENDETEST Frihetsgraderna fås på följande sätt: antalet fria kvadratsummor antalet skattade parametrar = (sr 1) [(r 1) + (s 1)] = sr r s + 1 = (r 1)(s 1). OBSERVERA! Även om homogenitetstestet och kontingenstabellen numeriskt och statistiskt är lika, så är det olika test. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 34 / 40

OBEROENDETEST: ETT EXEMPEL A 1 = case, en individ med en viss sjukdom, A 2 = control, en individ utan denna sjukdom. B 1 = har aldrig använt en viss terapi. B 2 = har tidigare använt en viss terapi, B 3 = använder för tillfället terapin med metod 1, B 3 = använder för tillfället terapin med metod 2. Serie Egenskap A 1 A 2 Total B 1 71 208 x 1 = 279 B 2 22 53 x 2 = 75 B 3 32 27 x 3 = 59 B 4 30 93 x 4 = 123 Total x 1 = 155 x 2 = 381 536 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 35 / 40

OBEROENDETEST: ETT EXEMPEL Vi får: p i = (p i ) obs = x i n och (p1 ) obs = x 1 n = 279 536 p j = (p j) obs = x j n. (p2 ) obs = 75 536, (p 3 ) obs = 59 536, (p 4 ) obs = 123 536 p 1 = (p 1) obs = x 1 n = 155 536, (p 2) obs = x 2 n = 381 536, Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 36 / 40

OBEROENDETEST: ETT EXEMPEL De förväntade frekvenserna: blir np i p j np 1 p 1 = 536 279 536 155 536 = 80.68 np 1 p 2 = 536 279 536 381 536 = 198.32 np 2 p 1 = 536 75 536 155 536 = 21.69 np 2 p 2 = 536 75 536 381 536 = 53.31 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 37 / 40

OBEROENDETEST: ETT EXEMPEL De förväntade frekvenserna (forts.) np i p j blir np 3 p 1 = 536 59 536 155 536 = 17.06 np 3 p 2 = 536 59 536 381 536 = 41.94 np 4 p 1 = 536 123 536 155 536 = 35.57 np 4 p 2 = 536 123 536 381 536 = 87.43 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 38 / 40

OBEROENDETEST: ETT EXEMPEL Q = (71 80.68)2 80.68 + (208 198.32)2 198.32 + (22 21.69)2 21.69 + (53 53.32)2 53.32 (32 17.06)2 (27 41.94)2 + + 17.06 41.94 (30 35.57)2 (93 87.43)2 + + 35.37 87.43 = 21.268 Antalet frihetsgrader är (r 1)(s 1) = (2 1)(4 1) = 3 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 39 / 40

OBEROENDETEST: P-VALUE P-värdet >> 1-chi2cdf(21.268,3) ans = 9.2610e-05 Kritiska värdet, signifikansnivå = 0.05 >> chi2inv(0.95,3) ans = 7.8147 Kursens tabellsamling ger χ 0.05 (3) = 7.81. Det gäller alltså 7.81 < Q = 21.268, d.v.s. teststatistikan ligger i det kritiska området. Alltså förkastas nollhypotesen om oberoendet på signifikansnivån 5%. Det finns en kontingens mellan A j :na och B i :na. Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 40 / 40