ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

Relevanta dokument
χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G60 Statistiska metoder

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Kapitel 10 Hypotesprövning

FÖRELÄSNING 8:

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Försöks- planering, forts. Per Milberg, IFM biologi

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Konfidensintervall, Hypotestest

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Datorlaboration 2 Konfidensintervall & hypotesprövning

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Lösningar till tentamen i Matematisk Statistik, 5p

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Jämförelse av två populationer

FACIT (korrekta svar i röd fetstil)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Uppgift 1. Produktmomentkorrelationskoefficienten

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

MVE051/MSG Föreläsning 7

SF1901 Sannolikhetsteori och statistik I

Hur skriver man statistikavsnittet i en ansökan?

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder

F3 Introduktion Stickprov

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Repetition och ANOVA. nbib44

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 7: Punktskattningar

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistik 1 för biologer, logopeder och psykologer

2. Test av hypotes rörande medianen i en population.

8 Inferens om väntevärdet (och variansen) av en fördelning

Hur man tolkar statistiska resultat

Föreläsning 7: Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Matematisk statistik för B, K, N, BME och Kemister

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Jag läser kursen på. Halvfart Helfart

Gamla tentor (forts) ( x. x ) ) 2 x1

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematisk statistik för B, K, N, BME och Kemister

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Lösningar till SPSS-övning: Analytisk statistik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

HYPOTESPRÖVNING sysselsättning

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

TAMS65 - Föreläsning 6 Hypotesprövning

MVE051/MSG Föreläsning 14

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Laboration 4: Hypotesprövning och styrkefunktion

TMS136. Föreläsning 13

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Tentamen i Matematisk statistik Kurskod S0001M

TAMS65 - Föreläsning 6 Hypotesprövning

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

Föreläsning 11: Mer om jämförelser och inferens

Statistik Lars Valter

TAMS65 - Föreläsning 12 Test av fördelning

F22, Icke-parametriska metoder.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Avd. Matematisk statistik

Avd. Matematisk statistik

Transkript:

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 ) NBIB44 Lars Westerberg INNEHÅLLSFÖRTECKNING Introducera en metod att statistiskt testa: avvikelser från förväntat, eller samband mellan parametrar När används den? Vilka hypoteser kan besvaras? Hur ska data se ut? Vilka svar kan den ge? Hur ska svaren tolkas och presenteras? Demo Börjar mer generellt 1

NÄR BEHÖVS STATISTIK? Ekologi är komplext statistik behövs Statistik håller koll på osäkerheten och hjälper oss att dra kloka och säkra slutsatser från data För att förstå hur kunskap blir till: Observation tolkning/hypotes prediktion (- test) Hypotesprövning, försöksplanering och statistik Undvika hypoteser som är: Omöjliga frågor där svar ej finns Orealistiska frågor där svar finns men är ej åtkomligt Oprecisa frågor som först måste preciseras ÄR STATISTIK SVÅRT? En del tycker att statistik är svårt Egentligen väldigt lätt att tillämpa trots svår matematik bakom Acceptera vissa saker nu som kan komma förstås senare Bra design lätt statistik; ostrukturerad design mer komplicerad 2

HUR LÄR MAN SIG? Skapa kunskapen själv Olika lärstilar: Visuellt Auditivt Kinestetiskt Taktilt Laborationer, seminarier, grupparbete OK OK Kursböcker, föreläsningar, egenstudier OK? OK? ALTERNATIVT MATERIAL FÖR ATT SKAPA KUNSKAP http://en.wikipedia.org/wiki/pearson%27s_chisquared_test http://www.youtube.com/watch?v=2qedrsxsf9m http://www.youtube.com/watch?v=dnj_xxtix7e http://www.youtube.com/watch?v=wxpbofdqnvk http://mathworld.wolfram.com/chi-squaredtest.html http://www2.math.uu.se/~uwe/statistik_och_biologi_vt 2009/ http://udel.edu/~mcdonald/statchigof.html 3

NÄR BEHÖVS STATISTIK? 1. Hur många mögliga jordgubbar finns det i skålen? 2. Hur många mögliga jordgubbar finns i genomsnitt i en kartong? 3. Hur många mögliga jordgubbar finns i affären? Nja: en siffra ex. 6 st. eller 6 av 57 Ja: kan t.ex. anta att skålen är ett representativt stickprov (N=57) 6/57 Ja: kan t.ex. multiplicera 2. med antal kartonger i affären NÄR BEHÖVS STATISTIK? 1. Hur många elever i klassen klarar standardprovet? 2. Hur många av Sveriges elever klarar standardprovet? 3. Klarar dyslektiker provet sämre? Nja: en siffra bara, 25 av 27 Nja: bara en siffra, 12650 av 12903 Ja: undersök antalet dyslektiker i en delmängd och testa om dyslektiker klarar provet sämre 4

TESTA OBSERVERAT = FÖRVÄNTAT Observation: Fågelbon sitter ofta på södra sidan av trädstammen Tolkning/hypotes: Fåglar föredrar att bygga på södra sidan Nollhypotes (H0): Fåglar väljer att bygga på slumpmässig sida av trädstammen Prediktion: andelen fågelbon på södra stamsidan är högre P0: alla sidor lika vanliga TESTA OBSERVERAT = FÖRVÄNTAT Totalinventerar ett skogsparti på fågelbon Vi finner 200 st Registrerar bl.a. sida på stam Metod: Ett chi2-test användes för att testa nollhypotesen att fåglar inte väljer vilken sida att bygga bo på. Obs Exp(%) Exp freq (O-E) 2 /E N 46 25% 50 0.32 Ö 42 25% 50 1.28 S 60 25% 50 2 V 52 25% 50 0.08 200 100% 200 Cih2: 3.68 Df(4-1): 3 P: 0.121 Resultat: Chi2-testet var inte signifikant och fåglar verkar välja stamsida oberoende av kompassriktning (X2=3.68, df=3, P=0.12) 5

BEGREPP OCH ANTAGANDEN Nollhypotes: formuleras som motsatsen till hypotesen H0: Ingen skillnad mellan eller ingen effekt av Bara ett redskap Stickprov eller replikat N st. oberoende replikat (observationer) Representativt för populationer du vill uttala dig för (åtminstone begränsa extrapolation) Hela populationen Sant antal på varje stamsida Stickprov antal obs. = N BEGREPP OCH ANTAGANDEN Frihetsgrader Oftast N-1 (4-1=3) Antal värden som är fria N beror på det statistiska testet: vad betraktas som ett replikat? (O-E)2/E Obs Exp freq N 46 50 0.32 0.32 0 Ö 42 50 1.28 1.28 0 S 60 50 2 2 3 V 52 50 0.08?? 200 200 P-värde Sannolikheten för data om nollhypotesen är sann: P(data H0) Signifikant om P<0.05 (95%, 1/20); olika nivåer Chi2: 3.68 3.68 3.68 6

TESTA SAMBAND MELLAN PARAMETERAR Observation: Två arter av muräna hittas på olika ställen* Tolkning/hypotes: Muränearterna har olika habitatpreferens Nollhypotes: De har samma habitatpreferens *Young and Winn (2003) Prediktion: Olika arter förekommer oftare på områden med olika bottensubstrat P0: Båda förekommer lika ofta på de olika bottensubstraten TESTA SAMBAND MELLAN PARAMETRAR Ingen på förhand bestämd fördelning Två variabler: muräna-art och bottensubstrat Låtsas att en variabel inte finns (t.ex. art) Beräkna andel av observationer på de olika bottnarna Multiplicera med totalt antal obs för den arten Botten Art1 G. moringa Art2 G. vicinus Botten1; Gräs, obs obs a 127 b (c1*r1/s) (?) (c2*r1/s) Botten2; obs c d Sand, obs (c1*r2/s) 99 (c2*r2/s) Botten3; obs e (?) f (c1*r3/s) (c2*r3/s) Gräns, obs 264 c1=a+c+e(?) c2=b+d+f 116 r1=a+b (?) r2=c+d 67 (?) r3=e+f S=a+b+c+ 161 d+e+f (?) 7

TESTA SAMBAND MELLAN PARAMETRAR Ingen på förhand bestämd fördelning Två variabler: muräna-art och bottensubstrat Låtsas att en variabel inte finns (t.ex. art) Beräkna andel av observationer på de olika bottnarna Multiplicera med totalt antal obs för den arten Metod: Ett chi2-test användes för att testa nollhypotesen att muränearterna har samma habitat-preferens. Botten G. moringa G. vicinus Gräs, obs Sand, obs Gräns, obs 127 (142.8) 99 (97.5) 264 (249.7) Chi2=6.26; Df=(r-1)(c-1)=2 116 (100.2) 67 (68.5) 161 (175.3) Resultat: Chi2-testet var signifikant och G.vicinius verkar föredra gräsbotten medan G. moringa hittas i gränshabitatet mellan sand och gräs (tab. 1; chi2=6.26, df=2, P=0.044) OLIKA TYPER AV CHI2 TEST Goodness-of-fit (Anpassningstest) Passar observationerna till en på förhand känd fördelning? Test of association, Independence/homogeneity test (Oberoendetest) Är det någon skillnad mellan två observerade populationer? (Homogeneity) Är det någon samband mellan två variabler som båda mäts för varje observation? (Independence) Contingency table 8