Repetition och ANOVA. nbib44

Relevanta dokument
ANOVA Mellangruppsdesign

Datorlaboration 2 Konfidensintervall & hypotesprövning

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Variansanalys med SPSS Kimmo Sorjonen ( )

Följande resultat erhålls (enhet: 1000psi):

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

7.5 Experiment with a single factor having more than two levels

Uppgift 1. Deskripitiv statistik. Lön

7.5 Experiment with a single factor having more than two levels

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Metod och teori. Statistik för naturvetare Umeå universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Lösningar till SPSS-övning: Analytisk statistik

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

Multipel Regressionsmodellen

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Samhällsvetenskaplig metod, 7,5 hp

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Innehåll. Normalfördelning och t-test. Vanliga statistiska mått 2/11/2014. Vad är punktskattningar? Figurer somvisarmedelochsd, SE ochki (ellerci)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Statistik för teknologer, 5 poäng Skrivtid:

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Linjär regressionsanalys. Wieland Wermke

Statistisk försöksplanering

Elementa om Variansanalys

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen för kursen Statististik för naturvetare 16 januari

Statistik Lars Valter

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Diskussionsproblem för Statistik för ingenjörer

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

OBS! Vi har nya rutiner.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

Räkneövning 3 Variansanalys

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

ANOVA Faktoriell (tvåvägs)

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Lektion 1: Fördelningar och deskriptiv analys

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Statistik och epidemiologi T5

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Samverkande Expertnät

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Skrivning i ekonometri torsdagen den 8 februari 2007

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

FACIT (korrekta svar i röd fetstil)

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

ÖVNINGSUPPGIFTER KAPITEL 9

TENTAMEN I MATEMATISK STATISTIK

Regressions- och Tidsserieanalys - F4

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Matematisk statistik för B, K, N, BME och Kemister

Del A: Schema för ifyllande av svar nns på sista sidan

Sconesbakning. Sofi Bergdahl Anna Kers Johanna Nyberg Josefin Persson

TENTAMEN I STATISTIK B,

Stressade studenter och extraarbete

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Stockholms universitet Termin 3 HT Anvisningar till Kurs 12, delkurs 1. FORSKNINGSMETODIK OCH VETENSKAPSTEORI, 7,5 hp

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

OBS! Vi har nya rutiner.

Forsknings- och undersökningsmetodik Skrivtid: 4h

Utflyttningsorsaker för Norrköpings kommun 2012

Tentamen MVE300 Sannolikhet, statistik och risk

Statistik 1 för biologer, logopeder och psykologer

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

Matematiska Institutionen Silvelyn Zwanzig 13 mar, 2006

Parade och oparade test

Tentamen i Matematisk statistik Kurskod S0001M

Statistisk försöksplanering

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

OBS! Vi har nya rutiner.

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Juli, Augusti

Tentamenskrivning: TMS145 - Grundkurs i matematisk statistik och bioinformatik,

Transkript:

Repetition och ANOVA nbib44

Repetition: Labb 2 Du har observerat: f(aa)=0.36, f(aa+aa)=0.64 Kan man testa om fenotypfrekvensen är i Hardy Weinberg jämvikt? Nej! Kan man testa om f(aa) är skiljt från någonting förväntat eller från f(aa) från annan population? Ja, med chi2, till och med utan att känna till allelfrekvenser Kan anta HW och uppskatta q = f(a) = f(aa), samt p=1-q och uppskatta f(aa) och f(aa) Vad kan man använda det till? OBS f(aa) 10 8 f(aa+aa) 23 15 EXP el. OBS2

Repetition: Chi2 Chi2 Goodness-of-fit alt homogeneity test Anpassningstest vs oberoendetest Ex.1: Fenotypfrekvens på plats A obs: Met/Met 4st Met/Val 23 st, Val/Val 3 st H0: plats 1 är i HWjämvikt Ex.2: fenotypfrekvens på plats B obs 2: Met/Met 9 st Met/Val 23 st, Val/Val 12 st H0: plats 1 och 2 har samma fenotypfrekvens OBS EXP M/M 4 8 M/V 23 15 V/V 3 7 plats A plats B M/M 4 9 M/V 23 23 V/V 3 12

Repetition: T-test Testar om skillnader föreligger mellan två grupper H0: ingen skillnad i medel... mellan grupp a och b Förutsätter: Oberoende mätpunkter i stickprov Försöksdesign, randomisering Samma varians mellan grupperna t.ex. Levene s test, H0: variansen är samma Normalfördelning Histogram eller test, transformera data Centrala gränsvärdessatsen

DN 2/4-13 >1800 plastfibrer hamnar i havet när man tvättar en fleecetröja Hur kan man mäta det? Hur jämföra med utsläpp från andra plagg?

(A) Global extent of microplastic in sediments from 18 sandy shores and identified as plastic by Fourier transform infrared spectrometry. The size of filled-circles represents number of microplastic particles found. (B) Relationship between populationdensity and number of microplastic particles in sediment from sandy beaches. (C) Number of particles of microplastic in sediments from sewage disposal-sites and reference-sites at two locations in U.K. (D) Number of polystester fibers discharged into wastewater from using washing-machines with blankets, fleeces, and shirts (all polyester). Published in: Mark Anthony Browne; Phillip Crump; Stewart J. Niven; Emma Teuten; Andrew Tonkin; Tamara Galloway; Richard Thom pson; Environ. Sci. Technol. 2011, 45, 9175-9179. DOI: 10.1021/es201811s Copyright 2011 American Chemical Society

Varför ANOVA istället för t-test? Ger nästan alltid samma resultat T-test kan bara testa två grupper i taget H0: 1 = 2 Anova testar skillnad mellan 2 eller fler medel H0: 1 = 2 = 3 =... Anova har utvecklats att klara mycket mer t.ex. fler faktorer, både grupper och kontinuerliga förklarande variabler Har visat sig oerhört robust!

YIELD 3 4 5 6 7 Principen bakom variansanalys Anova jämför skillnad i medel genom att analysera variansen i data H0: medlen är inte olika H0: variansen inom gruppen är lika som mellan grupper Odlingsexperiment: Effekten av 3 gödningsmedel på skördstorlek i ton. Data från 3x10 fält, N=30 Data och idé från Grafen & Hails 2002, Modern Statistics for the Life Sciences 1.0 1.5 2.0 2.5 3.0 Type of fertilizer

YIELD 3 4 5 6 7 YIELD 3 4 5 6 7 YIELD 3 4 5 6 7 Variansanalys (ANOVA) 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Field number SSY Field number Heldragen linje är stormedel för alla värden Kvadratsumman är de streckade linjerna, ett mått på total variation i data; SSY Jämför med formeln för varians 1/(n-1)*sum([y i ÿ] 2 ) 0 5 10 15 20 25 30 Field number

YIELD 3 4 5 6 7 YIELD 3 4 5 6 7 YIELD 3 4 5 6 7 Variansanalys (ANOVA) 0 5 10 15 20 25 30 Field number SSE 0 5 10 15 20 25 30 Field number Beräkna medel för grupperna Nya kvadratsummor för variationen kring gruppmedel, kallas error (sums of squares), SSE SSE är den variation som inte kan förklaras med faktorerna, därför error 0 5 10 15 20 25 30 Field number

YIELD 3 4 5 6 7 YIELD 3 4 5 6 7 Variansanalys (ANOVA) SSF 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Field number Beräkna kvadratsummor för gruppmedlens avvikelse från stormedlet, SSF Därmed har vi delat upp variationen: SSY = SSE + SSF Anova jämför om en signifikant andel av variationen beskrivs av faktorerna Field number Error variation SSE Explained variation SSF SSY

Variansanalys (ANOVA)

one-way anova Demo Excel

Antaganden för Anova Oberoende mätpunkter i stickprov Försöksdesign, randomisering Samma varians (homogena) mellan grupperna t.ex. Levene s test, H0: variansen är samma Normalfördelade residualer Histogram eller test, transformera data Centrala gränsvärdessatsen

Hur presenteras resultatet Fråga: Ger gödningsmedlen olika skörd? H0: ingen skillnad i avkastning mellan de tre olika gödningsmedlen

Resultat: tolka anovatabell Vad är between- och within groups?

SPSS Resultat: testa om varianser är homogena H0: ingen skillnad i varians mellan grupperna

SPSS Resultat: Deskriptiva data Deskriptiv kan vara bra i text (t.ex. svarta ramar) eller för att göra figurer (t.ex. röda ramar)

Hur presenteras resultatet i text Resultat: Vi fann en signifikant skillnad i avkastning mellan åkrar som behandlats med olika gödningsmedel (envägsanova, F(2,27)=5.70, P=0.009). Vid icke signifikant resultat så är stormedlet den bästa skattningen av avkastning Vid signifikanta resultat så finns en skillnad, men inget om mellan vilka grupper Vissa gör post-hoc test (gör inte det utan anledning) Andra nöjer sig med att rapportera medlen (+/-CI) i text eller tabell eller figur

Hur presenteras resultatet i text Resultat: Vi fann en signifikant skillnad i avkastning mellan åkrar som behandlats med olika gödningsmedel (envägsanova, F(2,27)=5.70, P=0.009). Vi fann att medel 1 gav högre avkastning än de andra medlen (medelavkastning i ton/ha (+/-SE) för medel 1 var 5.4 (0.31), medel 2 4.0 (0.31) och medel 3 4.5 (0.31)) alt. Medelavkastning för gödninsmedel 1 (5.4 (+/-0.31 SE)) var högre än för de andra två (gödningsmedel 2: 4.0 (0.31); och 3: 4.9 (0.31)) och det var en signifikant effekt av gödningsmedel (envägsanova, F(2,27)=5.70, P=0.009).

Hur presenteras resultatet i text Resultat: Vi fann en signifikant skillnad i avkastning mellan åkrar som behandlats med olika gödningsmedel (envägsanova, F(2,27)=5.70, P=0.009). Vi fann att medel 1 gav högre avkastning än de andra medlen (tab 1) Tabell 1. Medelavkastning från åkrar behandlade med tre olika typer av gödningsmedel N Medel Standard error medel 1 10 5.4 0.31 medel 2 10 4.0 0.31 medel 3 10 4.5 0.31 Total 30 4.6 0.20

YIELD 3 4 5 6 7 Hur presenteras resultatet i text Resultat: Vi fann en signifikant skillnad i avkastning mellan åkrar som behandlats med olika gödningsmedel (envägsanova, F(2,27)=5.70, P=0.009). Vi fann att medel 1 gav högre avkastning än de andra medlen (fig 1) 1 2 3 Figur 1 Medel och 95% konfidensintervall för avkastning från åkrar behandlade med olika gödningsmedel (1,2 och 3).

Hur presenteras resultatet i text Resultat: Vi fann en signifikant skillnad i avkastning mellan åkrar som behandlats med olika gödningsmedel (tab 1). Vi fann att medel 1 gav högre avkastning än de andra medlen (fig 1) Tabell 1. Anova av avkastning/ha från åkrar behandlade med tre olika typer av gödningsmedel df SS MS F P Gödningsm. 2 10.8 5.4 5.7 0.009 Error 27 25.6 0.9 Total 30 36.4