ANOVA Mellangruppsdesign

Relevanta dokument
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

ANOVA Faktoriell (tvåvägs)

7.5 Experiment with a single factor having more than two levels

Följande resultat erhålls (enhet: 1000psi):

7.5 Experiment with a single factor having more than two levels

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Samhällsvetenskaplig metod, 7,5 hp

OBS! Vi har nya rutiner.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Statistisk försöksplanering

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Räkneövning 3 Variansanalys

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Hypotestestning och repetition

Statistisk försöksplanering

Elementa om Variansanalys

TENTAMEN SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307 Forskningsmetodik och statistik 10 hp. Tisdag den 18 augusti, 2009

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Uppgift 1. Produktmomentkorrelationskoefficienten

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

OBS! Vi har nya rutiner.

TENTAMEN SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307 Forskningsmetodik och statistik 10 hp. Fredag den 24 april, 2009

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!

Examinationsuppgifter del 2

Statistik för teknologer, 5 poäng Skrivtid:

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

Variansanalys med SPSS Kimmo Sorjonen ( )

Inferensstatistik. Hypostesprövning - Signifikanstest

Metod och teori. Statistik för naturvetare Umeå universitet

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Repetition och ANOVA. nbib44

Multipel Regressionsmodellen

Lösningar till SPSS-övning: Analytisk statistik

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

OBS! Vi har nya rutiner.

Parade och oparade test

Tentamensresultat anslås (anslagstavla och kursportal) senast 3 veckor efter tentamen.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Tentamen MVE301 Sannolikhet, statistik och risk

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

SOPA62 - Kunskapsproduktion i socialt arbete

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen MVE301 Sannolikhet, statistik och risk

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

OBS! Vi har nya rutiner.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen i matematisk statistik

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Fuktighet i jordmåner. Variansanalys (Anova) En statistisk fråga. Grafisk sammanfattning: boxplots

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen i matematisk statistik

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F4

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

, s a. , s b. personer från Alingsås och n b

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Kvantitativa metoder. 1. Kort repetition. Forskarutbildningen, PF, ÅA. Skaltyper

Regressions- och Tidsserieanalys - F1

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Uppgift a b c d e f (vet ej) Poäng

Föreläsning 11: Mer om jämförelser och inferens

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

8.1 General factorial experiments

TENTAMEN I MATEMATISK STATISTIK

Tentamen MVE302 Sannolikhet och statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Transkript:

ANOVA Mellangruppsdesign Envägs variansanlays, mellangruppsdesign Variabler En oberoende variabel ( envägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser. EX Variabel Betingelser Kön : man, kvinna Fakultet : HU, TekFak, Filfak En beroende variabel (gäller alltid, även i tvåvägs variansanalys): Intervall-/kvotskala. Det man mäter hos items (personerna?) och vill jämföra mellan de olika betingelserna. EX Variabel Enhet Tentapoäng Antal rätt Månadslön kr

Envägs variansanlays, mellangruppsdesign Populationer och stickprov Två populationer: Skiljer sig populationernas medelvärden? Dra två stickprov (ett från varje population) Inferens med hjälp av oberoende t-test. Tre (eller fler populationer): Skiljer sig några populationers medelvärden åt? Dra tre stickprov (ett från varje population) Inferens med hjälp av ANOVA (ANalysis Of VAriances), envägs mellangruppsdesign. Exempel Skiljer sig den självskattade förmågan för skidåkning (kvotskala: -, alla antaganden för ANOVA kan antas vara uppfyllda) mellan svenskar, norrmän och danskar? Stickproven kan anses vara representativa för populationerna (hmmm ). Tabell. Självskattad förmåga för skidåkning. Skiljer sig den självskattade förmågan åt mellan dessa populationer? Totala medelvärdet för samtliga resultat beräknas X till X = Hypoteser: H : μ = μ = μ H A : μ i μ j, för några i och j X X

BETWEEN X 5 X X X 5 SS Sum of Squares Jämför alla skillnader mellan varje värde och medelvärdet. Kvadrera varje skillnad ( Squares, för att få bort minustecknen) och summera det som kvadrerats ( Sum of Squares =SS). SS är mått på hur spridda värden är (runt sitt medelvärde). Vad säger oss SS? Om värdena är mycket spridda runt medelvärdet så blir ju skillnaderna mellan varje värde och medelvärdet stora. Likaså får vi ju då stora värden då vi kvadrerar skillnaderna. Och likaså blir ju summan av dessa kvadrater stor. Ju större spridning desto större SS, alltså!

Mellan grupperna (Between): Grupp X k X k X ( X k X ) n k n k ( X k X ) - = 9 4 4 9=6 - = 4 4 4 4=6 6 6- = -4 6 5 5 6=8 ANOVA-tabell SS df MS F Between Within df between = n = = BETWEEN X 5 X X X 5 WITHIN 4

Inomgruppsspridningen Inom grupperna (Within): Grupp X i X (X i X ) 6 9 4 6- = 9- = -4 - = 4-= 9 6 6 Grupp X i X (X i X ) 9 5 - = 9- = - 5- = -=- 9 9 Grupp X i X (X i X ) 8 6 5 4 7 8-6 = 6-6 = 5-6 = - 4-6 = - 7-6 = 4 4 SS Within = 6++ = 56 5

Inom grupperna (Within): ANOVA-tabell SS df MS F Between Within 56 df within = N n = (n ) + (n ) + (n ) = = = (4 ) + (4 ) + (5 ) = = MS Mean Squares (skattningen av variansen) Många observationer Stora SS. Därför brukar man dela SS med antalet observationer nästan. Man delar SS med antalet frihetsgrader. MS = SS/df Vad säger oss MS? I populationen finns en spridning, t ex uttryckt i form av en varians. MS är en skattning av variansen i populationen, dvs. ett bra mått på hur spridda värdena är. 6

MS Mean Squares (skattningen av variansen) Om några av grupperna skiljer sig åt så bör vi få ett stort mått på MS B när vi tittar på spridningen av gruppernas medelvärden runt det totala medelvärdet ( X ) ett litet mått på MS W när vi tittar på spridningen av individernas värden runt sin grupps medelvärde ( X k ). ANOVA-tabell SS df MS F Between 66 Within 56 5,6 F F är ett mått på hur långt ifrån varandra gruppernas medelvärden ligger (MS B ) i förhållande till hur spridda värdena är inom grupperna (MS W ). Stora och små F: Små värden på F gör att vi inte med tillräckligt stor sannolikhet kan säga att gruppernas medelvärden (i populationen, kom ihåg att värdena vi tittar på är ifrån ett stickprov) skiljer sig åt. Stora värden på F, så stora att de passerar något kritiskt F-värde, säger oss att vi med stor sannolikhet kan säga att minst två medelvärden (i populationen) skiljer sig åt. 7

F ANOVA-tabell SS df MS F Between 66 66/5.6=.79 Within 56 5,6 Jämför med kritiska F-värden i tabell!!! Signifikanser och signifikansnivåer α=.5 t obs bortom t cv Ja α=. Nej Icke-signifikant resultat; vi kan inte säga något alls! t obs bortom t cv Ja α=. Nej Signifikant, p <.5 t obs bortom t cv Ja Nej Signifikant, p <. Signifikant, p <. 8

F ANOVA-tabell SS df MS F Between 66 66/5.6=.79 Within 56 5,6 F obs =.79 F cv = 4. då α =.5 F obs ligger bortom F cv Testa med α =. F cv = 7.56 då α =. F obs ligger bortom F cv Testa med α =. F cv = 4.9 då α =.. F obs ligger inte bortom F cv Välj α =.. Slutsats: Vi vet att minst två nationaliteter skattar sin förmåga för skidåkning olika, F(, ) =.79, p <.. Vilka grupper skiljer sig åt? Om man har tre eller flera grupper (vi hade i det här exemplet tre grupper) så kan man ta reda på vilka grupper som skiljer sig åt på två sätt: Jämför konfidensintervall (ger oftast rätt resultat). Om konfidensintervallen inte överlappar skiljer medelvärdena i populationen sig med stor sannolikhet åt. Gör ett post-hoc test. Ger mer precist resultat förutsatt att man väljer ett passande post-hoc test (det finns många att välja på). 9

Visar var skillnaderna finns! Post-Hoc test Tukey/Kramer (TK) Finns många olika varianter som är olika konservativa (ställer höga krav för att visa på att en skillnad är signifikant) eller liberala (ställer låga krav för att visa på att en skillnad är signifikant). Tukey/Kramer: X i X j Q MS n h W k n, h n n n k om alla n i är lika så blir n h = n. k = antalet grupper. Post-Hoc test Tukey/Kramer (TK) Q-tabell: r = (jämför grupper) df = α =.5.88 (kritiskt värde om α=.5) α =. 5.7 (kritiskt värde om α=.) jämförelser med total risk på 5% (α=.5) ger en risk i varje parvis jämförelse på α=.5/=.7.

Post-Hoc test Tukey/Kramer (TK) Vi vill ta reda på Qcv då α =.7 Q-fördelning.5.7. Q.5 Qcv Q. Post-Hoc test Tukey/Kramer (TK) Q-tabell: r = (jämför grupper) df = α =.5.88 (kritiskt värde om α=.5) α =. 5.7 (kritiskt värde om α=.) jämförelser med total risk på 5% (α=.5) ger en risk i varje parvis jämförelse på α=.5/=.7.

Post-Hoc test Tukey/Kramer (TK) X i X j Svenskar Norrmän Danskar Svenskar - Norrmän - Danskar 7 6 - Q Svenskar Norrmän Danskar Svenskar - Norrmän.88 - Danskar 6.4* 5.6* - * Signifikant jämfört med Q CV = 5. Alltså, danskar skiljer sig både från norrmän och från svenskar, men däremot kan vi inte säga om svenskar skiljer sig från norrmän. Slutsats: Det finns skillnader i självskattad förmåga för skidåkning mellan svenskar, norrmän och danskar, F(, ) =.79, p <.. Danskar skattar sin förmåga lägre än både svenskar och norrmän (enligt Tukey-Kramer post hoc test).

ANOVA mellangruppsdesign SPSS-output Medelvärdena ger en uppfattning om potentiella skillnader! Eftersom sig-värdet är mindre än. (men inte mindre än.) så är det signifikanta skillnader, p <.. ANOVA mellangruppsdesign SPSS-output Nation Dependent Variable:Skill_of_skiing Nation Mean Std. Error 95% Confidence Interval Lower Bound Upper Bound Swedish,,8,64 5,66 Norwegian,,8 9,64 4,66 Danish 6,,58,64 8,58 och post-hoc testen Tukey B. Danskar hamnar i en egen kolumn och skiljer sig därför signifikant från både norrmän och svenskar. Eftersom svenskar och norrmän hamnar i samma kolumn skiljer de sig inte signifikant åt. Konfidensintervallen Tukey B a,b,c Nation Skill_of_skiing N Subset Danish 5 6, Norwegian 4, Swedish 4, Means for groups in homogeneous subsets are displayed. Based on observed means. The error term is Mean Square(Error) = 5,6. a. Uses Harmonic Mean Sample Size = 4,86. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. c. Alpha =,5.