ANOVA Mellangruppsdesign Envägs variansanlays, mellangruppsdesign Variabler En oberoende variabel ( envägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser. EX Variabel Betingelser Kön : man, kvinna Fakultet : HU, TekFak, Filfak En beroende variabel (gäller alltid, även i tvåvägs variansanalys): Intervall-/kvotskala. Det man mäter hos items (personerna?) och vill jämföra mellan de olika betingelserna. EX Variabel Enhet Tentapoäng Antal rätt Månadslön kr
Envägs variansanlays, mellangruppsdesign Populationer och stickprov Två populationer: Skiljer sig populationernas medelvärden? Dra två stickprov (ett från varje population) Inferens med hjälp av oberoende t-test. Tre (eller fler populationer): Skiljer sig några populationers medelvärden åt? Dra tre stickprov (ett från varje population) Inferens med hjälp av ANOVA (ANalysis Of VAriances), envägs mellangruppsdesign. Exempel Skiljer sig den självskattade förmågan för skidåkning (kvotskala: -, alla antaganden för ANOVA kan antas vara uppfyllda) mellan svenskar, norrmän och danskar? Stickproven kan anses vara representativa för populationerna (hmmm ). Tabell. Självskattad förmåga för skidåkning. Skiljer sig den självskattade förmågan åt mellan dessa populationer? Totala medelvärdet för samtliga resultat beräknas X till X = Hypoteser: H : μ = μ = μ H A : μ i μ j, för några i och j X X
BETWEEN X 5 X X X 5 SS Sum of Squares Jämför alla skillnader mellan varje värde och medelvärdet. Kvadrera varje skillnad ( Squares, för att få bort minustecknen) och summera det som kvadrerats ( Sum of Squares =SS). SS är mått på hur spridda värden är (runt sitt medelvärde). Vad säger oss SS? Om värdena är mycket spridda runt medelvärdet så blir ju skillnaderna mellan varje värde och medelvärdet stora. Likaså får vi ju då stora värden då vi kvadrerar skillnaderna. Och likaså blir ju summan av dessa kvadrater stor. Ju större spridning desto större SS, alltså!
Mellan grupperna (Between): Grupp X k X k X ( X k X ) n k n k ( X k X ) - = 9 4 4 9=6 - = 4 4 4 4=6 6 6- = -4 6 5 5 6=8 ANOVA-tabell SS df MS F Between Within df between = n = = BETWEEN X 5 X X X 5 WITHIN 4
Inomgruppsspridningen Inom grupperna (Within): Grupp X i X (X i X ) 6 9 4 6- = 9- = -4 - = 4-= 9 6 6 Grupp X i X (X i X ) 9 5 - = 9- = - 5- = -=- 9 9 Grupp X i X (X i X ) 8 6 5 4 7 8-6 = 6-6 = 5-6 = - 4-6 = - 7-6 = 4 4 SS Within = 6++ = 56 5
Inom grupperna (Within): ANOVA-tabell SS df MS F Between Within 56 df within = N n = (n ) + (n ) + (n ) = = = (4 ) + (4 ) + (5 ) = = MS Mean Squares (skattningen av variansen) Många observationer Stora SS. Därför brukar man dela SS med antalet observationer nästan. Man delar SS med antalet frihetsgrader. MS = SS/df Vad säger oss MS? I populationen finns en spridning, t ex uttryckt i form av en varians. MS är en skattning av variansen i populationen, dvs. ett bra mått på hur spridda värdena är. 6
MS Mean Squares (skattningen av variansen) Om några av grupperna skiljer sig åt så bör vi få ett stort mått på MS B när vi tittar på spridningen av gruppernas medelvärden runt det totala medelvärdet ( X ) ett litet mått på MS W när vi tittar på spridningen av individernas värden runt sin grupps medelvärde ( X k ). ANOVA-tabell SS df MS F Between 66 Within 56 5,6 F F är ett mått på hur långt ifrån varandra gruppernas medelvärden ligger (MS B ) i förhållande till hur spridda värdena är inom grupperna (MS W ). Stora och små F: Små värden på F gör att vi inte med tillräckligt stor sannolikhet kan säga att gruppernas medelvärden (i populationen, kom ihåg att värdena vi tittar på är ifrån ett stickprov) skiljer sig åt. Stora värden på F, så stora att de passerar något kritiskt F-värde, säger oss att vi med stor sannolikhet kan säga att minst två medelvärden (i populationen) skiljer sig åt. 7
F ANOVA-tabell SS df MS F Between 66 66/5.6=.79 Within 56 5,6 Jämför med kritiska F-värden i tabell!!! Signifikanser och signifikansnivåer α=.5 t obs bortom t cv Ja α=. Nej Icke-signifikant resultat; vi kan inte säga något alls! t obs bortom t cv Ja α=. Nej Signifikant, p <.5 t obs bortom t cv Ja Nej Signifikant, p <. Signifikant, p <. 8
F ANOVA-tabell SS df MS F Between 66 66/5.6=.79 Within 56 5,6 F obs =.79 F cv = 4. då α =.5 F obs ligger bortom F cv Testa med α =. F cv = 7.56 då α =. F obs ligger bortom F cv Testa med α =. F cv = 4.9 då α =.. F obs ligger inte bortom F cv Välj α =.. Slutsats: Vi vet att minst två nationaliteter skattar sin förmåga för skidåkning olika, F(, ) =.79, p <.. Vilka grupper skiljer sig åt? Om man har tre eller flera grupper (vi hade i det här exemplet tre grupper) så kan man ta reda på vilka grupper som skiljer sig åt på två sätt: Jämför konfidensintervall (ger oftast rätt resultat). Om konfidensintervallen inte överlappar skiljer medelvärdena i populationen sig med stor sannolikhet åt. Gör ett post-hoc test. Ger mer precist resultat förutsatt att man väljer ett passande post-hoc test (det finns många att välja på). 9
Visar var skillnaderna finns! Post-Hoc test Tukey/Kramer (TK) Finns många olika varianter som är olika konservativa (ställer höga krav för att visa på att en skillnad är signifikant) eller liberala (ställer låga krav för att visa på att en skillnad är signifikant). Tukey/Kramer: X i X j Q MS n h W k n, h n n n k om alla n i är lika så blir n h = n. k = antalet grupper. Post-Hoc test Tukey/Kramer (TK) Q-tabell: r = (jämför grupper) df = α =.5.88 (kritiskt värde om α=.5) α =. 5.7 (kritiskt värde om α=.) jämförelser med total risk på 5% (α=.5) ger en risk i varje parvis jämförelse på α=.5/=.7.
Post-Hoc test Tukey/Kramer (TK) Vi vill ta reda på Qcv då α =.7 Q-fördelning.5.7. Q.5 Qcv Q. Post-Hoc test Tukey/Kramer (TK) Q-tabell: r = (jämför grupper) df = α =.5.88 (kritiskt värde om α=.5) α =. 5.7 (kritiskt värde om α=.) jämförelser med total risk på 5% (α=.5) ger en risk i varje parvis jämförelse på α=.5/=.7.
Post-Hoc test Tukey/Kramer (TK) X i X j Svenskar Norrmän Danskar Svenskar - Norrmän - Danskar 7 6 - Q Svenskar Norrmän Danskar Svenskar - Norrmän.88 - Danskar 6.4* 5.6* - * Signifikant jämfört med Q CV = 5. Alltså, danskar skiljer sig både från norrmän och från svenskar, men däremot kan vi inte säga om svenskar skiljer sig från norrmän. Slutsats: Det finns skillnader i självskattad förmåga för skidåkning mellan svenskar, norrmän och danskar, F(, ) =.79, p <.. Danskar skattar sin förmåga lägre än både svenskar och norrmän (enligt Tukey-Kramer post hoc test).
ANOVA mellangruppsdesign SPSS-output Medelvärdena ger en uppfattning om potentiella skillnader! Eftersom sig-värdet är mindre än. (men inte mindre än.) så är det signifikanta skillnader, p <.. ANOVA mellangruppsdesign SPSS-output Nation Dependent Variable:Skill_of_skiing Nation Mean Std. Error 95% Confidence Interval Lower Bound Upper Bound Swedish,,8,64 5,66 Norwegian,,8 9,64 4,66 Danish 6,,58,64 8,58 och post-hoc testen Tukey B. Danskar hamnar i en egen kolumn och skiljer sig därför signifikant från både norrmän och svenskar. Eftersom svenskar och norrmän hamnar i samma kolumn skiljer de sig inte signifikant åt. Konfidensintervallen Tukey B a,b,c Nation Skill_of_skiing N Subset Danish 5 6, Norwegian 4, Swedish 4, Means for groups in homogeneous subsets are displayed. Based on observed means. The error term is Mean Square(Error) = 5,6. a. Uses Harmonic Mean Sample Size = 4,86. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. c. Alpha =,5.