ANOVA Faktoriell (tvåvägs)



Relevanta dokument
ANOVA Mellangruppsdesign

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Multipel Regressionsmodellen

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Höftledsdysplasi hos dansk-svensk gårdshund

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Regressions- och Tidsserieanalys - F4

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Regressions- och Tidsserieanalys - F3

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Statistisk försöksplanering

10.1 Enkel linjär regression

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Metod och teori. Statistik för naturvetare Umeå universitet

Statistisk försöksplanering

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Linjär regressionsanalys. Wieland Wermke

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

InStat Exempel 4 Korrelation och Regression

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Inferensstatistik. Hypostesprövning - Signifikanstest

Regressions- och Tidsserieanalys - F1

Föreläsning G60 Statistiska metoder

Regressions- och Tidsserieanalys - F1

Medicinsk statistik II

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Hypotestestning och repetition

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Att välja statistisk metod

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

FACIT!!! (bara facit,

Regressions- och Tidsserieanalys - F3

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Regressionsanalys Enkel regressionsanalys Regressionslinjen

Medicinsk statistik II

Föreläsning 12: Regression

Föreläsning 12: Linjär regression

MVE051/MSG Föreläsning 14

F11. Kvantitativa prognostekniker

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Skrivning i ekonometri torsdagen den 8 februari 2007

7.5 Experiment with a single factor having more than two levels

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

F19, (Multipel linjär regression forts) och F20, Chi-två test.

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Regressionsanalys Enkel regressionsanalys Regressionslinjen

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

OBS! Vi har nya rutiner.

7.5 Experiment with a single factor having more than two levels

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Examinationsuppgifter del 2

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Föreläsning 11: Mer om jämförelser och inferens

Grundläggande matematisk statistik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

För Godkänt krävs minst 12 poäng i kvalitativ metodik och minst 12 poäng i statistiska metoder. Tentamen består av totalt 11 huvudfrågor.

Regressions- och Tidsserieanalys - F3

Sänkningen av parasitnivåerna i blodet

Elementa om Variansanalys

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

Statistik 1 för biologer, logopeder och psykologer

TENTAMEN I MATEMATISK STATISTIK

Kritisk granskning av forskning

OBS! Vi har nya rutiner.

Föreläsning 15: Faktorförsök

Samhällsvetenskaplig metod, 7,5 hp

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Transkript:

ANOVA Faktoriell (tvåvägs) Faktoriell ANOVA (tvåvägs) Två oberoende variabel ( tvåvägs ): Nominalskala eller ordinalskala. Delar in det man undersöker (personerna?) i grupper/kategorier, dvs. betingelser. EX Variabel Betingelser Kön 2: man, kvinna Fakultet 3: HU, TekFak, Filfak En beroende variabel (gäller alltid, även i tvåvägs variansanalys): Intervall-/kvotskala. Det man mäter hos items (personerna?) och vill jämföra mellan de olika betingelserna. EX Variabel Enhet Tentapoäng Antal rätt Månadslön kr 1

Faktoriell ANOVA (tvåvägs) Exempel En konsultfirma har specialiserat sig på att hjälpa medelstora företag inom svenska ITsektorn att bli mer produktiva genom att göra insatser för trivseln på företagen. För att testa om metoden är effektiv mäter man trivseln på en avdelning på ett medelstort ITföretag före, direkt efter och ett år efter konsulternas trivselinterventioner. Man mäter också trivseln på en annan avdelning under samma tid för att använda som kontrollgrupp. Företaget och dess avdelningar anses vara en god representant för (populationen av) svenska medelstora IT-företag. Alla mätningar görs på kvotskalenivå och alla antaganden för ANOVA anses vara uppfyllda. Frågeställning(ar): Finns det skillnader i trivsel på medelstora svenska IT-företag (1) mellan de olika tidpunkterna (2) mellan avdelningar som får eller inte får ta del av trivselinterventionen (3) eller mellan kombinationer av tidpunkter och avdelningar? Faktoriell ANOVA (tvåvägs) Flödesschema Det här flödesschemat är generellt för alla faktoriella designer, även om det här är beskrivet som en split-plot. Olikheterna mellan olika ANOVA designer blir när man testar enkla effekterna eller gör ett post-hoc test. Annars är det samma flöde för samtliga 2-vägs ANOVAs. Två oberoende variabler ger två huvudeffekter (A och B) och en interaktionseffekt (A*B): A: Mellangruppsvariabel, 2 betingelser T ex Avdelning B: Inomgruppsvariabel, 3 betingelser T ex Mättillfälle A*B: Interaktionseffekt, innehållande 2 + 3 = 5 enkla effekter T ex Kombinationer av Avdelning och Mättillfälle Variabel A Variabel B Betingelser B1 B2 B3 A1 A2 2

Faktoriell ANOVA (tvåvägs) Flödesschema Huvudeffekter Huvudeffekt 1 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Huvudeffekt 2 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Faktoriell ANOVA (tvåvägs) Flödesschema Huvudeffekter Huvudeffekt 1 Mättillfälle Betingelser Före Efter Långt efter Psykologi Avdelning Teknik Huvudeffekt 2 Mättillfälle Betingelser Före Efter Långt efter Psykologi Avdelning Teknik 3

Enkel effekt 1 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Enkel effekt 3 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Faktoriell ANOVA (tvåvägs) Flödesschema Interaktioneffektens delar Enkel effekt 2 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Enkel effekt 4 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Enkel effekt 5 Variabel B Betingelser B1 B2 B3 A1 Variabel A A2 Enkel effekt 1 Mättillfälle Långt Betingelser Före Efter efter Psykologi Avdelning Teknik Enkel effekt 3 Mättillfälle Långt Betingelser Före Efter efter Psykologi Avdelning Teknik Faktoriell ANOVA (tvåvägs) Flödesschema Interaktioneffektens delar Enkel effekt 2 Mättillfälle Långt Betingelser Före Efter efter Psykologi Avdelning Teknik Enkel effekt 4 Mättillfälle Långt Betingelser Före Efter efter Psykologi Avdelning Teknik Enkel effekt 5 Mättillfälle Långt Betingelser Före Efter efter Psykologi Avdelning Teknik 4

Faktoriell ANOVA (tvåvägs) Steg 1 Huvudeffekter och Interaktionseffekt Flödesschema H1: A H2: B I: A*B Sig. 1 Lås A (två sätt) Variera B (över tre betingelser) Lås B (tre sätt) Variera A (över två betingelser) Ej sig. Sig. Steg 2 Enkla effekter (5 st) E1: (A1)B E2: (A2)B Sig. Ej sig. 2 E3: (B1)A E4: (B2)A E5: (B3)A Ej sig. Ej sig. Sig. 3 1 H1: A Steg 3 Var ligger skillnaderna? Post-hoc om det behövs 2 grupper Vi vet vilka som skiljer sig åt 2 E1: (A1)B 3 grupper Post-Hoc Vi vet vilka som skiljer sig åt Klar 3 E5: (B3)A 2 grupper Vi vet vilka som skiljer sig åt Faktoriell ANOVA (tvåvägs) Steg 1 Huvudeffekter och Interaktionseffekt Flödesschema H1: Avdelning H2: Mättillfälle I: Avdelning*Mättillfälle Lås A (två sätt) Variera B (över tre betingelser) Sig. 1 E1: (Psykologi)Mättillfälle E2: (Teknik)Mättillfälle Sig. Ej sig. Steg 2 Enkla effekter (5 st) Sig. Ej sig. Lås B (tre sätt) Variera A (över två betingelser) 2 E3: (Före)Avdelning E4: (Efter)Avdelning E5: (Långt efter)avdelning Ej sig. Ej sig. Sig. 3 1 Steg 3 Var ligger skillnaderna? Post-hoc om det behövs H1: Avdelning 2 grupper Vi vet vilka som skiljer sig åt 2 E1: (Psykologi)Mättillfälle 3 grupper Post-Hoc Vi vet vilka som skiljer sig åt Klar 3 E5: (Långt efter)avdelning 2 grupper Vi vet vilka som skiljer sig åt 5

Faktoriell ANOVA (tvåvägs) 2-vägs ANOVA split-plot I en split-plot faktoriell design (mixed design) med två oberoende variabler är en av mellangruppstyp A och en av inomgruppstyp B. Till exempel: A kan vara variabeln kön med betingelserna kvinna och man B kan vara variabeln tidpunkt med betingelserna före, efter och långt efter behandling. Om vi har en signifikant interaktion behöver den analyseras mer i detalj genom test av enkla effekter (simple main effects). En enkel effekt är när man håller en oberoende variabel konstant (väljer en betingelse på den variabeln) och varierar den andra oberoende variabeln för att testa effekten på den beroende variabeln. Till exempel medelvärdesskillnader över olika tidpunkter då man studerar enbart kvinnor medelvärdesskilllnader mellan kvinnor och män före behandling. Faktoriell ANOVA (tvåvägs) 2-vägs ANOVA split-plot För att testa en enkel effekt behövs två saker: 1. MS Effect : Effekten av det man varierar. Fås genom en 1-vägs ANOVA 2. MS Error : Den varians man inte kan förklara, fås med feltermerna i 2-vägs ANOVAn. Enkla effekter när mellangruppsvariabeln (A) hålls konstant: F = MS Effect MS Error = MS Effect for B at constant A MS Error for B at original ANOVA Enkla effekter när inomgruppsvariabeln (B) hålls konstant: MS Effect for A at constant B F = MS Effect = MS Error SS Error for AxB + SS Error for A at original ANOVA df Error for AxB + df Error for A at original ANOVA 6

Faktoriell ANOVA (tvåvägs) 2-vägs ANOVA mellan och inom 2-vägs ANOVA mellangruppsdesign Om designen består av två mellangruppsvariabler, använd denna ekvation för alla enkla effekter. F = MS Effect MS Error = MS Effect for B at constant A MS Error for B at original ANOVA 2-vägs ANOVA inomgruppsdesign Om designen består av två inomgruppsvariabler, använd denna ekvation för alla enkla effekter MS Effect for A at constant B F = MS Effect = MS Error SS Error for AxB + SS Error for A at original ANOVA df Error for AxB + df Error for A at original ANOVA Frihetsgrader Frihetsgraderna är de som hör till respektive MS. Post-hoc test Om post-hoc test behövs, använd feltermen (MS Error ) för den aktuella enkla effekten. Faktoriell ANOVA (tvåvägs) För varje enkel effekt man undersöker behöver man alltså göra två saker: 1. Kör en 1-vägs ANOVA för att hitta MS Effect. 2. Hitta MS Error med hjälp av feltermerna i 2-vägs ANOVAn. Använd sedan MS Error vid eventuell beräkning av post-hoc test. 7

Exempel En hunduppfödare har i ett experiment mätt lydnaden hos tikar och hanhundar av raserna labrador, pitbull och tax. 0 motsvarar ingen lydnad och 80 maximal lydnad. Mätningarna är på intevall-/kvotskalenivå. Finns det skillnader I lydnad mellan raserna, könen, eller mellan kominationer av dem? Exempel SPSS Två oberoende variabler av mellangruppstyp (kön och ras). Kör en 2-vägs ANOVA med två mellangruppsvariabler. 8

Exempel resultatöversikt Exempel Huvudeffekter och interaktionseffekt Det finns inga signifikanta skillnader i lydnad mellan raserna, F(2, 76) = 2.86, p =.06. Det finns signifikanta skillnader mellan tikar och hanar, F(1, 76) = 6.03, p =.02, partial η 2 =.07. Det finns också en signifikant interaktion mellan ras och kön, F(2, 76) = 13.99, p <.001, partial η 2 =.27. 9

Exempel Enkel effekt 1 MS Effect = 510.544 df Effect = 2 Exempel Enkel effekt 2 MS Effect = 88.839 df Effect = 2 10

Exempel Enkel effekt 3 MS Effect = 4.446 df Effect = 1 Exempel Enkel effekt 4 MS Effect = 31.056 df Effect = 1 11

Exempel Enkel effekt 5 MS Effect = 1356.769 df Effect = 1 Exempel Felterm F = MS Effect MS Error = MS Effect for B at constant A MS Error for B at original ANOVA Båda oberoende variablerna har samma felterm i en mellangruppsdesign. MS Error = 37.408 df Error = 76 12

Exempel Test av enkla effekter Enkla effekter df Effect df Error MS Effect MS Error F p r Variera över Betingelse Ras Tik 2 76 510.544 37.408 13.65 <.001.39 Hane 2 76 88.839 37.408 2.37.10 Kön Labrador 1 76 4.446 37.408 0.12.73 Pitbull 1 76 31.056 37.408 0.83.36 Tax 1 76 1356.769 37.408 36.27 <.001.57 Test av enkla effekter visar på signifikanta skillnader mellan raserna för tikar, F(2, 76) = 13.65, p <.001, r =.39, men även skillnad mellan hantaxar och tiktaxar, F(1, 76) = 36.27, p <.001, r =.57. Exempel Beskrivning av signifikanta resultat Huvudeffekt Kön: Två betingelser Jämför medelvärden från 2-vägs ANOVAn. Tikar är mer lydiga än hanhundar! 13

Exempel Beskrivning av signifikanta resultat Enkel effekt Ras, för tikar: Tre betingelser Variant 1: 95% CI Tax-tikar har högre lydnad än både labrador- och pitbull-tikar. Exempel Beskrivning av signifikanta resultat Enkel effekt Ras, för tikar: Tre betingelser Variant 2: Räkna post-hoc Tukey/Kramer: 3 n h = 1 15 + 1 14 + 1 = 13.55 12 Q cv = 3.39 då α =.05 (r = 3 och df = 76) Q cv = 4.25 då α =.01 Q cv = 3.39 + 0.05 0.017 4.25 3.39 = 4.11 då α =.017. 0.05 0.01 14

Exempel Beskrivning av signifikanta resultat Jämförelse X i X j MS Error n h Q obs = Labrador vs. Pitbull 49.93 48.28 = 1.65 37.408 13.55 0.99 Labrador vs. Tax 60.00 49.94 = 10.07 37.408 13.55 6.06* Pitbull vs. Tax 60.00 48.29 = 11.71 37.408 13.55 7.05* X i X j MS Error n h Hos tikarna är taxarna mer lydiga än både labradorer och pitbulls. Exempel Beskrivning av signifikanta resultat Enkel effekt Kön för taxar: Två betingelser Jämför medelvärden från 2-vägs ANOVAn. Tiktaxar är mer lydiga än hantaxar! 15

Exempel Rapportering av resultat Det finns inga signifikanta skillnader i lydnad mellan raserna, F(2, 76) = 2.86, p =.06. Däremot finns signifikanta skillnader mellan tikar och hanar, F(1, 76) = 6.03, p =.02, partial η 2 =.07. Tikar är mer lydiga än hanhundar. Det finns också en signifikant interaktion mellan ras och kön, F(2, 76) = 13.99, p <.001, partial η 2 =.27. Test av enkla effekter visar att det finns skillnader i lydnad mellan tikar av olika raser, F(2, 76) = 13.65, p <.001, r =.39. Tiktaxar är mer lydiga än både labradorer och pitbulls enligt jämförelser med 95% konfidensintervall (eller enligt Tukey/Kramer posthoc test). Dessutom är tiktaxar mer lydiga än hantaxar, F(1, 76) = 36.27, p <.001, r =.57. Multipel linjär regression 16

I enkel linjär regression försöker man utifrån ett givet värde gissa ett annat. I multipel linjär regression försöker man utifrån flera givna värden gissa ett annat www.aiaccess.net Regressionsekvationen: Y = b 1 X 1 + b 2 X 2 + +b k X k + a 17

Y = Beroende variabel, Kriterievariabel - Det man vill gissa. Ŷ = Predicerat värde på den beroende variabeln - Det gissade värdet. X i = Oberoende variabler, Prediktionsvariabler - Det man utgår från när man gissar. b i = Regressionskoefficienter, Lutningskoefficienter - Planens lutningar med avseende på alla X i. a = Intercept - Värdet där linjen korsar Y-axeln. Residualer = Differenser mellan faktiska Y-värden och predicerade Ŷ-värden. - Skillnaderna mellan Y-värdena och planet (mätt i Y-led) Exempel I ett samhälle vill kommunledningen satsa på vinterturism. För att kunna höja intresset hos en tänkt målgrupp vill man undersöka vilka faktorer som på olika sätt kan hjälpa till att förklara snöfanatism (intresse för snörika områden). I en by man vill inrikta sig på frågar man 19 personer för att utifrån dem försöka generalisera vilken eller vilka faktorer som var för sig eller tillsammans kan förklara snöfanatism. Man undersöker följande faktorer: Sportintresse IQ Reseintresse Pigment_kvot (hur lätt personen har att bli solbränd) Frågeställning: Kan man utifrån sportintresse, IQ, reseintresse och pigment_kvot förklara snöfanatism? 18

Korrelationer Sportintresse och IQ verkar användbara för att förklara snöfanatism. Däremot inte reseintresse eller pigment_kvot. Dock har sportintresse och IQ också en stark korrelation vilket innebär att de förklarar en gemensam del av snöfanatism. Alltså: Sportintresse och IQ användbara var för sig men inte helt säkert tillsammans. SPSS 19

Modellen Modellen förklarar 76 %. Modellen är signifikant, dvs. vi törs säga att man utifrån pigment_kvot, sportintresse, reseintresse och IQ kan förklara snöfanatism. Modellens delar Ingen av modellens beståndsdelar är i sig själv signifikant (när den kombineras tillsammans med de andra). 20

Forward betyder att prediktorer läggs till stegvis med bästa först, därefter den som kan förklara mest av den del som återstår att förklara av den beroende variabeln. Prediktorer läggs till så länge de kan läggas till och vara signifikanta. Modellen Modell 1 förklarar 65 % och modell 2 förklarar 74 %. Båda modellerna är signifikanta, dvs. vi törs säga att man utifrån sportintresse (modell 1) och utifrån sportintresse och IQ (modell 2) kan förklara snöfanatism. 21

Modellens delar Sportintresse förklarar mest och läggs därför in i modell 1. Av det som återstår att förklara av sportfanatism efter sportintresse kan IQ signifikant bidra med förklaring och läggs därför in i modell 2. Exempel Slutsats: Man kan utifrån sportintresse och IQ signifikant förklara 74 % av snöfanatismen i den aktuella byn, F(2, 16) = 22.73, p <.001. Ett stort sportintresse predicerar stor snöfanatism, β =.64, t(16) = 4.39, p <.001, och en låg IQ predicerar stor snöfanatism, β = -.34, t(16) = -2.35, p =.03. Man bör således inrikta sig på sportintresserade med låg intelligens för att marknadsföra sig som perfekt ställe för vinterturism. (Då designen är en tvärsnittsstudie kan man tyvärr inte säga något om huruvida sportintresse och IQ kausalt påverkar snöfanatismen, så man kan inte utifrån denna studie motivera att till exempel sätta in fördummande åtgärder i byn med syfte att öka snöfanatismen.) 22

Exempel En kritisk politiker undrar dock om det inte kan vara så att det finns skillnader mellan kvinnor och män som kan förklara en del av resultatet. Därför genomförs analysen igen men med kontroll för kön. Steg 1: Lägg till kön som oberoende variabel med metoden Enter. Steg 2: Lägg till även sportintresse och IQ som oberoende variabler med metoden Enter. 23

Modellen Modell 1 (kön) förklarar 75 % och modell 2 (kön + IQ och sportintresse) förklarar ytterligare 14 %. Kön har ett signifikant förklaringsvärde för snöfanatism. Kön, IQ och sportintresse har tillsammans ett signifikant förklaringsvärde för snöfanatism. Modellens delar Kön är i sig själv en signifikant prediktor för snöfanatism. När man kontrollerar för kön är inte sportintresse signifikant prediktor längre (i kombination med IQ). 24

Kör en ny (hierarkisk) regression där kön läggs till som prediktor i första steget och där IQ läggs till som prediktor i andra steget. Modellen Modellens delar 25

Slutsats: Kön kan i sig själv förklara 75 % av variationerna i snöfanatism. När man kontrollerar för kön kan IQ förklara ytterligare 10%, F(1, 16) = 11.49, p =.004. Man kan utifrån kön och IQ signifikant förklara 84 % av snöfanatism i den aktuella byn, F(2, 16) = 47.06, p <.001. Kvinna är en prediktor för stor snöfanatism, β =.72, t(16) = 6.87, p <.001, och även en låg IQ predicerar stor snöfanatism, β = -.35, t(16) = -3.39, p =.004. Metoder för regression: 1. Börja med att studera korrelationerna a) Man vill ha stora korrelationer mellan Y och X i b) Man vill ha små korrelationer mellan X i och X j 2. Välj mellan enter, forward eller backward. a) Finns teorier om ordning så lägg in dem stegvis med hjälp av Enter tills man inte längre uppnår signifikans. Hierarkisk multipel linjär regression. b) Vid mer explorativa ansatser rekommenderas Backward. (Men testa gärna både backward och forward och se om ni får samma modell.) 26

Antaganden för ANOVA Antaganden för ANOVA N: 15 värden per betingelse (tumregel) Det behövs alltså minst 15 svenskar, minst 15 norrmän och minst 15 danskar för att uppfylla detta antagande. Stickproven är slumpvis utvalda Värdena i varje population antas vara normalfördelade Självskattad förmåga för skidåkning ska vara normalfördelade för svenskar, och så även för norrmän, och likaledes för danskar. Varianserna i populationerna antas vara lika stora Varianserna (eller standardavvikelserna) i populationerna svenskar, norrmän och danskar antas vara lika stora. 27

Att bryta mot reglerna 1. Beroende variabeln dikotom Om man har lika stora gruppstorlekar så är ANOVA robust om åtminstone 20% av alla mätvärden finns i den minsta gruppen och om vi har minst 20 frihetsgrader. 2. Olika gruppstorlekar Känsligt om vi har skeva fördelningar Känsligt om olika varianser 3. Olika varianser Känsligt om vi har olika stora gruppstorlekar 4. Beroende observationer Allvarligt. 28