1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna, så går man på dessa, kikar på handouts och kanske på de inspelade föreläsningarna så bör man finna svar. Litteraturen kan ge ytterligare fördjupad kunskap. För att få godkänt på tentans statistikdel skall man ha minst 60% av poängen på frågorna om regressionsanalys och variansanalys. För att få väl godkänt på tentans statistikdel skall man ha minst 60% av poängen på frågorna om regressionsanalys och variansanalys SAMT minst 60% av poängen på frågorna om multilevel modeling och structural equation modeling. Regressionsanalys Enkel regressionsanalys 1. Hur placeras regressionslinjen i förhållande till observerade datapunkter? (2p) 2. Beskriv formeln för regressionslinjen (ledtråd: a, b ). 3. Allt annat konstant, vad händer med regressionslinjen när korrelationen mellan prediktorn och utfallsvariabeln minskar? 4. Regressionslinjen går alltid genom en viss punkt. Vilken? (2p) 5. På vilket sätt skiljer sig β (beta) från den ordinarie regressionskoefficienten b? Vilken fördel har β jämfört med b? (2p) 6. Vad innebär regressions SS respektive residual SS vid en enkel regressionsanalys? (2p) 7. Vid regressionsanalys använder man sig av två olika frihetsgrader (df). Vad kallas dessa och hur beräknas de? (2p) 8. Vad står R respektive R 2 för? 9. Vad har man för antaganden angående varians och fördelning i utfallsvariabeln vid enkel regressionsanalys? Multipel regressionsanalys 10. Vad skiljer multipel från enkel regressionsanalys? (1p) 11. Vad innebär kollinearitet? Beskriv något mått på kollinearitet och någon tumregel vad den bör anta för värden. 12. Vad innebär adjusted R square?
2 13. Vad kan man anta om ANOVA-tabellen vid en regressionsanalys visar på en signifikant F-kvot? 14. Vad anger b- och β-koefficienterna vid en multipel regressionsanalys? (2p) 15. Beskriv selektionsmetoderna Enter samt Stepwise. (2p) 16. Beskriv, steg för steg, hur man skulle gå tillväga för att testa om en viss variabel X kan antas ha en kurvlinjär effekt på en annan variabel Y. (2p) 17. Beskriv, steg för steg, hur man skulle gå tillväga för att testa om två variabler X och Z kan antas ha en interaktionseffekt på en tredje variabel Y. (2p) 18. Tänk dig att vi finner, vid en multipel regressionsanalys, att regressionskoefficienten för prediktor X är lika med +0,3, att regressionskoefficienten för prediktor Z är lika med -0,2, och att koefficienten för interaktionstermen X Z är lika med +0,4 (alla koefficienter är signifikanta). Beskriv hur värdena +0,3; -0,2; och +0,4 kan tolkas. 19. Säg att vi har en kategorivariabler med fyra kategorier som vi vill ta med som en prediktor i en regressionsanalys. Beskriv hur man skall göra. Logistisk regression 20. När är logistisk regression att föredra framför linjär regression? Varför? 21. Säg att en kontinuerlig prediktor X får en regressionskoefficient på +0,2 (p <.05) vid en logistisk regression (binär). Beskriv vad värdet +0,2 står för. Regressionsanalys med SPSS 22. Beskriv vad predicerade värden, residualer och DfBeta innebär. Beskriv hur man kan använda sig av dessa för att diagnostisera resultatet från en regressionsanalys. Variansanalys (ANOVA) 1. När används envägs variansanalys? 2. Vad säger noll- respektive alternativhypotesen vid envägs variansanalys? (2p) 3. Vad anger den s.k. F-kvoten? 4. Om nollhypotesen stämmer vid envägs variansanalys, vad förväntas F-kvoten bli? (2p) 5. Hur ser förhållandet mellan F-kvoten och sannolikheten för att nollhypotesen stämmer?
3 6. I SPSS-outputen nedan, ange hur de olika värdena blivit framräknade (förutom sig.-värdet). Vad anger detta sig.-värde? 7. Varför utförs s.k. Post Hoc test ofta i samband med variansanalys? Nämn namnet på minst två olika Post Hoc test. 8. Beskriv tre antaganden vid variansanalys. 9. Vad menas med fixed respektive random oberoende variabler? 10. Vad (ungefär) anger effektstorleken vid variansanalys? Ange två olika effektmått. (2p) 11. När används tvåvägs ANOVA? 12. Vad menas med huvudeffekter, enkla effekter och interaktionseffekter? Ge konkreta exempel. 13. Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas interaktionen mellan de oberoende variablerna vid en tvåvägs ANOVA. Ge ett konkret exempel. 14. Vad brukar inträffa med F-kvoten för effekten av en viss oberoende variable om man tar med ytterligare en oberoende variabel i analysen? Varför? (2p) 15. Hur många effekter räknas fram vid en trevägs ANOVA? 16. Beskriv vad som menas med en trevägs interaktion. (2p) 17. Säg att du vid en trevägs ANOVA finner att de tre oberoende variablerna A, B och C interagerar signifikant i sin effekt på den beroende variabeln D. Beskriv hur du skulle gå vidare med analysen. (2p) 18. När används ANOVA för beroende mätningar? (2p) 19. Vad är fördelen med upprepade mätningar? 20. Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas mättillfälle vid en ANOVA för beroende mätningar. Ge ett konkret exempel. (2p) 21. Beskriv det extra antagande som gäller för ANOVA för beroende mätningar som inte gäller för ANOVA för oberoende mätningar.
4 22. När används Mixed ANOVA? 23. Vad innebär en signifikant interaktion vid en ANOVA för upprepade mätningar med en mellanindividsvariabel? Ge ett konkret exempel. (2p) 24. När används Multivariat ANOVA (MANOVA)? 25. Beskriv vilka antaganden som gäller vid MANOVA. Structural Equation Modeling (SEM) 1. Vilken skillnad respektive likhet finns i användningen av SEM jämfört med regressionsanalys? (2p) 2. Beskriv vad som menas med latenta respektive manifesta variabler. Ge exempel. Hur brukar dessa variabler illustreras i figurer? (2p) 3. Vad respresenterar enkelriktade respektive dubbelriktade pilar i illustrationer av SEMmodeller? 4. Vad menas med exogena respektive endogena variabler? Hur kan dessa identifieras i en figur med en SEM-modell? (2p) 5. Beskriv, gärna med tillhörande figurer, vad som menas med Path modeller, Konfirmatorisk faktoranalys, och Full model. (3p) 6. Vad vidhäftas, i normalfallet, varje endogen variabel i en SEM-modell? (2p) 7. Varje latent variabel har, i normalfallet, en utgående parameter med en viss specifik egenskap. Vilken? Varför gör man så? 8. Beskriv, gärna med tillhörande figur, vad som menas med mätmodell och med strukturmodell. 9. Vad menas med att en SEM-modell är identifierad? Varför måste en SEM-modell vara identifierad? (2p) a1 10. Komplettera modellen till höger med det som fattas (i förhållande till normalfallet)? Beräkna sedan antalet frihetsgrader och ange om modellen är identifierad. Motivera ditt svar och visa på dina beräkningar. a2 a3 b1 b2 b3 A B C c1 c2 c3
5 11. Vad menas med att en modell är overidentified, underidentified respektive just identified? (3p) 12. Säg att korrelationen mellan två latenta variabler A och B är lika med 0.5 och att den standardiserade effekten av B på en tredje latent variabel C är lika med 0.2 i en SEM-modell. På vilket sätt skulle korrelationen respektive den standardiserade effekten ändras om: (a) Reliabiliteten för A var lägre; (b) Reliabiliteten för B var lägre; (c) Reliabiliteten för C var lägre. 13. Kan standardisera effekter respektive korrelationer i en SEM-modell bli större än ett? Om ja, vad skulle sådana parametervärden kunna bero på? 14. Beräkna samtliga direkta, indirekta och totala effekter i modellen nedan (endast strukturdelen visas). Om beräkningen blir för krånglig räcker det med att visa hur beräkningen skulle göras utan att presentera själva slutresultatet. (3p) A.40.20.60 C.50 D B.30.10 15. Vad avgör en SEM-modells anpassningsmått? 16. Vad anger en SEM-modells chi2-värde? 17. När, enligt en tumregel, indikerar TLI (NNFI) samt RMSEA: (a) oacceptabelt dålig anpassning mellan modell och data; (b) nära anpassning (close fit) mellan modell och data; (c) exakt anpassning mellan modell och data. 18. Beskriv de tre kategorier i vilka SEM-analyser kan indelas? 19. Beskriv fyra steg som man kan ta till vid dålig anpassning mellan modell och data. (2p) 20. Vad anger modification indices? Ge ett exempel. 21. Vad skulle en forskare kunna göra för att, åtminstone delvis, undvika problemen som är förknippade med användningen av modification indices? 22. Ger SEM-analyser svar på kausalitet? Motivera ditt svar. (2p)
6 Multilevel Modeling (MLM) 1. När är det extra lämpligt att använda sig av MLM? 2. Beskriv vad som menas med fixed intercept, fixed effect, random intercept samt random effect. Ge konkreta exempel. 3. Vad innebär det att man centrerar en variabel? Varför är det vanligt att centrera prediktorer inom MLM? 4. Vad innebär grand mean centrering respektive subgruppscentrering? 5. Varför är det inte lämpligt att köra vanlig regressionsanalys på hierarkiska data? (2p) 6. Nämn namnet på de två estimeringsmetoder som (främst) används i MLM. (2p) 7. Säg att vi vill testa ifall medelvärdet på en viss variabel V skiljer sig åt mellan ett antal grupper. Vad specificeras denna skillnad mellan grupper som vid en MLM? (2p) 8. Vad anger -2 Log Likelihood? Vad indikerar ett högt respektive ett lågt värde? (2p) 9. Vad innebär det att en modell A är nestad i en annan modell B? Vilken av de två modellerna kommer att uppvisa bättre anpassning till data? (2p) 10. Beskriv hur man kan välja (datastyrt) mellan två modeller där den ena är nestad i den andra. (2p) 11. Varför lämpar sig MLM bra för analyser av upprepade mätningar (t.ex. jämfört med en repeated measures ANOVA)? (2p) 12. Hur omorganiseras data i SPSS om man skall analysera upprepade mätningar med MLM?