Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Relevanta dokument
Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Innehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Structural Equation Modeling (SEM) Ingenting är omöjligt

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Instruktioner till Examinationen Kursen Metoder för Statistisk Analys Karolinska Institutet

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Multipel Regressionsmodellen

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

ANOVA Faktoriell (tvåvägs)

OBS! Vi har nya rutiner.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Beskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5

InStat Exempel 4 Korrelation och Regression

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Kort manual till SPSS 10.0 för Mac/PC

FACIT!!! (bara facit,

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Linjär regressionsanalys. Wieland Wermke

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Uppgift 1. Deskripitiv statistik. Lön

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

Samhällsvetenskaplig metod, 7,5 hp

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Grundläggande matematisk statistik

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Regressionsanalys Enkel regressionsanalys Regressionslinjen

OBS! Vi har nya rutiner.

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

OBS! Vi har nya rutiner.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Regressions- och Tidsserieanalys - F1

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Statistiska samband: regression och korrelation

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Matematisk statistik, Föreläsning 5

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F4

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Statistik B Regressions- och tidsserieanalys Föreläsning 1

STATISTISK ANALYS AV KOMPLEXA DATA

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!

Regressions- och Tidsserieanalys - F3

Sänkningen av parasitnivåerna i blodet

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Metod och teori. Statistik för naturvetare Umeå universitet

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Maximalt antal poäng för hela skrivningen är 20 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 17 poäng.

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

Variansanalys med SPSS Kimmo Sorjonen ( )

Höftledsdysplasi hos dansk-svensk gårdshund

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Regressions- och Tidsserieanalys - F1

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

F7 Polynomregression och Dummyvariabler

Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT

10.1 Enkel linjär regression

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

F9 SAMPLINGFÖRDELNINGAR (NCT

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Del A: Schema för ifyllande av svar nns på sista sidan

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

TENTAMEN I STATISTIK B,

Regressionsanalys Enkel regressionsanalys Regressionslinjen

Lösningar till SPSS-övning: Analytisk statistik

732G71 Statistik B. Föreläsning 8. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 23

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Medicinsk statistik II

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

Laboration 2 multipel linjär regression

Transkript:

1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna, så går man på dessa, kikar på handouts och kanske på de inspelade föreläsningarna så bör man finna svar. Litteraturen kan ge ytterligare fördjupad kunskap. För att få godkänt på tentans statistikdel skall man ha minst 60% av poängen på frågorna om regressionsanalys och variansanalys. För att få väl godkänt på tentans statistikdel skall man ha minst 60% av poängen på frågorna om regressionsanalys och variansanalys SAMT minst 60% av poängen på frågorna om multilevel modeling och structural equation modeling. Regressionsanalys Enkel regressionsanalys 1. Hur placeras regressionslinjen i förhållande till observerade datapunkter? (2p) 2. Beskriv formeln för regressionslinjen (ledtråd: a, b ). 3. Allt annat konstant, vad händer med regressionslinjen när korrelationen mellan prediktorn och utfallsvariabeln minskar? 4. Regressionslinjen går alltid genom en viss punkt. Vilken? (2p) 5. På vilket sätt skiljer sig β (beta) från den ordinarie regressionskoefficienten b? Vilken fördel har β jämfört med b? (2p) 6. Vad innebär regressions SS respektive residual SS vid en enkel regressionsanalys? (2p) 7. Vid regressionsanalys använder man sig av två olika frihetsgrader (df). Vad kallas dessa och hur beräknas de? (2p) 8. Vad står R respektive R 2 för? 9. Vad har man för antaganden angående varians och fördelning i utfallsvariabeln vid enkel regressionsanalys? Multipel regressionsanalys 10. Vad skiljer multipel från enkel regressionsanalys? (1p) 11. Vad innebär kollinearitet? Beskriv något mått på kollinearitet och någon tumregel vad den bör anta för värden. 12. Vad innebär adjusted R square?

2 13. Vad kan man anta om ANOVA-tabellen vid en regressionsanalys visar på en signifikant F-kvot? 14. Vad anger b- och β-koefficienterna vid en multipel regressionsanalys? (2p) 15. Beskriv selektionsmetoderna Enter samt Stepwise. (2p) 16. Beskriv, steg för steg, hur man skulle gå tillväga för att testa om en viss variabel X kan antas ha en kurvlinjär effekt på en annan variabel Y. (2p) 17. Beskriv, steg för steg, hur man skulle gå tillväga för att testa om två variabler X och Z kan antas ha en interaktionseffekt på en tredje variabel Y. (2p) 18. Tänk dig att vi finner, vid en multipel regressionsanalys, att regressionskoefficienten för prediktor X är lika med +0,3, att regressionskoefficienten för prediktor Z är lika med -0,2, och att koefficienten för interaktionstermen X Z är lika med +0,4 (alla koefficienter är signifikanta). Beskriv hur värdena +0,3; -0,2; och +0,4 kan tolkas. 19. Säg att vi har en kategorivariabler med fyra kategorier som vi vill ta med som en prediktor i en regressionsanalys. Beskriv hur man skall göra. Logistisk regression 20. När är logistisk regression att föredra framför linjär regression? Varför? 21. Säg att en kontinuerlig prediktor X får en regressionskoefficient på +0,2 (p <.05) vid en logistisk regression (binär). Beskriv vad värdet +0,2 står för. Regressionsanalys med SPSS 22. Beskriv vad predicerade värden, residualer och DfBeta innebär. Beskriv hur man kan använda sig av dessa för att diagnostisera resultatet från en regressionsanalys. Variansanalys (ANOVA) 1. När används envägs variansanalys? 2. Vad säger noll- respektive alternativhypotesen vid envägs variansanalys? (2p) 3. Vad anger den s.k. F-kvoten? 4. Om nollhypotesen stämmer vid envägs variansanalys, vad förväntas F-kvoten bli? (2p) 5. Hur ser förhållandet mellan F-kvoten och sannolikheten för att nollhypotesen stämmer?

3 6. I SPSS-outputen nedan, ange hur de olika värdena blivit framräknade (förutom sig.-värdet). Vad anger detta sig.-värde? 7. Varför utförs s.k. Post Hoc test ofta i samband med variansanalys? Nämn namnet på minst två olika Post Hoc test. 8. Beskriv tre antaganden vid variansanalys. 9. Vad menas med fixed respektive random oberoende variabler? 10. Vad (ungefär) anger effektstorleken vid variansanalys? Ange två olika effektmått. (2p) 11. När används tvåvägs ANOVA? 12. Vad menas med huvudeffekter, enkla effekter och interaktionseffekter? Ge konkreta exempel. 13. Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas interaktionen mellan de oberoende variablerna vid en tvåvägs ANOVA. Ge ett konkret exempel. 14. Vad brukar inträffa med F-kvoten för effekten av en viss oberoende variable om man tar med ytterligare en oberoende variabel i analysen? Varför? (2p) 15. Hur många effekter räknas fram vid en trevägs ANOVA? 16. Beskriv vad som menas med en trevägs interaktion. (2p) 17. Säg att du vid en trevägs ANOVA finner att de tre oberoende variablerna A, B och C interagerar signifikant i sin effekt på den beroende variabeln D. Beskriv hur du skulle gå vidare med analysen. (2p) 18. När används ANOVA för beroende mätningar? (2p) 19. Vad är fördelen med upprepade mätningar? 20. Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas mättillfälle vid en ANOVA för beroende mätningar. Ge ett konkret exempel. (2p) 21. Beskriv det extra antagande som gäller för ANOVA för beroende mätningar som inte gäller för ANOVA för oberoende mätningar.

4 22. När används Mixed ANOVA? 23. Vad innebär en signifikant interaktion vid en ANOVA för upprepade mätningar med en mellanindividsvariabel? Ge ett konkret exempel. (2p) 24. När används Multivariat ANOVA (MANOVA)? 25. Beskriv vilka antaganden som gäller vid MANOVA. Structural Equation Modeling (SEM) 1. Vilken skillnad respektive likhet finns i användningen av SEM jämfört med regressionsanalys? (2p) 2. Beskriv vad som menas med latenta respektive manifesta variabler. Ge exempel. Hur brukar dessa variabler illustreras i figurer? (2p) 3. Vad respresenterar enkelriktade respektive dubbelriktade pilar i illustrationer av SEMmodeller? 4. Vad menas med exogena respektive endogena variabler? Hur kan dessa identifieras i en figur med en SEM-modell? (2p) 5. Beskriv, gärna med tillhörande figurer, vad som menas med Path modeller, Konfirmatorisk faktoranalys, och Full model. (3p) 6. Vad vidhäftas, i normalfallet, varje endogen variabel i en SEM-modell? (2p) 7. Varje latent variabel har, i normalfallet, en utgående parameter med en viss specifik egenskap. Vilken? Varför gör man så? 8. Beskriv, gärna med tillhörande figur, vad som menas med mätmodell och med strukturmodell. 9. Vad menas med att en SEM-modell är identifierad? Varför måste en SEM-modell vara identifierad? (2p) a1 10. Komplettera modellen till höger med det som fattas (i förhållande till normalfallet)? Beräkna sedan antalet frihetsgrader och ange om modellen är identifierad. Motivera ditt svar och visa på dina beräkningar. a2 a3 b1 b2 b3 A B C c1 c2 c3

5 11. Vad menas med att en modell är overidentified, underidentified respektive just identified? (3p) 12. Säg att korrelationen mellan två latenta variabler A och B är lika med 0.5 och att den standardiserade effekten av B på en tredje latent variabel C är lika med 0.2 i en SEM-modell. På vilket sätt skulle korrelationen respektive den standardiserade effekten ändras om: (a) Reliabiliteten för A var lägre; (b) Reliabiliteten för B var lägre; (c) Reliabiliteten för C var lägre. 13. Kan standardisera effekter respektive korrelationer i en SEM-modell bli större än ett? Om ja, vad skulle sådana parametervärden kunna bero på? 14. Beräkna samtliga direkta, indirekta och totala effekter i modellen nedan (endast strukturdelen visas). Om beräkningen blir för krånglig räcker det med att visa hur beräkningen skulle göras utan att presentera själva slutresultatet. (3p) A.40.20.60 C.50 D B.30.10 15. Vad avgör en SEM-modells anpassningsmått? 16. Vad anger en SEM-modells chi2-värde? 17. När, enligt en tumregel, indikerar TLI (NNFI) samt RMSEA: (a) oacceptabelt dålig anpassning mellan modell och data; (b) nära anpassning (close fit) mellan modell och data; (c) exakt anpassning mellan modell och data. 18. Beskriv de tre kategorier i vilka SEM-analyser kan indelas? 19. Beskriv fyra steg som man kan ta till vid dålig anpassning mellan modell och data. (2p) 20. Vad anger modification indices? Ge ett exempel. 21. Vad skulle en forskare kunna göra för att, åtminstone delvis, undvika problemen som är förknippade med användningen av modification indices? 22. Ger SEM-analyser svar på kausalitet? Motivera ditt svar. (2p)

6 Multilevel Modeling (MLM) 1. När är det extra lämpligt att använda sig av MLM? 2. Beskriv vad som menas med fixed intercept, fixed effect, random intercept samt random effect. Ge konkreta exempel. 3. Vad innebär det att man centrerar en variabel? Varför är det vanligt att centrera prediktorer inom MLM? 4. Vad innebär grand mean centrering respektive subgruppscentrering? 5. Varför är det inte lämpligt att köra vanlig regressionsanalys på hierarkiska data? (2p) 6. Nämn namnet på de två estimeringsmetoder som (främst) används i MLM. (2p) 7. Säg att vi vill testa ifall medelvärdet på en viss variabel V skiljer sig åt mellan ett antal grupper. Vad specificeras denna skillnad mellan grupper som vid en MLM? (2p) 8. Vad anger -2 Log Likelihood? Vad indikerar ett högt respektive ett lågt värde? (2p) 9. Vad innebär det att en modell A är nestad i en annan modell B? Vilken av de två modellerna kommer att uppvisa bättre anpassning till data? (2p) 10. Beskriv hur man kan välja (datastyrt) mellan två modeller där den ena är nestad i den andra. (2p) 11. Varför lämpar sig MLM bra för analyser av upprepade mätningar (t.ex. jämfört med en repeated measures ANOVA)? (2p) 12. Hur omorganiseras data i SPSS om man skall analysera upprepade mätningar med MLM?