Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet



Relevanta dokument
Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet

Instruktioner till Examinationen Kursen Metoder för Statistisk Analys Karolinska Institutet

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Bygga linjära modeller! Didrik Vanhoenacker 2007

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Linjär regressionsanalys. Wieland Wermke

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

OBS! Vi har nya rutiner.

ANOVA Faktoriell (tvåvägs)

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

OBS! Vi har nya rutiner.

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Uppgift 1. Deskripitiv statistik. Lön

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Kort manual till SPSS 10.0 för Mac/PC

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat?

Multipel Regressionsmodellen

Skrivning i ekonometri torsdagen den 8 februari 2007

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Beskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5

Variansanalys med SPSS Kimmo Sorjonen ( )

FACIT!!! (bara facit,

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Statistik , Stansens PC-klass ASA-huset. Schema: mån ti ons to fre

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Sänkningen av parasitnivåerna i blodet

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

Regressions- och Tidsserieanalys - F3

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR

Regressions- och Tidsserieanalys - F4

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

OBS! Vi har nya rutiner.

Fallbeskrivning: Suntrip2011

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Regressions- och Tidsserieanalys - F3

Tentamen för kursen. Linjära statistiska modeller. 20 mars

InStat Exempel 4 Korrelation och Regression

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

EXAMINATION KVANTITATIV METOD

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Maximalt antal poäng för hela skrivningen är 20 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 17 poäng.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

Kursbeskrivning för Ekonometri, 15 högskolepoäng

MSG830 Statistisk analys och experimentplanering

Metod och teori. Statistik för naturvetare Umeå universitet

Multipel regression och Partiella korrelationer

Regressions- och Tidsserieanalys - F3

Skriv tydligt. Besvara inte frågor med lösryckta ord, utan sammanhängande och tydligt. Visa även dina beräkningar.

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Försättsblad tentamen Fakulteten för hälsa och samhälle

Tisdagen den 16 januari

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Föreläsning 15: Faktorförsök

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

OBS! Vi har nya rutiner.

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Matematisk statistik för B, K, N, BME och Kemister

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Transkript:

1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om regressionsanalys OCH uppgiften om variansanalys på ett godtagbart sätt (se under Bedömning och Betygsättning nedan för den aktuella definitionen av godtagbart ). För att få väl godkänt på inlämningsuppgiften krävs att man utför uppgiften om structural equation modeling OCH uppgiften om multilevel modeling på ett godtagbart sätt. Trots att inlämningsuppgiften alltså består av två deluppgifter så lämnas dessa in i samma dokument. Se under Inlämning för närmare instruktioner. OBS: Undervisningen håller sig till SPSS och AMOS, men det är tillåtet att göra sina beräkningar med vilket statistikprogram som helst (ange dock vilket program ni använt er av). Vill man göra sina beräkningar för hand så är detta också OK. De olika dataseten finns utlagda på kurshemsidan (under Examination ) både som SPSS-filer och som tabbavgränsade textfiler. Uppgiften om Regressionsanalys Harootunian, B., & Tate, M. W. (1960). The relationship of certain selected variables to problem solving ability. Journal of Educational Psychology, 51, 326-333. Analysen utförs på ett dataset ( Simulering, Regression, Problem solving ability ; finns på kurshemsidan) som simulerar det som Harootunian och Tate använt sig av (det handlar alltså inte om originaldata). Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Ange undersökningens syfte (låtsas, s.a.s., att du är Harotuunian och att detta är din 2. Replikera de regressionsanalyser (tre stycken) vars resultat presenteras i Tabell 4 i Harootunian och Tates artikel. Presentera dina egna resultat (regressionskoefficienter samt hur mycket av variansen i utfallsvariabeln som modellen förklarar). 3. Finns det några problem med kollinearitet i någon av de tre utförda analyserna? Motivera ditt svar. 4. Standardisera alla variabler och räkna sedan fram alla tvåvägs interaktionstermer mellan de sju prediktorerna som involverar IQ (det blir sex stycken). Utför en analys där Problem Solving Ability (standardiserat) prediceras utifrån de sju prediktorerna (standardiserade) samt de sex interaktionstermerna. Presentera dina resultat (regressionskoefficienter samt hur mycket av variansen i utfallsvariabeln som modellen förklarar, samt eventuella problem med kollinearitet). 5. Utför en Stepwise regressionsanalys av modellen med Problem Solving Ability (standardiserat) som utfallsvariabel och med de sju standardiserade prediktorerna och de sex interaktionstermer som involverar IQ. Presentera dina resultat (t.ex. vilka prediktorer

2 som inkluderas i modellen och hur mycket av variansen i utfallsvariabeln som den slutliga modellen förklarar). Texten kan antingen skrivas i samma form som en vetenskaplig artikel (se Harootunian och Tates artikel för exempel), men då inkluderas SPSS-output som appendix. Texten kan också skrivas i form av en SPSS-undervisning-handout där man klipper in SPSS output-tabeller och kommentarer till dessa (se kurshemsidan för exempel). Observera att det inte räcker att du bara klipper in Output-tabellerna utan att beskriva och tolka resultaten. Uppgiften om Variansanalys (ANOVA) St.Lawrence, J. S., Brasfield, T. L., Shirley, A., Jefferson, K. W., Alleyne, E., O Bannon, R. E. III. (1995). Cognitive-behavioral intervention to reduce African American adolescents risk for HIV infection. Journal of Consulting and Clinical Psychology, 63, 221-237. Analysen utförs på ett dataset som simulerar det som St.Lawrence et al. använt sig av ( Simulering, ANOVA, Kondomanvändning; finns på kurshemsidan; det handlar inte om originaldata). Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Ange undersökningens syfte (låtsas, s.a.s., att du är St.Lawrence och att detta är din 2. Utför en ANOVA för upprepade mätningar (fyra mättillfällen) och med två oberoende variabler mellan individer. Presentera och tolka resultaten. Kan vi anta att kravet på sfäriskhet är uppfyllt? Motivera dina svar. 3. Om någon av interaktionerna i analysen ovan är signifikanta går du vidare och analyserar enkla effekter och presenterar och beskriver resultaten av dessa. Kan vi anta att kravet på sfäriskhet är uppfyllt? Motivera dina svar. Presentera gärna signifikanta skillnader med hjälp av en figur. 4. Beräkna tre förändringsvariabler utifrån de fyra upprepade mätningarna. Analysera dessa tre variabler med en multivariat variansanalys (MANOVA) och med Grupp och Kön som oberoende variabler mellan individer. Presentera och tolka resultaten. Motivera dina svar. Texten kan antingen skrivas i samma form som en vetenskaplig artikel (se St.Lawrence et al.s artikel för exempel), men då inkluderas SPSS-output som appendix. Texten kan också skrivas i form av en SPSS-undervisning-handout där man klipper in SPSS output-tabeller och kommentarer till dessa (se kurshemsidan för exempel). Observera att det inte räcker att du bara klipper in Output-tabellerna utan att beskriva och tolka resultaten. Uppgiften om Structural Equation Modeling (SEM)

3 Holahan, C. J., Moos, R. H., Holahan, C. K., & Cronkite, R. C. (1999). Resource loss, resource gain, and depressive symptoms: A 10-year model. Journal of Personality and Social Psychology, 77, 620-629. Analysen utförs på ett dataset som simulerar det som Holahan et al. använt sig av ( Simulering, SEM, Depressive symptoms and resource loss ; finns på kurshemsidan; det handlar alltså inte om originaldata). I detta dataset är korrelationerna mellan variablerna de samma som anges i Tabell 3 i Holahan et al.s artikel, däremot har alla variablerna i det simulerade datasetet ett medelvärde på noll och en standardavvikelse på ett. Mer specifikt skall man utföra följande moment/besvara följande frågor:1. 1. Ange undersökningens syfte (låtsas, s.a.s., att du är Holahan och att detta är din 2. Utför den SEM-analys som presenteras i Figur 2 i Holahan et al.s artikel och presentera dina resultat (gärna i form av en figur). Både parameterestimat och modellens anpassningsmått skall anges. OBS: Resultaten kommer inte att bli exakt de samma som i Holahan et al.s artikel, så det funkar inte att bara skriva av dessa. 3. När du skall utföra analysen får du upp ett varningsmeddelande (som du ignorerar genom att välja Proceed with analysis ). Varför? Skriv texten i form av en SPSS-undervisning-handout (se kurshemsidan för exempel). Uppgiften om Multilevel Modeling (MLM) Uppgiften går ut på analysera datasetet som heter MLM, socioekonomisk position. Detta dataset simulerar ett riktigt dataset, men det är alltså inte originaldata. Följande variabler ingår (du får gärna beskriva dessa i din text): 1. Intelligens ju högre värde desto högre uppmätt intelligens i tonåren. 2. Utbildning ju högre värde desto högre uppnådd utbildningsnivå vid 25 års ålder. 3. SEB socioekonomisk bakgrund, ju högre värde desto bättre ställt hade man det i barndomen. 4. USEP25, USEP30, USEP35, och USEP40 uppnådd socioekonomisk position vid 25-40 års ålder, ju högre värde desto bättre ställt har man det. Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Börja med att grand mean centrera variablerna Intelligens, Utbildning och SEB. 2. Omstrukturera data så att varje person får fyra rader (en för varje mätning av USEP). Skapa en tidvariabel som står för antalet år sedan man fyllde 25 (varje person får alltså fyra värden, nämligen 0, 5, 10 och 15). 3. Analysera Modell 1: Fixed intercept, inga prediktorer, USEP som beroende variabel. Presentera och tolka resultaten. 4. Analysera Modell 2: Random intercept, inga prediktorer, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 1? Vad händer med residualerna jämfört med Modell 1? Finns det någon signifikant variation i USEPinterceptet mellan individer? Vad innebär detta? Presentera och tolka resultaten. 5. Analysera Modell 3: Random intercept, fixed effekt av tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 2? Vad händer med residualerna jämfört med Modell 2? Hur ser effekten av tid på USEP ut? Presentera och tolka resultaten.

4 6. Analysera Modell 4: Random intercept, random effekt av tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 3? Vad händer med residualerna jämfört med Modell 3? Varierar effekten av tid på USEP signifikant mellan individer? Presentera och tolka resultaten. 7. Analysera Modell 5: Random intercept, random effekt av tid, fixed effekt av intelligens (centrerat) samt interaktionen mellan intelligens (centrerat) och tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och intelligens (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 8. Analysera Modell 6: Upprepa Modell 5 men byt ut intelligens mot utbildning (centrerat). Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och utbildning (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 9. Analysera Modell 7: Upprepa Modell 5 men byt ut intelligens mot socioekonomisk bakgrund (SEB) (centrerat). Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och SEB (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 10. Analysera modell 8: Random intercept, random effekt av tid, fixed effekter av intelligens (centrerat), utbildning (centrerat) och SEB (centrerat) samt alla tre tvåvägs interaktionstermer som involverar effekten av tid. Hur pass bra passar modellen med data jämfört med Modell 7? Hur ser huvudeffekterna och interaktionerna ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 7? Presentera och tolka resultaten. Inlämning Döp din text antingen till Uppgift om regression och ANOVA eller Uppgift om MLM och SEM beroende på vilka uppgifter du utfört. För en viss grad av anonymitet bör du inte ange ditt namn i den text som du skickar in dock skall namnet anges tydligt i det mejl som texten bifogas till. Fördjupningsuppgiften mejlas till följande två adresser (båda två): 1) kimmo.sorjonen@ki.se 2) kimmo.sorjonen.ki@analys.urkund.se I urkund görs en plagieringskontroll och om texten är plagierad så riskerar man att bli avstängd från sin utbildning. DET ÄR ALLTSÅ FÖRBJUDET ATT PLAGIERA REDAN EXISTERANDE TEXTER. Bedömning & Betygsättning Inlämningsuppgiften bedöms och betygsätts utifrån följande kriterier: A. Uppfylls instruktionerna? (helt = 2; hyfsat = 1; nej = 0)

5 B. Verkar beräkningarna vara korrekt utförda? (helt = 2; hyfsat = 1; nej = 0) C. Har uppgiften lämnats in i tid? (ja = 1; nej = 0) För betyget Godkänd krävs minst en poäng på VARDERA kriterium A och B ovan. För betyget Väl Godkänd krävs minst en poäng på VARDERA kriteriet (A-C) ovan samt att man utfört Uppgiften om multilevel modeling (MLM) OCH Uppgiften om structural equation modeling (SEM).