Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Relevanta dokument
Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet

Instruktioner till Examinationen Kursen Metoder för Statistisk Analys Karolinska Institutet

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Variansanalys med SPSS Kimmo Sorjonen ( )

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

OBS! Vi har nya rutiner.

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Kort manual till SPSS 10.0 för Mac/PC

Linjär regressionsanalys. Wieland Wermke

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Bygga linjära modeller! Didrik Vanhoenacker 2007

ANOVA Faktoriell (tvåvägs)

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Uppgift 1. Deskripitiv statistik. Lön

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat?

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Innehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler

Beskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5

InStat Exempel 4 Korrelation och Regression

Statistik , Stansens PC-klass ASA-huset. Schema: mån ti ons to fre

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

OBS! Vi har nya rutiner.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Structural Equation Modeling (SEM) Ingenting är omöjligt

Skrivning i ekonometri torsdagen den 8 februari 2007

FACIT!!! (bara facit,

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.

Maximalt antal poäng för hela skrivningen är 20 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 17 poäng.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Multipel Regressionsmodellen

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Kursbeskrivning för Ekonometri, 15 högskolepoäng

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

Sänkningen av parasitnivåerna i blodet

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

Regressions- och Tidsserieanalys - F3

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Regressions- och Tidsserieanalys - F4

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Hur påverkar betygsättning elevernas prestationer? Alli Klapp Göteborgs Universitet

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Läs noggrant informationen nedan innan du börjar skriva tentamen

Skriv tydligt. Besvara inte frågor med lösryckta ord, utan sammanhängande och tydligt. Visa även dina beräkningar.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Regressions- och Tidsserieanalys - F3

Intro till SPSS Kimmo Sorjonen (0811)

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Instruktioner till Frivillig Inlämningsuppgift 2 och Datorövning 3-4. Fortsättningskurs i statistik, moment 1, Statistisk Teori, 10 poäng.

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

Försättsblad tentamen Fakulteten för hälsa och samhälle

Examinationsuppgift 2014

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Samhällsvetenskaplig metod, 7,5 hp

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

STATISTISK ANALYS AV KOMPLEXA DATA

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

OBS! Vi har nya rutiner.

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

7.5 Experiment with a single factor having more than two levels

Metod och teori. Statistik för naturvetare Umeå universitet

Transkript:

1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet Uppdaterad: 120113 För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om regressionsanalys OCH uppgiften om variansanalys på ett godtagbart sätt (se under Bedömning och Betygsättning nedan för den aktuella definitionen av godtagbart ). För att få väl godkänt på inlämningsuppgiften krävs att man utför uppgiften om structural equation modeling OCH uppgiften om multilevel modeling på ett godtagbart sätt. Trots att inlämningsuppgiften alltså består av två deluppgifter så lämnas dessa in i samma dokument. Se under Inlämning för närmare instruktioner. OBS: Undervisningen håller sig till SPSS och AMOS, men det är tillåtet att göra sina beräkningar med vilket statistikprogram som helst (ange dock vilket program ni använt er av). Vill man göra sina beräkningar för hand så är detta också OK. De olika dataseten finns utlagda på kurshemsidan (under Examination ) både som SPSS-filer och som tabbavgränsade textfiler. Uppgiften om Regressionsanalys Harootunian, B., & Tate, M. W. (1960). The relationship of certain selected variables to problem solving ability. Journal of Educational Psychology, 51, 326-333. Analysen utförs på ett dataset ( Simulering, Regression, Problem solving ability ; finns på kurshemsidan) som simulerar det som Harootunian och Tate använt sig av (det handlar alltså inte om originaldata). Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Ange undersökningens syfte (låtsas, s.a.s., att du är Harotuunian och att detta är din 2. Replikera de regressionsanalyser (tre stycken) vars resultat presenteras i Tabell 4 i Harootunian och Tates artikel. Presentera dina egna resultat (regressionskoefficienter samt hur mycket av variansen i utfallsvariabeln som modellen förklarar). Välj ut någon av regressionskoefficienterna och förklara vad den innebär. Ange vilka prediktorer som är signifikanta. 3. Finns det några problem med kollinearitet i någon av de tre utförda analyserna? Motivera ditt svar. 4. Standardisera alla variabler och räkna sedan fram alla tvåvägs interaktionstermer mellan de sju prediktorerna som involverar IQ (det blir sex stycken). Utför en analys där Problem Solving Ability (standardiserat) prediceras utifrån de sju prediktorerna (standardiserade) samt de sex interaktionstermerna. Presentera dina resultat (regressionskoefficienter samt

2 hur mycket av variansen i utfallsvariabeln som modellen förklarar, samt eventuella problem med kollinearitet). Ange vilka prediktorer som är signifikanta. 5. Utför en Stepwise regressionsanalys av modellen med Problem Solving Ability (standardiserat) som utfallsvariabel och med de sju standardiserade prediktorerna och de sex interaktionstermer som involverar IQ. Presentera dina resultat (t.ex. vilka prediktorer som inkluderas i modellen och hur mycket av variansen i utfallsvariabeln som den slutliga modellen förklarar). Texten kan antingen skrivas i samma form som en vetenskaplig artikel (se Harootunian och Tates artikel för exempel), men då inkluderas SPSS-output som appendix. Texten kan också skrivas i form av en SPSS-undervisning-handout där man klipper in SPSS output-tabeller och kommentarer till dessa (se kurshemsidan för exempel). Observera att det inte räcker att du bara klipper in Output-tabellerna utan att beskriva och tolka resultaten. Uppgiften om Variansanalys (ANOVA) St.Lawrence, J. S., Brasfield, T. L., Shirley, A., Jefferson, K. W., Alleyne, E., O Bannon, R. E. III. (1995). Cognitive-behavioral intervention to reduce African American adolescents risk for HIV infection. Journal of Consulting and Clinical Psychology, 63, 221-237. Analysen utförs på ett dataset som delvis simulerar det som St.Lawrence et al. använt sig av ( Simulering, ANOVA, Kondomanvändning; finns på kurshemsidan; det handlar inte om originaldata). Undersökningens beroende variabel, mätt vid fyra olika tillfällen, är procentuell andel av samlagen under de senaste åtta veckorna då man använt kondom. Eftersom data är simulerade förekommer orimliga värden (< 0 och > 100) men strunta i detta. Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Ange undersökningens syfte (låtsas, s.a.s., att du är St.Lawrence och att detta är din 2. Utför en ANOVA för upprepade mätningar (fyra mättillfällen) och med två oberoende variabler mellan individer. Presentera och tolka resultaten. Kan vi anta att kravet på sfäriskhet är uppfyllt? Motivera dina svar. 3. Eftersom analysen ovan påvisar en signifikant trevägs interaktion utförs följande: Testa effekten av tid på kondomanvändningen separat för de fyra olika grupperna (BST female; BST male; EC female; EC male). I varje grupp testas om kravet på sfäriskhet är uppfyllt samt den specifika förändringen över tid (detta görs genom att sätta Contrasts = Repeated). Presentera och tolka resultaten. 4. Utför även följande analys: Fyra separata tvåvägs ANOVOR (en för varje mätning av kondomanvändning, OV = Group och Gender). Om någon interaktion är signifikant går du vidare och analyserar enkla effekter (med hjälp av Split file ). Presentera och tolka resultaten. 5. Beräkna tre förändringsvariabler utifrån de fyra upprepade mätningarna (Post-Pre, FU6m- Post, FU12m-FU6m). Analysera dessa tre variabler med en multivariat variansanalys (MANOVA) och med Grupp och Kön som oberoende variabler mellan individer. Presentera och tolka resultaten. Motivera dina svar.

3 Texten kan antingen skrivas i samma form som en vetenskaplig artikel (se St.Lawrence et al.s artikel för exempel), men då inkluderas SPSS-output som appendix. Texten kan också skrivas i form av en SPSS-undervisning-handout där man klipper in SPSS output-tabeller och kommentarer till dessa (se kurshemsidan för exempel). Observera att det inte räcker att du bara klipper in Output-tabellerna utan att beskriva och tolka resultaten. Uppgiften om Structural Equation Modeling (SEM) Holahan, C. J., Moos, R. H., Holahan, C. K., & Cronkite, R. C. (1999). Resource loss, resource gain, and depressive symptoms: A 10-year model. Journal of Personality and Social Psychology, 77, 620-629. Analysen utförs på ett dataset som simulerar det som Holahan et al. använt sig av ( Simulering, SEM, Depressive symptoms and resource loss ; finns på kurshemsidan; det handlar alltså inte om originaldata). I detta dataset är korrelationerna mellan variablerna de samma som anges i Tabell 3 i Holahan et al.s artikel, däremot har alla variablerna i det simulerade datasetet ett medelvärde på noll och en standardavvikelse på ett. Mer specifikt skall man utföra följande moment/besvara följande frågor: 1. Ange undersökningens syfte (låtsas, s.a.s., att du är Holahan och att detta är din 2. Utför den SEM-analys som presenteras i Figur 2 i Holahan et al.s artikel och presentera dina resultat (gärna i form av en figur). Både parameterestimat och modellens anpassningsmått skall anges. OBS: Resultaten kommer inte att bli exakt de samma som i Holahan et al.s artikel, så det funkar inte att bara skriva av dessa. Beskriv i ord vad resultaten visar. 3. Ange, gärna i en tabell, vilken direkt, indirekt samt total effekt (standardiserade) som de latenta variablerna har på varandra. 4. Ange hur mycket av variansen i de latenta endogena variablerna som kan förklaras av de exogena variablerna. 5. När du skall utföra analysen får du upp ett varningsmeddelande (som du ignorerar genom att välja Proceed with analysis ). Varför? Skriv texten i form av en SPSS-undervisning-handout (se kurshemsidan för exempel). Uppgiften om Multilevel Modeling (MLM) Uppgiften går ut på analysera datasetet som heter MLM, socioekonomisk position. Detta dataset simulerar ett riktigt dataset, men det är alltså inte originaldata. Följande variabler ingår (du får gärna beskriva dessa i din text): 1. Intelligens ju högre värde desto högre uppmätt intelligens i tonåren. 2. Utbildning ju högre värde desto högre uppnådd utbildningsnivå vid 25 års ålder. 3. SEB socioekonomisk bakgrund, ju högre värde desto bättre ställt hade man det i barndomen.

4 4. USEP25, USEP30, USEP35, och USEP40 uppnådd socioekonomisk position vid 25-40 års ålder, ju högre värde desto bättre ställt har man det. Mer specifikt skall man utföra följande moment/besvara följande frågor: i. Börja med att grand mean centrera variablerna Intelligens, Utbildning och SEB. ii. Omstrukturera data så att varje person får fyra rader (en för varje mätning av USEP). Skapa en tidvariabel som står för antalet år sedan man fyllde 25 (varje person får alltså fyra värden, nämligen 0, 5, 10 och 15). 1. Analysera Modell 1: Fixed intercept, inga prediktorer, USEP som beroende variabel. Presentera och tolka resultaten. 2. Analysera Modell 2: Random intercept, inga prediktorer, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 1? Vad händer med residualerna jämfört med Modell 1? Finns det någon signifikant variation i USEPinterceptet mellan individer? Vad innebär detta? Presentera och tolka resultaten. 3. Analysera Modell 3: Random intercept, fixed effekt av tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 2? Vad händer med residualerna jämfört med Modell 2? Hur ser effekten av tid på USEP ut? Presentera och tolka resultaten. 4. Analysera Modell 4: Random intercept, random effekt av tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 3? Vad händer med residualerna jämfört med Modell 3? Varierar effekten av tid på USEP signifikant mellan individer? Presentera och tolka resultaten. 5. Analysera Modell 5: Random intercept, random effekt av tid, fixed effekt av intelligens (centrerat) samt interaktionen mellan intelligens (centrerat) och tid, USEP som beroende variabel. Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och intelligens (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 6. Analysera Modell 6: Upprepa Modell 5 men byt ut intelligens mot utbildning (centrerat). Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och utbildning (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 7. Analysera Modell 7: Upprepa Modell 5 men byt ut intelligens mot socioekonomisk bakgrund (SEB) (centrerat). Hur pass bra passar modellen med data jämfört med Modell 4? Hur ser huvudeffekterna av tid och SEB (centrerat) samt deras interaktion ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 4? Presentera och tolka resultaten. 8. Analysera modell 8: Random intercept, random effekt av tid, fixed effekter av intelligens (centrerat), utbildning (centrerat) och SEB (centrerat) samt alla tre tvåvägs interaktionstermer som involverar effekten av tid. Hur pass bra passar modellen med data jämfört med Modell 7? Hur ser huvudeffekterna och interaktionerna ut? Hur tolkas dessa resultat? Vad händer med residualerna samt med variansen i interceptet och i effekten av tid mellan individer jämfört med Modell 7? Presentera och tolka resultaten. Inlämning Döp din text antingen till Uppgift om regression och ANOVA eller Uppgift om MLM och SEM beroende på vilka uppgifter du utfört. För en viss grad av anonymitet bör du inte ange

5 ditt namn i den text som du skickar in dock skall namnet anges tydligt i det mejl som texten bifogas till. Fördjupningsuppgiften mejlas till följande två adresser (båda två): 1) kimmo.sorjonen@ki.se 2) kimmo.sorjonen.ki@analys.urkund.se I urkund görs en plagieringskontroll och om texten är plagierad så riskerar man att bli avstängd från sin utbildning. DET ÄR ALLTSÅ FÖRBJUDET ATT PLAGIERA REDAN EXISTERANDE TEXTER. Bedömning & Betygsättning Inlämningsuppgiften bedöms och betygsätts utifrån följande kriterier: A. Uppfylls instruktionerna? (helt = 2; hyfsat = 1; nej = 0) B. Verkar beräkningarna vara korrekt utförda? (helt = 2; hyfsat = 1; nej = 0) C. Innehåller texten felaktiga påståenden? (nej = 2; mindre allvarliga = 1; flera/grova = 0) D. Har uppgiften lämnats in i tid? (ja = 1; nej = 0) För betyget Godkänd krävs minst en poäng på VARDERA kriteriet A-C ovan. För betyget Väl Godkänd krävs minst en poäng på VARDERA kriteriet A-D ovan samt att man utfört Uppgiften om multilevel modeling (MLM) OCH Uppgiften om structural equation modeling (SEM).