STOCKHOLMS UNIVERSITET Psykologiska institutionen Psykologi III, VT 2012. Fristående kurs FACIT!!! (bara facit, inga tolkningar) Skrivning i Psykologi III metod, fristående kurs: Metod och Statistik avsnitt 3, fredagen den 23 mars 2012, kl 9-14 INSTRUKTION 1. Skriv din kod i rutan ovan. 2. Redovisa svaren i nummerordning på lösa papper (utdelade av skrivningsvakten), svara ej på dessa sidor! Skriv tydligt din kod på samtliga ark på vilka du besvarar frågorna. 3. Efter skrivningen skall samtliga papper (fortfarande ihopbuntade) lämnas till skrivvakten. 4. Redovisa dina beräkningar så pass utförligt (formler du använt etc) att det klart framgår att du förstått vad du gjort och hur du kommit fram till svaret. Saknas formler eller dylikt blir det poängavdrag även om svaret skulle vara rätt! 5. Tillåtna hjälpmedel: Formel- och tabellsamling som delas ut av skrivningsvakten samt egen miniräknare. SKRIV EJ NEDAN! - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Skrivningsresultat: Fråga Max poäng Erhållen poäng Fråga Max poäng Erhållen poäng 1 (6) 6 (6) 2 (3) 7 (4) 3 (2) 8 (3) 4 (1) 9 (1) 5 (1) 10 (13) Totalt antal poäng: Betyg = A B C D E F 40-35 34,5-31 30,5-28 27,5-24 23,5-20 19,5-0
1. För att undersöka om man med olika dieter på kort tid kan påverka folks intelligens fördelades 50 undersökningsdeltagare slumpmässigt och jämt till fem dieter som deltagarna fick hålla sig till under en vecka. När veckan var slut fick samtliga göra ett IQ-test varpå följande resultat erhölls: A B C D E Medelvärde 90 95 100 105 110 Standardavvikelse 15 13 16 17 14 a) Utför lämplig signifikansprövning och tolka resultatet (3 p)! F = 625/227 = 2,75. Kritisk gräns,05 F 4, 45 = 2,61, dvs signifikant! Eta 2 =,197 b) Forskarna upptäckte att de hade randomiserat lika många män som kvinnor till var och en av de fem dieterna. De utförde då en 2 X 5 ANOVA med kön och diet som grupperingsfaktorer. Det visade sig att män och kvinnor hade samma genomsnittliga IQ men att det fanns en interaktionseffekt kön X diet. Illustrera hur denna interaktionseffekt skulle kunna se ut med en figur och med en medelvärdestabell (du behöver inte se till att interaktionseffekten du beskriver verkligen blir signifikant) (2 p) T.ex: Män 100 100 100 100 100 Kvinnor 80 90 100 110 120 c) Namnge ett (och endast ett) post hoc-test med vars hjälp du skulle kunna beräkna om diet E är signifikant bättre än diet C (1 p) Scheffé testet 2. Rita ett diagram som visar hur power ökar med ökande populationskorrelationskoefficient givet en alfanivå på 0.05 och en stickprovsstorlek på 37 undersökningsdeltagare! Utgå i diagrammet från populationskorrelationskoefficenterna 0.20, 0.30 och 0.40 (3 p)! För ρ = 0.20: δ = 0.2 36 = 1.2 vilket ger power = 0.22 För ρ = 0.30: δ = 0.3 36 = 1.8 vilket ger power = 0.44 För ρ = 0.40: δ = 0.4 36 = 2.4 vilket ger power = 0.67 3. Forskning har visat att folks avståndsbedömningar påverkas av om de får hålla i två tunga matkassar när de gör bedömingen jämfört med om de bär på två tomma matkassar. För avstånd i området 50-200 m och kassar som väger ca 8 kg brukar
effektstyrkan ligga kring d = 0.25. Per vill göra en sådan här undersökning till sin c- uppsats. Han tänker ställa sig utanför universitetets tunnelbanestation och haffa folk på väg till Södra husen. I förväg har han valt ut ett träd som han mätt upp ligger precis 107 m från den plats där han tänkte göra försöket och med sig tänkte han ha två matkassar som innehåller fyra enliters mjölkpaket vardera. Varannan person som han stoppar kommer att få bedöma avståndet till trädet medan de håller i de två matkassarna och varannan får göra avståndsbedömningen medan de håller i två tomma matkassar. Hur många undersökningsdeltagare behöver han totalt för att ha 70% sannolikhet att få signifikant (på 5%-nivån) resultat? Om han i stället ville ha en β på 10%, hur många deltagare hade han behövt då? (2 p) För power = 0,7 blir δ = 2,5, vilket ger n = 2(2,5/0,25) 2 = 200 per betingelse = 400 totalt (Även svaret För power = 0,7 blir δ = 2,4, vilket ger n = 2(2,4/0,25) 2 = 184 per betingelse = 368 totalt godkänns liksom interpoleringar mellan dessa två möjliga deltavärden) För power = 0,9 blir δ = 3,2, vilket ger n = 2(3,2/0,25) 2 = 328 per betingelse = 656 totalt (Även svaret För power = 0,7 blir δ = 3,3, vilket ger n = 2(3,3/0,25) 2 = 348 per betingelse = 696 totalt godkänns liksom interpoleringar mellan dessa två möjliga deltavärden) 4. Antag att = 25%, hur stor power har vi då? (1 p) 0,75 5. Om F-kvoten som beräknats i en envägs oberoende ANOVA blir 1.0 eller mindre, kan nollhypotesen förkastas på 5%-nivån? Svara Ja, Nej, eller Det beror på stickprovsstorleken (1 p) Nej 6. I kapitel 18 i Statistik för beteendevetare kan man läsa om olika statistiska fallgropar. Redogör för vad som kännetecknar dessa två fallgropar och hur man lämpligen bör förhålla sig till dom. Utgå från egna exempel! (6 p) Se kap 18 7. Lektor Svensson randomiserade 15 män och 15 kvinnor till tre undervisningsmetoder. Därefter undervisade hon studenterna med respektive metod under en termin. Sista dagen på terminen fick alla studenterna skriva en tenta på vilken man maximalt kunde få 10 poäng. Antal poäng som respektive student fick på tentan redovisas i tabellen nedan. Utför lämplig signifikansprövning och tolka resultatet. Ledtråd: SST = 130. (4 p) Metod A Metod B Metod C Män 1, 2, 3, 4, 5 1, 2, 3, 4, 5 1, 2, 3, 4, 5 Kvinnor 3, 4, 5, 6, 7 1, 2, 3, 4, 5 5, 6, 7, 8, 9 Varianskälla SS df MS F Eta 2 Kön** 30 1 30 12,23 Metod* 20 2 10 4,15 Kön X Metod* 20 2 10 4,15 Inom celler 60 24 3 Totalt 130 29 *p<,05; **p<,01
8. Vilken färg av blå, gul, röd och grön är snyggast på Sonkias nya mobiltelefon XZ2007? För att kolla detta (och om det ö h t finns belägg för att de olika färgerna på XZ2007 är olika snygga) fick ett antal slumpmässigt valda undersökningsdeltagare bedöma fyra varianter av XZ2007 (en för varje färg) på följande skala: 1 2 3 4 5 6 7 8 9 10 Jätteful Jättesnygg Bedömningarna matades in i SPSS och efter diverse menyval kom följande resultat ut: Within-Subjects Factors Measure: MEASURE_1 färg 1 2 3 4 Dependent Variable blå gul röd grön blå gul röd grön Descriptive Statistics Mean Std. Deviation N 4,7917 1,26422 96 5,2604 1,46715 96 4,9688 1,57248 96 5,0313 1,41014 96 Measure: MEASURE_1 Mauchly's Test of Sphericity b Within Subjects Effect färg Epsilon a Approx. Greenhous Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound,902 9,686 5,085,936,968,333 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: färg Tests of Within-Subjects Effects Measure: MEASURE_1 Source färg Error(färg) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum Partial Eta of Squares df Mean Square F Sig. Squared 10,799 3 3,600 2,651,049,027 10,799 2,809 3,844 2,651,053,027 10,799 2,904 3,719 2,651,051,027 10,799 1,000 10,799 2,651,107,027 386,951 285 1,358 386,951 266,887 1,450 386,951 275,854 1,403 386,951 95,000 4,073 Hjälp forskarna på Sonkia att tolka resultatet! (3 p) Inget signifikant samband mellan färg och bedömning 9. Illustrera med lämplig figur resultatet från en 2 X 3 ANOVA som visar på två huvudeffekter och en interaktionseffekt! (1 p) T.ex. som uppgift 7:
10. För 35 studenter på en viss statistikkurs mättes antalet timmar de lade ner på studier (PLUGG), antal föreläsningar de bevistat (FÖRELÄSN) samt antal poäng de fick på tentan (TENTA). Data matades in i SPSS och en multipel regressionsanalys beräknades. Output från SPSS redovisas nedan (13 p). a) Tolka den multipla korrelationen, R. b) Tolka R 2. c) Vad är skillnaden mellan R 2 och R 2 Adj? Tolka R 2 Adj. d) Vad säger ANOVA-tabellen i det här sammanhanget? e) Predicera vilken poäng på tentan en person som lagt ner 100 timmar på studier och som bevistat 20 föreläsningar kommer att få. f) Hur stor är den standardiserade regressionskoefficienten för antal timmar som lagts ner på studier? Vad betyder detta värde? g) Är regressionskoefficienten för antal timmar som lagts ner på studier signifikant? h) Vad är (i detta sammanhang) viktigast för vilken poäng man får på tentan, antal timmar som man lagt ner på studier eller antal föreläsningar man bevistat? i) Hur stor är den partiella korrelationen mellan antal bevistade föreläsningar och tentapoäng? Vad betyder detta värde? j) Hur stor är den semipartiella korrelationen mellan antal bevistade föreläsningar och tentapoäng? Vad betyder detta värde? k) Rita ett diagram där det framgår hur stor del av variansen i tentapoäng som kan relateras till varians i antal bevistade föreläsningar samt hur stor ökning i andel förklarad varians man får om man lägger till antal timmar spenderade på studier. l) Rita ett diagram där det framgår hur stor del av variansen i tentapoäng som kan relateras till varians i antal timmar spenderade på studier samt hur stor ökning i andel förklarad varians man får om man lägger till antal bevistade föreläsningar. m) Beräkna R utifrån något av diagrammen du ritade ovan. a) Den multipla korrelationskoefficienten mellan å ena sidan antalet timmar studenterna lade ner på studier och antal föreläsningar de bevistade och å andra sidan antalet poäng på tentan som de fick blev R = 0,63. Detta innebär att den bivariata korrelationen mellan studenternas faktiska poäng på tentan och deras utifrån regressionsekvationen predicerade poäng på tentan är r = 0,63.
b) R 2 =,396 vilket innebär att 39,6% ( 0,632, ej exakt på grund av avrundningsfel) av variansen i poäng på tentan kan relateras till varians i antalet timmar studenterna lade ner på studier och varians i antal föreläsningar de bevistade. c) R 2 är inte väntevärdesriktig. För att få en väntevärdesriktig uppskattning av hur stor del av variansen i poäng på tentan i populationen som kan relateras till varians i antalet timmar spenderade på studier och varians i antal bevistade föreläsningar måste vi beräkna R2Adj. Denna blir,359, det vill säga 35,9%. d) ANOVA-tabellen säger att R är signifikant större än vad som kan förväntas av en slump (F2, 32 = 10,50, p < 0,001). e) = 0,354 + 0,349 20 + 0,183 100 = 25,634 26 timmar. f) För antal timmar spenderade på studier var β= 0,498. Detta innebär att en ökning av antalet timmar som en viss student spenderar på studier med en hel standardavvikelseenhet, men med antalet föreläsningar som studenten bevistat konstanthållet, gör att vi ökar vår prediktion av studentens tentaresultat med ungefär en halv (0,498) standardavvikelseenhet. g) Ja, regressionskoefficienten för antal timmar som lagts ner på studier är signifkant (t = 3,541, p = 0,001). h) Eftersom den standardiserade regressionsvikten för antal timmar spenderade på studier (0,498) var större än den standardiserade regressionsvikten för antal bevistade föreläsningar (0,293) är antal timmar spenderade på studier viktigast vid prediktionen av tentaresultatet. i) Den partiella korrelationen mellan antal bevistade föreläsningar och tentapoäng, med antal timmar spenderade på studier konstanthållen (vi tar bort all variation som har med antal timmar spenderade på studier att göra från både antal bevistade föreläsningar och från tentapoängen) blev = 0,345. j) Den semipartiella korrelationen mellan antal bevistade föreläsningar och tentapoäng, med variationen från antal timmar spenderade på studier borttagen från antal bevistade föreläsningar blev = 0,286.
Genom att kvadrera de vanliga och de semi-partiella korrelationskoefficienterna kan vi rita följande diagram som visar andel varians i tentapoäng som kan förklaras av de två prediktorerna: k) l) m) R 2 = 0,160 + 0,236 =,396, vilket innebär att, alternativt: R2 = 0,082 + 0,315 =,397, vilket innebär att (skillnaderna beror på avrundningsfel). Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1,630 a,396,359,505 a. Predictors: (Constant), plugg, föreläsn
ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 5,367 2 2,683 10,503,000 a Residual 8,176 32,255 Total 13,543 34 a. Predictors: (Constant), plugg, föreläsn, b. Dependent Variable: tenta Coefficients a Unstandardized Coefficients Model B Std. Error 1 (Constant),354,325 föreläsn,349,168 plugg,183,052 Coefficients a Standardized Coefficients Correlations Model Beta t Sig. Zero-order Partial Part 1 (Constant) 1,089,284 föreläsn,293 2,081,046,400,345,286 plugg,498 3,541,001,561,531,486 a. Dependent Variable: tenta