chi 2 : A B A: B: p-värde: A B K M K M phi A B Ja 25 50 75 Ja 50 100 150 Nej 75 50 125 Nej 150 100 250 100 100 200 200 200 400 (2 tentor av 8)



Relevanta dokument
I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Parametiskt vs. icke-parametriskt

OBS! Vi har nya rutiner.

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Linjär regressionsanalys. Wieland Wermke

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

FACIT!!! (bara facit,

Medicinsk statistik II

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner.

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

Att välja statistisk metod

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

ANOVA Mellangruppsdesign

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Maximalt antal poäng för hela skrivningen är 31 poäng. För Godkänt krävs minst 19 poäng. För Väl Godkänt krävs minst 25 poäng.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Statistik och epidemiologi T5

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

MSG830 Statistisk analys och experimentplanering

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Kritisk granskning av forskning

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Multipel Regressionsmodellen

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Maximalt antal poäng för hela skrivningen är 20 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 17 poäng.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

OBS! Vi har nya rutiner.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!

Uppgift 1. Produktmomentkorrelationskoefficienten

OBS! Vi har nya rutiner.

Statistisk försöksplanering

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

EXAMINATION KVANTITATIV METOD

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Statistisk försöksplanering

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Samhällsvetenskaplig metod, 7,5 hp

Differentiell psykologi

Höftledsdysplasi hos dansk-svensk gårdshund

ANOVA Faktoriell (tvåvägs)

OBS! Vi har nya rutiner.

Forskningsmetod II Korrelation och regression

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Identifikationsnummer:... Tentamen: Statistik & Metod (2PS020), Psykologprogrammet, Termin 8 Datum:

OBS! Vi har nya rutiner.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Repetitionsföreläsning

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen består av 14 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Föreläsning G60 Statistiska metoder

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

7.5 Experiment with a single factor having more than two levels

Datorlaboration 2 Konfidensintervall & hypotesprövning

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

OBS! Vi har nya rutiner.

Beskrivning av litteraturen Kursen i Vetenskapsteori, Psykologprogrammet, T5

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Uppgift 1. Deskripitiv statistik. Lön

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Sänkningen av parasitnivåerna i blodet

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

FACIT (korrekta svar i röd fetstil)

Tentamen i Metod C-kurs

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Tentamen för kursen. Linjära statistiska modeller. 16 augusti

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Hur skriver man statistikavsnittet i en ansökan?

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Transkript:

Parametiskt vs. icke-parametriskt 1. Icke-parametriska analysmetoder kallas med ett annat ord för fördelningsfria analyser. Hur förklarar du relevansen hos detta begrepp? Och vad står parametrisk och dess motsats icke -parametrisk för? 2. Vad tar du hänsyn till när du ska välja mellan att använda parametrisk eller icke-parametrisk statistik? Ge exempel på tre icke-parametriska alternativ till vanliga parametriska analyser eller sambandsmått. (Obs! Tydliga benämningar behövs) (2 tentor av 8) 3. Du står inför några analysuppdrag och har konstaterat att dina data inte klarar av parametrisk statistik. Hur löser du följande uppgifter? Svaren kan vara korta (t ex namnet på ett sambandsmått) men de behöver vara exakta. Så tänk efter innan du svarar! a) Uttrycka sambandsstyrkan mellan fasadfärgen på hus (röd/vit/blå) och ort (Uppsala/Falun) Annan tenta: Uttrycka sambandsstyrkan mellan variablerna bostadsområde (Gottsunda/Luthagen) och invånarnas sjukskrivningsstatus (sjukskriven/icke-sjukskriven). b) Uttrycka den centrala tendensen för poäng från ett prov. c) Undersöka och uttrycka sambandet mellan för- och eftermätningsvärden i samband med depressionsbehandling. d) Analysera skillnaden mellan för- och eftermätningsvärden i samband med depressionsbehandling. (så att du kan avgöra om en förändring var signifikant eller inte) (3 tentor av 8) 4. Som bekant så finns det icke-parametriska alternativ till vissa vanliga parametriska analyser och sambandsmått. Nedan ser du namnen på några analysmetoder och sambandsmått. Din uppgift är att fylla i den icke-parametriska eller parametriska motsvarigheten till analysmetoden/sambandsmåttet som redan finns i listan. (Namnen du använder ska vara entydiga så att ingen tveksamhet råder kring vilken analys/sambandsmått du avser) Icke-parametriskt Parametriskt? Pearsons r Mann-Whitneys U test?? Beroende (inomgrupps) t-test 5. Nedan ser du två fyrfältstabell A och B med observerade värden ifyllda. Gör en jämförelse mellan de två tabellerna betr den relativa storleken av förmodat chi 2 -värde, p-värde och phi. Ange om dessa är lika eller olika stora för tabellerna A och B. Du svarar enklast genom att notera något av tecknen >, =, < mellan A och B här nedan.obs! Du behöver absolut inte beräkna någonting för att kunna svara på frågan. OBS OBS!! Tänk efter ordentligt, slarva inte! chi 2 : A B A: B: p-värde: A B K M K M phi A B Ja 25 50 75 Ja 50 100 150 Nej 75 50 125 Nej 150 100 250 100 100 200 200 200 400 (2 tentor av 8) Korrelation 6. Pearson s korrelationskoefficient (r) har förmågan att uttrycka sambandets styrka och riktning. Redogör för logiken bakom detta sambandsmått. Vad bygger den på och vad är det man intresserar sig för vid beräkningen av korrelationskoefficienten? OBS! Ditt svar behöver inte innehålla någon formel. (2 tentor av 8) 7. Bivariat korrelation, partialkorrelation, multipel korrelation. Förklara vad dessa är för någonting, vad de uttrycker och i vilka sammanhang de kommer till användning. Illustrera begreppet förklarad varians i samband med alla tre. 8. Vilket sambandsmått skulle du välja att använda i följande fall? Motivera kort! a) Du har tillgång till placeringarna från barn som har tävlat i höjdhopp och längdhopp och vill studera sambandet mellan dessa.

b) Från en annan höjdhoppstävling har du tillgång till deltagarnas kroppslängd och höjden de klarade av i tävlingen och är intresserad av sambandet mellan dessa två variabler. c) Du vill uttrycka sambandet mellan kön och användning av mössa när det är 10 C ute. Regression 9. På din PTP-arbetsplats kommer en AT-läkare (som saknar den gedigna metodutbildningen du har fått) fram till dig och undrar: Jag är lite förvirrad över det här med korrelation och regression, på något sätt verkar dom höra ihop men å andra sidan är dom ju inte samma sak heller. Kan du förklara för mig hur det ligger till med detta? Kan du reda ut begreppen? Vad har korrelation och regression gemensamt och vad är det som är utmärkande för dem för sig? Vad får vi ut av respektive metoder? Försök att beskriva väsentligheterna för dessa metoder utan att fördjupa dig i alla detaljer (= max en A4-sida). 10. Hur anpassas regressionslinjen (dvs hur ska den "dras") i förhållande till observationerna i samband med en regressionsanalys? Förklara principen bakom det hela och belys relevanta begrepp som felvarians, förklarad varians, residual, kvadratsumman. Illustrera med en figur. 11. En kursare till dig hävdar att hon/han under sitt uppsatsarbete har hittat ett starkt samband mellan två intressanta variabler. Som bevis visar hon/han ett tydligt lutande regressionslinje mellan variablerna. Köper du detta? Har linjens lutning någonting med sambandets styrka att göra? Hur bestäms lutningen egentligen? Motivera din ståndpunkt! 12. Vi har genomfört en regressionsanalys med OBVn antal goda gärningar under året gentemot BVn antal julklappar. Enligt resultatet är regressionskoefficienten b = 0,1. Den standardiserade regressionskoefficienten (ßvikten) är 0,3. Utnyttja denna information och ge mig dina mest exakta förklaringar till vad som händer med BVn när värdet på OBVn ändras! (svaret kan ändå vara kort) 13. Vi har genomfört en regressionsanalys med OBVn antal lästa timmar gentemot BVn tentaresultat (poäng). Enligt resultatet är regressionskoefficienten b = 1. Den standardiserade regressionskoefficienten (ß-vikten) är 0,5. Utnyttja denna information och ge mig dina mest exakta förklaringar till vad som händer med BVn när värdet på OBVn ändras! (svaret kan ändå vara kort) 14. Nedan ser du spridningsdiagrammen A, B och C som illustrerar olika typer av samvariation mellan variablerna X och Y. Mätskalorna skiljer sig inte åt mellan diagrammen. Svara på följande frågor. a) I vilket diagram finner du den högsta korrelationen?... b) I vilket diagram finner du den lägsta korrelationen?... c) Vilket diagram motsvarar den högsta icke-standardiserade regressionkoefficienten (b)?... d) Vilket diagram motsvarar den högsta standardiserade regressionkoefficienten (Beta, ß)?... Y A Y B X X Y C X

Multipel regression 15. Följande frågor handlar om multipel regressionsanalys. De kan besvaras relativt kort. a) Vilka tre generella syften kan vi ha för att använda multipel regression? b) Vilka huvudtyper av multipel regression finns det? c) Hur väljer du mellan olika huvudtyper beroende på vilket generellt syfte du har för din analys? d) Utöver bivariat korrelation behövs två andra typer av korrelation för att kunna genomföra en multipel regressionsanalys. Vilka är dessa två och vad är deras roll i samband med multipel regressionsanalys? (2 av 8) 16. Två oberoende variabler X och V har ingått i en multipel regressionsanalys i syfte att förklara varians i beroendevariabeln Y. Enligt analysresultatet är felvariansen 50 %. Den bivariata korrelationen mellan X och Y är: r xy = 0,70 och mellan X och V: r xv = 0,00. Hur mycket varians i Y förklaras av X och V tillsammans? Hur mycket varians i Y förklaras av enbart V? 17. Två oberoende variabler X och V har ingått i en multipel regressionsanalys i syfte att förklara varians i beroendevariabeln Y. - mellan X och Y är: r xy = 0,40 - mellan V och Y är: r vy = 0,30 - mellan X och V: r xv = 0,00 Hur mycket varians i Y förklaras av X och V tillsammans? (Redogör för din beräkning.) Hur stor är felvariansen? 18. Ange vilka av följande omständigheter kan omöjliggöra användningen av eller orsaka problem i samband med multipel regressionsanalys. (3 poäng) beroendevariabeln är på nominalskalenivå hälften av oberoende variabler är på nominalskalenivå sampelstorlek = 20 du finner icke-linjära samband mellan oberoende och beroende variabler avsaknaden av outliers höga korrelationer mellan oberoende variabler 19. En multipel regressionsanalys med standardmetoden har genomförts i syfte att avgöra hur olika faktorer bidrar till oro i klassrum i grundskolan. OBV 1: antalet elever i klassen OBV 2: lärarens tjänsteår BV: stökindex (en kontinuerlig skala från 0-10, högre värde >> mer stök) Resultatet av en multipel regressionsanalys med standardmetoden visade följande. b Beta (ß) Antalet elever i klassrummet 0,2 0.2 Lärarens tjänsteår - 0,4-0.1 a) Vad är den sannolika förklaringen till att standardmetoden har valts till denna analys? Vad heter de två andra huvudtyperna av multipel regression (namnen räcker)? b) Har lärarens tjänsteår eller antalet elever i klassen mest betydelse för att förklara varians i stökighet i klassrummet? Ge en fullständigt övertygande motivering för din ståndpunkt. 20. Att handla julklappar kan vara stressigt. Resultatet från en studie som använde sig av regressionsanalys visade följande. Oberoende variabel: antal timmar på stan

Beroende variabel: antal poäng på stresskalan vid hemfärden (skala 0 20, hög poäng betyder hög stress) a = 2 b = 4 a) Hur tolkar du detta resultat i klartext? Denna studie följdes upp med en ny studie där man lade till ytterligare en oberoende variabel, nämligen antalet personer som man behöver köpa julklappar till. Resultatet av en multipel regressionsanalys med standardmetoden visade bl a följande. b Beta (ß) Antal timmar på stan 2 0.3 Antal personer som behöver en julklapp 3 0.3 b) Hur tolkar du resultatet? c) Hur tolkar du det förhållandet att regressionskoefficienten för antal timmar på stan är lägre i den andra studien jämfört med den första? Varians / ANOVA 1. Vilka nollhypoteser testas i a) en envägs-anova och b) en tvåvägs-anova? (1p) 2. I en oberoende envägs-anova kan den totala variansen delas upp i mellangruppsvarians (systematisk varians) och inomgruppsvarians (felvarians). Vad menas med mellangruppsvarians och vad menas med inomgruppsvarians och hur används dessa för att beräkna F-kvoten? 3. I en oberoende envägs-anova kan den totala variansen delas upp i två delar, inomgruppsvarians (felvarians) och mellangruppsvarians (systematisk varians). Vad menas med inomgruppsvarians och vad menas med mellangruppsvarians? (2 tentor av 8) 4. Redogör för de fyra antaganden angående data som måste vara uppfyllda för att du skall kunna genomföra en oberoende envägs-anova. (2 tentor av 8) 5. Förklara begreppen (a) huvudeffekt (main effect) och (b) interaktionseffekt. 6. När är det viktigt att studera enkla effekter (simple effects)? 7. Du genomför en tvåvägs-anova på data från studie X och en tvåvägs-anova på data från studie Z. I studie X hittar du en signifikant huvudeffekt, en icke signifikant huvudeffekt och en icke signifikant interaktionseffekt. I studie Z hittar du ingen signifikant huvudeffekt men en signifikant interaktionseffekt. I en av dessa studier är det viktigt att studera enkla effekter (simple effects). Vilken? Varför? 8. Exemplifiera en mixed ANOVA med en av dig påhittad studie där du beskriver de ingående variablerna och anger (i) vilken eller vilka variabler som är oberoende variabler och (ii) vilken variabel som är den beroende variabeln. Ange även (iii) på vilken skalnivå din beroendevariabel ligger. A) Vilken betydelse har ordet mixed i en two-way mixed ANOVA? B) När och varför använder man sig av ett kontrast test? C) Vad är den huvudsakliga skillnaden mellan a priori test och post hoc test? 9. När och varför använder man sig av a priori test och post hoc test, samt vilken är den huvudsakliga skillnaden mellan a priori och post hoc test? När kan man använda sig av en ensvansad signifikansprövning? 10. När och varför använder man sig av a priori test och post hoc test? Vad är den huvudsakliga skillnaden mellan a priori test och post hoc test? (2 tentor av 8) 11. Du vill undersöka effekten av tre olika träningsmetoder (A, B, C) för terränglöpare. Du delar slumpmässigt in 60 löpare i tre grupper om vardera 20 löpare. Under 6 månader får Grupp A träna enligt metod A, Grupp B enligt metod B och Grupp C enligt metod C. Innan träningsperiodens början (Tid 1) och efter träningsperiodens slut (Tid 2) mäter du hur snabbt löparna springer 10km terränglöpning. För att analysera resultatet genomför du en ANOVA med

träningsmetod och tidpunkt som oberoende variabler (OBV) och löptid som beroende variabel (BV). Resultaten presenteras i tabellen nedan. a. Vilken typ av ANOVA är genomförd (envägs/tvåvägs, oberoende/beroende/mixed etc.)? (1p) b. Hur tolkar du resultatet? (1p) c. Vilka ytterligare analyser av resultatet skulle du vilja göra? (1p) Effect Intercept Grupp Error TID TID*Grupp Error SS Degr. of Freedom MS F p 327033,0 1 327033,0 1752,874 0,000000 33,2 2 16,6 0,089 0,915107 10634,5 57 186,6 245,1 1 245,1 34,426 0,000000 3,7 2 1,9 0,260 0,771856 405,8 57 7,1 12. Du undersöker effekterna av tre olika träningsmetoder (A, B och C). Du tar 30 hundrameterslöpare (15 män och 15 kvinnor) och delar slumpmässigt in dem i tre grupper (5 män och 5 kvinnor i varje grupp). Under en månad får Grupp A träna med metod A, Grupp B får träna med metod B och Grupp C får träna med metod C. Vid två tillfällen, dels dagen före träningsmånadens början (Tid 1) och dagen efter träningsmånadens slut (Tid 2), mäter du hur snabbt löparna springer 100 meter. Du genomför en ANOVA med träningsmetod och kön som oberoende variabler och förändringen mellan mätning 1 och mätning 2 (dvs. Tid 1 Tid 2) som beroende variabel. Resultatet presenteras i tabellen nedan. Är ANOVA n oberoende (between groups) eller beroende (within groups)? Är det en envägs ANOVA (one-way), tvåvägs ANOVA (two-way) eller trevägs ANOVA (three-way)? Hur tolkar du resultatet? (3p) 13. Du undersöker effekterna av tre olika träningsmetoder (A, B och C). Du tar 30 hundrameterslöpare (15 män och 15 kvinnor) och delar slumpmässigt in dem i tre grupper (15 män och 15 kvinnor i varje grupp). Under en månad får Grupp A träna med metod A, Grupp B får träna med metod B och Grupp C får träna med metod C. Vid två tillfällen, dels dagen före träningsmånadens början (Tid 1) och dagen efter träningsmånadens slut (Tid 2), mäter du hur snabbt löparna springer 100 meter. Du genomför en oberoende två-vägs ANOVA med träningsmetod och kön som oberoende variabler och förändringen mellan mätning 1 och mätning 2 (dvs. Tid 1 Tid 2) som beroende variabel. Resultatet presenteras i tabellen nedan. Hur tolkar du resultatet?

14. En forskare hade hypotesen att onlinerollspel av typen World of Warcraft i större utsträckning än andra aktiviteter på Internet var associerade med överdrivet spelande och beroendeliknande symptom ( Internetberoende ). Hon administrerade därför Youngs (1998) test för att mäta internetberoende till (1) en grupp World of warcraft -spelare, (2) en annan grupp som primärt använde sig av email och chat när de var online och (3) en tredje grupp som primärt använde Internet till att surfa och läsa nyheter. Testpoängen ligger på en kvotskala och går från 0 till 20. Hon var dessutom intresserad av att studera om det fanns några relevanta könsskillnader, då tidigare forskning visat att män i större utsträckning än kvinnor får höga poäng på test som mäter internetberoende. a) Du överväger att använda t-test, envägs ANOVA eller faktoriell ANOVA. Resonera kring för- och nackdelar med dessa metoder i just detta sammanhang. Vilken metod väljer du? b) Om F-värdet är högt (signifikant) i den ANOVA du räknar ut, hur förhåller sig då mellangruppsvarians, inomgruppsvarians, felvarians och systematisk varians till varandra i just detta exempel? 15. Du är intresserad av att studera olika typer av musiks påverkan på intelligensen. Du rekryterar 30 studenter från Uppsala universitet och fördelar dem slumpmässigt i tre grupper. Alla skall under tre timmar varje dag i en månad lyssna på musik. De i Grupp A får lyssna på de gamla synthikonerna Depeche Mode, de i Grupp B får lyssna på smäktande ballader av Julio Iglesias och Grupp C får lyssna på diverse klassisk musik. Vid månadens slut utför du ett intelligenstest. Du utför därefter en ANOVA med musik som oberoende variabel och intelligenskvot som beroende variabel. Resultatet syns nedan (på nästa sida). A) Är din ANOVA one-way eller two-way? B) Vilken/vilka nollhypotes/er undersöker du? C) Som du ser så är resultatet signifikant, vad innebär det? D) Vilka ytterligare analyser bör du göra? IQ: Sum of Squares df Mean Square F Sig. Between Groups 2166.667 2 1083.333 12.447.000 Within Groups 2350.000 27 87.037 Total 4516.667 29 16. En forskare utför en studie med tre grupper (betingelser) och är intresserad av huruvida dessa grupper skiljer sig på en beroende variabel. Han väljer en signifikansnivå på.05 (dvs. =.05) och utför sedan tre t-test (Grupp A mot Grupp B, Grupp A mot Grupp C och Grupp B mot Grupp C). Det visar sig att det finns en signifikant skillnad mellan Grupp A och Grupp C. Han hävdar att sannolikheten för att den signifikanta skillnaden mellan Grupp A och Grupp C skulle ha skapats av slumpen är 5 %. Har han rätt? Förklara.

Du genomför en studie där du är intresserad av huruvida kaffe påverkar människors reaktionsförmåga. Du gör en ANOVA med n_koppar (0 koppar, 1 kopp, 2 koppar eller 3 koppar) oberoende variabel och reaktionstid som beroende variabel. Resultatet finns nedan. Vad kan du säga om resultatet? 17. Du genomför en studie där du är intresserad av huruvida kaffe påverkar människors reaktionsförmåga. Eftersom du är intresserad av eventuella könsskillnader rekryterar du försökspersoner så att 50 % är kvinnor och 50 % är män. Du gör en ANOVA med kaffeintag (0 koppar, 1 kopp, 2 koppar eller 3 koppar) och kön som oberoende variabler och reaktionstid som beroende variabel. Resultatet finns nedan. Är din ANOVA one-way eller two-way? Vilka signifikanta huvudeffekter och/eller interaktionseffekter finns? Förklara varför du måsta/inte måste undersöka simple effects? Du bestämmer dig för att göra en kontrast analys, på vilken/a variabel/variabler skall du utföra den på och vilka ytterligare svar skulle denna analys ge? 18. En forskare har undersökt effekten av fyra olika metoder (A, B, C, D) på människors humör. Humörmåttet tillåter parametrisk analys. För att analysera resultatet har forskaren genomfört sex (6) oberoende t-test för att jämföra grupperna inbördes enligt: A-B, A-C, A-D, B-C, B-D, C-D. a. Vad gör forskaren för fel och varför är det fel? b. Hur bör forskaren gått tillväga för att analysera resultatet? Faktoranalys 1. Vilka vetenskapliga frågeställningar kan vi besvara med faktoranalys? 2. Faktoranalys kan användas oberoende av om våra variabler är mätta på samma skala (har samma enhet) eller har samma medelvärde. Förklara kortfattat hur detta är möjligt! 3. Spelar det någon roll för resultatet av en faktoranalys om de ingående variablerna skiljer sig med avseende på medelvärde och varians? Varför/varför inte? 4. Hair diskuterar Q-faktoranalys och R-faktoranalys. Beskriv de två typerna av faktoranalys och vad som skiljer dem åt. När använder man vilken typ av analys? Besvara följande: a) Hur bestäms hur många faktorer man får ut ur en faktoranalys och borde faktor 2 vara med i faktorlösningen i den förra uppgiften? b) Vad beskriver egenvärdet? c) Vad är dubbelladdningar? d) Varför roterar man oftast sin faktorlösning?

5. Chefen tar in dig på sitt rum och ber dig förklara en sak. Chefen har läst en testmanual där orden faktoranalys och egenvärde förekom. Nu undrar chefen vad egenvärdena egentligen står för i en faktoranalys. Du ser det här som en chans att öka respekten för psykologkåren och förklarar. 6. Eftersom du verkade ha så bra koll på egenvärden så har chefen bett dig att konstruera ett mätinstrument som ska screena för somatiska och psykologiska stressymtom. Instrumentet skall innehålla 10 items i var och en av de två sub-skalorna. Beskriv hur du går till väga! Följande termer skall finnas med i ditt svar: förklarad varians, communality, dubbelladdning, oblik och/eller ortogonal rotation. 7. Vad behöver man ta hänsyn till när man ska välja hur många faktorer man vill ha med i sin slutgiltiga faktorlösning? Nämn minst fyra kriterier som man kan använda samt kommentera hur statistiskt hårt eller objektivt varje kriterium kan anses vara. Räkna ut communalities och egenvärden från följande matris av faktorladdningar för två faktorer (OBS! Faktorladdningarna är hypotetiska och valda för att det ska gå att lösa med hjälp av huvudräkning). Faktor 1 Faktor 2 Variabel 1 0.7 0.2 Variabel 2 0.7 0.2 Variabel 3 0.1 0.6 Variabel 4 0.1 0.6 8. Vid konstruktion av frågeformulär är faktoranalys ett viktigt verktyg. Besvara följande frågor. Motivera ditt svar! a) Vad är det minimala antalet frågor (items) som bör ladda högt på en faktor? b) Vilket är det minimala egenvärdet som en faktor bör ha för att anses relevant? c) Vilket antagande gör man angående sina faktorer då man använder oblik rotation? d) Vad är en dubbelladdning och vad kan man göra åt den? 9. Anta att du ska konstruera ett nytt frågeformulär som ska gå att dela upp i olika delskalor. Du väljer strategin att inledningsvis inkludera fler frågor än vad du tänkt ha med i slutändan, i syfte att kunna välja ut de frågor som har de bästa psykometriska egenskaperna. Du har från början med 35 frågor. a) Hur många personer bör fylla i formuläret för att du ska kunna göra en faktoranalys som håller för samtliga 35 frågor? b) Vad bör du ta hänsyn till när du bedömer vilka frågor som inte ska vara med i den slutgiltiga lösningen? Nämn åtminstone två riktlinjer! 10. Föreställ dig att du har ett test med tio frågor som du tror mäter två faktorer. Din roterade faktorlösning ger två faktorer, men hur vill du att faktorladdningarna ska se ut i respektive faktor för att du ska vara övertygad om att testet mäter just två faktorer? Skriv ned en tabell med faktorladdningar (dvs hitta på laddningarna). Nämn andra statistiska mått som har betydelse för din uttolkning (t.ex procent förklarad..) 11. 225 inbitna Star Trek-fans ( trekkies ) fick fylla i en enkät som undersökte deras känslor rörande castingen i den nya Star Trek-filmen. Nedan ser du en tabell som innehåller faktorladdningarna för ett antal variabler. Variabler Factor 1 Factor 2 Factor 3 Ilska 0.77 0.05 0.08 Ironi 0.41 0.47 0.02 Frustration 0.64 0.03 0.04 Förvirring 0.04 0.50 0.60 Oförstånd 0.01 0.05 0.86 Godmodighet 0.05 0.87 0.10 Hämndlystnad 0.68 0.01 0.04

a) Vad är en faktorladdning? b) När man håller på med faktoranalys kan man stöta på ett problem som man försöker lösa genom rotation. Kan du se några tecken på ett eller flera sådana problem i tabellen? Ringa i så fall in dessa. c) Varför är problemet/problemen som ringades in i förra frågan ett problem i faktoranalys? Varför vill vi undvika dessa? d) Kommer faktorernas egenvärden att förändras vid en rotation och i så fall: Varför? (2 tentor av 8) 12. Anna har gjort en faktoranalys av ett frågeformulär med sex frågor. I figur 1 ser du de faktorladdningar som hon fått ut. Vilken av faktorerna beskriver mest varians i hennes data? Hon har problem att tolka resultaten eftersom många av frågorna laddar högt på bägge faktorerna men har hört att man kan rotera sin lösning. Kan du hjälpa henne att, så gott det går med ögonmått, rotera faktorerna ortogonalt så att hon slipper dubbelladdningar (rita figuren i ditt svar)? Metaanalys 1. Metaanalys går ut på att systematisera resultatet från flera studier. Men hur går man till väga? (3 poäng) 2. Metaanalys från A till Ö? Jag vill att du kortfattat beskriver hur man går tillväga. (3p) 3. Du har tillgång till 45 studier inom ett område (t.ex behandling av paniksyndrom). Hur gör du en meta-analys? 4. Meta-analys förutsätter tillgång till studier. Hur bör dessa se ut? Hur kan man avgränsa? Hur gör sen beräkningarna? 5. För att kunna göra en metaanalys behöver de studier man inkluderar innehålla tillräcklig information. Problematisera kring detta! Kan man exempelvis klumpa ihop studier hur som helst? 6. I boken om metaanalys beskrivs en del problem man måste vara vaksam inför när man gör en metaanalys. Nämn minst tre potentiella svårigheter när en metaanalys ska sammanställas. (3 p) 7. En forskare kommer till slutsatsen "Denna metaanalys visar ett den genomsnittliga effektstorleken för parterapi är d=.70". Hur kan hon ha kommit fram till detta? 8. Nämn två problem med signifikanstestning. 9. P-värden är ett sätt för oss att veta om vi ska bry oss om ett resultat. Hur då? Finns det problem med p-värden? (2 poäng) 10. Nämn två risker med att förlita sig alltför mkt på p-värden när man ska värdera forskningsresultat. 11. Nu vet ni att statistisk signifikans inte självklart innebär "kliniskt relevant". Ge några förslag till oss forskare hur vi ska göra för att forskningen ska ge "meningsfulla" resultat? 12. Vilket är mest sant p<.05 eller p<.001? Vill du veta mer innan du svarar? Vad i så fall? (2 p) 13. Varför är p<0.05 bättre än p<0.06? Eller är det inte så? 14. En doktor säger Detta resultat är ju p<0.001 och måste därför vara mer sant än p<0.05. Oturligt nog sitter du i publiken och ställer dig upp för att rätta till missförståndet. Vad säger du?