Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio



Relevanta dokument
Faktoranalys - Som en god cigarr

Intro till SPSS Kimmo Sorjonen (0811)

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Risk Ratio, Odds Ratio, Logistisk Regression och Survival Analys med SPSS Kimmo Sorjonen, 2012

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Idiotens guide till. Håkan Lyckeborgs SPSS-föreläsning 4/ Av: Markus Ederwall, 21488

Kort manual till SPSS 10.0 för Mac/PC

Variansanalys med SPSS Kimmo Sorjonen ( )

Structural Equation Modeling med Amos Kimmo Sorjonen ( )

Multilevel Modeling med SPSS Kimmo Sorjonen ( )

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Mata in data i Excel och bearbeta i SPSS

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Richard Öhrvall, 1

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel vers. 2010

Uppgift 1. Produktmomentkorrelationskoefficienten

Regressions- och Tidsserieanalys - F4

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet. SPSS (PASW) 18 for Windows - a guided tour

Statistik 1 för biologer, logopeder och psykologer

import totalt, mkr index 85,23 100,00 107,36 103,76

Marknadsinformationsmetodik Inlämningsuppgift

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Linjär regressionsanalys. Wieland Wermke

En kort instruktion för arbete i SPSS

En introduktion till och första övning for Excel

F3 Introduktion Stickprov

Histogram, pivottabeller och tabell med beskrivande statistik i Excel

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Datorlaboration 1 Deskriptiv statistik med hjälp av MS Excel

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Differentiell psykologi

Multivariata metoder

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

*****************************************************************************

Föreläsning G60 Statistiska metoder

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

DATORÖVNING 2: STATISTISK INFERENS.

Examinationsuppgifter del 2

DATORÖVNING 3: MER OM STATISTISK INFERENS.

FACIT (korrekta svar i röd fetstil)

Differentiell psykologi

Laboration med Minitab

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Föreläsning 4. Kap 5,1-5,3

Metod och teori. Statistik för naturvetare Umeå universitet

Sammanfattning av dugga 2

Statistiska samband: regression och korrelation

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Matematikcentrum 1(12) Matematisk Statistik Lunds Universitet Per-Erik Isberg. SPSS for Windows 12 - a guided tour

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Grunderna i SPSS Martin Gellerstedt 0. INTRODUKTION KOM IGÅNG MED INMATNING, KODNING OCH DATATRIXANDE... 3

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

ANOVA Mellangruppsdesign

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

Lektionsanteckningar 11-12: Normalfördelningen

STATISTISK ANALYS AV KOMPLEXA DATA

Datainmatning TÄNKTA BETECKNINGAR. Variabelnamn/kolumnbeteckning, Dummyvärden, som matas in beroende på aktuellt svarsalternativ

SPSS En guidad tur. Vad ska jag göra idag? Följ instruktioner som följer, om du behöver hjälp det är bara att fråga en lärare!

samma sätt. Spara varje uppgift som separat Excelfil. För att starta Excel med Resampling-pluginet, välj Resampling Stats for Excel i Start-menyn.

Datorlaboration 2 Konfidensintervall & hypotesprövning

Granskning av en medarbetarenkät. - En explorativ och konfirmativ faktoranalys

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

Laboration 3: Urval och skattningar

Marknadsinformationsmetodik Inlämningsuppgift

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Vägledning till statistisk redovisning i NFTS försöksdokumentation

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Datorövning 1 Enkel linjär regressionsanalys

Sänkningen av parasitnivåerna i blodet

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Kapitel 15: Data/Matrix Editor

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

MMA132: Laboration 2 Matriser i MATLAB

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Handledning för konstruktion av tabeller och diagram med Excel

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Medicinska Bilder, TSBB31. Lab: Mätvärden på Medicinska Bilder

Laboration Fuzzy Logic

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet

Introduktion till SPSS

Datorlaboration 7. Simuleringsbaserade tekniker

Transkript:

Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio med SPSS Kimmo Sorjonen 1. Faktoranalys Innan man utför en faktoranalys kan det vara bra att testa om det finns några outliers i data. Detta kan t.ex. göras genom att beräkna Mahalanobis i regressionsanalysmodulen. Kör in de variabler som skall faktoreras som prediktorer och t.ex. fp-nummer som beroende variabel. Man kan kolla om någon person har en Mahalanobis som är signifikant t.ex. på 0,001-nivån med lika många frihetsgrader som prediktorer. För att utföra en faktoranalys: Analyze Data Reduction Factor. Kör in de variabler som skall faktoreras i rutan Variables. För att testa om data lämpar sig för faktorering: Klicka på Descriptives och välj Antiimage samt KMO and Bartlett s test of sphericity. Klicka på Continue. För hjälp att välja lämpligt antal faktorer: Klicka på Extraction och välj Scree plot. Klicka på Continue. För att få en tydligare faktorstruktur: Klicka på Rotation och välj Varimax (se till att boxen Rotated solution är markerad). Klicka på Continue. Nu är vi redo att köra: Klicka på OK. 1.1 Output I det här exemplet har frågorna 23-34 i listan nedan fatorerats. Data är insamlade med en enkät där respondenter läser om hur en person (t.ex. Lena) slår ner en annan person (t.ex. Johan) efter att ha blivit provocerad. Respondenterna anger sedan vad de tycker om det inträffade genom att svara på påståenden på en skala från 1 (= instämmer inte alls) till 7 (= instämmer helt). Bartlett s testar om korrelationsmatrisen (för de aktuella itemen) i populationen kan antas vara en identitetsmatris (bara nollor utanför diagonalen). Om det skulle vara så skulle data inte lämpa sig för faktorering, så här vill vi gärna se ett signifikant resultat. KMO står för hur mycket ett items varians överlappar med de andra itemens varians och här anges ett medelvärde för de aktuella itemen. En riktlinje är att detta värde bör vara över 0,6 för en vettig faktorering.

2 Här ges kommunaliteter (hur stor andel av variansen som förklaras av alla faktorer). I den initiala lösningen, där antalet faktorer är lika många som antalet item, så förklaras all varians (kolumn 1). I kolumn 2 anges kommunaliteter för den extraherade modellen (i det här fallet med tre faktorer). I diagonalen i denna matris ges KMO för de enskilda itemen. En riktlinje är att värdet inte bör vara mindre än 0,5 (annars kan man fundera på att stryka itemet). Här anges egenvärden för de olika faktorerna (komponenterna) i den initiala lösningen. Även hur stor andel av den totala variansen de förklarar anges (detta är lika med egenvärdet dividerat med antal item). Här anges vilka faktorer som valts ut (de med egenvärden > 1). Här anges egenvärden som faktorerna har efter rotationen. Notera att summan av egenvärden och förklarad varians är den samma som i den initiala lösningen, men att den blivit lite jämnare fördelad mellan de tre faktorerna.

3 Scree Plot: Faktornummer på x-axeln och egenvärde på y- axeln. Lutningen avtar markant vid den tredje faktorn, vilket indikerar att en lösning med två faktorer skulle kunna vara lämplig. Oroterade faktorladdningar. Denna kan ignoreras till förmån för den roterade varianten. Roterad faktorlösning. Faktor 3 innehåller bara två höga laddningar, vilket är lite fjuttigt. Detta, tillsammans med Scree Plot, talar för att man skulle kunna testa en lösning med två faktorer (se nedan). Värdena i den här rutan anger hur den roterade faktorlösningen åstadkoms utifrån den oroterade. 1.2 Ändra antalet faktorer Vi gör om analysen, men istället för att låta programmet välja ut alla faktorer med egenvärden > 1 så säger vi till den att extrahera två faktorer. I faktoranalysmodulen: Klicka på Extraction, välj Number of factors och skriv 2 i rutan. Klicka på Continue och sedan på OK. Nedan visas endast de nya roterade faktorladdningarna:

4 Faktorladdningarna indikerar att frågorna 23, 25 (negativ laddning), 29, 31, 33 och 34 (negativ laddning) hänger ihop i en faktor. Om man läser innehållet i dessa frågor (se listan nedan) så skulle man kanske kunna tolka det hela som att faktorn mäter Offrets uppfattade samhälleliga värde. Faktor 2, med frågorna 24 (neg), 26, 27, 28 (neg), 30 och 32 skulle kanske kunna döpas till Generellt ogillande av våld. 2. Spegelvändning Om item 25 och 34 samt 24 och 28 skall inkluderas i respektive faktor, så måste de spegelvändas först. Detta innebär att fp med låga värden ges höga värden och fp med höga värden ges låga värden. I det aktuella fallet, där alla item mätts på en skala från 1 till 7, skulle det innebära att alla med värdet 1 får 7, 2 blir 6, 3 blir 5, 4 blir 4, 5 blir 3, 6 blir 2 och 7 blir 1. För att spegelvända: Transform Recode into Same Variables (om du vill ersätta den gamla variabeln med den nya spegelvända) eller Recode into Different Variables (om du vill behålla de ursprungliga variablerna och skapa nya spegelvända). I det här exemplet skapas nya variabler. Kör in variabeln som skall spegelvändas (t.ex. F25) i rutan Numeric variable Output variable. Skriv namnet på den nya spegelvända variabeln (t.ex. F25.rev) i rutan Name. Klicka på Change. Upprepa proceduren för de andra variablerna som skall spegelvändas. Det hela skulle kunna se ut som i figuren till vänster. Klicka på Old and New Values. Skriv 1 i rutan Old values och 7 i rutan New values och klicka sedan på Add. Skriv 2 under Old values och 6 under New values och klicka på Add o.s.v. När man är färdig ser det ut som i figuren till höger. Klicka på Continue och sedan på OK. De nya spegelvända variablerna dyker upp längst ut till höger i databladet. Spegelvändning av item kan även göras med Compute funktionen, som används för att skapa indexvariabler nedan.

5 3. Cronbach s Alpha Cronbach s alpha är det vanligaste homogenitetsmåttet och den anger i vilken utsträckning de testade itemen hänger ihop. En riktlinje är att Cronbach s alpha bör vara högre än 0,6 för att det skall vara meningsfullt att slå ihop item till en indexvariabel. För att beräkna Cronbach s alpha: Analyze Scale Reliability Analysis. Kör in de item som skall testas i rutan Items. För nyttig information: Klicka på Statstics och välj Scale if item deleted. Klicka på Continue och sedan på OK. 3.1 Output I det här exemplet har Cronbach s alpha beräknats för de item som ingick i faktor 1 (Offrets uppfattade samhälleliga värde) i faktoranalysen ovan. I den här analysen måste alla item gå åt samma håll (de skall alltså inte vara negativt korrelerade). Så istället för F25 och F34 tar vi med F25.rev och F34.rev. För dessa item är Alpha alltså 0,81 gott så. Kolumnen längst ut till höger fick vi genom vårt tillval av Scale if item deleted. Här anges vad alpha för övriga item skulle bli om respektive item skulle strykas. Om värdet här är högre än det aktuella alpha-värdet så kan homogeniteten alltså ökas genom att stryka detta item. Detta bör man överväga, speciellt om det aktuella alpha-värdet är lite taskigt. OBS: Ta inte bort mer än ett item (det sämsta) åt gången, även om det skulle vara flera item som drar ner alpha. I det här fallet är det inga item som drar ner alpha (alla värden är mindre än 0,805). 4. Skapa indexvariabler En indexvariabel är en sammanslagning av flera item. De item som ingår i en indexvariabel bör hänga ihop, både innehållsmässigt och statistiskt (= vara homogena). Annars blir det väldigt svårt att tolka vad ett värde i indexvariabeln står för. För att skapa en indexvariabel: Transform Compute variable. Skriv namnet på indexvariabeln (t.ex. OUSV för offrets upplevda samhälleliga värde) i rutan Target Variable. I rutan Numeric Expression skriver man vad värdena i denna variabel skall bestå av. Om vi skall slå ihop itemen ovan till ett index så skriver vi följande i rutan Numeric Expression : Mean(F23,F29,F31,F33,F25.rev,F34.rev) På så sätt skapar vi en ny variabel där varje respondent får ett värde som är lika med medelvärdet för den personens värden i F23, F29 o.s.v. I det här exemplet: Ju högre

6 värde en person har, desto större samhällelig nytta verkar han/hon tillskriva offret för den våldsamma handlingen (Johan). Den här indexvariabeln skulle nu t.ex. kunna användas som en prediktor i regressionsanalys eller som en beroende variabel i variansanalys. 5. Risk Ratio & Odds Ratio Risk- och odds ratio beräknar sambandet mellan två dikotoma variabler. Inom forskning handlar det ofta om att man vill testa om en grupp som exponerats för någonting, t.ex. svåra barndomsförhållanden, har en högre risk/odds för ett visst utfall, t.ex. missbruk, jämfört med en icke-exponerad grupp. I det aktuella datasetet, där alla respondenter är studenter, finns en variabel som anger ifall respondenten pluggar psykologi eller inte. Dessutom har vikt dikotomiserats till att ange om en person väger mer än 80 kg eller inte. Att dikotomisera en kvotvariabel som vikt i kg är givetvis idiotiskt och ingenting man skulle göra i vanliga fall. För att beräkna risk- och odds ratio: Analyze Descriptive Statistics Crosstabs. Kör in variabeln som skall betraktas som oberoende (om någon) i rutan Row(s) och den andra variabeln (utfallsvariabeln) i rutan Column(s). Programmet ger inte automatiskt odds- eller riskkvoter, så vi klickar på Statistics och väljer Risk samt Cochran s and Mantel- Haenszel statistics. Klicka på Continue och sedan på OK. 5.1Output 1. Risk att väga > 80 kg om man pluggar psykologi = 12 / 77 = 0,156 2. Risk att väga 80 kg om man pluggar psykologi = 65 / 77 = 0,844 3. Risk att väga > 80 kg om man inte pluggar psykologi = 30 / 172 = 0,174 4. Risk att väga 80 kg om man inte pluggar psykologi = 142 / 172 = 0,826 1. Odds att väga > 80 kg om man pluggar psykologi = 12 / 65 = 0,185 2. Odds att väga 80 kg om man pluggar psykologi = 65 / 12 = 5,417 3. Odds att väga > 80 kg om man inte pluggar psykologi = 30 / 142 = 0,211 4. Odds att väga 80 kg om man inte pluggar psykologi = 142 / 30 = 4,733

7 Risken att väga > 80 kg om man pluggar psykologi dividerat med risken att väga > 80 kg om man inte pluggar psykologi = 0,156 / 0,174 = 0,897. Konfidensintervallet (0,484-1,650) innehåller värdet 1. Vi kan alltså inte med tillräckligt hög säkerhet säga att det finns en skillnad i risk för vikt > 80 kg mellan dem som pluggar psykologi och dem som inte gör det. Risken att väga 80 kg om man pluggar psykologi dividerat med risken att väga 80 kg om man inte pluggar psykologi = 0,844 / 0,826 = 1,022. Konfidensintervallet (0,909-1,151) innehåller värdet 1. Vi kan alltså inte med tillräckligt hög säkerhet säga att det finns en skillnad i risk för vikt 80 kg mellan dem som pluggar psykologi och dem som inte gör det. Odds att väga > 80 kg om man pluggar psykologi dividerat med odds att väga > 80 kg om man inte pluggar psykologi = 0,185 / 0,211 = 0,877 (skillnaden beror på avrundning). Konfidensintervallet för oddskvoten går från 0,421 till 1,815. Detta intervall inkluderar värdet 1. Detta innebär att vi INTE kan utesluta att oddskvoten i populationen är lika med 1 med 95% säkerhet. Vi skulle alltså behålla nollhypotesen: Det finns ingen skillnad i odds för en vikt > 80 kg mellan dem som pluggar psykologi och dem som inte gör det. Här ser vi, återigen, att vår oddskvot inte skiljet sig signifikant från värdet 1 (p = 0,718)

8 6. Övningsuppgifter 6.1 Faktoranalys Upprepa stegen ovan för itemen F1-F22. VARNING: Jag har inkluderat två slumpvariabler i datasetet, dessa måste identifieras och elimineras. Lista på items i datasetet F1. Det var fruktansvärt av Lena att attackera Johan. F2. Johans beteende mot Lena var acceptabelt. F3. Lenas attack mot Johan var upprörande. F4. Johan riskerade att få men för livet. F5. Johan var uppkäftigt mot Lena. F6. Lenas handlande mot Johan var rimligt. F7. Lenas attack mot Johan var befogad. F8. Lenas beteende mot Johan var acceptabelt. F9. Lena betedde sig omoraliskt när hon attackerade Johan. F10. Det var förståeligt att Lena attackerade Johan. F11. Johans beteende mot Lena var inget att bli upprörd över. F12. Johans handlande mot Lena var godtagbart F13. Johan fick nog inga skador alls. F14. Lenas handlande mot Johan var chockerande. F15. Våld är trevligt F16. Johan var oförskämd mot Lena. F17. Johan var förmodligen snabbt uppe på benen igen. F18. Johan var i sin fulla rätt att handla som han gjorde. F19. Risken var stor att Johan blev allvarligt skadad. F20. Johans handlande mot Lena var väldigt provocerande. F21. Det var antagligen ingen större fara med Johan. F22. Lena borde ha slagit Johan ännu mer. F23. Om Johan dog eller blev allvarligt skadad så skulle det vara en katastrof för samhället. F24. I vissa situationer kan användandet av våld vara befogat. F25. Johans betydelse för samhället var, på det stora hela, nog rätt så obetydlig. F26. Det är omoraliskt att använda sig av våld. F27. Det är fegt att använda sig av våld mot andra. F28. Våld kan vara den enda lösningen på vissa problem. F29. Johan var en värdefull medlem av samhället. F30. Det är aldrig rätt att använda våld. F31. Det skulle vara en stor förlust för samhället om Johan dog eller blev allvarligt skadad. F32. Våld skapar problem snarare än löser dem. F33. Personer som Johan är väldigt nyttiga för samhället. F34. Samhället skulle nog klara sig bra även utan Johan. 6.2 Risk Ratio & Odds Ratio Beräkna om risken/oddsen för att vara längre än 175 cm (längre.175) skiljer sig åt mellan kvinnor och män (b.kön). Beräkna om risken/oddsen för att vara längre än 175 cm (längre.175) skiljer sig åt mellan dem som pluggar psykologi och dem som inte gör det.

9 7. Facit 7.1 Faktoranalys Jag fastnade för en lösning med tre faktorer: Faktor Item Alpha Acceptans av Våldsam Handling F1.rev, F3.rev, F6, F7, F8, F9.rev, F10, 0,895 (AVH) F14.rev, Ingen Större Fara (ISF) F4.rev, F13, F17, F19.rev, F21 0,905 Inte Offrets Fel (IOF) F2, F5.rev, F11, F12, F16.rev, F18, F20.rev 0,816 Item F15, F22 hade låg KMO (0,45 respektive 0,41) och ströks. Dessa två item är alltså inte inkluderade i analyserna. 7.2 Risk Ratio & Odds Ratio Odds för att vara längre än 175 cm är lägre för kvinnor jämfört med män (OR = 0.03, CI: 0.02-0.07). Däremot är risken för att vara kortare än 175 cm, kanske inte helt oväntat, högre för kvinnor än för män (RR = 4.05, CI: 2.87-5.72). Odds för att vara längre än 175 cm är lägre för psykologistudenter jämfört med dem som inte pluggar psykologi (OR = 0.30, CI: 0.16-0.55). Man kan även se att risken för att vara kortare än 175 cm är högre för psykologistudenter jämfört med dem som inte pluggar psykologi (RR = 1.54, CI: 1.27-1.87). Detta är ett oomkullrunkeligt bevis för att studier i psykologi är ett djävulens påfund som får människor s.a.s. att sjunka ihop.