Forskningsmetod STRUCTURAL EQUATION MODELING En kraftfull analysmetod för undersökning av kvaliteten i kvantitativa mätinstrument och för att pröva kausala modeller
Bakgrund till mitt intresse för multivariata analyser Jämförelser mellan olika faktoranalyser (olika kovariansmatriser) i eget avhandlingsarbete; fick hjälp av prof. K.G. Jöreskog (upphovsman till ACOVS och LISREL). Prof. Quensels extra opposition vid min disputation 1972, som inriktades på samplingproblem i skolundersökningar vid klassurval (mellan- och inomgruppsvarians). Möte med Herman Wold och J-B Lohmöller, upphovsmän till PLS (som forfarande frekvent används i Tyskland). Kurser i LISREL-analys (K.G. Jöreskog och Dag Sörbom). Hjälpprogrammet STREAMS (Jan-Erik Gustafsson).
Vad vill jag med denna presentation? Väcka intresse för en analysteknik som alla forskare borde känna till. Få forskare att lära sig använda SEM, dvs. starta med att gå en nybörjarkurs och sedan. Bidra till att svensk forskning inte fortsätter att sacka efter internationell forskning vad gäller kvantitativa analysmetoder.
Variabler direkt mätning eller via indikatorer? Vilka av följande är mest intressanta för dig? Hur studerar man dessa? Lärarkompetens Motivation Självförtroende Språkfärdighet Stresstolerans Attityd till utbildning Aggressivitet Lärandemiljö Kritisk förmåga Värderingar Samarbetsförmåga Kreativitet Vikt Längd
Av ovanstående variabler kan endast längd och vikt observeras (mätas) direkt (med kända mätmetoder). Alla de övriga kan endast studeras via indikatorer. Om man använder indikatorer måste man kunna visa, att dessa är relevanta och tillförlitliga (dvs. har hög validitet och reliabilitet för de variabler man vill studera.
Konstruktioner teoretiska begrepp Kan inte mätas direkt. Kan endast studeras via indikatorer.
Konstruktioner teoretiska begrepp Vilken är den bästa metoden för att veta om indikatorerna är bra, dvs. är relevanta och tillförlitliga (validitet och reliabilitet)? Hur kan man studera relationer mellan olika begrepp? Svar: Genom att använda SEM (Structural Equation Modeling)
Forskningsmetoder inom samhällsvetenskap och speciellt beteendevetenskap En orientering bort från NIVI (Naturvetenskaps- Imiterade VetenskapsIdealet och experimentella uppläggningar. Betoning på olika typer av deskriptiva studier. Utveckling av kausala modeller på deskriptiva data. En antipositivistisk inställning och en attitydmässig negativ inställning till kvantitativa data och kvantitativa analyser har lett till en påtaglig okunnighet om den senaste tidens utveckling inom mätteori och kvantitativa analysmetoder inom svensk forskning.
Varför kan man inte använda strikta experiment inom beteendevetenskaperna? Det sanna experimentet kräver att den oberoende variabeln är manipulativ, dvs. att man kan använda randomiserade grupper. Detta innebär att man slumpmässigt kan fördela deltagande individer till olika grupper. Etiskt kan det vara oacceptabelt att slumpmässigt tilldela individerna grupptillhörighet. Även om slumpmässig fördelning är möjlig, kan det vara svårt att hålla samtliga experimentbetingelserna under kontroll.
I flesta fall får man inom samhällsvetenskaperna nöja sig med icke-experimentella undersökningsuppläggningar, men trots detta vill man gärna söka kausala förklaringar till sina resultat. Kausala förklaringar är den mest fundamentala förklaringen till processer som studeras. Det är mer intressant att veta att x orsakar y än att veta att x och y har samband med varandra. Om teorier utvecklas i former av kausala relationer kan många andra relationer härledas.
GLM och SEM Många parametriska analystekniker bygger på en statistisk teori om en generell linjär modell (GLM General Linear Model), och syftet med dessa analysmetoder är att bestämma påverkan av eller relationen mellan de oberoende variablerna och de beroende. Structural Equation Modeling, SEM, är den mest flexibla statistiska analysmetoden som använder GLM, och den kan samtidigt hantera många oberoende och beroende variabler, både kategoridata och kontinuerliga variabler.
Vad är SEM? SEM är en multivariat statistisk metod, som kan användas på deskriptiva data för att utifrån en kausal teori: Estimera relationer mellan manifesta (observerade) och latenta (teoretiska) variabler. Estimera kausala relationer mellan latenta variabler. Pröva eller finna en förklaringsmodell som bäst beskriver empiriskt erhållna data.
Utvecklingen av kausala modeller Sewell Wright (1920-talet) Blalock, H. M., Jr. (1964). Causal inferences in non-experimental research. Chapel Hill: University of North Carolina Press. Duncan, O. D. (1966). Path analysis: Sociological examples. American Journal of Sociology. Duncan, O. D. (1975). Introduction to structural equation models. New York: Academic press. Raykov, T., & Marcoulides, G. A. (2006). A first course in structural equation modeling. Hove, UK: Psychology Press. Svenska forskare som gjort betydande insatser: Herman Wold, K. G. Jöreskog, Dag Sörbom, Bengt Muthén, m.fl.
Sewell Wright (path analysis) In cases in which the causal relations are uncertain, the method can be used to find the logical consequences of any particular hypothesis in regard to them (Wright, 1921, p. 557). the method of path coefficients is not intended to accomplish the impossible task of deducing causal relations from the value of a correlation coefficient. It is intended to combine the quantitative information given by the correlations with such qualitative information as may be at hand on causal relations to give a quantitative interpretation (Wright, 1934, p. 193).
Regressionsanalys Regressionsanalys är en multivariat teknik för att bestämma sambandet mellan en kriterievariabel och två eller flera prediktorvariabler. Regressionstekniken kan användas på intervall-, ordinal- och kategoridata. Y est = b 1 x 1 + b 2 x 2 + b 3 x 3 + + b n x n + A Det predicerade värdet på Y (Y est ) skiljer från kriteriet Y beroende på att x:en inte är perfekta prediktorer. Varje b-värde är en regressionskoefficient som visar hur mycket den beroende variabeln förändras, om värdet på respektive föregående variabel ökar ett steg. A är en konstant (jfr den räta linjens ekvation y= a + bx). För att kunna se vilka x-variabler som bäst bidrar till prediktionen standardiseras b-värdena (beta), som då direkt kan jämföras. Dessa kan då variera mellan -1,00 och +1,00.
Regressionsmodell med tre prediktorvariabler (b i = standardiserade viktkoefficienter; e = residual) X 1 b 1 X 2 b 2 Y e b 3 X 3
Pathmodell (p = pathkoefficienter; e = residual) e 3 e 4 X 1 p 31 X3 p 43 X4 X 2 p 32
Resultat av regressionsanalys: Multipel korrelation = 0,52; Förklarad varians i Betyg = 27 % Kön 0,33 Hemkultur 0,18 Betyg 0,86 0,17 Attityd Resultat av path-analys: Kön 0,33 0,85 0,86 0,41 Attityd 0,17 Betyg 0,26 Hemkult 0,18
Brandexemplet: Korrelationsmatris Variabler ES BA SV Eldsvådans storlek (ES) 1.00 Brandmännens arbetsinsats (BA) 0.80 1.00 Skadeverkningar (SV) 0.66 0.42 1.00
Teoretisk modell: ES SV BA Erhållna path-koefficienter enligt den teoretiska modellen: ES 0,90 SV 0,80 BA -0,30
Wright s rules Sambandet mellan två variabler i path-diagrammet kan uttryckas som summan av alla stigar (paths), som förbinder dessa två punkter men under betingelserna: a) ingen slinga, b) inte gå framåt och sedan bakåt och c) högst en dubbelriktad pil per stig.
Wright s rules (forts.) Om vi applicerar dessa regler på exemplet ovan erhålls: Sambandet mellan eldsvådans storlek och skadeverkningar: (r ESSV ) = 0,90 0,30x0,80 = 0,66. ES 0,90 SV 0,80 BA -0,30
Wright s rules (forts.) Sambandet mellan brandmännens arbetsinsats och skadeverkningar: (r BASV ) = -0,30 + 0,90x0,80 = 0,42. ES 0,90 SV 0,80 BA -0,30
Wright s rules (forts.) Sambandet mellan eldsvådans storlek och brandmännens arbetsinsats: (r ESBA ) = 0,80 (enligt reglerna får man inte gå framåt och sedan bakåt). ES 0,90 SV 0,80 BA -0,30
Wright s rules (forts.) Således har vi reproducerat korrelationsmatrisen Variabler ES BA SV Eldsvådans storlek (ES) 1.00 Brandmännens arbetsinsats (BA) 0.80 1.00 Skadeverkningar (SV) 0.66 0.42 1.00
Förhållandet mellan mätvariabeln och det bakomliggande begrepp som mätvariabeln avser att mäta Begrepp, latent variabel Indikator, manifest variabel Residual
Faktoranalysmodell e 1 Manifest variabel MV 1 λ1 e 2 Manifest variabel MV 2 λ2 e 3 e 4 Manifest variabel MV 3 Manifest variabel MV 4 λ3 λ4 λ5 Latent variabel LV e 5 Manifest variabel MV 5
Ekvationer som specificerar modellen och som visar hur de manifesta variablerna förklaras av den latenta variabeln (faktorladdningar) och residualerna. De fem ekvationer som kan skrivas utifrån modellen är följande: MV 1 = λ 1 LV + e 1 MV 2 = λ 2 LV + e 2 MV 3 = λ 3 LV + e 3 MV 4 = λ 4 LV + e 4 MV 5 = λ 5 LV + e 5
Exempel på SEM-analyser IEA-Written Composition; analyser utifrån det svenska stickprovet (Datafilen IEASv9 finns tillgänglig för övningskörningar)
Indikatorer för att få ett mått på Hemkultur (från IEA-Written Composition) 4. Talar tillsammans om vad som händer på arbetet och i skolan. 5. Talar tillsammans om familjeangelägenheter, t.ex. om hushållet, släkten, ekonomin. 6. Gör upp planer tillsammans, t.ex. för veckohelg eller semester, och diskuterar olika alternativ. 7. Diskuterar allmänna angelägenheter, t.ex. moral, religion, politik. 8. Diskuterar en bok som någon av er har läst. 9. Diskuterar TV- eller radioprogram.
Hur ofta gör barn och vuxna i din familj följande saker tillsammans? (svarsalternativ och skalering) 1. Högst en eller två gånger om året 2. Flera gånger om året 3. En eller två gånger i månaden 4. En eller två gånger i veckan 5. Varje eller nästan varje dag
Relevans och tillförlitlighet? Frågorna verkar bra och det blir nog tillförlitliga svar från det slumpmässiga urval av 541 svenska elever i år 9 som gjordes (även om det fanns ett visst intern bortfall, dvs. samtliga elever svarade inte på alla de sex frågorna). Hur kan man påstå det?
Validitet och reliabilitet? Correlati ons MV4 MV5 MV6 MV7 MV8 MV9 MV4 ** ** ** ** ** MV5,576** ** ** ** ** MV6,441**,505** ** ** ** MV7,393**,449**,385** ** ** MV8,287**,331**,347**,397** ** MV9,327**,373**,294**,360**,421** **. Listwise N=487 Vad säger korrelationsmatrisen om validitet och reliabilitet?
Resultat av faktoranalys och reliabilitetsanalys med SPSS Component Matrix a MV4 MV5 MV6 MV7 MV8 MV9 Component 1,728,784,710,708,642,641 Extraction Method: Principal Component Analy sis. a. 1 components extract ed. Reliabi lity Statisti cs Cronbach's Alpha N of Items,794 6 49.6 % explained variance Slutsats av dessa analyser?
Visserligen visar Cronbach s alpha en hygglig reliabilitet, men att endast erhålla en förklarad varians på ca 50 % är inte bra. Man vill gärna komma upp till minst 70 %. Resultatet av denna faktoranalys indikerar problem i valet av indikatorer. Denna dimensionsanalys är otillräcklig. Med SEM löser man problemet betydligt bättre och dessutom enkelt.
Indikatorer för att få ett mått på Hemkultur (från IEA-Written Composition) 4. Talar tillsammans om vad som händer på arbetet och i skolan. 5. Talar tillsammans om familjeangelägenheter, t.ex. om hushållet, släkten, ekonomin. 6. Gör upp planer tillsammans, t.ex. för veckohelg eller semester, och diskuterar olika alternativ. 7. Diskuterar allmänna angelägenheter, t.ex. moral, religion, politik. 8. Diskuterar en bok som någon av er har läst. 9. Diskuterar TV- eller radioprogram.
Med SEM-tekniken kan man analysera mätmodellen mycket bättre! Mätmodell: e e Fråga 4 Fråga 5 e e Fråga 6 Fråga 7 LV Hemkultur e Fråga 8 e Fråga 9
Det finns flera programvaror som kan utföra SEM-analyser LISREL (Jöreskog och Sörbom) Mplus (Muthén och Muthén) EQS (Bentler) AMOS (Arbuckle) För att lättare ge instruktioner till programvaran, som ska utföra analysen kan man använda hjälpprogrammet STREAMS (Structural Equation Modeling Made Simple) (Gustafsson och Stahl)
Teoretisk modell MVR V4 V5 V6 V7 V8 V9 LVR G REL G -> V4 V5 V6 V7 V8 V9 e Fråga 4 e e e Fråga 5 Fråga 6 Fråga 7 LV Hemkultur e Fråga 8 e Fråga 9 Är detta en bra modell som återspeglar erhållna data, dvs. som tillräcklig väl kan reproducera den empiriskt erhållna korrelationsmatrisen?
Correlati ons MV4 MV5 MV6 MV7 MV8 MV9 MV4 ** ** ** ** ** MV5,576** ** ** ** ** MV6,441**,505** ** ** ** MV7,393**,449**,385** ** ** MV8,287**,331**,347**,397** ** MV9,327**,373**,294**,360**,421** **. Listwise N=487
Hur jämför man den teoretiska modellen med insamlade empiriska data? Kovariansmatrisen för observerade data jämförs med kovariansmatrisen som genereras utifrån den hypotetiska modellen. Chi-kvadrat-testet används för att jämföra dessa två matriser. Kvoten mellan Chi-kvadrat-värdet och antalet frihetsgrader är ett bra mått på anpassning. Om denna kvot är under 2 anses avvikelsen mellan de två matriserna vara högst rimlig (chi-kvadrat-värdet beror dock på antalet observationer - högre vid stora stickprov). Dessutom används RMSEA-värdet (Root Mean Square Error of Approximation) som ett anpassningsindex. Om detta värde, som tar hänsyn till antalet skattade parametrar, är < 0,05 kan modellen betraktas som mycket god för att beskriva data.
Teoretisk modell Modell: MVR V4 V5 V6 V7 V8 V9 LVR G REL G -> V4 V5 V6 V7 V8 V9 Resultat: Goodness of Fit Test: Chi-square = 50.60, df = 9, p <.01, RMSEA =.102 Maximum Modification Index is 25.3 for: COV V9& V8& Modification Index ger information om hur modellen kan förbättras.
Indikatorer för att få ett mått på Hemkultur (från IEA-Written Composition) 4. Talar tillsammans om vad som händer på arbetet och i skolan. 5. Talar tillsammans om familjeangelägenheter, t.ex. om hushållet, släkten, ekonomin. 6. Gör upp planer tillsammans, t.ex. för veckohelg eller semester, och diskuterar olika alternativ. 7. Diskuterar allmänna angelägenheter, t.ex. moral, religion, politik. 8. Diskuterar en bok som någon av er har läst. 9. Diskuterar TV- eller radioprogram.
Ny teoretisk modell * MVR V4 V5 V6 V7 V9 * LVR G * REL G -> V4 V5 V6 V7 V9 Goodness of Fit Test: Chi-square = 8.39, df = 5, p <.14, RMSEA =.038 Estimated reliability: 0.78 Standardized estimates: V4 = +0.71*G +0.71*V4& V5 = +0.80*G +0.61*V5& V6 = +0.63*G +0.77*V6& V7 = +0.59*G +0.81*V7& V9 = +0.49*G +0.87*V9&
Resultat av LISREL-analys av en mätmodell Chi-square = 8.39, df = 5, p <.14, RMSEA =.038 Estimated reliability: 0.78 Fråga 4 0,71 0,80 Fråga 5 0,63 Hemkultur Fråga 6 0,59 0,49 Fråga 7 Fråga 9 0,71 0,61 0,77 0,81 0,87 (standardiserade estimat)
Indikatorer för att få ett mått på Hemkultur (från IEA-Written Composition) 4. Talar tillsammans om vad som händer på arbetet och i skolan. 5. Talar tillsammans om familjeangelägenheter, t.ex. om hushållet, släkten, ekonomin. 6. Gör upp planer tillsammans, t.ex. för veckohelg eller semester, och diskuterar olika alternativ. 7. Diskuterar allmänna angelägenheter, t.ex. moral, religion, politik. (8. Diskuterar en bok som någon av er har läst.) 9. Diskuterar TV- eller radioprogram.
Några resultat av analyser från andra forskningsprojekt
Minns följande: Mätmodell: Relationerna mellan den latenta variabeln och de manifesta variablerna Strukturmodell: Relationerna mellan de latenta variablerna
Modell med tre latenta variabler med respektive fyra, två och tre manifesta variabler MV 1 MV 2 MV 3 MV 4 MV 5 MV 6 Teoretiskt begrepp LV 1 Teoretiskt begrepp LV 2 Teoretiskt begrepp LV 3 MV 7 MV 8 MV 9
.11 Parental education.23.09.59.43 Home library Early reading activities.06.14.13.02 Early reading abilities (.11) (.38) (.18).33 (.33) Reading achievement, Grade 4 Path model of direct and indirect influences of parental education on students reading achievement RMSEA=.038 (total effects within brackets)
Några kausala modeller utifrån svenska data från IEA-Written composition LV s: Föräldrarnas utbildningsbakgrund (Pared), hemkultur (Hcult), betyg i uppsatsskrivning (Bet), TV-tittande (TV), skolattityder (Atti) MV s: Pared (v2,v3), Hcult (v4,v5.v6,v7,v9), Bet (v22,v23,v24,v25), TV (v14,v15), Atti (v10,v16)
SEM-analysis (LISREL) v2 v4 v5 Pared.34 Hcult v6 v7 v3.26 (.35) Bet.25 v9 v22 v23 v24 v25 Path model of direct and indirect influences of parental education and home culture on students writing achievement (total effect within brackets). RMSEA=.0.048
v3 v2 Pared -.46.34 (-.43).08 Hcult v4 v5 v6.14 (.31) TV (.26).28 v9 v7 v14 -.19 v15 Bet v22 v23 v24 v25 Path model of direct and indirect influences of parental education, home culture and TV viewing on students writing achievement (total effects within brackets). RMSEA=.0.045
v3 v2 Pared.32 (.46).34.42 Hcult v4 v5 v6.34 Atti.31 v9 v7 v10.73 v16 Bet v22 v23 v24 v25 Path model of direct and indirect influences of parental education, home culture and attitudes on students writing achievement (total effect within brackets). RMSEA=.0.047
Nedan följer resultat från en dimensionsanalys av ett frågeformulär till högstadieelever om lärarkompetens. Därefter följer resultat om hur högstadieelever reagerar i konfliktsituationer.
Tcomp.63.63.62.73.58.52.54.70.66.61.61.53.74.73.67.66.55.64.55.59.37.30.40.60.60.55.70 My teachers: can keep order maintain discipline are decisive and know what they want create a positive classroom climate show great confidence within their subject fields are competent in their subject fields have well-planned lessons make teaching interesting can explain new things in a good way increase my self-confidence use various teaching methods can motivate students are mostly cheerful and friendly have a positive attitude towards young people have patience are easy to talk to show that they believe in my capacity for learning show me that they want me to be successful in my studies are happy to see me making progress tell us when we have done a good job find out what we know and give individualized teaching help and give support to those who need it give information as to what I can and what I have to improve sum up what we have done lately and give feedback have reasonable demands give adequate homework are fair.85.31.12.08.56.42.25.35.31.34.36.25.40.37.41.12.34.50.42.26.63.29.32.25.67.30.14 Tdisc Tknow Tteach Tsocc Tposa Tindi Tfair
-.03 CONFRONTING AVOIDANCE FRONTING.23 Physical aggression ( against persons) Psycho - logical aggression ( against persons) Displaced aggression ( against objects ) Give up Win - win, co - operate, compromise Assistance - seeking, third party Self - blame Wait, ignore, withdrawal Hide or Mask Postpone or avoid person The results of a exploratory factor analysis of the conflict questionnaire
Kausal modell från DRACON-projektet (slutrapport finns på Malmö högskola) ober. var.: Tcomp, Atti, Self ber. var.: Confronting, Fronting
Tcomp: soc, tea, kno, dis, pos, ind, fai Confronting: phy, psy, fru Fronting: com, 3-p
School attitudes A1- I have a positive attitude to school and schoolwork. A2- I like schoolwork. A3- In general I enjoy school. A4- School helps develop my curiosity and desire to learn. Self-confidence S1- I have many good personal qualities. S2- On the whole I am satisfied with myself. S3- I think I am good enough. S4- I have plenty of self-confidence.
Pos Ind Fai Gender 1=boys 2=girls.31 Soc Tea Kno Tcomp -.19 -.20.14 -.37 Phy Dis A1 A2 A3.75 Atti.10.43 -.19 Confronting -.35 Psy Fru A4.56 Fronting Com 3-p S1 S3 S3 Self.13 -.14 S4.18
På nästkommande bild visas slutresultatet av en LISRELanalys från en enkät till lärare i ett slumpmässigt urval av 23 grundskolor i Malmö 1982. Studien Teacher stress: Exploratory model building publicerades i Journal of Occupational Psychology (1983), och blev uppmärksammad i hela världen. Artikeln återpublicerades i samma tidskrift för något år sedan, då den ansågs som banbrytande. Ref.: Tellenback, Sten, Brenner, Sten-Olof & Löfgren, Horst: Teacher stress: Exploratory model building. Journal of Occupational Psychology, 1983, 56,19-33.
Hur kan jag lära mig att själv utföra SEM-analyser? Ha en positiv inställning till att lära nya kvantitativa analysmetoder. Läs mitt kompendium om SEM-analys Gå en 3-dagars kurs i form av workshops (ca. 7 lektionstimmar per dag). Ha ett eget datamaterial i form av en SPSS-fil. För att öva på flernivåsanalyser ska datafilen innehålla såväl individdata som gruppdata. Utveckla en teori om kausala relationer mellan variabler i datafilen.
Referenser Tellenback, S., Brenner, S-O., & Löfgren, H. (1983). Teacher stress: Exploratory model building. Journal of Occupational Psychology, 56(1), 19-33. Malm, B., & Löfgren, H. (2006). Teacher competence and students conflict handling strategies. Research in Education, 76, 62-73. Löfgren, H. (2012). Risker med kvantitativa analyser utan teoretisk förankring och kvalitativ reflektion: Ett belysande exempel.
För frågor eller hjälp kontakta mig! E-post: horst.lofgren@mah.se Tel: 046-772490; 0766-472490