XII Seminario de Estadística Aplicada sobre “Métodos Estadísticos en Problemas Socioeconómicos” Instituto interamericano de Estadística (IASI). Escuela de Estadística y Centro de Estadística Aplicada a Estudios Socioeconómicos(CEAES) Universidad Nacional de Colombia Sede Medellín Ignacio Méndez Ramírez IIMAS UNAM México 1 imendez@servidor.unam.mx 1 Panorama 1.- Comentarios sobre causalidad y correlación 2.- Análisis de senderos. 3.-Algunas técnicas estadísticas presentadas con gráficas, (senderos). 4.- Análisis de Factores Exploratorio y Confirmatorio 5.-Ecuaciones Estructurales. Senderos con factores o variables latentes. 6.- Curvas de Crecimiento Latente Agregado. Se reportan referencias 2 2 Correlación • Asociación entre dos variables. Numéricas categóricas u ordinales. La distribución de X cambia al condicionar con Y y viceversa. No son independientes estadísticamente una de la otra. 3 3 4 4 5 5 6 6 7 7 8 8 9 9 Si lo que buscamos es apoyar a la casualidad a partir de datos empíricos. Entonces podemos tratar cada caso, con mas observaciones y con supuestos. Para el caso 1, se efectúan pruebas de significancia para que la correlación tenga pocas probabilidades de deberse al azar. El caso 2 (X Y) es el que queremos apoyar, la hipótesis. El caso 3 (X Y) se elimina si se pide que se considere la temporalidad, primero la X y después Y, no puede ser reversible 10 10 (4) X Y Z (5) (X Z Y) Para los casos 4 y 5, (modelos distintos pero equivalentes estadísticamente) se efectúan pruebas de significancia para la correlación parcial. Es decir se mantiene fijo el valor de Z, por diseño o por análisis; si la correlación parcial (de X con Y dado Z) es cero o casi. En base a consideraciones teóricas, se opta por el caso 4 o el 5. Para el caso 6, si la correlación parcial no se hace cero, entonces se pueden avaluar los efectos directos y los indirectos. (6) X Y Z 11 11 Se considera que en el tiempo se resuelve la reciprocidad: Época 1 Época 2 Época 3 Época 4 12 12 Decía Platón, en su popular mito, que encadenados dentro de una caverna han pasado toda su vida unos prisioneros. Han vivido acostumbrados a contemplar las sombras que proyecta una hoguera situada a un nivel superior por delante de la cual circula otra gente. Evidentemente, los prisioneros adoptan las sombras como la realidad ya que su existencia se ha basado en esa experiencia y no conocen nada más 13 13 Un día, un prisionero logra desencadenarse y salir del rincón donde vivía apresado, contempla la hoguera, y a las cosas y personas que producen las sombras, y siente la necesidad de compartir esa realidad con aquellos que viven atrapados ante las sombras. Algunos le siguen, al principio la nueva visión les ciega hasta que sus ojos se acostumbran. Sin embargo otros toman por loco a aquél que pretende desencadenarlo y alejarlo de la seguridad de su realidad hasta el punto de amenazarlos de muerte si intentan poner un dedo encima de sus tristes cadenas. 14 15 15 16 16 Cadenas causales ideas 17 17 Uso confirmatorio de las ideas de causalidad. Como Platón, lo que observamos son los reflejos o sombras de la realidad. Siempre el estudio de la realidad esta mediado por el diseño de investigación. Pero así como por ejemplo una sombra redonda, puede ser producida por una esfera o un cilindro, pero no por un cubo o paralelepípedo. Así en relación a las correlaciones, habrá patrones de correlación compatibles con ciertos modelos causales pero no con otros. 18 18 El uso de los modelos en el trabajo de investigación se da de acuerdo al esquema: Shipley Bill “ Cause and Correlation in Biology. A User¨s Guide to Path analysis, Structural Equation and Causal Inference”. Cambridge University Press 2000 Enfoque confirmatorio 20 20 1.- Se hacen mas claras las relaciones entre variables, 2.- Se valora la influencia de unas sobre otras. 3.- Se pueden valorar los efectos directos de una variable sobre otra, 4.- Se valoran los efectos indirectos. 5.- Se pueden tener variables mediadoras en la influencia de una variable sobre otra. 6.-Permite hacer mas aparentes las correlaciones, 21 7.- Se pueden tener variables latentes. 21 Análisis de senderos o de trayectorias (Path analysis) El análisis de senderos o método de coeficientes de sendero, es una forma de análisis de regresión estructurado, varios modelos de regresión ligados, y considerando variables estandarizadas a media cero y varianza uno, en un sistema cerrado. Se establecen varias ecuaciones que determinan todas las correlaciones entre las variables observadas. 22 22 Es prácticamente indispensable proponer un diagrama o modelo gráfico, donde se especifique las cadenas causales propuestas por el investigador. Lo que se obtiene es el grado de cercanía de las observaciones empíricas con las cadenas causales propuestas por el investigador, es decir se apoya o no la hipótesis resumida en la estructura causal propuesta, y además se evalúa el peso de cada relación, vía los llamados coeficientes 23 de sendero. 23 También se obtienen los efectos directos e indirectos de unas variables sobre otras. Por supuesto que las causalidades implicadas son de tipo probabilísticas y además se requiere tener validez interna para apoyar la causalidad. 24 24 Las ecuaciones estructurales implicadas en el sistema son todas lineales. Si las relaciones son no lineales, no se aplica el análisis, o bien, es una primera aproximación, aunque existe la posibilidad de generar funciones de las variables (vg.Términos cuadráticos o productos como variables) y usarlas como nuevas variables. 25 25 Todas las ecuaciones propuestas deben ser recursivas, sin ciclos de realimentación, es decir debe haber un “flujo causal” sin retornos. Consideremos un ejemplo hipotético. Sean X y Y variables exógenas, es decir no determinadas por variables del sistema (independientes), su correlación es rXY, y esta correlación no será descompuesta. Además consideremos tres variables endógenas (dependientes), es decir determinadas por otras variables en el 26 sistema, sean estas W, Z y L. 26 e2 PZX PLZ e3 rXY PZY PZW PLW PWY e1 27 27 El sistema propuesto es: W= PWYY+ PWe1e1 (1) Z= PZXX+ PZYY+PZWW+PZe2e2 (2) L= PLZZ+ PLWW+PLe3e3 (3) Todas las variables se estandarizan a media cero y varianza uno. Los errores e1, e2, y e3 expresan el hecho de que las variables endógenas no quedan totalmente determinadas por el sistema. Los coeficientes de regresión estandarizados, son los coeficientes de 28 sendero, PWY, PZX, PZY, PZW, PLZ y PLW. 28 Su significado es el mismo de la regresión múltiple, por ejemplo en ecuación (2), PZY es el cambio en desviaciones estándar que experimenta Z al aumentar una desviación estándar Y, manteniendo constantes a X y W. No vamos a distinguir entre parámetros y estimadores, todos los que se refieran serán estimadores. En cada modelo de regresión, los estimadores de los coeficientes de senderos se obtienen de manera usual por mínimos cuadrados en cada una de las tres 29 regresiones. 29 Nota. Inicialmente los parámetros en el análisis de senderos se estiman con mínimos cuadrados (OLS). Paquetes como EQS pueden hacerlo, pero también pueden usar otros métodos de estimación como Máxima Verosimilitud (ML) y otros . La máxima verosimilitud permite valorar todo el sistema con una prueba de Ji cuadrada Se puede demostrar que el proceso de estimación por mínimos cuadrados, genera las ecuaciones normales, las que por la codificación de las variables equivale a una descomposición de los coeficientes de correlación. En este caso el sistema es: 30 30 rWY= PWY ( X X ) ˆ X Y (EN1) Ecuaciones normales PZX + PZY rYX+ PZWrWX= rZX PZX rYX+ PZY + PZWrWY= rZY PZX rxw+ PZY rWY+ PZW= rZW PLZ + PLWrWZ= rLZ PLZ rZW+ PLW= rLW (EN2) (EN3) Nótese que es una descomposición implícita de coeficientes de correlación, es decir, de aquí se obtienen los coeficientes de correlación en términos de los coeficientes 31 de sendero y otras correlaciones. 31 PZe2 e2 PZX PLZ e3 rXY PZY PLe3 PZW PLW PWY PWe1 e1 32 32 La correlación entre X y Y, las exógenas, no se descompone. La correlación entre W y Y es PWY. Las demás correlaciones pueden ser expresadas en términos de los coeficientes de sendero. Es decir, resultan senderos “pueden variables. las correlaciones entre variables estar determinadas por los o caminos por los cuales se comunicar” cada pareja de 33 33 Una correlación se descompone en la suma de los productos de los coeficientes por cada posible sendero que conecta las dos variables involucradas. Así, la correlación entre W y X, resulta del producto de coeficientes a lo largo del sendero que conecta X con W pasando por Y. En la obtención de correlaciones, los errores se desprecian por no estar correlacionados con otras variables; en las varianzas si influyen. 34 34 rwx = PWYrXY rXY PWY Nótese que el sendero entre X y Y se puede considerar en los dos sentidos, los otros deben respetar el sentido de las flechas. 35 35 Senderos entre X y Z PZX Se dice que rZX es el efecto total ET entre Z y X , y que PZX es el efecto directo ED, de X a Z, es el sendero directo, sin pasar por otras variables. rXY PZY PZW PWY La diferencia entre ET y ED es EI el efecto indirecto de X sobre Z. 36 36 Este efecto indirecto está originado por dos caminos que conectan a X con Z. Uno es pasando de X a Y y luego de Y a Z, su peso es rXY PZY. El otro camino es vía X a Y a W y a Z, su peso es rXY PWY PZW. De manera que la correlación entre X y Z se integra por los tres senderos sumados. rZX = PZX + rXY PZY + rXY PWY PZW ET = ED + EI 37 37 Senderos entre Z y Y Ahora consideremos los correlación entre Z y Y . senderos y la PZX El efecto indirecto tiene dos caminos de Y a W y a Z, PWYPZW y el que va de Y a X y de ahí a Z, rXYPZX rXY PZY PZW PWY Efecto total ET= rZY= PZY + PWYPZW+ rXYPZX Efecto total ET= rZY= ED + EI 38 38 Senderos entre L y W PZX PLZ rXY PZY PZW PLW PWY El efecto directo es PLW y hay tres caminos indirectos. (ver colores) De manera que: ET=rLW =PLW+ rXYPWY PZXPLZ+ PWY PZYPLZ + PZW PLZ 3939 Senderos entre Y y L PZX PLZ rXY PZY PZW PLW PWY Entonces, la correlación o efecto total entre Y y L es: ET = rLY= rXYPZX PLZ+ PZYPLZ+ PWY PZWPLZ+PYWPWL Nótese que ahora no hay efecto directo. 40 40 Cuando el número de flechas que conectan pares de variables es igual al número de coeficientes de correlación, es posible obtener una descomposición exacta de los coeficientes de correlación, es el modelo saturado. Sin embargo, cuando por nuestra teoría eliminamos algunas flechas, o bien, en un primer análisis algunas P son muy pequeñas, las eliminamos y obtenemos un nuevo sistema que no es saturado (tiene un carácter exploratorio). En este ultimo caso algunos coeficientes de correlación, obtenidos con los modelos a través de los senderos, no coinciden con los observados. 41 41 Si las discrepancias son pequeñas, “el modelo no discrepa de los datos” y puede proponerse como un apoyo empírico a las relaciones involucradas. Es importante recalcar que pueden obtenerse varios sistemas que sean compatibles con los datos, de manera que uno de ellos no puede ser el “verdadero”, sólo es una explicación propuesta para las relaciones entre variables. El paquete EQS, diseñado para generar factores hipotéticos y buscar sus relaciones, puede usarse para análisis de senderos. Además este paquete obtiene los efectos totales y los indirectos con sus errores estándar y pruebas de 42 42 significancia de ambos. Este software además realiza una prueba de significancia vía una Ji2 asintótica, para la hipótesis de que el modelo es válido considerando parámetros poblacionales y por tanto puede generar datos como los obtenidos con elevada probabilidad. Si se rechaza el modelo, se considera que el esquema causal propuesto no tiene apoyo empírico, con esos datos. El EQS genera además otros índices de ajuste, valorando las discrepancias entre correlaciones observadas y las reproducidas 43 con el modelo. RMSEA, NFI, etc. 43 De hecho el coeficiente de determinación de cada variable endógena, es función del coeficiente de sendero del error de esa variable a la variable dependiente. PLe3 1 RL. ZW y por tanto, R 2 L. ZW 1 PLe3 2 2 Donde R2 es el coeficiente de determinación en la ecuación de regresión que predice L. 44 44 Identificabilidad Es importante preguntarse si el número de ecuaciones (información de entrada) es suficiente para “encontrar la solución” para los parámetros. Puede haber tres casos: 1.- Modelos subidentificados, menos ecuaciones que parámetros, no hay una solución. 2.Modelos saturados, igual numero de ecuaciones (información) que parámetros, Hay una solución única. No se puede evaluar el ajuste. 3.- Modelos sobreidentificados, mas ecuaciones (información) que parámetros, hay infinitas soluciones, se busca aquella que es optima según algún criterio. Se puede evaluar el grado de ajuste de los datos al modelo. 45 El Origen de los Modelos de Ecuaciones Estructurales (SEM) Sewell Wright 1897-1988 Primer articulo: 1920 46 46 La Idea de Wright X Y1 = α1 + β1X + ε1i Y1 Y2 Y2 = α2 + β2X + β3Y1 + ε2i ε1i ε2i 47 47 S. Wright desarrolló la técnica de Análisis de Senderos (Path Analysis). Que consiste en postular en base a la teoría existente o tentativa, una serie de dependencias entre variables de manera concatenada, se señala con flechas las relaciones de dependencia. Equivale a varios modelos de regresión sucesivos. v3 v5 v6 v1 v7 v2 v4 La doble flecha indica variables correlacionadas sin dependencia una de la otra. De nuevo surge la pregunta ¿¿ los datos son compatibles con el modelo postulado en la gráfica?? 48 48 49 25 20 y 15 10 Como modelo de regresión 5 Parameter Estimates 0 a o a-vs -otros Term Intercept Ia Estimate Std Error 9.2 1.456083 -3.9 2.52201 t Ratio Prob>|t| 6.32 <.0001* -1.55 0.1332 Std Beta 0 -0.28051 Summary of Fit Rsquare 0.078684 Adj Rsquare 0.04578 Root Mean Square Error 6.511802 Mean of Response 7.9 Obs ervations (or Sum Wgts) 30 R2= 1 - 0.962 = 0.0784 t Test o-a As sum ing equal variances Difference 3.9000 t Ratio 1.546385 Std Err Dif 2.5220 DF 28 Upper CL Dif 9.0661 Prob > |t| 0.1332 Lower CL Dif -1.2661 Prob > t 0.0666 -10 Confidence 0.95 Prob < t 0.9334 Level a o -5 0 5 Number 10 20 Mean 5.30000 9.20000 10 50 50 Modelo saturado R2= 1 - 0.962 = 0.0784 a--o* -0.28* Y 0.96 E1* Figure X: EQS 6 drug a--o prueba t.eds Chi Sq.=0.00 P=-1.00 CFI=-9.00 RMSEA 51 51 Análisis de varianza con 4 grupos, o regresión con tres indicadoras Summary of Fit Analysis of Variance RSquare 0.72512 RSquare Adj 0.6564 Source Root Mean Square Error 1.346755 Model Mean of Response 4.75 Error Obs ervations (or Sum Wgts ) 16 C. Total DF 3 12 15 Sum of Squares Mean Square 57.415000 19.1383 21.765000 1.8138 79.180000 F Ratio 10.5518 Prob > F 0.0011* Parameter Estimates Term Intercept Z1 Z2 Z3 Estimate Std Error t Ratio Prob>|t| 7.475 0.673378 11.10 <.0001* -4.925 0.9523 -5.17 0.0002* -3.975 0.9523 -4.17 0.0013* -2 0.9523 -2.10 0.0575 R2= 1 - 0.5242 = 0.725 52 52 Z1--0.20 -0.07 -4.92 1.45 CALIFICA -3.98 Z2--0.20 -0.07 -0.07 -2.00 Z3--0.20 Nótese las correlaciones entre Figure X: EQS 6 caledad1.eds Chi Sq.=0.00 P=-1.00 CFI=-9.00 RMSEA=-9.00 variables independientes, en este caso las 3 indicadoras de los 4 tratamientos. 53 53 MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. CALIFICA=V2 = -4.925*V5 .852 -5.782@ - 3.975*V6 .852 -4.667@ - 2.000*V7 .852 -2.348@ STANDARDIZED SOLUTION: CALIFICA=V2 = -.959*V5 + 1.000 E2 R-SQUARED - .774*V6 - .389*V7 Contribución de fuentes de variación no especificadas en la “explicación” de CALIFICA, el llamado error + .524 E2 .725 54 54 Factorial 2 x 2 (deprivación de alimento y droga) con 4 respuestas en el tiempo. MANOVA Mediciones repetidas droga-depri m orphinen m orphiney trim ethn trim ethy 1 droga-depri LS Means 0 -1 -2 -3 -4 LogHist0 LogHist1 LogHist3 LogHist5 Res ponses droga-depri LogHist0 LogHist1 m orphinen -2.8905289 -1.1621238 m orphiney -2.6525258 -2.5754886 trim ethn -3.0200804 0.13136445 trim ethy -2.4204863 -2.5285521 LogHist3 -1.9995998 -2.5556808 -0.1738823 -2.4829718 LogHist5 -2.3229961 -2.428211 -0.5102707 -2.4860774 55 55 All Between Test F Test Value 1.1101495 Exact F NumDF 4.0705 3 DenDF 11 Prob>F 0.0359* Exact F NumDF 107.2866 1 DenDF 11 Prob>F <.0001* Intercept Test F Test Value 9.7533317 droga-depri Test F Test Value 1.1101495 Exact F NumDF 4.0705 3 DenDF 11 Prob>F 0.0359* Within Subjects Contras t All Within Interactions Test Wilks' Lam bda Pillai's Trace Hotelling-Lawley Roy's Max Root Value 0.0198871 1.7570944 13.863757 11.007649 Approx. F NumDF 9.8056 9 5.1836 9 11.8099 9 40.3614 3 DenDF 22.054 33 23 11 Prob>F <.0001* 0.0002* <.0001* <.0001* Resultado del JMP, análisis MANOVA con mediciones repetidas en el tiempo. Time Test F Test Value 8.0108714 Exact F NumDF 24.0326 3 DenDF 9 Prob>F 0.0001* Time*droga-depri Test Wilks' Lam bda Pillai's Trace Hotelling-Lawley Roy's Max Root Value 0.0198871 1.7570944 13.863757 11.007649 Approx. F NumDF 9.8056 9 5.1836 9 11.8099 9 40.3614 3 DenDF 22.054 33 23 11 Prob>F <.0001* 0.0002* <.0001* <.0001* 56 56 DROGA--0.27 0.29 -0.23 LOGHIST0 -0.07 0.02 -0.60 -0.05 0.06 0.53 LOGHIST1 2.66 0.15 DEPRIVAC--0.27 Factorial 2x2 Tres indicadoras dos de efectos principales y una de la interacción -1.25 0.36 2.31 LOGHIST3 1.98 0.64 0.13 -1.75 DROG_X_D--0.21 -1.87 LOGHIST5 0.47 Figure X: EQS 6 subset of dogs.eds Chi Sq.=118.56 P=0.00 CFI=0.30 RMSEA=1.16 Mal ajuste, no correlaciones entre dependientes 57 57 correlaciones observadas menos las reproducidas con el modelo r ij - rij STANDARDIZED RESIDUAL MATRIX: DROGA V1 DEPRIVAC V2 DROG_X_D V3 LOGHIST0 V4 LOGHIST1 V5 LOGHIST3 V6 LOGHIST5 V7 DROGA V1 .000 .000 .000 .000 .000 .000 .000 DEPRI DR_X_D LOGHI1 LOGH2 V2 V3 V4 V5 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 LOGHIST3 LOGHIST5 V6 V7 LOGHIST3 V6 .000 LOGHIST5 V7 .379 .000 .000 .360 .492 .493 .000 .312 .297 Correlaciones entre variables dependientes 58 58 Modelo saturado DROGA--0.27 -0.23 0.29 LOGHIST0 -0.05 0.29 0.06 0.02 -0.60 -0.07 0.53 LOGHIST1 2.66 0.15 DEPRIVAC--0.27 0.32 0.55 0.37 2.31 -1.25 0.13 LOGHIST3 0.45 0.64 0.36 -1.75 1.98 DROG_X_D--0.21 0.54 -1.87 LOGHIST5 0.47 Figure X: EQS 6 subset of dogs3.eds Chi Sq.=-0.00 P=-1.00 CFI=-9.00 RMSEA=-9.00 59 59 Y= PYX1X1+ PYX2X2+…+PYXpXp+PYee2 Correlaciones entre independientes X1 e X2 Y X3 Xp 60 Multicolinealidad • Ejemplo del uso de gráficas para multicolinealidad en modelos de regresión. Las independientes están correlacionadas entre si. Dos de los usos de la regresión son : • Explicación: Que variables independientes ( las Xs) influyen en la dependiente ( la Y) • Predicción : Para un conjunto de valores de las Xs que valor de Y es el mas probables y su error de estimación 61 61 Datos de mezquite Biomasa y morfología Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0.868304 0.817651 179.9195 547.5421 19 Analysis of Variance Se quedan en el modelo. Source Model Error C. T otal DF 5 13 18 Sum of Squares Mean Square F Ratio 2774582.8 554917 17.1424 420823.1 32371 Prob > F 3195405.9 <.0001* Selección de variables Parameter Estimates Term Estimate Intercept -633.9447 DMA:Diametro mas ancho 421.21444 DME:Diametro mas estrecho 179.01994 AT :Altura total 13.116884 AP:Altura del pabellón -110.428 MDA:Medida de densidad del arbusto -0.190209 Se eliminan por no significativas Std Error t Ratio Prob>|t| Std Beta VIF 174.8941 -3.62 0.0031* 0 . 147.4542 2.86 0.0135* 0.698137 5.8960233 125.4312 1.43 0.1771 0.30732 4.5767798 245.5425 0.05 0.9582 0.013192 6.0196315 287.7734 -0.38 0.7074 -0.08663 5.0311875 31.07269 -0.01 0.9952 -0.00072 1.3657372 62 62 Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) Parameter Estimate s 0.865114 0.848254 164.1293 547.5421 19 Term Estimate Std Error t Ratio Prob>|t| Std Beta VIF Intercept -681.8358 134.1458 -5.08 0.0001* 0 . DMA:Diametro mas a ncho 387.10704 115.1662 3.36 0.0040* 0.641606 4.3219479 DME:Diametro mas e strecho 183.44485 111.1919 1.65 0.1185 0.314916 4.3219479 Casi la misma R2 , que con todas las variables, para predicción este modelo esta bien. Sin embargo para explicación no funciona. No es que Altura Total, Altura de Pabellón y Densidad del arbusto no influyan en la biomasa, si influyen a través de las correlaciones de estas tres variables con las retenidas en el modelo. Además al variar DMA también varian variables fuera del modelo, así que el coeficiente de regresión 387.1 no es solo el efecto de DMA en biomasa. Esto es mas claro si se considera un análisis de senderos. 63 63 DMA* 0.73* AT* 0.64* 0.68* 0.32* 0.88* BIOMASA 0.88* AP* 0.39* 0.64* 0.31* 0.58* 0.22* MDA* 0.20* DME* Hay efectos indirectos sobre la biomasa de las variables : Figure X: EQS 6 mesquite-est.eds Chi Sq.=0.43 P=0.93 CFI=1.00 RMSEA=0.00 Altura total , Altura de Pabellón y Medida de Densidad del Arbusto. Con fines explicativos es erróneo el modelo que64 64 resulta de la selección de variables 0.37 Información sobre evolución de 27 niños con daño neurológico perinatal . Tesis M en C Miriam Figueroa. UAM X. Rehabilitación Neurológica Seguimiento por un año, entre otras muchas cosas, PO permanencia del Objeto, EG edad gestacional, SSIN severidad del síndrome y SEC secuela ( si o no). Datos ordinales, se corrió con modelo robusto, dado que no se cumple la normalidad. 65 65 E4* E5* 0.95 0.80 PO1 PO3 E6* 0.20* 0.91 0.14* 0.60* EG 0.36* PO6 -0.36* 0.43* 0.35* -0.24* 0.24* PO9 -0.20* 0.75 E7* -0.10* SINN 0.18* 0.23* 0.35* PO12 0.83 E8 Desde el mes 9 si aumenta PO se disminuye la probabilidad de secuela Figure X: EQS 6 pomiriam.eds Chi Sq.=1.97 P=1.00 CFI=1.00 RMSEA=0.00 66 66 Desde los estudios sobre inteligencia a principios del siglo 20, se ha manejado que puede haber conceptos que no se pueden medir directamente, sino únicamente a través de indicadores de ellos o sea de variables observables. Así se han trabajado conceptos como inteligencia, agresividad, rendimiento escolar. Estas ideas dieron origen al llamado Análisis de Factores, que debe considerarse como “exploratorio” ya que no se fijan las cargas o pesos de las variables latentes sobre las manifiestas. Las variables son condicionalmente independientes dados los factores Factor 1 v1 v2 Factor 2 v3 v4 v5 67 67 Posteriormente se desarrolló la idea de que con base en consideraciones teóricas se podía establecer que algunas variables son indicadoras de unos factores y otras de factores diferentes. Se llama Análisis de Factores Confirmatorio. Podría haber algunas cargas comunes de una variable con dos o mas factores . Pero entonces surge una pregunta muy importante. ¿Los datos son compatibles con el modelo? Las variables son condicionalmente independientes dados los factores Factor 1 v1 v2 Factor 2 v3 v4 v5 68 68 69 F 70 71 Análisis de factores confirmatorio Rykov Tenko and George A. Marcoulides. “A first course in Structural Equation Modeling”. Lawrence Erlbaum Associates, Publishers. 2000. Pag 97. AFC. Son 250 estudiantes de segundo de “college”, se miden tres variables indicadoras de Habilidad, V1.-Habilidad General, V2.-Promedio en el ultimo año de high school y V3.- Promedio en el primer año del college. Tres indicadoras de Motivación: V4.- Motivación para alcances(score 1), V5.- Motivación para alcances(score 2), V6.- Motivación para alcances(score 3); y dos para Aspiración: V7.- Calificación en aspiración educacional y V8.Calificacion en aspiración vocacional. Matriz de Covarianzas GHabil V1 0.4500 V2 0.3200 V3 0.2700 V4 0.1700 V5 0.2000 V6 0.1900 V7 0.0800 V8 0.1100 1.0000 Xbar Sd 0.0000 GAveHS GAV1Col Motvn1 Motvn2 Motvn3 GEduAsp GVocAsp 0.3200 0.5600 0.3200 0.2000 0.2100 0.2500 0.1200 0.1000 1.0000 0.0000 0.2700 0.3200 0.4500 0.1900 0.1800 0.2000 0.0900 0.0700 1.0000 0.0000 0.1700 0.2000 0.1900 0.5500 0.3000 0.3000 0.2300 0.2100 1.0000 0.0000 0.2000 0.2100 0.1800 0.3000 0.6600 0.3600 0.2700 0.2500 1.0000 0.0000 0.1900 0.2500 0.2000 0.3000 0.3600 0.6100 0.2200 0.2700 1.0000 0.0000 0.0800 0.1200 0.0900 0.2300 0.2700 0.2200 0.5800 0.3900 1.0000 0.0000 0.1100 0.1000 0.0700 0.2100 0.2500 0.2700 0.3900 0.6200 1.0000 0.0000 72 Figure X: EQS 6 raykov-m-97.eds Chi Sq.=20.58 P=0.25 CFI=1.00 RMSEA=0.03 Buen ajuste 0.18 GenHabil 0.18 GrAvHaHS 1.18 Habilidad--0.27 1.01 Coeficientes no estandarizados GrAvHaCo 0.18 0.17 Motivn1 0.29 0.09 Motivacion--0.26 Con escalas originales en las variables 1.16 Motivn2 0.31 1.16 0.21 Motivn3 0.26 aspiracion--0.38 0.20 GEduAsp 1.03 73 Figure X: EQS 6 raykov-m-97.eds Chi Sq.=20.58 P=0.25 CFI=1.00 RMSEA=0.03 E1* 0.63 GenHabil 0.77 E2* 0.57 Habilidad* 0.82* GrAvHaHS Coeficientes estandarizados 0.78* E3* 0.63 GrAvHaCo 0.64* E4* 0.72 Motivn1 0.28* 0.69 Motivacion* 0.73* E5* 0.68 Motivn2 0.76* Con escalas estandarizadas a media cero y varianza uno para las variables 0.68* E6* 0.65 Motivn3 aspiracion* 0.81 E7* 0.59 GEduAsp 0.81* 74 Aspectos relevantes en la salida del EQS. NO SPECIAL PROBLEMS WERE ENCOUNTERED DURING OPTIMIZATION LARGEST STANDARDIZED RESIDUALS: correlaciones observadas menos las reproducidas con el modelo r ij - rij NO. PARAMETER ESTIMATE --- --------- ---------- --------- -------1 V7, V6 -.049 <0.10 2 V4, V3 .041 3 V8, V3 -.041 4 V5, V2 -.036 Puntos de corte recomendados CHI-SQUARE = 20.581 BASED ON 17 DEGREES OF FREEDOM PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS .24558 FIT INDICES ----------BENTLER-BONETT NORMED FIT INDEX = .974 >0.95 BENTLER-BONETT NON-NORMED FIT INDEX = .992 COMPARATIVE FIT INDEX (CFI) = .995 <0.08 ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) = .029 90% CONFIDENCE INTERVAL OF RMSEA ( .000, .067) <0.10 75 MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. GENHABIL=V1 = 1.000 F1 + 1.000 E1 GRAVHAHS=V2 = 1.185*F1 + 1.000 E2 .099 12.000@ GRAVHACO=V3 = 1.005*F1 + 1.000 E3 .087 11.605@ MOTIVN1 =V4 = 1.000 F2 + 1.000 E4 MOTIVN2 =V5 = 1.161*F2 + 1.000 E5 .121 9.611@ MOTIVN3 =V6 = 1.164*F2 + 1.000 E6 .118 9.893@ GEDUASP =V7 = 1.000 F3 + 1.000 E7 GVOCASP =V8 = 1.033*F3 + 1.000 E8 .113 9.172@ 76 VARIANCES OF INDEPENDENT VARIABLES STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. V F ----I F1 - F1 .269*I I .040 I I 6.686@I I F2 - F2 .261*I I .046 I I 5.668@I I F3 - F3 .378*I I .060 I I 6.278@I COVARIANCES AMONG INDEPENDENT VARIABLES STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. V F ----I F2 - F2 .169*I I F1 - F1 .027 I I 6.141@I I F3 - F3 .088*I I F1 - F1 .026 I I 3.342@I I F3 - F3 .214*I I F2 - F2 .034 I 77 STANDARDIZED SOLUTION: GENHABIL= V1 = .773 F1 GRAVHAHS= V2 = .821*F1 GRAVHACO= V3 = .777*F1 MOTIVN1 = V4 = .690 F2 MOTIVN2 = V5 = .730*F2 MOTIVN3 = V6 = .762*F2 GEDUASP = V7 = .807 F3 GVOCASP = V8 = .806*F3 + .634 E1 + .570 E2 + .629 E3 + .724 E4 + .683 E5 + .647 E6 + .591 E7 + .592 E8 CORRELATIONS AMONG INDEPENDENT VARIABLES --------------------------------------V F --I F2 - F2 .636*I I F3 - F3 .276*I I F3 - F3 .681*I R-SQUARED .598 .675 .604 .475 .534 .581 .651 .650 --- INDICES DE MODIFICACION DE AJUSTE WALD:..NONE OF THE FREE PARAMETERS IS DROPPED IN THIS PROCESS LM : NONE OF THE UNIVARIATE LAGRANGE MULTIPLIERS IS SIGNIFICANT, (Para agregar caminos o flechas). 78 La Síntesis, LISREL Structural Equations Modelling Karl Jöreskog 1934 – al presente Trabajo fundamental de síntesis en 1973 79 79 Posteriormente K. Joreskog unió las dos ideas, senderos y análisis de factores confirmatorio, para generar los llamados Modelos de Ecuaciones Estructurales (SEM o MEE)). En los que se plantean factores latentes para grupos de variables, pero además se establecen dependencias entre los factores vía senderos. Posteriormente en SEM entre otras cosas, se incluyen variables observables o manifiestas en los senderos, junto con factores (MIMIC) y para estudios longitudinales las Curvas de Crecimiento Latente. 80 80 Se tiene como información inicial, las mediciones en las variables para los elementos de estudio, de los que se obtiene la matriz de varianzas y covarianzas de las variables manifiestas u observadas llamada S. El modelo se especifica en una gráfica y en una serie de ecuaciones que ligan las variables entre si, incluyendo las latentes, y que involucran un conjunto de parámetros θ. De acuerdo a esas ecuaciones es posible determinar como serán las covarianzas en función de los coeficientes , Σ(θ). 81 Algunas propiedades de SEM 1. 2. 3. 4. Es un método “orientado al modelo” y no a una hipótesis nula . Es una herramienta de modelado muy flexible. Se puede usar en forma confirmatoria (prueba de ajuste del modelo propuesto) o en forma exploratoria (construcción del modelo). Frecuentemente es un mezcla, se inicia en forma confirmatoria, con la teoría que determina las causalidades (relaciones), que se representan en la gráfica de senderos, pero esta se modifica a la luz de los hallazgos empíricos. Hay una variedad de métodos de estimación 82 82 y de evaluación del ajuste (Fit) ¿¿Qué son los modelos de ecuaciones estructurales? 0 x1 .26 1.00 Factor 1 x2 Factor 5 .75 ξ1 x3 η5 .44 ns y2 y3 .90 .81 y4 1.0 0 η4 .92 .64 y8 Factor 4 ns y1 .95 .80 1.13 y5 .59 Factor 2 Factor η2 η3 .77 .98 -.47 y6 y7 1.0 Se concepualizan factores que surgen al considerar que varias variables son indicadores de un concepto hipotético. Se plantean támbien asociaciones entre factores 83 83 89 SEM (MEE): Un sistema flexible de ecuaciones multiples Jöreskög 1973 Matriz de covarianzas observada Sij x = Λxξ + δ y = Λyη + ε η = α + Β η + Γξ + ζ V ( ) V ( ) V ( ) V ( ) S σij Matriz de covarianzas reproducida en función de los parámetros (implicada) 90 90 Estimación y Evaluación Matriz de Covarianzas Observada Modelo Hipotético x1 y2 + y1 min (s ( )W (s ( ) S= { } 1.3 .24 .41 .01 9.7 12.3 compare Ajuste del Modelo Estimación de Parámetros σ11 σ12 σ22 σ13 σ23 σ33 { } = Σ(θ) Matriz de covarianzas Implicada 91 91 La matriz de varianzas y covarianzas implicada Σ(θ) , es función de un conjunto de parámetros. En base al principio de “Máxima Verosimilitud”, basado en el supuesto de normalidad multivariada de las variables, se busca aquel valor de los parámetros θ, que minimiza la función : F = ln|Σ(θ)|–ln|S| +traza[SΣ(θ)–1]–(p + q) Se puede decir que se buscan los parámetros que reproducen, de acuerdo al modelo postulado en la grafica, las varianzas y covarianzas más cercanas 92 posibles a las observadas. 92 Una vez que el modelo ha sido identificado y se han estimado sus parámetros, el siguiente problema que surge es el de evaluar qué tan bien se ajusta a los datos. Una medida global de ajuste es la estadística de la razón de verosimilitud, que sigue una distribución asintótica Ji-cuadrada dada por: x2=(n – 1)Fmín donde n es el tamaño de muestra y Fmín es el valor mínimo de la función ajustada (la anterior). 93 93 Si el modelo es correcto y el tamaño de muestra suficientemente grande, esta prueba permite valorar el ajuste, es decir el grado de semejanza entre la matriz de covarianzas observada en las variables xs y ys con términos sij, con la reproducida con el modelo, σij (θ),. Los grados de libertad de la Ji2 son: g.l. = 0.5 (p + q)(p + q + 1) – t donde t es el número de parámetros libres en el modelo, p es el numero de variables de factores dependientes (ys) y q el de las independientes (xs). 94 94 Sin embargo, la estadística Ji-cuadrada tiene un uso práctico limitado como medida de ajuste, ya que es una función tanto del tamaño de muestra como de la cercanía de la matriz de covarianzas estimada con la matriz de covarianzas observada. Una consecuencia de esto es que la probabilidad de rechazar un modelo aumenta con el incremento del tamaño de muestra, aún cuando la matriz de covarianzas de residuos, sij – σij (θ), presenta discrepancias triviales. Se acostumbra evaluar la magnitud de los residuos en forma estandarizada, equivale a las diferencias rij – ρij(θ), (en correlaciones: observada – implicada) 95 95 Adicionalmente, existen varias formas evaluar la “cercanía” del modelo con los datos, estas se resumen en los índices de ajuste, que son muy útiles Se recomienda también una validación cruzada. 96 96 Índices de ajuste en Ecuaciones Estructurales Hay varios índices de ajuste para valorar si el modelo es adecuado o no. Esto es muy usado, dado que al incrementarse la muestra la Ji cuadrada se incrementa mucho, entonces un modelo “aceptable” resulta significativo. Hay muchos reportes sobre la forma de avaluar el ajuste de un modelo de EQS. Una buena referencia es el trabajo: Hu S. and Bentler P. “Cutoff Criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives” Structural Equation Modelling 6(1) 1-55, 1999. Solo se incluirán en lo que sigue algunos de los 97 índices recomendados ahí. 97 Índice de ajuste comparativo, CFI Un buen modelo lo tendrá cercano a uno, es considerando como bueno que sea mayor o igual a 0.95. max CFI 1 max glm ,0 2 o glo ,0 m 2 Donde m y glm son los valores para el modelo que se esta ajustando; 2 y donde 0 y glo son los valores para el modelo que supone independencia total de las variables. 2 98 98 RMSEA Raíz de cuadrados medios del error. Se recomienda que sea inferior a 0.06 ( algunos citan 0.1) RMSEA Fo gl Donde N 1F gl Fo max ,0 N 1 Se obtienen también los intervalos de confianza al 90% para el RMSEA. Se recomienda que el limite superior sea inferior a 0.1 99 99 100 calificaciones de 88 estudiantes de una universidad Correlations Mecanica Mecanica 1.0000 Vectores 0.5534 algebra 0.5468 análisis 0.4094 es tadís tica 0.3891 Vectores 0.5534 1.0000 0.6096 0.4851 0.4364 algebra 0.5468 0.6096 1.0000 0.7108 0.6647 análisis es tadís tica 0.4094 0.3891 0.4851 0.4364 0.7108 0.6647 1.0000 0.6072 0.6072 1.0000 Vectores 0.3293 . 0.2808 0.0781 0.0202 algebra 0.2304 0.2808 . 0.4319 0.3568 análisis es tadís tica -0.0016 0.0246 0.0781 0.0202 0.4319 0.3568 . 0.2528 0.2528 . Partial Corr Mecanica Mecanica . Vectores 0.3293 algebra 0.2304 análisis -0.0016 es tadís tica 0.0246 partialed with respect to all other variables 101 Figure X: EQS 6 mardia3.eds Chi Sq.=0.89 P=0.93 CFI=1.00 RMSEA=0.00 E1* 0.84 C-Mechan C-Analys 0.55* 0.70 0.71* C-Algebr* 0.33* 0.61* 0.79 C-Vector 0.66* O-Statis 0.75 E2* Datos de Mardia sobre calificaciones de estudiantes de una universidad. Análisis de senderos 102 Modelo saturado Figure X: EQS 6 mardia3f1.eds Chi Sq.=0.07 P=-1.00 CFI=-9.00 RMSEA=-9.00 E1* 0.80 C-Mechan C-Analys 0.59 0.71 0.70* Factor latente* 0.25* 0 0.69* E2* 0.72 C-Vector 0.64* O-Statis 0.77 Datos de Mardia sobre calificaciones de estudiantes de una universidad. Análisis de Factores 103 E5 Evaluación de procesos de medición , métodos y ocasiones o sujetos. Sophia Rabe-Hesketh and Anders Skrondal. A Stata Press Publication. 2005 Pags 2, y 218.- Dos métodos para determinar flujo espiratorio forzado. Wrigth peak, en ocasiones 1 y 2, y Mini Wright en ocasiones 1 y 2, en 17 sujetos. El sujeto produce correlaciones entre todas las mediciones. Cada método por separado produce correlaciones entre sus mediciones. Se usan factores tanto para sujetos como para métodos 104 104 MiniWrigth* Wrigth* E E2* E4* E1* 0.24 0.24 0.09 0.17 wp1 wp2 0.96 0.00 0.19 wm2 0.97 0.98 0.00 0.17 wm1 0.99 sujeto* 105 105 0.97* MiniWrigth* Wrigth* E2* E4* E1* 0.98 1.00* 0.06 0.18 wp1 wp2 0.98 0.19 0.99* wm2 wm1 RELIABILITY COEFFICIENTS Figure X: EQS 6 pefr2met2.eds Chi Sq.=0.00 P=0.97 CFI=1.00 RMSEA=0.00 CRONBACH'S ALPHA = .989 RELIABILITY COEFFICIENT RHO = .994 Ambos métodos son confiables y miden lo mismo, se opta por el mas barato, rápido, etc. 106 106 MacKinnon D.P. “Introduction to Statistical Mediation Analysis”. Lawerence Erlbaun Associates. 2008. Se hicieron mediciones en 547 jugadores de futbol de High School. Se evaluaron en tres momentos, 1, antes de la temporada de juegos, 2, poco después y 3, varios meses después de ella. En la primer época se quería medir el concepto tolerancia del coach*, con tres indicadoras: coach1.- he hablado con algún coach sobre otras formas de fortalecimiento en lugar de usar esteroides, coach2.- en mi equipo hay reglas en contra del uso de esteroide y coach3.- si me encuentran usando 107 esteroides estaría en problemas con los “coaches”. En época 2, se evalúo la severidad percibida del uso de esteroides* con: severe 1.- Los malos efectos de los esteroides desaparecen en cuanto se dejan de tomar. Severe2.- solo unas pocas personas que usan esteroides anabólicos tienen efectos dañinos o desagradables, y severe 3.- Los esteroides no son dañinos si se usan pocos meses al año. En época 3, se evalúo Intención de usar esteroides* con : Intent1.-Tengo la intención de ensayar o usar esteroides. Intent2.- Estaré dispuesto a usar esteroides para saber que se siente, y Inten3.- Tengo curiosidad por usar esteroides * Factores latentes 108 0.22 0.56 0.63 intent1 intent2 1.47 3.26 coach1 0.73 coach2 1.75 TolCoach--0.47 1.50 InteUso 0.00 0.91 intent3 severe1 1.10 severe2 0.86 severe3 0.53 0.27 -0.41 1.18 SevePerci 1.48 0.63 1.27 coach3 0.89 Figure X: EQS 6 mackinn182.eds Chi Sq.=29.11 P=0.22 CFI=1.00 RMSEA=0.02 Coeficientes no estandarizados 109 E8* E9* E7* 0.34 0.66 intent1 intent2 0.75 E1* 0.93 coach1 D3* 0.36 E2* 0.62 coach2 0.78* 0.96 0.94* intent3 0.87* InteUso 0.00* TolCoach* 0.49 0.73 E4* severe2 0.62 E5* severe3 0.50 E6* 0.69 0.29* -0.29* severe1 0.78* SevePerci 0.79* E3* 0.61 0.86* coach3 0.96 D2* Figure X: EQS 6 mackinn182.eds Chi Sq.=29.11 P=0.22 CFI=1.00 RMSEA=0.02 Coeficientes estandarizados 110 DETERMINANT OF INPUT MATRIX IS .23023D+02 PARAMETER ESTIMATES APPEAR IN ORDER, NO SPECIAL PROBLEMS WERE ENCOUNTERED DURING OPTIMIZATION. LARGEST STANDARDIZED RESIDUALS: NO. PARAMETER ESTIMATE 1 V4, V1 -.098 2 V7, V1 -.091 3 V9, V4 -.065 <0.1 CHI-SQUARE = 29.111 BASED ON 24 DEGREES OF FREEDOM PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS .21596 FIT INDICES BENTLER-BONETT NORMED FIT INDEX = .986 BENTLER-BONETT NON-NORMED FIT INDEX = .996 COMPARATIVE FIT INDEX (CFI) = .997 ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) = 90% CONFIDENCE INTERVAL OF RMSEA ( .000, .042) >0.95 .020 <0.1 111 CONSTRUCT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. F1- tolerancia del Coach F2 =F2 = -.415*F1 + 1.000 D2 F2-Severidad Percibida F3 Intención de uso de .093 esteroides -4.458@ F3 =F3 = .266*F2 .048 5.534@ + .001*F1 .068 .020 + 1.000 D3 La influencia directa de F1, tolerancia del coach sobre F3 intención de uso, no es significativa. Es importante sin embargo, el efecto de F1 sobre F3 con F2 severidad percibida, como mediador. 112 PARAMETER TOTAL EFFECTS COACH1 =V1 = 1.000 F1 + 1.000 E1 COACH2 =V2 = 1.746*F1 + 1.000 E2 COACH3 =V3 = 1.482*F1 + 1.000 E3 SEVERE1 =V4 = 1.000 F2 - .415 F1 + 1.000 E4 + 1.000 D2 .093 -4.458@ SEVERE2 =V5 = 1.175*F2 - .487 F1 + 1.000 E5 + 1.175 D2 .077 .108 .077 15.296@ -4.499@ 15.296@ SEVERE3 =V6 = 1.269*F2 - .526 F1 + 1.000 E6 + 1.269 D2 .082 .116 .082 15.441@ -4.542@ 15.441@ INTENT1 =V7 = .266 F2 + 1.000 F3 - .109 F1 + 1.000 E7 +.266 D2 + 1.000 D3 .048 .067 .048 5.534@ -1.622 5.534@ INTENT2 =V8 = .391 F2 +1.470*F3 -.160 F1 +1.000 E8+ .391 D2 + 1.470 D3 .069 .069 .099 .069 .069 5.656@ 21.409@ -1.625 5.656@ 21.409@ INTENT3 =V9 = .399 F2 + 1.499*F3 - .163 F1+ 1.000 E9 + .399 D2 + 1.499 D3 .071 .071 .101 .071 .071 5.608@ 20.971@ -1.624 5.608@ 20.971 113 PARAMETER TOTAL EFFECTS F2 =F2 = -.415*F1 + 1.000 D2 F3 =F3 = .266*F2 - .109*F1 + .266 D2 .048 .067 .048 5.534@ -1.622 5.534@ + 1.000 D3 PARAMETER INDIRECT EFFECTS SEVERE1 =V4 = -.415 F1 + 1.000 D2 …...F3 =F3 = -.110*F1 + .266 D2 .093 .031 .048 -4.458@ -3.563@ 5.534@ SEVERE2 =V5 = -.487 F1 + 1.175 D2 .108 .077 -4.499@ 15.296@ SEVERE3 =V6 = -.526 F1 + 1.269 D2 .116 .082 -4.542@ 15.441@ INTENT1 =V7 = .266 F2 - .109 F1 + .266 D2 + 1.000 D3 .048 .067 .048 5.534@ -1.622 5.534@ INTENT2 =V8 = .391 F2 - .160 F1 + .391 D2 + 1.470 D3 .069 .099 .069 .069 5.656@ -1.625 5.656@ 21.409@ INTENT3 =V9 = .399 F2 - .163 F1 + .399 D2 + 1.499 D3 .071 .101 .071 .071 114 5.608@ -1.624 5.608@ 20.971@ DECOMPOSITION OF EFFECTS WITH STANDARDIZED VALUES PARAMETER TOTAL EFFECTS COACH1 =V1 = .356 F1 + .934 E1 COACH2 =V2 = .784*F1 + .621 E2 COACH3 =V3 = .789*F1 + .615 E3 SEVERE1 =V4 = .685 F2 - .198 F1 + .728 E4 + .656 D2 SEVERE2 =V5 = .781*F2 - .226 F1 + .625 E5 + .747 D2 SEVERE3 =V6 = .865*F2 - .250 F1 + .502 E6 + .828 D2 INTENT1 =V7 = .219 F2 + .747 F3 - .063 F1 + .664 E7 + .210 D2 + .715 D3 INTENT2 =V8 = .276 F2 + .941*F3 - .079 F1 + .337 E8 + .265 D2 + .900 D3 INTENT3 =V9 = .256 F2 + .873*F3 - .073 F1 + .488 E9 + .245 D2 + .835 D3 F2 =F2 = -.289*F1 + .957 D2 F3 =F3 = .294*F2 - .084*F1 + .281 D2 + .956 D3 PARAMETER INDIRECT EFFECTS SEVERE1 =V4 = -.198 F1 + .656 D2 SEVERE2 =V5 = -.226 F1 + .747 D2 SEVERE3 =V6 = -.250 F1 + .828 D2 INTENT1 =V7 = .219 F2 - .063 F1 + .210 D2 + .715 D3 INTENT2 =V8 = .276 F2 - .079 F1 + .265 D2 + .900 D3 INTENT3 =V9 = .256 F2 - .073 F1 + .245 D2 + .835 D3 F3 =F3 = -.085*F1 + .281 D2 115 WALD TEST (FOR DROPPING PARAMETERS) MULTIVARIATE WALD TEST BY SIMULTANEOUS PROCESS STEP PARAMETER CHI-SQUARE D.F. PROBABILITY 1 F3,F1 .000 1 .984 NONE OF THE UNIVARIATE LAGRANGE MULTIPLIERS IS SIGNIFICANT, F1 tolerancia del coach tiene efecto indirecto significativo sobre F3, Intención de usar esteroides, aun que su efecto directo no es signifcativo. 116 Si se trata de un análisis de factores confirmatorio con medias, las expresiones son. Σ = Λ Φ Λ´ μ = Λ μξ donde μξ es el vector de medias de las variables independientes, no explicadas. Máxima verosimilitud. Encontrar el mínimo de: FML F ( z ˆ )ˆ ( z ˆ ) 1 1 ˆ ˆ F log tr S log S ( p q) 117 118 ¡¡Medias de los factores latentes endógenos!! Análisis de factores con medias. 119 Análisis de factores con medias. 120 121 122 (Path analysis) MANOVA 123 Regresión lineal Caso X Y 1 simple de Y con X. A 3 24 1 B 8 20 1 Y = 20 + 0.4545455 X D 10 22 1 rYX=.601 C 15 32 1 E 19 27 1 Intercepto = 20 =25+ 0.455 (11) Medias 11 25 1 SD 6.205 4.69 0 Intercepto =Y+ b (X) 2 S 38.5 22.0 0 El Coeficiente de regresión 0.455 se puede ver como la estructura de covarianza del modelo de predicción. Este coeficiente refleja la asociación entre X y Y, pero no dice nada sobre la media de ambas variables. En cambio el intercepto (20) refleja la media de ambas variables y el coeficiente de regresión, con un solo numero. Se introduce una variable con valores iguales a1241 Regresión lineal simple de X con 1, sin ordenada al origen. Summary of Fit RSquare RSquare Adj Root Mean Square Error Mean of Response Observations (or Sum Wgts) 0 0 6.204837 11 5 14.045 Ey 0.455 38.5 Analysis of Variance Source DF Sum of Squares Mean Square Model 0 0.00000 0.0000 Error 4 154.00000 38.5000 C. Total 4 154.00000 Tested against reduced model: Y=mean 11 = X F Ratio . Prob > F . 20 0 Parameter Estimates Term 1 Estimate Std Error 11 2.774887 t Ratio Prob>|t| 3.96 0.0166* Media de Y=25= Efecto total de 1 en Y= = 20 + .455(11) Efecto directo de 1 en Y Efecto indirecto de 1 en Y Se introduce una “variable” con valores iguales 125 a1 CONSTANT--1.00 11.00 20.00 0.45 Y X V999, THE UNIT CONSTANT 38.50 VARIABLE MATRIX CONTAINS SPECIAL COVARIANCE MATRIX IS IN UPPER TRIANGLE; MEANS ARE IN BOTTOM ROW OF MATRIX COVARIANCE/MEAN MATRIX TO BE ANALYZED: 2 VARIABLES (SELECTED FROM VARIABLES), BASED ON 5 RMSEA=-9.00 Figure X: EQS 64kline trivial.eds Chi Sq.=0.00 P=-1.00 CFI=-9.00 CASES. X Y V999 V2 V3 V999 X V2 38.500 Y V3 17.500 22.000 V999 V999 11.000 25.000 1.000 126 En un modelo estructural de medias cada variable independiente se descompone en dos nuevas variables, la media y una desviación de la media. X= μx +e En consecuencia cada variable se convierte en una variable dependiente en una nueva ecuación en la que el intercepto es la media. X= μx1 +ex . Entonces ambos 1 y ex son “variables” independientes, la varianza de ex es igual a la de X. Los parámetros de un modelo SEM con estructura de medias, son a).-los coeficientes de regresión (coeficientes de sendero), b).- varianzas y covarianzas de las variables independientes, c).los interceptos de las variables dependientes , y d).- las medias de las independientes 127 El intercepto es la media implicada cuando no hay efectos indirectos de la constate 1 sobre esa variable. Cuando si hay efectos indirectos, la media implicada es el efecto total. Esto es válido tanto para variables observadas como para las latentes. En EQS se piden las covarianzas estimadas entre las variables Y y los factores F. (COVARIANCE en la parte de PRINT) y produce una matriz como sigue: ΣYY ΣYF ΣFY ΣFF Ultimo renglón (V999), medias. Al final medias de los factores 128 Ejemplo de “SEM” con medias. Estabilidad de la alienación. MATRIX CONTAINS SPECIAL VARIABLE V999, THE UNIT CONSTANT COVARIANCE MATRIX IS IN UPPER TRIANGLE; MEANS ARE IN BOTTOM ROW OF MATRIX COVARIANCE/MEAN MATRIX TO BE ANALYZED: BASED ON 932 CASES. ANOMIA67 V1 POWERL67 V2 ANOMIA71 V3 POWERL71 V4 V999 V999 ANOMIA67 POWERL67 ANOMIA71 POWERL71 V999 V1 V2 V3 V4 V999 11.834 Medias 6.947 9.364 6.819 5.091 12.532 4.783 5.028 7.495 9.986 13.610 14.760 14.130 14.900 1.000 129 0.39* E1* E3* E4* E2* 0.68 0.51 0.63 0.45 powerl71 anomia67 Powerl67 0.74 anomia71 0.86* 0.89* 0.78 -0.24* D1* 1.00 alienacion67 0.73 0.68* 5.39* D2* alienac71 1.81* CONSTANT 1.0 Figure X: EQS 6 wheatonbis.eds Chi Sq.=0.28 P=0.59 CFI=1.00 RMSEA=-9.00 Coeficientes estandarizados 130 MODEL COVARIANCE MATRIX FOR MEASURED AND LATENT VARIABLES ANOMIA67 V1 POWERL67 V2 ANOMIA71 V3 POWERL71 V4 V999 V999 F1 F1 F2 F2 F1 F2 F1 F2 ANOMIA67 POWERL67 ANOMIA71 POWERL71 V999 V1 V2 V3 V4 V999 11.730 6.908 9.401 6.717 5.097 12.469 4.672 5.065 7.453 9.986 13.614 14.759 14.131 14.900 1.000 6.372 6.908 4.702 4.672 13.614 4.702 5.097 7.501 7.453 14.996 F1 F1 6.372 4.702 F2 F2 7.501 Medias de los factores 1 y 2. Alienación en 67 y en 71 respectivamente 131 Un uso especial de las Ecuaciones Estructurales es en el contexto de estudios longitudinales, en los que se quiere valorar el ajuste de rectas o curvas, de manera que los parámetros de las curvas, la ordenada al origen y la pendiente, son variables aleatorias, es decir hay una curva para cada elemento estudiado. Se quiere conocer la media de las ordenadas al origen y de la pendiente, así como sus varianzas. Se usan factores latentes para esos parámetros. Las cargas de los factores sobre los parámetros 132 reflejan que parámetro es. 132 Así en el caso de la ordenada al origen todas las cargas son uno, para la pendiente las cargas son números que van creciendo según el tiempo de la variable a la que se dirige, para un coeficiente cuadrático son los cuadrados de los términos para el lineal. Se pueden modelar patrones no lineales y con puntos de cambio. 133 133 Some SEM advanced questions • Can change in responses be tracked over time? – Latent Growth Curve Analysis 2/20/2006 Latent Variable Models 134 Latent Growth Model D1 E1 E2 E3 E1 E2 E3 E1 E2 E3 E1 E2 E3 Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3 E1 QDI QDI1 Time Time 1 1 Intercept 2/20/2006 D2 1 E2 QDI QDI2 Time Time 2 0 1 QDI QDI3 Time Time 3 D3 1 E3 1 2 D4 E4 QDI QDI4 Time Time 4 3 Slope Latent Variable Models 135 D1* 1.0 Intercept Note que todas las cargas del factor ordenada al origen se fijan en la unidad Las cargas para el efecto lineal van creciendo desde 0 a 5 , de uno en uno. Si se tuviese diferentes incrementos de tiempo, estos pueden reflejarse en las cargas de la pendiente * 0.00 Constant 1 1.00 2.00 * 3.00 Linear 1.0 vg, 0, 1, 3, 7, 9 D2* Factor 1 136 136 D1* 1.0 Intercept La variable latente que representa al efecto cuadrático, tiene como cargas los cuadrados de los coeficientes del efecto lineal o pendiente. Se pueden usar los coeficientes de polinomios ortogonales .Hay mucha flexibilidad, se pueden usar exponentes fraccionarios * 0.00 1.00 2.00 Constant 1 Linear * 3.00 1.0 4.00 D2* * 5.00 0.00 1.00 4.00 16 Quadratic D3* 1.0 2 137 137 Consumo de alcohol en 4 épocas en 1204 estudiantes EQS. Medias supuestas ALC_T1 V1 ALC_T1 V1 .856 ALC_T2 V2 .648 ALC_T3 V3 .659 ALC_T4 V4 .609 V999 V999 3.200 ALC_T2 V2 .977 .817 .791 4.200 ALC_T3 V3 1.083 .952 4.900 ALC_T4 V4 1.300 5.100 V999 V999 1.000 Figure X: EQS 6 alcoholt4b Chi Sq.=0.74 P=0.39 CFI=1.00 RMSEA=0.00 Intercept 1 3.00 ALC_T1 0.20 1 0.54 0.32 0 CONSTANT--1.00 0.14 1.45 ALC_T2 1 0.20 1 -0.25 0.02 Linear 0 1 1 2 -0.04 ALC_T3 0.00 4 0.18 3 Quadratic 9 ALC_T4 0.20 138 ALC_T1 V1 ALC_T1 V1 .856 ALC_T2 V2 .648 ALC_T3 V3 .659 ALC_T4 V4 .609 V999 V999 3.200 ALC_T2 V2 .977 .817 .791 4.200 ALC_T3 V3 1.083 .952 6.600 ALC_T4 V4 1.300 7.400 V999 V999 1.000 Figure X: EQS 6 alcoholt4b f3libre Chi Sq.=7.56 P=0.01 CFI=1.00 RMSEA=0.07 D1* 1.0 Intercept 1 ALC_T1 1 1.0 1 * * E1* 1 CONSTANT1.0 D2* discontinuidad ALC_T2 0.00 * 1.0 1.0 E2* 1.00 Linear 2.00 3.00 * 0.00 ALC_T3 1.0 E3* 1.0 D3* * 1.0 discontinuo * ALC_T4 1.0 E4*139 En la tesis de Maestría en Ciencias en Rehabilitación Neurológica de Mirían Figueroa, UAM-X. se estudiaron 29 niños con daño neurológico perinatal, y tres de ellos tenían un daño severo, por lo que su desarrollo cognitivo fue prácticamente nulo. En este trabajo nos propusimos modelar el desarrollo cognitivo de los 26 niños restantes. El propósito básico de usar SEM radica en explorar las curvas de crecimiento con factores latentes. 140 140 Tipo de Estudio. Descriptivo (exploratorio) , retrospectivo parcial, longitudinal y observacional . Se obtuvo un muestra (disponible) de 29 niños con daño neurológico perinatal referidos por la sala de terapia intensiva neonatal del Instituto Nacional de Pediatría, en quienes se pudo documentar por medio de estudios neurofisiológicos, de imagen y laboratorio el diagnostico de las encefalopatías siguientes: hemorrágica, hipóxico-isquémica, hiperbilirrubinémica y mixta. Posteriormente por tener un daño muy severo se eliminaron tres de ellos. 141 141 Los criterios de Inclusión fueron que tuviesen antecedente de encefalopatía perinatal entre el 1 de enero de 1993 y el 31 de diciembre de 1994; con domicilio en el área metropolitana de la Cd. De México. Con seguimiento por 12 meses para evaluar el desarrollo cognitivo. Los Criterios de Exclusión fueron : Que presentaran diagnóstico de enfermedad que implicase deterioro neurológico progresivo. Que presentase anomalías cromosómicas o malformaciones congénitas asociadas del sistema músculo esquelético como luxación congénita de cadera o píe equino varo. Los Criterios de Eliminación fueron, con dos o mas fallas en el seguimiento, alta voluntaria del mismo, o 142 abandono del programa. 142 7 Variables Perinatales o de Base. Genero, Condición al Nacimiento, Tipo y severidad del Síndrome Neurológico, Diagnóstico de la Encefalopatía neonatal y tipo de encefalopatía. 84 Variables del Desarrollo Sensoriomotríz (Uzgiris y Hunt) Se midieron cada mes durante 12 meses. 1.-Persecución Visual y Permanencia del Objeto (PO). 2.-Medios y Fines para lograr Eventos Ambientales Deseados (MF). 3.-Imitación Vocal (IV). 4.-Imitación Gestual (IG). 5.-Causalidad Operacional (CO). 6.-Relaciones de los Objetos en el Espacio (RE). 143 143 7.-Esquemas con Relación a los Objetos (RO). Evolución Variables de base (Al nacer) Genero, Condición al Nacimiento, Tipo y severidad del Síndrome Neurológico, Diagnóstico de la Encefalopatía neonatal y tipo de encefalopatía Cognitiva 7 escalas por 12 meses Secuelas M NC CG S RET CC 144 144 Como sólo se tenia una muestra de 26 niños, no se pueden usar modelos muy elaborados, por esto se tomaron algunos de los indicadores de desarrollo sensioromotriz, los que habían sido mas fuertes predictores de secuelas en el estudio previo. Se inicia con un análisis de factores confirmatorio para PO MF CO y RE. Considerándolos simultáneamente, para construir un indicador latente del desarrollo basado en esos cuatro aspectos. Se consideran los meses 4, 8 y 12 del seguimiento. Para un buen ajuste se necesito usar correlaciones entre las variables. El modelo en forma gráfica esta en la figura 1. Los tres factores resultan con cargas grandes en todas las variables, lo que indica que si miden el desarrollo alcanzado en esa edad 145 145 Figure X: EQS 6 baslim-po-cuadr.eds Chi Sq.=11.55 P=0.56 CFI=1.00 RMSEA PO1 0.03 PO3 0.41 PO5 0.32 PO7 0.13 PO9 0.31 PO11 0.35 0.01 1 1 Intercept 0 11 1.04 Constant--1.00 0.68 0 1 Linear 2 1 1 3 4 1 0.08 4 9 -0.02 5 -0.01 16 Quadratic 25 0.00 146 146 F1 =F1 = 1.042*V999 + 1.000 D1 .039 26.725@ F2 =F2 = .680*V999 + 1.000 D2 .085 8.037@ F3 =F3 = -.023*V999 + 1.000 D3 .016 -1.467 147 147 Figure X: EQS 6 baslim-po.eds Chi Sq.=0.77 P=0.98 CFI=1.00 RMSEA=0.00 0.03 PO1 0.01 1 -0.02 Intercept 1 PO3 1.04 0.17 0.41 01 0.08 -0.02 1 PO5 0.33 Constant--1.00 12 0.11 0.58 1 Linear PO7 3 0.29 0.06 0.20 4 PO9 0.02 0.03 -0.03 0.07 -0.10 0.42 5 -0.03 PO11 BENTLER-BONETT NORMED FIT INDEX = 1.01 .995 LARGEST STANDARDIZED RESIDUALS: V999,V9 .105 0.08 148 148 Figure X: EQS 6 baslim-po.eds Chi Sq.=19.56 P=0.30 CFI=0.92 RMSEA=0.09 PO1 0.77 E5* D1* 0.64 1.00 PO3 0.18 0.96 E7* 0.87 E9* Intercept 0.00 0.19 0.22 8.23* PO5 0.20 Constant 1 0.46 0.15 3.82* 0.71 PO7 0.67 E11* Linear 0.14 1.00 0.74 PO9 D2* E13* 0.66 0.82 E15* 0.56 PO11 149 149 Figure X: EQS 6 baslim-po.eds Chi Sq.=19.56 P=0.30 CFI=0.92 RMSEA=0.09 PO1 0.02 0.02 1 PO3 1 0.44 Intercept 0 1 1.05 1 PO5 1 Constant--1.00 0.34 2 1 3 0.58 PO7 0.19 Linear 1 4 0.30 PO9 0.02 5 0.27 150 PO11 150 Figure X: EQS 6 baslim-po.eds Chi Sq.=0.77 P=0.98 CFI=1.00 RMSEA=0.00 D1* PO1 1.00 0.43 E5* 0.90 -0.42* Intercept 0.26 PO3 5.85* 0.25* 0.94 E7* 0.27 0.00 0.25 0.21 0.22* -0.53* PO5 0.86 E9* Constant 0.20 0.43 0.07* -1.13* 0.24* 0.16* 4.05* Linear 0.23 0.60 PO7 0.76 E11* 0.34* 0.57* 0.65 -0.63* 1.00 PO9 D2* 0.74 E13* 0.91 -0.15* PO11 0.35 E15* Se agregan correlaciones151 151 entre variables. MODEL COVARIANCE MATRIX FOR MEASURED AND LATENT VARIABLES PO1 V5 PO3 PO5 PO7 PO9 V7 V9 V11 V13 PO1 V5 .039 PO3 V7 .008 .466 PO5 V9 .032 .156 .448 PO7 V11 .007 .093 .229 .503 PO9 V13 .032 .142 .195 .475 .782 PO11 V15 .005 .193 .136 .338 .413 V999 V999 1.039 1.790 2.199 2.890 3.359 F1 F1 .032 .032 .032 .032 .032 F2 F2 .000 .020 .041 .061 .082 PO11 V999 F1 F2 V15 V999 F1 F2 PO11 V15 .618 V999 V999 3.938 1.000 F1 F1 .032 1.039 .032 F2 F2 .102 .580 .000 .020 Medias de todas las variables observadas y latentes 152 152 Crecimiento latente de factores Con los tres factores del AFC se construye un modelo de curva de crecimiento latente sobre ellos. Los valores iniciales están en la Fig. 2. Y los coeficientes no estandarizados o directos en la Fig. 3. Se obtienen también, las medias de los factores, las que reflejan claramente el incremento de las variables latentes. La ordenada al origen es de 0.14 y la pendiente de 1.00. Es decir se considera que los niños inician con valores bajos, en mes 1, y crecen en una unidad por cada 4 meses de desarrollo. En la Fig.4 están los coeficientes estandarizados 153 153 Figure X: EQS 6 fac3.eds Chi Sq.=34.40 P=0.72 CFI=1.00 RMSEA=0.00 BENTLER-BONETT NORMED FIT INDEX = .872 BENTLER-BONETT NONNORMED FIT INDEX = 1.046 COMPARATIVE FIT INDEX (CFI) = 1.000 BOLLEN'S (IFI) FIT INDEX = 1.024 ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) = .000 90% CONFIDENCE INTERVAL OF RMSEA ( 0.000, 0.105) PO4 0.66 MF4 0.00 CO4 0.57 RE4 0.78 0.75 1.00* desarrollo mes 4* 0.82* 0.62* 0 0.67* PO8 0.32 0.63 MF8 0.73 CO8 0.84 RE8 0.48 PO12 0.60 MF12 0.54 154 CO12 0.68 0.77 SATORRA-BENTLER SCALED CHI-SQUARE = 39.2542 ON 40 DEGREES OF FREEDOM PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS .50366 0.68* 0.66* desarrollo mes 8* 0.54* 0.88* 0.80* Todos los coeficientes de sendero son significativos con S-B 0.80 0.84* desarrollo mes 12* 0.73* 154 0.94* Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00 D1* 1.0 PO4 1.0 E10* MF4 1.0 E11* 1.0 D4* * desarrollo 4 1.0 1.0 * * * ordenada al origen * * * CO4 1.0 E12* RE4 1.0 * E13* * * * * 1.0 PO8 1.0 * 1.0 * * 1.0 CONSTANT 1.0 * desarrollo 8 * MF8 1.0 E19* * * 1.0 CO8 1.0 E20* RE8 1.0 E21* * * * 1.0 * * * * * E18* * * * 2.0 D2* * * * * pendiente PO12 1.0 1.0 * E26* * 3.0 1.0 * D5* * MF12 1.0 E27* * desarrollo 12 * CO12 1.0 * D3* 1.0 E28* * 155 155 Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00 Media 2.013 0.10 PO4 0.19 MF4 0.00 0.07 desarrollo 4 1.66 0.08 1.15 CO4 0.84 ordenada al origen 0.87 0.15 0.07 RE4 -1.13 0.18 0.03 0.10 0.14 0.07 0.07 Media 3.175 0.08 PO8 0.15 0.05 0.25 0.19 0.06 CONSTANT--1.00 0.18 1.04 1.13 desarrollo 8 MF8 0.25 1.78 0.11 0.07 0.47 CO8 0.20 0.97 1.00 0.08 RE8 0.13 0.92 0.40 -0.09 0.01 0.17 0.17 pendiente Media 4.064 0.05 0.02 PO12 0.08 0.38 0.09 0.06 MF12 0.03 1.15 0.02 desarrollo 12 0.12 1.03 CO12 0.95 0.24 0.08 156 156 0.00 RE12 0.16 Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00 D1* 0.72 PO4 0.70 E10* MF4 0.00 E11* 0.71 D4* desarrollo 4 1.00* 1.00 0.62 0.66* ordenada al origen 2.00* 0.50* 0.42* 0.79* CO4 0.31* RE4 -1.56* E12* 0.61 E13* 0.75 0.52* 0.18* 0.27* 0.35* 0.52 PO8 0.38* 0.69 1.#J* 0.17* E18* 0.30 0.75* 0.72 0.83* CONSTANT 1.0 0.69* 1.98* 0.76* desarrollo 8 MF8 0.65 E19* 0.24* 1.#J* 3.48* 0.33* 0.26* 0.48* 0.56 CO8 0.88 E20* 0.63* 0.68 7.51* 0.24* 0.05* 0.51 RE8 D2* 0.78 E21* -1.01* 1.91* 0.67* 0.44* pendiente PO12 0.79 0.38* E26* 0.30* 1.00 0.83 0.62 0.25* MF12 0.30 E27* 0.95* D5* desarrollo 12 0.47* 0.71* CO12 0.70 E28* 0.00 0.76* D3* 0.43* 157 157 RESUMEN: Ajuste de modelos. Pasos en SEM 1.- Teoría que variables y que relaciones entre ellas se postulan. Proceso de medición, qué variables latentes se postulan. Construir la grafica que resume la teoría. 2.-Verificar que la base de datos esta completa. Análisis exploratorio para eliminar observaciones atípicas y valorar formas de distribución. Con el EQS ajustar el modelo. Valorar ajuste. Si hay buen ajuste interpretar resultados. 158 RESUMEN: Ajuste de modelos. 3.-Si no hay buen ajuste, con los índices de modificación de ajuste: Prueba de Wald y prueba de Multiplicadores de Lagrange, agregar un elemento (línea causal o correlación según teoría), volver a correr y quitar un elemento. Avanzar paso a paso (agregar y quitar lo que se indica según pruebas, pero moderado por la teoría) llevando registro para poder regresar si se encuentra no identificación o se desajusta el modelo. Observar los cambios en la ji2 e índices de ajuste. También se consideran los residuos estandarizados más grandes para orientar la inclusión de más senderos. (Se acepta en caso extremo uno menor de 0.12) Los índices de ajuste deben mejorar paulatinamente, acercarse o superar 0.95, el RMSEA inferior a 0.08 ( límite superior menor a 0.10 extremo 0.12), la p aumenta, la ji2 baja. Si el modelo se juzga adecuado se interpretan resultados y se salva la grafica con senderos y coeficientes. En general no conviene fijar en 0 una 159 varianza de una variable, es una contradicción. Desarrollo Teórico Especificar modelo Diagrama de flujo Identificación Muestras y Mediciones Estimación de Parámetros Evaluar Ajuste ¿Ajusta? Si No Modificación del Modelo Discusión y Conclusión Bibliografía: 1.- Duncan, TE, Duncan SC, Strycker LA, Li F and Alpert A. “ An introduction to Latent Variable Grow Curve Modeling”. Lawrence Erlbaum Associates Publishers. 1999. 2.- Hancock G.R. and R.O. Mueller. Editors.” Structural Equation Modeling. A second course”. Information Age Publishing Inc. 2006 3.- Hoyle, Rick H. “ Structural Equation Modeling. Concepts, Issues, and Applications.“ SAGE Publications Inc. 1995. 4.- Hu S. and Bentler P. “Cutoff Criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives” Structural Equation Modelling 6(1): 1-55, 1999. 5.- Kline, Rex B. “ Principles and Practice of Structural Equation Modeling.” The Guilford Press. 2005. 6.- Loehlin John C. “ Latent Variables Models. An introduction to factor, path, and structural equation analysis” Lawrence Erlbaum Associates, Publishers. 2004 161 161 Bibliografía: 7.-MacKinnon D.P. “Introduction to Statistical Mediation Analysis. Lawrence Erlbaum Associates Publishers. 2008. 8.- Preacher KJ, Wichman AL, MacCallum RC and Briggs NE. “Latent Growth Curve Modeling”. Sage Publications. Num 157. 2008. 9.- Rykov Tenko and George A. Marcoulides. “A first course in Structural Equation Modeling”. Lawrene Erlbaum Associates, Publishers. 2000. 10.-Shipley Bill “ Cause and Correlation in Biology. A User¨s Guide to Path analysis, Structural Equation and Causal Inference”. Cambridge University Press 2000 162 162