Document

Anuncio
XII Seminario de Estadística Aplicada sobre
“Métodos Estadísticos
en Problemas Socioeconómicos”
Instituto interamericano de Estadística (IASI).
Escuela de Estadística
y Centro de Estadística Aplicada
a Estudios Socioeconómicos(CEAES)
Universidad Nacional de Colombia Sede Medellín
Ignacio Méndez Ramírez
IIMAS UNAM
México
1
[email protected]
1
Panorama
1.- Comentarios sobre causalidad y correlación
2.- Análisis de senderos.
3.-Algunas técnicas estadísticas presentadas
con gráficas, (senderos).
4.- Análisis de Factores Exploratorio y
Confirmatorio
5.-Ecuaciones Estructurales. Senderos con
factores o variables latentes.
6.- Curvas de Crecimiento Latente
Agregado. Se reportan referencias
2
2
Correlación
• Asociación entre dos variables. Numéricas
categóricas u ordinales.
La distribución de X cambia al condicionar
con Y y viceversa. No son independientes
estadísticamente una de la otra.
3
3
4
4
5
5
6
6
7
7
8
8
9
9
Si lo que buscamos es apoyar a la casualidad
a partir de datos empíricos. Entonces
podemos tratar cada caso, con mas
observaciones y con supuestos.
Para el caso 1, se efectúan pruebas de
significancia para que la correlación tenga
pocas probabilidades de deberse al azar.
El caso 2 (X Y) es el que queremos apoyar, la
hipótesis.
El caso 3 (X Y) se elimina si se pide que se
considere la temporalidad, primero la X y
después Y, no puede ser reversible
10
10
(4)
X
Y
Z
(5) (X
Z
Y)
Para los casos 4 y 5, (modelos distintos pero
equivalentes estadísticamente) se efectúan
pruebas de significancia para la correlación
parcial. Es decir se mantiene fijo el valor de Z,
por diseño o por análisis; si la correlación
parcial (de X con Y dado Z) es cero o casi. En
base a consideraciones teóricas, se opta por
el caso 4 o el 5.
Para el caso 6, si la correlación parcial no se
hace cero, entonces se pueden avaluar los
efectos directos y los indirectos. (6)
X
Y
Z
11
11
Se considera que en el tiempo se resuelve la
reciprocidad:
Época 1
Época 2
Época 3
Época 4
12
12
Decía Platón, en su popular mito, que
encadenados dentro de una caverna
han pasado toda su vida unos
prisioneros. Han vivido acostumbrados
a contemplar las sombras que
proyecta una hoguera situada a un
nivel superior por delante de la cual
circula otra gente. Evidentemente, los
prisioneros adoptan las sombras como
la realidad ya que su existencia se ha
basado en esa experiencia y no
conocen nada más
13
13
Un día, un prisionero logra desencadenarse
y salir del rincón donde vivía apresado,
contempla la hoguera, y a las cosas y
personas que producen las sombras, y
siente la necesidad de compartir esa
realidad con aquellos que viven atrapados
ante las sombras. Algunos le siguen, al
principio la nueva visión les ciega hasta
que sus ojos se acostumbran. Sin embargo
otros toman por loco a aquél que pretende
desencadenarlo y alejarlo de la seguridad
de su realidad hasta el punto de
amenazarlos de muerte si intentan poner
un dedo encima de sus tristes cadenas.
14
15
15
16
16
Cadenas
causales
ideas
17
17
Uso confirmatorio de las ideas de causalidad.
Como Platón, lo que observamos son los
reflejos o sombras de la realidad. Siempre el
estudio de la realidad esta mediado por el
diseño de investigación. Pero así como por
ejemplo una sombra redonda, puede ser
producida por una esfera o un cilindro, pero
no por un cubo o paralelepípedo.
Así en relación a las correlaciones, habrá
patrones de correlación compatibles con
ciertos modelos causales pero no con otros.
18
18
El uso de los modelos en el trabajo de
investigación se da de acuerdo al esquema:
Shipley Bill “ Cause and Correlation in Biology. A
User¨s Guide to Path analysis, Structural Equation
and Causal Inference”. Cambridge University
Press 2000
Enfoque
confirmatorio
20
20
1.- Se hacen mas claras las relaciones entre
variables,
2.- Se valora la influencia de unas sobre otras.
3.- Se pueden valorar los efectos directos de una
variable sobre otra,
4.- Se valoran los efectos indirectos.
5.- Se pueden tener variables mediadoras en la
influencia de una variable sobre otra.
6.-Permite
hacer
mas
aparentes
las
correlaciones,
21
7.- Se pueden tener variables latentes.
21
Análisis de senderos o de trayectorias
(Path analysis)
El análisis de senderos o método de
coeficientes de sendero, es una forma
de análisis de regresión estructurado,
varios modelos de regresión ligados, y
considerando variables estandarizadas
a media cero y varianza uno, en un
sistema cerrado.
Se establecen varias ecuaciones que
determinan todas las correlaciones
entre las variables observadas.
22
22
Es
prácticamente
indispensable
proponer un diagrama o modelo
gráfico, donde se especifique las
cadenas causales propuestas por el
investigador.
Lo que se obtiene es el grado de
cercanía
de
las
observaciones
empíricas con las cadenas causales
propuestas por el investigador, es decir
se apoya o no la hipótesis resumida en
la estructura causal propuesta, y
además se evalúa el peso de cada
relación, vía los llamados coeficientes
23
de sendero.
23
También se obtienen los efectos
directos e indirectos de unas variables
sobre otras.
Por supuesto que las causalidades
implicadas son de tipo probabilísticas
y además se requiere tener validez
interna para apoyar la causalidad.
24
24
Las
ecuaciones
estructurales
implicadas en el sistema son todas
lineales.
Si las relaciones son no lineales, no se
aplica el análisis, o bien, es una
primera aproximación, aunque existe
la posibilidad de generar funciones de
las variables (vg.Términos cuadráticos
o productos como variables) y usarlas
como nuevas variables.
25
25
Todas las ecuaciones propuestas deben ser
recursivas, sin ciclos de realimentación, es
decir debe haber un “flujo causal” sin
retornos.
Consideremos un ejemplo hipotético.
Sean X y Y variables exógenas, es decir no
determinadas por variables del sistema
(independientes), su correlación es rXY, y
esta correlación no será descompuesta.
Además
consideremos
tres
variables
endógenas
(dependientes),
es
decir
determinadas por otras variables en el
26
sistema, sean estas W, Z y L.
26
e2
PZX
PLZ
e3
rXY
PZY
PZW
PLW
PWY
e1
27
27
El sistema propuesto es:
W= PWYY+ PWe1e1
(1)
Z= PZXX+ PZYY+PZWW+PZe2e2
(2)
L= PLZZ+ PLWW+PLe3e3
(3)
Todas las variables se estandarizan a media
cero y varianza uno.
Los errores e1, e2, y e3 expresan el hecho de
que las variables endógenas no quedan
totalmente determinadas por el sistema.
Los
coeficientes
de
regresión
estandarizados, son los coeficientes de
28
sendero, PWY, PZX, PZY, PZW, PLZ y PLW.
28
Su significado es el mismo de la regresión
múltiple, por ejemplo en ecuación (2), PZY es
el cambio en desviaciones estándar que
experimenta Z al aumentar una desviación
estándar Y, manteniendo constantes a X y W.
No vamos a distinguir entre parámetros y
estimadores, todos los que se refieran serán
estimadores.
En cada modelo de regresión, los
estimadores de los coeficientes de senderos
se obtienen de manera usual por mínimos
cuadrados en cada una de las tres
29
regresiones.
29
Nota. Inicialmente los parámetros en el análisis de
senderos se estiman con mínimos cuadrados (OLS).
Paquetes como EQS pueden hacerlo, pero también
pueden usar otros métodos de estimación como
Máxima Verosimilitud
(ML) y otros . La máxima
verosimilitud permite valorar todo el sistema con
una prueba de Ji cuadrada
Se puede demostrar que el proceso de
estimación por mínimos cuadrados, genera
las ecuaciones normales, las que por la
codificación de las variables equivale a una
descomposición de los coeficientes de
correlación.
En este caso el sistema es:
30
30
rWY= PWY
( X X ) ˆ  X Y
(EN1)
Ecuaciones normales
PZX + PZY rYX+ PZWrWX= rZX
PZX rYX+ PZY + PZWrWY= rZY
PZX rxw+ PZY rWY+ PZW= rZW
PLZ + PLWrWZ= rLZ
PLZ rZW+ PLW= rLW
(EN2)
(EN3)
Nótese que es una descomposición implícita
de coeficientes de correlación, es decir, de
aquí se obtienen los coeficientes de
correlación en términos de los coeficientes
31
de sendero y otras correlaciones.
31
PZe2
e2
PZX
PLZ
e3
rXY
PZY
PLe3
PZW
PLW
PWY
PWe1
e1
32
32
La correlación entre X y Y, las exógenas, no
se descompone.
La correlación entre W y Y es PWY.
Las demás correlaciones pueden ser
expresadas en términos de los coeficientes
de sendero.
Es decir,
resultan
senderos
“pueden
variables.
las correlaciones entre variables
estar determinadas por los
o caminos por los cuales se
comunicar” cada pareja de
33
33
Una correlación se descompone en la suma
de los productos de los coeficientes por cada
posible sendero que conecta las dos
variables involucradas.
Así, la correlación entre W y X, resulta del
producto de coeficientes a lo largo del
sendero que conecta X con W pasando por Y.
En la obtención de correlaciones, los errores
se desprecian por no estar correlacionados
con otras variables; en las varianzas si
influyen.
34
34
rwx = PWYrXY
rXY
PWY
Nótese que el sendero entre X y Y se puede
considerar en los dos sentidos, los otros
deben respetar el sentido de las flechas. 35
35
Senderos entre X y Z
PZX
Se dice que rZX es el
efecto total ET entre Z y
X , y que PZX es el efecto
directo ED, de X a Z, es el
sendero
directo,
sin
pasar por otras variables.
rXY
PZY
PZW
PWY
La diferencia entre ET y ED es EI el efecto
indirecto de X sobre Z.
36
36
Este efecto indirecto está originado por dos
caminos que conectan a X con Z.
Uno es pasando de X a Y y luego de Y a Z, su
peso es rXY PZY.
El otro camino es vía X a Y a W y a Z, su
peso es rXY PWY PZW.
De manera que la correlación entre X y Z se
integra por los tres senderos sumados.
rZX = PZX + rXY PZY + rXY PWY PZW
ET = ED +
EI
37
37
Senderos entre Z y Y
Ahora consideremos los
correlación entre Z y Y .
senderos
y
la
PZX
El efecto indirecto tiene
dos caminos de Y a W y
a Z, PWYPZW
y el que
va de Y a X y de ahí a Z,
rXYPZX
rXY
PZY
PZW
PWY
Efecto total ET= rZY= PZY + PWYPZW+ rXYPZX
Efecto total ET= rZY= ED +
EI
38
38
Senderos entre L y W
PZX
PLZ
rXY
PZY
PZW
PLW
PWY
El efecto directo es PLW y hay tres caminos indirectos.
(ver colores)
De manera que:
ET=rLW =PLW+ rXYPWY PZXPLZ+ PWY PZYPLZ + PZW PLZ 3939
Senderos entre Y y L
PZX
PLZ
rXY
PZY
PZW
PLW
PWY
Entonces, la correlación o efecto total entre Y y L es:
ET = rLY= rXYPZX PLZ+ PZYPLZ+ PWY PZWPLZ+PYWPWL
Nótese que ahora no hay efecto directo.
40
40
Cuando el número de flechas que conectan
pares de variables es igual al número de
coeficientes de correlación, es posible obtener
una descomposición exacta de los coeficientes
de correlación, es el modelo saturado.
Sin embargo, cuando por nuestra teoría
eliminamos algunas flechas, o bien, en un
primer análisis algunas P son muy pequeñas, las
eliminamos y obtenemos un nuevo sistema que
no es saturado (tiene un carácter exploratorio).
En este ultimo caso algunos coeficientes de
correlación, obtenidos con los modelos a través
de los senderos, no coinciden con los
observados.
41
41
Si las discrepancias son pequeñas, “el modelo
no discrepa de los datos” y puede proponerse
como un apoyo empírico a las relaciones
involucradas.
Es importante recalcar que pueden obtenerse
varios sistemas que sean compatibles con los
datos, de manera que uno de ellos no puede ser
el “verdadero”, sólo es una explicación
propuesta para las relaciones entre variables.
El paquete EQS, diseñado para generar factores
hipotéticos y buscar sus relaciones, puede
usarse para análisis de senderos. Además este
paquete obtiene los efectos totales y los
indirectos con sus errores estándar y pruebas de
42
42
significancia de ambos.
Este software además realiza una prueba de
significancia vía una Ji2 asintótica, para la
hipótesis de que el modelo es válido
considerando parámetros poblacionales y
por tanto puede generar datos como los
obtenidos con elevada probabilidad.
Si se rechaza el modelo, se considera que el
esquema causal propuesto no tiene apoyo
empírico, con esos datos.
El EQS genera además otros índices de
ajuste, valorando las discrepancias entre
correlaciones observadas y las reproducidas
43
con el modelo. RMSEA, NFI, etc.
43
De hecho el coeficiente de determinación de
cada variable endógena, es función del
coeficiente de sendero del error de esa
variable a la variable dependiente.
PLe3  1  RL. ZW
y por
tanto,
R
2
L. ZW
 1  PLe3
2
2
Donde R2 es el coeficiente de determinación
en la ecuación de regresión que predice L.
44
44
Identificabilidad
Es importante preguntarse si el número de
ecuaciones (información de entrada) es suficiente
para “encontrar la solución” para los parámetros.
Puede haber tres casos:
1.- Modelos subidentificados, menos ecuaciones
que parámetros, no hay una solución.
2.Modelos
saturados,
igual
numero
de
ecuaciones (información) que parámetros, Hay
una solución única. No se puede evaluar el ajuste.
3.- Modelos sobreidentificados, mas ecuaciones
(información) que parámetros, hay infinitas
soluciones, se busca aquella que es optima según
algún criterio. Se puede evaluar el grado de ajuste
de los datos al modelo.
45
El Origen de los Modelos de Ecuaciones
Estructurales (SEM)
Sewell Wright
1897-1988
Primer
articulo:
1920
46
46
La Idea de Wright
X
Y1 = α1 + β1X + ε1i
Y1
Y2
Y2 = α2 + β2X + β3Y1 + ε2i
ε1i
ε2i
47
47
S. Wright desarrolló la técnica de Análisis de Senderos (Path
Analysis). Que consiste en postular en base a la teoría
existente o tentativa, una serie de dependencias entre
variables de manera concatenada, se señala con flechas las
relaciones de dependencia. Equivale a varios modelos de
regresión sucesivos.
v3
v5
v6
v1
v7
v2
v4
La doble flecha indica variables correlacionadas sin
dependencia una de la otra.
De nuevo surge la pregunta ¿¿ los datos son compatibles
con el modelo postulado en la gráfica??
48
48
49
25
20
y
15
10
Como modelo de regresión
5
Parameter Estimates
0
a
o
a-vs -otros
Term
Intercept
Ia
Estimate Std Error
9.2 1.456083
-3.9
2.52201
t Ratio Prob>|t|
6.32 <.0001*
-1.55 0.1332
Std Beta
0
-0.28051
Summary of Fit
Rsquare
0.078684
Adj Rsquare
0.04578
Root Mean Square Error
6.511802
Mean of Response
7.9
Obs ervations (or Sum Wgts)
30
R2= 1 - 0.962 = 0.0784
t Test
o-a
As sum ing equal variances
Difference
3.9000 t Ratio
1.546385
Std Err Dif
2.5220 DF
28
Upper CL Dif
9.0661 Prob > |t|
0.1332
Lower CL Dif
-1.2661 Prob > t
0.0666 -10
Confidence
0.95 Prob < t
0.9334
Level
a
o
-5
0
5
Number
10
20
Mean
5.30000
9.20000
10
50
50
Modelo saturado
R2= 1 - 0.962 = 0.0784
a--o*
-0.28*
Y
0.96
E1*
Figure X: EQS 6 drug a--o prueba t.eds Chi Sq.=0.00 P=-1.00 CFI=-9.00 RMSEA
51
51
Análisis de varianza con 4 grupos, o regresión con
tres indicadoras
Summary of Fit
Analysis of Variance
RSquare
0.72512
RSquare Adj
0.6564 Source
Root Mean Square Error
1.346755 Model
Mean of Response
4.75 Error
Obs ervations (or Sum Wgts )
16 C. Total
DF
3
12
15
Sum of
Squares Mean Square
57.415000
19.1383
21.765000
1.8138
79.180000
F Ratio
10.5518
Prob > F
0.0011*
Parameter Estimates
Term
Intercept
Z1
Z2
Z3
Estimate Std Error t Ratio Prob>|t|
7.475 0.673378
11.10 <.0001*
-4.925
0.9523
-5.17 0.0002*
-3.975
0.9523
-4.17 0.0013*
-2
0.9523
-2.10 0.0575
R2= 1 - 0.5242 = 0.725
52
52
Z1--0.20
-0.07
-4.92
1.45
CALIFICA
-3.98
Z2--0.20
-0.07
-0.07
-2.00
Z3--0.20
Nótese las correlaciones entre
Figure X: EQS 6 caledad1.eds Chi Sq.=0.00 P=-1.00 CFI=-9.00 RMSEA=-9.00
variables
independientes, en este
caso las 3 indicadoras de los 4
tratamientos.
53
53
MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST
STATISTICS
STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
CALIFICA=V2 = -4.925*V5
.852
-5.782@
- 3.975*V6
.852
-4.667@
- 2.000*V7
.852
-2.348@
STANDARDIZED SOLUTION:
CALIFICA=V2 = -.959*V5
+ 1.000 E2
R-SQUARED
- .774*V6
- .389*V7
Contribución
de
fuentes de variación
no especificadas en
la “explicación” de
CALIFICA,
el
llamado error
+ .524 E2
.725
54
54
Factorial 2 x 2 (deprivación de alimento y
droga) con 4 respuestas en el tiempo.
MANOVA Mediciones repetidas
droga-depri
m orphinen
m orphiney
trim ethn
trim ethy
1
droga-depri
LS Means
0
-1
-2
-3
-4
LogHist0
LogHist1
LogHist3
LogHist5
Res ponses
droga-depri
LogHist0
LogHist1
m orphinen -2.8905289 -1.1621238
m orphiney -2.6525258 -2.5754886
trim ethn
-3.0200804 0.13136445
trim ethy
-2.4204863 -2.5285521
LogHist3
-1.9995998
-2.5556808
-0.1738823
-2.4829718
LogHist5
-2.3229961
-2.428211
-0.5102707
-2.4860774
55
55
All Between
Test
F Test
Value
1.1101495
Exact F NumDF
4.0705
3
DenDF
11
Prob>F
0.0359*
Exact F NumDF
107.2866
1
DenDF
11
Prob>F
<.0001*
Intercept
Test
F Test
Value
9.7533317
droga-depri
Test
F Test
Value
1.1101495
Exact F NumDF
4.0705
3
DenDF
11
Prob>F
0.0359*
Within Subjects
Contras t
All Within Interactions
Test
Wilks' Lam bda
Pillai's Trace
Hotelling-Lawley
Roy's Max Root
Value
0.0198871
1.7570944
13.863757
11.007649
Approx. F NumDF
9.8056
9
5.1836
9
11.8099
9
40.3614
3
DenDF
22.054
33
23
11
Prob>F
<.0001*
0.0002*
<.0001*
<.0001*
Resultado del
JMP,
análisis
MANOVA con
mediciones
repetidas en el
tiempo.
Time
Test
F Test
Value
8.0108714
Exact F NumDF
24.0326
3
DenDF
9
Prob>F
0.0001*
Time*droga-depri
Test
Wilks' Lam bda
Pillai's Trace
Hotelling-Lawley
Roy's Max Root
Value
0.0198871
1.7570944
13.863757
11.007649
Approx. F NumDF
9.8056
9
5.1836
9
11.8099
9
40.3614
3
DenDF
22.054
33
23
11
Prob>F
<.0001*
0.0002*
<.0001*
<.0001*
56
56
DROGA--0.27
0.29
-0.23
LOGHIST0
-0.07
0.02
-0.60
-0.05
0.06
0.53
LOGHIST1
2.66
0.15 DEPRIVAC--0.27
Factorial 2x2
Tres
indicadoras
dos de
efectos
principales y
una de la
interacción
-1.25
0.36
2.31
LOGHIST3
1.98
0.64
0.13
-1.75
DROG_X_D--0.21
-1.87
LOGHIST5
0.47
Figure X: EQS 6 subset of dogs.eds Chi Sq.=118.56 P=0.00 CFI=0.30 RMSEA=1.16
Mal ajuste, no correlaciones
entre dependientes
57
57
correlaciones
observadas menos las reproducidas con el
modelo r ij - rij
STANDARDIZED RESIDUAL MATRIX:
DROGA
V1
DEPRIVAC V2
DROG_X_D V3
LOGHIST0 V4
LOGHIST1 V5
LOGHIST3 V6
LOGHIST5 V7
DROGA
V1
.000
.000
.000
.000
.000
.000
.000
DEPRI DR_X_D LOGHI1 LOGH2
V2
V3
V4
V5
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
LOGHIST3 LOGHIST5
V6
V7
LOGHIST3 V6
.000
LOGHIST5 V7
.379
.000
.000
.360
.492
.493
.000
.312
.297
Correlaciones
entre variables
dependientes
58
58
Modelo saturado
DROGA--0.27
-0.23
0.29
LOGHIST0
-0.05
0.29
0.06
0.02
-0.60
-0.07
0.53
LOGHIST1
2.66
0.15 DEPRIVAC--0.27
0.32
0.55
0.37
2.31
-1.25
0.13
LOGHIST3
0.45
0.64
0.36
-1.75
1.98
DROG_X_D--0.21
0.54
-1.87
LOGHIST5
0.47
Figure X: EQS 6 subset of dogs3.eds Chi Sq.=-0.00 P=-1.00 CFI=-9.00 RMSEA=-9.00
59
59
Y= PYX1X1+ PYX2X2+…+PYXpXp+PYee2
Correlaciones
entre
independientes
X1
e
X2
Y
X3
Xp
60
Multicolinealidad
• Ejemplo del uso de gráficas para
multicolinealidad en modelos de regresión. Las
independientes están correlacionadas entre si.
Dos de los usos de la regresión son :
• Explicación: Que variables
independientes ( las Xs) influyen en la
dependiente ( la Y)
• Predicción : Para un conjunto de
valores de las Xs que valor de Y es el
mas probables y su error de estimación
61
61
Datos de mezquite Biomasa y morfología
Summary of Fit
RSquare
RSquare Adj
Root Mean Square Error
Mean of Response
Observations (or Sum Wgts)
0.868304
0.817651
179.9195
547.5421
19
Analysis of Variance
Se
quedan
en el
modelo.
Source
Model
Error
C. T otal
DF
5
13
18
Sum of
Squares Mean Square
F Ratio
2774582.8
554917 17.1424
420823.1
32371 Prob > F
3195405.9
<.0001*
Selección
de
variables
Parameter Estimates
Term
Estimate
Intercept
-633.9447
DMA:Diametro mas ancho
421.21444
DME:Diametro mas estrecho
179.01994
AT :Altura total
13.116884
AP:Altura del pabellón
-110.428
MDA:Medida de densidad del arbusto -0.190209
Se eliminan por no
significativas
Std Error t Ratio Prob>|t| Std Beta
VIF
174.8941
-3.62 0.0031*
0
.
147.4542
2.86 0.0135* 0.698137 5.8960233
125.4312
1.43 0.1771
0.30732 4.5767798
245.5425
0.05 0.9582 0.013192 6.0196315
287.7734
-0.38 0.7074 -0.08663 5.0311875
31.07269
-0.01 0.9952 -0.00072 1.3657372
62
62
Summary of Fit
RSquare
RSquare Adj
Root Mean Square Error
Mean of Response
Observations (or Sum Wgts)
Parameter Estimate s
0.865114
0.848254
164.1293
547.5421
19
Term
Estimate Std Error t Ratio Prob>|t| Std Beta
VIF
Intercept
-681.8358 134.1458 -5.08 0.0001*
0
.
DMA:Diametro mas a ncho
387.10704 115.1662
3.36 0.0040* 0.641606 4.3219479
DME:Diametro mas e strecho 183.44485 111.1919
1.65 0.1185 0.314916 4.3219479
Casi la misma R2 , que con todas las variables, para
predicción este modelo esta bien. Sin embargo
para explicación no funciona. No es que Altura
Total, Altura de Pabellón y Densidad del arbusto no
influyan en la biomasa, si influyen a través de las
correlaciones de estas tres variables con las
retenidas en el modelo. Además al variar DMA
también varian variables fuera del modelo, así que
el coeficiente de regresión 387.1 no es solo el
efecto de DMA en biomasa. Esto es mas claro si se
considera un análisis de senderos.
63
63
DMA*
0.73*
AT*
0.64*
0.68*
0.32*
0.88*
BIOMASA
0.88*
AP*
0.39*
0.64*
0.31*
0.58*
0.22*
MDA*
0.20*
DME*
Hay efectos indirectos sobre la biomasa de las variables :
Figure X: EQS 6 mesquite-est.eds Chi Sq.=0.43 P=0.93 CFI=1.00 RMSEA=0.00
Altura total , Altura
de Pabellón y Medida de Densidad del
Arbusto. Con fines explicativos es erróneo el modelo que64
64
resulta de la selección de variables
0.37
Información sobre evolución de 27 niños con daño
neurológico perinatal . Tesis M en C Miriam Figueroa.
UAM X. Rehabilitación Neurológica Seguimiento por
un año, entre otras muchas cosas, PO permanencia
del Objeto, EG edad gestacional, SSIN severidad del
síndrome y SEC secuela ( si o no).
Datos ordinales, se corrió con
modelo robusto, dado que no
se cumple la normalidad.
65
65
E4*
E5*
0.95
0.80
PO1
PO3
E6*
0.20*
0.91
0.14*
0.60*
EG
0.36*
PO6
-0.36*
0.43*
0.35*
-0.24*
0.24*
PO9
-0.20*
0.75
E7*
-0.10*
SINN
0.18*
0.23*
0.35*
PO12
0.83
E8
Desde el mes 9 si aumenta PO se disminuye la probabilidad de secuela
Figure X: EQS 6 pomiriam.eds Chi Sq.=1.97 P=1.00 CFI=1.00 RMSEA=0.00
66
66
Desde los estudios sobre inteligencia a principios del siglo
20, se ha manejado que puede haber conceptos que no se
pueden medir directamente, sino únicamente a través de
indicadores de ellos o sea de variables observables. Así se
han trabajado conceptos como inteligencia, agresividad,
rendimiento escolar. Estas ideas dieron origen al llamado
Análisis de Factores, que debe considerarse como
“exploratorio” ya que no se fijan las cargas o pesos de las
variables latentes sobre las manifiestas.
Las variables son
condicionalmente
independientes
dados los
factores
Factor 1
v1
v2
Factor 2
v3
v4
v5
67
67
Posteriormente se desarrolló la idea de que con base
en consideraciones teóricas se podía establecer que
algunas variables son indicadoras de unos factores y
otras de factores diferentes. Se llama Análisis de
Factores Confirmatorio.
Podría haber algunas
cargas comunes de una variable con dos o mas
factores . Pero entonces surge una pregunta muy
importante. ¿Los datos son compatibles con el
modelo?
Las variables son
condicionalmente
independientes
dados los
factores
Factor 1
v1
v2
Factor 2
v3
v4
v5
68
68
69
F
70
71
Análisis de factores confirmatorio
Rykov Tenko and George A. Marcoulides. “A first course in
Structural
Equation
Modeling”.
Lawrence
Erlbaum
Associates, Publishers. 2000. Pag 97. AFC. Son 250 estudiantes
de segundo de “college”, se miden tres variables indicadoras de
Habilidad, V1.-Habilidad General, V2.-Promedio en el ultimo año de high
school y V3.- Promedio en el primer año del college. Tres indicadoras
de Motivación: V4.- Motivación para alcances(score 1), V5.- Motivación
para alcances(score 2), V6.- Motivación para alcances(score 3); y dos
para Aspiración: V7.- Calificación en aspiración educacional y V8.Calificacion en aspiración vocacional.
Matriz de Covarianzas
GHabil
V1 0.4500
V2 0.3200
V3 0.2700
V4 0.1700
V5 0.2000
V6 0.1900
V7 0.0800
V8 0.1100
1.0000
Xbar
Sd 0.0000
GAveHS GAV1Col Motvn1 Motvn2 Motvn3 GEduAsp GVocAsp
0.3200
0.5600
0.3200
0.2000
0.2100
0.2500
0.1200
0.1000
1.0000
0.0000
0.2700
0.3200
0.4500
0.1900
0.1800
0.2000
0.0900
0.0700
1.0000
0.0000
0.1700
0.2000
0.1900
0.5500
0.3000
0.3000
0.2300
0.2100
1.0000
0.0000
0.2000
0.2100
0.1800
0.3000
0.6600
0.3600
0.2700
0.2500
1.0000
0.0000
0.1900
0.2500
0.2000
0.3000
0.3600
0.6100
0.2200
0.2700
1.0000
0.0000
0.0800
0.1200
0.0900
0.2300
0.2700
0.2200
0.5800
0.3900
1.0000
0.0000
0.1100
0.1000
0.0700
0.2100
0.2500
0.2700
0.3900
0.6200
1.0000
0.0000
72
Figure X: EQS 6 raykov-m-97.eds Chi Sq.=20.58 P=0.25 CFI=1.00 RMSEA=0.03
Buen ajuste
0.18
GenHabil
0.18
GrAvHaHS
1.18
Habilidad--0.27
1.01
Coeficientes no
estandarizados
GrAvHaCo
0.18
0.17
Motivn1
0.29
0.09
Motivacion--0.26
Con escalas
originales en
las variables
1.16
Motivn2
0.31
1.16
0.21
Motivn3
0.26
aspiracion--0.38
0.20
GEduAsp
1.03
73
Figure X: EQS 6 raykov-m-97.eds Chi Sq.=20.58 P=0.25 CFI=1.00 RMSEA=0.03
E1*
0.63
GenHabil
0.77
E2*
0.57
Habilidad*
0.82*
GrAvHaHS
Coeficientes
estandarizados
0.78*
E3*
0.63
GrAvHaCo
0.64*
E4*
0.72
Motivn1
0.28*
0.69
Motivacion*
0.73*
E5*
0.68
Motivn2
0.76*
Con escalas
estandarizadas
a media cero y
varianza uno
para las
variables
0.68*
E6*
0.65
Motivn3
aspiracion*
0.81
E7*
0.59
GEduAsp
0.81*
74
Aspectos relevantes en la salida del EQS.
NO SPECIAL PROBLEMS WERE ENCOUNTERED DURING OPTIMIZATION
LARGEST STANDARDIZED RESIDUALS:
correlaciones observadas menos las
reproducidas con el modelo r ij - rij
NO. PARAMETER ESTIMATE
--- --------- ---------- --------- -------1
V7, V6
-.049
<0.10
2
V4, V3
.041
3
V8, V3
-.041
4
V5, V2
-.036
Puntos de corte
recomendados
CHI-SQUARE =
20.581 BASED ON
17 DEGREES OF FREEDOM
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
.24558
FIT INDICES
----------BENTLER-BONETT NORMED FIT INDEX
=
.974
>0.95
BENTLER-BONETT NON-NORMED FIT INDEX =
.992
COMPARATIVE FIT INDEX (CFI)
=
.995
<0.08
ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) =
.029
90% CONFIDENCE INTERVAL OF RMSEA (
.000,
.067)
<0.10
75
MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST
STATISTICS
STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
GENHABIL=V1 = 1.000 F1 + 1.000 E1
GRAVHAHS=V2 = 1.185*F1 + 1.000 E2
.099
12.000@
GRAVHACO=V3 = 1.005*F1 + 1.000 E3
.087
11.605@
MOTIVN1 =V4 = 1.000 F2 + 1.000 E4
MOTIVN2 =V5 = 1.161*F2 + 1.000 E5
.121
9.611@
MOTIVN3 =V6 = 1.164*F2 + 1.000 E6
.118
9.893@
GEDUASP =V7 = 1.000 F3 + 1.000 E7
GVOCASP =V8 = 1.033*F3 + 1.000 E8
.113
9.172@
76
VARIANCES OF INDEPENDENT VARIABLES
STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F
----I F1 - F1
.269*I
I
.040 I
I
6.686@I
I F2 - F2
.261*I
I
.046 I
I
5.668@I
I F3 - F3
.378*I
I
.060 I
I
6.278@I
COVARIANCES AMONG INDEPENDENT VARIABLES
STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F
----I F2 - F2
.169*I
I F1 - F1
.027 I
I
6.141@I
I F3 - F3
.088*I
I F1 - F1
.026 I
I
3.342@I
I F3 - F3
.214*I
I F2 - F2
.034 I
77
STANDARDIZED SOLUTION:
GENHABIL= V1 = .773 F1
GRAVHAHS= V2 = .821*F1
GRAVHACO= V3 = .777*F1
MOTIVN1 = V4 = .690 F2
MOTIVN2 = V5 = .730*F2
MOTIVN3 = V6 = .762*F2
GEDUASP = V7 = .807 F3
GVOCASP = V8 = .806*F3
+ .634 E1
+ .570 E2
+ .629 E3
+ .724 E4
+ .683 E5
+ .647 E6
+ .591 E7
+ .592 E8
CORRELATIONS AMONG INDEPENDENT VARIABLES
--------------------------------------V
F
--I F2 - F2
.636*I
I F3 - F3
.276*I
I F3 - F3
.681*I
R-SQUARED
.598
.675
.604
.475
.534
.581
.651
.650
---
INDICES DE MODIFICACION DE AJUSTE
WALD:..NONE OF THE FREE PARAMETERS IS DROPPED IN THIS PROCESS
LM : NONE OF THE UNIVARIATE LAGRANGE MULTIPLIERS IS SIGNIFICANT,
(Para agregar caminos o flechas).
78
La Síntesis, LISREL
Structural
Equations
Modelling
Karl Jöreskog
1934 – al presente
Trabajo fundamental de síntesis en 1973
79
79
Posteriormente K. Joreskog unió las dos
ideas, senderos y análisis de factores
confirmatorio, para generar los llamados
Modelos de Ecuaciones Estructurales
(SEM o MEE)). En los que se plantean
factores latentes para grupos de variables,
pero además se establecen dependencias
entre
los
factores
vía
senderos.
Posteriormente en SEM entre otras cosas,
se incluyen variables observables o
manifiestas en los senderos, junto con
factores
(MIMIC)
y
para
estudios
longitudinales las Curvas de Crecimiento
Latente.
80
80
Se tiene como información inicial, las
mediciones en las variables para los
elementos de estudio, de los que se
obtiene
la
matriz
de
varianzas
y
covarianzas de las variables manifiestas u
observadas llamada S. El modelo se
especifica en una gráfica y en una serie de
ecuaciones que ligan las variables entre si,
incluyendo las latentes, y que involucran
un conjunto de parámetros θ. De acuerdo
a esas ecuaciones es posible determinar
como serán las covarianzas en función de
los coeficientes , Σ(θ).
81
Algunas propiedades de SEM
1.
2.
3.
4.
Es un método “orientado al modelo” y no a una
hipótesis nula .
Es
una herramienta de modelado muy
flexible.
Se puede usar en forma confirmatoria (prueba de
ajuste del modelo propuesto) o
en forma
exploratoria
(construcción
del
modelo).
Frecuentemente es un mezcla, se inicia en
forma confirmatoria, con la teoría que determina
las causalidades (relaciones), que
se
representan en la gráfica de senderos, pero esta
se modifica a la luz de los hallazgos empíricos.
Hay una variedad de métodos de estimación
82
82
y de evaluación del ajuste (Fit)
¿¿Qué son los modelos de ecuaciones estructurales?
0
x1
.26
1.00
Factor 1
x2
Factor 5
.75
ξ1
x3
η5
.44
ns
y2
y3
.90
.81
y4
1.0
0
η4
.92
.64
y8
Factor 4
ns
y1
.95
.80
1.13
y5
.59
Factor 2
Factor
η2
η3
.77
.98
-.47
y6
y7
1.0
Se concepualizan factores que surgen al considerar
que varias variables son indicadores de un
concepto
hipotético.
Se
plantean
támbien
asociaciones entre factores
83
83
89
SEM (MEE): Un sistema flexible de ecuaciones
multiples
Jöreskög 1973
Matriz de covarianzas observada
Sij
x = Λxξ + δ
y = Λyη + ε
η = α + Β η + Γξ + ζ
V ( )   V ( )  
V ( )   V ( )  
S
σij
Matriz de covarianzas reproducida en función de los parámetros (implicada)
90
90
Estimación y Evaluación
Matriz de Covarianzas Observada
Modelo Hipotético
x1
y2
+
y1 min (s   ( )W (s   ( )
S=
{ }
1.3
.24 .41
.01 9.7 12.3
compare
Ajuste del
Modelo
Estimación de
Parámetros
σ11
σ12 σ22
σ13 σ23 σ33
{ }
=
Σ(θ)
Matriz de covarianzas Implicada
91
91
La matriz de varianzas y covarianzas implicada
Σ(θ) , es función de un conjunto de parámetros. En
base al principio de “Máxima Verosimilitud”, basado
en el supuesto de normalidad multivariada de las
variables, se busca aquel valor de los parámetros
θ, que minimiza la función :
F = ln|Σ(θ)|–ln|S| +traza[SΣ(θ)–1]–(p + q)
Se puede decir que se buscan los
parámetros que reproducen, de acuerdo al
modelo postulado en la grafica, las
varianzas y covarianzas más cercanas
92
posibles a las observadas.
92
Una vez que el modelo ha sido identificado y se
han estimado sus parámetros, el siguiente
problema que surge es el de evaluar qué tan
bien se ajusta a los datos.
Una medida global de ajuste es la estadística de
la razón de verosimilitud, que sigue una
distribución asintótica Ji-cuadrada dada por:
x2=(n – 1)Fmín
donde n es el tamaño de muestra y Fmín es el
valor mínimo de la función ajustada (la anterior).
93
93
Si el modelo es correcto y el tamaño de muestra
suficientemente grande, esta prueba permite
valorar el ajuste, es decir el grado de semejanza
entre la matriz de covarianzas observada en las
variables xs y ys con términos sij, con la
reproducida con el modelo, σij (θ),.
Los grados de libertad de la Ji2 son:
g.l. = 0.5 (p + q)(p + q + 1) – t
donde t es el número de parámetros libres en el
modelo, p es el numero de variables de factores
dependientes (ys) y q el de las independientes (xs).
94
94
Sin embargo, la estadística Ji-cuadrada tiene un
uso práctico limitado como medida de ajuste, ya
que es una función tanto del tamaño de muestra
como de la cercanía de la matriz de covarianzas
estimada con la matriz de covarianzas observada.
Una consecuencia de esto es que la probabilidad
de rechazar un modelo aumenta con el
incremento del tamaño de muestra, aún cuando
la matriz de covarianzas de residuos, sij – σij (θ),
presenta discrepancias triviales. Se acostumbra
evaluar la magnitud de los residuos en forma
estandarizada, equivale a las diferencias
rij – ρij(θ), (en correlaciones: observada – implicada)
95
95
Adicionalmente, existen varias formas evaluar la
“cercanía” del modelo con los datos, estas se
resumen en los índices de ajuste, que son muy
útiles
Se recomienda también una validación cruzada.
96
96
Índices de ajuste en Ecuaciones Estructurales
Hay varios índices de ajuste para valorar si el
modelo es adecuado o no. Esto es muy usado, dado
que al incrementarse la muestra la Ji cuadrada se
incrementa mucho, entonces un modelo “aceptable”
resulta significativo.
Hay muchos reportes sobre la forma de avaluar el
ajuste de un modelo de EQS. Una buena referencia
es el trabajo:
Hu S. and Bentler P. “Cutoff Criteria for fit
indexes in covariance structure analysis:
Conventional criteria versus new alternatives”
Structural Equation Modelling 6(1) 1-55, 1999.
Solo se incluirán en lo que sigue algunos de los
97
índices recomendados ahí.
97
Índice de ajuste comparativo, CFI
Un buen modelo lo tendrá cercano a uno, es
considerando como bueno que sea mayor o igual a
0.95.
max 
CFI  1 
max 


 glm ,0
2
o  glo ,0
m
2
Donde  m y glm son los valores para el modelo
que se esta ajustando;
2
y donde  0 y glo son los valores para el modelo
que supone independencia total de las variables.
2
98
98
RMSEA Raíz de cuadrados medios del error.
Se recomienda que sea inferior a 0.06 ( algunos
citan 0.1)
RMSEA 
Fo
gl
Donde
 N  1F  gl 
Fo  max 
,0
N 1


Se obtienen también los intervalos de confianza al
90% para el RMSEA. Se recomienda que el limite
superior sea inferior a 0.1
99
99
100
calificaciones de 88 estudiantes de una universidad
Correlations
Mecanica
Mecanica
1.0000
Vectores
0.5534
algebra
0.5468
análisis
0.4094
es tadís tica
0.3891
Vectores
0.5534
1.0000
0.6096
0.4851
0.4364
algebra
0.5468
0.6096
1.0000
0.7108
0.6647
análisis es tadís tica
0.4094
0.3891
0.4851
0.4364
0.7108
0.6647
1.0000
0.6072
0.6072
1.0000
Vectores
0.3293
.
0.2808
0.0781
0.0202
algebra
0.2304
0.2808
.
0.4319
0.3568
análisis es tadís tica
-0.0016
0.0246
0.0781
0.0202
0.4319
0.3568
.
0.2528
0.2528
.
Partial Corr
Mecanica
Mecanica
.
Vectores
0.3293
algebra
0.2304
análisis
-0.0016
es tadís tica
0.0246
partialed with respect to all other variables
101
Figure X: EQS 6 mardia3.eds Chi Sq.=0.89 P=0.93 CFI=1.00 RMSEA=0.00
E1*
0.84
C-Mechan
C-Analys
0.55*
0.70
0.71*
C-Algebr*
0.33*
0.61*
0.79
C-Vector
0.66*
O-Statis
0.75
E2*
Datos de
Mardia sobre calificaciones de estudiantes
de una universidad. Análisis de senderos
102
Modelo saturado
Figure X: EQS 6 mardia3f1.eds Chi Sq.=0.07 P=-1.00 CFI=-9.00 RMSEA=-9.00
E1*
0.80
C-Mechan
C-Analys
0.59
0.71
0.70*
Factor latente*
0.25*
0
0.69*
E2*
0.72
C-Vector
0.64*
O-Statis
0.77
Datos de Mardia sobre calificaciones de estudiantes
de una universidad. Análisis de Factores
103
E5
Evaluación de procesos de medición , métodos y ocasiones o sujetos.
Sophia Rabe-Hesketh and Anders Skrondal.
A Stata Press Publication. 2005
Pags 2, y 218.- Dos métodos para determinar flujo
espiratorio forzado. Wrigth peak, en ocasiones 1 y 2, y
Mini Wright en ocasiones 1 y 2, en 17 sujetos.
El sujeto produce correlaciones entre todas las
mediciones. Cada método por separado produce
correlaciones entre sus mediciones. Se usan
factores tanto para sujetos como para métodos
104
104
MiniWrigth*
Wrigth*
E
E2*
E4*
E1*
0.24
0.24
0.09
0.17
wp1
wp2
0.96
0.00
0.19
wm2
0.97
0.98
0.00
0.17
wm1
0.99
sujeto*
105
105
0.97*
MiniWrigth*
Wrigth*
E2*
E4*
E1*
0.98
1.00*
0.06
0.18
wp1
wp2
0.98
0.19
0.99*
wm2
wm1
RELIABILITY COEFFICIENTS
Figure X: EQS 6 pefr2met2.eds Chi Sq.=0.00 P=0.97 CFI=1.00 RMSEA=0.00
CRONBACH'S ALPHA
=
.989
RELIABILITY COEFFICIENT RHO
=
.994
Ambos métodos son confiables y miden lo mismo, se opta por el mas
barato, rápido, etc.
106
106
MacKinnon D.P. “Introduction to Statistical
Mediation
Analysis”.
Lawerence
Erlbaun
Associates. 2008. Se hicieron mediciones en 547
jugadores de futbol de High School. Se evaluaron en
tres momentos, 1, antes de la temporada de juegos,
2, poco después y 3, varios meses después de ella.
En la primer época se quería medir el concepto
tolerancia del coach*, con tres indicadoras:
coach1.- he hablado con algún coach sobre otras
formas de fortalecimiento en lugar de usar esteroides,
coach2.- en mi equipo hay reglas en contra del uso
de esteroide y coach3.- si me encuentran usando
107
esteroides estaría en problemas con los “coaches”.
En época 2, se evalúo la severidad percibida del
uso de esteroides* con: severe 1.- Los malos
efectos de los esteroides desaparecen en cuanto se
dejan de tomar.
Severe2.- solo unas pocas
personas que usan esteroides anabólicos tienen
efectos dañinos o desagradables, y severe 3.- Los
esteroides no son dañinos si se usan pocos meses al
año. En época 3, se evalúo Intención de usar
esteroides* con : Intent1.-Tengo la intención de
ensayar o usar esteroides.
Intent2.- Estaré
dispuesto a usar esteroides para saber que se siente,
y Inten3.- Tengo curiosidad por usar esteroides
* Factores latentes
108
0.22
0.56
0.63
intent1
intent2
1.47
3.26
coach1
0.73
coach2
1.75
TolCoach--0.47
1.50
InteUso
0.00
0.91
intent3
severe1
1.10
severe2
0.86
severe3
0.53
0.27
-0.41
1.18
SevePerci
1.48
0.63
1.27
coach3
0.89
Figure X: EQS 6 mackinn182.eds Chi Sq.=29.11 P=0.22 CFI=1.00 RMSEA=0.02
Coeficientes no estandarizados
109
E8*
E9*
E7*
0.34
0.66
intent1
intent2
0.75
E1*
0.93
coach1
D3*
0.36
E2*
0.62
coach2
0.78*
0.96
0.94*
intent3
0.87*
InteUso
0.00*
TolCoach*
0.49
0.73
E4*
severe2
0.62
E5*
severe3
0.50
E6*
0.69
0.29*
-0.29*
severe1
0.78*
SevePerci
0.79*
E3*
0.61
0.86*
coach3
0.96
D2*
Figure X: EQS 6 mackinn182.eds Chi Sq.=29.11 P=0.22 CFI=1.00 RMSEA=0.02
Coeficientes estandarizados
110
DETERMINANT OF INPUT MATRIX IS .23023D+02
PARAMETER ESTIMATES APPEAR IN ORDER,
NO SPECIAL PROBLEMS WERE ENCOUNTERED DURING OPTIMIZATION.
LARGEST STANDARDIZED RESIDUALS:
NO. PARAMETER ESTIMATE
1
V4, V1
-.098
2
V7, V1
-.091
3
V9, V4
-.065
<0.1
CHI-SQUARE =
29.111 BASED ON
24 DEGREES OF FREEDOM
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
.21596
FIT INDICES
BENTLER-BONETT NORMED FIT INDEX
=
.986
BENTLER-BONETT NON-NORMED FIT INDEX =
.996
COMPARATIVE FIT INDEX (CFI)
=
.997
ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) =
90% CONFIDENCE INTERVAL OF RMSEA (
.000,
.042)
>0.95
.020
<0.1
111
CONSTRUCT EQUATIONS WITH STANDARD ERRORS
AND TEST STATISTICS
STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE
MARKED WITH @.
F1- tolerancia del Coach
F2 =F2 = -.415*F1 + 1.000 D2
F2-Severidad Percibida
F3 Intención de uso de
.093
esteroides
-4.458@
F3 =F3 =
.266*F2
.048
5.534@
+ .001*F1
.068
.020
+ 1.000 D3
La influencia directa de F1, tolerancia del coach
sobre F3 intención de uso, no es significativa. Es
importante sin embargo, el efecto de F1 sobre F3
con F2 severidad percibida, como mediador.
112
PARAMETER TOTAL EFFECTS
COACH1 =V1 = 1.000 F1 + 1.000 E1
COACH2 =V2 = 1.746*F1 + 1.000 E2
COACH3 =V3 = 1.482*F1 + 1.000 E3
SEVERE1 =V4 = 1.000 F2 - .415 F1 + 1.000 E4 + 1.000 D2
.093
-4.458@
SEVERE2 =V5 = 1.175*F2 - .487 F1 + 1.000 E5 + 1.175 D2
.077
.108
.077
15.296@
-4.499@
15.296@
SEVERE3 =V6 = 1.269*F2 - .526 F1 + 1.000 E6 + 1.269 D2
.082
.116
.082
15.441@
-4.542@
15.441@
INTENT1 =V7 = .266 F2 + 1.000 F3 - .109 F1 + 1.000 E7 +.266 D2 + 1.000 D3
.048
.067
.048
5.534@
-1.622
5.534@
INTENT2 =V8 = .391 F2 +1.470*F3 -.160 F1 +1.000 E8+ .391 D2 + 1.470 D3
.069
.069
.099
.069
.069
5.656@ 21.409@ -1.625
5.656@
21.409@
INTENT3 =V9 = .399 F2 + 1.499*F3 - .163 F1+ 1.000 E9 + .399 D2 + 1.499 D3
.071
.071
.101
.071
.071
5.608@ 20.971@
-1.624
5.608@
20.971
113
PARAMETER TOTAL EFFECTS
F2 =F2 = -.415*F1 + 1.000 D2
F3 =F3 = .266*F2 - .109*F1 + .266 D2
.048
.067
.048
5.534@
-1.622
5.534@
+ 1.000 D3
PARAMETER INDIRECT EFFECTS
SEVERE1 =V4 = -.415 F1 + 1.000 D2 …...F3 =F3 = -.110*F1 + .266 D2
.093
.031
.048
-4.458@
-3.563@
5.534@
SEVERE2 =V5 = -.487 F1 + 1.175 D2
.108
.077
-4.499@
15.296@
SEVERE3 =V6 = -.526 F1 + 1.269 D2
.116
.082
-4.542@
15.441@
INTENT1 =V7 = .266 F2 - .109 F1 + .266 D2 + 1.000 D3
.048
.067
.048
5.534@
-1.622
5.534@
INTENT2 =V8 = .391 F2 - .160 F1 + .391 D2 + 1.470 D3
.069
.099
.069
.069
5.656@ -1.625
5.656@
21.409@
INTENT3 =V9 = .399 F2 - .163 F1 + .399 D2 + 1.499 D3
.071
.101
.071
.071
114
5.608@
-1.624
5.608@
20.971@
DECOMPOSITION OF EFFECTS WITH STANDARDIZED VALUES
PARAMETER TOTAL EFFECTS
COACH1 =V1 = .356 F1 + .934 E1
COACH2 =V2 = .784*F1 + .621 E2
COACH3 =V3 = .789*F1 + .615 E3
SEVERE1 =V4 = .685 F2 - .198 F1 + .728 E4 + .656 D2
SEVERE2 =V5 = .781*F2 - .226 F1 + .625 E5 + .747 D2
SEVERE3 =V6 = .865*F2 - .250 F1 + .502 E6 + .828 D2
INTENT1 =V7 = .219 F2 + .747 F3 - .063 F1 + .664 E7
+ .210 D2 + .715 D3
INTENT2 =V8 = .276 F2 + .941*F3 - .079 F1 + .337 E8
+ .265 D2 + .900 D3
INTENT3 =V9 = .256 F2 + .873*F3 - .073 F1 + .488 E9
+ .245 D2 + .835 D3
F2 =F2 = -.289*F1 + .957 D2
F3 =F3 = .294*F2 - .084*F1 + .281 D2 + .956 D3
PARAMETER INDIRECT EFFECTS
SEVERE1 =V4 = -.198 F1 + .656 D2
SEVERE2 =V5 = -.226 F1 + .747 D2
SEVERE3 =V6 = -.250 F1 + .828 D2
INTENT1 =V7 = .219 F2 - .063 F1 + .210 D2 + .715 D3
INTENT2 =V8 = .276 F2 - .079 F1 + .265 D2 + .900 D3
INTENT3 =V9 = .256 F2 - .073 F1 + .245 D2 + .835 D3
F3 =F3 = -.085*F1 + .281 D2
115
WALD TEST (FOR DROPPING PARAMETERS)
MULTIVARIATE WALD TEST BY SIMULTANEOUS PROCESS
STEP PARAMETER CHI-SQUARE D.F. PROBABILITY
1
F3,F1
.000
1
.984
NONE OF THE UNIVARIATE LAGRANGE MULTIPLIERS IS SIGNIFICANT,
F1 tolerancia del coach tiene efecto
indirecto significativo sobre F3, Intención de
usar esteroides, aun que su efecto directo
no es signifcativo.
116
Si se trata de un análisis de factores confirmatorio
con medias, las expresiones son.
Σ = Λ Φ Λ´
μ = Λ μξ
donde μξ es el vector de medias de las variables
independientes, no explicadas.
Máxima verosimilitud.
Encontrar el mínimo de:
FML  F  ( z  ˆ )ˆ ( z  ˆ )
1


1
ˆ
ˆ
F  log   tr S  log S  ( p  q)
117
118
¡¡Medias de los
factores latentes
endógenos!!
Análisis de factores con medias.
119
Análisis de factores con medias.
120
121
122
(Path analysis)
MANOVA
123
Regresión lineal
Caso
X
Y
1
simple de Y con X.
A
3
24
1
B
8
20
1
Y = 20 + 0.4545455 X
D
10
22
1
rYX=.601
C
15
32
1
E
19
27
1
Intercepto = 20 =25+ 0.455 (11)
Medias 11
25
1
SD
6.205 4.69
0
Intercepto =Y+ b (X)
2
S
38.5 22.0
0
El Coeficiente de regresión 0.455 se puede ver como
la estructura de covarianza del modelo de predicción.
Este coeficiente refleja la asociación entre X y Y, pero
no dice nada sobre la media de ambas variables.
En cambio el intercepto (20) refleja la media de ambas
variables y el coeficiente de regresión, con un solo
numero.
Se introduce una variable con valores iguales a1241
Regresión lineal simple de X con 1, sin ordenada al origen.
Summary of Fit
RSquare
RSquare Adj
Root Mean Square Error
Mean of Response
Observations (or Sum Wgts)
0
0
6.204837
11
5
14.045
Ey
0.455
38.5
Analysis of Variance
Source
DF Sum of Squares Mean Square
Model
0
0.00000
0.0000
Error
4
154.00000
38.5000
C. Total
4
154.00000
Tested against reduced model: Y=mean
11 = X
F Ratio
.
Prob > F
.
20
0
Parameter Estimates
Term
1
Estimate Std Error
11 2.774887
t Ratio Prob>|t|
3.96 0.0166*
Media de Y=25= Efecto total de 1 en Y=
= 20
+
.455(11)
Efecto directo
de 1 en Y
Efecto indirecto
de 1 en Y
Se introduce una “variable” con valores iguales 125
a1
CONSTANT--1.00
11.00
20.00
0.45
Y
X V999, THE UNIT CONSTANT
38.50 VARIABLE
MATRIX CONTAINS SPECIAL
COVARIANCE MATRIX IS IN UPPER TRIANGLE; MEANS ARE IN
BOTTOM ROW OF MATRIX
COVARIANCE/MEAN MATRIX TO BE ANALYZED:
2 VARIABLES (SELECTED
FROM
VARIABLES),
BASED
ON
5 RMSEA=-9.00
Figure
X: EQS 64kline
trivial.eds Chi Sq.=0.00
P=-1.00
CFI=-9.00
CASES.
X
Y
V999
V2
V3
V999
X
V2
38.500
Y
V3
17.500 22.000
V999 V999
11.000 25.000
1.000
126
En un modelo estructural de medias cada variable
independiente se descompone en dos nuevas
variables, la media y una desviación de la media.
X= μx +e En consecuencia cada variable se
convierte en una variable dependiente en una
nueva ecuación en la que el intercepto es la media.
X= μx1 +ex . Entonces ambos 1 y ex son “variables”
independientes, la varianza de ex es igual a la de X.
Los parámetros de un modelo SEM con estructura
de medias, son a).-los coeficientes de regresión
(coeficientes de sendero), b).- varianzas y
covarianzas de las variables independientes, c).los interceptos de las variables dependientes , y
d).- las medias de las independientes
127
El intercepto es la media implicada cuando no
hay efectos indirectos de la constate 1 sobre
esa variable.
Cuando si hay efectos
indirectos, la media implicada es el efecto
total. Esto es válido tanto para variables
observadas como para las latentes.
En EQS se piden las covarianzas estimadas
entre las variables Y y los factores F.
(COVARIANCE en la parte de PRINT) y
produce una matriz como sigue:
ΣYY ΣYF
ΣFY ΣFF
Ultimo renglón (V999),
medias. Al final medias
de los factores
128
Ejemplo de “SEM” con medias.
Estabilidad de la alienación.
MATRIX CONTAINS SPECIAL VARIABLE V999, THE UNIT CONSTANT
COVARIANCE MATRIX IS IN UPPER TRIANGLE; MEANS ARE IN BOTTOM
ROW OF MATRIX
COVARIANCE/MEAN MATRIX TO BE ANALYZED:
BASED ON 932 CASES.
ANOMIA67 V1
POWERL67 V2
ANOMIA71 V3
POWERL71 V4
V999 V999
ANOMIA67 POWERL67 ANOMIA71 POWERL71
V999
V1
V2
V3
V4
V999
11.834
Medias
6.947
9.364
6.819
5.091 12.532
4.783
5.028
7.495
9.986
13.610 14.760 14.130 14.900
1.000
129
0.39*
E1*
E3*
E4*
E2*
0.68
0.51
0.63
0.45
powerl71
anomia67
Powerl67
0.74
anomia71
0.86*
0.89*
0.78
-0.24*
D1*
1.00
alienacion67
0.73
0.68*
5.39*
D2*
alienac71
1.81*
CONSTANT 1.0
Figure X: EQS 6 wheatonbis.eds Chi Sq.=0.28 P=0.59 CFI=1.00 RMSEA=-9.00
Coeficientes estandarizados
130
MODEL COVARIANCE MATRIX FOR MEASURED AND LATENT VARIABLES
ANOMIA67 V1
POWERL67 V2
ANOMIA71 V3
POWERL71 V4
V999 V999
F1 F1
F2 F2
F1
F2
F1
F2
ANOMIA67 POWERL67 ANOMIA71 POWERL71
V999
V1
V2
V3
V4
V999
11.730
6.908
9.401
6.717
5.097
12.469
4.672
5.065
7.453
9.986
13.614
14.759
14.131
14.900
1.000
6.372
6.908
4.702
4.672
13.614
4.702
5.097
7.501
7.453
14.996
F1
F1
6.372
4.702
F2
F2
7.501
Medias de los factores 1 y 2.
Alienación en 67 y en 71
respectivamente
131
Un uso especial de las Ecuaciones
Estructurales es en el contexto de estudios
longitudinales, en los que se quiere valorar
el ajuste de rectas o curvas, de manera que
los parámetros de las curvas, la ordenada al
origen y la pendiente, son variables
aleatorias, es decir hay una curva para cada
elemento estudiado. Se quiere conocer la
media de las ordenadas al origen y de la
pendiente, así como sus varianzas. Se usan
factores latentes para esos parámetros. Las
cargas de los factores sobre los parámetros
132
reflejan que parámetro es.
132
Así en el caso de la ordenada al origen
todas las cargas son uno, para la pendiente
las cargas son números que van creciendo
según el tiempo de la variable a la que se
dirige, para un coeficiente cuadrático son los
cuadrados de los términos para el lineal. Se
pueden modelar patrones no lineales y con
puntos de cambio.
133
133
Some SEM advanced questions
• Can change in responses be tracked over
time?
– Latent Growth Curve Analysis
2/20/2006
Latent Variable Models
134
Latent Growth Model
D1
E1
E2
E3
E1
E2
E3
E1
E2
E3
E1
E2
E3
Q1
Q2
Q3
Q1
Q2
Q3
Q1
Q2
Q3
Q1
Q2
Q3
E1
QDI
QDI1
Time
Time 1
1
Intercept
2/20/2006
D2
1
E2
QDI
QDI2
Time
Time 2
0
1
QDI
QDI3
Time
Time 3
D3
1
E3
1
2
D4
E4
QDI
QDI4
Time
Time 4
3
Slope
Latent Variable Models
135
D1*
1.0
Intercept
Note que todas las
cargas del factor
ordenada al origen se
fijan en la unidad Las
cargas para el efecto
lineal van creciendo
desde 0 a 5 , de uno
en uno. Si se tuviese
diferentes
incrementos
de
tiempo, estos pueden
reflejarse
en
las
cargas
de
la
pendiente
*
0.00
Constant 1
1.00
2.00
*
3.00
Linear
1.0
vg, 0, 1, 3, 7, 9
D2*
Factor 1
136
136
D1*
1.0
Intercept
La variable latente
que representa al
efecto cuadrático,
tiene como cargas
los cuadrados de
los coeficientes del
efecto lineal o
pendiente. Se
pueden usar los
coeficientes de
polinomios
ortogonales .Hay
mucha flexibilidad,
se pueden usar
exponentes
fraccionarios
*
0.00
1.00
2.00
Constant 1
Linear
*
3.00
1.0
4.00
D2*
*
5.00
0.00
1.00
4.00
16
Quadratic
D3*
1.0
2
137
137
Consumo de alcohol en 4 épocas en 1204 estudiantes EQS.
Medias supuestas
ALC_T1
V1
ALC_T1 V1
.856
ALC_T2 V2
.648
ALC_T3 V3
.659
ALC_T4 V4
.609
V999 V999
3.200
ALC_T2
V2
.977
.817
.791
4.200
ALC_T3
V3
1.083
.952
4.900
ALC_T4
V4
1.300
5.100
V999
V999
1.000
Figure X: EQS 6 alcoholt4b Chi Sq.=0.74 P=0.39 CFI=1.00 RMSEA=0.00
Intercept
1
3.00
ALC_T1
0.20
1
0.54
0.32
0
CONSTANT--1.00
0.14
1.45
ALC_T2
1
0.20
1
-0.25
0.02
Linear
0
1
1 2
-0.04
ALC_T3
0.00
4
0.18
3
Quadratic
9
ALC_T4
0.20
138
ALC_T1
V1
ALC_T1 V1
.856
ALC_T2 V2
.648
ALC_T3 V3
.659
ALC_T4 V4
.609
V999 V999
3.200
ALC_T2
V2
.977
.817
.791
4.200
ALC_T3
V3
1.083
.952
6.600
ALC_T4
V4
1.300
7.400
V999
V999
1.000
Figure X: EQS 6 alcoholt4b f3libre Chi Sq.=7.56 P=0.01 CFI=1.00 RMSEA=0.07
D1*
1.0
Intercept
1
ALC_T1
1
1.0
1
*
*
E1*
1
CONSTANT1.0
D2*
discontinuidad
ALC_T2
0.00
*
1.0
1.0
E2*
1.00
Linear
2.00
3.00
*
0.00
ALC_T3
1.0
E3*
1.0
D3*
*
1.0
discontinuo
*
ALC_T4
1.0
E4*139
En la tesis de Maestría en Ciencias en
Rehabilitación Neurológica de Mirían
Figueroa,
UAM-X.
se estudiaron 29 niños con daño
neurológico perinatal, y tres de ellos tenían un daño
severo, por lo que su desarrollo cognitivo fue
prácticamente nulo. En este trabajo nos
propusimos modelar el desarrollo cognitivo de
los 26 niños restantes. El propósito básico de usar
SEM radica en explorar las curvas de crecimiento
con factores latentes.
140
140
Tipo de Estudio. Descriptivo (exploratorio) ,
retrospectivo parcial, longitudinal y observacional .
Se obtuvo un muestra (disponible) de 29 niños
con daño neurológico perinatal referidos por la sala
de terapia intensiva neonatal del Instituto Nacional
de Pediatría, en quienes se pudo documentar por
medio de estudios neurofisiológicos, de imagen y
laboratorio el diagnostico de las encefalopatías
siguientes:
hemorrágica,
hipóxico-isquémica,
hiperbilirrubinémica y mixta. Posteriormente por
tener un daño muy severo se eliminaron tres de
ellos.
141
141
Los criterios de Inclusión fueron que tuviesen
antecedente de encefalopatía perinatal entre el 1 de
enero de 1993 y el 31 de diciembre de 1994; con
domicilio en el área metropolitana de la Cd. De
México. Con seguimiento por 12 meses para evaluar
el desarrollo cognitivo.
Los Criterios de Exclusión fueron : Que presentaran
diagnóstico de enfermedad que implicase deterioro
neurológico progresivo. Que presentase anomalías
cromosómicas
o
malformaciones
congénitas
asociadas del sistema músculo esquelético como
luxación congénita de cadera o píe equino varo.
Los Criterios de Eliminación fueron, con dos o mas
fallas en el seguimiento, alta voluntaria del mismo, o
142
abandono del programa.
142
7 Variables Perinatales o de Base.
Genero, Condición al Nacimiento, Tipo y severidad
del Síndrome Neurológico, Diagnóstico de la
Encefalopatía neonatal y tipo de encefalopatía.
84 Variables del Desarrollo Sensoriomotríz
(Uzgiris y Hunt) Se midieron cada mes durante 12
meses.
1.-Persecución Visual y Permanencia del Objeto
(PO).
2.-Medios y Fines para lograr Eventos Ambientales
Deseados (MF).
3.-Imitación Vocal (IV).
4.-Imitación Gestual (IG).
5.-Causalidad Operacional (CO).
6.-Relaciones de los Objetos en el Espacio (RE). 143
143
7.-Esquemas con Relación a los Objetos (RO).
Evolución
Variables de base (Al nacer)
Genero,
Condición al Nacimiento,
Tipo y severidad del Síndrome Neurológico,
Diagnóstico de la Encefalopatía neonatal
y tipo de encefalopatía
Cognitiva
7 escalas por 12
meses
Secuelas
M
NC
CG
S
RET
CC
144
144
Como sólo se tenia una muestra de 26 niños, no se
pueden usar modelos muy elaborados, por esto se
tomaron algunos de los indicadores de desarrollo
sensioromotriz, los que habían sido mas fuertes
predictores de secuelas en el estudio previo.
Se inicia con un análisis de factores confirmatorio para PO
MF CO y RE. Considerándolos simultáneamente, para
construir un indicador latente del desarrollo basado en
esos cuatro aspectos. Se consideran los meses 4, 8 y 12
del seguimiento. Para un buen ajuste se necesito usar
correlaciones entre las variables. El modelo en forma
gráfica esta en la figura 1. Los tres factores resultan con
cargas grandes en todas las variables, lo que indica que si
miden el desarrollo alcanzado en esa edad
145
145
Figure X: EQS 6 baslim-po-cuadr.eds Chi Sq.=11.55 P=0.56 CFI=1.00 RMSEA
PO1
0.03
PO3
0.41
PO5
0.32
PO7
0.13
PO9
0.31
PO11
0.35
0.01
1
1
Intercept
0
11
1.04
Constant--1.00
0.68
0
1
Linear
2
1
1
3
4
1
0.08
4
9
-0.02
5
-0.01
16
Quadratic
25
0.00
146
146
F1 =F1 = 1.042*V999 + 1.000 D1
.039
26.725@
F2 =F2 = .680*V999 + 1.000 D2
.085
8.037@
F3 =F3 = -.023*V999 + 1.000 D3
.016
-1.467
147
147
Figure X: EQS 6 baslim-po.eds Chi Sq.=0.77 P=0.98 CFI=1.00 RMSEA=0.00
0.03
PO1
0.01
1
-0.02
Intercept
1
PO3
1.04
0.17
0.41
01
0.08 -0.02
1
PO5
0.33
Constant--1.00
12
0.11
0.58
1
Linear
PO7
3
0.29
0.06
0.20
4
PO9
0.02
0.03
-0.03
0.07
-0.10
0.42
5
-0.03
PO11
BENTLER-BONETT
NORMED FIT INDEX =
1.01
.995
LARGEST STANDARDIZED RESIDUALS: V999,V9
.105
0.08
148
148
Figure X: EQS 6 baslim-po.eds Chi Sq.=19.56 P=0.30 CFI=0.92 RMSEA=0.09
PO1
0.77
E5*
D1*
0.64
1.00
PO3
0.18
0.96
E7*
0.87
E9*
Intercept
0.00
0.19
0.22
8.23*
PO5
0.20
Constant 1
0.46
0.15
3.82*
0.71
PO7
0.67
E11*
Linear
0.14
1.00
0.74
PO9
D2*
E13*
0.66
0.82
E15*
0.56
PO11
149
149
Figure X: EQS 6 baslim-po.eds Chi Sq.=19.56 P=0.30 CFI=0.92 RMSEA=0.09
PO1
0.02
0.02
1
PO3
1
0.44
Intercept
0
1
1.05
1
PO5
1
Constant--1.00
0.34
2
1
3
0.58
PO7
0.19
Linear
1
4
0.30
PO9
0.02
5
0.27
150
PO11
150
Figure X: EQS 6 baslim-po.eds Chi Sq.=0.77 P=0.98 CFI=1.00 RMSEA=0.00
D1*
PO1
1.00
0.43
E5*
0.90
-0.42*
Intercept
0.26
PO3
5.85*
0.25*
0.94
E7*
0.27
0.00
0.25
0.21
0.22* -0.53*
PO5
0.86
E9*
Constant
0.20
0.43
0.07*
-1.13*
0.24*
0.16*
4.05*
Linear
0.23
0.60
PO7
0.76
E11*
0.34*
0.57*
0.65
-0.63*
1.00
PO9
D2*
0.74
E13*
0.91
-0.15*
PO11
0.35
E15*
Se agregan correlaciones151
151
entre variables.
MODEL COVARIANCE MATRIX FOR MEASURED AND LATENT
VARIABLES
PO1
V5
PO3
PO5
PO7
PO9
V7
V9
V11
V13
PO1 V5
.039
PO3 V7
.008
.466
PO5 V9
.032
.156
.448
PO7 V11
.007
.093
.229
.503
PO9 V13
.032
.142
.195
.475
.782
PO11 V15
.005
.193
.136
.338
.413
V999 V999
1.039
1.790
2.199
2.890
3.359
F1 F1
.032
.032
.032
.032
.032
F2 F2
.000
.020
.041
.061
.082
PO11
V999
F1
F2
V15
V999
F1
F2
PO11 V15
.618
V999 V999
3.938
1.000
F1 F1
.032
1.039
.032
F2 F2
.102
.580
.000
.020
Medias de
todas
las
variables
observadas
y latentes
152
152
Crecimiento latente de factores
Con los tres factores del AFC se construye un modelo de
curva de crecimiento latente sobre ellos. Los valores
iniciales están en la Fig. 2. Y los coeficientes no
estandarizados o directos en la Fig. 3. Se obtienen
también, las medias de los factores, las que reflejan
claramente el incremento de las variables latentes. La
ordenada al origen es de 0.14 y la pendiente de 1.00. Es
decir se considera que los niños inician con valores bajos,
en mes 1, y crecen en una unidad por cada 4 meses de
desarrollo. En la Fig.4 están los coeficientes
estandarizados
153
153
Figure X: EQS 6 fac3.eds Chi Sq.=34.40 P=0.72 CFI=1.00 RMSEA=0.00
BENTLER-BONETT
NORMED FIT INDEX =
.872
BENTLER-BONETT NONNORMED FIT INDEX = 1.046
COMPARATIVE FIT INDEX
(CFI) = 1.000
BOLLEN'S
(IFI) FIT
INDEX = 1.024
ROOT MEAN-SQUARE ERROR
OF APPROXIMATION (RMSEA)
=
.000
90% CONFIDENCE INTERVAL
OF RMSEA ( 0.000,
0.105)
PO4
0.66
MF4
0.00
CO4
0.57
RE4
0.78
0.75
1.00*
desarrollo mes 4*
0.82*
0.62*
0
0.67*
PO8
0.32
0.63
MF8
0.73
CO8
0.84
RE8
0.48
PO12
0.60
MF12
0.54
154
CO12
0.68
0.77
SATORRA-BENTLER SCALED
CHI-SQUARE = 39.2542 ON
40 DEGREES OF FREEDOM
PROBABILITY VALUE FOR
THE CHI-SQUARE STATISTIC
IS
.50366
0.68*
0.66*
desarrollo mes 8*
0.54*
0.88*
0.80*
Todos los
coeficientes de
sendero son
significativos
con S-B
0.80
0.84*
desarrollo mes 12*
0.73*
154
0.94*
Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00
D1*
1.0
PO4
1.0
E10*
MF4
1.0
E11*
1.0
D4*
*
desarrollo 4
1.0
1.0
*
*
*
ordenada al origen
*
*
*
CO4
1.0
E12*
RE4
1.0
*
E13*
*
*
*
*
1.0
PO8
1.0
*
1.0
*
*
1.0
CONSTANT 1.0
*
desarrollo 8
*
MF8
1.0
E19*
*
*
1.0
CO8
1.0
E20*
RE8
1.0
E21*
*
*
*
1.0
*
*
*
*
*
E18*
*
*
*
2.0
D2*
*
*
*
*
pendiente
PO12
1.0
1.0
*
E26*
*
3.0
1.0
*
D5*
*
MF12
1.0
E27*
*
desarrollo 12
*
CO12
1.0
*
D3*
1.0
E28*
*
155
155
Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00
Media 2.013
0.10
PO4
0.19
MF4
0.00
0.07
desarrollo 4
1.66
0.08
1.15
CO4
0.84
ordenada al origen
0.87
0.15
0.07
RE4
-1.13
0.18
0.03
0.10
0.14
0.07
0.07
Media 3.175
0.08
PO8
0.15
0.05
0.25
0.19
0.06
CONSTANT--1.00
0.18
1.04
1.13
desarrollo 8
MF8
0.25
1.78
0.11 0.07
0.47
CO8
0.20
0.97
1.00
0.08
RE8
0.13
0.92
0.40
-0.09
0.01
0.17
0.17
pendiente
Media 4.064
0.05
0.02
PO12
0.08
0.38
0.09
0.06
MF12
0.03
1.15
0.02
desarrollo 12
0.12
1.03
CO12
0.95
0.24
0.08
156
156
0.00
RE12
0.16
Figure X: EQS 6 fac3-lgc.eds Chi Sq.=17.21 P=0.98 CFI=1.00 RMSEA=0.00
D1*
0.72
PO4
0.70
E10*
MF4
0.00
E11*
0.71
D4*
desarrollo 4
1.00*
1.00
0.62
0.66*
ordenada al origen
2.00*
0.50*
0.42*
0.79*
CO4
0.31*
RE4
-1.56*
E12*
0.61
E13*
0.75
0.52*
0.18*
0.27*
0.35*
0.52
PO8
0.38*
0.69
1.#J*
0.17*
E18*
0.30
0.75*
0.72
0.83*
CONSTANT 1.0
0.69*
1.98*
0.76*
desarrollo 8
MF8
0.65
E19*
0.24*
1.#J*
3.48*
0.33* 0.26*
0.48*
0.56
CO8
0.88
E20*
0.63*
0.68
7.51*
0.24*
0.05*
0.51
RE8
D2*
0.78
E21*
-1.01*
1.91*
0.67*
0.44*
pendiente
PO12
0.79
0.38*
E26*
0.30*
1.00
0.83
0.62
0.25*
MF12
0.30
E27*
0.95*
D5*
desarrollo 12
0.47*
0.71*
CO12
0.70
E28*
0.00
0.76*
D3*
0.43*
157
157
RESUMEN: Ajuste de modelos. Pasos en SEM
1.- Teoría que variables y que relaciones entre ellas se
postulan. Proceso de medición, qué variables latentes se
postulan. Construir la grafica que resume la teoría.
2.-Verificar que la base de datos esta completa. Análisis
exploratorio para eliminar observaciones atípicas y valorar
formas de distribución.
Con el EQS ajustar el modelo. Valorar ajuste. Si hay buen
ajuste interpretar resultados.
158
RESUMEN: Ajuste de modelos.
3.-Si no hay buen ajuste, con los índices de modificación de
ajuste: Prueba de Wald y prueba de Multiplicadores de
Lagrange, agregar un elemento (línea causal o correlación
según teoría), volver a correr y quitar un elemento. Avanzar
paso a paso (agregar y quitar lo que se indica según pruebas,
pero moderado por la teoría) llevando registro para poder
regresar si se encuentra no identificación o se desajusta el
modelo. Observar los cambios en la ji2 e índices de ajuste.
También se consideran los residuos estandarizados más
grandes para orientar la inclusión de más senderos. (Se
acepta en caso extremo uno menor de 0.12) Los índices de
ajuste deben mejorar paulatinamente, acercarse o superar
0.95, el RMSEA inferior a 0.08 ( límite superior menor a 0.10
extremo 0.12), la p aumenta, la ji2 baja. Si el modelo se juzga
adecuado se interpretan resultados y se salva la grafica con
senderos y coeficientes. En general no conviene fijar en 0 una
159
varianza de una variable, es una contradicción.
Desarrollo Teórico
Especificar modelo
Diagrama de flujo
Identificación
Muestras y
Mediciones
Estimación de
Parámetros
Evaluar Ajuste
¿Ajusta?
Si
No
Modificación del
Modelo
Discusión y
Conclusión
Bibliografía:
1.- Duncan, TE, Duncan SC, Strycker LA, Li F and Alpert A. “
An introduction to Latent Variable Grow Curve Modeling”.
Lawrence Erlbaum Associates Publishers. 1999.
2.- Hancock G.R. and R.O. Mueller. Editors.” Structural
Equation Modeling. A second course”. Information Age
Publishing Inc. 2006
3.- Hoyle, Rick H. “ Structural Equation Modeling. Concepts,
Issues, and Applications.“ SAGE Publications Inc. 1995.
4.- Hu S. and Bentler P. “Cutoff Criteria for fit indexes in
covariance structure analysis: Conventional criteria versus new
alternatives” Structural Equation Modelling 6(1): 1-55, 1999.
5.- Kline, Rex B. “ Principles and Practice of Structural
Equation Modeling.” The Guilford Press. 2005.
6.- Loehlin John C. “ Latent Variables Models. An introduction
to factor, path, and structural equation analysis” Lawrence
Erlbaum Associates, Publishers. 2004
161
161
Bibliografía:
7.-MacKinnon D.P. “Introduction to Statistical Mediation
Analysis. Lawrence Erlbaum Associates Publishers. 2008.
8.- Preacher KJ, Wichman AL, MacCallum RC and Briggs NE.
“Latent Growth Curve Modeling”. Sage Publications. Num 157.
2008.
9.- Rykov Tenko and George A. Marcoulides. “A first course in
Structural Equation Modeling”. Lawrene Erlbaum Associates,
Publishers. 2000.
10.-Shipley Bill “ Cause and Correlation in Biology. A User¨s
Guide to Path analysis, Structural Equation and Causal
Inference”. Cambridge University Press 2000
162
162
Descargar