Análisis de Correspondencias Múltiples

Anuncio
Análisis de Correspondencias Múltiples
CIMPA-UCR
Análisis de Correspondencias
Múltiples
(ACM)
Análisis de Correspondencias Múltiples
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
CIMPA-UCR
Lebart, 1974
Hacer análisis de correspondencias sobre:
• Tabla disyuntiva completa
• Tabla de Burt
Representación simultánea de todas las modalidades.
Ojo: # de modalidades
Bibliografía:
Lebart et al. (inglés)
Lebart et al. (español)
Greenacre (inglés)
Escofier & Pagès (francés)
Análisis de Correspondencias Múltiples
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
CIMPA-UCR
n: individuos
p: variables cualitativas
1
2
3
4
M
Tipo de
salario
Sexo
Prov
M
F
F
M
M
Alajuela
Alto
Heredia Bajo
San Jose Muy Alto
Cartago
Bajo
M
M
Tabla disyuntiva completa:
1
2
3
4
M
M
1
0
0
1
F
0
1
1
0
SJ
0
0
1
0
A
1
0
0
0
C
0
0
0
1
H
0
1
0
0
MB
0
0
0
0
B
0
1
0
1
M
0
0
0
0
A
1
0
0
0
MA …
0
0
1
0
Análisis de Correspondencias Múltiples
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
CIMPA-UCR
Tabla de Burt (contingencia generalizada)
M
F
SJ
A
C
H
MB
B
M
A
M
M F
240 0
0 259
100 103
60 66
44 39
36 51
Sjo Ala Car Her
100 60 44 36
103 66 39 51
203 0 0 0
0 126 0 0
0
0 83 0
0
0
0 87
MB B M A MA …
Análisis de Correspondencias Múltiples
CIMPA-UCR
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
La tabla de datos:
Tabla de Burt
EDAD INGRESO
5
Medio
3
Alto
4
Bajo
1
Bajo
2
Medio
5
Alto
2
Medio
3
Bajo
1
Alto
4
Medio
Edad
SEXO
F
F
M
F
F
M
F
M
M
F
Ingresos
ind
1
2
3
4
5
6
7
8
9
10
Sexo
Sexo
F M 1
F 6
1
M
4 1
1 1 1 2
2 2 0
3 1 1
4 1 1
5 1 1
B 1 2
M 4 0
A 1 2
18 12
Edad
Ingresos
2 3 4 5 B M A
2 1 1 1 1 4 1
0 1 1 1 2 0 2
1 0 1
2
0 2 0
2
1 0 1
2
1 1 0
2 0 1 1
3
4
3
Análisis de Correspondencias Múltiples
CIMPA-UCR
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
ACM
⇔
n individuos
Profesión
Análisis de Correspondencias de una tabla
disyuntiva completa
Edad
Sexo
0 1 0 0 1 0 0 0 1
3
3
3
3
3
3
3
3n
Estructura particular
de la tabla
⇓
Propiedades
particulares del
análisis
Análisis de Correspondencias Múltiples
ACM: AFC DE UNA TABLA DISYUNTIVA
CIMPA-UCR
1
p1
•
j•
1L pq
1
n = # individuos
q = # variables cualitativas
pk = #modalidades de la variable k
zij
i
zi • = q
q
p = ∑ pk = total de columnas
k =1
n
z• j
Z = ( zij )
nq
1
zij = 
0
Márgenes:
zi• = q pues hay q unos en la fila i
z• j # individuos que tienen modalidad j
∑∑
j
i
zij = nq
Matriz a diagonalizar:
S=
1 t −1 1
Z ZD = BD −1
q
q
con D = diag ( z• j )
Análisis de Correspondencias Múltiples
CIMPA-UCR
ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES
F2
Prof 2
Prof 3
M
Edad 2
Prof 4
F1
Prof 1
F
Edad 1
n puntos en ℜ q
p puntos en
Edad 3
ℜ
n
Análisis de Correspondencias Múltiples
ACM: CASO DE 2 VARIABLES
CIMPA-UCR
Análisis factorial de correspondencias
Burt
Disyuntiva completa
1
P1
1
P2
1
P1
Contingencia
1
P2
P2
1
0
n
00100
100
P1
0
1
P2
(Z1)
P1
0
0
(Z2)
Z
B=Zt Z
K=Z2t Z1
λz
λB = λ2z
λK = (2λz − 1)
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM: NUBES DE PUNTOS - PERFILES
Perfiles- fila (individuos)
Z
Z
Puntos (coordenadas): ij = ij
Z i•
Peso:
Z i•
q 1
=
=
nq nq n
 nq
Métrica: diag 
 Z• j
Distancia
χ2:
q
1
Tabla: q Z




n p 1
(Zij − Z i′j )2
d (i, i′) = ∑
q j =1 Z • j
2
Perfiles- columna (modalidades)
Z
Puntos (coordenadas): ij
Z• j
Peso:
Z• j
nq
 nq 
 nq 
 = diag   = diag (n )
 q 
 Z i• 
Métrica: diag 
Distancia χ2:
Z
Z ′
d 2 ( j , j ′) = n∑  ij − ij 

Z • j′ 
i =1  Z • j
n
2
Análisis de Correspondencias Múltiples
ACM: DISTANCIA DE χ2
CIMPA-UCR
Perfiles de fila:
2
p
n
1
n
2
(Z ij − Z i′j ) =
d (i, i′) = ∑
q j =1 Z • j
q
∑
j∈M ii′
1
Z• j
con M ii′ : modalidades que tiene solo un individuo i o i’
Más parecidos si tienen más modalidades en común.
Perfiles de columna:
2
 Z ij Z ij′ 
card (ind [ j , no j ′] + card (ind [ j ′, no j ]


d ( j , j′) = n∑
−
=n


Z • j′ 
Z • j Z • j′
i =1  Z • j
n
2
Entre más objetos tengan sólo una de j o j’ mayor es la distancia
Análisis de Correspondencias Múltiples
CIMPA-UCR
INTERPRETACIÓN
• Dos modalidades escogidas por los mismos
individuos coinciden
•Dos individuos son cercanos si escogen las mismas
modalidades
• Modalidades con poco efectivo están alejadas del
centro de gravedad
Análisis de Correspondencias Múltiples
ACM: INERCIA
CIMPA-UCR
1
1
Centro de gravedad de nube de modalidades G =  , ... , 
n
n
2
n  Z


 n
Z
2 Z ij
1
1
ij
ij
2
d ( j , G ) = n∑ 
−  = n∑  2 −
+ 2=
−1




n
nZ • j n  Z • j
i =1  Z • j
i =1  Z • j
n
Distancia mayor si el efectivo es pequeño
Inercia de la modalidad j:
 1  Z• j
Z• j  n

− 1 = 1 −
I ( j) =
d ( j, G) =
nq
nq  Z • j  q 
n
Z• j
2
Mayor inercia si el efectivo es pequeño



Análisis de Correspondencias Múltiples
ACM: INERCIA
CIMPA-UCR
Inercia de la variable k:
1  Z• j
I (k ) = ∑ I ( j ) = ∑ 1 −
n
j =1
j =1 q 
pk
pk
 1
 = ( pk − 1)
 q
Crece con el número de modalidades
Si pk = 2
mínimo 1
q
Inercia total:
p
1
1
I = ∑ I (k ) = ∑ ( pk − 1) = ( p − q) = − 1
q
q
k
k q
No tiene significado estadístico
Análisis de Correspondencias Múltiples
CIMPA-UCR
Diagonalización:
ACM: SOLUCIÓN
1 t −1
Z ZD uα = λα uα
En ℜ :
q
1 −1 t
−1
ϕ
=
D
u
⇒
D Z Zϕα = λα ϕα
factor α
α
q
1
n
ZD −1Z tψ α = λαψ α
En ℜ :
q
Relaciones de transición:
p
ϕα =
ψα =
1
λα
D −1Z tψ α
1
q λα
Zϕα
Análisis de Correspondencias Múltiples
ACM: SOLUCIÓN
CIMPA-UCR
Relaciones baricéntricas:
ψ αi =
ϕαj =
1
λα
1
λα
p
Z ij
∑Z
i•
q λα
Z ij
1
j =1
n
∑Z
i =1
ϕαj =
1
•j
ψ αi =
∑ ϕα
j
j∈P ( i )
Z • j λα
P(i) modalidades que tiene i
I (j) modalidades que tiene j
∑ψ α
i∈I ( j )
i
Análisis de Correspondencias Múltiples
ACM: INTERPRETACIÓN
CIMPA-UCR
• Proximidad entre individuos en términos de parecido:
- Dos individuos se parecen si tienen casi las
mismas modalidades:
• Proximidad entre modalidades de variables diferentes
en términos de asociación:
- Son cercanos puesto que globalmente están
presentes en los mismos individuos
• Proximidad entre modalidades de una misma variable
en términos de parecido:
- Son excluyentes por construcción
- Si son cercanas es porque los individuos que las
poseen presentan casi el mismo comportamiento
en las otras variables
Análisis de Correspondencias Múltiples
CONCEPTOS SOCIOLÓGICOS EN LA EDUCACIÓN C.R.
Opinión: var 1, … , var 5/var 6, … , var 10
Señalización: sexo, tipo colegio, ingr, reli, poli, edpa, edma
CIMPA-UCR
Libertad y empresa privada
Var 1. La empresa privada es necesaria para la libertad
Var 2. Se puede entrar en un sindicato sin ser perseguido
Var 3. Si se trabaja en una e.p. no hay tiempo para ocuparse de la familia
Var 4. Los trabajadores deben repetar las órdenes de su patrono sin criticarlas
Var 5. Mi padre debe dedicarle más tiempo a la empresa o institución donde
trabaja
Democracia y Ejército
Var 6. Un país democrático no necestita ejército
Var 7. Un país con ejército es un país totalitario
Var 8. Es necesario que C.R. tenga ejército para defenderse de amenazas
externas
Var 9. La existencia de un ejército en C.R. podría llevar a una dictadura militar
a corto plazo
Var 10. E.E. U.U. no es un país democrático porque tiene ejército
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
ACM Ejemplo
CIMPA-UCR
Análisis de Correspondencias Múltiples
ACM Ejemplo
CIMPA-UCR
Análisis de Correspondencias Múltiples
ACM Ejemplo
CIMPA-UCR
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
• Clasificacion de variables cuya asociacion
es medida con el T de Chuprov
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Análisis de Correspondencias Múltiples
CIMPA-UCR
ACM Ejemplo
Descargar