Análisis de Correspondencias Múltiples CIMPA-UCR Análisis de Correspondencias Múltiples (ACM) Análisis de Correspondencias Múltiples ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES CIMPA-UCR Lebart, 1974 Hacer análisis de correspondencias sobre: • Tabla disyuntiva completa • Tabla de Burt Representación simultánea de todas las modalidades. Ojo: # de modalidades Bibliografía: Lebart et al. (inglés) Lebart et al. (español) Greenacre (inglés) Escofier & Pagès (francés) Análisis de Correspondencias Múltiples ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES CIMPA-UCR n: individuos p: variables cualitativas 1 2 3 4 M Tipo de salario Sexo Prov M F F M M Alajuela Alto Heredia Bajo San Jose Muy Alto Cartago Bajo M M Tabla disyuntiva completa: 1 2 3 4 M M 1 0 0 1 F 0 1 1 0 SJ 0 0 1 0 A 1 0 0 0 C 0 0 0 1 H 0 1 0 0 MB 0 0 0 0 B 0 1 0 1 M 0 0 0 0 A 1 0 0 0 MA … 0 0 1 0 Análisis de Correspondencias Múltiples ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES CIMPA-UCR Tabla de Burt (contingencia generalizada) M F SJ A C H MB B M A M M F 240 0 0 259 100 103 60 66 44 39 36 51 Sjo Ala Car Her 100 60 44 36 103 66 39 51 203 0 0 0 0 126 0 0 0 0 83 0 0 0 0 87 MB B M A MA … Análisis de Correspondencias Múltiples CIMPA-UCR ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES La tabla de datos: Tabla de Burt EDAD INGRESO 5 Medio 3 Alto 4 Bajo 1 Bajo 2 Medio 5 Alto 2 Medio 3 Bajo 1 Alto 4 Medio Edad SEXO F F M F F M F M M F Ingresos ind 1 2 3 4 5 6 7 8 9 10 Sexo Sexo F M 1 F 6 1 M 4 1 1 1 1 2 2 2 0 3 1 1 4 1 1 5 1 1 B 1 2 M 4 0 A 1 2 18 12 Edad Ingresos 2 3 4 5 B M A 2 1 1 1 1 4 1 0 1 1 1 2 0 2 1 0 1 2 0 2 0 2 1 0 1 2 1 1 0 2 0 1 1 3 4 3 Análisis de Correspondencias Múltiples CIMPA-UCR ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES ACM ⇔ n individuos Profesión Análisis de Correspondencias de una tabla disyuntiva completa Edad Sexo 0 1 0 0 1 0 0 0 1 3 3 3 3 3 3 3 3n Estructura particular de la tabla ⇓ Propiedades particulares del análisis Análisis de Correspondencias Múltiples ACM: AFC DE UNA TABLA DISYUNTIVA CIMPA-UCR 1 p1 • j• 1L pq 1 n = # individuos q = # variables cualitativas pk = #modalidades de la variable k zij i zi • = q q p = ∑ pk = total de columnas k =1 n z• j Z = ( zij ) nq 1 zij = 0 Márgenes: zi• = q pues hay q unos en la fila i z• j # individuos que tienen modalidad j ∑∑ j i zij = nq Matriz a diagonalizar: S= 1 t −1 1 Z ZD = BD −1 q q con D = diag ( z• j ) Análisis de Correspondencias Múltiples CIMPA-UCR ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES F2 Prof 2 Prof 3 M Edad 2 Prof 4 F1 Prof 1 F Edad 1 n puntos en ℜ q p puntos en Edad 3 ℜ n Análisis de Correspondencias Múltiples ACM: CASO DE 2 VARIABLES CIMPA-UCR Análisis factorial de correspondencias Burt Disyuntiva completa 1 P1 1 P2 1 P1 Contingencia 1 P2 P2 1 0 n 00100 100 P1 0 1 P2 (Z1) P1 0 0 (Z2) Z B=Zt Z K=Z2t Z1 λz λB = λ2z λK = (2λz − 1) Análisis de Correspondencias Múltiples CIMPA-UCR ACM: NUBES DE PUNTOS - PERFILES Perfiles- fila (individuos) Z Z Puntos (coordenadas): ij = ij Z i• Peso: Z i• q 1 = = nq nq n nq Métrica: diag Z• j Distancia χ2: q 1 Tabla: q Z n p 1 (Zij − Z i′j )2 d (i, i′) = ∑ q j =1 Z • j 2 Perfiles- columna (modalidades) Z Puntos (coordenadas): ij Z• j Peso: Z• j nq nq nq = diag = diag (n ) q Z i• Métrica: diag Distancia χ2: Z Z ′ d 2 ( j , j ′) = n∑ ij − ij Z • j′ i =1 Z • j n 2 Análisis de Correspondencias Múltiples ACM: DISTANCIA DE χ2 CIMPA-UCR Perfiles de fila: 2 p n 1 n 2 (Z ij − Z i′j ) = d (i, i′) = ∑ q j =1 Z • j q ∑ j∈M ii′ 1 Z• j con M ii′ : modalidades que tiene solo un individuo i o i’ Más parecidos si tienen más modalidades en común. Perfiles de columna: 2 Z ij Z ij′ card (ind [ j , no j ′] + card (ind [ j ′, no j ] d ( j , j′) = n∑ − =n Z • j′ Z • j Z • j′ i =1 Z • j n 2 Entre más objetos tengan sólo una de j o j’ mayor es la distancia Análisis de Correspondencias Múltiples CIMPA-UCR INTERPRETACIÓN • Dos modalidades escogidas por los mismos individuos coinciden •Dos individuos son cercanos si escogen las mismas modalidades • Modalidades con poco efectivo están alejadas del centro de gravedad Análisis de Correspondencias Múltiples ACM: INERCIA CIMPA-UCR 1 1 Centro de gravedad de nube de modalidades G = , ... , n n 2 n Z n Z 2 Z ij 1 1 ij ij 2 d ( j , G ) = n∑ − = n∑ 2 − + 2= −1 n nZ • j n Z • j i =1 Z • j i =1 Z • j n Distancia mayor si el efectivo es pequeño Inercia de la modalidad j: 1 Z• j Z• j n − 1 = 1 − I ( j) = d ( j, G) = nq nq Z • j q n Z• j 2 Mayor inercia si el efectivo es pequeño Análisis de Correspondencias Múltiples ACM: INERCIA CIMPA-UCR Inercia de la variable k: 1 Z• j I (k ) = ∑ I ( j ) = ∑ 1 − n j =1 j =1 q pk pk 1 = ( pk − 1) q Crece con el número de modalidades Si pk = 2 mínimo 1 q Inercia total: p 1 1 I = ∑ I (k ) = ∑ ( pk − 1) = ( p − q) = − 1 q q k k q No tiene significado estadístico Análisis de Correspondencias Múltiples CIMPA-UCR Diagonalización: ACM: SOLUCIÓN 1 t −1 Z ZD uα = λα uα En ℜ : q 1 −1 t −1 ϕ = D u ⇒ D Z Zϕα = λα ϕα factor α α q 1 n ZD −1Z tψ α = λαψ α En ℜ : q Relaciones de transición: p ϕα = ψα = 1 λα D −1Z tψ α 1 q λα Zϕα Análisis de Correspondencias Múltiples ACM: SOLUCIÓN CIMPA-UCR Relaciones baricéntricas: ψ αi = ϕαj = 1 λα 1 λα p Z ij ∑Z i• q λα Z ij 1 j =1 n ∑Z i =1 ϕαj = 1 •j ψ αi = ∑ ϕα j j∈P ( i ) Z • j λα P(i) modalidades que tiene i I (j) modalidades que tiene j ∑ψ α i∈I ( j ) i Análisis de Correspondencias Múltiples ACM: INTERPRETACIÓN CIMPA-UCR • Proximidad entre individuos en términos de parecido: - Dos individuos se parecen si tienen casi las mismas modalidades: • Proximidad entre modalidades de variables diferentes en términos de asociación: - Son cercanos puesto que globalmente están presentes en los mismos individuos • Proximidad entre modalidades de una misma variable en términos de parecido: - Son excluyentes por construcción - Si son cercanas es porque los individuos que las poseen presentan casi el mismo comportamiento en las otras variables Análisis de Correspondencias Múltiples CONCEPTOS SOCIOLÓGICOS EN LA EDUCACIÓN C.R. Opinión: var 1, … , var 5/var 6, … , var 10 Señalización: sexo, tipo colegio, ingr, reli, poli, edpa, edma CIMPA-UCR Libertad y empresa privada Var 1. La empresa privada es necesaria para la libertad Var 2. Se puede entrar en un sindicato sin ser perseguido Var 3. Si se trabaja en una e.p. no hay tiempo para ocuparse de la familia Var 4. Los trabajadores deben repetar las órdenes de su patrono sin criticarlas Var 5. Mi padre debe dedicarle más tiempo a la empresa o institución donde trabaja Democracia y Ejército Var 6. Un país democrático no necestita ejército Var 7. Un país con ejército es un país totalitario Var 8. Es necesario que C.R. tenga ejército para defenderse de amenazas externas Var 9. La existencia de un ejército en C.R. podría llevar a una dictadura militar a corto plazo Var 10. E.E. U.U. no es un país democrático porque tiene ejército Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples ACM Ejemplo CIMPA-UCR Análisis de Correspondencias Múltiples ACM Ejemplo CIMPA-UCR Análisis de Correspondencias Múltiples ACM Ejemplo CIMPA-UCR Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo • Clasificacion de variables cuya asociacion es medida con el T de Chuprov Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo Análisis de Correspondencias Múltiples CIMPA-UCR ACM Ejemplo