ACP Y DE

Anuncio
6. EJEMPLO DE APLICACIÓN
COMPLEMENTARIA DEL ACP Y DE
LOS MÉTODOS DE CLASIFICACIÓN
6.1.
Presentación del problema
Se trata de un ejemplo didáctico, destinado a mostrar el
encadenamiento de técnicas estadísticas complementarias para
«construir» el objeto de estudio.
Se dispone de las características morfológicas de 22 vacunos
y se desea elaborar una tipología de esos animales según esas
características.
6.2.
Tabla de Datos
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°68
6.3. Estrategia de análisis de datos,
combinando el ACP y los métodos de
clasificación
6.3.1. 1° Etapa : Análisis de Componentes Principales
de la tabla T(22, 3)
a) Resultados
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°69
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°70
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°71
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°72
b) Conclusiones de la 1era Etapa
1. Los dos primeros ejes factoriales «absorben» el 91% de la inercia total
de la nube de puntos individuos (animales).
2. El primer eje (71% de la inercia total) es un eje de tamaño. La proyección
ortogonal de los animales sobre ese eje los ordena en orden decreciente
de tamaño de izquierda a derecha. Los animales más grandes son el
N°12 y el N°17. Los más pequeños son el N°22, N°3, N°4 y N°6.
3. La corrección aportada por el segundo eje permite distinguir los animales
«largos» (longitud superior al promedio) pero de baja envergadura (peso
y perímetro de pecho inferiores a los promedios (se proyectan en el
semieje superior), de aquellos que presentan una morfología «corta»,
pero de gran envergadura (se proyectan en el semieje inferior).
4. Proyectando las direcciones de las variables en el primer plano de los
individuos podemos definir dos direcciones : una correspondiente a la
dirección del vector «longitud del cuerpo»; la otra correspondiente a la
bisectriz del ángulo formado por los vectores «peso» y «perímetro del
pecho».
5. Proyectando los puntos-animales ortogonalmente sobre la dirección
«longitud del cuerpo», se observa que el más «largo» es el N°12 (176 cm),
mientras que el más «corto» es el N°6 (145 cm).
6. Proyectando los puntos-animales ortogonalmente sobre la dirección
«envergadura», se observa que el animal de mayor envergadura es
también el N°12 (74 cm; 450 kg), mientras que el de menor envergadura
es el N°22 (65 cm; 360 kg).
✧
Dificultad para distinguir agrupamientos de
animales similares.
Se puede distinguir fácilmente el grupo de los animales más grandes y el
grupo de los más pequeños. Pero en la zona central del gráfico, es más difícil
discernir los límites de grupos de animales con morfologías similares
✧ Para efectuar la clasificación, se conservan los dos primeros
ejes factoriales.
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°73
6.3.2. 2° Etapa : Clasificación Jerárquica Ascendente
de los animales a partir de la «tabla de
factores» F(22, 2)
a) Resultados
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°74
b) Conclusiones
Dendrograma
Indice de nivel
de agregación
1.44
0.54
Partición en 3 clases
Partición en 4 clases
0.28
0.16
0.12
0.10
0
1 7 8 10 13 18 19 16 20 14 2
9 11 21 17 12 15 5
4 6
3 22
1. Se observa que la suma de los índices de niveles de agregación es
igual a 2.82366, lo cual corresponde a la suma de los dos primeros
valores propios.
2. La partición en 3 clases es, evidentemente, insuficiente.
Permite distinguir el grupo de animales «grandes» (17, 12) y el grupo
de animales «pequeños» (15, 5, 4, 6, 3, 22). Pero conserva una tercera
clase muy poco homogénea, correspondiente a los animales cuyos
puntos representativos se ubican en el centro del primer plano
principal. De modo que esta partición no corrige la insuficiencia que
presentaban los resultados del análisis factorial.
✧ Se considera que una «buena» partición debería
comportar 4 clases.
¿Por qué no se justifica, en este caso, una partición en 5 clases...?
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°75
6.3.3. 3° Etapa : Aplicación del método de agregación
en torno a «centros móviles».
Creación de la partición P4 a partir
de la «tabla de factores» F(22, 2)
a) Resultados
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°76
b) Conclusiones
✧ La partición P4
de los 22 animales en 4 clases queda compuesta de la siguiente manera:
✧ La definición de los elementos «parangones» de esas clases
permite atribuir un sentido a los «elementos típicos» o
representativos de las mismas.
✧ La definición de los elementos de «contribución máxima» a
la inercia de las clases permite apreciar el grado de
homogeneidad de las mismas.
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°77
Programa PRESTA - 1999 - Eduardo CRIVISQUI
Tr. N°78
Descargar