6. EJEMPLO DE APLICACIÓN COMPLEMENTARIA DEL ACP Y DE LOS MÉTODOS DE CLASIFICACIÓN 6.1. Presentación del problema Se trata de un ejemplo didáctico, destinado a mostrar el encadenamiento de técnicas estadísticas complementarias para «construir» el objeto de estudio. Se dispone de las características morfológicas de 22 vacunos y se desea elaborar una tipología de esos animales según esas características. 6.2. Tabla de Datos Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°68 6.3. Estrategia de análisis de datos, combinando el ACP y los métodos de clasificación 6.3.1. 1° Etapa : Análisis de Componentes Principales de la tabla T(22, 3) a) Resultados Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°69 Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°70 Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°71 Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°72 b) Conclusiones de la 1era Etapa 1. Los dos primeros ejes factoriales «absorben» el 91% de la inercia total de la nube de puntos individuos (animales). 2. El primer eje (71% de la inercia total) es un eje de tamaño. La proyección ortogonal de los animales sobre ese eje los ordena en orden decreciente de tamaño de izquierda a derecha. Los animales más grandes son el N°12 y el N°17. Los más pequeños son el N°22, N°3, N°4 y N°6. 3. La corrección aportada por el segundo eje permite distinguir los animales «largos» (longitud superior al promedio) pero de baja envergadura (peso y perímetro de pecho inferiores a los promedios (se proyectan en el semieje superior), de aquellos que presentan una morfología «corta», pero de gran envergadura (se proyectan en el semieje inferior). 4. Proyectando las direcciones de las variables en el primer plano de los individuos podemos definir dos direcciones : una correspondiente a la dirección del vector «longitud del cuerpo»; la otra correspondiente a la bisectriz del ángulo formado por los vectores «peso» y «perímetro del pecho». 5. Proyectando los puntos-animales ortogonalmente sobre la dirección «longitud del cuerpo», se observa que el más «largo» es el N°12 (176 cm), mientras que el más «corto» es el N°6 (145 cm). 6. Proyectando los puntos-animales ortogonalmente sobre la dirección «envergadura», se observa que el animal de mayor envergadura es también el N°12 (74 cm; 450 kg), mientras que el de menor envergadura es el N°22 (65 cm; 360 kg). ✧ Dificultad para distinguir agrupamientos de animales similares. Se puede distinguir fácilmente el grupo de los animales más grandes y el grupo de los más pequeños. Pero en la zona central del gráfico, es más difícil discernir los límites de grupos de animales con morfologías similares ✧ Para efectuar la clasificación, se conservan los dos primeros ejes factoriales. Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°73 6.3.2. 2° Etapa : Clasificación Jerárquica Ascendente de los animales a partir de la «tabla de factores» F(22, 2) a) Resultados Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°74 b) Conclusiones Dendrograma Indice de nivel de agregación 1.44 0.54 Partición en 3 clases Partición en 4 clases 0.28 0.16 0.12 0.10 0 1 7 8 10 13 18 19 16 20 14 2 9 11 21 17 12 15 5 4 6 3 22 1. Se observa que la suma de los índices de niveles de agregación es igual a 2.82366, lo cual corresponde a la suma de los dos primeros valores propios. 2. La partición en 3 clases es, evidentemente, insuficiente. Permite distinguir el grupo de animales «grandes» (17, 12) y el grupo de animales «pequeños» (15, 5, 4, 6, 3, 22). Pero conserva una tercera clase muy poco homogénea, correspondiente a los animales cuyos puntos representativos se ubican en el centro del primer plano principal. De modo que esta partición no corrige la insuficiencia que presentaban los resultados del análisis factorial. ✧ Se considera que una «buena» partición debería comportar 4 clases. ¿Por qué no se justifica, en este caso, una partición en 5 clases...? Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°75 6.3.3. 3° Etapa : Aplicación del método de agregación en torno a «centros móviles». Creación de la partición P4 a partir de la «tabla de factores» F(22, 2) a) Resultados Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°76 b) Conclusiones ✧ La partición P4 de los 22 animales en 4 clases queda compuesta de la siguiente manera: ✧ La definición de los elementos «parangones» de esas clases permite atribuir un sentido a los «elementos típicos» o representativos de las mismas. ✧ La definición de los elementos de «contribución máxima» a la inercia de las clases permite apreciar el grado de homogeneidad de las mismas. Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°77 Programa PRESTA - 1999 - Eduardo CRIVISQUI Tr. N°78