Solución Taller: Simplificación de estructuras de datos 1.) Variable dummy. Con la variable cualidad del producto, (x7 que se encuentra en una escala de cero a 10), usted deberá construir una variable dummy “dummyx7”, en tres rangos, 1= malo, 2= regular y 3=excelente; según la regla: x7<5,0 “malo”; x7<7,5 “regular” y el resto excelente Fracuencias Estadísticos variable dumy N Válidos Perdidos 100 0 variable dumy Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado malo 14 14,0 14,0 14,0 bueno 45 45,0 45,0 59,0 excelente 41 41,0 41,0 100,0 100 100,0 100,0 Total 2. variable fidelidaddummy Como observamos, el rango es de 13.97, para sacar las categorías, lo dividimos en 3 pues son 3 categorías, dando un valor de: 4.6. Quedando las categorías de la siguiente manera: 1 = 12.27 – 16.96 2 = 16.97 – 21.66 3 = 61.67 – 26.37 Estadísticos fidelidaddumy N Válidos Perdidos 100 0 Rango 13,97 Mínimo 12,27 Máximo 26,23 fidelidaad Válidos Frecuenci Porcentaj Porcentaje Porcentaje a e válido acumulado poco probable 25 25,0 25,3 25,3 medianamente 48 48,0 48,5 73,7 muy probable 26 26,0 26,3 100,0 Total 99 99,0 100,0 1 1,0 100 100,0 probable Perdidos Sistema Total El grafico de barras de la nueva variable fidelidaddummy donde se muestra el mayor puntaje acumulado en medianamente probable 3) Análisis de componentes principales Matriz de correlaciones: Mediante la matriz de correlaciones, nos permitió analizar cuáles eran las variables mas correlacionadas, para así determinar si estas presentan factores en común y poder realizar el ACP. Se pudo observar, que las variables que más se correlacionaban fueron: tamaño de la empresa con compra detallada y estructura de adquisición, y tipo de situación de compra con La cantidad de producto total de la empresa que se compra a HATCO. Comunalidades: Luego de haber realizado la extracción de datos de las variables, podemos observar en la tabla de comunalidades de extracción, que las variables tiene una comunalidad alta, lo cual me dice que todas las variables, están muy bien representadas en el espacio de los factores, como la variable estructura de la adquisición con un coeficiente de 0.907, tipo de industria con 0.912. Varianza total explicada: Se extraen los factores que explican en mayor proporción el total de la variable explicada, cuando estos son mayores que 1. En nuestro caso, tenemos cuatro componentes que cumplen la condición y que nos explican 82.008% de la varianza total, pero adicionalmente observamos el componente 5, que con un coeficiente de 0.906, muy cercano a 1, que explica un 6.038% y que se podría incluir en la estructura factorial. Grafico de sedimentación: Mediante la observación de este grafico, nos permite analizar con mayor rapidez y claridad, los componentes que explican en mayor proporción la varianza total y se concluye que los 4 primeros componentes al cumplir la condición de tener un coeficiente mayor a uno, explican mejor la varianza total. Matriz de componentes: Comparando las saturación relativa de cada variable con los cuatro factores podemos apreciar que el primer factor está constituido por las variables Velocidad de entrega, cantidad comprada de productos a Hacto, satisfacción de la compra de productos a Hatco y Compra detallada, tipo de situación de compra estas variables son explicadas con mayor proporción por este componente, tomados con el criterio de que sus coeficientes son mayores de 0.6. El segundo factor, esta constituidos por las variables nivel de precio, servicios conjuntos. El tercer componente esta constituido por la variable Imagen de la fuerza de venta. Por último el cuarto factor está conformado por la variable Tipo de industria con un coeficiente de 0.910 que es independiente del factor 1 Mediante el análisis de componentes principales, se obtuvieron 4 nuevas variables, que no están correlacionadas y me explican un 82.008% todas las variables. Matriz de componentesa Componente 1 Velocidad de entrega - 2 3 4 ,857 ,025 -,087 ,068 -,325 ,726 -,288 ,184 Flexibilidad de precio ,771 -,264 ,007 -,097 Imagen del fabricante ,111 ,713 ,587 -,212 Servicios conjuntos ,520 ,644 -,307 ,215 Imagen de la fuerza de ,134 ,609 ,702 -,070 Calidad del producto -,604 ,507 -,061 ,062 Tamaño de la empresa -,816 ,350 -,236 -,104 La cantidad de producto ,783 ,457 -,266 -,037 ,779 ,419 ,071 -,100 ,816 -,350 ,236 ,104 Estructura de la adquisición -,823 ,476 -,059 -,010 Tipo de industria -,059 ,054 ,278 ,910 Tipo de situación de compra ,866 ,177 -,221 ,136 FIDELIDADDUMMY ,706 ,506 -,189 -,145 tiempo que transcurre hasta que se entrega el producto, una vez que se hubo confirmado el pedido. Nivel de precio venta total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento La cantidad de producto total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento Compra detallada Método de extracción: Análisis de componentes principales. a. 4 componentes extraídos Matriz de componentesa Componente 1 Velocidad de entrega - 2 3 4 ,857 ,025 -,087 ,068 -,325 ,726 -,288 ,184 Flexibilidad de precio ,771 -,264 ,007 -,097 Imagen del fabricante ,111 ,713 ,587 -,212 Servicios conjuntos ,520 ,644 -,307 ,215 Imagen de la fuerza de ,134 ,609 ,702 -,070 Calidad del producto -,604 ,507 -,061 ,062 Tamaño de la empresa -,816 ,350 -,236 -,104 La cantidad de producto ,783 ,457 -,266 -,037 ,779 ,419 ,071 -,100 ,816 -,350 ,236 ,104 Estructura de la adquisición -,823 ,476 -,059 -,010 Tipo de industria -,059 ,054 ,278 ,910 Tipo de situación de compra ,866 ,177 -,221 ,136 FIDELIDADDUMMY ,706 ,506 -,189 -,145 tiempo que transcurre hasta que se entrega el producto, una vez que se hubo confirmado el pedido. Nivel de precio venta total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento La cantidad de producto total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento Compra detallada Método de extracción: Análisis de componentes principales. Varianza total explicada Sumas de las saturaciones al cuadrado de la Autovalores iniciales Compo nente Total % de la varianza extracción % acumulado Total % de la varianza Suma de las saturaciones al cuadrado de la rotación % acumulado Total % de la varianza % acumulado 1 6,578 43,853 43,853 6,578 43,853 43,853 4,826 32,171 32,171 2 3,296 21,974 65,827 3,296 21,974 65,827 4,439 29,592 61,762 3 1,378 9,189 75,016 1,378 9,189 75,016 1,965 13,097 74,859 4 1,049 6,991 82,008 1,049 6,991 82,008 1,072 7,148 82,008 5 ,906 6,038 88,045 6 ,528 3,518 91,563 7 ,380 2,533 94,096 8 ,323 2,151 96,247 9 ,254 1,691 97,938 10 ,117 ,778 98,717 11 ,092 ,612 99,328 12 ,060 ,399 99,728 13 ,032 ,214 99,941 14 ,009 ,059 100,000 15 1,758E-17 1,172E-16 100,000 Método de extracción: Análisis de Componentes principales. Matriz de correlaciones Velocidad de L entrega - p tiempo que d transcurre q hasta que se entrega el m producto, una vez que se p hubo 10 confirmado el pedido. Correlación Velocidad de entrega - Nivel de precio Flexibilidad de Imagen del Servicios Imagen de la Calidad del Tamaño de la precio fabricante conjuntos fuerza de venta producto empresa 1,000 -,349 ,509 ,050 ,612 ,077 -,483 -,631 -,349 1,000 -,487 ,272 ,513 ,186 ,470 ,428 Flexibilidad de precio ,509 -,487 1,000 -,116 ,067 -,034 -,448 -,646 Imagen del fabricante ,050 ,272 -,116 1,000 ,299 ,788 ,200 ,038 Servicios conjuntos ,612 ,513 ,067 ,299 1,000 ,241 -,055 -,220 Imagen de la fuerza de ,077 ,186 -,034 ,788 ,241 1,000 ,177 -,043 -,483 ,470 -,448 ,200 -,055 ,177 1,000 ,684 tiempo que transcurre hasta que se entrega el producto, una vez que se hubo confirmado el pedido. Nivel de precio venta Calidad del producto v Tamaño de la empresa -,631 ,428 -,646 ,038 -,220 -,043 ,684 1,000 La cantidad de producto ,676 ,082 ,559 ,224 ,701 ,256 -,192 -,365 ,651 ,028 ,525 ,476 ,631 ,341 -,283 -,457 ,631 -,428 ,646 -,038 ,220 ,043 -,684 -1,000 Estructura de la adquisición -,715 ,646 -,758 ,240 -,112 ,116 ,689 ,816 Tipo de industria -,028 ,040 -,049 ,005 ,016 ,145 ,149 ,000 Tipo de situación de compra ,676 -,080 ,621 ,102 ,566 ,030 -,421 -,594 FIDELIDADDUMMY ,584 ,051 ,501 ,341 ,588 ,291 -,062 -,283 total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento La cantidad de producto total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento Compra detallada Comunalidades Inicial Velocidad de entrega - Extracción 1,000 ,748 Nivel de precio 1,000 ,749 Flexibilidad de precio 1,000 ,674 Imagen del fabricante 1,000 ,911 Servicios conjuntos 1,000 ,826 Imagen de la fuerza de 1,000 ,887 Calidad del producto 1,000 ,629 Tamaño de la empresa 1,000 ,854 La cantidad de producto 1,000 ,894 tiempo que transcurre hasta que se entrega el producto, una vez que se hubo confirmado el pedido. venta total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento La cantidad de producto 1,000 ,797 Compra detallada 1,000 ,854 Estructura de la adquisición 1,000 ,907 Tipo de industria 1,000 ,912 Tipo de situación de compra 1,000 ,848 FIDELIDADDUMMY 1,000 ,811 total de la empresa que se compra a HATCO, medido en una escala porcentual de 100 puntos, que van de 0 a 100 por ciento Método de extracción: Análisis de Componentes principales. 4). Calcular el CP1. Variable dummy, Calcular el CP2. Variable dummy Luego de realizar el análisis de componentes principales se concluyo que se debían crear dos variables nuevas, que me englobaran todas las variables, por ello se crearon las variables Cp1 y Cp2. La primera variable Cp1 me explica mejor las variables Industria, comercio, servicios, otras actividades económicas, Unidades auxiliares tipo de gerencia, Unidades auxiliares diferentes de gerencia y Población. La segunda variables Cp2 me explica en mayor proporción la variables %NBI. La variable Cp1 está conformada por comercio del cual me explica un 0.984, población con un coeficiente 0.970, servicio con un coeficiente de 0.96, industria, otras actividades económicas con un coeficiente un 0.955, unidades auxiliares tipo de gerencia con un coeficiente de 0.949, unidades auxiliares diferentes de gerencia con un coeficiente de 0.938, NBI con un coeficiente de -0.675, desocupados con un coeficiente de 0.552 y alfabetización con un coeficiente de 0.520 La variable Cp2, constituida de la siguiente manera: por la variable comercio y de ella me explica un 0.097, población con un coeficiente de 0.115, servicios con un coeficiente de 0.135, industria con un coeficiente de 0.098, otras actividades económicas con un coeficiente de 0.146, unidades auxiliares tipo de gerencia con un coeficiente de 0.120, Unidades auxiliares diferente de gerencia con un coeficiente de 0.164, NBI con un coeficiente de 0.663, desocupados con un coeficiente de 0.058 y población con un coeficiente de -0.807.