Podemos utilizar el procedimiento ANOVA de una vía para contrastar la hipótesis de que las medias de dos o más grupos no son diferentes significativamente. El ANOVA de una vía también ofrece: Estadísticos a nivel de grupo para la variable dependiente. Un contraste de igualdad de varianzas Un gráfico de medias de grupo. Contrastes de rango, comparaciones de pares múltiple, y contrastes, para describir la naturaleza de la diferencia entre los grupos. Un primer paso importante en el análisis de la varianza es establecer la validez de los supuestos. Un supuesto del ANOVA es que las varianzas de los grupos sean equivalentes. Este ejemplo ilustra cómo contrastar este supuesto. Un Director de Ventas quiere determinar el número óptimo de días de entrenamiento de producto necesarios para los nuevos empleados. El tiene puntuaciones para tres grupos: empleados con uno, dos y tres días de entrenamiento. Los datos se recogen en el fichero ventas.sav. Antes de ejecutar el análisis de la varianza, representamos gráficamente las medias y los errores típicos. Para crear un gráfico de barras, elegimos: Gráficos Barras de error… Definir Seleccionamos Puntuación en el exámen de ventas como variable de análisis. Seleccionamos Grupo de entrenamiento de ventas como variable de categoría. Seleccionamos Error típico de la media de la lista de lo representan las barras. Pulsamos en Aceptar. Media +- 2 ET Puntuación en el exámen de ventas 85,00 80,00 75,00 70,00 65,00 60,00 55,00 1 2 3 Grupo de entrenamiento de ventas Las puntuaciones medias crecen claramente a medida que crecen los días de entrenamiento, pero la variación en dichas puntuaciones decrecen. El ANOVA asume igualdad de varianzas entre grupos; dicho supuesto no se puede mantener para estos datos. Para contrastar el supuesto de igualdad de varianzas, elegimos: Analizar Comparar medias ANOVA de un factor… Seleccionamos Puntuaciones del exámen de ventas como variable dependiente. Seleccionamos Grupo de entrenamiento de ventas como la variable factor. Entramos en Opciones… Seleccionamos Estadísticos Descriptivos y Prueba de Homogeneidad de Varianzas. Continuar. Aceptar. Descriptivos nivel N 1 2 3 Total 20 20 20 60 Media 63,5798 73,5677 79,2792 72,1422 Desviación típica 13,50858 10,60901 4,40754 12,00312 Error típico 3,02061 2,37225 ,98556 1,54960 Intervalo de confianza para la media al 95% Límite Límite inferior superior 57,2576 69,9020 68,6025 78,5328 77,2165 81,3420 69,0415 75,2430 Mínimo 32,68 47,56 71,77 32,68 Máximo 86,66 89,65 89,69 89,69 La desviación típica y el error típico confirman que a medida que crece el número de días de entrenamiento, la variación en las puntuaciones decrece. Prueba de homogeneidad de varianzas nivel Estadístico de Levene 4,637 gl1 gl2 2 57 Sig. ,014 El estadístico de Levene rechaza la hipótesis nula de la varianza de los grupos son iguales. El ANOVA es robusto a esta violación cuando los grupos son de igual o parecido tamaño; sin embargo, podemos elegir la transformación de los datos o la ejecución de un contraste no paramétrico que no requiere del cumplimiento de este supuesto. En respuesta a los requerimientos de los clientes, una compañía de electrónica esta desarrollando un nuevo aparato reproductor de Vds.. Usando un prototipo, el equipo de marketing ha recogido datos de un grupo de análisis. El ANOVA se utiliza para descubrir si los consumidores de distintas edades puntúan el diseño de forma diferente. Este ejemplo utiliza el fichero reproductordvd.sav. Para empezar el análisis, elegimos: Analizar Comparar medias ANOVA de un factor… Seleccionamos valoración global como variable dependiente. Seleccionamos Grupo de edad como variable factor. Entramos en Opciones… El gráfico de medias es una forma útil de visulizar las diferencias de grupos. Seleccionamos Gráfico de las medias. Continuar. Aceptar. ANOVA dvdpuntos Inter-grupos Intra-grupos Total Suma de cuadrados 733,274 1976,417 2709,691 gl 5 62 67 Media cuadrática 146,655 31,878 F 4,601 Sig. ,001 El nivel de significación de la prueba F en la tabla ANOVA es 0.001. Por tanto, debemos rechazar la hipótesis de que las puntuaciones medias son iguales para los distintos grupos de edad. Ahora que sabemos que los grupos de edad difieren de alguna forma, necesitamos saber más acerca de la estructura de dichas diferencias. 38 Media de dvdpuntos 36 34 32 30 28 18-24 25-31 32-38 39-45 46-52 53-59 Grupo de edad El gráfico de las medias ayuda a ver esta estructura. Los participantes con edades entre 32 y 45 años puntuaron el reproductor de DVD más alto que los otros. Si analizamos más detalladamente, entonces el equipo puede utilizar contraste de rangos, comparaciones de pares, o característica de contraste en un ANOVA de un factor. CONTRASTES ENTRE MEDIAS En general, los estadísticos F establecen que hay o no hay diferencias entre las medias de grupo, y los gráficos de las medias sugieren donde puede estar dicha diferencia. En este punto se muestra, podemos utilizar el procedimiento ANOVA de un factor para especificar cómo las medias difieren y contrastar dichas especificaciones. Viendo los datos del reproductor de DVD, los investigadores de Mercado se preguntan: ¿Son realmente diferentes los dos grupos que hay entre las edades de 32 y 45 años? ¿Podemos considerar estadísticamente equivalentes los entrevistados con edades inferiores a 32 años y los de más de 45 años? Volvemos a ejecutar el ANOVA de un factor, pero ahora entramos en Contrastes… El primer contraste compara solamente los grupos 3 y 4 ([32-38] y [39-45]); el resto son eliminados asignándoles ponderaciones 0. Ponemos 0 como coeficiente para el grupo 1, pulsamos en añadir. Añadimos otro coeficiente 0 para el grupo 2. Luego, añadimos coeficientes a los grupos 3 y 4, de manera que sumen 0. Por tanto, ponemos un -1 para el grupo 3 y un 1 para el grupo 4. Ponemos un 0 como coeficientes para los grupos 5 y 6. Pasamos al siguiente contraste. El segundo contraste compara los grupos 1 y 2 con los grupos 5 y 6. Los grupos 3 y 4 se eliminan. Ponemos 0,5 como coeficiente para los grupos 1 y 2. Luego ponemos coeificiente 0 para los grupos 3 y 4. Para que la suma de los coeficientes de contraste sea 0, los grupos 5 y 6 tienen que tener como coeficiente -0,5. Continuar. Aceptar. Pruebas para los contrastes dvdpuntos Asumiendo igualdad de varianzas No asumiendo igualdad de varianzas Contraste 1 2 1 2 Valor del contraste -2,20 2,61 -2,20 Error típico 2,525 1,633 2,678 t -,871 1,596 -,821 62 62 17,209 Sig. (bilateral) ,387 ,116 ,423 2,61 1,594 1,635 42,280 ,110 gl Nótese que los resultados se muestran en dos panels: el primero assume que las varianzas de los grupos son iguales, y el segundo asumen que son distintas. En este caso, las varianzas de los grupos se asume que son iguales, por lo que nos centramos en el primer panel. Los niveles de significación para los contrastes del primer contraste son ambos mayores que 0.1. Esto indica que el grupo de edad 39-45 no es significativamente más favorable hacia el reproductor DVD que el grupo de 3238. De igual forma, los valores de significación para los contrastes del segundo contraste son mayores que 0.1. Los entrevistados con edades inferiores a 32 y superiores a 45 tienen puntuaciones estadísticamente equivalentes. TODAS LAS POSIBLES COMPARACIONES ENTRE MEDIAS. Los contrastes son un método eficiente y potente para la comparación exacta de los grupos que queremos comparar, utilizando cualquier ponderación que necesitemos. Sin embargo, hay veces cuando no tenemos, o no necesitamos, tales especificaciones. El procedimiento de ANOVA de un factor permite comparar cada media de grupo frente a cada una de las restantes, un método conocido como comparaciones múltiples de pares. Un Director de ventas ha analizado los datos de entrenamiento utilizando el ANOVA de un factor. Mientras que las diferencias de los grupos fueron detectadas, no hay hipótesis a priori acerca de cómo los tres grupos difieren. Así, ha decidido simplemente comparar cada grupo con cada uno de los restantes. Este ejemplo utiliza el fichero ventas.sav. Retomamos el primero de los ejemplos para llevar a cabo el ANOVA de un factor, pero ahora además entramos en Post Hoc… Las pruebas Post Hoc se dividen en dos grupos: El primer grupo asume igualdad de varianzas. El segundo conjunto no asume que las varianzas sean iguales. Puesto que el test de Levene ha establecido que las varianzas entre grupos de entrenamiento son significativamente diferentes, elegimos de esta lista. Seleccionamos T2 de Tamhane. Continuar. Aceptar. Comparaciones múltiples Variable dependiente: nivel Tamhane (I) GRUPO 1 2 3 (J) GRUPO 2 3 1 3 1 2 Diferencia de medias (I-J) -9,98789* -15,69947* 9,98789* -5,71158 15,69947* 5,71158 Error típico 3,84079 3,17733 3,84079 2,56883 3,17733 2,56883 Sig. ,040 ,000 ,040 ,102 ,000 ,102 Intervalo de confianza al 95% Límite Límite inferior superior -19,6053 -,3705 -23,8792 -7,5198 ,3705 19,6053 -12,2771 ,8539 7,5198 23,8792 -,8539 12,2771 *. La diferencia entre las medias es significativa al nivel .05. El grupo con un día de entrenamiento significativamente menor puntuación que el resto de grupos. Los entrenados 2 y 3 días no difieren significativamente en promedio. A pesar de esta igualdad, el Director de ventas puede aún considerar el beneficio añadido del tercer día de entrenamiento, dado el mayor descenso en la variabilidad.