TRABAJO DISEÑO UNIFACTORIAL ALEATORIZADO EVANDIS MANUEL ALGARIN BUZÓN LEYNER YESID QUERALES ZARACHE NOVIEMBRE DE 2020 UNIVERSIDAD DEL ATLANTICO DISEÑO DE EXPERIMENTOS GRUPO 1 INTRODUCCIÓN En el siguiente trabajo se realizará un experimento para estudiar la confiabilidad de una cierta cantidad de tableros electrónicos para carros, donde cada uno de estos es sometido a un envejecimiento acelerado durante 100 horas a una determinada temperatura, donde nuestra variable de interés es aquella que mide la intensidad de corriente que circulan entre dos puntos. En este experimento estaremos aplicando el análisis de varianza (ANOVA) que nos arroja el saber la existencia o no de diferencia significativa entre las medias de cada temperatura, para más tarde aplicar los supuestos de modelo, como el de normalidad, que se realiza de manera gráfica y por la prueba de Shapiro-Wilks. Por otra parte se analizará si hay datos atípicos. Después de tener en cuenta los resultados de la tabla de ANOVA por medio de gráficos, la prueba de Bartlett y la de Levene se analiza el supuesto de Homocedasticidad es decir ver si habría o no diferencia significativa entre las varianzas de los tratamientos. Al final teniendo en cuenta los resultados de la tabla ANOVA y por medio de la prueba de los Rangos Múltiples de Duncan y la LSD analizaremos entre que pares de medias existe o no una diferencia significativa. OBJETIVOS Estudiar si hay diferencias significativas entre las medias de las temperaturas. Realizar el análisis de varianza. Verificar la existencia o no de diferencia significativa entre las medias. Determinar un intervalo de confianza para la media de cualquier tratamiento y una para la diferencia de ellos. Verificar el cumplimiento del supuesto de normalidad. Verificar si existen datos atípicos. Verificar el cumplimiento del supuesto de homocedasticidad. Hacer las comparaciones de pares de medias. Verificar en que pares de medias existe significancia o no. Inicialmente establecemos las hipótesis que queremos contrastar Nuestra hipótesis nula nos indica que no existe diferencia significativa entre las medias de las temperaturas por lo cual no afectan la intensidad de corriente. Mientras la alternativa nos dice que si existe diferencia entre algunas de las medias por lo cual la temperatura sí afecta la intensidad de corriente. El modelo estadístico que se va a utilizar es el unifactorial aleatorizado. Ahora calculamos los valores necesarios para construir nuestra tabla ANOVA. Temperatura Intensidad de Corriente 15 18 13 12 17 21 11 16 23 19 25 22 28 32 34 31 45 51 57 48 ̅ 14,5 16,25 22,25 31,25 50,25 58 65 89 125 201 ̅ Totales [( ∑∑ ) ( ) ( ) ] ( ) Tratamientos [( ∑ ( Errores ) ) ( ) ] ( ) Tabla ANOVA Fuente de Variación Temperaturas Error Total Suma de Cuadrados 3599,8 Debemos calcular con nuestro Grados de Libertad 4 15 19 Cuadrado Medio 852,95 12,53 68,06 con un 95% de confiabilidad y contrastar Entonces nos queda Por lo tanto, se rechaza y concluimos que existe diferencia entre algunas de las medias, por lo cual la temperatura sí afecta la intensidad de corriente. A continuación vamos a estimar: Intervalo de confianza de 95% para la media 1 Intervalo de confianza de 95% para la diferencia de medias de los tratamientos 1 y 2 Intervalo de confianza para √ ̅ √ ̅ √ ( √ )√ ( )√ Intervalo de confianza para ̅ √ ̅ ̅ √ ̅ √ ( )√ √ ( )√ Normalidad Veamos los residuos del ejercicio sobre la intensidad de corriente de acuerdo a determinada temperatura. 15 17 23 28 45 18 21 19 32 51 0,5 0,75 0,75 3,25 3,5 4,75 13 11 25 34 57 ̅ 14,5 16,25 22,25 31,25 50,25 12 16 22 31 48 2,75 2,75 6,75 0,75 0,75 Determinamos los rangos para cada y sus respectivos porcentaje de probabilidad de acuerdo a la posición. Rango 1 2 3 4 5 6 7 8 9 10 % 0,025 0,075 0,125 0,175 0,225 0,275 0,325 0,375 0,425 0,475 2,5% 7,5% 12,5% 17,5% 22,5% 27,5% 32,5% 37,5% 42,5% 47,5% Rango 11 12 13 14 15 16 17 18 19 20 % 0,5 0,75 0,75 0,75 0,75 2,75 2,75 3,5 4,75 6,75 0,525 0,575 0,625 0,675 0,725 0,775 0,825 0,875 0,925 0,975 52,5% 57,5% 62,5% 67,5% 72,5% 77,5% 82,5% 87,5% 92,5% 97,5% Realizamos la gráfica de los probabilidad. vs sus respectivos porcentajes de Al observarse una tendencia lineal de los puntos en la gráfica podemos afirmar que los residuos se distribuyen normalmente, cumpliendo así el supuesto de normalidad. Prueba Shapiro-Wilks para normalidad. Tenemos estas hipótesis Tomando el ejercicio tenemos: Rango Rango 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 La varianza de los residuales es: Los coeficientes serian: 0,5 0,75 0,75 0,75 0,75 2,75 2,75 3,5 4,75 6,75 ( 1 2 3 4 5 6 7 8 9 10 [ ) ( ( 0,4734 0,3211 0,2565 0,2085 0,1686 0,1334 0,1013 0,0711 0,0422 0,0140 ( ) ) ) ( ( ( ( ( ( ( ) ) ) ) ) ) ) TOTAL Luego ( ( ) )( [∑ ) ( ( [ ] ) ( ) )] ( ) 5,681 3,211 1,731 1,251 0,885 0,4 0,228 0,071 0,042 0,01 13,51 ] Teniendo en cuenta un nivel de confianza del 95% se tiene que: Por lo tanto no se rechaza , es decir, se cumple el supuesto de normalidad para los residuales. Datos Atípicos. Si analizamos los residuales del ejercicio sobre la intensidad de corriente de acuerdo a determinada temperatura, observamos que son respectivamente el menor y mayor de los residuales. 0,5 0,75 0,75 3,25 3,5 4,75 0,75 0,75 2,75 2,75 6,75 √ √ √ Teniendo en cuenta los residuos estandarizados podemos afirmar que no hay datos atípicos en las observaciones. Igualdad de Varianzas (Homocedasticidad) Método gráfico. Tomando nuestro ejercicio tenemos que: 0,5 0,75 0,75 3,25 ̅ 14,5 16,25 22,25 31,25 50,25 3,5 4,75 2,75 2,75 6,75 0,75 0,75 8 6 4 2 0 0 -2 -4 -6 10 20 30 40 50 60 Si observamos la gráfica de los valores predichos vs los residuales podría decirse que no se está cumpliendo el supuesto, sin embargo al ser una pequeña cantidad de datos, necesitamos hacer la prueba analítica. Método analítico. Prueba de Bartlett Usamos esta prueba para contrastar las siguientes hipótesis: En el ejercicio tenemos que: Temperatura ∑ Intensidad de Corriente 15 18 13 12 17 21 11 16 23 19 25 22 28 32 34 32 45 51 57 48 ( ) ( ) ( ) ( ) [ ( ) ( ( 7 16,92 6,25 6,33 26,25 ) [ ] ( ) ) ( ( )] ) ( ) [ ( ] ) Observamos que por ende no se rechaza la hipótesis nula, es decir, se valida la igualdad de las varianzas de cada tratamiento. Prueba de Levene Inicialmente establecemos las hipótesis que queremos contrastar Nuestra hipótesis nula nos indica que no existe diferencia significativa entre las medias. Mientras la alternativa nos dice que si existe diferencia significativa en al menos una de ellas. Tomando la tabla original del ejercicio Temperatura Intensidad de Corriente 15 18 13 12 17 21 11 16 23 19 25 22 28 32 34 31 45 51 57 48 ̃ 14 16,5 22,5 31,5 49,5 Tomando la desviación absoluta de las observaciones de cada tratamiento con la mediana de los tratamientos, denotada de la forma: | ̃| Tenemos ̅ 1 0,5 0,5 3,5 4,5 4 4,5 3,5 0,5 1,5 1 5,5 2,5 2,5 7,5 2 0,5 0,5 0,5 1,5 8 11 7 7 15 2 2,75 1,75 1,75 3,75 ̅ Totales [( ) ∑∑ ( ) ( ) ] ( ) Tratamientos [( ) ∑ ( Errores ) ( ) ] ( ) Tabla ANOVA Fuente de Variación Temperaturas Error Total Suma de Cuadrados Debemos calcular con nuestro 76,8 Grados de Libertad 4 15 19 Cuadrado Medio 2,95 4,33 0,68 con un 95% de confiabilidad y contrastar Entonces nos queda Por lo tanto, se acepta y que las deviaciones medias son iguales, por lo cual las varianzas de las observaciones de los tratamientos también lo serán. Comparaciones de pares de medias. Método de rangos múltiples de Duncan. Arreglando los promedios de los tratamientos en orden ascendente tenemos: ̅ ̅ ̅ ̅ ̅ El error estándar de cada promedio es ̅ √ √ En el conjunto de rangos significativos de la siguiente tabla para 15 grados de libertad y , se obtiene ( ) ( ) ( ) ( ) Por lo tanto, los rangos de significación mínima son ( ) ̅ ( )( ) ( ) ̅ ( )( ) ( ) ̅ ( )( ) ( ) ̅ ( )( ) Los resultados de las comparaciones serían ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Por el análisis se observa que hay diferencias significativas entre todos los pares de medias con excepción de la 1 y 2. Método por prueba LSD. Tomando nuestro ejercicio sobre la intensidad de corriente de acuerdo a determinada temperatura, comparemos con la prueba LSD los pares de medias. √ √ ( ) |̅ ̅ | | | |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) ( )( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) |̅ ̅ | | | ( ) Como las diferencias de medias de medias cuyos valores absolutos superen el estadístico de prueba se consideran estadísticamente diferentes, podemos decir que todos los pares, excepto , tienen diferencias significativas. CONCLUSIÓN Concluimos que realizando el método de análisis de varianza (ANOVA), vimos que existe diferencia significativa entre las medias de temperaturas. Realizando después el supuesto de normalidad de manera gráfica y con la prueba de Shapiro-Wilks, concluimos que los datos tienen una distribución normal. Más tarde, gracias a al método gráfico y a las pruebas de Bartlett y Levene, observamos que cumple el supuesto de homocedasticidad, es decir, que no existe diferencia significativa entre las varianzas de las temperaturas. Por último, aplicando el método de Duncan y la prueba LSD, llegamos a concluir que existe diferencia significativa entre todos los pares de medias a excepción de la 1 la 2.