TAREA 4 1. En que situaciones se aplica un diseño de bloques completos al azar? En que difieren los factores de tratamiento y de bloque? Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor sin que las posibles diferencias se deban a otros factores que no se consideraron en el estudio. En el diseño DBCA, en cada bloque se prueban todos los tratamientos. La aleatorización se hace dentro de cada bloque. Un tratamiento es una combinación de niveles de todos los factores y los factores de bloque son las variables adicionales al factor de interés que se incorporan de manera explicita en un experimento comparativo para no sesgar la comparación. 2. Que diferencia hay entre un DBCA y los diseños en cuadro latino? En el DBCA se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio, mientras que en el diseño en cuadro latino se controlan dos factores de bloque y uno de tratamientos; los tres factores tienen la misma cantidad de niveles. Los tratamientos se representan por letras latinas y se distribuyen en forma adecuada en un cuadro. 3. De acuerdo con el modelo estadístico para un diseño en bloques, porque a través de este diseño se reduce el error aleatorio? Porque ahora al considerar los bloques, la variabilidad observada que no se podía explicar por los factores estudiados resulta del efecto de dichos bloques y del error experimental. 9. A continuación se muestran los datos para un diseño en bloques al azar. Bloque Total por tratamiento Tratamiento 1 2 3 4 A 3 4 2 6 Y1. = B 7 9 3 10 Y2. = C 4 6 3 7 Y3. = . . . . Total por bloque Y1 = Y2 = Y3 = Y4 = Y.. a) Complete las sumas totales que se piden en la tabla anterior. Bloque Total por tratamiento Tratamiento 1 2 3 4 A 3 4 2 6 Y1. = 15 B 7 9 3 10 Y2. = 29 C 4 6 3 7 Y3. = 20 . . . . Total por bloque Y 1 = 14 Y 2 = 19 Y3 = 8 Y 4 = 23 Y.. = 64 b) Calcule las sumas de cuadrados correspondientes: SCTrat, SCB, SCT y SCE SCT = + 42 + … + 72) – (642/12) = 72.6667 SCTrat = ((152 + 292 + 202) / 4) - (642/12) = 25.1667 SCB = (142 + 192 +82 +232) /3) - (642/12) = 42.0000 SCE = 72.6667 – 25.1667 – 42.0000 = 5.5000 c) Obtenga la tabla de análisis de varianza y anote las principales conclusiones. Empleando el SW Minitab se obtiene la siguiente información: (32 Two-way ANOVA: Respuesta versus Tratamiento, Bloque Source DF Tratamiento 2 Bloque 3 Error 6 Total 11 SS MS F P 25.1667 12.5833 13.73 0.006 42.0000 14.0000 15.27 0.003 5.5000 0.9167 72.6667 d) Obtenga la diferencia mínima significativa (LSD) para comparar tratamientos en este diseño en bloques. LSD t 0.025,(31)( 41) 2(0.9167) 2(0.9167) 2.4469 (2.4469)(0.45835) 1.1215 4 4 10. Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación. Número de réplica (día) Marca de 1 2 3 4 5 6 atomizador 1 72 65 67 75 62 73 2 55 59 68 70 53 50 3 64 74 61 58 51 69 a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico. Modelo estadístico: Yij = μ + τi + γj + εij ; i = 1,2,3 y j = 1,2,3,4,5,6 Las hipótesis adecuadas son: Ho: μ1 + μ2 + μ3 = μ Ha: μi ≠ μj para algún i ≠ j Que también se puede expresar como: Ho: τ1 = τ2 = τ3 = 0 Ha: τi ≠ 0 para algún i b) Existe diferencia entre la efectividad promedio de los atomizadores? Empleando el SW Minitab se obtiene la siguiente información: Two-way ANOVA: Respuesta_1 versus Marca Atomizador, Día Source DF SS Marca Atomizador 2 296.33 Día 5 281.33 Error 10 514.33 Total 17 1092.00 MS F P 148.167 2.88 0.103 56.267 1.09 0.421 51.433 De esta tabla se observa que para marca atomizador se obtuvo un valor-p = 0.103 > 0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia entre la efectividad promedio de los atomizadores. c) Hay algún atomizador mejor? Argumente su respuesta. Empleando el SW Minitab se obtiene la siguiente información: Individual 95% CIs For Mean Based on Marca Pooled StDev Atomizador Mean --+---------+---------+---------+------1 69.0000 (----------*----------) 2 59.1667 (----------*---------) 3 62.8333 (----------*----------) --+---------+---------+---------+------54.0 60.0 66.0 72.0 En este caso como los intervalos de confianza se traslapan entonces los atomizadores son estadísticamente iguales en cuanto a sus medias. d) Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta. Individual 95% CIs For Mean Based on Pooled StDev Día Mean --+---------+---------+---------+------1 63.6667 (-----------*----------) 2 66.0000 (-----------*----------) 3 65.3333 (-----------*----------) 4 67.6667 (-----------*----------) 5 55.3333 (----------*-----------) 6 64.0000 (-----------*-----------) --+---------+---------+---------+------48.0 56.0 64.0 72.0 En este caso como los intervalos de confianza se traslapan entonces los resultados de diferentes días en que se realizo el experimento son estadísticamente iguales en cuanto a sus medias. e) Verifique los supuestos de normalidad y de igual varianza entre las marcas. Residual Plots for Respuesta_1 Residuals Versus the Fitted Values 99 10 90 5 Residual Percent Normal Probability Plot of the Residuals 50 10 -10 -5 0 Residual 5 10 50 Histogram of the Residuals 55 60 65 Fitted Value 70 Residuals Versus the Order of the Data 10 4.8 5 3.6 Residual Frequency -5 -10 1 2.4 1.2 0.0 0 0 -5 -10 -10 -5 0 Residual 5 10 2 4 6 8 10 12 14 Observation Order 16 18 En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los residuos y se observa que estos siguen una distribución normal ya que tienden a quedar alineados en una línea recta. En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el supuesto de que los tratamientos tienen igual varianza. 16. Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material solo permite cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que solo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro latino para controlar activamente a los lotes y días. Los datos obtenidos son: Día 1 2 3 4 5 Lote 1 A=8 B=7 D=1 C=7 E=3 Lote 2 C = 11 E=2 A=7 D=3 B=8 Lote 3 B=4 A=9 C = 10 E=1 D=5 Lote 4 D=6 C=8 E=6 B=6 A = 10 Lote 5 E=4 D=2 B=3 A=8 C=8 a) Cómo se aleatorizó el experimento? Se siguió la siguiente estrategia: 1. Se construye el cuadro latino estándar más sencillo. 2. Se aleatoriza el orden de los renglones (o columnas) y después se aleatoriza el orden de las columnas (o renglones). 3. Por último, los tratamientos a comparar se asignan en forma aleatoria a las letras latinas. Así se cumple que cada letra debe aparecer solo una vez en cada renglón y en cada columna. b) Anote la ecuación del modelo y las hipótesis estadísticas correspondientes. Modelo estadístico: Yij = μ + τi + γj + δl + εij ; i = 1,2,3,4,5 j = 1,2,3,4,5, l = 1,2,3,4,5 Las hipótesis adecuadas son: Ho: μ1 + μ2 + μ3 + μ4 + μ5= μ Ha: μi ≠ μj para algún i ≠ j Que también se puede expresar como: Ho: τ1 = τ2 = τ3 = τ4 = τ5 = 0 Ha: τi ≠ 0 para algún i c) Existen diferencias entre los tratamientos? Cuáles tratamientos son diferentes entre si? Analysis of Variance for Y, using Adjusted SS for Tests Source DF Catalizador 4 Lote 4 Día 4 Error 12 Total 24 Seq SS 141.440 15.440 12.240 37.520 206.640 Adj SS AdjMS 141.440 35.360 15.440 3.860 12.240 3.060 37.520 3.127 F P 11.31 0.000 1.23 0.348 0.98 0.455 S = 1.76824 R-Sq = 81.84% R-Sq(adj) = 63.69% De esta tabla se observa que para Catalizador se obtuvo un valor-p = 0.000 < 0.05, por lo tanto se rechaza Ho. Es decir que al menos dos de los catalizadores son diferentes. Interval Plot of Respuesta vs Catalizador 95% CI for the Mean 12 10 Respuesta 8 6 4 2 0 1 2 3 Catalizador 4 5 De tal forma, los intervalos de confianza de los catalizadores 1 y 2 se traslapan por lo que sus respuestas medias son iguales estadísticamente. Los intervalos de confianza de los catalizadores 2 y 3 se traslapan por lo que sus respuestas medias son iguales estadísticamente. Los intervalos de confianza de los catalizadores 4 y 5 se traslapan por lo que sus respuestas medias son iguales estadísticamente. Los intervalos de confianza de los catalizadores 2 y 4 se traslapan por lo que sus respuestas medias son iguales estadísticamente. Los intervalos de confianza de los catalizadores 2 y 5 se traslapan por lo que sus respuestas medias son iguales estadísticamente. Finalmente al no traslaparse los intervalos los catalizadores1 y 2 son diferentes a los catalizadores 4 y 5. De igual forma el análisis se realiza para los 2 bloques. Interval Plot of Respuesta vs Lote 95% CI for the Mean 12 10 Respuesta 8 6 4 2 0 1 2 3 Lote 4 5 De tal forma, los intervalos de confianza de los lotes se traslapan por lo que sus respuestas medias son iguales estadísticamente. Interval Plot of Respuesta vs Día 95% CI for the Mean 10 Respuesta 8 6 4 2 0 1 2 3 Día 4 5 De tal forma, los intervalos de confianza de los días se traslapan por lo que sus respuestas medias son iguales estadísticamente. d) Los factores de ruido, lote y día afectan el tiempo de reacción del proceso? Del ANOVA se observa que para lote se obtuvo un valor-p = 0.348 > 0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un proceso químico de los lotes. Por otro lado, del ANOVA se observa que para días se obtuvo un valor-p = 0.455 > 0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un proceso químico de los días. e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. Cuál tratamiento es el mejor? Sería el tratamiento 5, puesto que tiene la media más baja respecto al tiempo de reacción del proceso. f) Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día a día. Residual Plots for Y Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 2 Residual Percent 90 50 10 1 1 0 -1 -2 -3.0 -1.5 0.0 Residual 1.5 3.0 2 Histogram of the Residuals 10 2 4.5 Residual Frequency 6 8 Fitted Value Residuals Versus the Order of the Data 6.0 3.0 1.5 0.0 4 1 0 -1 -2 -2 -1 0 1 Residual 2 2 4 6 8 10 12 14 16 18 20 22 24 Observation Order En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los residuos y se observa que estos siguen una distribución normal ya que tienden a quedar alineados en una línea recta. En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el supuesto de que los tratamientos tienen igual varianza. 23. Un investigador está interesado en el efecto del porcentaje de lisina y del porcentaje de proteína en la producción de vacas lecheras. Se consideran 7 niveles de cada factor. % de lisina: 0,0 (A), 0,1 (B), 0,2 (C), 0,3 (D), 0,4 (E), 0,5 (F), 0,6 (G), % de proteína: 2 (), 4(β), 6(χ), 8(σ), 10(ε), 12(φ), 14(γ) Para el estudio, se seleccionan siete vacas al azar, a las cuales se les da un seguimiento de siete períodos de tres meses. Los datos en galones de leche fueron los siguientes: Vaca/Período 1 2 3 4 5 1 304 436 350 504 417 2 381 505 425 564 494 3 432 566 479 357 461 4 442 372 536 366 495 5 496 449 493 345 509 6 534 421 352 427 346 7 543 386 435 485 406 a) Analice este experimento, qué factores tienen efecto en leche? Empleando el SW Minitab se obtiene la siguiente información: Analysis of Variance for Respuesta, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS Vaca 6 8754 8588 1431 período 6 1761 1702 284 % lisina 6 38906 40171 6695 % proteina 6 148628 148628 24771 Error 24 24792 24792 1033 Total 48 222841 F 1.39 0.27 6.48 23.98 6 7 519 432 350 413 340 502 425 507 481 380 478 397 554 410 la producción de P 0.261 0.943 0.000 0.000 S = 32.1406 R-Sq = 88.87% R-Sq(adj) = 77.75% Del ANOVA se observa que para VACA se obtuvo un valor-p = 0.261 > 0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia en la producción de leche. Por otro lado, del ANOVA se observa que para PERIODO se obtuvo un valor-p = 0.943 > 0.05, por lo tanto se acepta Ho. De igual forma para el % DE LISINA se obtuvo un valor-p = 0.000 < 0.05, por lo tanto se se rechaza Ho. Es decir si existe diferencia en la producción de leche debida a dicho porcentaje. De igual forma para el % DE PROTEINA se obtuvo un valor-p = 0.000 < 0.05, por lo tanto se se rechaza Ho. Es decir si existe diferencia en la producción de leche debida a dicho porcentaje. b) Interprete los resultados usando gráficos de medias. Interval Plot of Respuesta vs Vaca 95% CI for the Mean 525 500 Respuesta 475 450 425 400 375 350 1 2 3 4 Vaca 5 6 7 De tal forma, los intervalos de confianza de las vacas se traslapan por lo que sus respuestas medias son iguales estadísticamente. Interval Plot of Respuesta vs período 95% CI for the Mean 550 Respuesta 500 450 400 350 1 2 3 4 período 5 6 7 De tal forma, los intervalos de confianza de los períodos se traslapan por lo que sus respuestas medias son iguales estadísticamente. Interval Plot of Respuesta vs % lisina 95% CI for the Mean 550 Respuesta 500 450 400 350 300 1 2 3 4 % lisina 5 6 7 De tal forma, los intervalos de confianza de los % de lisina se traslapan por lo que sus respuestas medias son iguales estadísticamente. Interval Plot of Respuesta vs % proteina 95% CI for the Mean 600 550 Respuesta 500 450 400 350 300 1 2 3 4 % proteina 5 6 7 De tal forma, los intervalos de confianza de los % de proteína no se traslapan por lo que sus respuestas medias no son iguales estadísticamente. c) Cómo puede explicar la falta de efectos en vacas y período? El diseño pretendía verificar el efecto del porcentaje de lisina y del porcentaje de proteína en la producción de vacas lecheras por lo que se bloquearon los aspectos relacionados a las vacas y al período. d) Que porcentajes de lisina y proteína dan los mejores resultados? De las gráficas anteriores, % de lisina que brinda los mejores resultados es: 0,4 (E). Respecto del % de proteínas, el mejor es: 14(γ). e) Verifique los supuestos del modelo. Residual Plots for Respuesta Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 50 Residual Percent 90 50 10 1 -50 -25 0 Residual 25 -25 50 300 400 500 Fitted Value 600 Residuals Versus the Order of the Data 50 12 9 Residual Frequency 0 -50 Histogram of the Residuals 6 3 0 25 25 0 -25 -50 -60 -30 0 Residual 30 60 1 5 10 15 20 25 30 35 Observation Order 40 45 En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los residuos y se observa que estos siguen una distribución normal ya que tienden a quedar alineados en una línea recta. En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el supuesto de que los tratamientos tienen igual varianza.