CAPITULO 6 DISEÑOS FACTORIALES 2K 6.1 Generalidades Los diseños factoriales 2K son una clase especial de los diseños factoriales en los que se tienen k factores de interés a dos niveles cada uno. Son especialmente útiles en las etapas iniciales de la investigación para determinar, de un gran número de factores candidatos, cuales son los que realmente influyen sobre la variable respuesta. Se llaman diseños factoriales 2k porque se quiere investigar la forma como influyen k factores sobre una variable respuesta y en cada factor se consideran dos niveles solamente. La réplica completa de un diseño de este tipo requiere 2 x 2 x… x 2 = 2k observaciones y recibe el nombre de diseño factorial 2k. El diseño 2k son muy útiles en las primeras etapas del trabajo experimental, cuando se investiguen muchos factores pero, probablemente todos ellos no influyen realmente sobre la variable respuesta. Esto diseño proporciona el número más pequeño de corridas para estudiar simultáneamente k factores en un diseño factorial completo. Dado que sólo existen dos niveles para cada factor, es necesario suponer que la respuesta es aproximadamente lineal sobre el rango de los niveles seleccionados para el factor. Así, este tipo de diseño experimental es la forma más económica de estudiar el efecto combinado de k factores. Los niveles de cada factor pueden ser cualitativos o cuantitativos y se denotan como Alto y Bajo o mas (+) y menos (-). A continuación se enumeran algunas de las razones por las cuales se estudian los diseños factoriales 2k por separado: • Es la forma más económica y barata de estudiar el efecto de k factores de interés sobre una variable respuesta. • Existen procedimientos especiales que simplifican los cálculos matemáticos en los diseños 2k • Los diseños 2k se pueden fraccionar. Esta característica permite correr solo una fracción (la mitad, la cuarta parte, etc) del diseño completo y responder algunas inquietudes del fenómeno que se estudia. • Constituyen la base de otros diseños más complejos que se verán más adelante en el curso. • El modelo de regresión lineal para un diseño 2k es muy fácil de obtener a partir del ANOVA. Esto se verá detalladamente más adelante. 6.1.1 Definiciones y diseño 22 Es el tipo más sencillo de diseño experimental 2k. En este diseño se tienen dos factores A y B, cada uno con dos niveles. Lo usual es considerar estos niveles como los niveles bajo y alto del factor. El diseño 22 se suele representar por un cuadrado como el que se ilustra en la Figura 6.1 b ab Alto (+) Bajo (-) (1) Bajo (-) a Alto (+) Figura 6.1 Representación geométrica del diseño 22 A esta representación se le conoce como representación geométrica del diseño 22. Es esta representación, cada vértice del cuadrado corresponde a una combinación diferente de tratamientos (niveles) en el diseño factorial. En la Figura 6.1 se aprecia una notación especial para etiquetar las combinaciones de tratamiento en el diseño 22. Esta notación de letras minúsculas se utiliza, en general, para todos los diseños 2k y se conoce como notación de Yates. Si una letra está presente, el factor correspondiente se corre con el nivel alto en dicha combinación de tratamiento; si está ausente, el factor se corre con su nivel bajo. Por ejemplo, la combinación de tratamiento a indica que el factor A está en el nivel alto, y el factor B en el nivel bajo. La combinación de tratamiento donde ambos factores tienen el nivel bajo está representado por (1). Esta notación se emplea en todas las series de diseños 2k. Por ejemplo, la combinación de tratamiento en un diseño 24 con A y C en el nivel alto, y B y D en el nivel bajo, se denota por ac. Los efectos de interés en el diseño 22 son los efectos principales A y B, y la interacción entre los dos factores AB. Si suponemos que las letras (1), a, b y ab representan los totales de todas las n observaciones tomadas en los puntos de diseño, es sencillo estimar los efectos de estos factores. Para estimar el efecto principal de A, se promedian las observaciones del lado derecho del cuadrado de la Figura 6.1, donde A tiene el nivel alto, y se resta de éste el promedio de las observaciones que están en el lado izquierdo del cuadrado, donde A tiene el nivel bajo, o A = y A+ − y A− = a + ab b + (1) 1 − = [a + ab − b − (1)] 2n 2n 2n (6-1) De igual forma, el efecto principal de B se obtiene al promediar las observaciones de la parte superior del cuadrado, donde B tiene el nivel alto, y se resta de éste el promedio de las observaciones que están en la parte inferior del cuadrado, donde B tiene el nivel bajo: B = y B+ − y B− = b + ab a + (1) 1 − = [b + ab − a − (1)] 2n 2n 2n (6-2) Finalmente, la interacción AB se estima tomando la diferencia en los promedios de la diagonal de la Figura 6.1, o AB = ab + (1) a + b) 1 = − [ab + (1) − a − b] 2n 2n 2n (6-3) Debido a que la cantidad dentro de corchetes cuadrados en las ecuaciones (6-1), (6-2) y (6-3) aparece con frecuencia en los diseños 22, resulta conveniente hacer las siguientes definiciones: Contraste A = [a + ab − b − (1)] (6-4) ContrasteB = [b + ab − a − (1)] (6-5) Contraste AB = [ab + (1) − a − b] (6-6) La manera practica de calcular los contrastes de cualquier efecto (principal o de interacción) es a partir de la tabla de signos. Esta tabla, para el diseño 22 se muestra a continuación: A B AB Notación de Yates - - + (1) + - - a - + + b + + - ab Tabla 6.1 Tabla de signos para el diseño 22 y notación de Yates Observe que la tabla de signos (Tabla 6.1) que la interacción AB se obtiene multiplicando la columna con los signos de A por la columna con los signos de B y, el resultado son los signos del contraste AB [ver ecuación (6-6)]. Para generar un contraste a partir de esta tabla, se multiplican los signos de la columna apropiada de la Tabla 6.1 por las combinaciones de tratamientos que aparecen en la columna de notación de Yates, y luego se suma. Por ejemplo, contrasteAB = [(1)] + [-a] + [-b] = ab + (1) – a – b. Los contrastes se emplean en el cálculo de las estimaciones de los efectos y en las sumas de cuadrados de A, B y la interacción AB. Las fórmulas para las sumas de cuadrados son SC A 2 2 [ a + ab − b − (1)] [ Contraste A ] = = (6-7) [b + ab − a − (1)]2 = [ContrasteB ]2 (6-8) SC B = 4n SC AB = 4n 4n 4n [ab + (1) − a − b]2 = [ContrasteAB ]2 4n 4n (6-9) Para los diseños 22, tal vez no se ve muy útil la tabla de signos. Sin embargo, en la medida que aumenta la cantidad de factores en el diseño 2k, la utilidad de la tabla de signos se hace más evidente. El Análisis de Varianza para el diseño 22 se completa con la suma de cuadrados totales: 2 2 n SCT = ∑∑∑ yijk2 − i =1 j =1 k =1 y•2•• 4n Y la suma de cuadrados de los errores que se obtiene por diferencia: (6-10) SCE = SCT − SC AB − SC A − SCB (6-11) El ANOVA completo para el diseño 22 se muestra en la Tabla 6.2 a continuación: Fuente de Variación Factor A Factor B Interacción AB Grados de Suma de Cuadrados libertad Media de F0 cuadrados Valor P SC A = [a + ab − b − (1)]2 = [Contraste A ]2 1 MC A = SC A 1 F0 = MC A MC E Probabilidad SC B = [b + ab − a − (1)]2 = [ContrasteB ]2 1 MC B = SC B 1 F0 = MC B MC E Probabilidad SC AB = [ab + (1) − a − b]2 = [Contraste AB ]2 1 MC AB = SC AB 1 F0 = MC AB MC E Probabilidad MC E = 4n 4n 4n 4n 4n 4n Error SCE = SCT − SC AB − SC A − SCB 4(n-1) Total y•2•• SCT = ∑∑∑ y − 4n i =1 j =1 k =1 4n-1 2 2 SC E 4(n − 1) n 2 ijk Tabla 6.2 Tabla ANOVA para un diseño factorial 22 6.1.2 Diseño 23 En los diseños factoriales 23 se tienen tres factores de interés A, B y C a dos niveles cada uno. Las ocho corridas o tratamientos del diseño 23 se pueden representar geométricamente como un cubo similar al que se muestra en la figura siguiente: bc abc c Alto + ac Factor C b ab Alto + Factor B Bajo − Bajo − a (1) − Bajo Factor A + Alto Figura 6.2 Representación geométrica del diseño 23 Cada arista del cubo corresponde a una corrida o combinación de tratamientos diferente. En la Figura 6.2 también se puede apreciar la notación de Yates para los diseños 23, en esta notación las ocho corridas se representan por (1), a, b, ab, c, ac, bc y abc. Al igual que el los diseños 22, el efecto principal A puede estimarse promediando las cuatro combinaciones de tratamiento de la cara derecha del cubo, donde el nivel A es alto, y después restando de esta cantidad el promedio de las cuatro combinaciones de tratamientos que están en la cara izquierda del cubo, donde A tiene el nivel bajo. Al hacer esto se tiene: A = y A+ − y A− a + ab + ac + abc (1) + b + c + bc − 4n 4n 1 [a + ab + ac + abc − (1) − b − c − bc] = 4n = (6-12) De manera similar, el efecto de B se puede determinar como la diferencia en promedios entre las cuatro combinaciones de tratamientos de la cara posterior del cubo (Figura 6.2) y las cuatro combinaciones de la cara anterior. Con esto se tiene que B = y B+ − y B− = 1 [b + ab + bc + abc − (1) − a − c − ac] 4n (6-13) El efecto de C es la diferencia en la respuesta promedio entre las cuatro combinaciones de tratamientos de la cara superior del cubo (Figura 6.2) y las cuatro de la cara inferior, esto es, C = y C+ − y C− = 1 [c + ac + bc + abc − (1) − a − b − ab] 4n (6-14) Los efectos de interacción también se pueden obtener con facilidad. La interacción entre A y B se puede obtener como la diferencia entre los promedios de los efectos de A en los dos niveles de B. Es decir: Efecto de A promedio B alto (+) EfectoAPara B + = B bajo (-) EfectoAPara B − = [(abc − bc ) + (ab − b )] 2n {(ac − c ) + [a − (1)]} 2n Luego la interacción entre A y B es: AB = EfectoAPara B + − EfectoAPara B − [abc − bc + ab − b − ac + c − a + (1)] = 2 4n (6-15) De manera analoga se pueden obtener la interacción AC y BC AC = EfectoAPara C + − EfectoAPara C − [(1) − a + b − ab + c − ac + bc − abc ] = 2 4n (6-16) BC = EfectoBPara C + − EfectoBPara C − [(1) + a − b − ab − c − ac + bc + abc ] = 2 4n (6-17) En la Figura 6.3 se ilustra gráficamente los terminos involucrados en el cálculo de los efectos principales y de interacción en un diseño factorial 23. bc c ac −b + abc ac + b ab ab − a (1) a (1) abc + c ac −b ab a (1) bc bc abc c Efectos principales A, B y C bc bc bc abc abc c + (1) − ac b c ac + − b ab a + abc ac − b ab (1) a (1) + c ab a Interacciones de dos factores: AB, AC y BC bc c ac b (1) abc Corridas − Corridas + ab a Interacción de tres factores Figura 6.3 Calculo de los efectos principales y de interacción en un diseño 23 La Figura 6.3 muestra los vértices del cubo (tratamientos) que deben ir positivos y/o negativos para el cálculo de cada efecto. Estos signos concuerdan con los obtenidos anteriormente en las ecuaciones de la (6-12) a la (6-17) y los que se verán más adelante en la tabla de signos que se verá más adelante (Tabla 6.4). Finalmente, la interacción ABC se obtiene como: ABC= [abc-bc -ac+c-ab+b+a-(1)] 4n (6-18) A pesar de que para los diseños factoriales 22 y 23 se puede representar geométricamente en un cuadrado y un cubo respectivamente, el cálculo de los contrastes y de los efectos se puede obtener más fácilmente a partir de la tabla de signos mostrada a continuación: Tratamiento 1 2 3 4 5 6 7 8 Yates (1) a b ab c ac bc abc A + + + + B C AB AC BC ABC - - + + + - - + + + - + + + - + - + + + + - + + + + + + + + + + - Tabla 6.3 Tabla de signos para el diseño 23 y notación de Yates En la tabla de signos (Tabla 6.4) se puede obtener con facilidad los signos para los contrastes de interacción, multiplicando las columnas adecuadas de los efectos principales. Así, por ejemplo, la columna con los signos de interacción AC se puede obtener multiplicando la columna de A con la columna C renglón a renglón. Y el contraste AC, resulta simplemente de multiplicar la columna de Yates en la Tabla 6.4 por la columna de signos AC: Contraste AC = [(1) − a + b − ab + c − ac + bc − abc ] (6-19) La suma de cuadrados y efectos para la construcción del ANOVA se pueden obtener a partir de las formulas: Efecto = SC = Contraste 4n (Contraste)2 8n (6-20) (6-21) 6.1.3 Diseño 2k Después de tratar los diseños 22 y 23 con cierto detalle, nos proponemos a explicar el caso general de los diseños 2k. En estos diseños, tenemos k factores de interés. La tabla de signos (para k ≤ 6) se muestra a continuación: Tratamiento Yates 1 (1) 2 a 3 b 4 ab 5 c 6 ac 7 bc 8 abc 9 d 10 ad 11 bd 12 abd 13 cd 14 acd 15 bcd 16 abcd 17 e 18 ae 19 be 20 abe 21 ce 22 ace 23 bce 24 abce 25 de 26 ade 27 bde 28 abde 29 cde 30 acde 31 bcde 32 abcde A + + + + + + + + + + + + + + + + B + + + + + + + + + + + + + + + + C + + + + + + + + + + + + + + + + D + + + + + + + + + + + + + + + + E + + + + + + + + + + + + + + + + F - Tratamiento 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 Yates f af bf abf cf acf bcf abcf df adf bdf abdf cdf acdf bcdf abcdf ef aef bef abef cef acef bcef abcef def adef bdef abdef cdef acdef bcdef abcdef A + + + + + + + + + + + + + + + + B + + + + + + + + + + + + + + + + C + + + + + + + + + + + + + + + + D + + + + + + + + + + + + + + + + E + + + + + + + + + + + + + + + + Tabla 6.4 Tabla de signos para el diseño 2k k≤ 6 y notación de Yates En la tabla de signos (Tabla 6.4 ) muestra un patrón de construcción bien definido: la columna del primer factor, A inicia alternando los signos más (+) y menos (-) iniciando con el signo menos; la segunda columna alterna dos signos menos con dos signos más, iniciando con dos signos menos; la tercera columna (la de C) alterna 4 signos menos con 4 signos más iniciando con 4 signos menos, y así sucesivamente. En general, el procedimiento para hallar un contraste es el mismo que se empleo para los diseños 22 y 23. Por ejemplo, si se tienen 4 factores de interés en un diseño 24 se toman las 6 primeras columnas de la Tabla 6.4 para obtener la siguiente tabla: F + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Tratamiento 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Yates (1) a b ab c ac bc abc d ad bd abd cd acd bcd abcd A + + + + + + + + B + + + + + + + + C + + + + + + + + D AB + + + + + + + + + + + + + + + + Tabla 6.5 Tabla de signos para el diseño 24 Si se desea el contraste AB, simplemente se multiplican los signos de la columna A por los signos de la B renglón a renglón y posteriormente el resultado de esta columna se multiplica por la columna de Yates. El resultado final es el siguiente: Contraste AB = [(1) − a − b + ab + c − ac − bc + abc (6-22) + d − ad − bd + abd + cd − acd − bcd + abcd ] De la misma forma se pueden obtener los demás contrastes para el cálculo de efectos [Ecuación (6-23)] y la suma de cuadrados [Ecuación (6-24)] para el Análisis de Varianza. Efecto = SC = Contraste n 2 k −1 (Contraste )2 n2 k (6-23) (6-24) 6.1.4 Modelo de Superficie de Respuesta para un diseño 2k Un aspecto interesante de los diseños factoriales 2k es que si se codifican las variables al intervalo [-1,1] entonces, se puede obtener el modelo de regresión correspondiente con relativa facilidad. Consideremos por ejemplo el diseño 22. En este diseño se tienen dos efectos principales, A y B y la interacción AB. El modelo de regresión correspondiste es: y = β 0 + β1 x1 + β 2 x2 + β12 x1 x2 (6-25) Donde x1 representa el factor A, x2 representa el factor B, y el producto entre x1 y x2 representa la interacción entre A y B. Los parámetros del modelo de regresión, β 1, β 2, β 12 se pueden demostrar que son iguales a la mitad de las estimaciones de los efectos correspondientes, mientras que β 0 es igual a la gran media. En general, se tiene que: Cualquier Parámetro en el modelo de Regresión = Efecto en ANOVA 2 (6-26) Y β 0 = gran promedio = promedio de todas las observaciones (6-27) Se debe recordar que los valores de las variables en el modelo de regresión están codificadas al intervalo [-1, 1]. Esto quiere decir que si se quiere expresar el modelo en las unidades en las que realmente se mide la variable se debe hacer la transformación correspondiste. Esta transformación se ilustra en la figura siguiente: Factor en escala normalizada +1 Bajo Factor en Alto escala real -1 Figura 6.4 Transformación usada para encontrar el modelo de regresión en un diseño 2k Esto nos lleva a la ecuación de transformación: xcod . = 2 x real − Bajo − Alto Alto − Bajo (6-28) La cual se puede utilizar para obtener el modelo de regresión en las unidades originales en las que se miden los factores de interés. Esto transforma la ecuación (6-25) en el modelo: 2 x A − ABajo − AAlto y = β 0 + β1 AAlto − ABajo 2 x A − ABajo − AAlto + β12 AAlto − ABajo 2 x − BBajo − B Alto + β2 B B −B Alto Bajo 2 x B − BBajo − B Alto B − B Alto Bajo + (6-29) Sin embargo, siempre se prefiere trabajar el modelo con las variables codificadas (en el intervalo [-1,1]) Si los factores son cuantitativos, el modelo de regresión, se puede utilizar, con toda confianza, para predecir el valor de la variable respuesta para cualquier punto entre -1 y 1 (si el factor o variable está codificado) o desde el valor bajo al alto si la variable o factor no está codificado. Es decir, el modelo de regresión se puede utilizar para interpolar cualquier valor intermedio de la variable respuesta sin problemas pero no se debe utilizar para extrapolar. 6.1.5 Proyección de diseños factoriales 2k Cualquier diseño 2k se contrae o se proyecta sobre cualquier otro diseño 2k con menos variables si se omiten uno o más de los factores originales. En ocasiones, esto puede proporcionar un conocimiento adicional de los demás factores. Si algún factor en un diseño factorial 2k no es significativo y todas sus interacciones son despreciables, entonces puede descartarse del experimento convirtiendo el diseño en un diseño 2K−1. En este caso se dice que el diseño 2k se ha proyectado en un diseño 2k−1 con el doble de réplicas denominadas réplicas ocultas. En general, si se tiene una sola réplica en un diseño 2K y si h (h<k) factores son insignificantes y pueden descartarse, entonces los datos originales corresponden a un diseño factorial completo con dos niveles en los h−k factores restantes con 2h réplicas La figura siguiente ilustra la proyección de un diseño 24 en uno 23 − Factor insignificante D + Figura 6.5 Proyección de un diseño 24 a un diseño 23 6.1.6 El algoritmo de Yates Este procedimiento fue propuesto por Yates para obtener, de una manera sencilla, la tabla de ANOVA para un diseño factorial 2k. Este procedimiento es una alternativa a la tabla de signos propuesta anteriormente. Para utilizar el algoritmo de Yates, primero se construye una tabla con las combinaciones de tratamientos y los correspondientes totales de tratamiento, en un orden estándar. Por orden estándar se entiende que cada factor se introduce uno a la vez combinándolo con todos los niveles de los factores que están por encima de él. Es así como el orden estándar de un diseño 22 es (1), a, b, ab, mientras que para un diseño 23 es (1), a, b, ab, c, ac, bc, abc, y para un diseño 24 es (1), a, b, ab, c, ac, bc, abc, d, ad, bd, abd, cd, acd, bcd, abad. Aquí se presenta el procedimiento siguiente de cuatro pasos: 1. Se etiqueta la columna adyacente (1). Las entradas en la mitad superior de esta columna se calculan sumando las respuestas en pares adyacentes de la columna anterior. Las entradas de la parte inferior de esta columna se calcula cambiando el signo de la primera entrada de cada par de las respuestas originales y luego sumando los pares adyacentes. 2. Se etiqueta la columna adyacente (2). La columna (2) se construye con las entradas de la columna (1), siguiendo el mismo procedimiento utilizado para generar la columna (1). El proceso continúa hasta que se han construido k columnas. La columna (k) contiene los contrastes designados en los renglones. 3. Se calcula la suma de cuadrados para los efectos elevando al cuadrado cada entrada de la columna k y dividiéndolo entre n2k. 4. Se calcula las estimaciones de los efectos dividiendo cada entrada de la columna k entre n2k-1. 6.1.7 Diseño 2k sin réplica A medida que crece el número de factores de un experimento factorial, el número de efectos que pueden estimarse también aumenta. Por ejemplo, un experimento 24 tiene cuatro efectos principales, 6 interacciones entre dos factores, 4 interacciones entre tres factores y una interacción entre cuatro factores, mientras que un experimento 26 tiene 6 efectos principales, 15 interacciones entre dos factores, 20 interacciones entre tres factores, 15 interacciones entre cuatro factores, 6 interacciones entre cinco factores y una intersección entre 6 factores. En muchas situaciones se aplica el principio de dispersión de los efectos; esto es, usualmente el sistema está dominado por los efectos principales y las interacciones de orden inferior. En general, las interacciones entre tres factores y las de orden superior son despreciables. Por consiguiente, cuando el número de factores es moderadamente grande (por ejemplo, k ≥ 4 o 5), una práctica común es correr sólo una réplica del diseño 2k y luego combinar las interacciones de orden superior como una estimación del error. En ocasiones, una única réplica de un diseño 2k se conoce como diseño factorial 2k sin réplica. Cuando se analizan datos que provienen de diseños factoriales sin réplica, en ocasiones se presentan interacciones reales de orden superior. En estos casos resulta inapropiado utilizar la media de cuadrados del error obtenida al combinar las interacciones de orden superior. Para resolver este problema puede emplearse un método de análisis más sencillo. Para ello se construye una gráfica de las estimaciones de los efectos sobre una escala de probabilidad normal. Los efectos que son despreciables tienen una distribución normal, con media cero y varianza σ2, y tienden a caer a lo largo de una línea recta sobre esta gráfica, mientras que los efectos significativos tienen medias distintas de cero y no se alinean a los largo de la línea recta. 6.2 Adición de puntos centrales en un diseño 2k Un aspecto muy importante en el empleo de diseños factoriales de dos niveles es la hipótesis de linealidad en los efectos de los factores. Claro está que la linealidad perfecta es innecesaria, y el sistema 2k trabaja muy bien aun cuando la suposición de linealidad es sólo aproximada. Sin embargo, existe un método para replicar ciertos puntos en el diseño 2k factorial que proporciona protección contra la curvatura y permite una estimación independiente del error que ha de obtenerse. El método consiste en añadir puntos centrales al diseño 2k. Éstos coinciden de nC réplicas de las corridas en el punto xi = 0 (i= 1, 2,…, k). Una razón importante para añadir réplicas de las corridas en el centro del diseño es que los puntos centrales no tienen impacto en las estimaciones usuales de los efectos en un diseño 2k. Se supone que los k factores son cuantitativos. ab b Alto (+) Corrida Central Medio Bajo (-) (1) Bajo (-) Medio a Alto (+) Figura 6.6 Representación geométrica del diseño 22 con corridas centrales o puntos centrales Para ilustrar este enfoque, considérese un diseño 22 con una observación en cada uno de los puntos factoriales (-, -), (+, -), (-, +) y (+, +), y nC observaciones en los puntos centrales (0, 0). La Figura 6.6 ilustra esta situación. Sean y F y y C los promedios de las cuatro corridas en los cuatro puntos factoriales y el promedio de las nC corridas en el punto central, respectivamente. Si la diferencia y F - y C es pequeña, entonces los puntos centrales se encuentran sobre el plano que pasa por todos los puntos factoriales, o cerca de él, y no hay curvatura. Por otra parte, si y F - y C es grande, entonces la curvatura está presente. Una suma de cuadrados de un grado de libertad para la curvatura está dada por: SS Curvatura n n (y − y C ) = F C F nF + nC 2 (6-30) donde, en general, nF es el número de puntos en el diseño factorial. Esta cantidad puede ser comparada con el error cuadrático medio para probar la curvatura. De manera más específica, cuando se añaden puntos al centro del diseño 2k, entonces el modelo que se considera es k k Y = β 0 + ∑ β j x j + ∑∑ β ij xi x j + ∑ β jj x 2 + ε j =1 i< j i< j (6-31) j =1 donde las βjj son efectos cuadráticos puros. La prueba de curvatura consiste, en realidad, de la prueba de las hipótesis k H 0 : ∑ β jj = 0 j =1 k (6-32) H 1 : ∑ β jj ≠ 0 j =1 Por otra parte, si los puntos factoriales en el diseño no están replicados, entonces pueden emplearse los nC puntos centrales para construir una estimación del error con nC -1 grados de libertad. 6.3 Formación de bloques y confusión en diseños 2k A menudo es imposible correr todas las observaciones en un diseño factorial 2k bajo condiciones homogéneas. La técnica de diseño apropiada para esta situación general es la formación de bloques. Sin embargo, en muchas situaciones, el tamaño del bloque es más pequeño que el número de corridas en la réplica completa. En estos casos, la confusión es un procedimiento útil para correr el diseño 2k en bloques 2p, donde el número de corridas en un bloque es menor que el número de combinaciones de tratamientos en una réplica completa. La técnica provoca que ciertos efectos de interacción sean indistinguibles de los bloques, o que sean confundidos con bloques. A continuación se ilustra la confusión en el diseño factorial 2k en bloques 2p, con p < k. Considérese un diseño 22. Supóngase que cada una de las 22 = 4 combinaciones de tratamientos requiere cuatro horas de análisis de laboratorio. Por tanto, se requieren dos días para efectuar el experimento. Si los días se consideran como bloques, entonces deben asignarse dos de las cuatro combinaciones de tratamientos a cada día. Tratamiento (1) a b ab A + + B AB - + - + + + Contraste AB = [(1) − a − b + ab ] b ab Corridas Bloque 1 (1) ab a b Bloque 1 Bloque 2 Corridas Bloque 2 (1) a Figura 6.7 Formación de bloques en un diseño 22 Este diseño se muestra en la Figura 6.7. Nótese que el bloque 1 contiene las combinaciones de tratamientos (1) y ab, y que el bloque 2 contiene a a y b. Los contrastes para estimar los efectos principales de los factores A y B son ContrasteA = ab + a – b – (1) ContrasteB = ab + a – b – (1) Observe que estos contrastes no se ven afectados por la formación de bloques puesto que en cada uno de ellos existe sólo una combinación de tratamientos más y una menos de cada uno de los bloques. Esto es, cualquier diferencia entre el bloque 1 y el bloque 2 que aumente las lecturas en un bloque por una constante aditiva, será cancelada. El contraste para la interacción AB es ContrasteAB = ab + (1) – a – b Puesto que las dos combinaciones de tratamientos con los signos más, ab y (1), están en el bloque 1 y las dos con los signos menos, a y b, están en el bloque 2, los efectos del bloque y la interacción AB son idénticos. Esto es, la interacción AB queda confundida con bloques. La razón de esto es evidente en la tabla de signos más y menos del diseño 22 que aparece en la Figura 6.7. De ésta se observa que todas las combinaciones de tratamientos que tienen un signo más en AB están asignadas al bloque 1, mientras que todas las combinaciones de tratamientos que tienen un signo menos en AB están asignadas al bloque 2. Este esquema puede emplearse para confundir cualquier diseño 2k en dos bloques. Como segundo ejemplo considérese un diseño 23, efectuado en dos bloques. De la tabla de signos más y menos (Figura 6.8), se asignan las combinaciones de tratamientos que son menos en la columna ABC al bloque 1, y las que son más en la columna ABC al bloque 2. El diseño resultante se muestra en la Figura 6.8. Combinación de Tratamientos (1) a b ab c ac bc abc I + + + + + + + + A + + + + Efectos Factoriales B AB C AC BC ABC - + - + + - - - - + + + - - + + + + - - + + + - - + + + - + - + + + + + + + Contraste ABC = [− (1) + a + b − ab + c − ac − bc + abc ] bc abc Corridas – (Bloque 1) c ac Corridas + (Bloque 2) b ab (1) (1) ab ac bc a b c abc Bloque 1 Bloque 2 a Figura 6.8 Formación de bloques en un diseño 22 En general, lo que se busca es que el efecto de bloque se confunda con las interacciones de orden superior. La Figura 6.8 se observa que el efecto de bloque se confunde con el efecto de interacción ABC. El cual, por el principio de los efectos esparcidos se puede asumir despreciable. Sin embargo, si la interacción entre los tres factores llega a ser significativa entonces no podremos saber si realmente se debe a la interacción a al efecto de bloque. Existe un método más general para construir bloques. Ésta utiliza un contraste de definición, por ejemplo, L= α1x1 + α2x2 +… + αkxk donde xi es el nivel del i-ésimo factor que aparece en una combinación de tratamientos y αi es el exponente que aparece sobre el i-ésimo factor en el efecto que va a confundirse con bloques. Para el sistema 2k, se tiene que αi = 0 o 1, y xi = 0 (nivel bajo) o xi = 1 (nivel alto). Las combinaciones de tratamientos que producen el mismo valor de L (mód. 2) son colocadas en el mismo bloque, Puesto que los únicos valores posibles de L (mód. 2) son 0 y 1, esto asigna las combinaciones de tratamientos 2k exactamente en dos bloques. Como ejemplo, considérese el diseño 23 con ABC confundido con bloques. En este caso, xi corresponde a A, x2 a B, x3 a C, con α1 = α2 = α3 = 1. Por tanto, el contraste de definición que se utilizará para confundir ABC con bloques es L = x1 + x2 + x3 Para asignar las combinaciones de tratamientos a los bloques, se sustituyen éstas en el contraste de definición, de la manera siguiente: (1): L = 1(0) + 1(0) + 1(0) = 0 = 0 (mód 2) a: L = 1(1) + 1(0) + 1(0) = 1 = 1 (mód 2) b: L = 1(0) + 1(1) + 1(0) = 1 = 1 (mód 2) ab: L = 1(1) + 1(1) + 1(0) = 2 = 0 (mód 2) c: L = 1(0) + 1(0) + 1(1) = 1 = 1 (mód 2) ac: L = 1(1) + 1(0) + 1(1) = 2 = 0 (mód 2) bc: L = 1(0) + 1(1) + 1(1) = 2 = 0 (mód 2) Es así como (1), ab, ac, y bc se corren en el bloque 1, y a, b, c y abc se corren en el bloque 2. Este mismo diseño se muestra en la figura 12-32. Existe un útil método corto para construir estos diseños. El bloque que contiene la combinación de tratamientos (1) recibe el nombre de bloque principal. Cualquier elemento [con excepción de (1)] en el bloque principal puede generarse haciendo la multiplicación módulo 2 de los exponentes de cualquier par de elementos del bloque principal. Por ejemplo, considérese el bloque principal del diseño 23 con ABC confundido, el cual se muestra en la figura 12-32. Nótese que ab · ac = a2bc = bc ab · bc = ab2c = ac ab · bc = abc2 = ab Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse al hacer la multiplicación módulo 2 de los exponentes de un elemento del bloque nuevo por cada elemento del bloque principal. Para el diseño 23 con ABC confundido, puesto que el bloque principal es (1), ab, ac y bc, se sabe que la combinación de tratamientos b está en el otro bloque. Por tanto, los elementos de este segundo bloque son b · (1) =b b · ab = ab2 = a b · ac = abc 2 b · bc = b c = c 6.4 Diseños 2k fraccionados A medida que aumenta el número de factores en un diseño factorial 2k, el número de corridas requeridas se aumenta con rapidez. Por ejemplo, un diseño 25 requiere 32 corridas. En este diseño, sólo cinco grados de libertad corresponden a los efectos principales, y 10 a las interacciones entre dos factores. Dieciséis de los 31 grados de libertad se utilizan para estimar interacciones de orden superior –esto es, interacciones entre tres factores y de orden superior-. A menudo existe poco interés en estas interacciones de orden superior, en particular cuando se comienza a estudiar por primera vez un proceso o sistema. Si es posible suponer que ciertas interacciones de orden superior son despreciables, entonces puede emplearse un diseño factorial fraccionaria con menos corridas que el conjunto completo de corridas 2 k, para obtener información sobre los efectos principales y las interacciones de orden inferior. Aquí se presentan las réplicas fraccionarias del diseño 2k. Uno de los principales usos de los diseños fraccionarios se encuentran en experimentos de detección. Éstos son experimentos en los que se consideran muchos factores con la finalidad de identificar aquellos (si es que los hay) que tienen efectos grandes Normalmente los experimentos de detección se realizan en las primeras etapas de un proyecto, cuando es probable que muchos de los factores considerados al inicio tengan poco o ningún efecto sobre la respuesta. Los factores identificados como importantes son los que se investigan con más profundidad en experimentos subsecuentes. 6.4.1 Fracción un medio de un diseño 2k La fracción un medio del diseño 2k-1 corridas y a menudo se conoce como diseño factorial fraccionario 2k-1. Como ejemplo considérese el diseño 23-1, la fracción un medio del diseño 23. Este diseño tiene sólo cuatro corridas, en contraste con el diseño completo que requiere ocho. Combinación de Tratamientos a b c abc ab ac bc (1) I + + + + + + + + A + − − + + + − − Efectos Factoriales B C AB AC BC ABC − − − − + + + − − + − + − + + − − + + + + + + + + − + − − − − + − + − − + + − − + − − − + + + − 3 bc abc c Fracción principal, I=ABC ac Fracción alterna, I= −ABC b ab (1) Figura 6.9 Diseño factorial 2 fraccionado a la mitad. a Relación de definición del diseño La Figura 6.9 presenta la tabla de signos más y menos para el diseño 23 fraccionado. Supóngase que se escogen las cuatro combinaciones de tratamientos a, b, c y abc como la fracción un medio. Estas combinaciones aparecen en la parte superior de la Figura 6.9 en color azul claro. Observe que la combinación de tratamientos escogida para esta fracción tiene signo mas para la interacción ABC, por lo tanto, el efecto ABC se conoce como generador de la fracción. Además, debido a que el signo es el mismo para la interacción ABC, esta interacción es indetectable usando esta fracción. Además observe que la combinación de signos utilizada para encontrar el efecto de cualquier factor principal se repite en una interacción doble. Para encontrar los efectos principales se usa: A = ½ [a – b – c + abc] B = ½ [-a + b – c + abc] C = ½ [-a – b + c + abc] Los cuales se repiten en el cálculo de las interacciones dobles: BC = ½ [a – b – c + abc] AC = ½ [-a + b – c + abc] AB = ½ [-a – b + c + abc] Estos resultados se aprecian en la Figura 6.9, donde se colocan con un recuadro del mismo color las parejas de efectos que son iguales. Por tanto, la combinación lineal de las observaciones en la columna A de la Figura 6.9 no solo estima el efecto principal de A sino la interacción BC. O mejor dicho, esta combinación estima la suma de los efectos A+BC. De la misma forma, la columna correspondiente a B no solo estima este efecto sino también la interacción AC o lo que se mejor, estima la suma B+AC. En la Tabla 6.6 se resumen las consecuencias del fraccionamiento a la mitad de un diseño 23 completo. Combinación Efecto Explicación ½ [a – b – c + abc] A+BC A se confunde con BC o es alias de él ½ [-a + b – c + abc] B+AC B se confunde con AC o es alias de él ½ [-a – b + c + abc] C+AB C se confunde con AB o es alias de él Tabla 6.6 Confusión en un diseño factorial 23 fraccionado a la mitad La consecuencia adicional de este fraccionamiento es que la interacción triple, ABC no se puede detectar. Es decir, con un diseño 23-1 no se puede evaluar la posible interacción ABC. Sin embargo, las interacciones de orden superior, usualmente, son despreciables en el mundo real. En general, la fracción a realizar se escoge de tal suerte que los efectos principales y las interacciones de orden inferior que son de interés formen alias sólo con interacciones de orden superior (las que probablemente son despreciables). La estructura de alias para este diseño puede encontrarse utilizando la relación de definición I = ABC. La multiplicación de cualquier efecto por esta relación proporciona los alias para tal efecto. En el ejemplo, el alias de A es A=A (ABC) = A2BC = BC. Note que se ha eliminado A2 debido a que representa una columna de signos más que no altera el producto final. Es decir A2 = I, e I es la columna identidad. De la misma manera se pueden encontrar los alias de B y C. Supóngase que en lugar de escoger la mitad superior de la Figura 6.9 para fraccionar al diseño 23, se hubiera escogido la mita inferior. Es decir la combinación de tratamientos en los que ABC tiene signo negativo. Estas cuatro corridas se muestran en color amarillo en la Figura 6.9. La relación de definición para este diseño es I = ABC. Los alias son A =-BC, B = -AC, y C = -AB. Por tanto, las estimaciones de A, B y C que se obtienen de esta fracción en realidad estiman A – BC, - B – AC y C – AB. En la práctica, usualmente no es importante la fracción un medio que se escoja pues ambas son lleva a resultados equivalentes. La fracción con el signo más en la relación de definición se conoce como fracción principal, y la otra como fracción alternativa. Nótese que si se hubiera seleccionado AB como el generador del diseño factorial fraccionario (Buscando todos los más en la columna correspondiente de la Figura 6.9), entonces A sería alias de B, lo cual conlleva a una pérdida de información muy importante. Como regla general, se escoge la fracción en la que se confundan las interacciones de orden superior. Más adelante, se explica un procedimiento práctico para escoger la fracción más adecuada, en el caso general de los diseños 2k-1 Un comentario final de los diseños factoriales fraccionados a la mitad es que combinando las estructuras de alias de ambas fracciones se pueden obtener los efectos principales y de interacción. Por ejemplo, el efecto A se obtiene: A= ( A + BC ) fracción + ( A − BC ) fracción principal alternativa 2 Y la interacción doble BC se obtiene como: (6-33) BC = ( A + BC ) fracción − ( A − BC ) fracción principal alternativa (6-34) 2 Una alternativa equivalente hubiera sido analizar el experimento como si se hubiera corrido completo desde el principio. Sin embargo, al correr la segunda fracción posteriormente, se debe tener mucho cuidado en que las condiciones bajo las cuales se realizan los experimentos sean las mismas de cuando se corrió la primera fracción. Si no se pudieron mantener las mismas condiciones se debe utilizar un efecto de bloque haciendo que el efecto de bloque se confunda con la interacción triple, ABC, y los efectos principales y de interacciones dobles se calculen sin ninguna confusión 6.4.2 Resolución en un diseño fraccionado Al correr un diseño factorial fraccionado los efectos no pueden estimarse de manera individual, sino que se estiman sumas o restas de efectos que son alias entre sí. La interpretación de estas sumas o restas se hace sencilla si se supone que todos los términos, excepto uno, son despreciables. Por lo tanto el efecto de esta suma (o resta), se puede atribuir a un único factor. Por esta razón siempre se busca un diseño factorial fraccionado en el cual los efectos principales importantes sean alias de otros efectos que no son muy importantes. El supuesto lógico en este caso consiste en asumir que los efectos principales son más importantes que las interacciones de dos factores, y estas a su vez son más relevantes que los de tres factores, y así sucesivamente. Este concepto se maneja buscando un diseño factorial fraccionado que tenga la máxima resolución posible. Se dice que un diseño factorial fraccionado tiene resolución R si las interacciones de P factores no son alias de interacciones que tengan menos de R – P factores. Cuan más alta sea la resolución de un diseño factorial fraccionado mejor se pueden apreciar los efectos potencialmente importantes. A continuación se dan las definiciones de los diseños con resolución III, IV y V. Diseños de Resolución III. En estos diseños los efectos principales no son alias entre sí, pero si pueden ser alias con alguna interacción doble. El diseño 23-1 pertenece a esta clase. Lo usual es utilizar un número romano como subíndice para indicar la resolución 2 3III−1 Diseños de Resolución IV. Son diseños en los que ningún efecto principal tiene alias con otro efecto principal o con interacciones entre dos factores, pero estas pueden tener alias entre sí. El diseño 24-1 con relación de definición I = ABCD (o I = - ABCD) es de resolución IV. Este diseño se denota como 2 4IV−1 Diseños de Resolución V. En estos diseños los efectos principales y las interacciones dobles son alias con interacciones triples o de orden superior, es decir, los efectos principales y las interacciones dobles se pueden determinar limpiamente. Un ejemplo de un diseño con esta resolución es el diseño 25-1 ( 2V5−1 ) con relación de definición I = ABCDE (o I = - ABCDE). En general la resolución de un diseño factorial fraccionado esta dado por la longitud de la “palabra” en la relación de definición con el menor número de letras posible. Por esta razón los diseños factoriales fraccionados 23-1, 24-1 y 25-1 tienen resolución III, IV y V respectivamente, porque sus correspondientes generadores se componen de 3, 4 y 5 letras. 6.4.3 Construcción de fracciones 2k-1 Una manera sencilla de construir diseños factoriales fraccionados 2k-1 con la más alta resolución posible es la siguiente: 1. Se construye la tabla de signos para un diseño factorial completo con k-1 factores y de esta forma se tienen las primeras k-1 columnas de la fracción deseada. 2. La columna faltante (la k-ésima) se construye multiplicando entre sí las columnas anteriores. Si se desea la fracción complementaria o alternativa se cambian los signos de esta última columna. El diseño que resulta es un diseño factorial fraccionado, 2k-1 con la máxima resolución posible, R = k. Como ejemplo veamos la construcción de un diseño factorial fraccionado 24-1 con resolución IV y con generador I = ABCD. 1. Se parte del diseño factorial completo 24-1 = 23 dado por: A B C - - - + - - - + - + + - D - - + + - + - + + + + + 2. La columna restante (la cual corresponde a D) se obtiene al multiplicar las columnas A, B y C A B C D= ABC - - - - + - - + - + - + + + - - - - + + + - + - - + + - + + + + Si se desea la fracción alternativa, con generador I = - ABC, se cambia el signo de la última columna en el segundo paso. 6.4.4 Diseños factoriales fraccionados 2k-2 Un diseño factorial 2k-2 representa la cuarta parte del diseño factorial completo. Para generar este diseño se necesitan dos efectos generadores, los cuales se toman de las interacciones de orden superior y que al mismo tiempo su producto sea también una interacción de orden superior. Estos diseños tendrán tres generadores: los dos primeros que se escogieron y el que resulta del producto entre ellos y ninguno de ellos se puede estimar. La estructura de alias se obtiene a partir de los dos generadores iniciales y su producto. Por lo tanto cada efecto tiene tres alias. En general, el número de palabras de la relación definidora indica el número de alias que tendrá cada efecto, y multiplicando un efecto cualquiera por esta relación se determinan sus alias. Una forma sencilla de construir un diseño factorial 2k-2 es: 1. Se escribe el diseño 2k-2 como si fuera un diseño factorial completo con k-2 factores y de esta forma se obtienen los primeros k-2 factores. 2. Los niveles que corresponden a los factores de las dos últimas columnas (factores k-1 y k) se obtienen multiplicando columnas previas de acuerdo a los generadores escogidos. Veamos este procedimiento de dos pasos para construir un diseño factorial 25-2: 1. Se parte del diseño factorial completo 23 para los tres factores A, B y C A B C - - - + - - - + - + + - - - + + - + - + + + + + D E 2. Los niveles para los factores D y E se obtienen al seleccionar de manera adecuada los generadores. Una opción es tomar I = ABD e I = ACE, y el tercer generador es el producto ABD × ACE = A2 BCDE = BCDE. De esta manera se puede obtener que D = AB y E = AC. A B C D E - - - + - + - - - - - + - - + + + - + - - - + + - + - + - + - + + - - + + + + + La estructura de alias completo se puede obtener como se explico anteriormente. Por ejemplo, los alias de A se obtienen multiplicando este por los tres generadores así: A = A × (Primer generador) = A × ABD = BD A = A × (Segundo generador) = A × ACE = CE A = A × (Tercer generador) = A × BCDE = ABCDE El resto de alias para los demás factores se muestra en la siguiente tabla: A+BD+CE+ABCDE B+AD+ABCE+CDE C+ABCD+AE+BDE D+AB+ACDE+BCE E+ABDE+AC+BCD BC+ACD+ABE+DE BE+ADE+ABC+CD µ+ABD+ACE+BCDE Tabla 6.7 Estructura de alias completa para un diseño 2 5III−2 Se observa en la Tabla 6.7 que cada efecto principal tiene al menos una interacción doble como alias que es lo que conduce a un diseño de resolución III. De la Tabla 6.7 se puede asumir que las interacciones de orden superior son despreciables y por lo tanto eliminarlas del modelo para obtener una estructura de alias reducida (ver Tabla 6.8) A + BD + CE B + AD C + AE D + AB E + AC BC + DE BE + CD Tabla 6.8 Estructura de alias reducida para un diseño 2 5III−2 Cuando se alían efectos con la misma jerarquía, como en el caso de BD + CE, debe decidirse con base en el conocimiento del proceso, a que interacción se atribuye el efecto observado en el caso que resulte significativo. Otra manera es fijarse en qué efectos principales resultan significativos ya que estos tienen más probabilidad de estar activos en sus interacciones. 6.4.5 Ejercicios propuestos. 1. A continuación se muestran los resultados de un diseño factorial. Conteste los siguientes incisos sin utilizar un software computacional, haga las operaciones que se le piden de manera manual. Réplica A B I II III Total - - 82 80 84 (1) = 246 + - 78 82 79 (a) = 239 - + 71 70 66 (b) = 207 + + 89 88 93 (ab) = 270 a. ¿Qué nombre recibe este diseño y por qué? b. ¿Cuántos tratamientos tiene este diseño, cuántas réplicas? c. En total son 12 corridas experimentales las que se realizaron, señale en qué orden debieron correrse y explique por qué. d. Señale los efectos que se pueden estudiar a través de este diseño. e. Obtenga los contrastes para los efectos principales de A y B, y para la interacción. f. Calcule los efectos principales y el efecto de interacción. g. Haga las gráficas de los efectos principales de A y B, e interprételas. h. Realice la gráfica de la interacción entre los factores de A y B, e interprétela con detalle. i. ¿Desde su punto de vista el factor B parece tener influencias sobre Y? Argumente. 2. Suponga un diseño factorial 23, y conteste las siguientes preguntas.Utilizando la notación de (-, +) para los niveles de los factores, escriba todos los tratamientos que forman este diseño. a. Represente en forma geométrica este diseño y resalte la región de experimentación. b. ¿Cuáles son todos los posibles efectos que se pueden estu diar con este diseño? c. Para cada uno de los efectos anteriores, obtenga su contraste. d. Señale en forma específica cómo utilizaría los contrastes para calcular los efectos y la suma de los cuadrados. e. ¿Cómo aplicaría los tres principios básicos del diseño de experimentos en este caso para cada uno de los efectos anteriores? 3. A continuación se muestran los resultados obtenidos en un diseño factorial 23 no replicado. Conteste los siguientes incisos sin utilizar un software computacional, es decir, haga las operaciones que se le piden de forma manual. ¿Código? A B C Y - + - 25 + + + 12 - - - 30 + - + 10 - - + 10 + + - 14 - + + 31 + - - 17 a. En la primera columna de la matriz del diseño especifique el código de cada uno de los tratamientos, de acuerdo a la notación de Yates. b. Calcule los efectos principales de A y B. c. Haga la gráfica de los efectos principales de A y B, e interprételas. d. Calcule el efecto de la interacción AB. e. Realice la gráfica de la interacción entre los factores A y B; e interprétela con detalle. f. ¿Qué tendría que hacer para saber si los efectos que cálculo en los incisos anteriores, afectan de manera significativa a la variable de respuesta? g. Calcule la suma de cuadrados para el efecto principal de A y para la interacción. 4. Suponga un diseño factorial 24, y conteste las siguientes preguntas. a. Anote la matriz de diseño, es decir, haga una lista de todos los tratamientos que forman este diseño. b. ¿Por qué este diseño recibe tal nombre? c. ¿Cuáles son todos los posibles efectos que se pueden estudiar con este diseño? d. ¿Refiriéndose al análisis, en qué consiste y cuál es el objetivo de obtener el mejor ANOVA? e. ¿Cómo se calculan los coeficientes de determinación R2 y R2AjS? f. Si después de obtener el mejor ANOVA, se obtiene que estos R2aj coeficientes tienen un valor de alrededor 90, ¿qué significa esto? g. Si por el contrario, tales coeficientes tienen un valor de alrededor 20, ¿qué significa esto? h. Obtenga el contraste para el efecto principal de D y para el efecto de interacción CD. i. Señale en forma específica cómo utilizaría los contrastes para calcular los efectos y la suma de los cuadrados. j. ¿Puede darse el caso de que el efecto principal de A no sea significativo, y el efecto de la interacción AB si lo sea? 5. En una empresa lechera se ha tenido problemas con la viscosidad de cierta bebida de chocolate. Se cree que tres ingredientes que se agregan en pequeñas cantidades son con los que se puede resolver este problema, por lo que es necesario explorar la situación; para ello se corre un experimento 23 con dos réplicas. En seguida se aprecian los resultados obtenidos. Ingrediente A Ingrediente B Ingrediente C Viscosidad -1 -1 -1 13.3, 13.7 +1 -1 -1 14.7, 14.4 -1 +1 -1 14.6, 14.5 +1 +1 -1 14.3, 14.1 -1 -1 +1 16.9, 17.2 +1 -1 +1 15.5, 15.4 -1 +1 +1 17.0, 17.1 +1 +1 +1 18.9, 19.0 a. Estime todos los posibles efectos y diga cuáles son significativos. b. Realice un análisis de varianza de estos datos y obtenga conclusiones generales. c. ¿Hay un tratamiento ganador para minimizar? d. Verifique residuos, ¿qué observa de destacado? 6. Se quiere aumentar el rendimiento de un proceso, y para ello se estudian tres factores con dos niveles cada uno. Se hacen tres repeticiones en cada tratamiento del diseño factorial 23 resultante. La variable de respuesta que se mide es rendimiento. Los datos son los siguientes: Repetición Tratamiento 1 2 3 (1) 22 31 25 a 32 43 29 b 35 34 50 ab 55 47 46 c 44 45 38 ac 40 37 36 bc 60 50 54 abc 39 41 47 a. ¿Cuáles efectos están activos? b. Si obtuvo una interacción importante, interprétela con detalle. c. Determine las condiciones de operación que maximizan el rendimiento. d. ¿Cuál es la respuesta esperada en el mejor tratamiento? e. Verifique los supuestos del modelo. 7. Se hace un experimento para mejorar el rendimiento de un proceso, controlando cuatro factores en dos niveles cada uno. Se corre una réplica de un diseño factorial 24, con los factores tiempo (A), concentración (B), presión (C) y temperatura (D), y los resultados son los siguientes: A0 A1 B0 B1 B0 B1 C0 C1 C0 C1 C0 C1 C0 C1 D0 12 17 13 20 18 15 16 15 D1 10 19 13 17 25 21 24 23 a. Analice estos datos con el uso de todos los criterios existentes para encontrar el mejor ANOVA. En las figuras considere de entrada los 15 efectos posibles. b. ¿Cuáles efectos están activos? c. Determine el mejor tratamiento. d. Prediga el rendimiento esperado en el mejor tratamiento y dé un intervalo de confianza para el rendimiento futuro. e. Compruebe los supuestos del modelo. f. ¿Puede este diseño colapsarse en uno 23 con dos réplicas? De ser posible, hágalo y repita los incisos anteriores para este nuevo diseño. 8. En una empresa panificadora existen problemas con la simetría y el color del pan integral. Los responsables del proceso sospechan que el problema se origina desde la fase de fermentación. En ésta se combina agua, harina, cierta cantidad de levadura más una serie de ingredientes como fosfato, sal, etc. Al final de la fermentación se obtiene lo que se llama “esponja líquida” la cual debe cumplir una serie de parámetros de calidad: una acidez total titulable (ATT) mayor a 6.0 y un pH mayor a 4.8. Sin embargo, no se ha cumplido con dichas exigencias de calidad; se han hecho algunos intentos experimentales con un factor a la vez, pero los resultados han sido malos. En busca de una mejor estrategia experimental, se decide utilizar un diseño factorial fraccionado 26-2 para investigar el efecto de seis factores en las variables ATT y pH. Los primeros cinco factores se refieren a cierta cantidad que se agrega en la fermentación: A: levadura (17,19), B: sal (2.5, 3.7), C: fosfato (2.0, 3.6), D: sulfato (1.5, 2.2), E: cloruro (0.89, 1.20); el sexto factor es F: temperatura inicial del agua (22, 26). Los datos obtenidos se muestran en la tabla siguiente. Orden de Variables de Matriz de diseño corrida 9 respuesta A B C D E F ATT pH - - - - - - 6.2 4.86 5 + - - - + - 5.6 4.86 6 - + - - + + 5.8 4.85 1 + + - - - + 5.8 4.99 14 - - + - + + 5.7 4.94 10 + - + - - + 6.4 4.74 13 - + + - - - 6.4 4.83 12 + + + - + - 6.6 4.85 11 - - - + - + 5.3 4.81 3 + - - + + + 6.6 4.81 15 - + - + - + 5.2 4.98 16 + + - + - - 5.5 4.98 8 - - + + + - 6.9 4.84 4 + - + + - - 7.1 4.85 2 - + + + - + 6.7 4.96 7 + + + + + + 6.9 4.84 a. Observe los datos con cuidado, sobre todo los correspondientes al pH, ¿qué observa de destacado? ¿A qué puede deberse eso? b. ¿Cuál es la resolución de este diseño y qué significa ésta? Escriba la estructura alias reducida. ¿Cómo se pueden interpretar efectos de interacción que son alias? c. ¿Cuáles efectos explican el comportamiento de cada una de las respuestas? Encuentre el mejor ANOVA para cada respuesta e interprete utilizando α = 0.05. d. Determine las condiciones de operación que maximizan a ambas respuestas simultáneamente. ¿Es posible dar una solución simultánea al problema con los análisis individuales? Argumente. e. Verifique los supuestos para cada variable de respuesta. 9. Se piensa que cuatro factores tienen influencia sobre el sabor de un refresco: tipo de endulzante (A), proporción jarabe/agua (B), nivel de carbonatación (C) y temperatura (D). Cada factor puede correrse en dos niveles, lo que produce un diseño 24. En cada corrida del diseño, se dan muestras de la bebida a un grupo de prueba formado por 20 personas. Cada una de ellas asigna un puntaje a la bebida, que va de 1 a 10. El puntaje total es la variable de respuesta, y el objetivo es encontrar una fórmula que maximice el puntaje total. Se corren dos réplicas de este diseño, y los resultados se muestran a continuación. Analice los datos y obtenga conclusiones. Utilice α = 0.05 y las prueba estadísticas. Combinación de Réplica Réplica Combinación de I II tratamientos I II (1) 159 163 d 164 159 a 168 175 ad 187 189 b 158 163 bd 163 159 ab 166 168 abd 185 191 c 175 178 cd 168 174 ac 179 183 acd 197 199 bc 173 168 bcd 170 174 abc 179 182 abca 194 198 tratamientos 10. En un estudio del rendimiento en el desarrollo de un proceso, se analizan cuatro factores, cada uno con dos niveles: tiempo (A), concentración (B), presión (C), y temperatura (D). Se corre sólo una replica del diseño 24, y los datos resultantes son los que aparecen en la tabla siguiente: Orden real Número de corrida de la A B C D Rendimiento corrida Niveles de los factores (lbs) Bajo (-) Alto (+) 1 5 - - - - 12 A (h) 2.5 3 2 9 + - - - 18 B (%) 14 18 3 8 - + - - 13 C (psi) 60 80 4 13 + + - - 16 D (ºC) 250 5 3 - - + - 17 6 7 + - + - 15 7 14 - + + - 20 8 1 + + + - 15 9 6 - - - + 10 10 11 + - - + 25 11 2 - + - + 13 12 15 + + - + 24 13 4 - - + + 19 14 16 + - + + 21 15 10 - + + + 17 16 12 + + + + 23 225 a. Haga una gráfica de las estimaciones de los efectos sobre una escala de probabilidad normal. ¿Qué factores son los que aparentemente tienen los efectos más grandes? b. Realice un análisis de varianza utilizando la gráfica de probabilidad normal del inciso a) como guía para formar el término del error. ¿Cuáles son sus conclusiones? c. Analice los residuos de este experimento. ¿El análisis de éstos indica algún problema en potencia? d. ¿Puede reducirse este diseño en un diseño 23 con dos réplicas? Si es así, esboce el diseño con el promedio y el rango del rendimiento den cada punto de un cubo. Interprete los resultados. 11. Considere el experimento descrito en el ejercicio anterior. Encuentre intervalos de confianza del 95% sobre los efectos de los factores que parezcan importantes. Utilice la gráfica de probabilidad normal como guía con respecto a los efectos que pueden combinarse para proporcionar una estimación del error.