Ideas básicas del diseño experimental Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992) Diseño de experimentos – p. 1/23 Ideas básicas del diseño experimental Antes de llevar a cabo un experimento, se deben contestar algunas preguntas: 1. Cuántos tratamientos se van a estudiar? 2. Cuántas veces se va a observar cada tratamiento? 3. Cuáles son las unidades experimentales? 4. Cómo aplica el experimentador los tratamientos a las u.e. disponibles y luego observa las respuestas? 5. Se puede analizar el diseño resultante y/o se pueden hacer las comparaciones deseadas? Diseño de experimentos – p. 2/23 Ideas básicas del diseño experimental Considere un experimento que involucra t tratamientos y cada tratamiento se aplica a r u.e. diferentes. Un modelo matemático que se puede usar para describir yij , la respuesta observada de la j-ésima u.e. del i-ésimo tratamiento es: ( i = 1, 2, . . . , t (1) yij = µi + ǫij j = 1, 2, . . . , r donde µi es la media real, pero desconocida, de las respuestas del i-ésimo tratamiento y ǫij es una variable aleatoria que represental el ruido resultante de la variación total y otras posibles fuentes de error aleatorio y no aleatorio. Diseño de experimentos – p. 3/23 Ideas básicas del diseño experimental Para llevar a cabo este experimento, el investigador debe seleccionar rt u.e. y asignar aleatoriamente cada tratamiento a r de las u.e. El uso de la aleatorización es muy importante ya que previene la introducción de sesgos sistemáticos en el experimento. Si el investigador no usa la aleatorización, entonces no puede decir si una diferencia observada se debe a diferencias entre los tratamientos o se debe al método sistemático usado para asignar los tratamientos a las u.e. Ya que el objetivo de un experimento es comparar la respuesta observada en las u.e. de los tratamientos, entonces, mientras más parecidas sean las u.e. mejores serán las comparaciones entre los tratamientos. Diseño de experimentos – p. 4/23 Ideas básicas del diseño experimental En muchos experimentos es imposible seleccionar rt u.e. idénticas. El que las u.e. no sean idénticas contribuye al error ǫij . Entonces, se mejoran los experimentos si el investigador puede agrupar las u.e. en grupos que sean muy parecidos, u.e. muy parecidas se les llama homogéneas. Cuando este es el caso, los tratamientos pueden compararse en las u.e. similares donde la variación debida al grupo puede tomarse en cuenta en el análisis. Estos grupos de u.e. homogéneas se llaman bloques. Diseño de experimentos – p. 5/23 Ideas básicas del diseño experimental Sean r bloques con t u.e. cada uno, cada tratamiento apareciendo una sola vez en cada bloque. Un modelo que representa la respuesta observada del i-ésimo tratamiento en el j-ésimo bloque es: ( i = 1, 2, . . . , t yij = µi + bj + ǫ∗ij j = 1, 2, . . . , r Observe que el ǫij del modelo (1) se reemplazó por bj + ǫ∗ij , esto es, la variación entre grupos o bloques de u.e. se identificó y se separó de ǫij . Se pueden comparar dos tratamientos, libres de efectos de bloque, tomando diferencias dentro de bloque de las respuestas de los dos tratamientos como: yij − yi′ j = µi − µi′ + ǫ∗ij − ǫ∗i′ j el cual no depende del efecto del bloque bj . Diseño de experimentos – p. 6/23 Ideas básicas del diseño experimental Un objetivo del diseño experimental es seleccionar y agrupar el material experimental de tal manera que se reduzca el error experimental. Entonces, necesitamos que las u.e. en las cuales se van a comparar los tratamientos, sean lo más parecidas posible para que puedan detectarse pequeñas diferencias significativas entre dos tratamientos. Si hay t tratamientos y t u.e. se puede llevar a cabo un experimento y se puede estimar la media de cada tratamiento. Pero la varianza del error no se puede obtener a menos que alguno o todos los tratamientos sean replicados (tengan repeticiones). Una réplica de un tratamiento es una observación independiente del tratamiento y, por lo tanto, dos réplicas (repeticiones) de un tratamiento deben involucrar dos u.e. Diseño de experimentos – p. 7/23 Ideas básicas del diseño experimental Frecuentemente se utliza dividir una muestra para generar dos observaciones a las que se les llama réplicas cuando en realidad son submuestras o mediciones repetidas. Por ejemplo, dos mediciones independientes de la estatura de una persona no dan una medida de la variación de estaturas de la población de personas, sino que dan una medida de la variación de la medición de estatura en esa persona. Otro ejemplo, considere un experimento para comparar la capacidad de tres conservadores para inhibir el crecimiento de hongos en cierto tipo de pastel. Diseño de experimentos – p. 8/23 Ideas básicas del diseño experimental Se aplica un conservador a cada pastel. Después de 9 días de almacenado se mide el número de esporas de hongo por cm3 . Como el investigador quiere 10 réplicas para el análisis, divide cada pastel en 10 partes y obtiene la medición de esporas de hongo en cada parte. Sin embargo, esas 10 mediciones no resultan de 10 aplicaciones independientes del conservador. La medida de variación de sus submuestras es un indicador de la variación dentro del pastel y no de la variación u.e. a u.e. Para tener 10 réplicas, el investigador necesita hacer 10 pasteles con cada conservador, cada uno de ellos mezclado independientemente del otro. Diseño de experimentos – p. 9/23 Ideas básicas del diseño experimental Es muy importante distinguir entre una submuestra y una réplica, ya que la varianza del error estimada entre las submuestras es en general considerablemente menor que la varianza del error estimada entre réplicas o u.e. Por lo tanto, la estadística F de las pruebas construída usando la varianza del error calculada de las submuestras será mucho mayor de lo que debe ser, llevando al experimentador a encontrar más diferencias significativas de lo que debería. Diseño de experimentos – p. 10/23 Estructuras de un diseño experimental 1. Estructura de tratamientos. Es el conjunto de tratamientos, combinación de los niveles de los factores bajo estudio, o poblaciones que son seleccionadas por el investigador para comparar. La estructura de tratamientos puede ser un conjunto de t tratamientos, llamada estructura de tratamientos unifactorial (de una vía, one-way), o un conjunto de combinaciones de niveles como un arreglo factorial de 2 factores (vías) o de mayor orden. Diseño de experimentos – p. 11/23 Estructuras de un diseño experimental 2. Estructura de diseño. Es la forma en que se agrupan las u.e. en conjuntos homogéneos (bloques). La estructura de diseño de un experimento involucra el agrupamiento de las u.e. de tal manera que las condiciones bajo las cuales se observan los tratamientos sean lo más uniformes posible. Si todas las u.e. son homogéneas, entonces solo hay un grupo o bloque de observaciones y las u.e. pueden ser asignadas a los tratamientos completamente al azar. Esta estructura de diseño se llama diseño completamente al azar. Si se requiere más de un grupo de u.e. para que dentro de cada grupo las u.e. sean más homogéneas entre sí que entre grupos, entonces la estructura de diseño es algún tipo de diseño de bloques. Diseño de experimentos – p. 12/23 Diseño experimental Una vez que se seleccionaron las estructura de tratamientos y de diseño, el diseño experimental se especifica describiendo exactamente el método de asignación aleatoria de los tratamientos a la u.e. en la estructura de diseño. El diseño experimental define el modelo apropiado que debe usarse para un análisis correcto. Al construir el modelo, se hacen dos suposiciones básicas: 1. Se supone que los componentes de la estructura de diseño son efectos aleatorios, esto es, los bloques usados son una muestra aleatoria de la población de posibles bloques de u.e. 2. Se supone que no hay interacción entre los componentes de la estructura de diseño y los componentes de la estructura de tratamientos. Es decir, se supone que la relación existente entre los tratamientos será consistente de bloque a bloque, o dicho de otra manera, los bloques no influyen en la relación entre los tratamientos. Diseño de experimentos – p. 13/23 Tipos de estructuras de diseño La estructura de diseño se selecciona usando toda la información disponible de las u.e. y se escoge independientemente de la estructura de tratamientos. Tipos de estructura de diseño. 1. Diseño completamente al azar. Se supone que todas las u.e. son homogéneas y los tratamientos se asignan a las u.e. completamente al azar. 2. Diseño de bloques al azar (completos). Si hay t tratamientos, este diseño consiste de b bloques con t u.e. cada uno. Cada tratamiento se asigna aleatoriamente a las u.e. en cada bloque. (Restricción en la aleatorización). Si cada bloque tiene ct u.e. con c entero, entonces cada tratamiento se puede asignar a c u.e. en cada bloque (bloques al azar generalizados). Diseño de experimentos – p. 14/23 Tipos de estructuras de diseño 3. Diseño de cuadro latino. Consiste de un diseño de bloques en dos direcciones. Si se tienen t tratamientos, t2 u.e. se arreglan en un cuadrado t × t donde los renglones se llaman bloques renglón y las columnas bloques columna. Los tratamientos se asignan aleatoriamente a las u.e. de tal manera que cada tratamiento ocurra una sola vez en cada bloque renglón y una sola vez en cada bloque columna. 4. Diseño de bloques incompletos. Cuando el número de tratamientos es mayor que el número de u.e. en cada bloque. 5. Combinaciones y generalizaciones. El tamaño de los bloques varía de bloque a bloque, o algunos bloques están incompletos y otros completos. Diseño de experimentos – p. 15/23 Tipos de estructuras de tratamientos 1. Estructura de una vía (oneway). Consiste de un conjunto de t tratamientos o poblaciones que corresponden a los t niveles del factor bajo estudio. 2. Estructura de dos vías (twoway). Consiste de un conjunto de tratamientos construidos al combinar los niveles de dos factores. Si el primer factor tiene s niveles y el segundo r niveles, resultan s × r tratamientos. Ejemplo: Diseño factorial 3 × 4, 12 tratamientos. A1 A2 A3 B1 A1 B1 A2 B1 A3 B1 B2 A1 B2 A2 B2 A3 B2 B3 A1 B3 A2 B3 A3 B3 B4 A1 B4 A2 B4 A3 B4 Diseño de experimentos – p. 16/23 Tipos de estructuras de tratamientos 3. Estructura de arreglo factorial. Consiste de un conjunto de tratamientos construidos al combinar los niveles de 2 o más factores. 4. Estructura de arreglo factorial fraccional. Consiste de solo una parte o fracción de todas las combinaciones posibles de niveles (tratamientos) de un arreglo factorial. Existen diferentes técnicas para seleccionar la fracción apropiada. 5. Arreglos factoriales con uno o más controles. Por ejemplo un factorial 3 × 2 + 1 significa que se tienen dos factores uno con 3 niveles, el otro con 2 niveles y un tratamiento testigo o control. Todas las estructuras descritas se pueden considerar como una estructura de una vía (oneway) para propósitos de análisis. Diseño de experimentos – p. 17/23 Ejemplo Un nutriólogo quiere estudiar el efecto de 5 dietas para perder peso. La estructura de tratamientos es de un solo factor con 5 niveles. ■ Si hay 20 personas homogéneas, se puede usar un diseño completamente al azar donde cada dieta se asigna completamente al azar a 4 personas. El modelo: yij yij = µi + ǫij ó = µ + τi + ǫij i = 1, . . . , 5 j = 1, . . . , 4 F.V. Dieta Error g.l. 4 15 Diseño de experimentos – p. 18/23 Ejemplo ■ Si hay 10 hombres y 10 mujeres en lugar de las 20 personas homogéneas, el género de la persona puede usarse como bloque, entonces se usaría un diseño de bloques al azar generalizado donde cada dieta se asigna aleatoriamente a dos hombres y dos mujeres. yijk yijk = µi + bj + ǫijk ó = µ + τi + bj + ǫijk i = 1, . . . , 5 j = 1, . . . , 4 F.V. Bloque Dieta Error g.l. 1 4 14 Diseño de experimentos – p. 19/23 Ejemplo ■ En algunos casos, el sexo de la persona no es una buena selección como factor de bloqueo ya que puede ser un tipo de tratamiento (sobre todo si consideramos que puede haber interacción de los dos factores). Si es así, la estructura de tratamientos es un factorial de 2 vías (dieta y sexo) con 10 tratamientos, resultado de combinar dos niveles de sexo con 5 niveles de dieta. El diseño es completamente al azar con 2 repeticiones. yijk yijk µ αi βj γij = µij + ǫijk ó = µ + αi + βj + γij + ǫijk i = 1, . . . , 5 j = 1, 2 k = 1, 2 media general efecto de dieta efecto de sexo interacción dieta sexo Diseño de experimentos – p. 20/23 Ejemplo La Tabla de ANOVA para cada uno de los modelos es: F.V. Modelo µij Sexo x Dieta Error Modelo µ + αi + βj + γij Sexo Dieta Sexo x Dieta Error g.l. 9 10 1 4 4 10 Diseño de experimentos – p. 21/23 Ejemplo ■ Suponga ahora que las dietas tienen una estructura consistente de una dieta control y cuatro dietas resultado de la combinación de dos niveles de proteína y dos niveles de carbohidratos. La estructura de tratamientos de Dieta es un arreglo factorial 2 × 2 con un control, que al cruzarse con Sexo genera una estructura de tratamientos de tres vías con dos controles (uno para hombres y otro para mujeres). El diseño es completamente al azar. El modelo es: yijk = µ + αi + βj + γij + ǫijk i = 1, . . . , 5 j = 1, 2 k = 1, 2 Diseño de experimentos – p. 22/23 Ejemplo F.V. Sexo Dieta Control vs. 22 Proteína Carbohidrato Proteína x carbohidrato Sexo x Dieta Sexo x Control vs. 22 Sexo x Proteína Sexo x Carbohidrato Sexo x Carbohidrato x Proteína Error g.l. 1 4 1 1 1 1 4 1 1 1 1 10 Diseño de experimentos – p. 23/23