Ideas básicas del diseño experimental

Anuncio
Ideas básicas del diseño experimental
Capítulo 4 de Analysis of Messy Data. Milliken y Johnson (1992)
Diseño de experimentos – p. 1/23
Ideas básicas del diseño experimental
Antes de llevar a cabo un experimento, se deben contestar
algunas preguntas:
1. Cuántos tratamientos se van a estudiar?
2. Cuántas veces se va a observar cada tratamiento?
3. Cuáles son las unidades experimentales?
4. Cómo aplica el experimentador los tratamientos a las u.e.
disponibles y luego observa las respuestas?
5. Se puede analizar el diseño resultante y/o se pueden hacer
las comparaciones deseadas?
Diseño de experimentos – p. 2/23
Ideas básicas del diseño experimental
Considere un experimento que involucra t tratamientos y cada
tratamiento se aplica a r u.e. diferentes.
Un modelo matemático que se puede usar para describir yij ,
la respuesta observada de la j-ésima u.e. del i-ésimo
tratamiento es:
(
i = 1, 2, . . . , t
(1)
yij = µi + ǫij
j = 1, 2, . . . , r
donde µi es la media real, pero desconocida, de las
respuestas del i-ésimo tratamiento y ǫij es una variable
aleatoria que represental el ruido resultante de la variación
total y otras posibles fuentes de error aleatorio y no aleatorio.
Diseño de experimentos – p. 3/23
Ideas básicas del diseño experimental
Para llevar a cabo este experimento, el investigador debe
seleccionar rt u.e. y asignar aleatoriamente cada tratamiento
a r de las u.e.
El uso de la aleatorización es muy importante ya que previene
la introducción de sesgos sistemáticos en el experimento. Si el
investigador no usa la aleatorización, entonces no puede decir
si una diferencia observada se debe a diferencias entre los
tratamientos o se debe al método sistemático usado para
asignar los tratamientos a las u.e.
Ya que el objetivo de un experimento es comparar la respuesta
observada en las u.e. de los tratamientos, entonces, mientras
más parecidas sean las u.e. mejores serán las comparaciones
entre los tratamientos.
Diseño de experimentos – p. 4/23
Ideas básicas del diseño experimental
En muchos experimentos es imposible seleccionar rt u.e.
idénticas.
El que las u.e. no sean idénticas contribuye al error ǫij .
Entonces, se mejoran los experimentos si el investigador
puede agrupar las u.e. en grupos que sean muy parecidos,
u.e. muy parecidas se les llama homogéneas.
Cuando este es el caso, los tratamientos pueden compararse
en las u.e. similares donde la variación debida al grupo puede
tomarse en cuenta en el análisis.
Estos grupos de u.e. homogéneas se llaman bloques.
Diseño de experimentos – p. 5/23
Ideas básicas del diseño experimental
Sean r bloques con t u.e. cada uno, cada tratamiento
apareciendo una sola vez en cada bloque.
Un modelo que representa la respuesta observada del i-ésimo
tratamiento en el j-ésimo bloque es:
(
i = 1, 2, . . . , t
yij = µi + bj + ǫ∗ij
j = 1, 2, . . . , r
Observe que el ǫij del modelo (1) se reemplazó por bj + ǫ∗ij ,
esto es, la variación entre grupos o bloques de u.e. se
identificó y se separó de ǫij .
Se pueden comparar dos tratamientos, libres de efectos de
bloque, tomando diferencias dentro de bloque de las
respuestas de los dos tratamientos como:
yij − yi′ j = µi − µi′ + ǫ∗ij − ǫ∗i′ j
el cual no depende del efecto del bloque bj .
Diseño de experimentos – p. 6/23
Ideas básicas del diseño experimental
Un objetivo del diseño experimental es seleccionar y agrupar
el material experimental de tal manera que se reduzca el error
experimental. Entonces, necesitamos que las u.e. en las
cuales se van a comparar los tratamientos, sean lo más
parecidas posible para que puedan detectarse pequeñas
diferencias significativas entre dos tratamientos.
Si hay t tratamientos y t u.e. se puede llevar a cabo un
experimento y se puede estimar la media de cada tratamiento.
Pero la varianza del error no se puede obtener a menos que
alguno o todos los tratamientos sean replicados (tengan
repeticiones).
Una réplica de un tratamiento es una observación
independiente del tratamiento y, por lo tanto, dos réplicas
(repeticiones) de un tratamiento deben involucrar dos u.e.
Diseño de experimentos – p. 7/23
Ideas básicas del diseño experimental
Frecuentemente se utliza dividir una muestra para generar dos
observaciones a las que se les llama réplicas cuando en
realidad son submuestras o mediciones repetidas.
Por ejemplo, dos mediciones independientes de la estatura de
una persona no dan una medida de la variación de estaturas
de la población de personas, sino que dan una medida de la
variación de la medición de estatura en esa persona.
Otro ejemplo, considere un experimento para comparar la
capacidad de tres conservadores para inhibir el crecimiento de
hongos en cierto tipo de pastel.
Diseño de experimentos – p. 8/23
Ideas básicas del diseño experimental
Se aplica un conservador a cada pastel. Después de 9 días de
almacenado se mide el número de esporas de hongo por cm3 .
Como el investigador quiere 10 réplicas para el análisis, divide
cada pastel en 10 partes y obtiene la medición de esporas de
hongo en cada parte.
Sin embargo, esas 10 mediciones no resultan de 10
aplicaciones independientes del conservador.
La medida de variación de sus submuestras es un indicador de
la variación dentro del pastel y no de la variación u.e. a u.e.
Para tener 10 réplicas, el investigador necesita hacer 10
pasteles con cada conservador, cada uno de ellos mezclado
independientemente del otro.
Diseño de experimentos – p. 9/23
Ideas básicas del diseño experimental
Es muy importante distinguir entre una submuestra y una
réplica, ya que la varianza del error estimada entre las
submuestras es en general considerablemente menor que la
varianza del error estimada entre réplicas o u.e.
Por lo tanto, la estadística F de las pruebas construída usando
la varianza del error calculada de las submuestras será mucho
mayor de lo que debe ser, llevando al experimentador a
encontrar más diferencias significativas de lo que debería.
Diseño de experimentos – p. 10/23
Estructuras de un diseño experimental
1. Estructura de tratamientos. Es el conjunto de
tratamientos, combinación de los niveles de los factores bajo
estudio, o poblaciones que son seleccionadas por el
investigador para comparar.
La estructura de tratamientos puede ser un conjunto de t
tratamientos, llamada estructura de tratamientos unifactorial
(de una vía, one-way), o un conjunto de combinaciones de
niveles como un arreglo factorial de 2 factores (vías) o de
mayor orden.
Diseño de experimentos – p. 11/23
Estructuras de un diseño experimental
2. Estructura de diseño. Es la forma en que se agrupan las
u.e. en conjuntos homogéneos (bloques).
La estructura de diseño de un experimento involucra el
agrupamiento de las u.e. de tal manera que las condiciones
bajo las cuales se observan los tratamientos sean lo más
uniformes posible.
Si todas las u.e. son homogéneas, entonces solo hay un grupo
o bloque de observaciones y las u.e. pueden ser asignadas a
los tratamientos completamente al azar. Esta estructura de
diseño se llama diseño completamente al azar.
Si se requiere más de un grupo de u.e. para que dentro de
cada grupo las u.e. sean más homogéneas entre sí que entre
grupos, entonces la estructura de diseño es algún tipo de
diseño de bloques.
Diseño de experimentos – p. 12/23
Diseño experimental
Una vez que se seleccionaron las estructura de tratamientos y
de diseño, el diseño experimental se especifica describiendo
exactamente el método de asignación aleatoria de los
tratamientos a la u.e. en la estructura de diseño.
El diseño experimental define el modelo apropiado que debe
usarse para un análisis correcto. Al construir el modelo, se
hacen dos suposiciones básicas:
1. Se supone que los componentes de la estructura de diseño
son efectos aleatorios, esto es, los bloques usados son una
muestra aleatoria de la población de posibles bloques de
u.e.
2. Se supone que no hay interacción entre los componentes
de la estructura de diseño y los componentes de la
estructura de tratamientos. Es decir, se supone que la
relación existente entre los tratamientos será consistente
de bloque a bloque, o dicho de otra manera, los bloques no
influyen en la relación entre los tratamientos.
Diseño de experimentos – p. 13/23
Tipos de estructuras de diseño
La estructura de diseño se selecciona usando toda la
información disponible de las u.e. y se escoge
independientemente de la estructura de tratamientos.
Tipos de estructura de diseño.
1. Diseño completamente al azar. Se supone que todas las
u.e. son homogéneas y los tratamientos se asignan a las
u.e. completamente al azar.
2. Diseño de bloques al azar (completos). Si hay t
tratamientos, este diseño consiste de b bloques con t u.e.
cada uno. Cada tratamiento se asigna aleatoriamente a las
u.e. en cada bloque. (Restricción en la aleatorización).
Si cada bloque tiene ct u.e. con c entero, entonces cada
tratamiento se puede asignar a c u.e. en cada bloque
(bloques al azar generalizados).
Diseño de experimentos – p. 14/23
Tipos de estructuras de diseño
3. Diseño de cuadro latino. Consiste de un diseño de
bloques en dos direcciones. Si se tienen t tratamientos, t2
u.e. se arreglan en un cuadrado t × t donde los renglones
se llaman bloques renglón y las columnas bloques
columna. Los tratamientos se asignan aleatoriamente a las
u.e. de tal manera que cada tratamiento ocurra una sola
vez en cada bloque renglón y una sola vez en cada bloque
columna.
4. Diseño de bloques incompletos. Cuando el número de
tratamientos es mayor que el número de u.e. en cada
bloque.
5. Combinaciones y generalizaciones. El tamaño de los
bloques varía de bloque a bloque, o algunos bloques están
incompletos y otros completos.
Diseño de experimentos – p. 15/23
Tipos de estructuras de tratamientos
1. Estructura de una vía (oneway). Consiste de un conjunto
de t tratamientos o poblaciones que corresponden a los t
niveles del factor bajo estudio.
2. Estructura de dos vías (twoway). Consiste de un
conjunto de tratamientos construidos al combinar los
niveles de dos factores. Si el primer factor tiene s niveles y
el segundo r niveles, resultan s × r tratamientos.
Ejemplo: Diseño factorial 3 × 4, 12 tratamientos.
A1
A2
A3
B1
A1 B1
A2 B1
A3 B1
B2
A1 B2
A2 B2
A3 B2
B3
A1 B3
A2 B3
A3 B3
B4
A1 B4
A2 B4
A3 B4
Diseño de experimentos – p. 16/23
Tipos de estructuras de tratamientos
3. Estructura de arreglo factorial. Consiste de un conjunto
de tratamientos construidos al combinar los niveles de 2 o
más factores.
4. Estructura de arreglo factorial fraccional. Consiste de
solo una parte o fracción de todas las combinaciones
posibles de niveles (tratamientos) de un arreglo factorial.
Existen diferentes técnicas para seleccionar la fracción
apropiada.
5. Arreglos factoriales con uno o más controles. Por
ejemplo un factorial 3 × 2 + 1 significa que se tienen dos
factores uno con 3 niveles, el otro con 2 niveles y un
tratamiento testigo o control.
Todas las estructuras descritas se pueden considerar como
una estructura de una vía (oneway) para propósitos de
análisis.
Diseño de experimentos – p. 17/23
Ejemplo
Un nutriólogo quiere estudiar el efecto de 5 dietas para perder
peso. La estructura de tratamientos es de un solo factor con 5
niveles.
■
Si hay 20 personas homogéneas, se puede usar un diseño
completamente al azar donde cada dieta se asigna
completamente al azar a 4 personas. El modelo:
yij
yij
= µi + ǫij
ó
= µ + τi + ǫij i = 1, . . . , 5 j = 1, . . . , 4
F.V.
Dieta
Error
g.l.
4
15
Diseño de experimentos – p. 18/23
Ejemplo
■
Si hay 10 hombres y 10 mujeres en lugar de las 20 personas
homogéneas, el género de la persona puede usarse como
bloque, entonces se usaría un diseño de bloques al azar
generalizado donde cada dieta se asigna aleatoriamente a
dos hombres y dos mujeres.
yijk
yijk
= µi + bj + ǫijk
ó
= µ + τi + bj + ǫijk i = 1, . . . , 5 j = 1, . . . , 4
F.V.
Bloque
Dieta
Error
g.l.
1
4
14
Diseño de experimentos – p. 19/23
Ejemplo
■
En algunos casos, el sexo de la persona no es una buena
selección como factor de bloqueo ya que puede ser un tipo
de tratamiento (sobre todo si consideramos que puede
haber interacción de los dos factores). Si es así, la
estructura de tratamientos es un factorial de 2 vías (dieta y
sexo) con 10 tratamientos, resultado de combinar dos
niveles de sexo con 5 niveles de dieta. El diseño es
completamente al azar con 2 repeticiones.
yijk
yijk
µ
αi
βj
γij
= µij + ǫijk
ó
= µ + αi + βj + γij + ǫijk i = 1, . . . , 5 j = 1, 2 k = 1, 2
media general
efecto de dieta
efecto de sexo
interacción dieta sexo
Diseño de experimentos – p. 20/23
Ejemplo
La Tabla de ANOVA para cada uno de los modelos es:
F.V.
Modelo µij
Sexo x Dieta
Error
Modelo µ + αi + βj + γij
Sexo
Dieta
Sexo x Dieta
Error
g.l.
9
10
1
4
4
10
Diseño de experimentos – p. 21/23
Ejemplo
■
Suponga ahora que las dietas tienen una estructura
consistente de una dieta control y cuatro dietas resultado de
la combinación de dos niveles de proteína y dos niveles de
carbohidratos.
La estructura de tratamientos de Dieta es un arreglo factorial
2 × 2 con un control, que al cruzarse con Sexo genera una
estructura de tratamientos de tres vías con dos controles
(uno para hombres y otro para mujeres). El diseño es
completamente al azar.
El modelo es:
yijk = µ + αi + βj + γij + ǫijk i = 1, . . . , 5 j = 1, 2 k = 1, 2
Diseño de experimentos – p. 22/23
Ejemplo
F.V.
Sexo
Dieta
Control vs. 22
Proteína
Carbohidrato
Proteína x carbohidrato
Sexo x Dieta
Sexo x Control vs. 22
Sexo x Proteína
Sexo x Carbohidrato
Sexo x Carbohidrato x Proteína
Error
g.l.
1
4
1
1
1
1
4
1
1
1
1
10
Diseño de experimentos – p. 23/23
Descargar