DISEÑO DE EXPERIMENTOS Mediante el diseño de experimentos podemos determinar si el factor a considerar tiene efecto sobre la variable de respuesta. Por lo general el factor se pude presentar en diferentes niveles que darán como resultado un cambio en la respuesta. En general se puede presentar los niveles (o tratamientos) de la siguiente manera: Tratamiento 1 2 3 … a Y11 Y21 Y23 … Ya1 Y12 Y22 Y32 … Ya2 Observaciones Y13 Y23 Y33 … Ya3 … … … … … Yin Y2n Y3n … Yan Se tienen a tratamientos y n observaciones para cada tratamiento. En este caso existen el mismo número de observaciones para cada tratamiento. Decimos que es un diseño balanceado. En el caso de que exista diferente número de observaciones para cada tratamiento decimos que el diseño es desbalanceado. Cada una de las observaciones se puede representar mediante el modelo general de análisis de varianza unidireccional ( de un solo factor): Yij = + i + ij Donde yij i ij es la j-ésima observación del i-ésimo tratamiento es la media general es el efecto de i-ésimo tratamiento es un error aleatorio con media cero y varianza 2 El objetivo general es determinar si existen diferencias entre los tratamientos, lo cual nos llevará a determinar también si el factor tiene efecto sobre la respuesta. Lo anterior se responde probando las siguientes hipótesis: H0: 1 = 2 = 2 = … = a = 0 Ha: i ≠ 0 1 Ing. Armando Jiménez Lizcano El procedimiento para estas hipótesis consiste primero en descomponer la suma total de cuadrados en dos componentes: SST = SStratamientos + SSE Donde SST SStratamientos SSE es la suma total de cuadrados es la suma de cuadrados de los tratamientos es la suma de los cuadrados del error Las fórmulas apropiadas para calcular estas expresiones son las siguientes: a Y ..2 n SST Yij2 N i 1 j 1 Donde Y.. es la suma total de todas las observaciones N es el número total de observaciones a SStratam ientos Y i 1 2 i. n Y ..2 N Donde Yi. Es la suma total de las observaciones del i-ésimo tratamiento n es el número de observaciones para cada tratamiento SSE SST SS tratamient os Utilizando la tabla de análisis de varianza: Fuente de variación Tratamientos Error total Suma de cuadrados SStratamientos SSE SST Grados de libertad a-1 N-a N-1 Media de cuadrados MStratamientos MSE Estadístico de prueba F0 MS tratamientos MSE 2 Ing. Armando Jiménez Lizcano Donde MStratamientos MSE SStratamientos a 1 SSE N a El estadístico de prueba tiene una distribución F (Fisher) con v1 = a -1 y v2 = N -a grados de libertad en el numerador y en el denominador, respectivamente. Retomando la hipótesis anteriormente mencionada: H0: 1 = 2 = 3 = … = a = 0 Ha: i ≠ 0 El estadístico de prueba calculado en la tabla de análisis de varianza es F0 MS tratamientos MSE La hipótesis nula se rechazará cuando el estadístico de prueba sea mayor que el valor de las tablas F , a-1, Na, donde representa al nivel de significancia en la prueba. Si se rechaza la hipótesis nula concluiremos entonces que sí existen diferencias entre los tratamiento y por ende el factor si tiene efecto sobre la respuesta. En el caso del diseño desbalanceado, en el cual el número de observaciones difiere para cada tratamiento, el procedimiento es semejante; solo difiere la manera en que se calculan las sumas de los cuadrados: a ni SST Y i 1 j 1 2 ij 2 Y .. N Yi.2 Y ..2 N i 1 ni a SStratamientos 3 Ing. Armando Jiménez Lizcano Donde ni es el número de observaciones para el i-ésimo tratamiento. INTERVALOS DE CONFIANZA PARA LAS MEDIAS DE LOS TRATAMIENTOS Se pueden calcular intervalos de confianza para las medias de cada uno de los tratamientos del experimento. Para el caso balanceado, el intervalo de confianza de (1-)100% se puede calcular mediante la siguiente ecuación: Yi t 2 , N a MSE MSE i Yi t , N a 2 n n En el caso de un diseño desbalanceado, el intervalo de confianza de (1-)100% quedará de la siguiente manera: Yi t 2 , N a MSE MSE i Yi t , N a 2 ni ni De la misma manera se pueden calcular intervalos de confianza de (1-)100% para la diferencia en las medias de dos tratamientos. Para el diseño balanceado: Yi Y j t 2 , N a 2MSE 2MSE i j Yi Y j t , N a 2 n n Para el diseño desbalanceado: Yi Y j t 2 , N a 1 1 1 1 MSE i Yi Y j t , N a MSE n n n n 2 j j i i 4 Ing. Armando Jiménez Lizcano METODOS PARA COMPARAR MEDIAS ENTRE TRATAMIENTOS Se pueden comparar las medias entre los tratamientos para establecer si existe alguna diferencia entre ellos. A continuación se presentan dos de los varios métodos que existen para realizar este procedimiento. METODO DE LA MINIMA DIFERENCIA SIGNIFICATIVA (LSD) Este método consiste en comparar el valor absoluto de la diferencia en las medias entre dos tratamientos cualesquiera, con la mínima diferencia significativa o LSD por su abreviación en inglés. La mínima diferencia significativa se calcula de la siguiente manera: Para el diseño balanceado LSD t 2 , N a 2MSE n Para el diseño desbalanceado LSD t 2 , N a 1 1 MSE n n j i En general se compara el valor absoluto de la diferencia entre las medias de los dos tratamientos con el LSD, si el valor absoluto es mayor, concluiremos que las medias de los dos tratamientos son diferentes; si es menor, entonces no son diferentes. Esto es: Yi Y j LSD Yi Y j LSD Yi Yi y y Yj Yj son no diferentes son diferentes 5 Ing. Armando Jiménez Lizcano METODO DE LOS INTERVALOS MULTIPLES DE DUNCAN Este es uno de los métodos más utilizados para comparar las medias entre los tratamientos. La ventaja sobre los demás es que se puede aplicar sin importar si el diseño es balanceado o no, al evitar realizar las comparaciones por separado de acuerdo al tipo de diseño. El procedimiento para utilizar este método consta de varias partes: 1. Se ordenan las medias en forma ascendente, es decir de la mas pequeña, en cuanto a su valor hasta la más grande. 2. Se calcula el error estándar de las medias mediante la siguiente fórmula: Para el diseño balanceado: S Yi MSE n S Yi MSE nh Para el diseño desbalanceado: Donde nh a a 1 n i1 i 3. Se buscan los intervalos significativos en las tablas de los Intervalos Significativos de Duncan: r( p, f ) Donde es el nivel de significancia p = 2, 3, 4, ..., a f representa a los grados de libertad del error 4. Se convierten los intervalos anteriores a intervalos menos significativos: Rp = r( p, f )Sÿi 5. Se comparan las medias de acuerdo al siguiente procedimiento: 6 Ing. Armando Jiménez Lizcano Se resta a la media con el valor más grande la media con el valor más pequeño. Esta diferencia se compara con Ra. Si la diferencia es mayor, entonces las dos medias son diferentes. Se resta a la media con el valor más grande la media con el segundo valor más pequeño. Esta diferencia se compara con Ra-1. Si la diferencia es mayor, entonces las dos medias son diferentes. Se resta a la media con el valor mas grande la media con el tercer valor más pequeño. Esta diferencia se compara con Ra-2. Si la diferencia es mayor, entonces las media son diferentes. Así sucesivamente, hasta restar a la media con el valor más grande la media con el segundo valor más grande. Esta diferencia se compara con R2. Si la diferencia es mayor, entonces las medias son diferentes. Una vez comparada la media mas grande con todas las demás, se comprar la media con el segundo valor más grande con las demás medias, siguiendo el procedimiento anterior, sólo que ahora la primera diferencia se compara con Ra-1. Se continúa de esta manera hasta haber comparado entre sí las últimas dos medias con los valores mas pequeños. 7 Ing. Armando Jiménez Lizcano