1.1 Ejemplo de un ANOVA clasificación simple. Se lleva a cabo un estudio para evaluar cuatro dietas (D1; D2; D3; D4), con el propósito de comparar la efectividad de la dieta en la pérdida de peso en personas que asisten a un gimnasio. La dieta se suministró durante 15 días. La población es el conjunto de personas que asisten al gimnasio. El factor de análisis o variable explicativa es la dieta (tratamientos). La forma de medir la efectividad de la dieta se hace mediante la evaluación de la pérdida o ganancia de peso (diferencia entre peso final y peso inicial) para cada uno de las personas incluidas en el experimento. Esta ganancia o pérdida es la variable respuesta que se obtiene de cada persona tratada, siendo las personas las correspondientes unidades experimentales. Para este estudio se seleccionaron 20 personas y se asignaron aleatoriamente 5 a cada dieta. Para que el diseño sea completamente aleatorizado se requiere primero seleccionar una muestra al azar de 20 personas de la población y segundo distribuir las dietas a las personas también en forma aleatoria. La teoría de muestreo dice cómo seleccionar las 20 personas conocida cierta información sobre la conformación de la población tal como el acceso de las personas al gimnasio, el tiempo que dura la investigación, etc. Si la llegada de personas al gimnasio es frecuente, podrían seleccionarse las 20 personas entre las 100 o 300 que ingresan, utilizando una tabla de números aleatorios o generando éstos a partir del uso de algún software estadístico. Si la disponibilidad de personas es menor, podría seguirse un muestreo sistemático, por ejemplo, una de cada dos o una de cada tres que llegan. Aquí las UE son las 20 personas en el orden de selección v1, v2, …, v20 a las cuales se le asignan los respectivos tratamientos. La Tabla 4.1 muestra la asignación aleatoria de las 4 dietas a las personas involucradas en este problema. Tabla 4.1 Asignación aleatoria de 4 dietas a 20 unidades experimentales Repeticiones 1 2 3 4 5 D1 D2 v7 v1 v11 v2 v12 v6 v17 v14 v18 v3 D3 D4 v10 v8 v4 v19 v15 v5 v13 v9 v16 v20 La Tabla 4.2 muestra la pérdida o ganancia de peso en kilogramos de las personas que asisten al gimnasio. Tabla 4.2 Pérdida o ganancia de peso en Kg de las personas Repeticiones D1 D2 D3 D4 1 -9.3 -10.1 1.5 -3.2 2 2.5 -5.0 -2.0 -5.6 3 -5.4 -7.2 -0.5 -8.4 4 -3.6 -9.2 3.4 -5.3 5 1.7 -8.1 -2.5 -1.4 -14.1 -39.6 -0.1 -23.9 Totales -2.82 -7.92 -0.02 -4.78 Medias 24.5 3.87 6.08 6.99 Varianzas 1.2 ANOVA En la Tabla 4.4 se muestra la información sobre el ANOVA asociada al modelo del DCA Tabla 4.4 Análisis de varianza con base en el modelo del DCA C de V Coeficientes de variación Tratamientos gl Grados de libertad t–1 SC Sumas de Cuadrados SCTra CM Cuadrados Medios CMTra Error Total n–t n–1 SCE SCT CME 𝑡 𝑆𝐶𝑇𝑟𝑎 = ∑ 𝑟𝑖 (𝑦̅𝑖. − 𝑦̅.. )2 𝑖=1 𝑡 𝑟𝑖 𝑆𝐶𝐸 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. ) 𝑖=1 𝑗=1 𝑆𝐶𝑇 = 𝑆𝐶𝑇𝑟𝑎 + 𝑆𝐶𝐸 𝐶𝑀𝑇𝑟𝑎 = 𝐶𝑀𝐸 = 𝑆𝐶𝑇𝑟𝑎 𝑡−1 𝑆𝐶𝐸 𝑛−𝑡 2 F Estadístico F 𝐶𝑀𝑇𝑟𝑎 𝐶𝑀𝐸 Es de interés en esta investigación comprobar la hipótesis de igualdad de dietas, de la forma: 𝐻0 : 𝐷1 = ⋯ = 𝐷4 𝑣𝑠 𝐻1 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑖𝑒𝑡𝑎 𝑑𝑖𝑓𝑖𝑒𝑟𝑒 𝑒𝑛 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 La información que aparece en la Tabla 4.5 permite tomar la decisión de rechazar la hipótesis nula puesto que: 𝐹 = 5.33 > 𝐹(3,16;0.05) = 3.24 De esta forma se encuentran diferencias medias entre las dietas aplicadas a las unidades experimentales (20 personas) Tabla 4.5 Análisis de varianza para los datos en el ejemplo del estudio sobre dietas C de V Causas de variación Dieta Error Total gl Grados de libertad 3 16 19 SC Sumas de Cuadrados 165.77 165.73 331.50 CM Cuadrados Medios 55.25 10.35 F Estadístico F 5.33