Revisado_marzo_2015_LWB Efectos Aleatorios y Mixtos. Diseños Anidados PARTE I 1. La figura abajo es de una isla imaginaria con las localidades de humedales representadas con diamantes y hexágonos. En la isla hay dos tipos de humedales: alimentados por agua de precipitación (P – los hexágonos) y alimentados por agua subterránea (ST – los diamantes). Con el objetivo de determinar si la fuente de agua alimentando un humedal influía sobre las tasas de producción de metano, se muestrearon tres humedales de cada tipo de agua. Estos tres humedales (rotulados 1, 2, y 3 en la figura) se eligieron aleatoriamente de un conjunto grande de humedales que tenían cada tipo de agua. En cada humedal seleccionado, se obtuvieron 3 muestras de suelo (en lugares aleatoriamente elegidos dentro de cada humedal). Estas muestras se transportaron al laboratorio y se incubaron a temperatura constante. Las tasas de producción de metano que se obtuvieron aparecen en la tabla en la próxima página. a. ¿Son los efectos de tipo de humedal fijos o aleatorios? b. ¿Son los efectos de humedal fijos o aleatorios? c. La estructura ¿es factorial o anidada? d. Defina los valores de a= b= n= e. Prepare una tabla de ANOVA con las fuentes de variación, los grados de libertad y los cuadrados medios esperados. AGRO 6600 – LAB 9 Page 1 Revisado_marzo_2015_LWB Tipo de Agua Humedal muestreado Muestra (dentro de humedales) producción metano (umol/l/hr) ST 1 1 6.63 ST 1 2 6.77 ST 1 3 5.64 ST 2 1 12.4 ST 2 2 13.5 ST 2 3 11.9 ST 3 1 7.64 ST 3 2 6.18 ST 3 3 5.42 P 1 1 1.74 P 1 2 2.55 P 1 3 2.09 P 2 1 0.59 P 2 2 0.32 P 2 3 0.8 P 3 1 1.98 P 3 2 4.56 P 3 3 3.67 f. Formule y pruebe las hipótesis de interés. Use Infostat y SAS para obtener e interpretar sus conclusiones. Favor de considerar la explicación de modelos que aparece en las últimas dos páginas de este laboratorio!! g. Realice un intervalo de confianza del 95% para la diferencia entre las tasas de producción de metano en humedales con agua subterránea y con agua de precipitación. h. Estime todas las componentes de varianza presentes en este modelo (p 47 en las notas de conferencia). 2. El Departamento de Transportación desea realizar un estudio para evaluar la erosión del suelo en áreas con pendiente cercanas a futuras autopistas. Entre las posibles especies a ser usadas, se tomó una muestra aleatoria de 6 especies vegetales nativas que podrían servir como coberturas (es decir que crecen en forma rastrera y podrían controlar la erosión). En un área con pendiente cercana a una futura autopista se dispusieron 36 parcelas. En el mes de enero se sembraron 12 de estas parcelas aleatoriamente escogidas (dos parcelas con cada especie), en el mes de mayo se sembraron otras 12 parcelas aleatoriamente escogidas (dos parcelas con cada especie), y finalmente en el mes de septiembre se sembraron las 12 restantes (dos con cada especie). Se midió el porcentaje de cobertura del suelo a los dos años de implantadas las parcelas. AGRO 6600 – LAB 9 Page 2 Revisado_marzo_2015_LWB mes enero enero enero enero enero enero enero enero enero enero enero enero mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo septi septi septi septi septi septi septi septi septi septi septi septi especie 1 1 2 2 3 3 4 4 5 5 6 6 1 1 2 2 3 3 4 4 5 5 6 6 1 1 2 2 3 3 4 4 5 5 6 6 repet 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 cobertura 63.9 66.6 69.8 68.5 67.2 70.5 66.4 63.5 61.4 65.7 68.1 68.4 69.1 70.1 72.5 70.7 63.9 65.2 71.9 69.9 67.7 67.1 68.7 72 76.5 70.9 74.3 73.8 73.4 72.3 77.4 78.9 75.3 74.6 73.9 75.6 a. ¿Son las especies fijas o aleatorias? b. ¿Son las épocas fijas o aleatorias? c. La estructura ¿es factorial o anidada? d. Defina los valores de a= b= n= AGRO 6600 – LAB 9 Page 3 Revisado_marzo_2015_LWB e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios esperados. f. Formule y pruebe las hipótesis de interés. Use Infostat para obtener e interpretar sus conclusiones. g. Compare las medias de épocas mediante una prueba de Tukey usando α=0.05. h. Estime todas las componentes de varianza presentes en este modelo. Parte II Para cada una de las siguientes situaciones: a. decida cuáles son los factores en estudio, y los niveles de cada uno. b. decida cuál es el diseño experimental usado. c. decida si cada factor constituye un efecto fijo o aleatorio. d. decida si los factores están anidados (diseño anidado) o cruzados (experimento factorial). e. realice un esquema de la tabla de ANOVA que incluya fuentes de variación, grados de libertad y estadísticos F. 1. 2. 3. 4. 5. 6. 7. Con el objeto de comparar las tres marcas más comúnmente usadas de aceite para automóvil, se tomaron 24 motores, 12 de cada uno de dos fabricantes (estos dos fabricantes son los dos que normalmente proveen este tipo de motores. Cada marca de aceite se usó en cuatro motores de cada fabricante (elegidos aleatoriamente) y luego de esto los motores se vaciaron y se hicieron funcionar sin aceite. Se registró el tiempo en que cada motor dejó de funcionar. Una compañía farmacéutica desea examinar la potencia de un medicamento líquido que se mezcla en tambores grandes antes de ser embotellado. Para ello se eligen aleatoriamente 4 plantas de producción, y en cada planta se escogen 5 tambores (también aleatoriamente). De cada tambor se analizan cuatro muestras aleatoriamente tomadas del líquido. Después de realizar un cruzamiento de varias líneas de maíz, se desea evaluar la variabilidad genética generada por estos cruzamientos. Para ello se seleccionan al azar 10 líneas (de las 250 disponibles) y se siembran de acuerdo a un diseño en bloques completos al azar con 4 repeticiones. Se desea comparar la calidad de naranjas de tres variedades cosechadas en tres épocas diferentes (20 de diciembre, 20 de enero y 20 de febrero) en una estación experimental. Para ello se analizan 10 naranjas de cada variedad tomadas aleatoriamente en cada una de las fechas y se determina la concentración de azúcar en cada una. Se estudió el consumo de oxígeno de dos especies de ostras bajo distintos niveles de concentración de agua de mar (50%, 75% y 100%). Para ello se usaron 24 piletas, que se llenaron con agua destilada y de mar en la concentración respectiva (8 con 50% de agua de mar, 8 con 75%, y 8 con 100%; seleccionadas aleatoriamente). Se colocaron ostras de la especie A en 12 piletas (cuatro con cada concentración, elegidas aleatoriamente), y ostras de la especie B en las otras 12 piletas. Se registró el consumo (l O2 / mg de peso corporal seco / min) a 22C. En el mes de enero, cinco muestras de suelo se toman aleatoriamente en cada una de 6 localidades (también escogidas aleatoriamente) dentro de un área contaminada que está siendo limpiada. Las mismas 6 localidades se muestrean nuevamente (5 muestras aleatorias en cada una) durante el mes de junio. Las muestras se analizan para determinar la concentración de derivados de insecticidas clorados. Se compara la producción diaria de leche bajo 12 dietas diferentes. Las 12 dietas son todas las combinaciones de 3 niveles de vitamina A (0, 10 y 20 mg/kg), 2 fuentes proteicas (harina de pescado y AGRO 6600 – LAB 9 Page 4 Revisado_marzo_2015_LWB harina de soya), con y sin suplementación mineral. Cuatro vacas se asignaron aleatoriamente a cada una de las dietas. 8. Se desea comparar el peso de conejos entrampados en distintas semanas en varios bosques de un área de interés. Para ello se eligen al azar cuatro bosques en el área. En cada bosque se colocan aleatoriamente 10 trampas (cada trampa tiene lugar para exactamente un conejo). Luego de una semana se retiran los conejos entrampados y se registra su peso. Las 10 trampas vuelven a ubicarse aleatoriamente en el bosque, se espera una semana y se registra el peso de los conejos entrampados. Este proceso se repite hasta tener cuatro semanas de datos. Definiendo los modelos en InfoStat y SAS: Información adicional usando el ejemplo de las notas de conferencia (cartones de jugo de china). Queremos saber si hay diferencias en el contenido de vitamina C de jugo de china de dos marcas diferentes (A, B). Elegimos aleatoriamente 6 cartones de cada una de las marcas, y de cada cartón tomamos 2 muestras aleatorias de 1 oz. y las analizamos. (a=6; b=2; n=2) (#observaciones = a*b*n = 6*2*2 = 24) F. de V. Marca Cartón(Marca) a-1 a(b-1) G. L. 5 6 Error Total ab(n-1) abn-1 12 23 Comentarios Se lee esto como “cartón dentro de marca”. A veces es escrito como “Cartón/Marca” (con un “/” en vez de paréntesis). La fuente de variación Cartón(Marca) es la suma de efecto de Cartón + Cartón*Marca. Los grados de libertad también son la suma de los gl de carton + gl de cartón*marca (1 + (1*5) = 6 G.L. InfoStat usa el símbolo “>” para indicar la jerarquía de los efectos. “Marca>Cartón” quiere decir que cartón está en un nivel más abajo en la jerarquía comparado con marca (piénsalo como “marca mayor que cartón” o “cartón menor que marca”). Al contrario, SAS usa paréntesis para encerrar el efecto más alto en la jerarquía, y este efecto viene después del efecto más abajo (“cartón dentro de marca”). En otras palabras “marca jerárquicamente mayor que cartón” (en InfoStat) es exactamente lo mismo como el concepto de “cartón dentro de marca” (en SAS)! En InfoStat, el efecto después del “\” (circulado en el ejemplo abajo) es el denominador en la prueba de F. Por ejemplo, aquí “Marca\Marca>Cartón” quiere decir que “Marca>Cartón” es el denominador en la prueba de F para “Marca”. En SAS, se utiliza el comando “test” seguido por el efecto de ser probado (“h” o “hipótesis”) y el denominador de la prueba (“e” o “error”) AGRO 6600 – LAB 9 Page 5 Revisado_marzo_2015_LWB En resumen: Como designar la fuente de variación “Cartón dentro de Marca” Piénselo así: Como hacer la prueba de F de Marca En InfoStat Marca>Cartón En SAS Carton(Marca) “marca jerárquicamente mayor que cartón” (o “cartón menor que marca”) Marca\Marca>Cartón “cartón dentro de marca” test h=Marca e=Carton(Marca); En InfoStat: (note el uso de “ \ ” para definir como hacer la prueba de F) En SAS: model vitam = marca carton(marca); test h=marca e=carton(marca); AGRO 6600 – LAB 9 Page 6