Lab 9 - Uprm

Anuncio
Revisado_marzo_2015_LWB
Efectos Aleatorios y Mixtos. Diseños Anidados
PARTE I
1. La figura abajo es de una isla imaginaria con las localidades de humedales representadas con diamantes y
hexágonos. En la isla hay dos tipos de humedales: alimentados por agua de precipitación (P – los
hexágonos) y alimentados por agua subterránea (ST – los diamantes). Con el objetivo de determinar si la
fuente de agua alimentando un humedal influía sobre las tasas de producción de metano, se muestrearon tres
humedales de cada tipo de agua. Estos tres humedales (rotulados 1, 2, y 3 en la figura) se eligieron
aleatoriamente de un conjunto grande de humedales que tenían cada tipo de agua. En cada humedal
seleccionado, se obtuvieron 3 muestras de suelo (en lugares aleatoriamente elegidos dentro de cada
humedal). Estas muestras se transportaron al laboratorio y se incubaron a temperatura constante. Las tasas
de producción de metano que se obtuvieron aparecen en la tabla en la próxima página.
a. ¿Son los efectos de tipo de humedal fijos o aleatorios?
b. ¿Son los efectos de humedal fijos o aleatorios?
c. La estructura ¿es factorial o anidada?
d. Defina los valores de
a=
b=
n=
e. Prepare una tabla de ANOVA con las fuentes de variación, los grados de libertad y los cuadrados
medios esperados.
AGRO 6600 – LAB 9
Page 1
Revisado_marzo_2015_LWB
Tipo
de
Agua
Humedal
muestreado
Muestra
(dentro de
humedales)
producción
metano
(umol/l/hr)
ST
1
1
6.63
ST
1
2
6.77
ST
1
3
5.64
ST
2
1
12.4
ST
2
2
13.5
ST
2
3
11.9
ST
3
1
7.64
ST
3
2
6.18
ST
3
3
5.42
P
1
1
1.74
P
1
2
2.55
P
1
3
2.09
P
2
1
0.59
P
2
2
0.32
P
2
3
0.8
P
3
1
1.98
P
3
2
4.56
P
3
3
3.67
f. Formule y pruebe las hipótesis de interés. Use Infostat y SAS para obtener e interpretar sus
conclusiones. Favor de considerar la explicación de modelos que aparece en las últimas dos
páginas de este laboratorio!!
g. Realice un intervalo de confianza del 95% para la diferencia entre las tasas de producción de metano en
humedales con agua subterránea y con agua de precipitación.
h. Estime todas las componentes de varianza presentes en este modelo (p 47 en las notas de conferencia).
2. El Departamento de Transportación desea realizar un estudio para evaluar la erosión del suelo en áreas con
pendiente cercanas a futuras autopistas. Entre las posibles especies a ser usadas, se tomó una muestra
aleatoria de 6 especies vegetales nativas que podrían servir como coberturas (es decir que crecen en forma
rastrera y podrían controlar la erosión). En un área con pendiente cercana a una futura autopista se
dispusieron 36 parcelas. En el mes de enero se sembraron 12 de estas parcelas aleatoriamente escogidas (dos
parcelas con cada especie), en el mes de mayo se sembraron otras 12 parcelas aleatoriamente escogidas (dos
parcelas con cada especie), y finalmente en el mes de septiembre se sembraron las 12 restantes (dos con
cada especie). Se midió el porcentaje de cobertura del suelo a los dos años de implantadas las parcelas.
AGRO 6600 – LAB 9
Page 2
Revisado_marzo_2015_LWB
mes
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
especie
1
1
2
2
3
3
4
4
5
5
6
6
1
1
2
2
3
3
4
4
5
5
6
6
1
1
2
2
3
3
4
4
5
5
6
6
repet
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
cobertura
63.9
66.6
69.8
68.5
67.2
70.5
66.4
63.5
61.4
65.7
68.1
68.4
69.1
70.1
72.5
70.7
63.9
65.2
71.9
69.9
67.7
67.1
68.7
72
76.5
70.9
74.3
73.8
73.4
72.3
77.4
78.9
75.3
74.6
73.9
75.6
a. ¿Son las especies fijas o aleatorias?
b. ¿Son las épocas fijas o aleatorias?
c. La estructura ¿es factorial o anidada?
d. Defina los valores de
a=
b=
n=
AGRO 6600 – LAB 9
Page 3
Revisado_marzo_2015_LWB
e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios
esperados.
f. Formule y pruebe las hipótesis de interés. Use Infostat para obtener e interpretar sus conclusiones.
g. Compare las medias de épocas mediante una prueba de Tukey usando α=0.05.
h. Estime todas las componentes de varianza presentes en este modelo.
Parte II
Para cada una de las siguientes situaciones:
a. decida cuáles son los factores en estudio, y los niveles de cada uno.
b. decida cuál es el diseño experimental usado.
c. decida si cada factor constituye un efecto fijo o aleatorio.
d. decida si los factores están anidados (diseño anidado) o cruzados (experimento factorial).
e. realice un esquema de la tabla de ANOVA que incluya fuentes de variación, grados de libertad y
estadísticos F.
1.
2.
3.
4.
5.
6.
7.
Con el objeto de comparar las tres marcas más comúnmente usadas de aceite para automóvil, se tomaron 24
motores, 12 de cada uno de dos fabricantes (estos dos fabricantes son los dos que normalmente proveen este
tipo de motores. Cada marca de aceite se usó en cuatro motores de cada fabricante (elegidos
aleatoriamente) y luego de esto los motores se vaciaron y se hicieron funcionar sin aceite. Se registró el
tiempo en que cada motor dejó de funcionar.
Una compañía farmacéutica desea examinar la potencia de un medicamento líquido que se mezcla en
tambores grandes antes de ser embotellado. Para ello se eligen aleatoriamente 4 plantas de producción, y en
cada planta se escogen 5 tambores (también aleatoriamente). De cada tambor se analizan cuatro muestras
aleatoriamente tomadas del líquido.
Después de realizar un cruzamiento de varias líneas de maíz, se desea evaluar la variabilidad genética
generada por estos cruzamientos. Para ello se seleccionan al azar 10 líneas (de las 250 disponibles) y se
siembran de acuerdo a un diseño en bloques completos al azar con 4 repeticiones.
Se desea comparar la calidad de naranjas de tres variedades cosechadas en tres épocas diferentes (20 de
diciembre, 20 de enero y 20 de febrero) en una estación experimental. Para ello se analizan 10 naranjas de
cada variedad tomadas aleatoriamente en cada una de las fechas y se determina la concentración de azúcar
en cada una.
Se estudió el consumo de oxígeno de dos especies de ostras bajo distintos niveles de concentración de agua
de mar (50%, 75% y 100%). Para ello se usaron 24 piletas, que se llenaron con agua destilada y de mar en la
concentración respectiva (8 con 50% de agua de mar, 8 con 75%, y 8 con 100%; seleccionadas
aleatoriamente). Se colocaron ostras de la especie A en 12 piletas (cuatro con cada concentración, elegidas
aleatoriamente), y ostras de la especie B en las otras 12 piletas. Se registró el consumo (l O2 / mg de peso
corporal seco / min) a 22C.
En el mes de enero, cinco muestras de suelo se toman aleatoriamente en cada una de 6 localidades (también
escogidas aleatoriamente) dentro de un área contaminada que está siendo limpiada. Las mismas 6
localidades se muestrean nuevamente (5 muestras aleatorias en cada una) durante el mes de junio. Las
muestras se analizan para determinar la concentración de derivados de insecticidas clorados.
Se compara la producción diaria de leche bajo 12 dietas diferentes. Las 12 dietas son todas las
combinaciones de 3 niveles de vitamina A (0, 10 y 20 mg/kg), 2 fuentes proteicas (harina de pescado y
AGRO 6600 – LAB 9
Page 4
Revisado_marzo_2015_LWB
harina de soya), con y sin suplementación mineral. Cuatro vacas se asignaron aleatoriamente a cada una de
las dietas.
8. Se desea comparar el peso de conejos entrampados en distintas semanas en varios bosques de un área de
interés. Para ello se eligen al azar cuatro bosques en el área. En cada bosque se colocan aleatoriamente 10
trampas (cada trampa tiene lugar para exactamente un conejo). Luego de una semana se retiran los conejos
entrampados y se registra su peso. Las 10 trampas vuelven a ubicarse aleatoriamente en el bosque, se espera
una semana y se registra el peso de los conejos entrampados. Este proceso se repite hasta tener cuatro
semanas de datos.
Definiendo los modelos en InfoStat y SAS:
Información adicional usando el ejemplo de las notas de conferencia (cartones de jugo de china).
Queremos saber si hay diferencias en el contenido de vitamina C de jugo de china de dos marcas diferentes (A,
B). Elegimos aleatoriamente 6 cartones de cada una de las marcas, y de cada cartón tomamos 2 muestras
aleatorias de 1 oz. y las analizamos. (a=6; b=2; n=2) (#observaciones = a*b*n = 6*2*2 = 24)
F. de V.
Marca
Cartón(Marca)
a-1
a(b-1)
G. L.
5
6
Error
Total
ab(n-1)
abn-1
12
23
Comentarios
Se lee esto como “cartón dentro de marca”. A veces es escrito como
“Cartón/Marca” (con un “/” en vez de paréntesis).
La fuente de variación Cartón(Marca) es la suma de efecto de Cartón +
Cartón*Marca. Los grados de libertad también son la suma de los gl de
carton + gl de cartón*marca
(1 + (1*5) = 6 G.L.
InfoStat usa el símbolo “>” para indicar la jerarquía de los efectos. “Marca>Cartón” quiere decir que cartón está
en un nivel más abajo en la jerarquía comparado con marca (piénsalo como “marca mayor que cartón” o
“cartón menor que marca”).
Al contrario, SAS usa paréntesis para encerrar el efecto más alto en la jerarquía, y este efecto viene después del
efecto más abajo (“cartón dentro de marca”). En otras palabras “marca jerárquicamente mayor que
cartón” (en InfoStat) es exactamente lo mismo como el concepto de “cartón dentro de marca” (en SAS)!
En InfoStat, el efecto después del “\” (circulado en el ejemplo abajo) es el denominador en la prueba de F. Por
ejemplo, aquí “Marca\Marca>Cartón” quiere decir que “Marca>Cartón” es el denominador en la prueba de F
para “Marca”.
En SAS, se utiliza el comando “test” seguido por el efecto de ser probado (“h” o “hipótesis”) y el denominador
de la prueba (“e” o “error”)
AGRO 6600 – LAB 9
Page 5
Revisado_marzo_2015_LWB
En resumen:
Como designar la
fuente de variación
“Cartón dentro de
Marca”
Piénselo así:
Como hacer la prueba
de F de Marca
En InfoStat
Marca>Cartón
En SAS
Carton(Marca)
“marca jerárquicamente mayor que
cartón”
(o “cartón menor que marca”)
Marca\Marca>Cartón
“cartón dentro de marca”
test h=Marca e=Carton(Marca);
En InfoStat: (note el uso de “ \ ” para definir como hacer la prueba de F)
En SAS:
model vitam = marca carton(marca);
test h=marca e=carton(marca);
AGRO 6600 – LAB 9
Page 6
Descargar