Subido por thoanviz

Solucionario-Bioestadística-Aplicada

Anuncio
UNIVERSIDAD NACIONAL DE INGENIERÍA
Facultad de Ingeniería Ambiental
Departamento de Estudios Generales
Periodo Académico
2019 – 1
AA242 BIOESTADISTICA APLICADA
SOLUCIONARIO - EXAMEN PARCIAL
Profesor(es)
Día y hora
Indicaciones
: CASTAÑEDA SALDAÑA Beatriz, ARANA LOPEZ Sara
: 07 de Mayo del 2019 - 09-11
: Prohibido el préstamo de calculadoras. Uso de Internet y de Celulares. Las interpretaciones
deben ser en el contexto, no abstractas ni genéricas
1. Se va a construir una planta de tratamiento de residuos sólidos y se quiere conocer la opinión
de los vecinos de la localidad. Se selecciona una muestra aleatoria de 150 individuos y se
realiza un sondeo. Se piensa que el 60% de los habitantes del lugar estará a favor del
proyecto. Si esto es verdad,
a) Si sólo 81 son de tal opinión, ¿se podría poner en duda la cifra 60%?. Proporcione el nivel
crítico para este resultado en la muestra. 2p
Según lo expresado se postula
Ho: P  60% a favor del proyecto
H1: P < 60%
Con la data de la muestra calculamos p = (81/150*100) = 54%
luego calculamos la estadística Z
Z
p  P0

P0 ( 1  P0 ) / n
0.54  0.60
  1 .5
0.6 * 0.4 / 150
Calculamos nivel crítico o p-value= P(Z < -1.5) = 0.067 > 0.05
Con este resultado concluimos que el resultado de la muestra no es evidencia suficiente
para dudar que el 60% de la población de esta localidad apoye el proyecto.
b) ¿A cuántos individuos se debería encuestar para que al estimar el porcentaje de los que
están a favor, el error no exceda de 5% con 95% de confianza? 2p
Determinamos el tamaño de muestra considerando
E= 0.05
Confianza (1-) = 95%, entonces Z0.975 = 1.96
Asumimos valor preliminar de
P= 0.60
Población grande
Z12 / 2 P ( 1  P ) 1.96²( 0.6 * 0.4 )
n

 369
E²
0.05²
2. Se realiza un estudio para eliminar los efectos de los efluentes de una fábrica sobre los peces
que viven en el río que fluye junto a la fábrica. La variable de interés es el nivel total de
mercurio, en microgramos por gramo de peso, por pez en el área. Las muestras de peces se
toman en 4 puntos a lo largo del río:
I:
5,5 km por encima de la fábrica
II:
3,7 km por debajo de la fábrica
III:
21 km por debajo de la fábrica;
IV:
133 km por debajo de la fábrica.
Se obtuvieron los siguientes datos:
Nivel de mercurio
Punto de muestreo
II
III
I
0.45
0.35
0.32
0.68
0.53
0.34
0.61
0.41
0.51
0.71
x = 0.49
S2 = 0.14
1.64
1.67
1.85
1.57
1.59
1.61
1.53
1.40
1.70
1.48
x = 1.60
S2 = 0.12
IV
1.56
1.55
1.69
1.67
1.60
1.68
1.65
1.59
1.75
1.49
0.65
0.59
0.69
0.62
0.70
0.64
0.81
0.58
0.53
0.75
x = 1.62
S2 = 0.08
x  1.09 ; S ²  0.54
x = 0.66
S2 = 0.08
a) Plantee las hipótesis en forma teórica y aplicada 2p
Ho: No hay impacto con la contaminación con mercurio de los peces por efecto de los
efluentes de la fábrica, el promedio de mercurio por gramo de peso es el mismo en
los 4 puntos de muestreo (Ho: I =II =III =IV)
H1: Hay impacto de contaminación con mercurio de los peces por efecto de los efluentes
de la fábrica, el promedio de mercurio por gramo de peso no es el mismo en los 4
puntos de muestreo (H1 : I II III IV)
b) Asuma distribución normal y analice si las varianzas son semejantes o diferentes. 2p
Formulamos las hipótesis:
H0: Las varianzas de los niveles de mercurio en los peces de los cuatro puntos
de muestreo son semejantes (H0: 21 = 22 = 23 = 24 )
H1: En alguno de los puntos de muestreo la varianza de los niveles de mercurio
difiere de la varianza de alguno de los otros puntos de muestreo. (H1: 2i 
2j ; para algún i  j )
Operamos la data para calcular la estadística de la prueba de Bartlet
Puntos de muestreo
II
9
III
9
IV
9
Suma
ni –1
I
9
(ni –1)S2i
9x0.14
9x0.12
9x0.08
9x0.08
5.959
(ni –1)log S2i -3.112
-10.022
-9.897
-11.365
-34.396
Operamos la estadística


 k ( n  1 )S 2  

k
i 

 i
   ( ni  1 ) log S i2
ln( 10 ) ( N  k )  log  i 1

N k
1



 







X2 
k 1
1
1 
1



3( k  1 )  1 ni  1 N  k 
36





Obtenemos X²= 1.105
Calculamos el p-value= P(X²(3) >1.105) = 0.776
Con este resultado concluimos que las varianzas de los niveles de mercurio en los
peces no difieren de manera significativa y podemos asumir que son semejantes.
c) Ejecute el análisis de comparación de medias con la prueba ANOVA, incluyendo la
comparación múltiple de los promedios, si es pertinente. Interprete todos los resultados.
3p
Para analizar las hipótesis de la comparación de medias
Ho: I =II =III =IV H1 : I II III IV
aplicamos la prueba ANOVA, por lo que construimos la tabla ANOVA
k
SCG 
 ( x i  x ) 2 n i =10.859
SCE 
 S 2i (n i  1) = 3.78
i 1
k
i 1
SCT  SCG  SCE =14.639
Fuente de Suma de Grados de Cuadrado Razón Probabilidad
variación Cuadrados Libertad
Medio
F
P
Grupos
Error
Total
10.859
3.78
14.639
3
36
39
3.620
0.105
34.47
< 0.001
El resultado nos indica que hay diferencias significativas en los promedios de mercurio
por gramo de peso.
Comparación múltiple – Prueba de Tukey
W  q0.05( 4 , 36 )
CME / n  3.79 0.105 / 10  0.388
 x 1 - x 2 = 1.11*
 x 1 - x 3 = 1.13*
 x 1 - x 4 = 0.17
 x 2 - x 3 = 0.02
 x 2 - x 4 = 0.94*
 x 3 - x 4 = 0.96*
Con estos resultados podemos concluir que los niveles de mercurio en los
peces son significativamente mayores a 3.7km y 21 km debajo de la fábrica
respecto de los niveles encontrados en los peces a 5.5 km arriba de la fábrica
y a 133 km debajo de la fábrica, ello nos lleva a proponer que es urgente que
se aplique un tratamiento a los efluentes de la fábrica porque están
contaminando a los preces con mercurio.
3. El ozono es un componente que puede causar daños en plantas sensibles. En 1979 se ha
establecido en E.E.U.U. una norma federal para la concentración de ozono con nivel máximo
de 0,12 ppm (partes por millón). Se sospecha que las concentraciones actuales en el aire
exceden dicho nivel. A fin de verificarlo, se han obtenido muestras de aire en 40 estaciones.
a) Especifique la hipótesis nula y alternativa para verificar la suposición. 1p
Ho:   0.12 ppm
La concentración máxima de ozono supera a 0.12 ppm
H1:  < 0.12 ppm
Si el promedio es significativamente menor que 0.12 ppm, entonces las concentraciones
máxima de ozono no pasará de 0.12 ppm
b) El análisis de los datos revela una media muestral de 0,115 con una desviación estándar
muestral de 0,03. ¿Puede rechazarse la sospecha existente con un nivel de significancia
 = 0,01? Halle el valor p de la prueba y de una interpretación del mismo. 3p
Aplicamos la prueba Z, dado que la muestra es grande y la varianza es desconocida
Z 
x  0
0.115  0.12

 1.05
S/ n
0.03 / 40
Calculamos el p-value= P(Z < -1.05) = 0.146 > 0.05
Este resultado nos indica que el promedio de las concentraciones no difiere
significativamente del nivel máximo 0.12 ppm, lo que implica que las concentraciones de
ozono exceden los niveles máximos permisibles.
c) Obtenga un intervalo de confianza del 95% para la concentración media de ozono, y
comente su relación con el contraste de hipótesis de los apartados anteriores. 2p
Calculamos los límites para la estimación por intervalo del promedio
L  x  Z 1 / 2
S
 0.03 
 0.115  1.96
  0.115  0.009
n
 40 
IC 95% para la concentración media de ozono: Li= 0.106 ppm ; Ls=0.124 ppm
Este resultado confirma que los niveles máximos de concentración de ozono superan a
0.12 ppm, dado que con 95% de confianza se estima que el promedio puede ser de
hasta 0.124 ppm.
4. Se quiere contrastar el contenido de azúcar de distintos cargamentos de remolacha. Se sabe
que el contenido medio de azúcar para remolacha de regadío es del 18% con una media
superior para el secano, siendo la desviación típica del 6% en ambos casos. Se toma una
muestra de 20 cargamentos.
¿Qué valor de la media permitirá tomar la decisión sobre si la remolacha es de secano o de
regadío, al nivel del 5%? 3p
La cantidad solicitada se determina en el procedimiento de prueba para las hipótesis:
H0:   18% de contenido de azúcar, es decir, el cargamento de remolacha es de regadío
H1:  > 18% de contenido de azúcar, es decir el cargamento de remolacha es de secano
Considerando un nivel de significancia del 5% la región de rechazo será si
Z
x  0
 Z 0.95
/ n
Remplazando con la data
Z
x  18
 1.645
6 / 20
 x  20.21%
Entonces se decidirá que la remolacha es de secano si el promedio de contenido de
azúcar supera el 20.21%, en caso contrario se asumirá que la remolacha es de regadío.
Descargar