UNIVERSIDAD NACIONAL DE INGENIERÍA Facultad de Ingeniería Ambiental Departamento de Estudios Generales Periodo Académico 2019 – 1 AA242 BIOESTADISTICA APLICADA SOLUCIONARIO - EXAMEN PARCIAL Profesor(es) Día y hora Indicaciones : CASTAÑEDA SALDAÑA Beatriz, ARANA LOPEZ Sara : 07 de Mayo del 2019 - 09-11 : Prohibido el préstamo de calculadoras. Uso de Internet y de Celulares. Las interpretaciones deben ser en el contexto, no abstractas ni genéricas 1. Se va a construir una planta de tratamiento de residuos sólidos y se quiere conocer la opinión de los vecinos de la localidad. Se selecciona una muestra aleatoria de 150 individuos y se realiza un sondeo. Se piensa que el 60% de los habitantes del lugar estará a favor del proyecto. Si esto es verdad, a) Si sólo 81 son de tal opinión, ¿se podría poner en duda la cifra 60%?. Proporcione el nivel crítico para este resultado en la muestra. 2p Según lo expresado se postula Ho: P 60% a favor del proyecto H1: P < 60% Con la data de la muestra calculamos p = (81/150*100) = 54% luego calculamos la estadística Z Z p P0 P0 ( 1 P0 ) / n 0.54 0.60 1 .5 0.6 * 0.4 / 150 Calculamos nivel crítico o p-value= P(Z < -1.5) = 0.067 > 0.05 Con este resultado concluimos que el resultado de la muestra no es evidencia suficiente para dudar que el 60% de la población de esta localidad apoye el proyecto. b) ¿A cuántos individuos se debería encuestar para que al estimar el porcentaje de los que están a favor, el error no exceda de 5% con 95% de confianza? 2p Determinamos el tamaño de muestra considerando E= 0.05 Confianza (1-) = 95%, entonces Z0.975 = 1.96 Asumimos valor preliminar de P= 0.60 Población grande Z12 / 2 P ( 1 P ) 1.96²( 0.6 * 0.4 ) n 369 E² 0.05² 2. Se realiza un estudio para eliminar los efectos de los efluentes de una fábrica sobre los peces que viven en el río que fluye junto a la fábrica. La variable de interés es el nivel total de mercurio, en microgramos por gramo de peso, por pez en el área. Las muestras de peces se toman en 4 puntos a lo largo del río: I: 5,5 km por encima de la fábrica II: 3,7 km por debajo de la fábrica III: 21 km por debajo de la fábrica; IV: 133 km por debajo de la fábrica. Se obtuvieron los siguientes datos: Nivel de mercurio Punto de muestreo II III I 0.45 0.35 0.32 0.68 0.53 0.34 0.61 0.41 0.51 0.71 x = 0.49 S2 = 0.14 1.64 1.67 1.85 1.57 1.59 1.61 1.53 1.40 1.70 1.48 x = 1.60 S2 = 0.12 IV 1.56 1.55 1.69 1.67 1.60 1.68 1.65 1.59 1.75 1.49 0.65 0.59 0.69 0.62 0.70 0.64 0.81 0.58 0.53 0.75 x = 1.62 S2 = 0.08 x 1.09 ; S ² 0.54 x = 0.66 S2 = 0.08 a) Plantee las hipótesis en forma teórica y aplicada 2p Ho: No hay impacto con la contaminación con mercurio de los peces por efecto de los efluentes de la fábrica, el promedio de mercurio por gramo de peso es el mismo en los 4 puntos de muestreo (Ho: I =II =III =IV) H1: Hay impacto de contaminación con mercurio de los peces por efecto de los efluentes de la fábrica, el promedio de mercurio por gramo de peso no es el mismo en los 4 puntos de muestreo (H1 : I II III IV) b) Asuma distribución normal y analice si las varianzas son semejantes o diferentes. 2p Formulamos las hipótesis: H0: Las varianzas de los niveles de mercurio en los peces de los cuatro puntos de muestreo son semejantes (H0: 21 = 22 = 23 = 24 ) H1: En alguno de los puntos de muestreo la varianza de los niveles de mercurio difiere de la varianza de alguno de los otros puntos de muestreo. (H1: 2i 2j ; para algún i j ) Operamos la data para calcular la estadística de la prueba de Bartlet Puntos de muestreo II 9 III 9 IV 9 Suma ni –1 I 9 (ni –1)S2i 9x0.14 9x0.12 9x0.08 9x0.08 5.959 (ni –1)log S2i -3.112 -10.022 -9.897 -11.365 -34.396 Operamos la estadística k ( n 1 )S 2 k i i ( ni 1 ) log S i2 ln( 10 ) ( N k ) log i 1 N k 1 X2 k 1 1 1 1 3( k 1 ) 1 ni 1 N k 36 Obtenemos X²= 1.105 Calculamos el p-value= P(X²(3) >1.105) = 0.776 Con este resultado concluimos que las varianzas de los niveles de mercurio en los peces no difieren de manera significativa y podemos asumir que son semejantes. c) Ejecute el análisis de comparación de medias con la prueba ANOVA, incluyendo la comparación múltiple de los promedios, si es pertinente. Interprete todos los resultados. 3p Para analizar las hipótesis de la comparación de medias Ho: I =II =III =IV H1 : I II III IV aplicamos la prueba ANOVA, por lo que construimos la tabla ANOVA k SCG ( x i x ) 2 n i =10.859 SCE S 2i (n i 1) = 3.78 i 1 k i 1 SCT SCG SCE =14.639 Fuente de Suma de Grados de Cuadrado Razón Probabilidad variación Cuadrados Libertad Medio F P Grupos Error Total 10.859 3.78 14.639 3 36 39 3.620 0.105 34.47 < 0.001 El resultado nos indica que hay diferencias significativas en los promedios de mercurio por gramo de peso. Comparación múltiple – Prueba de Tukey W q0.05( 4 , 36 ) CME / n 3.79 0.105 / 10 0.388 x 1 - x 2 = 1.11* x 1 - x 3 = 1.13* x 1 - x 4 = 0.17 x 2 - x 3 = 0.02 x 2 - x 4 = 0.94* x 3 - x 4 = 0.96* Con estos resultados podemos concluir que los niveles de mercurio en los peces son significativamente mayores a 3.7km y 21 km debajo de la fábrica respecto de los niveles encontrados en los peces a 5.5 km arriba de la fábrica y a 133 km debajo de la fábrica, ello nos lleva a proponer que es urgente que se aplique un tratamiento a los efluentes de la fábrica porque están contaminando a los preces con mercurio. 3. El ozono es un componente que puede causar daños en plantas sensibles. En 1979 se ha establecido en E.E.U.U. una norma federal para la concentración de ozono con nivel máximo de 0,12 ppm (partes por millón). Se sospecha que las concentraciones actuales en el aire exceden dicho nivel. A fin de verificarlo, se han obtenido muestras de aire en 40 estaciones. a) Especifique la hipótesis nula y alternativa para verificar la suposición. 1p Ho: 0.12 ppm La concentración máxima de ozono supera a 0.12 ppm H1: < 0.12 ppm Si el promedio es significativamente menor que 0.12 ppm, entonces las concentraciones máxima de ozono no pasará de 0.12 ppm b) El análisis de los datos revela una media muestral de 0,115 con una desviación estándar muestral de 0,03. ¿Puede rechazarse la sospecha existente con un nivel de significancia = 0,01? Halle el valor p de la prueba y de una interpretación del mismo. 3p Aplicamos la prueba Z, dado que la muestra es grande y la varianza es desconocida Z x 0 0.115 0.12 1.05 S/ n 0.03 / 40 Calculamos el p-value= P(Z < -1.05) = 0.146 > 0.05 Este resultado nos indica que el promedio de las concentraciones no difiere significativamente del nivel máximo 0.12 ppm, lo que implica que las concentraciones de ozono exceden los niveles máximos permisibles. c) Obtenga un intervalo de confianza del 95% para la concentración media de ozono, y comente su relación con el contraste de hipótesis de los apartados anteriores. 2p Calculamos los límites para la estimación por intervalo del promedio L x Z 1 / 2 S 0.03 0.115 1.96 0.115 0.009 n 40 IC 95% para la concentración media de ozono: Li= 0.106 ppm ; Ls=0.124 ppm Este resultado confirma que los niveles máximos de concentración de ozono superan a 0.12 ppm, dado que con 95% de confianza se estima que el promedio puede ser de hasta 0.124 ppm. 4. Se quiere contrastar el contenido de azúcar de distintos cargamentos de remolacha. Se sabe que el contenido medio de azúcar para remolacha de regadío es del 18% con una media superior para el secano, siendo la desviación típica del 6% en ambos casos. Se toma una muestra de 20 cargamentos. ¿Qué valor de la media permitirá tomar la decisión sobre si la remolacha es de secano o de regadío, al nivel del 5%? 3p La cantidad solicitada se determina en el procedimiento de prueba para las hipótesis: H0: 18% de contenido de azúcar, es decir, el cargamento de remolacha es de regadío H1: > 18% de contenido de azúcar, es decir el cargamento de remolacha es de secano Considerando un nivel de significancia del 5% la región de rechazo será si Z x 0 Z 0.95 / n Remplazando con la data Z x 18 1.645 6 / 20 x 20.21% Entonces se decidirá que la remolacha es de secano si el promedio de contenido de azúcar supera el 20.21%, en caso contrario se asumirá que la remolacha es de regadío.