Ingeniero Técnico en Obras Públicas (Hidrología) Estadística (diciembre 2004) Prácticas con Statistix Nombre: 1. Los datos de emisión de CO2 por fuentes fósiles para los distintos paises europeos entre los años 1985 y 1997. Se indican a continuación los datos de emisión total de este contaminante para España entre los años 1990 y 1997. Año (X) Emisión total (Y ) ( Megatoneladas) 90 203.8 91 215.5 92 225.1 93 211.5 94 222.8 95 237.5 96 226.6 97 242.8 (a) Dibuja un diagrama de cajas-bigotes para la emisión de CO2. ¿Existe algún valor atípico? (si es así indica cual es).¿Qué representa la línea horizontal del centro de la caja?(1 punto) (b) Realizar el ajuste lineal de la emisión total en función del año. Calcular el valor de R2 y comentar la bondad del ajuste.(2 puntos) (c) Según nuestro modelo, ¿se está produciendo un aumento o un descenso de la emisión de CO2?(1 punto) (d) Según nuestro modelo, ¿cuál sería la cantidad de CO2 emitida en 1998 por España? (1 punto) 2. Un estudio demostró que la resistencia a compresión de un nuevo tipo de acero se distribuye según un modelo Normal. Con el fin de determinar la resistencia promedio, se escogieron 90 probetas al azar y se obtuvieron los valores experimentales almacenados en el fichero resistenc.dat Una vez recuperado el fichero, que se encuentra en su ruta habitual, responder a las siguientes cuestiones (a) Realiza el histograma correspondiente tomando 10 clases. Indicar la frecuencia de cada clase:(1 punto) Clase Frecuencia (b) ¿Podemos asumir el modelo normal como adecuado?. Razona tu respuesta.(1 punto) (c) Si suponemos que la variable X=”Resitencia” sigue una distribución normal. ¿Cuales serán sus parámetros?. Obtener Pr(X < 56) así como la proporción de datos en la muestra cuyo valor es inferior a 56.(0.75 puntos) (d) Obtener un intervalo de confianza al 97% para la resietncia promedio . ¿Cómo interpretas el resultado obtenido?(1 punto) (e) ¿Podemos afirmar que la resitencia promedio peso promedio es superior a 46?. Responder a la pregunta anterior planteando la prueba estadística correspondiente y comentando el p-valor obtenido.(1.25 puntos) Ingeniero Técnico en Obras Públicas (Hidrología) Estadística (septiembre 2005) Prácticas con Statistix Nombre: 1. Un determinado estudio medioambiental informa sobre los resultados obtenidos sobre la aparición de cloro y el porcentaje de suelo urbano cercano a lo largo de un acuífero. Los resultados obtenidos fueron almacenados en el fichero contamina.txt (a) Dibuja un diagrama de cajas-bigotes para ambas características y determina si existe algún valor atípico. (si es así indica su valor). Indica los valores exactos de cada una de las líneas que componen cada diagrama.(1 punto) (b) Realizar el diagrama de dispersión entre ambas características y determina un modelo que permita obtener el contenido de cloro en el agua en función del % de suelo urbano cercano. Calcular el valor de R2 y comentar la bondad del ajuste.(2 puntos) (c) A partir del estudio realizado, ¿qué influencia tiene el suelo urbano en la concentración de cloro obtenida?(1 punto) (d) ¿Podrías determinar cuál sería la cantidad de cloro si el % de suelo urbano fuese de 1.5?, ¿y si fuese de 2.5? (0.5 puntos) (e) En una determinada zona del acuífero se ha detectado una concentración de 21.7. ¿podemos determinar el % de suelo urbano cercano?. Razona tu respuesta. (0.5 puntos) 2. Se ha realizado un estudio de salinidad de ciertas disoluciones, midiéndose en ellas la concentración de ClNa en mg/l. Los resultados obtenidos se almacenaron en el fichero clna.dat Una vez recuperado el fichero, que se encuentra en su ruta habitual, responder a las siguientes cuestiones (a) Realiza el histograma correspondiente tomando 7 clases y límite inferior 28 y límite superior 224 (copiarlo en la parte de atrás). Indicar la frecuencia de cada clase:(1 punto) Clase Frecuencia (b) ¿Qué modelo de distribución podemos asociar a la variable contenido en ClNa en función de los datos observados?. Razona tu respuesta.(1 punto) (c) Si suponemos que la variable ”X=ln(ClNa)” sigue una distribución normal, determinar sus parámetros, obtener Pr(X < 5) así como la proporción de datos en la muestra cuyo valor es inferior a 5.(0.75 puntos) (d) Obtener un intervalo de confianza al 97% para el promedio de la variable X. ¿Cómo interpretas el resultado obtenido?(1 punto) (e) ¿Podemos afirmar que el promedio de la variable X=ln(ClNa) es superior a 4.75?. Responder a la pregunta anterior planteando la prueba estadística correspondiente y comentando el p-valor obtenido.(1.25 puntos) Ingeniero Técnico en Obras Públicas (Hidrología) Estadística (diciembre 2005) Examen de prácticas con Statistix Nombre: Problema 1 En el fichero cemento.dat se encuentran los datos correspondientes al calor emitido (HEAT) al fraguar un determinado compuesto de cemento y el % que contiene la mezcla de cuatro componentes químicos que forman parte de su composición (Chem1, Chem2, Chem3 y Chem4). 1.1.- Realizar un diagrama de cajas y bigotes para la característica Heat e indicar las características más relevantes del mismo, así como qué representan (indicando sus valores) cada una de las líneas que componen el gráfico. (1.5 punto) 1.2.- Con el fin de estudiar una posible relación entre los componentes de la aleación representar gráficamente la cantidad de compuesto Chem4 en función de la cantidad de compuesto Chem2 y comentar las características que se observan. ¿Existe algún dato que pueda ser extremadamente influyente en un posible ajuste lineal? (1 pto) 1.3.- Queremos buscar un modelo que explique la cantidad de Chem4 en función de Chem2. Proponer un modelo y dar una medida de su validez (1 pto) 1.4.- Se estima que una cantidad aceptable de Chem2 es de 16%. ¿Cuál sería la cantidad de Chem4 que se debería utilizar?. (1 pto) 1.5.- Si se realiza un compuesto con un 31% de Chem2, determinar la cantidad de Chem4 correspondiente (1 pto). El valor observado difiere del valor estimado, ¿podrías explicar esta diferencia? (1 pto) 1.6.- Suponiendo que la variable X=”Cantidad de Chem2 utilizada en el compuesto” sigue una distribución normal, proporciona un intervalo de confianza al 98% para la media de la variable aleatoria X. ¿Qué interpretación tiene el intervalo obtenido? ¿cuánto vale el error de estimación para el intervalo obtenido?(1 pto) 1.7.- ¿Podemos afirmar que la cantidad media de Chem1 es superior a la de Chem3?. Plantea el procedimiento estadístico correspondiente y responde a la cuestión anterior comentando el p-valor obtenido.(1.5 pto) Problema 2 Una vez recuperado el fichero choleste.sx contestar a las siguientes cuestiones 2.1.- Realiza un histograma de la característica AGE tomando como límite inferior 18, como límite superior 78.5 y una amplitud de 12.1 y comenta las características más relevantes que observes.(0.75 ptos) 2.2.- Suponiendo que la característica AGE siga una distribución normal determina sus parámetros.(0.5 ptos) 2.3.- Determinar el % de datos superiores a 54.3 y compara este resultado con la probabilidad Pr(AGE>54.3) suponiendo que la característica AGE siga una distribución normal.(0.75 ptos)