Examenes de prácticas del curso 04/05

Anuncio
Ingeniero Técnico en Obras Públicas (Hidrología)
Estadística (diciembre 2004)
Prácticas con Statistix
Nombre:
1. Los datos de emisión de CO2 por fuentes fósiles para los distintos paises europeos entre los años 1985
y 1997. Se indican a continuación los datos de emisión total de este contaminante para España entre
los años 1990 y 1997.
Año (X)
Emisión total (Y )
( Megatoneladas)
90
203.8
91
215.5
92
225.1
93
211.5
94
222.8
95
237.5
96
226.6
97
242.8
(a) Dibuja un diagrama de cajas-bigotes para la emisión de CO2. ¿Existe algún valor atípico? (si es
así indica cual es).¿Qué representa la línea horizontal del centro de la caja?(1 punto)
(b) Realizar el ajuste lineal de la emisión total en función del año. Calcular el valor de R2 y comentar
la bondad del ajuste.(2 puntos)
(c) Según nuestro modelo, ¿se está produciendo un aumento o un descenso de la emisión de CO2?(1
punto)
(d) Según nuestro modelo, ¿cuál sería la cantidad de CO2 emitida en 1998 por España? (1 punto)
2. Un estudio demostró que la resistencia a compresión de un nuevo tipo de acero se distribuye según un
modelo Normal. Con el fin de determinar la resistencia promedio, se escogieron 90 probetas al azar y
se obtuvieron los valores experimentales almacenados en el fichero resistenc.dat Una vez recuperado
el fichero, que se encuentra en su ruta habitual, responder a las siguientes cuestiones
(a) Realiza el histograma correspondiente tomando 10 clases. Indicar la frecuencia de cada clase:(1
punto)
Clase
Frecuencia
(b) ¿Podemos asumir el modelo normal como adecuado?. Razona tu respuesta.(1 punto)
(c) Si suponemos que la variable X=”Resitencia” sigue una distribución normal. ¿Cuales serán sus
parámetros?. Obtener Pr(X < 56) así como la proporción de datos en la muestra cuyo valor es
inferior a 56.(0.75 puntos)
(d) Obtener un intervalo de confianza al 97% para la resietncia promedio . ¿Cómo interpretas el
resultado obtenido?(1 punto)
(e) ¿Podemos afirmar que la resitencia promedio peso promedio es superior a 46?. Responder a
la pregunta anterior planteando la prueba estadística correspondiente y comentando el p-valor
obtenido.(1.25 puntos)
Ingeniero Técnico en Obras Públicas (Hidrología)
Estadística (septiembre 2005)
Prácticas con Statistix
Nombre:
1. Un determinado estudio medioambiental informa sobre los resultados obtenidos sobre la aparición de
cloro y el porcentaje de suelo urbano cercano a lo largo de un acuífero. Los resultados obtenidos fueron
almacenados en el fichero contamina.txt
(a) Dibuja un diagrama de cajas-bigotes para ambas características y determina si existe algún valor
atípico. (si es así indica su valor). Indica los valores exactos de cada una de las líneas que
componen cada diagrama.(1 punto)
(b) Realizar el diagrama de dispersión entre ambas características y determina un modelo que permita
obtener el contenido de cloro en el agua en función del % de suelo urbano cercano. Calcular el
valor de R2 y comentar la bondad del ajuste.(2 puntos)
(c) A partir del estudio realizado, ¿qué influencia tiene el suelo urbano en la concentración de cloro
obtenida?(1 punto)
(d) ¿Podrías determinar cuál sería la cantidad de cloro si el % de suelo urbano fuese de 1.5?, ¿y si
fuese de 2.5? (0.5 puntos)
(e) En una determinada zona del acuífero se ha detectado una concentración de 21.7. ¿podemos
determinar el % de suelo urbano cercano?. Razona tu respuesta. (0.5 puntos)
2. Se ha realizado un estudio de salinidad de ciertas disoluciones, midiéndose en ellas la concentración
de ClNa en mg/l. Los resultados obtenidos se almacenaron en el fichero clna.dat Una vez recuperado
el fichero, que se encuentra en su ruta habitual, responder a las siguientes cuestiones
(a) Realiza el histograma correspondiente tomando 7 clases y límite inferior 28 y límite superior 224
(copiarlo en la parte de atrás). Indicar la frecuencia de cada clase:(1 punto)
Clase
Frecuencia
(b) ¿Qué modelo de distribución podemos asociar a la variable contenido en ClNa en función de
los datos observados?. Razona tu respuesta.(1 punto)
(c) Si suponemos que la variable ”X=ln(ClNa)” sigue una distribución normal, determinar sus
parámetros, obtener Pr(X < 5) así como la proporción de datos en la muestra cuyo valor es
inferior a 5.(0.75 puntos)
(d) Obtener un intervalo de confianza al 97% para el promedio de la variable X. ¿Cómo interpretas
el resultado obtenido?(1 punto)
(e) ¿Podemos afirmar que el promedio de la variable X=ln(ClNa) es superior a 4.75?. Responder
a la pregunta anterior planteando la prueba estadística correspondiente y comentando el p-valor
obtenido.(1.25 puntos)
Ingeniero Técnico en Obras Públicas (Hidrología)
Estadística (diciembre 2005)
Examen de prácticas con Statistix
Nombre:
Problema 1
En el fichero cemento.dat se encuentran los datos correspondientes al calor emitido (HEAT) al fraguar un determinado compuesto de cemento y el % que contiene la mezcla de cuatro componentes químicos que forman parte de su
composición (Chem1, Chem2, Chem3 y Chem4).
1.1.- Realizar un diagrama de cajas y bigotes para la característica Heat e indicar las características más relevantes
del mismo, así como qué representan (indicando sus valores) cada una de las líneas que componen el gráfico.
(1.5 punto)
1.2.- Con el fin de estudiar una posible relación entre los componentes de la aleación representar gráficamente la
cantidad de compuesto Chem4 en función de la cantidad de compuesto Chem2 y comentar las características
que se observan. ¿Existe algún dato que pueda ser extremadamente influyente en un posible ajuste lineal? (1
pto)
1.3.- Queremos buscar un modelo que explique la cantidad de Chem4 en función de Chem2. Proponer un modelo
y dar una medida de su validez (1 pto)
1.4.- Se estima que una cantidad aceptable de Chem2 es de 16%. ¿Cuál sería la cantidad de Chem4 que se debería
utilizar?. (1 pto)
1.5.- Si se realiza un compuesto con un 31% de Chem2, determinar la cantidad de Chem4 correspondiente (1 pto).
El valor observado difiere del valor estimado, ¿podrías explicar esta diferencia? (1 pto)
1.6.- Suponiendo que la variable X=”Cantidad de Chem2 utilizada en el compuesto” sigue una distribución normal,
proporciona un intervalo de confianza al 98% para la media de la variable aleatoria X. ¿Qué interpretación tiene
el intervalo obtenido? ¿cuánto vale el error de estimación para el intervalo obtenido?(1 pto)
1.7.- ¿Podemos afirmar que la cantidad media de Chem1 es superior a la de Chem3?. Plantea el procedimiento
estadístico correspondiente y responde a la cuestión anterior comentando el p-valor obtenido.(1.5 pto)
Problema 2
Una vez recuperado el fichero choleste.sx contestar a las siguientes cuestiones
2.1.- Realiza un histograma de la característica AGE tomando como límite inferior 18, como límite superior 78.5 y
una amplitud de 12.1 y comenta las características más relevantes que observes.(0.75 ptos)
2.2.- Suponiendo que la característica AGE siga una distribución normal determina sus parámetros.(0.5 ptos)
2.3.- Determinar el % de datos superiores a 54.3 y compara este resultado con la probabilidad Pr(AGE>54.3)
suponiendo que la característica AGE siga una distribución normal.(0.75 ptos)
Descargar