MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA. CURSO 2007-2008 PRÁCTICA 1: Estadística Descriptiva Univariante Usaremos para las Prácticas el programa Statgraphics Plus 5.1 (versión española). Los procedimientos que se van a utilizar en esta primera práctica están en: (Menu) DESCRIPCIÓN > DATOS NUMÉRICOS > ANÁLISIS UNIDIMENSIONAL (Menu) DESCRIPCIÓN > DATOS CUALITATIVOS > TABULACIÓN (Menu) COMPARACIÓN > DOS MUESTRAS > COMPARACIÓN DE DOS MUESTRAS Los ficheros de datos que se van a utilizar son Coches.sf3 Desviaciones_08.sf3 Para abrirlos: CTRL+F12 (se encuentran en la carpeta C:\Archivos de programa\Statgraphics\Statgraphis Plus5.1\Data\) ¡ATENCIÓN: el programa no permite tener abierto más de un fichero de datos a la vez! Podéis grabar el trabajo como Statfolio (extensión sgp) en un disquete. Además tendréis que grabar el fichero de datos. ES IMPORTANTE que no cerreis ninguna ventana antes de grabar, para no perder el trabajo. EJERCICIO 1: El fichero coches.sf3 contiene los datos del consumo (en litros/100 Km) de todos los modelos nuevos de Monovolúmenes de tamaño medio que existen actualmente en el mercado y sus emisiones de CO2 (en g/Km), además del tipo de motorización de cada vehículo (Gasolina o Diesel). Vamos a estudiar descriptivamente la variable Emisiones: 1. ¿En qué intervalo toma valores la variable? (es decir, ¿cuál es el mínimo y cuál es el máximo?). 2. Haz un histograma para los datos de las emisiones de CO2, ajustando adecuadamente L0 y LK y responde: 2.1. ¿Cuántas clases tiene, por defecto? ¿Corresponde este valor al que proporciona la fórmula de Sturges? 2.2. ¿Qué valor has introducido como extremo inferior de la primera clase (L0 )? ¿Qué valor has introducido como extremo superior de la última (LK)? 2.3. ¿En torno a qué intervalo de la variable parece encontrarse el centro de gravedad de los datos? (Aquí no se trata de dar el valor exacto de la media, sino de utilizar el gráfico para observar en torno a qué zona del eje X parece situarse el centro de gravedad del histograma.) 2.4. ¿Los datos se sitúan simétricamente o parece haber asimetría en la disposición de los datos? ¿Cómo describirías esa asimetría (si la hay)? 3. Dibuja un diagrama de cajas de los datos de las emisiones de CO2 y contesta: 3.1. ¿Se observan diferencias, en la asimetría, respecto de lo observado en el histograma? 3.2. ¿Se detectan datos atípicos? 3.3. Si has contestado afirmativamente a la pregunta anterior, determina cuáles y cuántos son y si son próximos o alejados. (Para resolver este apartado es conveniente utilizar el comando “Selección” de Statgraphics, además de determinar con la calculadora en qué intervalo estarían los atípicos próximos y en cuál los alejados). Observa a qué modelos de coche corresponden, ¿se considerarían datos erróneos? 4. Calcula las medidas necesarias para responder a las siguientes preguntas: 4.1. ¿Por debajo de qué valor están el 50% de las emisiones? 4.2. ¿Cuál es la emisión media de estos vehículos? 4.3. ¿Por debajo de que número se encuentra el 90% de las emisiones de estos vehículos? 4.4. ¿En qué intervalo se encuentra el 50% central de los datos? 4.5. Si nos fijamos en las emisiones de vehículos con consumo menor que 10 litros, ¿cuál es la emisión media observada? 4.6. Entre los vehículos que consumen menos de 10 litros, el 30% de ellos emiten menos de... ¿cuántos gramos de CO2 por Km? 5. Si consideramos las emisiones de CO2 entre los vehículos Diesel y los de Gasolina, ¿qué diferencias observas (posición, variabilidad, simetría,...)? Coméntalas, incidiendo en su significado respecto del nivel de contaminación de los vehículos. 6. Obtén un diagrama de sectores para la variable Motorización y responde: ¿Qué tipo de motorización presenta mayor número de modelos donde elegir? ¿Cuál es su porcentaje respecto del total? EJERCICIO 2: La variable Desviaciones1, en el fichero Desviaciones_08.sf3, contiene dos variables; la primera, Desviaciones1 contiene los valores de las diferencias al cuadrado de unas medidas respecto de un valor prefijado. 1. Realiza un diagrama de cajas para estos datos para determinar qué tipo de asimetría tienen. 2. Construye las variables T1, T2, T3 y T4, transformadas de Desviaciones1 mediante las transformaciones 1/x, x½, Ln x, y x2. 3. ¿Qué cambios respecto de la simetría provocan en los datos originales estas transformaciones? 4. Las transformaciones anteriores no son lineales y no tienen las mismas propiedades que ellas. Por ejemplo, se puede comprobar que la media de las nuevas variables no es la transformada de la media de la variable original. Calcula media y mediana de la variable original, y de estas nuevas variables y completa la tabla de la hoja de respuestas, para comparar. 5. Por último, haz lo mismo para la variable Desviaciones2, realiza un diagrama de cajas para estos datos para determinar qué tipo de asimetría tienen y repite los apartados 2 y 3, para esta nueva variable.