Practica Nº 1 Estadística Descriptiva 1) Un artículo publicado en Technometrics (Vol. 19,1977, pag.425) presenta los datos siguientes sobre el octanaje de varias mezclas de gasolina: 88.5 94.7 84.3 90.1 89.0 89.8 91.6 90.3 90.0 87.7 91.1 86.7 93.4 96.1 89.6 90.4 91.6 90.7 83.4 91.0 88.2 88.5 93.3 87.4 91.1 90.5 86.7 94.2 90.8 90.1 91.8 88.4 92.6 93.7 87.5 87.8 88.3 89.2 92.3 88.9 89.8 92.7 91.5 89.9 98.8 88.3 90.4 91.2 90.6 92.2 88.6 88.3 94.2 85.3 90.1 89.3 91.1 92.2 100.3 87.6 92.7 87.9 93.0 94.4 90.4 91.2 96.5 84.3 93.2 88.6 88.7 92.7 89.3 91.0 93.3 86.7 91.0 90.9 89.9 91.8 89.7 92.2 a) Construya una tabla de frecuencias (absoluta y relativa) y un histograma utilizando ocho clases. b) Construya una tabla de frecuencias (absoluta y relativa) y un histograma con 16 clases. Compare la forma del histograma con la que tiene el histograma de la parte a). ¿Los dos histogramas presentan información similar?. 2) Los datos siguientes representan el número de ciclos transcurridos hasta que se presenta una falla en una prueba de piezas de aluminio sujetas a un esfuerzo alternante repetido de 21000 psi, a 18 ciclos por segundo: 1115 1310 1540 1502 1258 1315 1085 1567 1883 1203 1270 1015 845 1674 1223 375 2265 1910 1018 1452 1890 1782 1522 1792 1000 1820 1940 1120 1055 1764 1330 1608 1535 1781 1750 798 1020 865 2130 1421 1109 1481 1016 1102 1605 706 2215 785 885 2100 1594 2023 1315 1269 1260 1888 910 1730 1102 1578 758 1416 1560 1501 1238 990 1468 1512 1750 1642 a) Construya una tabla de frecuencias (absoluta y relativa) y un histograma. b) Construya un polígono de frecuencias. c) ¿Existe evidencia de que una pieza “sobrevivirá” más allá de los 2000 ciclos?. Justifique su respuesta. 3) Las siguientes mediciones corresponden a las temperaturas de un horno registradas en lotes sucesivos de un proceso de fabricación de semiconductores (las unidades son ºF): 953, 950, 948, 955, 951, 949, 957, 954, 955. Calcule: a) La media muestral de estos datos. b) La mediana muestral de estos datos c) ¿En cuánto puede incrementarse la mayor medición de temperatura sin que cambie la mediana muestral?. 1 4) Se toman ocho mediciones del diámetro interno de los anillos para los pistones del motor de un automóvil. Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000, 74.005, 74.002, 74.005, 74.004. a) Encuentre la media y la mediana de estos datos. b) Suponga que se elimina la observación más grande (74.015 mm). Calcule la media y la mediana muestrales para los datos restantes. Compare sus resultados con los obtenidos en la parte a). 5) Hallar la media y mediana para los datos de los ejercicios 1) y 2). 6) Los siguientes datos son las temperaturas de unión de los O-rings (en grados F), en cada prueba de lanzamiento o de un lanzamiento real, del motor del cohete del transbordador espacial (tomados de Presidential Commission on the Space Shuttle Challenger Accident, Vol.1, pags. 129-131): 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73, 70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. a) Calcule la media y la mediana muestrales. b) Encuentre los cuartiles inferior y superior de la temperatura. c) Encuentre los percentiles quinto y noveno de la temperatura. d) Elimine la observación más pequeña (31ºF) y vuelva a calcular lo que se pide en los incisos a), b) y c). ¿Qué efecto tiene la eliminación de este punto?. 7) La contaminación de una pastilla de silicio puede afectar de manera importante la calidad de la producción de circuitos integrados. De una muestra de 10 pastillas se obtienen las siguientes concentraciones de oxígeno: 3.15, 2.68, 4.31, 2.09, 3.82, 2.94, 3.47, 3.39, 2.81, 3.61. Calcule: a) La varianza muestral. b) La desviación estándar muestral. c) El rango de la muestra. 8) Considere los datos para anillos de pistón, del ejercicio 4). Calcule: a) La varianza muestral. b b) La desviación estándar muestral. c)El rango de la muestra. d)Suponga que se elimina la observación más grande (74.015). Calcule la varianza muestral, la desviación estándar muestral, el rango de la muestra. Compare los resultados con los obtenidos en los incisos anteriores. Para esta medición en particular, ¿ cuán sensibles son la varianza muestral, la desviación muestral y el rango de la muestra? 9) Considere los datos del ejercicio 5). a) La varianza muestral. b) La desviación estándar muestral. c) El rango de la muestra y rango intercuartílico. c d) Construya un diagrama de caja y discuta sobre la forma de la distribución y la d posible presencia de valores atípicos. 10) Se tienen las millas por galón de 154 autos, los que se clasifican según su origen. Se obtienen así las siguientes tres muestras: 2 Muestra 1, consiste en las millas por galón de 85 autos de origen americano: 36.1, 19.9, 19.4, 20.2, 19.2, 20.5, 20.2, 25.1, 20.5, 19.4, 20.6, 20.8, 18.6, 18.1, 19.2, 17.7, 18.1, 17.5, 30, 30.9, 23.2, 23.8, 21.5, 19.8, 22.3, 20.2, 20.6, 17, 17.6, 16.5, 18.2, 16.9, 15.5, 19.2, 18.5, 35.7 , 27.4 , 23 , 23.9, 34.2, 34.5, 28.4, 28.8, 26.8, 33.5, 32.1, 28, 26.4 , 24.3 ,19.1 , 27.9, 23.6, 27.2, 26.6, 25.8, 23.5, 30, 39, 34.7, 34.4, 29.9, 22.4, 26.6, 20.2, 17.6, 28, 27, 34, 31, 29, 27, 24, 23, 38, 36, 25, 38, 26, 22, 36, 27, 27, 32, 28, 31 . Muestra 2, consiste en las millas por galón de 25 autos de origen europeo: 43.1, 20.3, 17, 21.6, 16.2, 31.5, 31.9, 25.4, 27.2, 37.3, 41.5, 34.3, 44.3, 43.4, 36.4, 30.4, 40.9, 29.8, 35, 33, 34.5, 28.1, 30.7, 36, 44. Muestra 3, consiste en las millas por galón de 44 autos de origen japonés: 32.8, 39.4, 36.1, 27.5, 27.2, 21.1, 23.9, 29.5, 34.1, 31.8, 38.1, 37.2, 29.8, 31.3, 37, 32.2, 46.6, 40.8, 44.6, 33.8, 32.7, 23.7, 32.4, 39.1, 35.1, 32.3, 37, 37.7, 34.1, 33.7, 32.4, 32.9, 31.6, 25.4, 24.2, 37, 31, 36, 36, 34, 38, 32, 38, 32 a) Hallar media, mediana y moda de cada muestra. b) Hallar rango, rango intercuartílico, desviación estándar de cada muestra. c) Hallar el coeficiente de variación para cada muestra. d) Haga un gráfico de cajas simultáneas. e) ¿Qué pude concluir sobre el consumo de los autos europeos y japoneses con respecto al de los autos americanos?. 11) Los precios de 155 autos se clasifican según el origen de los mismos, obteniéndose las siguientes tres muestras: Muestra 1, consiste en el precio de 85 autos de origen americano: 1900, 3300, 3125, 2850, 2800, 3275, 2375, 2275, 2700, 2300, 3300, 2425, 2700, 2425, 3900, 4400, 2525, 3000, 2100, 2250, 3200, 2400, 3925, 3200, 2975, 3150, 3325, 4650, 4850, 5725, 4025, 5225, 4825, 4100, 4725, 2700, 2725, 9900, 4050, 2625, 2775, 3525, 3625, 3525, 3325, 2900, 3625, 3525, 3625, 3770, 3200, 4250, 5100, 5175, 4950, 4550, 4900, 3600, 3450, 3850, 4100, 6675, 6875, 5450, 5625, 5275, 5500, 5175, 5650, 6250, 5650, 5225, 5150, 4350, 4550, 7300, 7450, 6000, 6100, 5475, 8400, 5975, 5650, 4925, 6050. Muestra 2, consiste en el precio de 26 autos de origen europeo: 4475, 5875, 4200, 5450, 3675, 3100, 4675, 2275, 7000, 5900, 3900, 3825, 7975, 14275, 2575, 7000, 5000, 5650, 4600, 8500, 8225, 8550, 5200, 5075, 2400, 15475. Muestra 3, consiste en el precio de 44 autos de origen japonés: 2200, 2725, 2250, 2975, 2775, 3700, 2975, 3425, 2750, 2750, 3850, 3525, 5500, 4675, 4050, 3975, 3350, 3300, 3925, 3625, 8150, 7250, 4700, 4400, 4000, 3950, 3775, 4475, 3975, 5550, 4650, 5825, 5650, 9475, 8375, 4900, 5100, 6350, 6500, 5425, 4625, 4875, 5075, 7700. 3 a)Hallar media, mediana y moda de cada muestra. b)Hallar rango, rango intercuartílico, desviación estándar de cada muestra. c)Hallar el coeficiente de variación para cada muestra. d)Haga un gráfico de cajas simultáneas. e)¿Hay diferencias de precio entre los diferentes orígenes?. 12) En relación al ejercicio 11), ahora se clasifica el precio de los 155 autos anteriores según el año del modelo, obteniéndose las siguientes cinco muestras: Muestra 1, precios de 36 autos modelo año 78: 2400, 1900, 2200, 2725, 2250, 3300, 3125, 2850, 2800, 3275, 2375, 2275, 2700, 2300, 3300, 2425, 2700, 2425, 3900, 4400, 2525, 3000, 2100, 2975, 2775, 2250, 3700, 3200, 2400, 2975, 4475, 5875, 4200, 5450, 3675, 3425. Muestra 2, precios de 29 autos modelo año 79: 3925, 3200, 2975, 3150, 3325, 4650, 4850, 5725, 4025, 5225, 4825, 4100, 4725, 3100, 2750, 2700, 2725, 15475, 9900, 4675, 4050, 2625, 2775, 2750, 2275, 3525, 3625, 3525, 3325. Muestra 3, precios de 29 autos modelo año 80: 7000, 3850, 2900, 3525, 3625, 3525, 3625, 3700, 5900, 5500, 4675, 4050, 3975, 3350, 3200, 3300, 3900, 3825, 7975, 14275, 3925, 2575, 3625, 7000, 8150, 7250, 5000, 4250, 4700. Muestra 4, precios de 30 autos modelo año 81: 5100, 5175, 4950, 4550, 4900, 4400, 3600, 4000, 3950, 3775, 4475, 3975, 3450, 3850, 4100, 5650, 4600, 5550, 4650, 5825, 5650, 8500, 8225, 8550, 9475, 8375, 6675, 6875, 5450, 5625. Muestra 5, precios de 31 autos modelo año 82: 5275, 5500, 5175, 5650, 6250, 5650, 5225, 5150, 5200, 4900, 5100, 4350, 4550, 6350, 6500, 5425, 4625, 4875, 5075, 7300, 7450, 6000, 6100, 7700, 5475, 8400, 5975, 5075, 5650, 4925, 6050. a)Hallar media, mediana y moda de cada muestra. b)Hallar rango, rango intercuartílico, desviación estándar de cada muestra. c)Hallar el coeficiente de variación para cada muestra. d)Haga un gráfico de cajas simultáneas. e)¿Ha variado el precio de los autos durante los años considerados?. 4