DAACLS_678_02.qxd 4/15/04 3:19 PM Page 17 LECCIÓN Medidas de la tendencia central y las gráficas de caja CONDENSADA 2.1 En esta lección ● ● Encontrarás e interpretarás la media, la mediana, y la moda para unos conjuntos de datos Crearás e interpretarás las gráficas de caja para unos conjuntos de datos Para facilitar el entendimiento y la interpretación de un conjunto grande de datos, puedes presentar los valores en una gráfica y calcular las medidas numéricas, o estadísticas, que resumen los datos. La media, la mediana, y la moda son estadísticas que dan una indicación del valor típico de un conjunto de datos. Probablemente hayas aprendido sobre estas medidas de tendencia central en anteriores cursos de matemáticas. Repasa estas medidas, trabajando el Ejemplo A en tu libro y después, leyendo, el resto de la página 78. Aquí tienes un resumen de los puntos claves: ● ● ● ● La media, que a menudo se representa con el símbolo x, es la suma de los valores de los datos dividida entre el número de valores de datos. La mediana es el valor de en medio (si hay un número impar de valores) o la media de los dos valores de en medio (si hay un número par de valores) cuando los datos se colocan en orden. La moda es el valor que se presenta con más frecuencia. Cuando un conjunto de datos tiene uno o más valores que se apartan mucho del resto, por lo general la mediana es la mejor medida de lo que es típico, en lugar de la media. n ● El símbolo xi significa x1 x 2 x 3 · · · xn, donde x1, x 2, . . . , xn i1 son los valores de dato individuales. Por tanto, la fórmula para la media de n valores de datos es n xi i1 x n ● La recolección de datos de una muestra aleatoria (random sample) ayuda a asegurar que los datos no sean sesgados, o injustos. Una buena descripción de un conjunto de datos incluye una medida de la tendencia central, junto con información sobre la forma y la dispersión de los datos. Una gráfica de caja es una herramienta útil para mostrar la forma y la (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press CHAPTER 2 17 DAACLS_678_02.qxd 4/15/04 3:19 PM Page 18 Lección 2.1 • Medidas de la tendencia central y las gráficas de caja (continuación) dispersión de los datos. A continuación se presenta una gráfica de caja de los datos sobre las mochilas en tu libro. El borde izquierdo de la caja es el primer cuartil, Q1, que es la mediana de los valores que están por debajo de la mediana. 0 5 Mínimo 10 Q1 Q3 15 El borde derecho de la caja es el tercer cuartil, Q3, que es la mediana de los valores que están por encima de la mediana. 20 Peso (lb) 25 30 35 Máximo Mediana El mínimo, Q1, la mediana, Q3, y el máximo se conocen colectivamente como el resumen de cinco números. Los segmentos que se salen de la “caja” se llaman “bigotes” (“whiskers”). Una gráfica de caja divide los datos en cuatro partes iguales. El bigote izquierdo, la parte izquierda de la caja, la parte derecha de la caja, y el bigote derecho representan cada uno un cuarto de los datos. El resumen de cinco números da los valores de los puntos claves de una gráfica de caja. El resumen de cinco números para los datos de las mochilas es 3, 7, 9, 10, 33. Los cinco números son el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo, respectivamente. Para ayudarte a entender mejor las gráficas de caja, trabaja el Ejemplo B en tu libro. Datos simétricos Los estadísticos usan la palabra forma para describir cómo se distribuyen los datos con relación a la posición de la medida de tendencia central. Los datos simétricos están balanceados o casi balanceados en el centro. Los datos sesgados (skewed) están distribuidos más hacia un lado del centro que hacia el otro. Datos sesgados Investigación: Tasas de pulso La investigación en tu libro implica la recolección de las tasas de los pulsos de todos los estudiantes del grupo. Si esto no es posible, usa los datos siguientes. Pulso en reposo: 68, 76, 84, 80, 76, 72, 60, 68, 68, 80, 68, 80, 64, 64, 72, 76, 72, 68, 56, 88, 80, 76, 68, 56, 64, 60, 92, 72, 84, 72 Pulso después del ejercicio: 148, 136, 157, 151, 121, 139, 137, 129, 127, 129, 155, 141, 133, 153, 161, 153, 127, 135, 144, 146, 136, 131, 133, 159, 127, 142, 133, 150, 164, 161 Para hallar el resumen de cinco números de los datos del pulso en reposo, empieza por ordenarlos. 56, 56, 60, 60, 64, 64, 64, 68, 68, 68, 68, 68, 68, 72, 72, 72, 72, 72, 76, 76, 76, 76, 80, 80, 80, 80, 84, 84, 84, 88, 92 El valor mínimo de estos datos es 56 y el máximo es 92. Existen 30 valores en el conjunto de datos, de modo que la mediana es la media de los valores décimoquinto y décimosexto, que es 72. El primer cuartil es la mediana de los primeros 15 valores, es decir, 68. El tercer cuartil es la mediana de los 15 valores más altas, es decir 80. 18 CHAPTER 2 (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press DAACLS_678_02.qxd 4/15/04 3:19 PM Page 19 Lección 2.1 • Medidas de la tendencia central y las gráficas de caja (continuación) Así pues, el resumen de cinco números de la muestra de los datos de pulsos en reposo es 56, 68, 72, 80, 92. Siguiendo el mismo proceso, puedes determinar que el resumen de cinco números de la muestra de los pulsos después del ejercicio es 121, 133, 140, 153, 164. Usa los resúmenes de cinco números para construir las gráficas de caja. Usando una escala de 50 a 170, podrás presentar ambos conjuntos de datos en el mismo eje. En reposo Ejercicio 50 70 90 110 130 150 170 Pulso (latidos por minuto) He aquí unas conclusiones a las que puedes llegar a partir de las gráficas de caja. Trata de llegar a un mínimo de tres conclusiones más, por tu propia cuenta. ● ● ● El pulso mínimo después del ejercicio es de casi 30 latidos por minuto más que el pulso máximo en reposo. Ambos conjuntos de datos están sesgados, y los pulsos mayores que la mediana están más dispersos que los pulsos menores que la mediana. La mediana de los pulsos después del ejercicio es casi el doble que los pulsos en reposo. Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press CHAPTER 2 19 DAACLS_678_02.qxd 4/15/04 3:19 PM Page 20 DAACLS_678_02.qxd 4/15/04 3:19 PM Page 21 LECCIÓN CONDENSADA 2.2 Medidas de dispersión En esta lección ● ● ● Encontrarás las medidas de dispersión de un conjunto de datos Encontrarás e interpretarás la desviación estándar de un conjunto de datos Usarás el alcance intercuartil (IQR) para identificar los externos de un conjunto de datos Ambos conjuntos de datos que presentamos a continuación tienen una media de 16 y una mediana de 16. Sin embargo, los dos conjuntos son claramente diferentes. Específicamente, los valores del primero conjunto de datos están agrupados bastante cerca de las medidas centrales, mientras que en el segundo conjunto los valores están más dispersos. Conjunto 1: 14, 14, 15, 16, 16, 16, 16, 17, 18, 18 Conjunto 2: 0, 2, 4, 8, 14, 18, 24, 24, 30, 36 Estos conjuntos de datos evidencian que una medida central por sí sola no da una visión completa de un conjunto de datos. En esta lección aprenderás algunas maneras de describir la variabilidad, o dispersión (spread), de un conjunto de datos. Investigación: Un buen diseño En esta investigación llevarás a cabo varios ensayos de un experimento. Si tu experimento está bien diseñado y lo llevas a cabo de manera consistente, debes obtener un resultado parecido en cada ensayo. Realiza uno de los dos experimentos descritos en tu libro. Aquí usaremos la muestra de datos del Experimento del lanzamiento de bandas elásticas, pero tú debes seguir con tus propios datos. Muestra de datos de las bandas elásticas (cm): 182.2, 135.9, 187.6, 162.5, 150.0, 186.5, 180.0 Paso 1 Calcula la distancia media de tus ensayos. Para la muestra, la media es 169.2 cm. Paso 2 Resta la media de cada valor del conjunto de datos. Para la muestra, las diferencias son 13.0, 33.3, 18.4, 6.7, 19.2, 17.3, y 10.8, respectivamente. Estos valores te dan una idea del nivel de control existente en la planificación de tu experimento. Si la mayor parte de las diferencias se acerca a 0, significa que fuiste capaz de realizar los intentos de forma consistente, obteniendo un resultado parecido en cada ocasión. Trata de encontrar una manera de calcular un solo valor que indica el nivel de conformidad entre tus resultados. Una posibilidad es encontrar el promedio de los valores absolutos de las diferencias. Para esta muestra de datos, el valor es 17.0, lo que indica que, como promedio, cada valor se sitúa a 17 cm de la media. (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press CHAPTER 2 21 DAACLS_678_02.qxd 4/15/04 3:19 PM Page 22 Lección 2.2 • Medidas de dispersión (continuación) Paso 3 La desviación estándar es una medida de la dispersión de los datos con respecto a la media. Descubre cómo usar tu calculadora para hallar la desviación estándar de un conjunto de datos (consulta Calculator Note 2B). Después, introduce los resultados de tu experimento y calcula la desviación estándar. Para esta muestra de datos, la desviación estándar es 20.2 cm. Paso 4 Antes de leer el texto siguiente, intenta encontrar una fórmula o un procedimiento para hallar la desviación estándar sin calculadora. (Sugerencias: Una desviación es una diferencia entre un valor de datos y la media del conjunto de datos. La desviación estándar implica elevar al cuadrado y sacar la raíz cuadrada). Para calcular la desviación estándar, sigue estos pasos: 1. Encuentra las desviaciones restando la media de cada valor. (Ya hiciste esto en el Paso 2.) Para esta muestra de datos, las desviaciones son 13.0, 33.3, 18.4, 6.7, 19.2, 17.3, y 10.8. 2. Eleva al cuadrado cada desviación. Para esta muestra, los resultados son 169, 1108.9, 338.56, 44.89, 368.64, 299.29, y 116.64. 3. Encuentra la suma de las desviaciones cuadradas. Para esta muestra, la suma es 2445.91. 4. Divide la suma de las desviaciones cuadradas entre el número de datos menos uno. Este valor se llama la varianza de los datos. Para esta muestra, la varianza es 407.65. 5. Saca la raíz cuadrada del resultado del paso anterior. El resultado es la desviación estándar. Para la muestra, la desviación estándar es 20.2 cm. Estos pasos para calcular la desviación estándar, s, pueden resumirse en una sola fórmula: n s xi x2 i1 n1 donde xi representa los valores individuales de los datos, n es el número de valores, y x es la media. Paso 5 Repite el experimento y obtén otro conjunto de siete u ocho ensayos. Mientras trabajas, sé lo más cuidadoso y consistente posible. Calcula la desviación estándar de los resultados. ¿Cómo se compara la desviación estándar del segundo conjunto de ensayos con la desviación estándar del primer conjunto? ¿Realizaste los ensayos de una manera más consistente la segunda vez? Lee el texto en las páginas 87–89 de tu libro hasta el ejemplo, y asegúrate de que lo entiendes. Después encuentra la desviación estándar e identifica los externos (outliers) siguiendo el ejemplo en tu libro. 22 CHAPTER 2 Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press 4/15/04 3:19 PM Page 23 LECCIÓN CONDENSADA 2.3 Histogramas y grados percentiles En esta lección ● ● ● Construirás e interpretarás unos histogramas Encontrarás el grado percentil de un valor Aplicarás todas las estadísticas y gráficos que has aprendido para analizar un conjunto de datos Un histograma muestra cómo se distribuyen los datos numéricos en diferentes intervalos, lo cual te da una visión clara de los agrupamientos y los vacíos existentes en el conjunto de datos. Las columnas, llamadas barras (bins), de un histograma indican cuántos valores de datos caen dentro de un intervalo dado. El nivel de detalle mostrado en un histograma depende del ancho de las barras. Estos dos histogramas muestran los datos de las mochilas de la Lección 2.1. 20 18 16 14 12 10 8 Número de mochilas Número de mochilas DAACLS_678_02.qxd 6 4 2 0 0 12 24 36 Peso de las mochilas (lb) 12 10 8 6 4 2 0 0 6 12 18 24 30 36 Peso de las mochilas (lb) El ancho de barra del gráfico a la izquierda es 6, mientras que el a la derecha es 3. Cada barra incluye el valor mínimo (de la izquierda), pero no el valor máximo (de la derecha). Así, por ejemplo, la segunda barra del histograma a la izquierda incluye las mochilas que pesan 6 libras, pero no las que pesan 12 libras. Una mochila de 12 libras estaría contenida en la tercera barra. El histograma a la derecha proporciona más detalles sobre la distribución que el histograma a la izquierda. Por ejemplo, del histograma a la izquierda puedes ver que hay cuatro mochilas que pesan menos de 6 libras. El histograma a la derecha muestra que cada una de estas cuatro mochilas pesa al menos 3 libras. EJEMPLO Considera los histogramas anteriores. a. ¿Cuál es el número total de mochilas representadas por los histogramas? b. Describe la forma en que cada histograma muestra los agrupamientos y los vacíos en los datos. c. Usa el histograma a la izquierda para determinar el intervalo que incluye el peso mediano. Ahora usa el histograma a la derecha para determinar el intervalo que incluye la mediana. ¿Cuál histograma te da una estimación más precisa de la mediana? d. ¿Qué porcentaje de las mochilas pesa menos de 9 libras? Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press (continúa) CHAPTER 2 23 DAACLS_678_02.qxd 4/15/04 3:19 PM Page 24 Lección 2.3 • Histogramas y grados percentiles (continuación) Solución a. Usa cualquiera de los dos histogramas y suma el número de mochilas en cada barra. Con el histograma a la izquierda, obtienes 4 19 5 1 1 30. Entonces, hay 30 mochilas representadas. (Verifica esta respuesta sumando las frecuencias de las barras en el histograma a la derecha.) b. El histograma a la izquierda muestra que los pesos más comunes se encuentran entre 6 y 12 libras, que todas las mochilas, excepto dos, pesan menos de 18 libras, y que ninguna pesa entre 24 y 30 libras. El histograma a la derecha muestra que los pesos más comunes se encuentran entre 9 y 12 libras, que todas las mochilas, excepto siete, pesan entre 3 y 12 libras, y que ninguna mochila pesa entre 21 y 33 libras. c. Existe un total de 30 valores, de modo que la mediana se ubica entre los valores 15° y 16°. En el histograma a la izquierda, el valor mediano se encuentra en la segunda barra, en la que se incluyen valores mayores que o iguales a 6 libras, y siempre menores que 12 libras. En el histograma a la derecha, la mediana se ubica en la cuarta barra, en la que se incluyen valores mayores que o iguales a 9 libras y siempre menores que 12 libras. El histograma de la derecha da una estimación más precisa. d. Usa el histograma a la izquierda porque tiene una barra con un valor final de 9. Suma las frecuencias de las barras a la izquierda de 9. Obtienes 4 8 12. Así pues, 1320 , ó 40%, de las mochilas pesan menos de 9 libras. Trabaja ahora el Ejemplo A en tu libro. Asegúrate que entiendes cómo crear un histograma en tu calculadora. El grado percentil (percentile rank) de un valor expresa el porcentaje de valores que están debajo de ese valor. En la parte d del ejemplo anterior, el 40% de las mochilas pesan menos de 9 libras, y por tanto, una mochila que pesa 9 libras tiene un grado percentil de 40. Trabaja el Ejemplo B en tu libro para practicar los percentiles y las desviaciones estándar. Investigación: Comida a la carrera En la investigación en tu libro se te pide que lleves a cabo un análisis estadístico sobre el valor nutricional de los productos de comida rápida. Lee la investigación atentamente y después realiza tu análisis estadístico. Todos los productos Hamburguesas Pollo Pescado 18.7 15.6 15.1 27.5 18 13 14 9.4 6.2 Media Mediana Desviación estándar Si decides analizar el contenido de grasa en los productos, deberías considerar estos estadísticas y gráficos. 26.5 9.3 8.7 Todos los productos Hamburguesas Pollo Pescado 0 24 CHAPTER 2 4 8 12 16 20 24 28 32 36 40 44 Grasa (gramos) Discovering Advanced Algebra Condensed Lessons in Spanish ©2004 Key Curriculum Press