LECCIÓN CONDENSADA 2.1 Gráficas de caja En esta lección ● ● ● crearás e interpretarás las gráficas de caja para conjuntos de datos usarás el rango intercuartil (IQR) para identificar valores extremos potenciales y representarlos gráficamente en una gráfica de caja modificada identificarás la forma de los datos como sesgados o simétricos Para entender e interpretar un conjunto de datos, puedes presentar los valores en una gráfica y calcular las medidas numéricas, o estadísticas, que resumen los datos. La media, la mediana y la moda son estadísticas que dan una indicación del valor típico de un conjunto de datos. Probablemente hayas aprendido sobre estas medidas de tendencia central en cursos anteriores de matemáticas. Repasa estas medidas, analizando los ejemplos y ejercicios de la lección Refreshing Your Skills del Capítulo 2. Una buena descripción de un conjunto de datos incluye una medida de la tendencia central, junto con información sobre la forma y la dispersión de los datos. Una gráfica de caja es una herramienta útil para mostrar la forma y la dispersión de los datos. Analiza el Ejemplo A de la Lección 2.1 en tu libro para repasar cómo hallar el resumen de los cinco números de un conjunto de datos y crea una gráfica de caja. Cuando analizas datos, es importante saber cómo se reunieron esos datos. Si sólo se recopilaron datos de las mochilas de los estudiantes que salían de una clase determinada, podrían ser parciales, o injustos. Los datos de una muestra aleatoria simple de todos los estudiantes serían mas representativos del peso de las mochilas de todos los estudiantes. Lee el texto que sigue al Ejemplo A en tu libro para entender mejor estos términos y repasar los valores del resumen de los cinco números. La siguiente gráfica de caja muestra los datos de mochilas con los valores del resumen de los cinco números resaltados y explicados. El borde izquierdo de la caja es el primer cuartil, Q1, que es la mediana de los valores que están por debajo de la mediana. 0 5 Mínimo 10 Q3 Q1 15 El borde derecho de la caja es el tercer cuartil, Q3, que es la mediana de los valores que están por encima de la mediana. 20 Peso (lb) 25 30 35 Máximo Mediana El mínimo, Q1, la mediana, Q3, y el máximo se conocen colectivamente como el resumen de cinco números. Los segmentos que salen desde la “caja” son “brazos”. Observa el largo del brazo derecho. En los datos de las mochilas, la más pesada tiene 33 lb, eso es bastante más que el peso siguiente de 20 lb. Los valores externos de un conjunto de datos se llaman extremos. En una gráfica de caja modificada los puntos que estén a más de 1.5 veces el IQR desde los extremos de la caja se trazan como puntos separados. Para entender mejor los valores externos y las gráficas de caja modificadas, analiza el Ejemplo B en tu libro. Los estadísticos usan la palabra forma para describir cómo se distribuyen los (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press CHAPTER 2 17 Lección 2.1 • Gráficas de caja (continuación) datos con relación a la posición de la medida de tendencia central. Los datos simétricos están equilibrados o casi equilibrados en el centro. Los datos sesgados (skewed) están dispersos más hacia un lado del centro que hacia el otro lado. Esta gráfica de caja muestra un conjunto de datos simétricos. Los datos sesgados hacia la derecha implican que están dispersos más hacia la derecha del centro que hacia la izquierda. Este conjunto de datos está sesgado hacia la izquierda. Investigación: Frecuencia del pulso La investigación en tu libro consiste en reunir frecuencia del pulso de todos los estudiantes del grupo. Si no puedes reunir datos reales, usa los siguientes. Pulsos en reposo: 68, 76, 84, 80, 76, 72, 60, 68, 68, 80, 68, 80, 64, 64, 72, 76, 72, 68, 56, 88, 80, 76, 68, 56, 64, 60, 92, 72, 84, 72 Pulsos después de hacer ejercicio: 148, 136, 157, 151, 121, 139, 137, 129, 127, 129, 155, 141, 133, 153, 161, 153, 127, 135, 144, 146, 136, 131, 133, 159, 127, 142, 133, 150, 164, 161 Ordena los pulsos en reposo para hallar el resumen de cinco números. 56, 56, 60, 60, 64, 64, 64, 68, 68, 68, 68, 68, 68, 72, 72, 72, 72, 72, 76, 76, 76, 76, 80, 80, 80, 80, 84, 84, 84, 88, 92 El valor mínimo de estos datos es 56 y el máximo es 92. Existen 30 valores en el conjunto de datos, por lo tanto la mediana es la media de los valores 15.o y 16.o, que es 72. El primer cuartil es la mediana de los primeros 15 valores, que es 68. El tercer cuartil es la mediana de los 15 valores más altos, que es 80. Por lo tanto, el resumen de cinco números de la muestra de datos de pulsos en reposo es 56, 68, 72, 80, 92. Siguiendo el mismo proceso, puedes determinar que el resumen de cinco números de la muestra de los pulsos después de hacer ejercicio es 121, 133, 140, 153, 164. Usa los resúmenes de cinco números para construir las gráficas de caja. Usando una escala de 50 a 170, podrás presentar ambos conjuntos de datos en el mismo eje. En reposo Ejercicio 50 70 90 110 130 150 170 Pulso (latidos por minuto) Éstas son conclusiones que puedes sacar a partir de las gráficas de caja. Intenta sacar un mínimo de tres conclusiones más, por tu cuenta. ● ● ● El pulso mínimo después de hacer ejercicio es de casi 30 latidos por minuto más que el pulso máximo en reposo. Ambos conjuntos de datos están sesgados hacia la derecha y los pulsos mayores que la mediana están más dispersos que los pulsos menores que la mediana. La mediana de los pulsos después del ejercicio casi dobla los pulsos en reposo. ¿Puedes sacar una conclusión acerca de una población más grande? Si reuniste los datos de los estudiantes de tu clase, entonces esos datos podrían representar de los estudiantes de tu edad. Sin embargo, es posible que tu clase tenga un porcentaje mayor de deportistas que la población general de estudiantes de tu edad, o que tenga otras características especiales que hagan que los datos sean menos representativos. ¿Qué otros factores podrían influir si generalizaras los datos de tu clase para una población más grande? 18 CHAPTER 2 Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press LECCIÓN CONDENSADA 2.2 Medidas de dispersión En esta lección ● ● hallarás las medidas de dispersión de un conjunto de datos hallarás e interpretarás la desviación estándar de un conjunto de datos Si hiciste el ejercicio 7 de la Lección 2.1, es posible que recuerdes los siguientes datos. Éstos son los puntajes de las tareas de dos estudiantes, de menor a mayor. Puntajes de Connie: 82, 82, 84, 84, 85, 85, 86 Puntajes de Oscar: 72, 76, 76, 84, 90, 94, 96 Ambos conjuntos de datos tienen una media de 84 y una mediana de 84. Sin embargo, los conjuntos de datos son muy diferentes. En esta lección aprenderás modos de describir la variabilidad, o dispersión, de un conjunto de datos. Las gráficas de caja de los datos muestran que los puntajes de Oscar están más dispersos respecto de la mediana, mientras que los puntajes de Connie están agrupados más cerca de la mediana. Tareas semestrales Connie Oscar Las gráficas de caja muestran la dispersión de los 72 74 76 78 80 82 84 86 88 90 92 94 96 datos con respecto a la mediana, pero es posible Puntaje que a veces necesites mirar la dispersión de los datos con respecto a la media. Lee la página 93 en tu libro para aprender a calcular las desviaciones, que son las diferencias con signo entre los valores de los datos y la media. En la investigación explorarás modos de describir la variabilidad de los resultados de un experimento. Investigación: Un buen diseño En esta investigación realizarás varios ensayos para un experimento. Si tu experimento está bien diseñado y lo haces consistentemente, obtendrás un resultado parecido en cada ensayo. Realiza uno de los dos experimentos descritos en tu libro. Aquí usaremos la muestra de datos del Experimento del lanzamiento de bandas elásticas, pero tú debes seguir tus propios datos. Muestra de datos de las bandas elásticas (cm): 182.2, 135.9, 187.6, 162.5, 150.0, 186.5, 180.0 Calcula la distancia media de tus ensayos y luego calcula las desviaciones. Para la muestra, la media es 169.2 cm. Para calcular las desviaciones, resta la media de cada valor del conjunto de datos. Para la muestra de datos, las desviaciones son 13.0, 33.3, 18.4, 6.7, 19.2, 17.3 y 10.8, respectivamente. Paso 1 Estos valores te dan una idea del nivel de control existente en la planificación de tu experimento. Si la mayoría de las diferencias se acerca a 0, significa que pudiste realizar los ensayos consistentemente, obteniendo un resultado parecido en cada ocasión. Paso 2 (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press CHAPTER 2 19 Lección 2.2 • Medidas de dispersión (continuación) Intenta hallar cómo calcular un solo valor que indique el nivel de consistencia de tus resultados. Una posibilidad es hallar el promedio de los valores absolutos de las diferencias. Para esta muestra de datos, el valor es 17.0, lo que indica que, en promedio, cada valor está a 17 cm de la media. La desviación estándar es una medida de la dispersión de datos respecto de la media. Averigua cómo usar tu calculadora para hallar la desviación estándar de un conjunto de datos (consulta Calculator Note 2A). Después, escribe los resultados de tu experimento y calcula la desviación estándar. Para esta muestra de datos, la desviación estándar es 20.2 cm. Paso 3 Antes de leer el siguiente texto, intenta hallar una fórmula o un procedimiento para hallar la desviación estándar sin calculadora. (Sugerencia: La desviación estándar implica elevar al cuadrado y sacar la raíz cuadrada.) Paso 4 Para calcular la desviación estándar, sigue estos pasos: 1. Eleva al cuadrado cada desviación del Paso 1. Para esta muestra de datos, los resultados son 169, 1108.9, 338.56, 44.89, 368.64, 299.29 y 116.64. 2. Halla la suma de las desviaciones al cuadrado. Para esta muestra de datos, la suma es 2445.91. 3. Divide la suma de las desviaciones al cuadrado entre el número de datos menos uno. Este valor se llama varianza de los datos. Para esta muestra de datos, la varianza es 407.65. 4. Saca la raíz cuadrada del resultado del paso anterior. El resultado es la desviación estándar. Para esta muestra de datos, la desviación estándar es 20.2 cm. En estadística, con frecuencia se refiere a la media con el símbolo x, que se pronuncia “x barra”. Otro símbolo, ⌺ (sigma mayúscula), se usa para expresar 5 la suma de los valores de un conjunto de datos. Por ejemplo, xi significa i=1 x1 ⫹ x2 ⫹ x3 ⫹ x4 ⫹ x5, donde x1, x2, x3, x4 y x5 son los valores individuales de los datos. Esto se llama notación sigma, o notación sumatoria. Puedes usar estos símbolos para resumir los pasos para hallar la desviación estándar en una sola fórmula: s⫽ n 2 (xi x) i=1 n1 donde xi representa los valores de los datos individuales, n es el número de valores y x es la media. Repite el experimento y reúne otro conjunto de siete u ocho ensayos. Mientras trabajas, sé lo más cuidadoso y consistente posible. Calcula la desviación estándar de los resultados. ¿Cómo se compara la desviación estándar del segundo conjunto de ensayos con la desviación estándar del primer conjunto? ¿Realizaste los ensayos más consistentemente la segunda vez? Paso 5 Lee el texto en las páginas 95 a 97 de tu libro y asegúrate de que lo entiendes. Después practica cómo hallar la desviación estándar y cómo identificar los extremos (outliers) siguiendo el ejemplo en tu libro. 20 CHAPTER 2 Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press LECCIÓN CONDENSADA 2.3 Histogramas y rangos percentiles En esta lección ● ● ● construirás e interpretarás histogramas hallarás el rango percentil del valor de datos aplicarás todas las estadísticas y gráficos que has aprendido para analizar un conjunto de datos Un histograma muestra cómo se distribuyen los datos numéricos en diferentes intervalos, dando una visión clara de los agrupamientos y los vacíos existentes en el conjunto de datos. Las columnas de un histograma, llamadas barras (bins), indican cuántos valores de datos pertenecen a un intervalo dado. 20 18 16 14 12 10 8 Número de mochilas Número de mochilas El nivel de detalle que muestra un histograma depende del ancho de las barras. Ambos histogramas muestran los datos de las mochilas de la Lección 2.1 de tu libro. 6 4 2 0 0 12 24 36 Peso de las mochilas (lb) 12 10 8 6 4 2 0 0 6 12 18 24 30 36 Peso de las mochilas (lb) El ancho de barra de la gráfica izquierda es 6, mientras que el de la derecha es 3. Cada barra incluye el valor mínimo (a la izquierda), pero no el valor máximo (a la derecha). Por lo tanto, por ejemplo, la segunda barra del histograma de la izquierda incluye las mochilas que pesan 6 libras, pero no las que pesan 12 libras. Una mochila de 12 libras estaría incluida en la tercera barra. El histograma derecho proporciona más detalles sobre la distribución que el histograma izquierdo. Por ejemplo, en el histograma izquierdo puedes ver que hay cuatro mochilas que pesan menos de 6 libras. El histograma de la derecha muestra que cada una de estas cuatro mochilas pesa al menos 3 libras. EJEMPLO Considera los histogramas anteriores. a. ¿Cuál es el número total de mochilas representadas en los histogramas? b. Describe cómo cada histograma muestra agrupamientos y vacíos en los datos. c. Usa el histograma izquierdo para determinar el intervalo que incluye el peso mediano. Ahora usa el derecho para determinar el intervalo que incluye la mediana. ¿Qué histograma te da una estimación más precisa de la mediana? d. ¿Qué porcentaje de las mochilas pesa menos de 9 libras? (continúa) Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press CHAPTER 2 21 Lección 2.3 • Histogramas y rangos percentiles (continuación) 䊳 Solución a. Usa cualquiera de los dos histogramas y suma el número de mochilas en cada barra. Con el histograma izquierdo, obtienes 4 19 5 1 1 30. Por lo tanto, hay 30 mochilas representadas. (Verifica esta respuesta usando el histograma derecho.) b. El histograma izquierdo muestra que los pesos más comunes están entre 6 y 12 libras, que todas las mochilas, excepto dos, pesan menos de 18 libras y que ninguna pesa entre 24 y 30 libras. El histograma derecho muestra que los pesos más comunes están entre 9 y 12 libras, que todas las mochilas, excepto siete, pesan entre 3 y 12 libras y que ninguna mochila pesa entre 21 y 33 libras. c. Existe un total de 30 valores, de modo que la mediana se ubica entre los valores 15° y 16°. En el histograma izquierdo, el valor mediano está en la segunda barra, que incluye valores mayores o iguales a 6 libras y siempre menores que 12 libras. Esto se puede expresar como 6 lb peso 12 lb. En el histograma derecho, la mediana está en la cuarta barra, que incluye valores tales como 9 lb peso 12 lb. El histograma derecho da una estimación más precisa. d. Usa el histograma derecho porque tiene una barra con un valor final de 9. Suma las frecuencias de las barras a la izquierda de 9. Obtienes 4 8 12. Por lo tanto, 1320 , ó 40%, de las mochilas pesan menos de 9 libras. Analiza ahora el Ejemplo A en tu libro. Asegúrate de que entiendas cómo crear un histograma en tu calculadora (consulta Calculator Note 2C). El rango percentil (percentile rank) de un valor expresa el porcentaje de valores que están por debajo de ese valor. En la parte d del ejemplo anterior, el 40% de las mochilas pesa menos de 9 libras, por lo tanto, una mochila que pesa 9 libras tiene un rango percentil de 40. Resuelve el Ejemplo B en tu libro para practicar con percentiles y desviaciones estándar. Investigación: Comida a la carrera La investigación en tu libro te pide que realices un análisis estadístico sobre el valor nutricional de los productos de comida rápida. Lee la investigación atentamente y después realiza tu análisis estadístico. Si decides analizar el contenido de grasa saturada en los productos, deberías considerar las gráficas y estadísticas. Grasas saturadas (g) Todos los sándwiches Todos los sándwiches Hamburguesas Pollo Media Mediana Desviación estándar 22 CHAPTER 2 11.9 8 17.6 18 6.2 6 9.2 9.8 2.8 Hamburguesas Pollo 0 5 10 15 20 25 Grasas saturadas (g) 30 35 Discovering Advanced Algebra Condensed Lessons in Spanish ©2010 Key Curriculum Press