Gráficas de caja

Anuncio
LECCIÓN
CONDENSADA
2.1
Gráficas de caja
En esta lección
●
●
●
crearás e interpretarás las gráficas de caja para conjuntos de datos
usarás el rango intercuartil (IQR) para identificar valores extremos
potenciales y representarlos gráficamente en una gráfica de caja modificada
identificarás la forma de los datos como sesgados o simétricos
Para entender e interpretar un conjunto de datos, puedes presentar los valores en
una gráfica y calcular las medidas numéricas, o estadísticas, que resumen los datos.
La media, la mediana y la moda son estadísticas que dan una indicación del valor
típico de un conjunto de datos. Probablemente hayas aprendido sobre estas medidas
de tendencia central en cursos anteriores de matemáticas. Repasa estas medidas,
analizando los ejemplos y ejercicios de la lección Refreshing Your Skills del Capítulo 2.
Una buena descripción de un conjunto de datos incluye una medida de la tendencia
central, junto con información sobre la forma y la dispersión de los datos. Una
gráfica de caja es una herramienta útil para mostrar la forma y la dispersión de los
datos. Analiza el Ejemplo A de la Lección 2.1 en tu libro para repasar cómo hallar
el resumen de los cinco números de un conjunto de datos y crea una gráfica de caja.
Cuando analizas datos, es importante saber cómo se reunieron esos datos. Si sólo
se recopilaron datos de las mochilas de los estudiantes que salían de una clase
determinada, podrían ser parciales, o injustos. Los datos de una muestra aleatoria
simple de todos los estudiantes serían mas representativos del peso de las mochilas de
todos los estudiantes. Lee el texto que sigue al Ejemplo A en tu libro para entender
mejor estos términos y repasar los valores del resumen de los cinco números.
La siguiente gráfica de caja muestra los datos de mochilas con los valores del
resumen de los cinco números resaltados y explicados.
El borde izquierdo de la caja es el primer
cuartil, Q1, que es la mediana de los
valores que están por debajo de la mediana.
0
5
Mínimo
10
Q3
Q1
15
El borde derecho de la caja es el tercer
cuartil, Q3, que es la mediana de los valores
que están por encima de la mediana.
20
Peso (lb)
25
30
35
Máximo
Mediana
El mínimo, Q1, la mediana, Q3, y el máximo se conocen colectivamente como el resumen de cinco números.
Los segmentos que salen desde la “caja” son “brazos”. Observa el largo del brazo
derecho. En los datos de las mochilas, la más pesada tiene 33 lb, eso es bastante
más que el peso siguiente de 20 lb. Los valores externos de un conjunto de datos
se llaman extremos. En una gráfica de caja modificada los puntos que estén a más
de 1.5 veces el IQR desde los extremos de la caja se trazan como puntos separados.
Para entender mejor los valores externos y las gráficas de caja modificadas, analiza
el Ejemplo B en tu libro.
Los estadísticos usan la palabra forma para describir cómo se distribuyen los
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
CHAPTER 2
17
Lección 2.1 • Gráficas de caja (continuación)
datos con relación a la posición de la medida de tendencia central. Los datos
simétricos están equilibrados o casi equilibrados en el centro. Los datos sesgados
(skewed) están dispersos más hacia un lado del centro que hacia el otro lado.
Esta gráfica de caja muestra un conjunto de datos simétricos.
Los datos sesgados hacia la derecha implican que están
dispersos más hacia la derecha del centro que hacia la izquierda.
Este conjunto de datos está sesgado hacia la izquierda.
Investigación: Frecuencia del pulso
La investigación en tu libro consiste en reunir frecuencia del pulso de todos los
estudiantes del grupo. Si no puedes reunir datos reales, usa los siguientes.
Pulsos en reposo: 68, 76, 84, 80, 76, 72, 60, 68, 68, 80, 68, 80, 64, 64, 72, 76,
72, 68, 56, 88, 80, 76, 68, 56, 64, 60, 92, 72, 84, 72
Pulsos después de hacer ejercicio: 148, 136, 157, 151, 121, 139, 137, 129, 127,
129, 155, 141, 133, 153, 161, 153, 127, 135, 144, 146, 136, 131, 133, 159, 127,
142, 133, 150, 164, 161
Ordena los pulsos en reposo para hallar el resumen de cinco números.
56, 56, 60, 60, 64, 64, 64, 68, 68, 68, 68, 68, 68, 72, 72, 72, 72, 72, 76, 76, 76, 76,
80, 80, 80, 80, 84, 84, 84, 88, 92
El valor mínimo de estos datos es 56 y el máximo es 92. Existen 30 valores en el
conjunto de datos, por lo tanto la mediana es la media de los valores 15.o y 16.o,
que es 72. El primer cuartil es la mediana de los primeros 15 valores, que es 68.
El tercer cuartil es la mediana de los 15 valores más altos, que es 80.
Por lo tanto, el resumen de cinco números de la muestra de
datos de pulsos en reposo es 56, 68, 72, 80, 92. Siguiendo el
mismo proceso, puedes determinar que el resumen de cinco
números de la muestra de los pulsos después de hacer ejercicio
es 121, 133, 140, 153, 164. Usa los resúmenes de cinco números
para construir las gráficas de caja. Usando una escala de 50 a 170,
podrás presentar ambos conjuntos de datos en el mismo eje.
En reposo
Ejercicio
50
70 90 110 130 150 170
Pulso (latidos por minuto)
Éstas son conclusiones que puedes sacar a partir de las gráficas de caja. Intenta
sacar un mínimo de tres conclusiones más, por tu cuenta.
●
●
●
El pulso mínimo después de hacer ejercicio es de casi 30 latidos por minuto
más que el pulso máximo en reposo.
Ambos conjuntos de datos están sesgados hacia la derecha y los pulsos mayores
que la mediana están más dispersos que los pulsos menores que la mediana.
La mediana de los pulsos después del ejercicio casi dobla los pulsos en reposo.
¿Puedes sacar una conclusión acerca de una población más grande? Si reuniste
los datos de los estudiantes de tu clase, entonces esos datos podrían representar
de los estudiantes de tu edad. Sin embargo, es posible que tu clase tenga un
porcentaje mayor de deportistas que la población general de estudiantes de
tu edad, o que tenga otras características especiales que hagan que los datos
sean menos representativos. ¿Qué otros factores podrían influir si generalizaras
los datos de tu clase para una población más grande?
18
CHAPTER 2
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
LECCIÓN
CONDENSADA
2.2
Medidas de dispersión
En esta lección
●
●
hallarás las medidas de dispersión de un conjunto de datos
hallarás e interpretarás la desviación estándar de un conjunto de datos
Si hiciste el ejercicio 7 de la Lección 2.1, es posible que recuerdes los siguientes
datos. Éstos son los puntajes de las tareas de dos estudiantes, de menor a mayor.
Puntajes de Connie: 82, 82, 84, 84, 85, 85, 86
Puntajes de Oscar: 72, 76, 76, 84, 90, 94, 96
Ambos conjuntos de datos tienen una media de 84 y una mediana de 84. Sin
embargo, los conjuntos de datos son muy diferentes. En esta lección aprenderás
modos de describir la variabilidad, o dispersión, de un conjunto de datos.
Las gráficas de caja de los datos muestran que los
puntajes de Oscar están más dispersos respecto
de la mediana, mientras que los puntajes de
Connie están agrupados más cerca de la mediana.
Tareas semestrales
Connie
Oscar
Las gráficas de caja muestran la dispersión de los
72 74 76 78 80 82 84 86 88 90 92 94 96
datos con respecto a la mediana, pero es posible
Puntaje
que a veces necesites mirar la dispersión de los
datos con respecto a la media. Lee la página 93 en tu libro para aprender
a calcular las desviaciones, que son las diferencias con signo entre los valores
de los datos y la media.
En la investigación explorarás modos de describir la variabilidad de los resultados
de un experimento.
Investigación: Un buen diseño
En esta investigación realizarás varios ensayos para un experimento. Si tu
experimento está bien diseñado y lo haces consistentemente, obtendrás un
resultado parecido en cada ensayo.
Realiza uno de los dos experimentos descritos en tu libro. Aquí usaremos la
muestra de datos del Experimento del lanzamiento de bandas elásticas, pero tú
debes seguir tus propios datos.
Muestra de datos de las bandas elásticas (cm): 182.2, 135.9, 187.6, 162.5, 150.0,
186.5, 180.0
Calcula la distancia media de tus ensayos y luego calcula las desviaciones.
Para la muestra, la media es 169.2 cm. Para calcular las desviaciones, resta
la media de cada valor del conjunto de datos. Para la muestra de datos, las
desviaciones son 13.0, 33.3, 18.4, 6.7, 19.2, 17.3 y 10.8, respectivamente.
Paso 1
Estos valores te dan una idea del nivel de control existente en la
planificación de tu experimento. Si la mayoría de las diferencias se acerca a 0,
significa que pudiste realizar los ensayos consistentemente, obteniendo un
resultado parecido en cada ocasión.
Paso 2
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
CHAPTER 2
19
Lección 2.2 • Medidas de dispersión (continuación)
Intenta hallar cómo calcular un solo valor que indique el nivel de consistencia
de tus resultados. Una posibilidad es hallar el promedio de los valores absolutos
de las diferencias. Para esta muestra de datos, el valor es 17.0, lo que indica que,
en promedio, cada valor está a 17 cm de la media.
La desviación estándar es una medida de la dispersión de datos respecto
de la media. Averigua cómo usar tu calculadora para hallar la desviación estándar
de un conjunto de datos (consulta Calculator Note 2A). Después, escribe los
resultados de tu experimento y calcula la desviación estándar. Para esta muestra
de datos, la desviación estándar es 20.2 cm.
Paso 3
Antes de leer el siguiente texto, intenta hallar una fórmula o un
procedimiento para hallar la desviación estándar sin calculadora. (Sugerencia:
La desviación estándar implica elevar al cuadrado y sacar la raíz cuadrada.)
Paso 4
Para calcular la desviación estándar, sigue estos pasos:
1. Eleva al cuadrado cada desviación del Paso 1. Para esta muestra de datos,
los resultados son 169, 1108.9, 338.56, 44.89, 368.64, 299.29 y 116.64.
2. Halla la suma de las desviaciones al cuadrado. Para esta muestra de datos,
la suma es 2445.91.
3. Divide la suma de las desviaciones al cuadrado entre el número de datos
menos uno. Este valor se llama varianza de los datos. Para esta muestra
de datos, la varianza es 407.65.
4. Saca la raíz cuadrada del resultado del paso anterior. El resultado es la
desviación estándar. Para esta muestra de datos, la desviación estándar
es 20.2 cm.
En estadística, con frecuencia se refiere a la media con el símbolo x៮, que se
pronuncia “x barra”. Otro símbolo, ⌺ (sigma mayúscula), se usa para expresar
5
la suma de los valores de un conjunto de datos. Por ejemplo,
xi significa
i=1
x1 ⫹ x2 ⫹ x3 ⫹ x4 ⫹ x5, donde x1, x2, x3, x4 y x5 son los valores individuales de
los datos. Esto se llama notación sigma, o notación sumatoria. Puedes usar estos
símbolos para resumir los pasos para hallar la desviación estándar en una sola fórmula:
s⫽
n
2
(xi x៮)
i=1
n1
donde xi representa los valores de los datos individuales, n es el número
de valores y x៮ es la media.
Repite el experimento y reúne otro conjunto de siete u ocho ensayos.
Mientras trabajas, sé lo más cuidadoso y consistente posible. Calcula la desviación
estándar de los resultados. ¿Cómo se compara la desviación estándar del segundo
conjunto de ensayos con la desviación estándar del primer conjunto? ¿Realizaste
los ensayos más consistentemente la segunda vez?
Paso 5
Lee el texto en las páginas 95 a 97 de tu libro y asegúrate de que lo entiendes.
Después practica cómo hallar la desviación estándar y cómo identificar los
extremos (outliers) siguiendo el ejemplo en tu libro.
20
CHAPTER 2
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
LECCIÓN
CONDENSADA
2.3
Histogramas y rangos percentiles
En esta lección
●
●
●
construirás e interpretarás histogramas
hallarás el rango percentil del valor de datos
aplicarás todas las estadísticas y gráficos que has aprendido para analizar
un conjunto de datos
Un histograma muestra cómo se distribuyen los datos numéricos en diferentes
intervalos, dando una visión clara de los agrupamientos y los vacíos existentes
en el conjunto de datos. Las columnas de un histograma, llamadas barras (bins),
indican cuántos valores de datos pertenecen a un intervalo dado.
20
18
16
14
12
10
8
Número de mochilas
Número de mochilas
El nivel de detalle que muestra un histograma depende del ancho de las barras.
Ambos histogramas muestran los datos de las mochilas de la Lección 2.1 de tu libro.
6
4
2
0
0
12
24
36
Peso de las mochilas (lb)
12
10
8
6
4
2
0
0
6 12 18 24 30 36
Peso de las mochilas (lb)
El ancho de barra de la gráfica izquierda es 6, mientras que el de la derecha es 3.
Cada barra incluye el valor mínimo (a la izquierda), pero no el valor máximo
(a la derecha). Por lo tanto, por ejemplo, la segunda barra del histograma de la
izquierda incluye las mochilas que pesan 6 libras, pero no las que pesan 12 libras.
Una mochila de 12 libras estaría incluida en la tercera barra.
El histograma derecho proporciona más detalles sobre la distribución que
el histograma izquierdo. Por ejemplo, en el histograma izquierdo puedes ver que
hay cuatro mochilas que pesan menos de 6 libras. El histograma de la derecha
muestra que cada una de estas cuatro mochilas pesa al menos 3 libras.
EJEMPLO
Considera los histogramas anteriores.
a. ¿Cuál es el número total de mochilas representadas en los histogramas?
b. Describe cómo cada histograma muestra agrupamientos y vacíos en los datos.
c. Usa el histograma izquierdo para determinar el intervalo que incluye el peso
mediano. Ahora usa el derecho para determinar el intervalo que incluye la
mediana. ¿Qué histograma te da una estimación más precisa de la mediana?
d. ¿Qué porcentaje de las mochilas pesa menos de 9 libras?
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
CHAPTER 2
21
Lección 2.3 • Histogramas y rangos percentiles (continuación)
䊳
Solución
a. Usa cualquiera de los dos histogramas y suma el número de mochilas en cada
barra. Con el histograma izquierdo, obtienes 4 19 5 1 1 30. Por
lo tanto, hay 30 mochilas representadas. (Verifica esta respuesta usando el
histograma derecho.)
b. El histograma izquierdo muestra que los pesos más comunes están entre 6 y
12 libras, que todas las mochilas, excepto dos, pesan menos de 18 libras y que
ninguna pesa entre 24 y 30 libras. El histograma derecho muestra que los pesos
más comunes están entre 9 y 12 libras, que todas las mochilas, excepto siete,
pesan entre 3 y 12 libras y que ninguna mochila pesa entre 21 y 33 libras.
c. Existe un total de 30 valores, de modo que la mediana se ubica entre los valores
15° y 16°. En el histograma izquierdo, el valor mediano está en la segunda
barra, que incluye valores mayores o iguales a 6 libras y siempre menores que
12 libras. Esto se puede expresar como 6 lb peso 12 lb. En el histograma
derecho, la mediana está en la cuarta barra, que incluye valores tales como
9 lb peso 12 lb. El histograma derecho da una estimación más precisa.
d. Usa el histograma derecho porque tiene una barra con un valor final de 9.
Suma las frecuencias de las barras a la izquierda de 9. Obtienes 4 8 12.
Por lo tanto, 1320 , ó 40%, de las mochilas pesan menos de 9 libras.
Analiza ahora el Ejemplo A en tu libro. Asegúrate de que entiendas cómo crear
un histograma en tu calculadora (consulta Calculator Note 2C).
El rango percentil (percentile rank) de un valor expresa el porcentaje de valores
que están por debajo de ese valor. En la parte d del ejemplo anterior, el 40% de
las mochilas pesa menos de 9 libras, por lo tanto, una mochila que pesa 9 libras
tiene un rango percentil de 40. Resuelve el Ejemplo B en tu libro para practicar
con percentiles y desviaciones estándar.
Investigación: Comida a la carrera
La investigación en tu libro te pide que realices un análisis estadístico sobre
el valor nutricional de los productos de comida rápida. Lee la investigación
atentamente y después realiza tu análisis estadístico.
Si decides analizar el contenido de grasa saturada en los productos, deberías
considerar las gráficas y estadísticas.
Grasas saturadas (g)
Todos los
sándwiches
Todos los
sándwiches Hamburguesas Pollo
Media
Mediana
Desviación
estándar
22
CHAPTER 2
11.9
8
17.6
18
6.2
6
9.2
9.8
2.8
Hamburguesas
Pollo
0
5
10
15
20
25
Grasas saturadas (g)
30
35
Discovering Advanced Algebra Condensed Lessons in Spanish
©2010 Key Curriculum Press
Descargar