Medidas de la tendencia central y las gráficas de caja

Anuncio
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 17
LECCIÓN
Medidas de la tendencia
central y las gráficas de caja
CONDENSADA
2.1
En esta lección
●
●
Encontrarás e interpretarás la media, la mediana, y la moda para unos
conjuntos de datos
Crearás e interpretarás las gráficas de caja para unos conjuntos de datos
Para facilitar el entendimiento y la interpretación de un conjunto grande de datos,
puedes presentar los valores en una gráfica y calcular las medidas numéricas, o
estadísticas, que resumen los datos.
La media, la mediana, y la moda son estadísticas que dan una indicación del
valor típico de un conjunto de datos. Probablemente hayas aprendido sobre estas
medidas de tendencia central en anteriores cursos de matemáticas. Repasa estas
medidas, trabajando el Ejemplo A en tu libro y después, leyendo, el resto de la
página 78. Aquí tienes un resumen de los puntos claves:
●
●
●
●
La media, que a menudo se representa con el símbolo x, es la suma de los
valores de los datos dividida entre el número de valores de datos.
La mediana es el valor de en medio (si hay un número impar de valores) o
la media de los dos valores de en medio (si hay un número par de valores)
cuando los datos se colocan en orden.
La moda es el valor que se presenta con más frecuencia.
Cuando un conjunto de datos tiene uno o más valores que se apartan mucho
del resto, por lo general la mediana es la mejor medida de lo que es típico,
en lugar de la media.
n
●
El símbolo
xi significa x1 x 2 x 3 · · · xn, donde x1, x 2, . . . , xn
i1
son los valores de dato individuales. Por tanto, la fórmula para la media de
n valores de datos es
n
xi
i1
x n
●
La recolección de datos de una muestra aleatoria (random sample) ayuda a
asegurar que los datos no sean sesgados, o injustos.
Una buena descripción de un conjunto de datos incluye una medida de la
tendencia central, junto con información sobre la forma y la dispersión de los
datos. Una gráfica de caja es una herramienta útil para mostrar la forma y la
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
CHAPTER 2
17
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 18
Lección 2.1 • Medidas de la tendencia central y las gráficas de caja (continuación)
dispersión de los datos. A continuación se presenta una gráfica de caja de los
datos sobre las mochilas en tu libro.
El borde izquierdo de la caja es el primer
cuartil, Q1, que es la mediana de los
valores que están por debajo de la mediana.
0
5
Mínimo
10
Q1
Q3
15
El borde derecho de la caja es el tercer
cuartil, Q3, que es la mediana de los valores
que están por encima de la mediana.
20
Peso (lb)
25
30
35
Máximo
Mediana
El mínimo, Q1, la mediana, Q3, y el máximo se conocen colectivamente como el resumen de cinco números.
Los segmentos que se salen de la “caja” se llaman “bigotes” (“whiskers”). Una
gráfica de caja divide los datos en cuatro partes iguales. El bigote izquierdo, la
parte izquierda de la caja, la parte derecha de la caja, y el bigote derecho
representan cada uno un cuarto de los datos.
El resumen de cinco números da los valores de los puntos claves de una gráfica
de caja. El resumen de cinco números para los datos de las mochilas es 3, 7, 9,
10, 33. Los cinco números son el valor mínimo, el primer cuartil, la mediana,
el tercer cuartil, y el valor máximo, respectivamente.
Para ayudarte a entender mejor las gráficas de caja, trabaja el Ejemplo B en
tu libro.
Datos simétricos
Los estadísticos usan la palabra forma para describir cómo se distribuyen los
datos con relación a la posición de la medida de tendencia central. Los datos
simétricos están balanceados o casi balanceados en el centro. Los datos sesgados
(skewed) están distribuidos más hacia un lado del centro que hacia el otro.
Datos sesgados
Investigación: Tasas de pulso
La investigación en tu libro implica la recolección de las tasas de los pulsos de
todos los estudiantes del grupo. Si esto no es posible, usa los datos siguientes.
Pulso en reposo: 68, 76, 84, 80, 76, 72, 60, 68, 68, 80, 68, 80, 64, 64, 72, 76, 72,
68, 56, 88, 80, 76, 68, 56, 64, 60, 92, 72, 84, 72
Pulso después del ejercicio: 148, 136, 157, 151, 121, 139, 137, 129, 127, 129,
155, 141, 133, 153, 161, 153, 127, 135, 144, 146, 136, 131, 133, 159, 127, 142,
133, 150, 164, 161
Para hallar el resumen de cinco números de los datos del pulso en reposo,
empieza por ordenarlos.
56, 56, 60, 60, 64, 64, 64, 68, 68, 68, 68, 68, 68, 72, 72, 72, 72, 72, 76, 76, 76, 76,
80, 80, 80, 80, 84, 84, 84, 88, 92
El valor mínimo de estos datos es 56 y el máximo es 92. Existen 30 valores
en el conjunto de datos, de modo que la mediana es la media de los valores
décimoquinto y décimosexto, que es 72. El primer cuartil es la mediana de los
primeros 15 valores, es decir, 68. El tercer cuartil es la mediana de los 15 valores
más altas, es decir 80.
18
CHAPTER 2
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 19
Lección 2.1 • Medidas de la tendencia central y las gráficas de caja (continuación)
Así pues, el resumen de cinco números de la muestra de los datos de pulsos en
reposo es 56, 68, 72, 80, 92. Siguiendo el mismo proceso, puedes determinar que
el resumen de cinco números de la muestra de los pulsos después del ejercicio
es 121, 133, 140, 153, 164. Usa los resúmenes de cinco números para construir
las gráficas de caja. Usando una escala de 50 a 170, podrás presentar ambos
conjuntos de datos en el mismo eje.
En reposo
Ejercicio
50
70 90 110 130 150 170
Pulso (latidos por minuto)
He aquí unas conclusiones a las que puedes llegar a partir de las gráficas de caja.
Trata de llegar a un mínimo de tres conclusiones más, por tu propia cuenta.
●
●
●
El pulso mínimo después del ejercicio es de casi 30 latidos por minuto más que
el pulso máximo en reposo.
Ambos conjuntos de datos están sesgados, y los pulsos mayores que la mediana
están más dispersos que los pulsos menores que la mediana.
La mediana de los pulsos después del ejercicio es casi el doble que los pulsos en
reposo.
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
CHAPTER 2
19
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 20
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 21
LECCIÓN
CONDENSADA
2.2
Medidas de dispersión
En esta lección
●
●
●
Encontrarás las medidas de dispersión de un conjunto de datos
Encontrarás e interpretarás la desviación estándar de un conjunto de datos
Usarás el alcance intercuartil (IQR) para identificar los externos de un
conjunto de datos
Ambos conjuntos de datos que presentamos a continuación tienen una media
de 16 y una mediana de 16. Sin embargo, los dos conjuntos son claramente
diferentes. Específicamente, los valores del primero conjunto de datos están
agrupados bastante cerca de las medidas centrales, mientras que en el segundo
conjunto los valores están más dispersos.
Conjunto 1: 14, 14, 15, 16, 16, 16, 16, 17, 18, 18
Conjunto 2: 0, 2, 4, 8, 14, 18, 24, 24, 30, 36
Estos conjuntos de datos evidencian que una medida central por sí sola no
da una visión completa de un conjunto de datos. En esta lección aprenderás
algunas maneras de describir la variabilidad, o dispersión (spread), de un
conjunto de datos.
Investigación: Un buen diseño
En esta investigación llevarás a cabo varios ensayos de un experimento. Si tu
experimento está bien diseñado y lo llevas a cabo de manera consistente, debes
obtener un resultado parecido en cada ensayo.
Realiza uno de los dos experimentos descritos en tu libro. Aquí usaremos la
muestra de datos del Experimento del lanzamiento de bandas elásticas, pero tú
debes seguir con tus propios datos.
Muestra de datos de las bandas elásticas (cm): 182.2, 135.9, 187.6, 162.5, 150.0,
186.5, 180.0
Paso 1 Calcula la distancia media de tus ensayos. Para la muestra, la media es
169.2 cm.
Paso 2 Resta la media de cada valor del conjunto de datos. Para la muestra,
las diferencias son 13.0, 33.3, 18.4, 6.7, 19.2, 17.3, y 10.8, respectivamente.
Estos valores te dan una idea del nivel de control existente en la planificación de
tu experimento. Si la mayor parte de las diferencias se acerca a 0, significa que
fuiste capaz de realizar los intentos de forma consistente, obteniendo un resultado
parecido en cada ocasión.
Trata de encontrar una manera de calcular un solo valor que indica el nivel de
conformidad entre tus resultados. Una posibilidad es encontrar el promedio de los
valores absolutos de las diferencias. Para esta muestra de datos, el valor es 17.0,
lo que indica que, como promedio, cada valor se sitúa a 17 cm de la media.
(continúa)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
CHAPTER 2
21
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 22
Lección 2.2 • Medidas de dispersión (continuación)
Paso 3 La desviación estándar es una medida de la dispersión de los datos con
respecto a la media. Descubre cómo usar tu calculadora para hallar la desviación
estándar de un conjunto de datos (consulta Calculator Note 2B). Después,
introduce los resultados de tu experimento y calcula la desviación estándar. Para
esta muestra de datos, la desviación estándar es 20.2 cm.
Paso 4 Antes de leer el texto siguiente, intenta encontrar una fórmula o un
procedimiento para hallar la desviación estándar sin calculadora. (Sugerencias:
Una desviación es una diferencia entre un valor de datos y la media del conjunto
de datos. La desviación estándar implica elevar al cuadrado y sacar la raíz
cuadrada).
Para calcular la desviación estándar, sigue estos pasos:
1. Encuentra las desviaciones restando la media de cada valor. (Ya hiciste esto en
el Paso 2.) Para esta muestra de datos, las desviaciones son 13.0, 33.3, 18.4,
6.7, 19.2, 17.3, y 10.8.
2. Eleva al cuadrado cada desviación. Para esta muestra, los resultados son 169,
1108.9, 338.56, 44.89, 368.64, 299.29, y 116.64.
3. Encuentra la suma de las desviaciones cuadradas. Para esta muestra, la suma
es 2445.91.
4. Divide la suma de las desviaciones cuadradas entre el número de datos menos
uno. Este valor se llama la varianza de los datos. Para esta muestra, la
varianza es 407.65.
5. Saca la raíz cuadrada del resultado del paso anterior. El resultado es la
desviación estándar. Para la muestra, la desviación estándar es 20.2 cm.
Estos pasos para calcular la desviación estándar, s, pueden resumirse en una sola
fórmula:
n
s
xi x2
i1
n1
donde xi representa los valores individuales de los datos, n es el número de
valores, y x es la media.
Paso 5 Repite el experimento y obtén otro conjunto de siete u ocho ensayos.
Mientras trabajas, sé lo más cuidadoso y consistente posible. Calcula la desviación
estándar de los resultados. ¿Cómo se compara la desviación estándar del segundo
conjunto de ensayos con la desviación estándar del primer conjunto? ¿Realizaste
los ensayos de una manera más consistente la segunda vez?
Lee el texto en las páginas 87–89 de tu libro hasta el ejemplo, y asegúrate de que
lo entiendes. Después encuentra la desviación estándar e identifica los externos
(outliers) siguiendo el ejemplo en tu libro.
22
CHAPTER 2
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
4/15/04
3:19 PM
Page 23
LECCIÓN
CONDENSADA
2.3
Histogramas y grados percentiles
En esta lección
●
●
●
Construirás e interpretarás unos histogramas
Encontrarás el grado percentil de un valor
Aplicarás todas las estadísticas y gráficos que has aprendido para analizar un
conjunto de datos
Un histograma muestra cómo se distribuyen los datos numéricos en diferentes
intervalos, lo cual te da una visión clara de los agrupamientos y los vacíos
existentes en el conjunto de datos. Las columnas, llamadas barras (bins), de un
histograma indican cuántos valores de datos caen dentro de un intervalo dado.
El nivel de detalle mostrado en un histograma depende del ancho de las barras.
Estos dos histogramas muestran los datos de las mochilas de la Lección 2.1.
20
18
16
14
12
10
8
Número de mochilas
Número de mochilas
DAACLS_678_02.qxd
6
4
2
0
0
12
24
36
Peso de las mochilas (lb)
12
10
8
6
4
2
0
0
6 12 18 24 30 36
Peso de las mochilas (lb)
El ancho de barra del gráfico a la izquierda es 6, mientras que el a la derecha es 3.
Cada barra incluye el valor mínimo (de la izquierda), pero no el valor máximo
(de la derecha). Así, por ejemplo, la segunda barra del histograma a la izquierda
incluye las mochilas que pesan 6 libras, pero no las que pesan 12 libras. Una
mochila de 12 libras estaría contenida en la tercera barra.
El histograma a la derecha proporciona más detalles sobre la distribución que el
histograma a la izquierda. Por ejemplo, del histograma a la izquierda puedes ver
que hay cuatro mochilas que pesan menos de 6 libras. El histograma a la derecha
muestra que cada una de estas cuatro mochilas pesa al menos 3 libras.
EJEMPLO
Considera los histogramas anteriores.
a. ¿Cuál es el número total de mochilas representadas por los histogramas?
b. Describe la forma en que cada histograma muestra los agrupamientos y los
vacíos en los datos.
c. Usa el histograma a la izquierda para determinar el intervalo que incluye
el peso mediano. Ahora usa el histograma a la derecha para determinar el
intervalo que incluye la mediana. ¿Cuál histograma te da una estimación más
precisa de la mediana?
d. ¿Qué porcentaje de las mochilas pesa menos de 9 libras?
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
(continúa)
CHAPTER 2
23
DAACLS_678_02.qxd
4/15/04
3:19 PM
Page 24
Lección 2.3 • Histogramas y grados percentiles (continuación)
Solución
a. Usa cualquiera de los dos histogramas y suma el número de mochilas en cada
barra. Con el histograma a la izquierda, obtienes 4 19 5 1 1 30.
Entonces, hay 30 mochilas representadas. (Verifica esta respuesta sumando las
frecuencias de las barras en el histograma a la derecha.)
b. El histograma a la izquierda muestra que los pesos más comunes se encuentran
entre 6 y 12 libras, que todas las mochilas, excepto dos, pesan menos de
18 libras, y que ninguna pesa entre 24 y 30 libras. El histograma a la derecha
muestra que los pesos más comunes se encuentran entre 9 y 12 libras, que
todas las mochilas, excepto siete, pesan entre 3 y 12 libras, y que ninguna
mochila pesa entre 21 y 33 libras.
c. Existe un total de 30 valores, de modo que la mediana se ubica entre los
valores 15° y 16°. En el histograma a la izquierda, el valor mediano se
encuentra en la segunda barra, en la que se incluyen valores mayores que
o iguales a 6 libras, y siempre menores que 12 libras. En el histograma a
la derecha, la mediana se ubica en la cuarta barra, en la que se incluyen
valores mayores que o iguales a 9 libras y siempre menores que 12 libras.
El histograma de la derecha da una estimación más precisa.
d. Usa el histograma a la izquierda porque tiene una barra con un valor final de
9. Suma las frecuencias de las barras a la izquierda de 9. Obtienes 4 8 12.
Así pues, 1320 , ó 40%, de las mochilas pesan menos de 9 libras.
Trabaja ahora el Ejemplo A en tu libro. Asegúrate que entiendes cómo crear un
histograma en tu calculadora.
El grado percentil (percentile rank) de un valor expresa el porcentaje de valores
que están debajo de ese valor. En la parte d del ejemplo anterior, el 40% de las
mochilas pesan menos de 9 libras, y por tanto, una mochila que pesa 9 libras
tiene un grado percentil de 40. Trabaja el Ejemplo B en tu libro para practicar
los percentiles y las desviaciones estándar.
Investigación: Comida a la carrera
En la investigación en tu libro se te
pide que lleves a cabo un análisis
estadístico sobre el valor
nutricional de los productos
de comida rápida. Lee la
investigación atentamente
y después realiza tu análisis
estadístico.
Todos los
productos
Hamburguesas
Pollo
Pescado
18.7
15.6
15.1
27.5
18
13
14
9.4
6.2
Media
Mediana
Desviación
estándar
Si decides analizar el contenido de
grasa en los productos, deberías
considerar estos estadísticas y gráficos.
26.5
9.3
8.7
Todos los
productos
Hamburguesas
Pollo
Pescado
0
24
CHAPTER 2
4
8
12 16 20 24 28 32 36 40 44
Grasa (gramos)
Discovering Advanced Algebra Condensed Lessons in Spanish
©2004 Key Curriculum Press
Descargar