Tema 12: Estadística y probabilidad Contenidos: Gráficos estadísticos - Estadígrafos de tendencia central Nivel: 4° Medio Gráficos estadísticos. Estadígrafo 1. Distribución de frecuencias Generalmente se distribuyen los datos en clases (dependiendo de la cantidad de los datos), entre 5 a 18 clases. Para calcular la magnitud de cada clase se divide el rango en el número de clases que se necesita o quiere realizar la distribución, aproximando al impar más cercano. Marca de la clase es el valor medio entre el límite inferior y el límite superior de cada clase. Ejemplo: Si de 80 datos, el menor es 60 y el mayor es 89, entonces el rango es (89 – 60) = 29; y si se decide formar 6 clases, entonces 29 : 6= 4, 8…, que aproximado al impar mas cercano es 5, que será la amplitud de cada clase: Frecuencia absoluta es el número de datos que se repite en cada clase. Frecuencia total es la suma de las frecuencias absolutas (total de datos). Frecuencia relativa es un número decimal o fraccionario entre 0 y 1 que corresponde al cociente entre cada frecuencia absoluta y la frecuencia total: Frecuencia porcentual es el porcentaje asociado a cada clase y se calcula multiplicando la frecuencia relativa por 100. En el ejemplo anterior, ¿cuál es la frecuencia absoluta de la tercera clase? ¿Cuál es la frecuencia total? ¿Cuál es la marca de la última clase? ¿Cuál es la frecuencia relativa de la primera clase? En efecto, la frecuencia absoluta de la tercera clase es 43. La frecuencia total es 25 + 38 + 43 + 36 + 28 + 12 = 182 La marca de la última clase es: (85 + 89) : 2 = 87 Y la frecuencia relativa de la primera clase es: 25/182 = 0,1373… y su frecuencia porcentual corresponde a 13,73%. 2. Gráficos estadísticos 2.1 Histograma o gráfico de barras El histograma es un gráfico de barras en que se presentan las frecuencias (absolutas, relativas o porcentuales). En el eje horizontal se ubican los intervalos o datos en cuestión y en el eje vertical anotamos la frecuencia o frecuencia relativa de cada intervalo o dato. Es un gráfico en el cual el dato en estudio (o intervalo) es puesto en el eje horizontal. Para ello se utilizan rectángulos cuyo alto, indicado en el eje Y, señala la frecuencia del dato en estudio. Ejemplo 1: Número de salas de cine en el país: Ejemplo 2: Edades de los alumnos de un colegio: Observa que en este histograma en particular se presentan dificultades para distinguir las frecuencias de cada intervalo. Para resolver lo anterior, algunas veces se anota la frecuencia respectiva sobre la columna. 2.2 Gráfico de líneas Este tipo de gráfico frecuentemente aparece en diarios y revistas, ya que ilustra con mucha claridad los cambios que tiene alguna variable en estudio. También se le llama Poligonal y consiste en unir los centros de cada barra del Histograma. Ejemplo: Fluctuación del precio de la gasolina durante un mes: 2.3 Gráfico circular En el gráfico circular, cada sector circular (por ende cada ángulo central) es proporcional al valor que corresponde a cada dato. Ejemplo: Una encuesta practicada a 180 adultos, para determinar si estos fumaban o no, se resume en el siguiente gráfico circular: Ahora, determina la cantidad de personas que nunca han fumado y cuántos no contestaron la encuesta. Las preguntas se pueden contestar aplicando los principios de proporcionalidad directa (ver módulo 1, eje temático “Números y Proporcionalidad”). El total de personas es 180 y le corresponden 360°, por lo tanto: , es decir: 10 personas nunca habían fumado. Por otro lado, a las personas que no contestaron la encuesta les corresponde un ángulo de: 360°– (90° + 120° + 20° + 80°) = 50°, por lo que planteamos la proporción: De modo que 25 personas no contestaron la encuesta. Los problemas acerca de gráficos de sectores circulares pueden plantearse al revés, es decir, determinar los ángulos centrales si se conoce la cantidad (o porcentaje) de cada rubro. 2.4 Pictograma Es un gráfico donde se ocupa una figura o ícono que representa el dato que se está estudiando. Ejemplo: Número de líneas telefónicas instaladas en una determinada ciudad durante 3 años consecutivos. 2.5 Gráfico ojiva Ojiva es un gráfico de línea que interpreta el crecimiento acumulado de las frecuencias absolutas, relativas o porcentuales. Se realiza una tabla de frecuencias y de frecuencias acumuladas, la que se grafica considerando en el eje horizontal las clases y en el eje vertical las frecuencias acumuladas. El gráfico ojiva es siempre creciente en tramos, demostrando los períodos que son de mayor o menor crecimiento. En el ejemplo anterior: Tabla de frecuencias Datos Frecuencia absoluta Frecuencia relativa Frecuencia porcentual F. absoluta acumulada F. relatva acumulada 1998 1999 2000 May – 20 Jun – 20 Sep – 20 25 % 30 % 45 % 50000 110000 200000 May – 20 Nov – 20 20/20 = 1 50000 60000 90000 F. porcentual acumulada 25% 55% 100% 3. Estadígrafos de tendencia central Los estadígrafos de tendencia central que estudiaremos son la media, la mediana y la moda. Estos estadígrafos nos dan los valores donde están centrados los datos según su frecuencia. 3.1 Media aritmética La media aritmética también se llama “media” o “promedio aritmético” y es lo que siempre has ocupado para calcular el promedio de notas. La media aritmética se calcula dependiendo de cómo se presenten los datos, pero en general es la suma de los datos dividida por el número de datos. 1. Media aritmética de datos no agrupados de n datos corresponde a la suma de todos los datos, dividida por La media el número de datos. Se puede escribir como la sumatoria de los datos desde el primero hasta el dato enésimo, dividido por n, quedando la siguiente fórmula: Ejemplo: Si Pedro ha obtenido las siguientes notas en Ciencias: 6,0 – 5,8 – 7,0 – 6,8 – 5,6 Su media aritmética o promedio es: , lo que se redondea al décimo como 6,2. 2. Media de datos dados en una tabla de frecuencia En este caso, se debe multiplicar cada dato por su respectiva frecuencia, sumar todos estos productos, y el resultado dividirlo por la suma de los datos, esto es: Ejemplo: Se ha lanzado un dado 40 veces, obteniéndose los siguientes resultados: Por lo tanto, su media es: 3. Media de datos agrupados en intervalos Se define la marca de clase de un intervalo como la media aritmética entre los extremos de él. Si llamamos a la marca de clase de un intervalo conjunto de datos agrupados en intervalos es: , entonces la media de un Ejemplo: La distribución de edades de un conjunto de 50 personas está representada por el siguiente gráfico: La media de este conjunto de datos es: 30.86 años, aproximadamente. 4. Media ponderada de datos En algunas oportunidades, los datos no tienen la misma relevancia, de modo que cada dato se multiplica por un factor, el cual indica el grado de importancia que tiene en la muestra; en este caso la media se calcula con la expresión: donde pi es un factor del dato xi, el cual viene dado en la situación planteada en el problema. Ejemplo: Un alumno tiene nota 5,0 como promedio de controles que valen un 80% de la nota final y obtiene un 6,0 en el examen. ¿Cuál es su promedio final? En este caso el dato 5,0 tiene un factor de 0,8 (80%) y el dato 6,0 tiene un factor de 0,2 (20%), por lo tanto su media es: Propiedades de la media Sean los n datos: x1, x2, x3, x4,...xn, con media . Entonces se cumplen las siguientes propiedades: . Es decir, la suma de 1. La suma de los datos corresponde al producto los datos se puede determinar multiplicando la media por el número de datos. 2. Si a cada uno de los datos se le suma (o resta) una cantidad a, la media aritmética será 3. Si a cada uno de los datos se le multiplica por una cantidad a, la media aritmética será . Ejemplo 1: Un colegio tiene tres cuartos medios, los que en el último ensayo de Lenguaje obtuvieron los siguientes puntajes promedio: Ocupando la propiedad 1, la suma de los puntajes del 4° A es la multiplicación del promedio por el número de alumnos, esto es: Suma = 20 · 650 = 13.000 Por lo tanto, la suma de todos los puntajes de los alumnos es: 20 · 650 + 30 · 600 + 25· 580 = 45.500 Así, la media aritmética de los tres cursos es: Ejemplo 2: La media aritmética de las edades de tres hermanos es 25 años. ¿Cuál será su media en tres años? Dada la propiedad 2, la media aritmética será 28 años. 3.2. Mediana Si los datos se ordenan en sentido creciente o decreciente, la mediana indica el dato que se ubica al centro de ellos. Si el número de datos n es un número impar, entonces la mediana es el dato: Si el número de datos n es un número par, entonces la mediana es la media aritmética entre los datos y . Las fórmulas anteriores las puedes obviar si tienes en cuenta que la mediana es el término central en el caso de que este sea uno, o bien la media de los términos centrales en el caso de que sean dos. Ejemplo 1: Las alturas de 6 integrantes de un equipo de básquetbol (en cm) son las siguientes: 182 – 175 – 181 – 182 – 178 – 183. ¿Cuál es la mediana? Primero ordenemos los datos de menor a mayor (o al revés): 175 – 178 – 181 – 182 – 182 – 183. Como hay dos datos centrales, se calcula la media de ambos datos: Ejemplo 2: Se ha consultado la edad a treinta trabajadores de una empresa, obteniendo los siguientes resultados: La suma de las frecuencias es 30, por lo tanto, es un número par de datos; la mediana es la media entre el dato de lugar 15 y el de lugar 16; el dato de lugar 15 es 23 y el de lugar 16 es 27, por lo tanto: 3.3 Moda La moda es el dato que más se repite, es decir, el que tiene mayor frecuencia. Volviendo al ejemplo 1: Las alturas eran: 182 – 175 – 181 – 182 – 178 – 183; por lo tanto, la moda es 182, ya que es el dato que más se repite. En el ejemplo 2: La moda es 23, ya que tiene mayor frecuencia. A veces los datos no tienen moda. Por ejemplo, si los datos fueran: 185 – 188 – 183 – 178 – 177, no hay un dato que tenga mayor frecuencia que los otros. Hay otras distribuciones que pueden tener más de una moda: Por ejemplo: La moda es 16 y 20; y en este caso se habla de una distribución bimodal. No se pueden tener más de 3 modas. Sitios sugeridos Para reforzar tipos de gráficos estadísticos visita el sitio: http://sapiens.ya.com/matagus/unidad2.htm Para que refuerces las medidas de tendencia central y los cálculos de los percentiles, estudia el siguiente sitio: http://www.liccom.edu.uy/bedelia/cursos/metodos/material/estadistica/med_p os.html Para que refuerces el cálculo de tendencias centrales según tablas de frecuencias, visita el sitio: http://www.bioestadistica.uma.es/libro/node18.htm Para una visión más general y ampliada sobre estadística, estudia el siguiente sitio: http://www.southlink.com.ar/vap/MEDIDAS.htm Si deseas profundizar sobre estadística descriptiva, visita el siguiente sitio: http://www.unavarra.es/estadistica/I.T.T.Imagen/descriptiva.pdf Conviene que visites este sitio, donde se esquematiza con ejemplos gráficos el análisis de los datos estadísticos: http://endrino.cnice.mecd.es/~jhem0027/estadistica/estadistica02.htm