Notas de clase: Rénember Niño C. CAPÍTULO IV MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION 4.1 MEDIDAS DE TENDENCIA CENTRAL Hemos analizado como a partir de tablas y gráficos puede presentarse la información que es objeto de estudio. Las medidas de tendencia central son valores representativos de un conjunto de datos que tienden a estar localizados en aquella parte de la distribución donde los datos tienden a aglomerarse. Las medidas de tendencia central más usadas son la media, la mediana y la moda. 4.1.1 MEDIA ARETMÉTICA La media aritmética o promedio o simplemente media es la medida de tendencia central más importante y la más usada. La media aritmética se define como la suma de todos los datos dividida entre el número total de datos. Si la media aritmética se calcula a partir de todos los datos de una población, se tiene la media aritmética poblacional el cual es un parámetro. Si se calcula a partir de los datos de una muestra, se tiene la media muestral Si por: son los datos de una población, la media poblacional ̅. está dada ∑ Si ̅ son los datos de una muestra, la media muestral ̅ está dada por: ∑ 1 Notas de clase: Rénember Niño C. Ej. Los ingresos diarios en miles de pesos de 4 personas son: 10, 12, 18 y 20, su ingreso promedio es: ̅ Lo que indica que en promedio las cuatro personas ganan diariamente $15.000.oo Si los datos se presentan en una tabla de frecuencias, entonces la media se calcula mediante la expresión: ̅ ∑ donde los fi representan la frecuencia absoluta de cada dato xi. Ejemplo: Los siguientes datos representan el peso de 10 personas. Calcule el peso promedio de esas personas. Peso(Xi) Nímero de personas (fi) 45 2 50 3 55 4 60 1 TOTAL n=10 2 Notas de clase: Rénember Niño C. La media se calcula como: ̅ ∑ 52 es el peso promedio de las 10 personas. Se los datos presentan una importancia o peso (Wi) dentro del grupo, entonces la media se calculará por la expresión: ̅ ∑ ∑ Un caso común son las notas de estudiantes universitarios. Los créditos académicos constituyen un peso o importancia dentro de cada materia. Calcula el promedio de los datos dados a continuación: MATERIA Nota(Xi) Nímero de Crédiots (wi) Matemáticas 4.5 2 Investigación 5.0 3 Estadística 3.0 4 Sociología 1.0 1 TOTAL n=10 La nota promedio se calcula como: 3 Notas de clase: Rénember Niño C. ̅ ∑ ∑ 4.1.1.1 PROPIEDADES DE LA MEDIA ARITMÉTICA 1. La suma de las desviaciones de cada dato con respecto a la media es igual a cero. Esto es: ∑( ̅) Tomemos el ejemplo de las notas de cuatro estudiantes universitarios: 3.0, 5.0, 3.0, 4.0 Para estos datos tenemos que: ̅ Las desviaciones de los datos y su suma se muestran a continuación: 3.0-3.5= - 0.5 4.0-3.5= 0.5 2.0-3.5 = -1.5 5.0-3.5 = 1.5 Observamos que: ∑( ̅) ( ) 4 Notas de clase: Rénember Niño C. 2. La media de una muestra a cuyos datos se suma o resta una constante es igual a la media de los datos originales , más o memos el valor de la constante. Ejemplo: Los siguientes datos representan la altura en cm. Que alcanzaron unas matas de maíz que se sometieron a un tratamiento químico: 1.82 1.75 1.47 1.71 1.27 1.34 1.73 1.83 1.63 1.94 1.76 1.82 1.82 1.74 Para estos datos la media es: ̅ Suponga ud. Que las mediciones estuvieron mal hechas y que debemos restar 15 cm. A cada dato. ¡Cuál es entonces la verdadera media? ̅ es entonces la verdadera media. 3. Cuando disponemos de una muestra de tamaño n, dividida en varios subgrupos, podemos hallar la media general si disponemos de la media y del tamaño de cada subgrupo mediante la expresión: ̅ ( ̅ ̅ ̅ ̅ ) Ejemplo: Consideremos cuatro submuestras del peso en libras de 15 peces así: Sub Muestra 1 1.5 1.7 1.8 1.9 2.0 2.2 Sub Muestra 2 1.7 1.8 1.9 Sub Muestra 3 1.8 1.9 2.0 2.3 Sub Muestra 4 1.6 2.0 Si calculamos la media para el total de observaciones encontramos que: 5 Notas de clase: Rénember Niño C. ̅ Por otro lado, si calculamos la media para cada sub muestra, obtenemos ̅̅̅ , es la media para la sub muestra 1 ̅̅̅ , es la media para la sub muestra 2 ̅̅̅ , es la media para la sub muestra 3 ̅̅̅ , es la media para la sub muestra 4 Con estos datos podemos calcular la media para el total de observaciones, mediante la expresión: ̅ ( ̅ ̅ ̅ ̅ ) ( ( ) ( ) ( ) ( )) Valor que coincide con el obtenido si sumamos todos los datos y dividimos por el total de datos, que es 15. 4.1..2 MEDIANA Esta medida de tendencia central es poco utilizada, pero en estudios estadísticos avanzados, es de bastante importancia. La mediana es el valor que divide a una muestra ordenada, en dos partes iguales, de tal forma que “la mitad de los valores son menores que el valor de la mediana y la otra mitad son mayores que el valor de la mediana “La simbolizamos por (Me). 6 Notas de clase: Rénember Niño C. 4.1.1.2 CÁLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS a). NÚMERO IMPAR DE OBSERVACIONES: Supongamos que el peso en libras de 7 cachamas, tomadas al azar de un estanque arrojó los siguientes datos: 2.1, 3.2, 2.4, 3.0, 2.8, 2.9, 2.7 Ordenando los datos tenemos: 2.1 2.4 2.7 2.8 2.9 3.0 3.2 Mediana El valor central es 2.8, el cual es la mediana. Luego, Me =2.8 lo que significa que el 50% o menos de las cachamas tiene menos de 2.8 libras y que el otro 50% ó menos tiene más de 2.8 libras. Este mismo resultado lo hubiéramos obtenido si aplicamos la relación: (n+1)/2=(7+1)/2=4, donde 4 es la posición que ocupa el valor 2.8 una vez se ha ordenado la muestra. b). NÚMERO PAR DE OBSERVACIONES: Cuando el número de observaciones es par, la mediana es igual al promedio de los dos valores centrales, es decir, el valor resultante de la suma de las dos observaciones centrales dividida por dos. Ejemplo: Supongamos que el número de días que llovió en San Bernardo en cada uno de los meses fueron los siguientes: 7 Notas de clase: Rénember Niño C. 3 5 1 0 1 4 7 3 1 1 0 4 Ordenando tenemos: 0 0 1 1 1 13 3 4 4 5 7 Como n= 12 es par, entonces: Me = (1+3)/2=2 Lo cual significa que en San Bernardo en la mitad de los meses llovió menos de dos días y en la otra mitad llovió más de dos días. III.2.2 MEDIANA PARA DATOS AGRUPADOS Si los datos han sido agrupados en intervalos, no es posible obtener la mediana por el procedimiento estudiado, puesto que la identidad de los datos se perdió al quedar agrupados y no podemos determinar que dato o que datos ocupan posiciones centrales. En este caso hallamos un valor que divide en partes iguales, siguiendo los siguientes pasos: Paso 1. Buscamos la clase donde se encuentra la mediana. Para esto buscamos en la columna de las frecuencias absolutas acumuladas el intervalo donde se encuentra el valor: Paso 2. Una vez seleccionado el intervalo donde se encuentra la mediana, procedemos a calcular este valor mediante la expresión: ( ) Donde: 8 Notas de clase: Rénember Niño C. = Límite inferior del intervalo mediano C= Amplitud o ancho de cada intervalo de clase n= número de datos = Frecuencia absoluta acumulada hasta el intervalo anterior al intervalo mediano. = Frecuencia absoluta del intervalo mediano. Para calcular la mediana en este caso, tengamos en cuenta la siguiente tabla: Tabla3.1 Peso en Kg. de una muestra de peces. Peso (Kg) Marca de Clase 1.5-1.7 1.7-1.9 1.9-2.1 2.1-2.3 1.6 1.8 2.0 2.2 Frecuencia Absoluta 2 8 3 2 15 Frecuencia Absoluta Acumulada 2 10 13 15 Intervalo mediano PROCEDIMIENTO: a). Hallamos la mitad de las observaciones: b). Localizamos el resultado n/2 anterior en la columna de las frecuencias absolutas acumuladas. Este valor se encuentra en el segundo intervalo, ya que en primer intervalo la columna de las frecuencias absolutas acumuladas llega hasta 2 y es de suponerse que los valores del 3 al 10 se encuentran en el segundo intervalo. 9 Notas de clase: Rénember Niño C. c). El segundo intervalo es llamado intervalo mediano, puesto que en el debe encontrarse el valor de la mediana, el cual debe estar comprendido entre 1.7 y 1.9. Luego tenemos que: Li = 1.7 C= 0.2, el cual se obtiene de 1.9 – 1.7 =0.2 que es el ancho de clase. N=15 es el número total de datos Fme-1 = Es la frecuencia absoluta acumulada hasta el intervalo anterior al mediano. Fme-1 = 8 es la frecuencia absoluta del intervalo mediano. Luego: ( ) Me=1.7 + 0.2 * (15/2 – 2)/8 Me= 1.8375 Luego: Me = 1.8375 Se considera que la mitad de los peces tiene menos de 1.8375 y que la otra mitad tiene más de 1.8375 Kg. III.3 MODA Llamaremos moda al dato que más se repite en una muestra, es decir a aquel de mayor frecuencia absoluta. Ejemplo III.3.1 El número de hijos de 5 familias son: 2 1 0 3 2 En este caso la moda es 2, significa que el número de hijos más frecuente es 2. 10 Notas de clase: Rénember Niño C. Ejemplo III.3.2 Los siguientes datos representan el peso en Kgs. De ocho alumnos de décimo grado: 56 54 57 57 54 55 53 58 Observamos que hay dos valores que más se repiten, ellos son, 54 y 57, es decir hay dos modas. Cuando una distribución de frecuencias tiene dos modas, se dice que es Bimodal, si tiene tres modas se denomina Trimodal, etc. En general cuando una distribución de frecuencias tiene más de tres modas, se denomina Multimodal. Cuando los datos están agrupados en grupos o intervalos de clase, tomaremos como moda la marca de clase del intervalo que tenga mayor frecuencia absoluta. Ejemplo: La moda para los datos de la tabla II.2.1 es 1.8, que es la marca de clase del intervalo con mayor frecuencia absoluta. EJERCICIOS DE LA UNIDAD III 1. Calcula el peso promedio de los integrantes de tu grupo de trabajo. 2. Calcula la nota promedio obtenida en el semestre anterior, de uno de los integrantes de tu grupo de trabajo. Explica cómo lo hiciste. 3. Cuatro grupos de estudiantes consistentes de 15, 20, 10 y 18 alumnos dieron pesos promedios de 162, 148, 153 y 140 libras respectivamente. Hallar el peso promedio de todos esos estudiantes. 4. Para un mismo conjunto de datos un estudiante encontró X =28.5, sin agrupar los datos y otro encontró ̅ , agrupando los datos. Cual media es más exacta, por qué? 5. Un tecnólogo encontró que la media para un grupo de datos es ̅ . Después se dio cuenta que los datos estaban equivocados y que los pesos se excedieron en 2 Kg, Cuál es entonces la verdadera media? 11 Notas de clase: Rénember Niño C. 6. Halla la media, mediana y moda para las tablas de los incisos a y b del ejercicio 8 de la unidad de la unidad II. Interpreta estas medidas. 7. La duración en horas, de 1000 bombillas se indica en la siguiente tabla. Duración (Horas) 400-450 450-500 500-550 550-600 600-650 650-700 700-750 750-800 Frecuencia 30 100 175 225 180 125 100 65 a. Calcular la duración promedio de una bombilla e interpretar b. Determinar la moda e interpretar c. Determinar el valor de la mediana e interpretar. 12