2013 Estadística Aplicada a la Administración CAPÍTULO II: MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL Y DISPERSIÓN Los datos individuales pueden ser sintetizados mediante medidas de tendencia central y de dispersión. 1.1. MEDIDAS DE TENDENCIA CENTRAL En el capítulo anterior, nos referimos a la clasificación, ordenación y presentación de datos estadísticos, limitando el análisis de la información a la interpretación porcentual de las distribuciones de frecuencia, es así como, el análisis estadístico propiamente dicho, parte de la búsqueda de parámetros sobre los cuales pueda recaer la representación de toda la información. Supóngase que Pedro obtiene 32 puntos en una prueba de lectura. La calificación por sí misma tiene muy poco significado a menos que usted conozca cuál es el total de puntos que obtiene una persona promedio al participar en esa prueba, cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones. Es decir que para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos. Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. Digamos por ejemplo que la calificación promedio en la prueba que hizo Pedro fue de 20 puntos. De ser así podemos decir que la calificación de Pedro se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 60 puntos, entonces la conclusión sería muy diferente, dado que se ubicaría muy por debajo del promedio de la clase. En resumen, el propósito de las medidas de tendencia central sirven para: a) Mostrar en qué lugar se ubica la persona promedio o típica del grupo. b) Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. c) Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. d) Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos. Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la información, son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión, ya que la representatividad de ellas está asociada con el grado de concentración de la información. Las principales medidas de tendencia central son: MEDIDA Media aritmética Mediana Moda DEFINICIÓN Es el promedio aritmético de todos los datos o valores. Es el dato o valor que divide por la mitad la serie de datos ordenados creciente o decrecientemente, es decir, es el valor central de la serie. La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro de una distribución). Una información puede tener una moda y se llama unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la información no posea moda. 1.2. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE TENDENCIA CENTRAL: FÓRMULAS Para calcular una determinada medida de posición puede haber diversas fórmulas. La elección de la fórmula adecuada dependerá de la forma en que estén organizados los datos individuales. En principio, los datos pueden estar organizados de tres maneras: 1) Datos no agrupados. Cuando se recolecta información, generalmente se obtienen datos desordenados, frente a lo cual convendrá ordenarlos en forma creciente o decrecientemente. 3) Datos agrupados por frecuencia. Es obtener o agruparlos los datos por frecuencias. 4) Datos agrupados por intervalos. Es obtener o agruparlos los datos por intervalos. La estadística va agrupando los datos siguiendo el orden anterior. Cuanto más avance en este proceso, 1 Prof. Jesús Timaure 2013 Estadística Aplicada a la Administración más habrá logrado sintetizar y organizar los datos individuales. En el siguiente cuadro se sintetizan las diversas reglas o fórmulas para calcular las medidas de posición, según como estén organizados los datos individuales y según los niveles de medición que admiten. Nótese que en algunos casos no es posible especificar ninguna fórmula, y entonces el cálculo se hará siguiendo la regla indicada para los mismos. . Medida de tendencia C Datos no agrupados Media aritmética (promedio) x Datos agrupados por frecuencia f x n Datos agrupados por intervalos ( X .f ) f x ( Xi .f ) f Cuando n es impar Me Mediana Cuando n es par Me Moda (n 1) 2 f Fmediana= 2 n (+1) 2 Valor que más se repite fa Valor con la mayor frecuencia f Facum.ant. * Rmedina Me LRi 2 Fmediana F mod al Fanterior * R mod al Mo LRi 2 F mod al Fant Fsig 1.3. DEFINICIONES BÁSICAS Límites del intervalo.- Todo intervalo debe quedar definido por dos límites: un límite inferior y un límite superior. Punto medio del intervalo (Xi = X ): Es el valor que resulta de la suma de los intervalo superior e inferior, es decir, el punto medio del intervalo se calcula sumando ambos límites y dividiendo el resultado por dos. El punto medio del intervalo sirve para calcular la media aritmética. Rango: Es la diferencia entre los valores máximo y mínimo de la variable, también utilizado para cada intervalo, se llama también amplitud. Desvió: Es la suma de las diferencias de los datos con respecto a la media aritmética, la cual dará como resultado cero. Formula para datos no agrupados Di X X y para agrupados por intervalo: Di Xi X 1.4. MEDIDAS ESTADÍSTICAS DE POSICIÓN Anteriormente, vimos lo referente a las medidas de tendencia central, las cuales, a su vez, son también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información. Nos ocuparemos ahora de ciertos parámetros posicionales muy útiles en la interpretación porcentual de la información. MEDIDA Cuartiles Quintiles Deciles Centiles DEFINICIÓN Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes iguales, el primer cuartil (Q1) deja el 25% de la información por debajo de él, seguidamente el segundo cuartil (Q2), al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil (Q3) deja el 75% por debajo de sí. Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente determinada. Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro parámetros. Similarmente, los deciles o decillas dividen la información en diez partes iguales, en cantidades porcentuales de 10 en 10. Obviamente los centiles dividen la información en 100 partes, lo cual facilita la interpretación porcentual de una distribución de frecuencias. 2 Prof. Jesús Timaure 2013 Estadística Aplicada a la Administración 1.5. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE POSICIÓN: FÓRMULAS Datos no agrupados: Cuando n es par: k*n/r Cuando n es impar: k(n+1)/r En general para calcular cualquier percentil de datos agrupados: r: Número de partes en que se divide la información k: Orden del percentil k = 1,2,.....,r-1 n: Número de observaciones 1.6. MEDIDAS ESTADÍSTICAS DE DISPERSIÓN Llamadas también medidas de variabilidad o de variación, son datos estadísticos que informan acerca del grado de dispersión o variabilidad de los datos individuales de una muestra o una población, respecto de una variable. En otras palabras, indican el grado de homogeneidad o de heterogeneidad del conjunto de los datos. Por ejemplo, en dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética, y mediana que los valores 49, 50,51; sin embargo, para la primera información la media aritmética, se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la segunda información que posee igual media aritmética y mediana, vemos entonces que la primera información es mas heterogénea o dispersa que la segunda. En general, las medidas de dispersión más utilizadas sirven para la medición de variables en el nivel cuantitativo. En el siguiente cuadro se especifican las definiciones principales de las medidas de dispersión. MEDIDA DESVIACIÓN MEDIA VARIANZA DESVIÓ ESTÁNDAR COEFICIENTE DE VARIACIÓN DEFINICIÓN Es el promedio de las desviaciones de todos los valores respecto de la media aritmética Es el promedio de los cuadrados de las desviaciones con respecto a la media aritmética Es la raíz cuadrada de la varianza Es el cociente entre el desvío estándar y la media aritmética 1.7. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE DISPERSIÓN: FÓRMULAS Medida de dispersión Datos no agrupados Desviación media Desvío estándar D m Datos agrupados por frecuencia (Di ) f D Es la raíz cuadrada de la 2 varianza (S ) S 2 Varianza (Di f CV Coeficiente de variación Intervalos f Totales n= 2 ) 3 (Di ) f 2 S 2 f .(Di f CV Xi D Es la raíz cuadrada de la varianza (S ) S X fa↑ m Datos agrupados por intervalos F(Xi) 2 ) (Di ) f 2 Es la raíz cuadrada de la varianza (S ) S 2 S X Lri m f .(Di f CV Lrs Di Prof. Jesús Timaure f(Di) 2 ) S X Di2 f(Di2)