UNIVERSIDAD DE COSTA RICA ESCUELA DE ESTADÍSTICA Prof. Olman Ramírez Moreira MEDIDAS DE POSICIÓN FUENTE: Gómez, Elementos de Estadística Descriptiva Levin & Rubin. Estadística para Administradores 1 XS-0111 OBJETIVO Utilizar la estadística para describir una colección de datos Emplear la media, la mediana, la moda y los cuantilos para describir cómo se “amontonan” los datos Calcular las medidas de posición a partir de conjuntos de datos, en datos agrupados y empleando programas de cómputo 2 XS-0111 UTILIDAD Necesidad de disponer medidas que resuman o condensen los datos Propósito: resumir en un solo número la posición o localización de la distribución caracterizar y representar un conjunto de datos Valores típicos son los situados en la parte central de la distribución. También conocidos como medidas de tendencia central o promedios Medidas de posición más utilizadas: 3 Media aritmética o promedio Mediana Moda Cuantilos XS-0111 DATOS NO AGRUPADOS Y AGRUPADOS Los cálculos de las estadísticas pueden resultar sencillos si el conjunto de datos es pequeño Un conjunto de datos ya de cierto tamaño hace que los cálculos resulten lentos y con probabilidades de errores al operar con ellos Los datos se agrupan en una distribución de frecuencias: tabla que indica la cantidad de datos en cada una de las clases definidas. Cada dato cae dentro de solo una de esas clases No conocemos el valor individual de cada dato Calculamos una estimación de la medida de posición (ante la sencillez se sacrifica la precisión Se requiere de una manera distinta de calcular las medidas de posición: Distribuciones de frecuencias (si los datos están agrupados XS-0111 4 Programas de computación DATOS SIN AGRUPAR Visitas diarias hechas al sitio WEB de Estudios sobre Diversidad Cultural en el primer cuatrimestre del 2007 22 22 23 24 25 26 26 26 27 27 27 28 28 28 29 5 30 30 30 30 30 30 30 31 31 31 31 31 32 32 33 33 33 33 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35 36 36 36 37 37 37 37 38 38 38 38 XS-0111 38 38 38 38 38 38 39 39 39 40 40 40 40 40 40 40 41 41 42 42 42 42 43 43 43 44 44 45 45 45 45 45 45 46 46 47 47 47 47 47 48 48 48 49 49 49 50 50 52 52 52 52 53 53 54 55 61 62 64 72 DATOS AGRUPADOS Visitas diarias hechas al sitio WEB de Estudios sobre Diversidad Cultural en el primer cuatrimestre del 2007 Visitas (clases) 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 TOTAL 6 FRECUENCIA Absoluta Relativa 15 12,5 54 45,0 37 30,8 10 8,3 3 2,5 1 0,8 120 XS-0111 SIGNOS CONVENCIONALES n Tamaño de una muestra de la población de estudio N Número de elementos de la población de estudio µ Media de la población x Media de la muestra n ∑X X= Cálculo de la media en una muestra i i =1 n Cálculo de la media para la población N ∑X µ = i i =1 N 7 XS-0111 X MEDIA ARITMÉTICA Representación: X Es el resultado de la suma de los valores del conjunto de análisis entre el número de datos Es sensible a todos los valores de una distribución, en especial a los valores extremos altos y bajos n Forma de cálculo: ∑X X = i i =1 n Xi = X1, X2, . . ., Xn corresponden a los valores de la variable En datos agrupados: Calcular el punto medio de cada clase k Aplicar la fórmula: X f ∑ X= i i i =1 n fi : frecuencia (número de datos) de cada clase Xi : punto medio de la cada clase 8 XS-0111 Visitas diarias hechas al sitio WEB de Estudios sobre Diversidad Cultural en el primer cuatrimestre del 2007 Visitas (clases) 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 TOTAL 9 Punto medio 25 35 45 55 65 75 FRECUENCIA Absoluta Relativa 15 12,5 54 45,0 37 30,8 10 8,3 3 2,5 1 0,8 120 FRECUENCIA ACUMULADA Absoluta 15 69 106 116 119 120 Relativa 12,5 57,5 88,3 96,7 99,2 100,0 Xi * fi 375 1890 1665 550 195 75 4750 XS-0111 VENTAJAS Y DESVENTAJAS DE LA MEDIA VENTAJAS Es un concepto familiar para mucha gente y es intuitivamente claro Útil para varios procedimientos como la comparación de varios conjuntos de datos DESVENTAJAS Puede verse afectada por la presencia de valores extremos que no son representativos del conjunto de datos. En estos casos podría resultar más representativo calcular la media sin tomar en cuenta el valor extremo: Es tedioso calcular la media si utilizamos todos los datos y el conjunto de datos es grande No se puede calcular si el conjunto de datos tiene clases extremas abiertas (la inferior o la superior) SUGERENCIA Revisar los datos una vez registrados representándolos gráficamente 10 y decidir si la media tendráXS-0111 significado MODA Representación: Mo Valor más común, más típico, que ocurre más frecuente-mente en un conjunto de datos No se ve afectada por la presencia de valores extremos bajos o altos Puede no existir o no estar definida. Esto es, puede no ser única reducida utilidad y dificultad en interpretación Puede también aplicarse a datos cualitativos Cálculo en datos agrupados: Identificar la clase modal (la clase con mayor frecuencia) Aplicar la fórmula: d1 M o = Lmo + d1 + d 2 11 I mo d1 = f Mo − f aMo XS-0111 d 2 = f Mo − f pMo MEDIANA Representación: Me Valor central de una serie de datos ordenados Valor tal que no más de la mitad de las observaciones son menores que él y no más de la mitad son mayores Pasos para calcularla en datos sin agrupar Ordenar los datos de acuerdo a su magnitud Determinar el valor central de la serie, esto es, el término ubicado en la posición (n+1)/2 Si el número de datos es par, la Me corresponde al promedio de los valores centrales Pasos para calcularla en datos agrupados: Identificar la clase en que está la mediana (acumula el 50% de los datos) Aplicar la fórmula respectiva VENTAJA: VENTAJA no se afecta tan intensamente como la media SUGERENCIA: SUGERENCIA La Me es mucho mejor que la media aritmética para eliminar el efecto de elementos extremos 12 XS-0111 USO MEDIDAS POSICIÓN La selección de cual medida utilizar depende de los propósitos perseguidos La más utilizada en la media aritmética Las medidas no compiten entre sí, sino que se complementan para proporcionar una mejor descripción del conjunto de datos Considerar la influencia de valores extremos al seleccionar medida Distribución simétrica: Mo, Me y X coinciden, tienen el mismo valor Cualquiera es igualmente adecuada para caracterizar el grupo de datos Distribución asimétrica (positiva o negativa): Caracterizada por un alejamiento de la Me y en especial de la con respecto a la Mo Resulta preferible utilizar la Mo y en especial la Me en estos casos Mo < Me < X asimetría positiva Mo > Me > X asimetría negativa 13 XS-0111 CUANTILOS Dividen el conjunto ordenado de datos en fracciones específicas Abarcan un conjunto de medidas: cuartiles, quintiles, deciles, percentiles, mediana Cuartiles: dividen el conjunto de datos en cuartas partes Q1valor tal que una cuarta parte de las observaciones son menores que él y ¾ partes mayores Q2 = Me Q3 supera a ¾ de las observaciones y solo es superado por una cuarta parte de ellas Deciles dividen el conjunto de datos en décimas partes Me = P50 Q3 = P75 D6 = P60 Percentiles dividen el conjunto de datos en centésimas partes Deciles, cuartiles, quintiles constituyen casos particulares de percentiles: Procedimiento de cálculo: Ordenar los datos según magnitud Identificar el percentil correspondiente al cuantilo buscado Calcular el rango percentil, esto es, aplicar la fórmula siguiente para localizar la posición correspondiente m Rango Pm = x (n + 1) 100 de datos 14Ubicar el percentil buscado en el conjuntoXS-0111 CÁLCULO MEDIDAS DE POSICIÓN Moda: 35 Mediana: 38 Promedio 38.96 Cuartil 1 33 Cuartil 3 45 Rango intercuartil 12 Quintil 3 40 Percentil 40 35 15 XS-0111 120 ∑X i =1 i = : 4675 INTERPRETACIONES Moda: El número de visitas más común al sitio WEB Estudios sobre diversidad en el primer cuatrimestre del 2007 fue de 35 visitas diarias. Mediana: En la mitad de los días del primer cuatrimestre del 2007 se recibieron 38 visitas o menos al sitio WEB Estudios sobre diversidad y la otra mitad de los días el número de visitas diarias fue de 38 o más. Promedio: El sitio WEB Estudios sobre diversidad recibió 38.96 visitas diarias en promedio durante el primer cuatrimestre del 2007 Cuarti 1: En la cuarta parte (25%) de los días del primer cuatrimestre del 2007 se recibieron 33 visitas o menos al sitio WEB Estudios sobre Diversidad, y en los restantes tres cuartas partes (75%) de los días las visitas al sitio fueron 33 o más diarias. Cuarti 3: En las tres cuartas partes (75%) de los días del primer cuatrimestre del 2007 se recibieron 45 visitas o menos al sitio WEB Estudios sobre Diversidad, y en la restante cuarta parte (25%) de los días las visitas al sitio fueron 45 o más diarias. Quintil 3: En las tres quintas partes (60%) de los días del primer cuatrimestre del 2007 se recibieron 40 visitas o menos al sitio WEB Estudios sobre Diversidad, y en la restante cuarta parte (25%) de los días las visitas al sitio fueron 45 o más diarias. 16 XS-0111