MEDIDAS O ÍNDICES DESCRIPTIVOS. Resumen los datos. Son de varios tipos: I. Tendencia central: Media, Mediana, Moda y Suma de todos los valores. II. Dispersión: Desviación típica, Varianza, Coeficiente de variación de Pearson, Rango, Mínimo, Máximo y Error típico de la media. III. Forma: Asimetría y curtosis. IV. Posición: Cuartiles, percentiles. I. Medidas de tendencia central son estadísticos que describen la distribución de los valores de la variable. Media (poblacional, µ , muestral, x ), es el resultado de sumar los n valores de la variable y dividir por n. Media recortada al 5% Media aritmética calculada después de haber eliminado el 5% de los casos mayores y el 5% de los menores. La eliminación de los casos extremos de los cálculos da como resultado una mejor estimación de la tendencia central, especialmente cuando los datos no son normales. Intervalos de confianza. Muestra los intervalos de confianza para la media, ej. 95 %. Mediana . Valor por encima y por debajo del cual se encuentran la mitad de los casos; es el percentil 50 o valor central. Cuando el número de observaciones es par, la mediana es el promedio de las dos observaciones centrales, una vez que han sido ordenadas de manera ascendente o descendente. La mediana es una medida de tendencia central que no es sensible a los valores atípicos (a diferencia de la media, que puede resultar afectada por unos pocos valores extremadamente altos o bajos). Moda El valor que aparece con mayor frecuencia. Si varios valores comparten la mayor frecuencia de aparición, cada uno de ellos es una moda. II. Las medidas de dispersión son estadísticos que miden cantidad de variación o de dispersión entre los valores observados. Rango: Es el resultado de restar el valor mínimo del valor máximo. 2 Varianza poblacional σ : Es el resultado de sumar las desviaciones cuadráticas de los valores respecto a la media dividido por n. 2 Varianza muestral s . Es el resultado de sumar las desviaciones cuadráticas de los valores respecto a la media dividido por n-1. 2 Desviación típica DT poblacional σ . Es la raíz cuadrada de la varianza poblacional σ . 2 Desviación típica DT muestral s. Es la raíz cuadrada de la varianza muestral s . DT es una medida de dispersión en torno a la media. En una distribución normal, el 68% de los casos se encuentra dentro de una DT respecto a la media, el 95% de los casos se encuentra dentro de 2 DT respecto a la media y el 99% de los casos se encuentra dentro de 3 DT respecto a la media. Por ejemplo, si la media de edad es 45, con una desviación típica de 10, el 95% de los casos estaría entre 25 y 65 en una distribución normal. Coeficiente de variación de Pearson. Es el cociente entre la desviación típica y la media expresado en forma de porcentaje: cv=100 σ / µ cv=100s/ x . Si cv < 30%, muestra homogénea (representativa). Error típico o estándar de la media es DT partido por n , mide el grado de dispersión de las medias de todas las posibles muestras que pudieran extraerse de una población. III. Medidas de forma: Son estadísticos que describen la simetría y el apuntamiento (o poco aplanamiento) de la distribución. Asimetría. Medida de la asimetría de una distribución. La distribución normal es simétrica por lo que tiene un valor de asimetría 0. Una distribución que tenga una asimetría positiva significativa tiene una cola derecha larga. Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda larga. Un valor de asimetría mayor que 1, en valor absoluto, indica generalmente una distribución que difiere de manera significativa de la distribución normal. Curtosis. Medida del grado en que las observaciones están agrupadas en torno al punto central. Para una distribución normal, el valor del estadístico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran más y presentan colas más largas que las de una distribución normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas más cortas. Asimetría y curtosis inferiores en valor absoluto a 2 veces su error estándar: variable aproximadamente simétrica y mesocúrtica. IV. Medidas de posición. Valores percentiles. Los valores de una variable cuantitativa que dividen los datos ordenados en grupos, de forma que un porcentaje de los casos se encuentre por encima y otro porcentaje se encuentre por debajo. Los cuartiles (o los percentiles 25) Q1, (50, mediana) Q2 y (75) Q3, dividen las observaciones en cuatro grupos de igual tamaño. También puede especificar percentiles individuales (por ejemplo, el percentil 95, el valor por debajo del cual se encuentran el 95% de las observaciones). Los valores son puntos medios de grupos. Si los valores de los datos son puntos medios de grupos (por ejemplo, si las edades de todas las personas entre treinta y cuarenta años se codifican como 35),