Estadística Descriptiva SESIÓN 11 Medidas de dispersión Contextualización de la sesión 11 En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión, además de los diversos temas relacionados con ella. Esta es una cuantificación del grado de alejamiento de los datos respecto a su media aritmética. Ahora es necesario conocer otra de las medidas de dispersión conocida como desviación típica o estándar y los temas relacionados con esta medida. Al terminar esta sesión habrás comprendido el concepto de desviación estándar relacionado con los estudios estadísticos. Introducción de la sesión 11 Las medidas de dispersión se asocian a la precisión estadística de las observaciones o datos muestrales. Cuando la dispersión de un conjunto de datos es muy alta, las estimaciones que se realizan en función de éstas conllevan un notable grado de imprecisión. Y en sentido inverso, cuando un conjunto de datos presenta una dispersión baja, el nivel de incertidumbre disminuye notablemente. Explicación: Desviación típica o estándar La desviación típica o estándar, denotada por la literal s, es una medida de dispersión que se emplea para variables de razón (también conocidas como ratio o cociente) y para variables de intervalo. La desviación estándar se considera una medida cuadrática que representa el promedio de las desviaciones (distancias) de los datos muestrales respecto de su media aritmética, expresada en las mismas unidades que la variable. Explicación: Desviación típica o estándar La fórmula para calcular la desviación estándar para datos no agrupados está dada por la siguiente expresión: Explicación: Desviación típica o estándar Dónde: n= Número de datos o elementos de la muestra. i= Índice de la suma que toma los valores 1, 2, 3...n. xi = Valor del i-ésimo dato de la muestra. = Media aritmética de la muestra. Explicación: Desviación típica o estándar Es importante señalar que la siguiente fórmula se considera más apropiada para una mejor estimación de la desviación estándar de la población a partir de la muestra: Explicación: Desviación típica o estándar Cualquiera de las fórmulas puede usarse indistintamente, pero en la práctica es común el uso de la segunda. En ésta, al cociente n – 1 se le denomina corrección de Bessel. Calculemos la desviación estándar para el siguiente conjunto de datos no agrupados: A = {2, 4, 6, 8, 10} De este conjunto se desprende que: n=5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10 Explicación: Desviación típica o estándar Con estos datos, procedemos a calcular la media aritmética del conjunto: Y a continuación se sustituyen los valores anteriores en la fórmula: Explicación: Desviación típica o estándar Tal como se muestra a continuación: Explicación: Desviación típica o estándar Por su parte, la fórmula para calcular la desviación estándar de datos agrupados está dada por la siguiente expresión: Dónde: k= Número de intervalos de clase en la distribución de frecuencias. n= Número de datos o elementos de la muestra. i= Índice de la suma que toma los valores 1,2,3...k. fi = Frecuencia del i-ésimo intervalo de clase. xi = Marca de clase del i-ésimo intervalo de la muestra. Media aritmética de la muestra. Explicación: Desviación típica o estándar Para calcular la desviación estándar en un conjunto de datos agrupados, también empleamos la versión que incorpora la corrección de Bessel. Como puede observarse, cada elemento de la fórmula se toma directamente de la tabla de datos agrupados. Considerando el caso práctico de una bebida, se toma de la tabla de datos agrupados las columnas referentes a las frecuencias de clase (fi) y a las marcas de clase (xi). Explicación: Desviación típica o estándar De esta tabla se obtienen los siguientes valores para las frecuencias de clase: f1 = 5 f2 = 10 f3 = 30 f4 = 40 f5 = 15 x3 = 17.5 x4 = 22.5 x5 = 27.5 Y para las marcas de clase: x1 = 7.5 x2 = 12.5 Asimismo, dado que hay cinco intervalos de clase y la muestra tiene 100 elementos, los valores de k y n respectivamente son: k=5 n = 100 Y como ya se determinó en ejercicios anteriores: = 20 Explicación: Desviación típica o estándar Ahora, sustituyendo estos valores en la respectiva fórmula se tiene que: Explicación: Desviación típica o estándar La desviación estándar es una medida de dispersión que nos permite evaluar la incertidumbre de los datos obtenidos por la muestra; es decir, analiza todos aquellos datos que se alejan de nuestro promedio para determinar si nuestra predicción o teoría está alejada del modelo que se construyó con la muestra. Conclusión En esta sesión se han explicado la desviación estándar como una medida de dispersión, que sirve para evaluar la incertidumbre de los datos de una muestra, además, se explicó el procedimiento para el correcto cálculo de esta desviación en un conjunto de datos no agrupados y agrupados. Conclusión En la siguiente sesión conocerás los temas correspondientes a la varianza como la última de las medidas de dispersión, así como el procedimiento para su cálculo en conjuntos de datos agrupados y no agrupados.