Explicación: Desviación típica o estándar

Anuncio
Estadística Descriptiva
SESIÓN 11
Medidas de dispersión
Contextualización de la sesión 11
 En la sesión anterior se explicaron los temas relacionados con la
dispersión, una de las medidas de dispersión, además de los
diversos temas relacionados con ella. Esta es una cuantificación
del grado de alejamiento de los datos respecto a su media
aritmética. Ahora es necesario conocer otra de las medidas de
dispersión conocida como desviación típica o estándar y los
temas relacionados con esta medida.
 Al terminar esta sesión habrás comprendido el concepto de
desviación estándar relacionado con los estudios estadísticos.
Introducción de la sesión 11
 Las
medidas de dispersión se asocian a la precisión
estadística de las observaciones o datos muestrales. Cuando
la dispersión de un conjunto de datos es muy alta, las
estimaciones que se realizan en función de éstas conllevan un
notable grado de imprecisión. Y en sentido inverso, cuando un
conjunto de datos presenta una dispersión baja, el nivel de
incertidumbre disminuye notablemente.
Explicación: Desviación típica o
estándar
 La desviación típica o estándar, denotada por la literal s, es una
medida de dispersión que se emplea para variables de razón
(también conocidas como ratio o cociente) y para variables de
intervalo. La desviación estándar se considera una medida
cuadrática que representa el promedio de las desviaciones
(distancias) de los datos muestrales respecto de su media
aritmética, expresada en las mismas unidades que la variable.
Explicación: Desviación típica o
estándar
 La fórmula para calcular la desviación estándar para
datos no agrupados está dada por la siguiente
expresión:
Explicación: Desviación típica o
estándar
 Dónde:
n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1, 2, 3...n.
xi =
Valor del i-ésimo dato de la muestra.
=
Media aritmética de la muestra.
Explicación: Desviación típica o
estándar
 Es importante señalar que la siguiente fórmula se
considera más apropiada para una mejor estimación de
la desviación estándar de la población a partir de la
muestra:
Explicación: Desviación típica o
estándar
Cualquiera de las fórmulas puede usarse indistintamente, pero
en la práctica es común el uso de la segunda. En ésta, al
cociente n – 1 se le denomina corrección de Bessel.
Calculemos la desviación estándar para el siguiente conjunto de
datos no agrupados:
A = {2, 4, 6, 8, 10}
 De este conjunto se desprende que:
n=5
x1 = 2
x2 = 4
x3 = 6
x4 = 8
x5 = 10
Explicación: Desviación típica o
estándar
 Con estos datos, procedemos a calcular la media aritmética
del conjunto:
 Y a continuación se sustituyen los valores anteriores en la
fórmula:
Explicación: Desviación típica o
estándar
 Tal como se muestra a continuación:
Explicación: Desviación típica o
estándar
 Por su parte, la fórmula para calcular la desviación estándar de
datos agrupados está dada por la siguiente expresión:
 Dónde:
k=
Número de intervalos de clase en la distribución de frecuencias.
n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1,2,3...k.
fi =
Frecuencia del i-ésimo intervalo de clase.
xi = Marca de clase del i-ésimo intervalo de la muestra.
Media aritmética de la muestra.
Explicación: Desviación típica o
estándar
 Para calcular la desviación estándar en un conjunto de datos
agrupados, también empleamos la versión que incorpora la
corrección de Bessel. Como puede observarse, cada elemento
de la fórmula se toma directamente de la tabla de datos
agrupados. Considerando el caso práctico de una bebida, se
toma de la tabla de datos agrupados las columnas referentes a
las frecuencias de clase (fi) y a las marcas de clase (xi).
Explicación: Desviación típica o
estándar
 De esta tabla se obtienen los siguientes valores para las
frecuencias de clase:
f1 = 5
f2 = 10
f3 = 30
f4 = 40
f5 = 15
x3 = 17.5
x4 = 22.5
x5 = 27.5
 Y para las marcas de clase:
x1 = 7.5
x2 = 12.5
 Asimismo, dado que hay cinco intervalos de clase y la muestra
tiene 100 elementos, los valores de k y n respectivamente son:
k=5
n = 100
 Y como ya se determinó en ejercicios anteriores:
= 20
Explicación: Desviación típica o
estándar
 Ahora, sustituyendo estos valores en la respectiva
fórmula se tiene que:
Explicación: Desviación típica o
estándar
 La desviación estándar es una medida de dispersión que
nos permite evaluar la incertidumbre de los datos
obtenidos por la muestra; es decir, analiza todos aquellos
datos que se alejan de nuestro promedio para determinar
si nuestra predicción o teoría está alejada del modelo
que se construyó con la muestra.
Conclusión
 En esta sesión se han explicado la desviación estándar como
una medida de dispersión, que sirve para evaluar la
incertidumbre de los datos de una muestra, además, se
explicó el procedimiento para el correcto cálculo de esta
desviación en un conjunto de datos no agrupados y
agrupados.
Conclusión
 En la siguiente sesión conocerás los temas correspondientes a
la varianza como la última de las medidas de dispersión, así
como el procedimiento para su cálculo en conjuntos de datos
agrupados y no agrupados.
Descargar