Subido por Jose Luis Jimenez

Estadistica básica -- Cálculo de varianza y desviación estándar

Anuncio
Universidad Abierta y a Distancia de México
Ingeniería en Biotecnología
Estadística Básica
Grupo: BI-BEBA-1902-B2-001
Unidad 3.
Actividad 2
Medidas de dispersión
Varianza y desviación estándar
Alumno: José Luis Jiménez Molina
Fecha: 06 de noviembre de 2019
1
Actividad 2
Instrucciones:
1. Retoma los datos de la actividad anterior.
2. Halla las medidas de dispersión: varianza y desviación estándar, e interprétalas
Las medidas de dispersión miden el grado de separación o alejamiento de una variable estadística
alrededor de una medida de posición o tendencia central. Este grado de separación nos muestra lo
representativa que es la medida de posición con respecto al conjunto total de datos.
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.
La varianza mide la dispersión de los valores de la variable con respecto a la media aritmética.
Siempre es mayor o igual que cero y menor que infinito. Para obtener su valor, calculamos la sumatoria
de los cuadrados de las desviaciones y el resultado lo dividimos entre el valor poblacional (N) o el valor
muestral (n−1) según sea el caso.
Las fórmulas de la varianza para datos no agrupados son:
Para una muestra:
Para una población:
Desviación típica o estándar. Muestra que tan alejados están los datos de la media aritmética. Se
representa como S cuando se calcula para una muestra o  cuando se calcula para toda la
población. Es la raíz cuadrada de la varianza. Entre más dispersa se encuentra la distribución de
datos, más grande es su desviación estándar.
Las fórmulas de la desviación típica o estándar para datos no agrupados son:
2
En una población
En una muestra
Donde:
s = Desviación estándar en una muestra.
σ= Es la desviación estándar en una población
xi = Es un valor de un conjunto de datos.
n = Es el número de datos de la muestra.
N = Es el número de datos de la población.
µ = Es la media del conjunto de datos de la población.
𝑥 = Es la media del conjunto de datos de la muestra
Significa suma de
Cálculo de la varianza del ejemplo de la actividad anterior.
Para el ejemplo anterior, usamos la fórmula
Paso 1: calcular la media.
_
x
=
4 +
5
+ 5 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 11
20
= 7.6
3
Paso 2: calcular el cuadrado de la distancia a la media para cada dato.
Datos
Media:
4
5
5
6
6
7
7
7
7
7
8
8
8
8
9
9
10
10
10
11
7.6
Media
-
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
Resultado
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
-3.6
-2.6
-2.6
-1.6
-1.6
-0.6
-0.6
-0.6
-0.6
-0.6
0.4
0.4
0.4
0.4
1.4
1.4
2.4
2.4
2.4
3.4
Elevar al
cuadrado
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
- 3.6 )² =
- 2.6 )² =
- 2.6 )² =
- 1.6 )² =
- 1.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
0.4 )² =
0.4 )² =
0.4 )² =
0.4 )² =
1.4 )² =
1.4 )² =
2.4 )² =
2.4 )² =
2.4 )² =
3.4 )² =
Suma:
Resultado
12.960
6.760
6.760
2.560
2.560
0.360
0.360
0.360
0.360
0.360
0.160
0.160
0.160
0.160
1.960
1.960
5.760
5.760
5.760
11.560
66.800
Paso 3: sumar los valores que resultaron del paso 2.
Resultado: 66.8
Paso 4: dividir entre el número de datos - 1.
66.8 / (20 - 1) = 3.52
Varianza, S² = 3.52
4
Cálculo de la desviación estándar del ejemplo de la actividad anterior.
Realice lo siguiente:
Paso 1: calcule la media.
_
x
=
4 +
5
+ 5 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 11
20
= 7.6
Paso 2: calcule el cuadrado de la distancia a la media para cada dato.
Datos
Media:
4
5
5
6
6
7
7
7
7
7
8
8
8
8
9
9
10
10
10
11
7.6
Media
-
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
7.6
Resultado
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
-3.6
-2.6
-2.6
-1.6
-1.6
-0.6
-0.6
-0.6
-0.6
-0.6
0.4
0.4
0.4
0.4
1.4
1.4
2.4
2.4
2.4
3.4
Elevar al
cuadrado
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
- 3.6 )² =
- 2.6 )² =
- 2.6 )² =
- 1.6 )² =
- 1.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
- 0.6 )² =
0.4 )² =
0.4 )² =
0.4 )² =
0.4 )² =
1.4 )² =
1.4 )² =
2.4 )² =
2.4 )² =
2.4 )² =
3.4 )² =
Suma:
Resultado
12.960
6.760
6.760
2.560
2.560
0.360
0.360
0.360
0.360
0.360
0.160
0.160
0.160
0.160
1.960
1.960
5.760
5.760
5.760
11.560
66.800
Paso 3: sume los valores que resultaron del paso 2.
Resultado: 66.8
Paso 4: divida entre el número de datos - 1.
5
66.8 / (20 - 1) = 3.52
Paso 5: sacar la raíz cuadrada.
√3.52 = 1.876
Desviación estándar, s: 1.876
3. Describe los resultados obtenidos
Se obtuvieron los valores de varianza y desviación estándar, el valor de la varianza es de 3.52 y el
valor de la desviación estándar es de 1.876.
Aunque la varianza mide la dispersión matemática de los datos con respecto a la media y es
teóricamente correcto, es difícil utilizarlo en el mundo real debido a que los valores están elevados al
cuadrado.
La desviación estándar, al ser la raíz cuadrada de la varianza, se encuentra en las mismas unidades
que los datos, por esta razón, es más fácil trabajar con ella, ya que la medida de la dispersión tiene las
mismas unidades que la muestra original.
6
Descargar