Medidas de variabilidad y Posición

Anuncio
Jesús Eduardo Pulido
Guatire, marzo 2010
Medidas de Variabilidad y Posición.
Cuando trabajamos el aspecto denominado Medidas de Tendencia Central se
observó que tanto la media como la mediana y la moda proporcionan un solo
valor cada una, el cual es descriptivo de un conjunto de valores que toma una
determinada variable; aun cuando la información contenida en una medida de
tendencia central puede ser suficiente en algunos casos, hay muchas
situaciones en las cuales se requiere describir otras características, atributos o
cualidades que se registran en un archivo de datos. Dicho en otros términos
para describir una distribución de frecuencias se necesita, por lo menos, de
otra medida que posibilite cuantificar la variación de los datos ya que “Una
medida de variabilidad es un número que nos indica el grado de dispersión en
un conjunto de datos. Si este valor es pequeño (respecto de la unidad de
medida) entonces hay una gran uniformidad entre los datos. Por el contrario, un
gran valor nos indica poca uniformidad” (Chao, 1993; p. 49).
Entre las medidas de dispersión absoluta de mayor uso tenemos la
amplitud total o rango, desviación típica y la varianza.
Amplitud total o rango.
La amplitud total o recorrido de una variable está definida por la
diferencia entre su valor más alto
y el mínimo. Se utiliza cuando sólo se
necesita hacer una comparación rápida entre dos distribuciones; no es muy
confiable debido a su inestabilidad ya que puede variar considerablemente de
una distribución a otra. Su resultado se fundamenta únicamente en dos de sus
valores extremos, los demás datos no interviene en el cálculo.
A continuación se muestra la magnitud con la cual varían los valores que
toman las variables Yi y Zi.
1
Yi
Zi
10
11
12
13
14
2
2
3
4
5
El rango para Yi = 14 – 10 = 4 y para Zi su rango = 5 – 2 = 3; los
resultados indican claramente que los valores que tomó la variable Yi están
más separados que los de la variable Zi, el espacio ocupado por Yi es
equivalente a 4 unidades, lo cual es un indicador de la existencia de una mayor
variabilidad con respecto a la de los valores tomados por la variable Zi,
expresado en términos de dispersión; cuanto más grande es el rango mayor es
la dispersión de los datos en una distribución.
Desviación Típica o Estándar S 
La desviación típica mide el grado en que las puntuaciones de la variable
se aleja de su media aritmética; ejemplo, determinar la desviación típica de la
siguiente distribución de frecuencias (Calificaciones en Inglés)
X
f
10
11
12
13
14
2
4
8
3
2

19
Para obtener la desviación típica nos vamos a apoyar en la siguiente ecuación
s=
modo: SC=
SC
. La Suma de Cuadrados (SC) se obtiene del siguiente
n
 fX
2
-
 fX 2
Seguidamente se prepara una tabla con todos
n
los componentes de esta fórmula.
SC= 2.735 -
X
f
X2
fX2
fX
10
11
12
13
14
2
4
8
3
2
100
121
144
169
196

19
200
484
1152
507
392
2.735
20
44
96
39
28
227
2272
19
SC= 2.735 -
2
51.529
19
SC = 2.735 – 2.712,05
S=
22,95
19
SC= 22, 95
S= 1,2078= 1,09 puntos

La media de la distribución en estudio es 11,95 puntos ( X 
227
)
19
Interpretación. Las calificaciones obtenidas por los alumnos en inglés se
alejan del promedio (11,95) en 1,09 puntos; dicho en otros términos, los
alumnos lograron un promedio de 11,95 puntos en inglés con una dispersión
de 1,09 puntos.
La desviación típica presenta una gran utilidad cuando se analiza
conjuntamente con la media aritmética en una distribución normal; veamos los
siguientes casos:
a.
La     68% (el intervalo comprendido entre la media más y
menos una desviación estándar contiene aproximadamente el 68%
de los casos en estudio).
b.
La   2  95% (el intervalo comprendido entre la media más y
menos dos desviaciones estándares contiene aproximadamente el
95% de los casos en estudio).
c.
La   3  99% (el intervalo comprendido entre la media más y
menos tres desviaciones estándares contiene aproximadamente el
99% de los casos en estudio).
Medidas de Posición.
Cuando trabajamos la mediana se hizo con el propósito de encontrar un
valor que permitiera localizar la posición de algún caso con relación a otros que
están ordenados
de manera ascendente o descendente. En ese preciso
instante se inició el estudio de las medidas de posición, puesto que se dividió la
distribución en dos partes iguales, pero igualmente puede dividirse en cuatro
(cuartiles) en diez (deciles) o en cien partes iguales (percentiles). Los cuartiles
son tres y se representan por Q1, Q2, y Q3, respectivamente. El Q1, significa
que por debajo de su valor se encuentra el 25% de los casos en la
3
distribución que se esté analizando; el Q2 es igual a la mediana y bajo el
Q3 se encuentra el 75% de los casos.
De igual modo, el percentil es el punto por debajo del cual se
encuentra un determinado porcentaje de casos, por ejemplo, el percentil
ochenta (P80) es el punto por debajo del cual se encuentra el 80% de los
casos en la distribución. El percentil veinticinco (P25) es igual al cuartil
uno (Q1), el percentil cincuenta (P50) es igual a la mediana e igual al
cuartil dos (P50 = Me = Q2) y el percentil setenta y cinco es igual al cuartil
tres (P75 = Q3).
En el caso de datos agrupados en distribuciones de frecuencia el
cálculo de los percentiles se hace mediante un procedimiento análogo al
KN
 faanterior
i
utilizado para la mediana: Pk = Xri + 100
fi
Donde:
K = Es el percentil que se desea determinar.
N = Es la suma de las frecuencias absolutas de la distribución
 fi  N  .
Los demás componentes de la fórmula ya fueron estudiados en la
mediana.
Apoyándonos en la distribución de las calificaciones obtenidas por los alumnos
en la prueba de Física vamos a ilustrar el cálculo del percentil 25 (P25), el P65 y
completaremos el estudio de esta distribución con el cálculo del Rango y la
Desviación Típica.
Xi
10
11
12
13
14
15
16
fi
fa
1
2
1
2
2
2
1
11
1
3
4
6
8
10
11
4
Pasos para determinar un determinado percentil:
1. Localizar la fila que contiene al percentil, en nuestro caso el P25;
P25 =
25 * 11
= 2,75; el P25 está ubicado en la fila 2 de la distribución de
100
frecuencias porque la frecuencia acumulada es 3 y ésta contiene a 2,75.
2. Una vez localizada la fila podemos localizar el Límite Real Inferior (Xri),
el cual es 10,5 (se le quitó media unidad a 11), la frecuencia acumulada
anterior (1), la frecuencia absoluta que contiene al P25 (2) y el intervalo
que en nuestro caso es 1 (11-10= 1; 12 – 11= 1; …; 16 – 15 = 1).
3. Se aplica la ecuación P25 = 10,5 +
2,75  1
*1
2
P25 = 10,5 – 0,875
P25 = 9,62. Utilizando el mismo procedimiento se determinó el P65 y se
obtuvo un resultado de P65 = 12,92.
El rango viene dado por la diferencia entre la calificación más alta y la menor
que alcanzaron los estudiantes, en nuestro caso es Rango = 16 – 10 = 6
La Desviación Típica se determinó utilizando el proceso descrito anteriormente
y se obtuvo el siguiente resultado S = 1,83
Los resultados de la distribución de las calificaciones obtenidas por los 11
estudiantes en la prueba de Física se reportan en el siguiente cuadro.
Estadísticos Resultados
N
11
Media
13,09
Mediana
13,25
Moda
11
Desv. Típica
1,83
Rango
6
P25
9,62
P65
12,92
Asimetría
Negativa
Interpretación. Al analizar los resultados de la tabla se observa que la
distribución de las calificaciones obtenidas por los 11 alumnos en la prueba de
5
Física es asimétrica negativa, que su calificación promedio fue de 13,09 puntos
con una dispersión de 1,83; que la mitad de los estudiantes obtuvo
calificaciones por debajo de 13,25 puntos; que entre el estudiante que logró la
mayor calificación y el obtuvo la menor hay una diferencia de 6 puntos. Que el
40% de los estudiantes logró calificaciones que están comprendidas entre 9,62
y 12,92 puntos.
Referencia Bibliográfica.
Chao, L. (1994). Estadística para las ciencias administrativas. (3ª ed). México:
McGraw-Hill.
6
Descargar