Medidas de posición y variabilidad para datos agrupados

Anuncio
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Medidas de tendencia central y
variabilidada para datos agrupados
Media (media aritmética) (
X
)
Con anterioridad hablamos sobre la manera de determinar la media de la muestra. Si hay
muchos valores u observaciones; la sumatoria se vuelve tediosa y conviene clasificar o agrupar
los datos antes de calcular la media. Al clasificar los datos, las observaciones individuales
pierden su identidad, esto se explica porque el analista no tiene mayor interés en los valores de
las observaciones originales, porque no guarda un registro de los mismos o simplemente porque
nunca los tuvo a la mano, pues los obtuvo ya clasificados. Al calcular la media a partir de datos
agrupados, se supone que todos los valores que caen en un intervalo de clase particular están
localizados en el punto medio del intervalo (marca de clase). Para encontrar la media, se
multiplica cada marca de clase por la frecuencia correspondiente, se suman estos productos y se
dividen entre la suma de las frecuencias (número total de observaciones).
Donde:
k
∑M• f
i
X=
i =1
n
i
es la marca de clase
f i es la frecuencia absoluta de la
clase
k es el número de clase
Mi
M
ediana ( m~ )
Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra
la mediana.
Con datos agrupados la mediana se
localizara en uno de los intervalos
de clase. La clase en la que cae la
mediana se llama la clase de la
mediana y se hace la suposición de
que los valores individuales de la
esta
clase
se
distribuyen
uniformemente sobre la clase.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
El lugar que ocupa la mediana en el ordenamiento se obtiene mediante la formula:
Una vez localizado el lugar de la mediana se hace el calculo de la mediana:
Lugar de la mediana =
n +
0.5
2

 n +1
− (F + 1)

C
~ = Lm~ +  2
m


f m~




Donde:
Lm~ es el límite inferior de la clase
que contiene la mediana
n es el número total de datos
F es la suma de todas las
frecuencias, pero sin incluir la
clase mediana
Moda (Mo)
El cálculo de la moda para distribuciones cuantitativas continuas requiere de algunos
cálculos:
Se debe localizar la clase modal, que será aquella que tenga la mayor frecuencia.
 ∆1 
Mo = LMo + 
C
 ∆1 + ∆ 2 
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Donde:
Departamento de Ingeniería química
LMo es el límite inferior de la clase modal.
∆ 1 es la frecuencia de la clase modal menos la frecuencia de la clase que
se encuentra inmediatamente por debajo de ella.
∆ 2 es la frecuencia de la clase modal menos la frecuencia de la clase que
se encuentra inmediatamente por encima de ella.
C es el intervalo de la clase modal.
Ejemplo
Supongamos los pesos de un grupo de 50 personas se distribuyen
de la siguiente forma:
Linderos
45-55
6
6
55-65
10
16
65-75
19
35
75-85
11
46
85-95
4
50
Medidas de posición no centrales
Las medidas de posición no centrales permiten conocer otros puntos característicos de la
distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una
serie de valores que dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los
resultados.
Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los
resultados.
Ejemplo
Vamos a calcular los cuartiles de la serie de datos referidos a la
estatura de un grupo de alumnos del ejemplo anterior. Los
deciles y centiles se calculan de igual manera, aunque haría
falta distribuciones con mayor número de datos.
1º cuartil: es el valor 1.22 cm, ya que por debajo suya se sitúa el 25% de la frecuencia (tal
como se puede ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1.26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la
frecuencia.
3º cuartil: es el valor 1.28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la
frecuencia. Además, por encima suya queda el restante 25% de la frecuencia.
Nota: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el
ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las
repeticiones.
Rango ( R )
[o recorrido, también se le conoce como amplitud o intervalo]
El rango es la diferencia entre el límite superior de la ultima clase y el límite inferior de la
primera clase.
R = Ls (Ultima clase) - L i ( primera clase)
Donde:
Ls es el límite superior de la
ultima clase
Li es el límite inferior de la primera
clase
Varianza ( s )
2
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Muestra:
Desviación estándar ( S )
Autor: Rosalba Patiño Herrera
Población:
s = s2
Agosto del 2002
Descargar