DISTRIBUCIONES DE FRECUENCIAS

Anuncio
DISTRIBUCIONES DE FRECUENCIAS
Introducir – Proveniencia de los datos: Contar o Medir
Es una ordenación de datos en clases o categorías, que muestran
para cada una de ellas, el número de elementos que contienen y
que son clasificaciones que se refieren a variables cuantitativas,
continuas o discretas y que constituyen un instrumento muy útil
en el trabajo estadístico.
Las D.F. nos brinda información acerca de tres aspectos valiosos:
a. La forma o patrón de la distribución de los datos.
b. La posición de la distribución o sea alrededor de que valor se
tienden a concentrar los datos (valores centrales).
c. La dispersión de los datos alrededor de los valores centrales o
promedios (variabilidad).
Frecuencias:
Es el número de veces que se repite un dato en un conjunto de
datos o en un intervalo determinado. Existen varios tipos de
frecuencias, entre ellas:
a. Frecuencia Absoluta: Es el número absoluto de veces que se
encuentra un dato en conjunto de datos o intervalo, se denota
con nk. Se determina por inspección del conjunto de datos.
b. Frecuencia Absoluta Acumulada: Es la suma acumulada de
la frecuencia absoluta se denota por Nk.
c. Frecuencia Relativa: Es una forma de representar
porcentualmente el número de veces que se repite un dato o el
número de datos que se encuentran en un intervalo, se denota
por fk.
fk = nk x 100
N
d. Frecuencia Relativa Acumulada: Es la suma acumulada de la
frecuencia relativa, se denota por Fk.
Fk = nk x 100
n
CLASE:
Es un intervalo dentro del cual se encuentra un conjunto de datos.
Sus valores extremos se llaman limites de clase. El número de
clases se denota con la letra K. Los limites de clases representan a
los datos en este caso son conocidas como limite reales de clase y
están denotados por Li y Ls, en caso contrario se denotan por Ii –
Is.
La amplitud de clase o intervalo de clase es la diferencia entre los
limites reales de clase se denota con la letra i.
Procedimiento para construir una Distribución de
Frecuencias
1. Recolectar los datos (Xi), de acuerdo con el tamaño de la
muestra previamente calculado.
2. Ordenar los datos de (a), para facilitar obtener las frecuencias
absolutas. Este paso es opcional, ya que se realiza por conteo
contando dato por dato y anotando una rayita en el intervalo
correspondiente.
3. Se calcula el rango, restando el dato mayor el dato menor, sea:
R = Xi max – Xi min
4. Fijar el número de clases (k) es conveniente que este entre 5 y
20, se puede utilizar la regla de sturges, para obtener el número
de clases aproximado. Esta regla es:
K = 1 + 3,3 log n => donde n = tamaño de la muestra.
5. Calcular el intervalo de clase (i), así i = R/k. El valor de i
debe ser redondeado siempre hacia arriba y a la misma cantidad
de decimales que tienen los datos.
6. Calcular el rango propuesto (Rp), mediante la multiplicación
del intervalo redondeado por el numero de clases (k), sea:
Rp = ir – k
7. Calcular la diferencia (d) entre el rango y el rango propuesto,
sea:
D = Rp – R
Este valor numérico cuya última cifra significativa debe ser un
cinco, si no se cumple se debe hacer el cálculo, hasta que se
cumpla la condición.
8. Calcular la mitad de la diferencia (md).
Md = d/z
9. Fijar los limites reales de clases (Li, Ls) de la siguiente
manera.
a. Tomar el valor del dato menor y restarle el valor de md, el
valor obtenido es el primer Li. Li1 = Xi min – md.
b. Sumar i al valor de Li1, para obtener el primer Ls. Ls1 = Li1 +
i
c. Repetir el paso 9.b hasta completar las k (número de clases).
Al final se debe cumplir con:
Lsk = Xi max + md , donde:
Lsk = último limite real superior
10. Fijar los limites de clase (Ii, Is), sumando cinco unidades
decimales a los limites inferiores reales de clase y
restándoselas a los limites superiores reales de clase así:
Si Li y Ls tienen solo un decimal se suma o resta 0.5
Si Li y Ls tienen dos decimales, se suma y se resta 0.05
Iik = Lik + 5 unidades decimales
Isk = Lsk – 5 unidades decimales
11. Completar el cuadro de frecuencias de datos agrupados, para
ello:
a. Calcular el punto medio de cada clase (Xk)
Xk = Li + Ls o Xk = Ii + Is
2
2
b. Obtener la frecuencia absoluta (nk), esto se realiza por
inspección de los datos y conteo.
c. Obtener la frecuencia absoluta acumuladas de (Nk), sea: Nk =
Acumulado de nk
d. Calcular la frecuencia relativa (Fk), sea: Fk =nk/n
e. Obtener la frecuencia relativa acumulada (Fk), sea: Fk =
acumulado de Fk
12. Construir el histograma para observar la distribución del
conjunto de datos. Además el polígono de frecuencias y ojivas
¨menos de¨ y ¨más de¨
Histograma: Es un gráfico de barras continuas, en donde se
representan los limites reales de clase en el eje x y la frecuencia
absoluta o relativa en el eje y.
Polígono de Frecuencias: Es una forma comparativa de
representar la distribución de frecuencias, se realiza tomando
como adcisa el punto medio de la clase y como ordenada la
frecuencia.
Las Ojivas o Poliganos de Frecuencias Acumuladas: Se realiza
de igual forma que el poligano con excepción que la ordenada no
se levanta sobre el punto medio de la clase, si no sobre el Ls o Li,
según se tengan una frecuencia acumulada ¨menos de¨ o ¨más de¨
Descargar