DISTRIBUCIONES DE FRECUENCIAS Introducir – Proveniencia de los datos: Contar o Medir Es una ordenación de datos en clases o categorías, que muestran para cada una de ellas, el número de elementos que contienen y que son clasificaciones que se refieren a variables cuantitativas, continuas o discretas y que constituyen un instrumento muy útil en el trabajo estadístico. Las D.F. nos brinda información acerca de tres aspectos valiosos: a. La forma o patrón de la distribución de los datos. b. La posición de la distribución o sea alrededor de que valor se tienden a concentrar los datos (valores centrales). c. La dispersión de los datos alrededor de los valores centrales o promedios (variabilidad). Frecuencias: Es el número de veces que se repite un dato en un conjunto de datos o en un intervalo determinado. Existen varios tipos de frecuencias, entre ellas: a. Frecuencia Absoluta: Es el número absoluto de veces que se encuentra un dato en conjunto de datos o intervalo, se denota con nk. Se determina por inspección del conjunto de datos. b. Frecuencia Absoluta Acumulada: Es la suma acumulada de la frecuencia absoluta se denota por Nk. c. Frecuencia Relativa: Es una forma de representar porcentualmente el número de veces que se repite un dato o el número de datos que se encuentran en un intervalo, se denota por fk. fk = nk x 100 N d. Frecuencia Relativa Acumulada: Es la suma acumulada de la frecuencia relativa, se denota por Fk. Fk = nk x 100 n CLASE: Es un intervalo dentro del cual se encuentra un conjunto de datos. Sus valores extremos se llaman limites de clase. El número de clases se denota con la letra K. Los limites de clases representan a los datos en este caso son conocidas como limite reales de clase y están denotados por Li y Ls, en caso contrario se denotan por Ii – Is. La amplitud de clase o intervalo de clase es la diferencia entre los limites reales de clase se denota con la letra i. Procedimiento para construir una Distribución de Frecuencias 1. Recolectar los datos (Xi), de acuerdo con el tamaño de la muestra previamente calculado. 2. Ordenar los datos de (a), para facilitar obtener las frecuencias absolutas. Este paso es opcional, ya que se realiza por conteo contando dato por dato y anotando una rayita en el intervalo correspondiente. 3. Se calcula el rango, restando el dato mayor el dato menor, sea: R = Xi max – Xi min 4. Fijar el número de clases (k) es conveniente que este entre 5 y 20, se puede utilizar la regla de sturges, para obtener el número de clases aproximado. Esta regla es: K = 1 + 3,3 log n => donde n = tamaño de la muestra. 5. Calcular el intervalo de clase (i), así i = R/k. El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos. 6. Calcular el rango propuesto (Rp), mediante la multiplicación del intervalo redondeado por el numero de clases (k), sea: Rp = ir – k 7. Calcular la diferencia (d) entre el rango y el rango propuesto, sea: D = Rp – R Este valor numérico cuya última cifra significativa debe ser un cinco, si no se cumple se debe hacer el cálculo, hasta que se cumpla la condición. 8. Calcular la mitad de la diferencia (md). Md = d/z 9. Fijar los limites reales de clases (Li, Ls) de la siguiente manera. a. Tomar el valor del dato menor y restarle el valor de md, el valor obtenido es el primer Li. Li1 = Xi min – md. b. Sumar i al valor de Li1, para obtener el primer Ls. Ls1 = Li1 + i c. Repetir el paso 9.b hasta completar las k (número de clases). Al final se debe cumplir con: Lsk = Xi max + md , donde: Lsk = último limite real superior 10. Fijar los limites de clase (Ii, Is), sumando cinco unidades decimales a los limites inferiores reales de clase y restándoselas a los limites superiores reales de clase así: Si Li y Ls tienen solo un decimal se suma o resta 0.5 Si Li y Ls tienen dos decimales, se suma y se resta 0.05 Iik = Lik + 5 unidades decimales Isk = Lsk – 5 unidades decimales 11. Completar el cuadro de frecuencias de datos agrupados, para ello: a. Calcular el punto medio de cada clase (Xk) Xk = Li + Ls o Xk = Ii + Is 2 2 b. Obtener la frecuencia absoluta (nk), esto se realiza por inspección de los datos y conteo. c. Obtener la frecuencia absoluta acumuladas de (Nk), sea: Nk = Acumulado de nk d. Calcular la frecuencia relativa (Fk), sea: Fk =nk/n e. Obtener la frecuencia relativa acumulada (Fk), sea: Fk = acumulado de Fk 12. Construir el histograma para observar la distribución del conjunto de datos. Además el polígono de frecuencias y ojivas ¨menos de¨ y ¨más de¨ Histograma: Es un gráfico de barras continuas, en donde se representan los limites reales de clase en el eje x y la frecuencia absoluta o relativa en el eje y. Polígono de Frecuencias: Es una forma comparativa de representar la distribución de frecuencias, se realiza tomando como adcisa el punto medio de la clase y como ordenada la frecuencia. Las Ojivas o Poliganos de Frecuencias Acumuladas: Se realiza de igual forma que el poligano con excepción que la ordenada no se levanta sobre el punto medio de la clase, si no sobre el Ls o Li, según se tengan una frecuencia acumulada ¨menos de¨ o ¨más de¨