Unidad II. Distribución de frecuencias y sus gráficas 1>Para llevar a cabo una actividad, siempre es necesario que las cosas u objetos a tratar estén organizados para desempeñarla adecuadamente. La Estadística no es la excepción, ya que se requiere que los datos numéricos tengan cierto orden para ser manipulados más fácilmente. 2>Los datos organizados permiten que se formen subconjuntos (o grupos) con características similares llamados clases o categorías que se pueden representar en forma tabular o gráficamente. 3>Los grupos de datos en clases indican la frecuencia o número de observaciones o porcentajes que tiene cada una de las clases, a esto se le conoce como Distribución de frecuencias. Dentro de esta unidad, se verá cómo construir las diferentes distribuciones de frecuencias (relativas, acumuladas) y qué tipo de gráficas se utilizan para representarlas y cómo construirlas. 1 Los datos numéricos de una muestra deben estar ordenados en forma ascendente o descendente para ser utilizados y manipulados fácilmente. Por ejemplo, se tiene una muestra de ingresos ganados por estudiantes universitarios que trabajaron un determinado sábado, se observa que los datos no tienen un orden. 2 En la tabla de abajo se muestran los datos de los ingresos ordenados en forma ascendente. 3 4 Algunos de los términos empleados en el tema de distribuciones de frecuencias son: 1>Por ejemplo, para el caso de la muestra de los ingresos ganados por los estudiantes, se tiene como dato mayor el 42 2>Y como dato menor el 8. 3>Dando como rango 42 – 8 = 34 Rango, que es la diferencia entre el dato mayor y menor del grupo de datos. 5 6 Clases o categorías, que es la distribución de los datos en intervalos. Existen 3 reglas para construir distribuciones de frecuencias, las cuales son: Frecuencia de clase, es el número de observaciones o individuos (frecuencia) que pertenecen a cada clase. 1. Determinar la cantidad de clases no traslapantes, esto es, el Número de clases. Al formar las clases se está indicando los intervalos que se emplearán para agrupar los datos. Distribución de frecuencias o tabla de frecuencias, es el resumen tabular de los datos por clases que indica la frecuencia de observaciones en cada una de estas clases. Hay una regla general que indica que solo se deben emplear entre 5 y 20 clases. 7 8 Otra indica que cuando se tiene un número pequeño de observaciones, se deben utilizar cinco o seis clases Una última regla indica que cuando se tiene un número grande de observaciones, se requiere un mayor número de clases 9 Tomando el arreglo de datos de los ingresos ganados por los estudiantes universitarios, se podría tomar como número de clases = 6 ya que es un número pequeño de observaciones las que se tienen. 10 Muestra= 20 estudiantes. 11 12 Regla 2. Determinar el ancho de cada clase (Ancho de clases) Una regla general es que todas las clases tengan el mismo ancho. La fórmula para determinar el ancho aproximado de la clase es: identificar el mayor y el menor de todos los datos (Rango), 13 Posteriormente se divide el rango en un número de clases adecuado del mismo tamaño. 14 Por ejemplo, si al aplicar la ecuación se obtuviera que el ancho de la clase es: 9.28 Cuando se obtiene el ancho de la clase, se puede tener un valor con decimales, el cual se puede ajustar a un valor entero con base en la preferencia de quien está desarrollando la distribución de frecuencias. 15 16 se puede ajustar a 10. Otro caso, si el ancho de la clase es 4.2 17 se puede dejar a 5. 18 La cantidad de clases y el ancho de clases se determinan por tanteos, esto es, quien está realizando el análisis de los datos puede repetir este proceso aplicado su criterio para determinar la combinación de cantidad de clases y ancho de clases con que se obtenga la mejor manera de resumir los datos. 19 20 Aplicando la ecuación para obtener el ancho de clases del caso de los salarios de los estudiantes universitarios tenemos: Ancho aproximado de clase = 42 – 8 Entre 6 = 5.6 21 22 Regla 3. Determinar los límites de clase (Límites de clase). Por lo tanto, el ancho de clase = 6, ya que se ajusta. Los límites de clase son importantes porque indican dónde se clasifica cada uno de los datos. Cada valor debe pertenecer a una clase y sólo a una. 23 24 Hay 2 límites de clase: •Límite superior de clase. Valor máximo posible de los datos que se asignan a la clase. •Límite inferior de clase. Valor mínimo posible de los datos que se asignan a la clase. 25 La diferencia entre los límites inferiores de clase de clases adyacentes es igual al ancho de clase. 26 Los límites de clase para cada una de las 6 clases del ejemplo de los salarios de los universitarios son: 27 28 13 – 7 = 6 19 – 13 = 6, etc. Se puede observar que el ancho de clase es de 6. 29 Después de haber aplicado las reglas para formar distribuciones de frecuencias se procede a obtener la distribución de frecuencias contando la cantidad de datos (observaciones o elementos) que pertenecen a cada clase. 30 Para la segunda clase, su frecuencia es 4, porque los datos 13, 15, 17 y 18 se encuentran entre 13 y 18. La distribución de frecuencias del salario de los estudiantes es la siguiente: Para la primer clase, su frecuencia es 2, ya que en el arreglo de datos el 8 y 11 se encuentran entre 7 y 12. 31 32 En la tercer clase, la frecuencia es 3, debido a que el 21, 21 y 23 se encuentran entre 19 y 24. Y así sucesivamente se obtiene la frecuencia correspondiente a cada clase. El PUNTO MEDIO DE CLASE, es el valor promedio entre los límites inferior y superior de clase. Para el caso de los salarios de los estudiantes, los puntos medio de cada clase son los siguientes: Para la primera, 9.5 33 Para la segunda, 15.5. Y así sucesivamente para el resto de las clases. 34 Las distribuciones de frecuencias se representan gráficamente a través de histogramas (o histograma de frecuencias) y polígonos de frecuencias. 35 36 Histograma de frecuencias. Consiste en un conjunto de rectángulos, similar a una gráfica de barras. En el eje X horizontal se representan los límites de clase y en el eje Y vertical se indican las áreas proporcionales a las frecuencias de clase. 37 Para las distribuciones de frecuencias del ejemplo de los ingresos ganados de los estudiantes universitarios, se muestra el histograma “Salarios de estudiantes” 38 Polígono de frecuencias. Consiste en un gráfico de trazos. 39 40 Se construye a partir del histograma, en donde se van conectando los puntos medios de las partes superiores de los rectángulos. Para las distribuciones de frecuencias del ejemplo de los ingresos ganados por los estudiantes universitarios, aparece el polígono “Salarios de estudiantes” 41 La frecuencia relativa de una clase, es la frecuencia de la clase entre el número total de observaciones (n). Se expresa como porcentaje. En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias relativas de cada una de las 6 clases son: 42 Para la segunda clase, se divide 4/20=0.2, y así sucesivamente con el resto de las clases. Para la primera se divide 2/20=0.1 43 44 Al final, la suma de todas las frecuencias relativas de las clases es igual a 1, que representa el 100% La tabla resultante de obtener cada una de las frecuencias relativas de las clases, se le conoce como Distribución de frecuencias relativas o Distribución de porcentajes o Tabla de frecuencias relativas La suma de todas las frecuencias relativas de las clases debe dar 1. 45 Las distribuciones de frecuencias relativas se representan gráficamente a través de histogramas o polígonos de frecuencias, teniendo como resultado las gráficas llamadas: Histogramas de frecuencias relativas (o histograma de porcentajes) y Polígono de frecuencias relativas (o polígono de porcentajes). 46 Histograma de frecuencias relativas. Para construirlo, en el eje X se representan los límites de clase y en el eje Y se indican las frecuencias relativas de clase. 47 48 Para las distribuciones de frecuencias relativas del ejemplo de los ingresos ganados de los estudiantes universitarios, se muestra el histograma de porcentajes “Salarios de estudiantes” Polígono de frecuencias relativas. Para su construcción, se conectan los puntos medios de las partes superiores de los rectángulos del histograma de frecuencias relativas. 49 Para las distribuciones de frecuencias relativas del ejemplo de los ingresos ganados de los estudiantes universitarios, se indica el polígono de porcentajes “Salarios de estudiantes” 50 La frecuencia acumulada hasta un límite de clase, es la suma sucesiva de las frecuencias de clase hasta un límite de clase dado. En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias acumuladas de cada una de las 6 clases son: Para la primera es 2 porque su frecuencia es 2 51 52 Para la segunda clase, se suma su frecuencia 4 mas la frecuencia acumulada de la primera clase que es 2, dando como resultado 6, y así sucesivamente con el resto de las clases. Para la última clase, su frecuencia acumulada debe ser igual a n, en este caso igual a 20. 53 La tabla que indica las frecuencias acumuladas de cada límite de clase o que muestra la cantidad de elementos con valores menores que o iguales al límite superior de clase para cada clase se le conoce como Distribución de frecuencias acumuladas o Distribución acumulada o Tabla de frecuencias acumuladas. 54 Una Distribución acumulada <o más>, es una distribución de frecuencias acumuladas de todos los valores mayores o iguales que el límite inferior de clase de cada clase. 55 56 Ejemplo: los salarios de 7 dólares o más de 13 dólares o más, etc. 57 La Distribución acumulada <menor que>, es la distribución de frecuencias acumuladas de todos los valores menores o iguales que el límite superior de clase de cada clase. 58 Ejemplo: los salarios menores que 12 dólares= 2 elementos, 59 60 menores que 18 dólares= 6 elementos, etc. Las distribuciones de frecuencias acumuladas se representan gráficamente a través de un Polígono de frecuencias acumuladas u ojiva. 61 El Polígono de frecuencias acumuladas, para construirlo, en el eje X horizontal se representan los límites de clase. 62 Para las distribuciones de frecuencias acumuladas del ejemplo de los ingresos ganados de los estudiantes universitarios, se muestra el polígono de frecuencias acumuladas “Salarios de estudiantes” Y en el eje Y vertical se colocan las frecuencias acumuladas de clase. 63 64 Una Frecuencia acumulada relativa, es la frecuencia acumulada de cada clase entre el número total de elementos u observaciones. En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias acumuladas relativas de cada una de las 6 clases son: Para la segunda clase, se divide 6/20=0.3, y así sucesivamente con el resto de las clases. Para la primera se divide 2/20=0.1 65 La Frecuencia acumulada en porcentajes, se obtiene de multiplicar las frecuencias acumuladas relativas por 100. 66 Para la segunda clase, se multiplica 0.3 por 100 = 30, y así sucesivamente con el resto de las clases. En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias acumuladas en porcentaje de cada una de las 6 clases son: Para la primera se multiplica 0.1 por 100 = 10 67 68 La tabla que contiene las frecuencias acumuladas relativas o frecuencias acumuladas en porcentajes de las clases se les conoce como Distribución de frecuencias acumuladas relativas o Distribución acumulada en porcentajes. Las distribuciones de frecuencias acumuladas relativas y distribuciones de frecuencias acumuladas en porcentajes se representan gráficamente a través de un Polígono de frecuencias acumuladas relativas y Ojivas porcentuales respectivamente. 69 Un Polígono de frecuencias acumuladas relativas, se construye colocando en el eje X horizontal los límites de clase y en el eje Y vertical las frecuencias acumuladas relativas de clase. 70 Para las distribuciones de frecuencias acumuladas relativas del ejemplo de los ingresos ganados de los estudiantes universitarios, se muestra el polígono de frecuencias acumuladas relativas “Salarios de estudiantes” 71 72 Las Ojivas porcentuales para construirlas se representa en el eje X horizontal los límites de clase y en el eje Y vertical se representan las frecuencias acumuladas en porcentajes de clase. Para las distribuciones de frecuencias acumuladas en porcentajes del ejemplo de los ingresos ganados de los estudiantes universitarios, se muestra la ojiva porcentual “Salarios de estudiantes” 73 A continuación se mencionan las formas características que pueden tener las curvas de frecuencia: 74 Asimétrica (sesgada) a la derecha (sesgo positivo), la cola de la curva a un lado del máximo 1. Simétrica o en forma de campana, las observaciones equidistantes del máximo central tienen la misma frecuencia. 75 76 Asimétrica (sesgada) a la izquierda (sesgo negativo), la cola de la curva a un lado del máximo central es más larga que al otro lado. La cola mayor está a la izquierda. En forma de J, hay un máximo en un extremo. 77 En forma de J inversa, hay un máximo en un extremo. 78 En forma de U, tiene máximos en ambos extremos. 79 80 Bimodal, tiene dos máximos. Multimodal, tiene más de dos máximos. 81 83 82