DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA ENEI ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS Sirve para organizar los datos de varias maneras e indicar los sitios en donde los valores de datos tienen que acumularse, y ayudar a distinguir los valores mayores y menores se utilizan diversas técnicas. El primer método que se utiliza para la descripción de un conjunto de datos es la distribución de frecuencias. Distribución de frecuencias: Agrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría. Para elaborar una distribución de frecuencias es necesario seguir una serie de pasos. El primero de ellos es anotar los datos en una tabla que muestre las clases (categorías) y el número de observaciones en cada categoría. El objetivo final es obtener una tabla que muestre a simple vista la forma de los datos. PASO 1: Determinar el número de clases El objetivo es usar suficientes grupos, o clases, que indiquen la forma de la distribución. Aquí se necesita algún criterio. Demasiadas clases o muy pocas pueden no revelar la forma básica del conjunto de datos. PASO 2: Determinar el intervalo o amplitud Generalmente el intervalo o amplitud de clases debe ser el mismo para todas ellas. Todas las clases juntas deben cubrir por lo menos la distancia que hay desde el menor hasta el mayor valor que se tiene en los daros sin procesar. PASO 3: Establecer los límites de cada clase Es necesario establecer los límites de clase claros de manera que cada observación pertenezca a solo una clase. Esto significa que se deben evitar los límites de clase que se sobrepongan o que no sean claros, por ejemplo, estableciendo una forma de redondear cifras. PASO 4: Distribuir los valores en distintas clases Prof. Willer David Chanduví Puicón Página 1 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA Distribuir en una columna los valores de acuerdo con la clase a la que pertenecen. ENEI PASO 5: Contar el número de elementos en cada clase Al número de observaciones en cada clase se le llama frecuencia de clase. A partir del paso 4, se contabilizan los números de observaciones, estos valores representan la frecuencia. INTERVALOS DE CLASE Y PUNTOS MEDIOS DE CLASE Punto medio de clase: También conocido como marcas de clase, se localiza a la mitad entre los límites inferiores de dos clases consecutivas. Se puede calcular sumando el límite inferior de la clase al límite superior de la misma, y dividiendo el resultado entre 2. Intervalo de clase: Se determina restando el límite inferior de una clase del límite inferior de la siguiente. Asimismo, también se puede determinar encontrando la distancia entre los puntos medios consecutivos. DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS Puede resultar conveniente convertir las frecuencias de clase en frecuencias de clase relativas para mostrar el porcentaje del número total de observaciones en cada clase. Para convertir una distribución de frecuencias en una distribución de frecuencias relativa, cada frecuencia de clase se divide entre el número total de observaciones. La organización de datos mediante distribución de frecuencias, utilizada para resumir los datos originales y facilitar su comprensión, tiene como principal ventaja el obtener una imagen visual rápida de la forma de la distribución, sin realizar cálculos adicionales, es decir, se puede ver dónde se concentran los datos, y determinar si hay valores extremadamente grandes o sumamente pequeños. Sin embargo, existen dos desventajas de utilizar tales formas de organización: (1) se pierde la identidad exacta de cada valor, y (2) no se sabe bien cómo se distribuyen los valores dentro de cada clase. Prof. Willer David Chanduví Puicón Página 2 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA ENEI Ejemplo: La empresa Colgate – Palmolive aplica la estadística en su programa de aseguramiento de la calidad en los detergentes caseros para ropa. Le interesa la satisfacción del cliente con respecto a la cantidad de detergente en los paquetes. Todos los paquetes de cierto tamaño se llenan con la misma cantidad de detergente en peso, aunque el volumen del detergente varía de acuerdo con la densidad del polvo detergente. Así, si la densidad es alta se necesita una cantidad menor de detergente para tener el peso señalado en el paquete. El resultado es que cuando el cliente abre el paquete le parece que no ha sido bien llenado. Para controlar el problema del peso del polvo de detergente, se ha establecido límites en el nivel aceptable de la densidad del polvo. Con periodicidad se toman muestras de los paquetes y se mide la densidad del polvo detergente. A continuación se presenta una tabla de distribución de frecuencias obtenido de 150 muestras tomadas durante una semana. Densidades mayores a 0,40 son inaceptablemente altas. Densidad 0,29 0,31 0,33 0,35 0,37 0,39 - 0,30 0,32 0,34 0,36 0,38 0,40 Total Frecuencia Absoluta 30 75 32 9 3 1 Frecuencia Frecuencia Frecuencia Absoluta Relativa Relativa Acumulada Acumulada 30 150 Para evitar estos inconvenientes es factible utilizar otros métodos de organización. Prof. Willer David Chanduví Puicón Página 3 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA ENEI REPRESENTACIÓN GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS Con frecuencia es necesario tener una percepción rápida de la tendencia de los datos obtenidos. Estas tendencias pueden mostrarse utilizando diagramas o gráficas. Tres diagramas que representan de manera adecuada una distribución de frecuencias son el histograma, el polígono de frecuencias y el polígono de frecuencias acumuladas. Histograma Es uno de los medios que se utilizan mayormente para representar una distribución de frecuencias. Es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase están representadas por las alturas de las barras, y éstas se colocan adyacentes una a otra. De esta manera, el histograma describe una distribución de frecuencias utilizando una serie de rectángulos adyacentes, la altura de cada rectángulo es proporcional a la frecuencia que representa la clase. Prof. Willer David Chanduví Puicón Página 4 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA Polígono de frecuencias ENEI Es un método similar al histograma. Está formada por segmentos de rectángulos que unen a los puntos medios de clase y las frecuencias de clase. El punto medio de cada clase se marca en el eje X, y las frecuencias de clase, en el eje Y. Recuerde que el punto medio de clase es el valor que se encuentra al centro de una clase, y representa los valores en ésta. La frecuencia de clase es el número de observaciones en una clase determinada. Tanto el histograma como el polígono de frecuencias permiten obtener una imagen rápida de las principales característica de los datos (altos, bajos, puntos de concentración, etc.). Aunque el objetivo de ambas representaciones es similar, el histograma tiene la ventaja de indicar cada clase como un rectángulo, cuya altura representa el número total de frecuencias en la clase. El polígono de frecuencias, a su vez, tiene una ventaja notable con relación al histograma, ya que permite compara en forma directa dos o más distribuciones de frecuencias. Prof. Willer David Chanduví Puicón Página 5 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA ENEI Polígono de frecuencias acumuladas Para graficar una distribución de frecuencias acumuladas, se localiza el límite superior de cada clase en el eje X, y las frecuencias acumuladas correspondientes a lo largo de eje Y. Para proporcionar información adicional, puede graduarse en el eje vertical de la izquierda en unidades, y en el de la derecha, en porcentajes. El polígono de frecuencia tiene la ventaja de que puede observarse directamente con facilidad los valores que se encuentran por debajo de un límite determinado. REPRESENTACIONES DE TALLO Y HOJAS Es una técnica que se utiliza para mostrar información cuantitativa para mostrar información cuantitativa en forma condensada. Una ventaja de esta representación sobre la distribución de frecuencias es que no se pierde la intensidad de cada observación. Cada valor numérico se divide en dos partes: los dígitos principales se toman como el tallo, y el dígito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de cada observación, a lo largo del eje horizontal. Prof. Willer David Chanduví Puicón Página 6 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA Procedimiento: ENEI 1. Ordene los datos de menor a mayor. 2. Escriba los primeros dígitos de cada uno de los datos a la izquierda de una línea vertical (Tallo). 3. A la derecha de la línea vertical, se anota el último dígito de cada dato (Hoja). Ejemplo: Para ilustrar el uso del diagrama de tallos y hojas, considere los siguientes datos que corresponden al resultado de un examen de aptitudes con 150 preguntas presentado por 50 personas que aspiraban a un puesto en una empresa. Los datos corresponden al número de respuestas correctas por examen. 6 7 8 9 10 11 12 13 14 Luego se obtiene: 6 7 8 9 10 11 12 13 14 8 2 0 1 0 2 4 2 1 9 3 1 2 0 3 6 4 3 1 2 2 5 7 5 2 2 4 5 8 6 3 4 6 8 6 4 5 6 9 5 6 5 6 7 8 8 6 7 8 9 Al rotar el gráfico sobre su costado en contra de las manecillas del reloj se obtiene una imagen de los datos que es parecida a un histograma y en el que las clases son 60 – 69, 70 – 79, 80 – 89, etcétera. Prof. Willer David Chanduví Puicón Página 7 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA Finalmente se puede observar la forma de la distribución mediante: 6 7 8 9 10 11 12 13 14 8 2 0 1 0 2 4 2 1 9 3 1 2 0 3 6 4 3 1 2 2 5 7 5 2 2 4 5 8 6 3 4 6 8 6 4 5 6 9 ENEI 5 6 5 6 7 8 8 6 7 8 9 Aunque este diagrama parece proporcionar la misma información que un histograma, tiene dos ventajas fundamentales: 1. El diagrama de tallos y hojas es más fácil de construir. 2. En cada intervalo de clase se proporciona más información que un histograma debido a que el tallo y la hoja proporcionan el dato. Otras representaciones gráficas de datos Las representaciones gráficas anteriores poseen un fuerte atractivo visual. Es decir, están diseñados para captar la atención del lector. Pero existen también otras representaciones. Entre las más utilizadas se encuentran la gráfica de líneas, la gráfica de barras y la gráfica circular; las cuales suelen aparecer en publicaciones de periódicos o revistas, o en publicaciones gubernamentales. Las gráficas de líneas son especialmente efectivas en los negocios porque se puede mostrar el cambio en una variable a través del tiempo. Con frecuencia, en la misma gráfica de líneas se representan dos o más series de cifras. Por tanto, una gráfica puede mostrar la tendencia de varias series, lo cual permite su comparación rápida en un periodo o intervalo de tiempo. La gráfica de barras es especialmente útil para mostrar cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón (o cociente). Asimismo, la gráfica de barras puede realizarse de manera vertical u horizontal. Una diferencia con los histogramas es que en los gráficos de barras existen espacios entre las barras debido a que los datos se miden en la escala nominal. La gráfica circular es especialmente útil para mostrar los datos del nivel nominal. Para elaborarlo es necesario marcar los porcentajes de manera uniforme sobre un círculo. Se trazan líneas desde el Prof. Willer David Chanduví Puicón Página 8 DISTRIBUCIÓN DE FRECUENCIAS CURSO: ESTADÍSTICA DESCRIPTIVA ENEI centro del círculo y se divide este en sectores. El área, sector o “rebanada” obtenida representan los porcentajes. GRÁFICAS ENGAÑOSAS Al elaborar una representación gráfica se debe tener cuidado de no hacer una que lleve a confusión o a una interpretación errónea. Siempre que observe una gráfica o un diagrama, analícelos cuidadosamente. Pregúntese. ¿Qué trata de mostrarme el autor?, ¿Puede tener alguna predisposición? Una de las formas más fáciles de conducir al lector a una interpretación errónea es hacer que la extensión del eje Y sea muy pequeña en términos de las unidades que se utilizan para ese eje. Un segundo método es comenzar en algún valor diferente de 0 sobre el eje Y. De esta u otras formas se puede distorsionar gráficas o diagramas, por lo que es aconsejable siempre tomar precauciones y observar las escalas que se utilizan en el eje X y en el eje Y. Prof. Willer David Chanduví Puicón Página 9