Distribucion de frecuencias

Anuncio
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
ENEI
ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS
Sirve para organizar los datos de varias maneras e indicar los sitios en donde los valores de datos
tienen que acumularse, y ayudar a distinguir los valores mayores y menores se utilizan diversas
técnicas.
El primer método que se utiliza para la descripción de un conjunto de datos es la distribución de
frecuencias.
Distribución de frecuencias: Agrupamiento de datos en categorías mutuamente excluyentes,
que indican el número de observaciones en cada categoría.
Para elaborar una distribución de frecuencias es necesario seguir una serie de pasos. El primero de
ellos es anotar los datos en una tabla que muestre las clases (categorías) y el número de
observaciones en cada categoría. El objetivo final es obtener una tabla que muestre a simple vista la
forma de los datos.
PASO 1: Determinar el número de clases
El objetivo es usar suficientes grupos, o clases, que indiquen la forma de la distribución. Aquí se
necesita algún criterio. Demasiadas clases o muy pocas pueden no revelar la forma básica del
conjunto de datos.
PASO 2: Determinar el intervalo o amplitud
Generalmente el intervalo o amplitud de clases debe ser el mismo para todas ellas. Todas las clases
juntas deben cubrir por lo menos la distancia que hay desde el menor hasta el mayor valor que se
tiene en los daros sin procesar.
PASO 3: Establecer los límites de cada clase
Es necesario establecer los límites de clase claros de manera que cada observación pertenezca a solo
una clase. Esto significa que se deben evitar los límites de clase que se sobrepongan o que no sean
claros, por ejemplo, estableciendo una forma de redondear cifras.
PASO 4: Distribuir los valores en distintas clases
Prof. Willer David Chanduví Puicón
Página 1
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
Distribuir en una columna los valores de acuerdo con la clase a la que pertenecen.
ENEI
PASO 5: Contar el número de elementos en cada clase
Al número de observaciones en cada clase se le llama frecuencia de clase. A partir del paso 4, se
contabilizan los números de observaciones, estos valores representan la frecuencia.
INTERVALOS DE CLASE Y PUNTOS MEDIOS DE CLASE
 Punto medio de clase: También conocido como marcas de clase, se localiza a la mitad
entre los límites inferiores de dos clases consecutivas. Se puede calcular sumando el límite
inferior de la clase al límite superior de la misma, y dividiendo el resultado entre 2.
 Intervalo de clase: Se determina restando el límite inferior de una clase del límite
inferior de la siguiente. Asimismo, también se puede determinar encontrando la distancia
entre los puntos medios consecutivos.
DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS
Puede resultar conveniente convertir las frecuencias de clase en frecuencias de clase relativas para
mostrar el porcentaje del número total de observaciones en cada clase.
Para convertir una distribución de frecuencias en una distribución de frecuencias relativa, cada
frecuencia de clase se divide entre el número total de observaciones.

La organización de datos mediante distribución de frecuencias, utilizada para resumir los
datos originales y facilitar su comprensión, tiene como principal ventaja el obtener una
imagen visual rápida de la forma de la distribución, sin realizar cálculos adicionales, es
decir, se puede ver dónde se concentran los datos, y determinar si hay valores
extremadamente grandes o sumamente pequeños.
Sin embargo, existen dos desventajas de utilizar tales formas de organización: (1) se pierde
la identidad exacta de cada valor, y (2) no se sabe bien cómo se distribuyen los valores
dentro de cada clase.
Prof. Willer David Chanduví Puicón
Página 2
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
ENEI
Ejemplo:
La empresa Colgate – Palmolive aplica la estadística en su programa de aseguramiento de
la calidad en los detergentes caseros para ropa. Le interesa la satisfacción del cliente con
respecto a la cantidad de detergente en los paquetes. Todos los paquetes de cierto tamaño se
llenan con la misma cantidad de detergente en peso, aunque el volumen del detergente varía
de acuerdo con la densidad del polvo detergente. Así, si la densidad es alta se necesita una
cantidad menor de detergente para tener el peso señalado en el paquete. El resultado es que
cuando el cliente abre el paquete le parece que no ha sido bien llenado.
Para controlar el problema del peso del polvo de detergente, se ha establecido límites en el
nivel aceptable de la densidad del polvo. Con periodicidad se toman muestras de los
paquetes y se mide la densidad del polvo detergente. A continuación se presenta una tabla
de distribución de frecuencias obtenido de 150 muestras tomadas durante una semana.
Densidades mayores a 0,40 son inaceptablemente altas.
Densidad
0,29
0,31
0,33
0,35
0,37
0,39
-
0,30
0,32
0,34
0,36
0,38
0,40
Total
Frecuencia
Absoluta
30
75
32
9
3
1
Frecuencia
Frecuencia
Frecuencia
Absoluta
Relativa
Relativa
Acumulada
Acumulada
30
150
Para evitar estos inconvenientes es factible utilizar otros métodos de organización.
Prof. Willer David Chanduví Puicón
Página 3
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
ENEI
REPRESENTACIÓN GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS
Con frecuencia es necesario tener una percepción rápida de la tendencia de los datos obtenidos.
Estas tendencias pueden mostrarse utilizando diagramas o gráficas. Tres diagramas que representan
de manera adecuada una distribución de frecuencias son el histograma, el polígono de frecuencias y
el polígono de frecuencias acumuladas.
Histograma
Es uno de los medios que se utilizan mayormente para representar una distribución de frecuencias.
Es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clase en el eje
vertical. Las frecuencias de clase están representadas por las alturas de las barras, y éstas se colocan
adyacentes una a otra.
De esta manera, el histograma describe una distribución de frecuencias utilizando una serie de
rectángulos adyacentes, la altura de cada rectángulo es proporcional a la frecuencia que representa
la clase.
Prof. Willer David Chanduví Puicón
Página 4
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
Polígono de frecuencias
ENEI
Es un método similar al histograma. Está formada por segmentos de rectángulos que unen a los
puntos medios de clase y las frecuencias de clase. El punto medio de cada clase se marca en el eje
X, y las frecuencias de clase, en el eje Y. Recuerde que el punto medio de clase es el valor que se
encuentra al centro de una clase, y representa los valores en ésta. La frecuencia de clase es el
número de observaciones en una clase determinada.

Tanto el histograma como el polígono de frecuencias permiten obtener una imagen rápida
de las principales característica de los datos (altos, bajos, puntos de concentración, etc.).
Aunque el objetivo de ambas representaciones es similar, el histograma tiene la ventaja de
indicar cada clase como un rectángulo, cuya altura representa el número total de frecuencias
en la clase. El polígono de frecuencias, a su vez, tiene una ventaja notable con relación al
histograma, ya que permite compara en forma directa dos o más distribuciones de
frecuencias.
Prof. Willer David Chanduví Puicón
Página 5
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
ENEI
Polígono de frecuencias acumuladas
Para graficar una distribución de frecuencias acumuladas, se localiza el límite superior de cada clase
en el eje X, y las frecuencias acumuladas correspondientes a lo largo de eje Y. Para proporcionar
información adicional, puede graduarse en el eje vertical de la izquierda en unidades, y en el de la
derecha, en porcentajes. El polígono de frecuencia tiene la ventaja de que puede observarse
directamente con facilidad los valores que se encuentran por debajo de un límite determinado.
REPRESENTACIONES DE TALLO Y HOJAS
Es una técnica que se utiliza para mostrar información cuantitativa para mostrar información
cuantitativa en forma condensada. Una ventaja de esta representación sobre la distribución de
frecuencias es que no se pierde la intensidad de cada observación.
Cada valor numérico se divide en dos partes: los dígitos principales se toman como el tallo, y el
dígito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de
cada observación, a lo largo del eje horizontal.
Prof. Willer David Chanduví Puicón
Página 6
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
Procedimiento:
ENEI
1. Ordene los datos de menor a mayor.
2. Escriba los primeros dígitos de cada uno de los datos a la izquierda de una línea vertical
(Tallo).
3. A la derecha de la línea vertical, se anota el último dígito de cada dato (Hoja).
Ejemplo:
Para ilustrar el uso del diagrama de tallos y hojas, considere los siguientes datos que corresponden
al resultado de un examen de aptitudes con 150 preguntas presentado por 50 personas que aspiraban
a un puesto en una empresa. Los datos corresponden al número de respuestas correctas por examen.
6
7
8
9
10
11
12
13
14
Luego se obtiene:
6
7
8
9
10
11
12
13
14
8
2
0
1
0
2
4
2
1
9
3
1
2
0
3
6
4
3
1
2
2
5
7
5
2
2
4
5
8
6
3
4
6
8
6
4
5
6
9
5 6
5 6 7 8 8
6 7 8
9
Al rotar el gráfico sobre su costado en contra de las manecillas del reloj se obtiene una imagen de
los datos que es parecida a un histograma y en el que las clases son 60 – 69, 70 – 79, 80 – 89,
etcétera.
Prof. Willer David Chanduví Puicón
Página 7
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
Finalmente se puede observar la forma de la distribución mediante:
6
7
8
9
10
11
12
13
14
8
2
0
1
0
2
4
2
1
9
3
1
2
0
3
6
4
3
1
2
2
5
7
5
2
2
4
5
8
6
3
4
6
8
6
4
5
6
9
ENEI
5 6
5 6 7 8 8
6 7 8
9
Aunque este diagrama parece proporcionar la misma información que un histograma, tiene dos
ventajas fundamentales:
1. El diagrama de tallos y hojas es más fácil de construir.
2. En cada intervalo de clase se proporciona más información que un histograma debido a que
el tallo y la hoja proporcionan el dato.
Otras representaciones gráficas de datos
Las representaciones gráficas anteriores poseen un fuerte atractivo visual. Es decir, están diseñados
para captar la atención del lector. Pero existen también otras representaciones. Entre las más
utilizadas se encuentran la gráfica de líneas, la gráfica de barras y la gráfica circular; las cuales
suelen aparecer en publicaciones de periódicos o revistas, o en publicaciones gubernamentales.
Las gráficas de líneas son especialmente efectivas en los negocios porque se puede mostrar el
cambio en una variable a través del tiempo. Con frecuencia, en la misma gráfica de líneas se
representan dos o más series de cifras. Por tanto, una gráfica puede mostrar la tendencia de varias
series, lo cual permite su comparación rápida en un periodo o intervalo de tiempo.
La gráfica de barras es especialmente útil para mostrar cualquiera de los niveles de medición:
nominal, ordinal, de intervalo o de razón (o cociente). Asimismo, la gráfica de barras puede
realizarse de manera vertical u horizontal. Una diferencia con los histogramas es que en los gráficos
de barras existen espacios entre las barras debido a que los datos se miden en la escala nominal.
La gráfica circular es especialmente útil para mostrar los datos del nivel nominal. Para elaborarlo
es necesario marcar los porcentajes de manera uniforme sobre un círculo. Se trazan líneas desde el
Prof. Willer David Chanduví Puicón
Página 8
DISTRIBUCIÓN DE FRECUENCIAS
CURSO: ESTADÍSTICA DESCRIPTIVA
ENEI
centro del círculo y se divide este en sectores. El área, sector o “rebanada” obtenida representan los
porcentajes.
GRÁFICAS ENGAÑOSAS
Al elaborar una representación gráfica se debe tener cuidado de no hacer una que lleve a confusión
o a una interpretación errónea.
Siempre que observe una gráfica o un diagrama, analícelos cuidadosamente. Pregúntese. ¿Qué trata
de mostrarme el autor?, ¿Puede tener alguna predisposición?
Una de las formas más fáciles de conducir al lector a una interpretación errónea es hacer que la
extensión del eje Y sea muy pequeña en términos de las unidades que se utilizan para ese eje. Un
segundo método es comenzar en algún valor diferente de 0 sobre el eje Y. De esta u otras formas se
puede distorsionar gráficas o diagramas, por lo que es aconsejable siempre tomar precauciones y
observar las escalas que se utilizan en el eje X y en el eje Y.
Prof. Willer David Chanduví Puicón
Página 9
Descargar