version para imprimir

Anuncio
Unidad II. Distribución de frecuencias y sus gráficas
1>Para llevar a cabo una actividad, siempre es necesario que las cosas u objetos a tratar
estén organizados para desempeñarla adecuadamente. La Estadística no es la excepción, ya
que se requiere que los datos numéricos tengan cierto orden para ser manipulados más
fácilmente.
2>Los datos organizados permiten que se formen subconjuntos (o grupos) con
características similares llamados clases o categorías que se pueden representar en forma
tabular o gráficamente.
3>Los grupos de datos en clases indican la frecuencia o número de observaciones o
porcentajes que tiene cada una de las clases, a esto se le conoce como Distribución de
frecuencias.
Dentro de esta unidad, se verá cómo construir las diferentes distribuciones de frecuencias
(relativas, acumuladas) y qué tipo de gráficas se utilizan para representarlas y cómo
construirlas.
1
Los datos numéricos de una muestra deben estar ordenados en forma ascendente o
descendente para ser utilizados y manipulados fácilmente. Por ejemplo, se tiene una
muestra de ingresos ganados por estudiantes universitarios que trabajaron un
determinado sábado, se observa que los datos no tienen un orden.
2
En la tabla de abajo se muestran los datos de los ingresos ordenados en forma ascendente.
3
4
Algunos de los términos empleados en el tema de distribuciones de frecuencias son:
1>Por ejemplo, para el caso de la muestra de los ingresos ganados por los estudiantes, se
tiene como dato mayor el 42
2>Y como dato menor el 8.
3>Dando como rango 42 – 8 = 34
Rango, que es la diferencia entre el dato mayor y menor del grupo de datos.
5
6
Clases o categorías, que es la distribución de los datos en intervalos.
Existen 3 reglas para construir distribuciones de frecuencias, las cuales son:
Frecuencia de clase, es el número de observaciones o individuos (frecuencia) que
pertenecen a cada clase.
1. Determinar la cantidad de clases no traslapantes, esto es, el
Número de clases.
Al formar las clases se está indicando los intervalos que se
emplearán para agrupar los datos.
Distribución de frecuencias o tabla de frecuencias, es el resumen tabular de los
datos por clases que indica la frecuencia de observaciones en cada una de estas
clases.
Hay una regla general que indica que solo se deben emplear entre
5 y 20 clases.
7
8
Otra indica que cuando se tiene un número pequeño de observaciones, se deben
utilizar cinco o seis clases
Una última regla indica que cuando se tiene un número grande de observaciones,
se requiere un mayor número de clases
9
Tomando el arreglo de datos de los ingresos ganados por los estudiantes universitarios, se
podría tomar como número de clases = 6 ya que es un número pequeño de observaciones
las que se tienen.
10
Muestra= 20 estudiantes.
11
12
Regla 2. Determinar el ancho de cada clase (Ancho de clases)
Una regla general es que todas las clases tengan el mismo ancho.
La fórmula para determinar el ancho aproximado de la clase es: identificar el mayor y el
menor de todos los datos (Rango),
13
Posteriormente se divide el rango en un número de clases adecuado del mismo tamaño.
14
Por ejemplo, si al aplicar la ecuación se obtuviera que el ancho de la clase es: 9.28
Cuando se obtiene el ancho de la clase, se puede tener un valor con decimales, el
cual se puede ajustar a un valor entero con base en la preferencia de quien está
desarrollando la distribución de frecuencias.
15
16
se puede ajustar a 10.
Otro caso, si el ancho de la clase es 4.2
17
se puede dejar a 5.
18
La cantidad de clases y el ancho de clases se determinan por tanteos, esto es,
quien está realizando el análisis de los datos puede repetir este proceso aplicado
su criterio para determinar la combinación de cantidad de clases y ancho de clases
con que se obtenga la mejor manera de resumir los datos.
19
20
Aplicando la ecuación para obtener el ancho de clases del caso de los salarios de
los estudiantes universitarios tenemos:
Ancho aproximado de clase = 42 – 8
Entre 6 = 5.6
21
22
Regla 3. Determinar los límites de clase (Límites de clase).
Por lo tanto, el ancho de clase = 6, ya que se ajusta.
Los límites de clase son importantes porque indican dónde se clasifica cada uno de los
datos. Cada valor debe pertenecer a una clase y sólo a una.
23
24
Hay 2 límites de clase:
•Límite superior de clase. Valor máximo posible de los datos que se asignan a la clase.
•Límite inferior de clase. Valor mínimo posible de los datos que se asignan a la clase.
25
La diferencia entre los límites inferiores de clase de clases adyacentes es igual al ancho de
clase.
26
Los límites de clase para cada una de las 6 clases del ejemplo de los salarios de los
universitarios son:
27
28
13 – 7 = 6
19 – 13 = 6, etc. Se puede observar que el ancho de clase es de 6.
29
Después de haber aplicado las reglas para formar distribuciones de frecuencias se procede
a obtener la distribución de frecuencias contando la cantidad de datos (observaciones o
elementos) que pertenecen a cada clase.
30
Para la segunda clase, su frecuencia es 4, porque los datos 13, 15, 17 y 18 se encuentran
entre 13 y 18.
La distribución de frecuencias del salario de los estudiantes es la siguiente:
Para la primer clase, su frecuencia es 2, ya que en el arreglo de datos el 8 y 11 se
encuentran entre 7 y 12.
31
32
En la tercer clase, la frecuencia es 3, debido a que el 21, 21 y 23 se encuentran entre 19 y
24. Y así sucesivamente se obtiene la frecuencia correspondiente a cada clase.
El PUNTO MEDIO DE CLASE, es el valor promedio entre los límites inferior y superior de
clase. Para el caso de los salarios de los estudiantes, los puntos medio de cada clase son los
siguientes:
Para la primera, 9.5
33
Para la segunda, 15.5. Y así sucesivamente para el resto de las clases.
34
Las distribuciones de frecuencias se representan gráficamente a través de histogramas (o
histograma de frecuencias) y polígonos de frecuencias.
35
36
Histograma de frecuencias. Consiste en un conjunto de rectángulos, similar a una gráfica de
barras.
En el eje X horizontal se representan los límites de clase y en el eje Y vertical se indican las
áreas proporcionales a las frecuencias de clase.
37
Para las distribuciones de frecuencias del ejemplo de los ingresos ganados de los
estudiantes universitarios, se muestra el histograma “Salarios de estudiantes”
38
Polígono de frecuencias. Consiste en un gráfico de trazos.
39
40
Se construye a partir del histograma, en donde se van conectando los puntos medios de las
partes superiores de los rectángulos.
Para las distribuciones de frecuencias del ejemplo de los ingresos ganados por los
estudiantes universitarios, aparece el polígono “Salarios de estudiantes”
41
La frecuencia relativa de una clase, es la frecuencia de la clase entre el número total de
observaciones (n). Se expresa como porcentaje. En el ejemplo de los ingresos ganados por
los estudiantes universitarios, las frecuencias relativas de cada una de las 6 clases son:
42
Para la segunda clase, se divide 4/20=0.2, y así sucesivamente con el resto de las clases.
Para la primera se divide 2/20=0.1
43
44
Al final, la suma de todas las frecuencias relativas de las clases es igual a 1, que representa
el 100%
La tabla resultante de obtener cada una de las frecuencias relativas de las clases, se le
conoce como Distribución de frecuencias relativas o Distribución de porcentajes o Tabla de
frecuencias relativas
La suma de todas las frecuencias relativas de las clases debe dar 1.
45
Las distribuciones de frecuencias relativas se representan gráficamente a través de
histogramas o polígonos de frecuencias, teniendo como resultado las gráficas llamadas:
Histogramas de frecuencias relativas (o histograma de porcentajes) y Polígono de
frecuencias relativas (o polígono de porcentajes).
46
Histograma de frecuencias relativas. Para construirlo, en el eje X se representan los límites
de clase y en el eje Y se indican las frecuencias relativas de clase.
47
48
Para las distribuciones de frecuencias relativas del ejemplo de los ingresos ganados de los
estudiantes universitarios, se muestra el histograma de porcentajes “Salarios de
estudiantes”
Polígono de frecuencias relativas. Para su construcción, se conectan los puntos
medios de las partes superiores de los rectángulos del histograma de frecuencias relativas.
49
Para las distribuciones de frecuencias relativas del ejemplo de los ingresos ganados de los
estudiantes universitarios, se indica el polígono de porcentajes “Salarios de estudiantes”
50
La frecuencia acumulada hasta un límite de clase, es la suma sucesiva de las
frecuencias de clase hasta un límite de clase dado.
En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias
acumuladas de cada una de las 6 clases son:
Para la primera es 2 porque su frecuencia es 2
51
52
Para la segunda clase, se suma su frecuencia 4 mas la frecuencia acumulada de la primera
clase que es 2, dando como resultado 6, y así sucesivamente con el resto de las clases.
Para la última clase, su frecuencia acumulada debe ser igual a n, en este caso igual a 20.
53
La tabla que indica las frecuencias acumuladas de cada límite de clase o que muestra la
cantidad de elementos con valores menores que o iguales al límite superior de clase para
cada clase se le conoce como Distribución de frecuencias acumuladas o Distribución
acumulada o Tabla de frecuencias acumuladas.
54
Una Distribución acumulada <o más>, es una distribución de frecuencias acumuladas de
todos los valores mayores o iguales que el límite inferior de clase de cada clase.
55
56
Ejemplo: los salarios de 7 dólares o más
de 13 dólares o más, etc.
57
La Distribución acumulada <menor que>, es la distribución de frecuencias acumuladas de
todos los valores menores o iguales que el límite superior de clase de cada clase.
58
Ejemplo: los salarios menores que 12 dólares= 2 elementos,
59
60
menores que 18 dólares= 6 elementos, etc.
Las distribuciones de frecuencias acumuladas se representan gráficamente a través de un
Polígono de frecuencias acumuladas u ojiva.
61
El Polígono de frecuencias acumuladas, para construirlo, en el eje X horizontal se
representan los límites de clase.
62
Para las distribuciones de frecuencias acumuladas del ejemplo de los ingresos ganados de
los estudiantes universitarios, se muestra el polígono de frecuencias acumuladas “Salarios
de estudiantes”
Y en el eje Y vertical se colocan las frecuencias acumuladas de clase.
63
64
Una Frecuencia acumulada relativa, es la frecuencia acumulada de cada clase entre el
número total de elementos u observaciones. En el ejemplo de los ingresos ganados por los
estudiantes universitarios, las frecuencias acumuladas relativas de cada una de las 6 clases
son:
Para la segunda clase, se divide 6/20=0.3, y así sucesivamente con el resto de las clases.
Para la primera se divide 2/20=0.1
65
La Frecuencia acumulada en porcentajes, se obtiene de multiplicar las frecuencias
acumuladas relativas por 100.
66
Para la segunda clase, se multiplica 0.3 por 100 = 30, y así sucesivamente con el resto de
las clases.
En el ejemplo de los ingresos ganados por los estudiantes universitarios, las frecuencias
acumuladas en porcentaje de cada una de las 6 clases son:
Para la primera se multiplica 0.1 por 100 = 10
67
68
La tabla que contiene las frecuencias acumuladas relativas o frecuencias acumuladas en
porcentajes de las clases se les conoce como Distribución de frecuencias acumuladas
relativas o Distribución acumulada en porcentajes.
Las distribuciones de frecuencias acumuladas relativas y distribuciones de frecuencias
acumuladas en porcentajes se representan gráficamente a través de un Polígono de
frecuencias acumuladas relativas y Ojivas porcentuales respectivamente.
69
Un Polígono de frecuencias acumuladas relativas, se construye colocando en el eje X
horizontal los límites de clase y en el eje Y vertical las frecuencias acumuladas relativas de
clase.
70
Para las distribuciones de frecuencias acumuladas relativas del ejemplo de los ingresos
ganados de los estudiantes universitarios, se muestra el polígono de frecuencias
acumuladas relativas “Salarios de estudiantes”
71
72
Las Ojivas porcentuales para construirlas se representa en el eje X horizontal los límites de
clase y en el eje Y vertical se representan las frecuencias acumuladas en porcentajes de
clase.
Para las distribuciones de frecuencias acumuladas en porcentajes del ejemplo de los
ingresos ganados de los estudiantes universitarios, se muestra la ojiva porcentual “Salarios
de estudiantes”
73
A continuación se mencionan las formas características que pueden tener las curvas de
frecuencia:
74
Asimétrica (sesgada) a la derecha (sesgo positivo), la cola de la curva a un lado del máximo
1. Simétrica o en forma de campana, las observaciones equidistantes del máximo central
tienen la misma frecuencia.
75
76
Asimétrica (sesgada) a la izquierda (sesgo negativo), la cola de la curva a un lado del
máximo central es más larga que al otro lado. La cola mayor está a la izquierda.
En forma de J, hay un máximo en un extremo.
77
En forma de J inversa, hay un máximo en un extremo.
78
En forma de U, tiene máximos en ambos extremos.
79
80
Bimodal, tiene dos máximos.
Multimodal, tiene más de dos máximos.
81
83
82
Descargar