Histograma

Anuncio
11
Histograma
¿Qué es?
Es un concepto fundamental en estadística que es muy útil para visualizar
una gran cantidad de datos.
Está formado por un conjunto de barras que representa la frecuencia con
la que se obtienen ciertos valores o datos de algún proceso, así mismo el
histograma muestra la forma en que se distribuyen los datos y las
variaciones y discontinuidades producidas entre estos.
Muestran gráficamente la capacidad de un proceso y, si se desea, la
relación que guarda el proceso con las especificaciones y las normas, tal
como se puede apreciar en el siguiente gráfico:
HISTOGRAMA DEL DIAMETRO DE UNA VARILLA
20
Tolerancia
Capacidad
3. Determinar el ancho del intervalo, dividiendo el rango de los datos
entre el número de intervalos. El rango es la diferencia entre el
máximo y el mínimo valor de los datos.
4. Construir los intervalos a partir del mínimo valor, al cual se le va
sumando el valor del ancho del intervalo definido anteriormente
hasta completar el número de intervalos requeridos. No es necesario
que el límite superior del último intervalo coincida con el máximo
valor de los datos.
5. Luego se tabulan los datos dentro de cada uno de los intervalos
definidos, es decir se cuenta cuantos datos caen en cada uno de los
intervalos (frecuencia del intervalo). Si un dato cae en el límite de un
intervalo, se considera en el intervalo siguiente.
6. Graficar el diagrama asignando a cada intervalo una barra del
tamaño de su respectiva frecuencia.
Ejemplo 1 (Variables Discretas)
Se quiere realizar un estudio del número de llamadas por hora que
se atienden en una central telefónica, se piensa que en promedio son
110 con una variación de +/-4 llamadas.
15
Frecuencia
1.
La variable que se elige para el estudio es el número de
llamadas.
Se hace la recolección de datos de una muestra de 50 horas, y
se obtiene lo siguiente: 10 datos con 106 llamadas, 8 datos con
107 llamadas, 8 datos con 105 llamadas, 8 datos con 103
llamadas, 6 datos con 108 llamadas, 4 datos con 109 llamadas,
3 datos con 104 llamadas, 2 datos con 110 llamadas y 1 dato
con 102 llamadas.
Ordenando y tabulando se obtiene el siguiente cuadro:
2.
10
5
3.
0
0.00 13.06 13.09 13.12 13.15 13.18 13.21 13.24 13.27 13.30 13.33 13.36
Número de llamadas
por hora
Diámetro (mm)
La construcción de histogramas se puede hacer con datos discretos y con
datos continuos, este último requiere de un poco de más trabajo, pues
requiere agrupar los datos.
Las variables discretas son aquellas que no admiten valores intermedios,
por ejemplo: Número de reclamos, pueden ser 1, 2, 3, etc; pero no 3.4,
generalmente son el resultado del conteo.
Las variables continuas, son aquellas que son susceptibles a ser divididas
indefinidamente, por ejemplo el peso de un objeto puede ser 11Kg, 11.33
ó 11.3398 Kg, dependiendo de la precisión del instrumento de medida.
102
103
104
105
106
107
108
109
110
Total de datos
¿Cuándo se utiliza?
El saber que un conjunto de números tiene cierto tipo de distribución es
básico para poder resolver los problemas de control de calidad.
Los histogramas se utilizan cuando se quiere conocer el tipo de
distribución de datos de un proceso, el cual puede dar la pauta de cómo
resolver determinado problema.
4.
Frecuencia
1
8
3
8
10
8
6
4
2
50
Se grafica el histograma con las frecuencias:
12
¿Cómo se utiliza?
HISTOGRAMA DE LLAMADAS A UNA CENTRAL TELEFÓNICA
10
Frecuencia
Variables Discretas:
1.
2.
3.
4.
Identificar la variable que se quiere medir.
Hacer la recolección de los datos observados.
Hacer un ordenamiento (ascendente o descendente).
Tabular la frecuencia con la que aparece cada uno de los valores, es
decir colocar el número de veces que aparece cada valor.
5. Graficar asignando a cada valor su respectiva frecuencia.
6
4
2
0
Variables Continuas:
102
En el caso de las variables continuas los datos se agrupan en intervalos y
se determina la frecuencia para cada intervalo:
5.
1. Similar a los pasos del 1 al 3 de las variables discretas.
2. Determinar el número de intervalos a usar, usualmente es un valor
cercano a la raíz cuadrada del número total de datos.
8
103
104
105
106
107
108
Número de llamadas/ hora
109
110
Interpretando el histograma podemos ver que existen datos que
están fuera del rango, con mayor frecuencia en 103 llamadas.
La distribución es irregular para los datos menores a 106
llamadas.
11
Intervalos
Ejemplo 2 (Variables Continuas)
58.5
62.8
67.1
71.4
75.7
80.0
84.3
88.6
92.9
97.2
101.5
Se quiere hacer un estudio del peso de los trabajadores de una
empresa:
1. La variable elegida para el estudio es el peso en kg de los
trabajadores. Se trata de una variable continua.
2. Se toma una muestra de 110 trabajadores y se mide el peso de
cada uno, tal como se presenta a continuación, previamente
ordenadas ascendentemente:
60.9
66.3
70.8
72.7
74.3
75.3
76.5
78.6
81.0
85.1
88.9
61.3
67.5
70.8
72.8
74.5
75.3
76.5
78.9
81.1
85.6
89.0
61.5
67.9
71.1
72.8
74.5
75.4
76.8
79.0
81.2
85.8
89.1
62.6
68.3
71.1
72.9
74.6
75.4
76.8
79.0
81.3
85.9
91.1
64.9
68.4
71.3
73.2
74.6
75.5
76.9
79.6
82.2
86.3
91.9
65.4
69.3
71.4
73.2
74.8
75.7
77.0
80.3
82.4
86.4
95.3
65.5
65.7
65.9
69.4
69.5
69.8
71.6
72.1
72.5
73.4
73.6
73.7
74.9
75.1
75.1
75.7
76.1
76.2
77.3
77.8
77.9
80.8
80.8
80.9
83.4
83.6
83.9
86.7
87.3
88.6
95.6 100.2 105.5
3. Una vez que se tienen los datos ordenados se determina el número
de intervalos:
N º int evalos  110 = 10.48  11
4. Determinando el ancho de intervalo:
Rango
# de int ervalos
=
105 .5  58.5
 4.27  4.3
11
5. Construyendo los intervalos y tabulando los datos se tiene:
5
7
15
30
19
14
10
6
2
1
1
HISTOGRAMA DE PESOS DE LOS TRABAJAODRES
35
_
x
30
25
20
15
10
5
0
58.5
Ancho 
62.8
67.1
71.4
75.7
80.0
84.3
88.6
92.9
97.2
101.5
105.8
6. A continuación se grafica el histograma:
Frecuencia
58.5
66.0
70.4
72.5
74.0
75.2
76.3
78.5
80.9
84.9
88.7
-
Frecuencia
62.8
67.1
71.4
75.7
80.0
84.3
88.6
92.9
97.2
101.5
Intervalos
7. Se puede observar que el peso promedio de los trabajadores se
encuentra entre 71.4 y 75.7 Kg.
Descargar