2. descripcion de un conjunto de datos

Anuncio
2.
DESCRIPCION DE UN CONJUNTO DE DATOS
2.1 Descripción numérica de un conjunto de datos.
Como se mencionó en el capitulo 1, uno de los aspectos básicos de la
estadística es la recolección de datos. Los datos son mediciones
de alguna
variable de interés, obtenidas de una población particular mediante la selección
de una muestra. Los datos obtenidos de la muestra son de utilidad para obtener
estimaciones de los valores de la población. Una población se define como el
conjunto
de
todos
los
elementos
que
se
somete
a
un
estudio.
Un individuo o unidad estadística es cada uno de los elementos que
componen la población. Una muestra es un conjunto de elementos
extraídos aleatoriamente, cuyo tamaño es menor que la población y
que es estadísticamente
representativa. El muestreo es la técnica o
método con que se extraen los elementos de la población a estudiar.
Un valor es cada uno de los distintos resultados que se pueden obtener
en un estudio estadístico. S i lanzamos una moneda al aire
una ve z
obtenemos un posible valor, cara o cruz. Un dato es cada uno de los
valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara,
cruz, cara, cruz.
Las medidas descriptivas numéricas asociadas a una población
de mediciones se llaman parámetros de la población; las medidas
obtenidas
de
una
muestra
de
una
población
se
le
llaman
estadísticos. (Ver fig. 2.1).
Fig. 2.1.- Población y Espacio muestral
3
Para analizar el comportamiento o distribución de un conjunto de datos
comúnmente se inicia calculando los estadísticos básicos; como son: La Media,
la Mediana y la Moda, como medidas de tendencia central, y la Varianza, la
Desviación estándar y la Amplitud, como medidas de variabilidad, entre otras.
2.1.1 Medidas de tendencia central.
Las medidas de tendencia central mas usadas son:
̅ estadístico para la muestra, y
 La Media Aritmética o Promedio: 𝑿
𝝁 parámetro para la población.
Se obtiene a partir de la suma de todos sus datos dividida entre el número
total de datos, es decir:
𝑋̅ =
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖
=
𝑛
𝑛
(2.1)
𝜇=
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑁
𝑖=1 𝑥𝑖
=
𝑁
𝑁
(2.2)
 La Mediana: 𝑴𝒆,
𝒐
̃
𝑿
Es un conjunto de números ordenados en orden de magnitud ascendente,
es decir, de menor a mayor; el dato que ocupa la posición central corresponde
a la mediana.
4
Ejemplo 2.1. Sea el siguiente conjunto de datos, para el caso 1 y caso
2, tenemos que
 La Moda: 𝑴𝒐

En un conjunto de números es el dato que ocurre con mayor frecuencia,
es decir, es el dato mas frecuente.

La moda puede no existir en la distribución e incluso puede tener hasta
dos o más.

En el caso de una moda la distribución es unimodal, en el caso de dos
modas es bimodal, en el caso de tres modas es trimodal, y así
sucesivamente.
En la figura 2.2 se observan las gráficas que muestran los distintos sesgos
que se pueden presentar en una distribución de datos, como lo son sesgo a la
izquierda o sesgo a la derecha o sin sesgo.
Fig. 2.2 Tipos de sesgos
5
2.1.2 Medidas de Dispersión.
La dispersión o variabilidad de los datos intenta dar una idea de que tan
esparcidos se encuentran los datos de una distribución. Las medidas de
dispersión más comunes son:
 Rango o Amplitud: 𝑅
El Rango R se define, como la diferencia existente entre el dato mayor y
el dato menor de un conjunto de datos, esto es
𝑅 = 𝑑𝑎𝑡𝑜𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜𝑚𝑒𝑛𝑜𝑟
(2.3)
Ejemplo 2.2. Obtener el rango o amplitud de los siguientes datos,
2 4 3 5 4 3 5 7 6 2 4 5 7 4
El dato mayor es 7 y el dato menor es 2, por consiguiente el rango o
amplitud es
𝑅 = 𝑑𝑎𝑡𝑜𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜𝑚𝑒𝑛𝑜𝑟 = 7 − 2 = 5
 La Desviación Estándar:
𝑺 estadístico para la muestra, y
𝝈 parámetro para la población.
La desviación estándar representa las desviaciones de cada uno de los
números obtenidos con respecto a su media aritmética, dividido entre el total de
datos menos 1, se representa de la siguiente manera.
6
(2.4)
∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝑆 = √ 𝑖=1
𝑛−1
(2.5)
∑𝑁 (𝑥𝑖 − µ)2
𝜎 = √ 𝑖=1
𝑁
𝑺𝟐 estadístico para la muestra, y
 La Varianza:
𝝈𝟐 parámetro para la población.
La varianza de una variable aleatoria es una medida de dispersión definida
como la suma de cuadrados de las desviaciones de los datos con respecto a su
media, esto es
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆 =
𝑛−1
(2.6)
2
∑𝑁
𝑖=1(𝑥𝑖 − µ)
𝑁
(2.7)
2
𝜎2 =
 Coeficiente de Variación: 𝐶𝑉
El
Coeficiente
de
variación
(CV),
es
una
medida
que
se
emplea
fundamentalmente para:
1. Comparar la variabilidad entre dos grupos de datos referidos a distintos
sistemas de unidades de medida, por ejemplo, kilos y cms.
2. Comparar la variabilidad entre dos grupos de datos obtenidos entre dos o
más personas distintas.
3. Comparar dos grupos de datos que tienen la misma media aritmética.
7
El coeficiente de variación se denota y se define matemáticamente como
la expresión 2.8,
𝐶𝑉 =
𝑆
100
𝑋̅
(2.8)
 Desviación Media: 𝐷𝑀
La desviación media
se define como la suma de los
absolutos de las desviaciones de los datos con
valores
respecto a la media
dividida entre el total de datos, matemáticamente se expresa como,
𝑛
(2.9)
1
𝐷𝑀 = ∑|𝑥𝑖 − 𝑋̅|
𝑛
𝑖=1
Ejemplo 2.3. Obtener 𝑆, 𝑆 2 , 𝐶𝑉 𝑦 𝐷𝑀 para los datos del ejemplo 2.2,
2 4 3 5 4 3 5 7 6 2 4 5 7 4
El valor de la media es,
𝑋̅ =
2+4+3+5+4+3+5+7+6+2+4+5+7+4
= 4.4
14
El valor de la varianza es,
𝑆2 =
2(2−4.4)2 +4(4−4.4)2 +2(3−4.4)2 +3(5−4.4)2 +(6−4.4)2 +2(7−4.4)2
14−1
= 2.55
El valor de la desviación estándar es,
𝑆 = √2.55 = 1.59
El valor del coeficiente de variación es,
𝐶𝑉 =
1.59
100 = 36.13%
4.4
8
El valor de la desviación media es,
𝐷𝑀 =
2|2 − 4.4| + 4|4 − 4.4| + 2|3 − 4.4| + 3|5 − 4.4| + |6 − 4.4| + 2|7 − 4.4|
= 1.27
14
2.1.3 Regla Empírica.
En muchos de los casos, los datos que surgen en la práctica se ha
observado que; para distribuciones normales, se cumple lo siguiente:
1. 𝑋̅ -S y 𝑋̅ +S (una desviación estándar) están
aproximadamente el 68% del total de los datos.
2. 𝑋̅ ± 2S (dos desviaciones estándar) están
aproximadamente el 95% del total de los datos.
3. 𝑋̅ ± 3S (3 desviaciones estándar) están aproximadamente
el 99.7% del total de los datos.
En la práctica es común usar 3 desviaciones estándar.
La figura 2.3 Muestra geométricamente los porcentajes de la Regla Empírica
Figura 2.3 Representación gráfica de la Regla Empírica
9
Ejemplo 2.4. Aplicar la regla empírica para los datos del ejemplo2.2
2 4 3 5 4 3 5 7 6 2 4 5 7 4
En el ejemplo 2.3 encontramos que
Media
4.4
Una desviación
Dos desviaciones
Tres desviaciones
estándar (S)
estándar
estándar
1.59
3.18
4.77
En la tabla 2.1 se pueden ver los intervalos según la regla empírica. Para
una desviación estándar
tenemos que, el 68% de los datos están entre 2.81 a
5.99. Para dos desviaciones estándar se tiene que el 95% de los datos están
entre 1.22 a 7.58 y si son tres desviaciones estándar el 99.7% de los datos
están entre 0 y 9.17.
Intervalo
𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
% Regla Empírica
𝑋̅ ± 𝑆
2.81
5.99
68%
𝑋̅ ± 2𝑆
1.22
7.58
95%
𝑋̅ ± 3𝑆
0
9.17
99.7%
Tabla 2.1 Intervalos de datos según la regla empírica.
10
2.2 Descripción gráfica de un conjunto de datos.
2.2.1 Histograma y tabla de frecuencias.
Distribuciones o tabla de frecuencia:
La construcción de una tabla de frecuencias requiere solo del conteo del
número de elementos o individuos que están dentro de cierta clase o intervalo
determinado.
El Histograma
El histograma es una gráfica de las frecuencias observadas de un
conjunto de datos (Montgomery D.C., 1991);
es uno de los métodos
gráficos más comúnmente usados para ver la distribución de los datos.
Tiene varias ventajas, una de ellas es que podemos observar la tendencia
central y su dispersión (ver figura 2.4).
.
Figura 2.4 Histograma
11
Figura 2.5 Formas Típicas del Histogramas
12
Dependiendo de las características de los datos, el histograma puede
tomar varias formas típicas, en la figura 2.5 se dan algunos ejemplos de las
formas típicas en que suelen presentarse en un histograma.
Ejemplo 2.5. Realizar el histograma
de los datos
de la tabla 2.2 que
representan las edades de 40 personas.
36 25 37 24 39 20 36 45 31 31 30 25 24 24 30 35 38 40 30 41
39 24 29 23 41 40 33 24 34 40 35 35 36 29 27 29 35 33 32 38
Tabla 2.2 Edades de 40 personas
CONSTRUCCION DEL HISTOGRAMA
Usando los datos de la tabla 2.2, el histograma para las edades de las
personas se obtiene mediante los siguientes pasos:
PASO 1. Calcular el rango de los datos. Rango= Dato mayor – Dato
menor = 45-20=25
PASO 2. Determinar el número de clases. Hay varias maneras de
determinar el número de clases, el cual varía entre 5 y 15 dependiendo
del número de datos, uno de los más comunes es que el número de clases
sea aproximadamente igual a la raíz cuadrada del número de datos. En
las edades de los adultos se tiene que son 40 datos, entonces el numero
de clases será aproximadamente igual a
40  6.32 , como tiene que ser
un numero entero, en este caso puede ser el 6 o el 7, tomaremos el
numero 6.
13
PASO 3. Fijar la longitud de clase. Una forma de asignar la misma
importancia a todas las clases es tomando la longitud de clase (lc) igual
a
𝑙𝑐 =
𝑟𝑎𝑛𝑔𝑜
25
=
= 4.16
𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
6
PASO 4. Construir los intervalos de clase. Los intervalos se obtienen
dividiendo el total de los datos en seis intervalos de igual longitud de
clase, como se muestra en la tabla 2.3.
CLASE
INTERVALO
1
20 -24.16
2
24.16-28.32
3
28.32-32.48
4
32.48-36.64
5
36.64-40.80
6
40.80-45.00
Tabla 2.3 Intervalos de clase para las edades de las personas
PASO 5. Cuantificar la frecuencia de cada clase. Realizar el conteo de
los datos que caen en cada intervalo de clase y especificar su
frecuencia, como se ilustra en la tabla 2.4
CLASE
INTERVALO
FRECUENCIA
1
20 -24.16
7
2
24.16-28.32
3
3
28.32-32.48
9
4
32.48-36.64
10
5
36.64-40.80
8
6
40.80-45.00
3
Tabla 2.4 frecuencias de edades
14
PASO 6. Las frecuencias relativas de cada intervalo de clase. Las frecuencias
relativas se obtienen dividiendo cada frecuencia por el total de datos, como se
puede ver en la tabla 2.5.
CLASE
INTERVALO
FRECUENCIA
FRECUENCIA
RELATIVA
1
20 -24.16
7
0.1750
2
24.16-28.32
3
0.075
3
28.32-32.48
9
0.225
4
32.48-36.64
10
0.25
5
36.64-40.80
8
0.20
6
40.80-45.00
3
0.075
Tabla 2.5 Frecuencias relativas para las edades
PASO 7. Hacer el histograma de frecuencias o de frecuencias relativas.
El histograma consiste en una serie de barras cuya longitud de las bases son los
intervalos de clase y la altura representa la frecuencia o la frecuencia relativa
de los datos contenida en cada clase. En la figura 2.6 se puede ver el histograma
de la frecuencia y en la figura 2.7 esta el histograma de la frecuencia relativa.
Histograma
Histograma
10
porcentaje=frec. relativa*100
25
frecuencia
8
6
4
2
0
20
15
10
5
0
20
25
30
35
EDADES
40
45
20
25
30
35
EDADES
40
Figura 2.6 Histograma de frecuencias
Figura 2.7Histograma de frecuencias
para edades
relativas para edades
45
15
2.2.2 Diagrama de caja.
Un diagrama de Caja o Caja y Bigotes es un gráfico, basado en cuartiles,
mediante el cual se visualiza un conjunto de datos. Está compuesto por un
rectángulo, la "caja", y los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y
máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores
atípicos y la simetría de la distribución. Primero es necesario encontrar la
mediana para luego encontrar los 2 cuartiles restantes.
Ejemplo 2.6. Realizar el diagrama de Caja y-Bigotes de los datos de las
edades de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Ordenar los datos de menor a mayor para calcular los estadísticos.
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de cuartiles:
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media
aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el
valor de la variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10; como N es un numero par, la mediana es el valor
promedio del decimo dato mas el dato que le sigue,
16
𝑋̃= Q2 = (33 + 34)/ 2 =33,5
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribución. En este caso, como 3N / 4 = 15, resulta que
Q2= (39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES; en la figura 2.8 se muestra la gráfica de
Caja- Bigotes de las edades de las 20 personas.
Figura 2.8 Caja-Bigotes
Nótese que en la figura 2.8, el bigote de la parte izquierda representa al 25%
de edades ( Xmín, Q1). La primera parte de la caja a (Q1, Q2) es el otro 25%.
La segunda parte de la caja a (Q2, Q3) es otro 25% y finalmente el bigote de
la parte derecha viene dado por (Q3, Xmáx) y que representa el ultimo 25% de
los datos.
Interpretaciones de la caja de bigotes
Dependiendo de la cantidad de datos y de la dispersión de los datos, el diagrama
de caja y bigotes puede presentar algunas variantes en su interpretación, a
continuación se presentan algunos casos
1- Si la parte izquierda de la caja es mayor que la de la derecha, ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la población
está más dispersa que entre el 50% y el 75%.
17
2- El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha;
por ello el 25% de los más jóvenes están más concentrados que el 25%
de los mayores.
3- El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población
está comprendido en 14,5 años.
2.3 Descripción de datos categóricos.
2.3.1 Diagrama de barras y gráfica circular.
El grafico de barras y la grafica circular son muy útiles para cuando los
datos son del tipo cualitativo o categórico. Los Datos Cualitativos o Categóricos,
son aquellos que expresan atributos o categorías. Para facilitar el análisis
estadístico de este tipo de datos frecuentemente se codifican a números, esta
codificación da lugar a dos subtipos de datos categóricos:
Datos Nominales: Son aquellos datos categóricos que pueden ser
codificados numéricamente pero donde hay una relación arbitraria entre los
números asignados y el valor de la variable.
Datos Ordinales: Son aquellos que al ser codificados numéricamente
deben guardar una correspondencia entre los números asignados y el verdadero
valor de la variable.
Las graficas de barras son de utilidad para describir una variable cuyos
valores son categorías o para clasificar
variables. En la figura 2.9
o ver la relación entre dos o más
esta la grafica de barras que muestra las
temperaturas en grados Fahrenheit
diarias durante una semana.
18
Fig. 2.9 Gráfica de Barras
Gráfica circular que utiliza radios para dividir un círculo en sectores de
manera que las áreas de los sectores son proporcionales a las cantidades
representadas.
Fig. 2.10 Gráfica circular
Ejemplo 2.7. En una fábrica de ropa se registran los defectos encontrados en prendas de vestir cuando se hace la inspección final. Los registros
de las últimas dos semanas se muestran a continuación.
T
C
H
T
H
O
M
H
T
H
C
H
O
T
H
O
M
H
C
H
O
C
C
C
H
M
M
O
H
H
T
O
Donde: C= COSTURA,
M= MONTAJE,
T=TELA,
O=CORTE
y
T
H=HILO.
19
En la Tabla 2.6 se puede ver la tabla de frecuencias para los defectos de
ropa encontrados. En las figuras 2.11; y 2.12 se muestran, la gráfica de barras
y la gráfica circular respectivamente del ejemplo 2.7.
Clase
1
2
3
4
5
Valor
C
H
M
O
T
Frecuencia
6
11
4
6
6
Frecuencia
Relativa
0.1818
0.3333
0.1212
0.1818
0.1818
Frecuencia
Acumulada
6
17
21
27
33
Frecuencia
Rel. acum.
0.1818
0.5152
0.6364
0.8182
1.0000
Tabla 2.6 Tabla de frecuencias para defectos en prendas de vestir
Diagrama de Barras de DEFECTO
Diagrama de Sectores de DEFECTO
12
18.18%
frecuencia
10
18.18%
DEFECTO
COSTURA
HILO
MONTAJE
CORTE
TELA
8
6
18.18%
4
33.33%
2
0
12.12%
COSTURA HILO MONTAJE CORTE TELA
Figura 2.11 Grafica de barras para defectos en
Figura 2.12 Grafica Circular para defectos en
prendas de vestir
prendas de vestir
2.3.2 Diagrama de Pareto.
{[}
El Diagrama de Pareto
es una forma especial de gráfico de barras
{\}
{]}
{^}
{_}
{`}
verticales que separa los problemas muy importantes de los menos importantes,
estableciendo un orden de prioridades.
Fue creado sobre la base del principio de Pareto, según el cual, el 80% de los
problemas son provenientes de apenas el 20% de las causas (ley 80-20, pocos
vitales, muchos triviales). Vilfredo Pareto fue un economista italiano que, en el
20
siglo XIX, presentó una fórmula que mostraba la desigualdad en la distribución
de los salarios.
El Diagrama de Pareto se usa para, identificar y dar prioridad a las causas o
defectos más importantes en cualquier proceso, evaluando el comportamiento
de un problema, comparando los datos entre el "antes" y el "después".
Ejemplo 2.8. Utilizando los datos del ejemplo 2.7 El de la fábrica de ropa;
realizar el diagrama de Pareto.
T
C
H
T
H
O
M
H
T
H
C
H
O
T
H
O
M
H
C
H
O
C
C
C
H
M
M
O
H
H
T
O
Donde: C= COSTURA,
M= MONTAJE,
T=TELA,
O=CORTE
y
T
H=HILO.
¿COMO CONSTRUIRLO?
Se trazan dos ejes verticales de la misma longitud perpendicular en cada
esquina de un eje horizontal. En el eje vertical izquierdo, se traza una escala
desde el cero hasta el número de defectos en listados. En el eje vertical derecho
haga una escala de 0 a 100%. El 100% corresponderá al total de defectos
enlistados. Divida el eje horizontal en intervalos iguales, de acuerdo con la
cantidad de categorías o lista de defectos. Construya y denomine las barras,
colocando las categorías en orden decreciente de frecuencia, de izquierda a
derecha. Trace una línea punteada que conecte el origen con la esquina superior
derecha de la primera barra, se suma la altura de la primera barra, la altura de
la segunda barra. Marque con un punto el valor obtenido en la prolongación del
lado derecho de la segunda barra. Sume a esta nueva altura la altura de la
tercera barra. Marque con un punto el valor obtenido en la prolongación del lado
derecho de la tercera barra. Hacer esto, sucesivamente, hasta la última barra
.Enlace todos los puntos marcados con una línea, dando continuidad a la línea
punteada iniciada en el origen, para formar la curva de Pareto. El último punto
representa el 100 % de los eventos. Complete el gráfico con informaciones tales
como: nombre del gráfico, período, responsable, etc.
21
Nótese en el diagrama de Pareto de la figura 2.13, que el defecto mas
importante en la ropa es el derivado del hilo.
Gráfica de Pareto para DEFECTO
40
100.00
87.88
frecuencia
30
69.70
20
51.52
33.33
10
0
Hilo
Tela
Corte
Costura
Montaje
Figura 2.13 Diagrama de Pareto para defectos en ropa
Ejercicios de la unidad 2.
Para cada ejercicio del 1 al 8 calcular:
•
La Media, Mediana y Moda
•
Identificar si existe sesgo y de que tipo.
•
Calcular la Amplitud, Varianza, Desviación Estándar y Coeficiente de
Variación.
•
Calcule los porcentajes de datos según la Regla Empírica.
•
Elabore la tabla de Frecuencias, Histograma, Barras y/o Circular.
•
Elabore el Diagrama de Caja.
•
Escribe una breve conclusión o interpretación.
22
Problema 1.- En un estudio de dos semanas sobre la productividad de 100
trabajadores, se obtuvieron los siguientes datos sobre el número total de piezas
fabricadas por trabajador.
65
39
54
79
32
43
53
41
40
47
68
35
68
22
35
50
35
43
76
58
46
51
61
65
34
76
69
57
33
40
45
85
84
63
53
64
54
51
52
70
55
55
62
44
28
21
36
34
82
56
60
47
73
53
88
42
56
45
37
48
65
49
52
50
80
41
70
68
38
77
35
55
45
56
51
67
74
74
75
62
36
57
45
82
67
60
61
78
60
26
72
62
73
59
59
74
52
50
61
48
Problema 2.- Se registró el tiempo (en meses) entre el inicio de una
enfermedad en particular y su repetición en 50 pacientes.
2.1
19.2
14.1
3.7
9.0
4.1
8.7
1.6
8.2
0.2
8.2
1.3
26.7
9.9
1.2
18.0
0.4
6.1
9.6
1.6
0.3
18.0
32.3
3.3
2.4
5.6
3.9
1.4
7.4
7.4
11.4
2.7
4.3
2.4
23.1
6.6
0.2
14.7
5.8
8.3
4.4
6.9
1.0
12.6
2.0
18.4
24.0
13.5
16.7
3.5
23
Problema 3.-Los datos siguientes son las velocidades del viento promedio (en
millas por hora) que se producen en 45 ciudades seleccionadas de la Republica
Mexicana.
8.9
7.9
6.2
9.4
12.5
6.2
9.7
8.9
7.9
9.3
9.5
8.2
10.2
7.8
7.0
8.9
10.7
11.9
10.5
7.7
9.1
9.2
8.9
11.5
8.9
12.9
10.4
11.0
9.1
10.8
9.6
8.8
8.3
10.4
9.4
35.3
7.1
10.4
11.1
10.5
11.3
8.7
9.1
8.6
7.9
Problema 4.- Considere la siguiente muestra (La resistencia de 50 lotes de
algodón, libras necesarias para romper una madeja).
74
100
90
99
97
89
108
94
87
79
101
90
105
83
91
96
81
98
81
98
105
110
91
99
101
94
106
98
93
82
90
86
96
88
97
103
85
106
92
115
97
101
102
96
100
76
96
81
101
93
24
Problema 5.-.En la elaboración de envases de plástico primero se elabora la
preforma, para la cual se tienen varios criterios de calidad, uno de ellos es el
peso de esta. Para cierto envase se tiene que el peso debe estar en 28 ±0.5 𝑔. A
continuación se muestran los últimos 112 datos.
27.72
28.39
28.21
28.19
28.02
27.93
27.89
27.88
28.06
27.91
27.97
27.95
27.96
27.94
28.04
28.05
27.81
27.74
27.95
27.91
27.93
28.07
28.13
27.98
27.87
27.87
27.82
28.23
27.9
27.91
28.16
27.94
27.86
27.84
27.7
27.98
28.02
28
27.99
28.13
28.26
28.1
27.94
28.07
27.84
27.9
27.87
27.76
27.95
27.94
27.81
27.76
27.96
27.84
27.85
27.93
28.22
27.96
27.88
28.08
28.04
28.19
27.89
28.08
28.09
28.02
27.85
28.27
27.75
27.98
27.75
27.82
28.13
27.88
28.11
28.05
28.14
28.11
28.08
28.16
28.04
28.05
27.75
27.89
27.94
28.19
28.1
27.78
27.63
27.93
27.74
28.1
28.14
27.91
27.84
28.21
27.85
27.84
28.12
28.01
27.97
27.88
28
28.1
28.16
28.16
28.01
28.13
27.97
27.9
27.87
27.94
Problema 6.-Una característica clave en la calidad de las pinturas es su
densidad, y un componente que influye en ésta es la cantidad de arenas que se
utilizan en su elaboración. La cantidad de arena en la formulación de un lote se
controla por medio del número de costales, que según el proveedor contiene 20
kg. Sin embargo, continuamente se tienen problemas en la densidad de la
pintura que es necesario corregir con el retrabajo y reprocesos adicionales. En
este contexto se decide investigar cuanta arena contiene en realidad los
costales. Para ello, se toma una muestra de 30 costales de cada lote o pedido
(500). Los pesos obtenidos en las muestras de los últimos tres lotes se muestran
en la siguiente tabla. Las especificaciones iniciales que se establecen para el
peso de los costales de arena son de 20 ±0.8 𝑘𝑔.
25
Lote
Peso en costales
Peso en costales
Lote
Peso en costales
18.6
19.1 19.6
18.6
19.6
18.9
20.1
19.7
19.9
19.2
18.6 19.4
19.5
19.7
19.3
20
19.6
20.4
19.5
19.4 19.8
20
19
18.8
20.2
20.1
20.5
19.2
18.7 19.1
19.9
19.4
18.4
20.2
19.7
20.3
19.1
17.8
20.7
19.7
19.7
19.6
18.4
20.1
19.2
19.7
20
20
18.8
18.8
19.6
19
21
20.4
20.4
20
18.6 19.3
18.5
19.4
19.6
20.8
19.8
20.6
19.3
19.6 19.1
18.9
19.7
20.6
20
19.1
20
18.4
20.3
19.7
19.7
19.8
20.2
18.9
19.4
19
1
Lote
20
21
20
19.8 20.4
19
19
19.1
2
3
Problema 7.- Una característica importante en la calidad de leche de vaca es la
concentración de grasa. En una industria en particular se fijo el 3% como el
estándar mínimo que debe cumplir el producto que se recibe directamente de
los establos lecheros. Por medio de muestreos y evaluaciones en cierta época
del año se obtuvieron los siguientes 90 datos sobre concentración de grasa en
cierta región. Obtenga resultados e interprete.
2.7
3.4
2.9
3.3
3.3
2.9
3.1
2.8
3
3.4
3.1
3.1
3.2
2.8
3.3
3.2
2.7
2.9
2.2
3
3.2
3.1
2.7
3.3
3.2
3.4
3.8
3.2
3.5
3.2
2.9
3.6
2.9
3.5
3
3.1
3.4
3.1
4
3.4
3
3
3.3
2.9
2.8
2.9
3
3.6
3.3
3.1
3.3
3.1
3.4
3.3
3.4
3.5
2.5
3.2
3.3
3.6
3.3
2.6
3.5
2.9
3.3
2.7
3
3.8
3.6
3.1
3.1
3.5
3.4
3.3
3.2
3.2
3.5
3.1
3.5
3.7
3.4
2.7
2.9
3.5
3.3
3
3.9
3.4
3
3.2
26
Problema 8.- En la elaboración de una bebida se desea garantizar que el
porcentaje de 𝐶𝑂2 (gas) éste entre 2.5 y 3. En el monitoreo del proceso se
obtuvieron los siguientes 115 datos. Obtenga resultados e interprete.
2.61
2.56
2.63
2.56
2.53
2.64
2.61
2.6
2.48
2.69
2.51
2.64
2.68
2.59
2.63
2.63
2.67
2.56
2.61
2.61
2.57
2.63
2.59
2.67
2.52
2.57
2.7
2.57
2.49
2.59
2.61
2.56
2.67
2.66
2.55
2.65
2.73
2.62
2.56
2.64
2.52
2.64
2.52
2.57
2.52
2.6
2.65
2.66
2.64
2.61
2.62
2.56
2.67
2.61
2.6
2.58
2.69
2.66
2.6
2.6
2.6
2.64
2.65
2.58
2.67
2.66
2.57
2.61
2.59
2.5
2.67
2.71
2.67
2.56
2.58
2.6
2.57
2.56
2.49
2.66
2.64
2.61
2.64
2.59
2.53
2.62
2.52
2.72
2.57
2.53
2.67
2.49
2.58
2.53
2.61
2.65
2.51
2.57
2.57
2.58
2.55
2.64
2.55
2.55
2.52
2.6
2.65
2.65
2.53
Problema 9.-Diseñar el Diagrama de Pareto
MARZO
Tipo de queja
Limpieza de la sala de espera
Limpieza Baños
Atencion del personal
Calidad de los alimentos
Existencia de medicamentos
Limpieza en camas
TOTAL
Semana 1
ll
llll ll
llll llll llll
ll
lll
llll
33
Semana 2
lll
llll llll l
llll llll
l
llll
llll
34
Semana 3
lll
llll
llll llll llll
l
lll
llll
31
TOTAL
8
23
40
4
10
13
98
Problema 10.- En una empresa se está buscando reducir las quejas de clientes.
Se tienen los registros del último semestre, clasificados por área de trabajo y turno.
27
Área
A
B
C
D
Turno1
Turno2
Quejas:
Ooo
oooooooooo
o Retrasos
x Pedidos
xxx
xxxxxx
+ Facturas
/ Otros
++
/
Oooo
ooooooooo
a)
Realice un análisis de Pareto completo. Empezando
por un Pareto para problemas, y luego a partir del
xx
Xxxxxxx
+++ /
++
Ooooo
Oooooooo
x
Xxxxx
+
/
Oooo
ooooooooooooo
xx
xxxxx
++ //
++++
mismo, enfocar Paretos para causas.
b)
¿Cuál es el problema más importante?
c)
¿Cuáles son las principales pistas para encontrar la
causa del problema principal?
Problema 11.- En una empresa procesadora de carnes frías se tienen los datos
de una semana de los defectos en la inspección final de la salchicha se muestran
a continuación.
Máquina
Turno
empacadora
A
B
C
Defecto y número de paquetes defectuosos
Falta de vacío
Mancha verde
Mancha amarilla
I
4300
700
700
II
6300
650
650
I
3500
700
400
II
6600
500
420
I
8500
800
324
II
9120
655
345
Realice un análisis de Pareto completo y encuentre las principales pistas para
resolver los problemas en las salchichas.
28
Descargar