2. DESCRIPCION DE UN CONJUNTO DE DATOS 2.1 Descripción numérica de un conjunto de datos. Como se mencionó en el capitulo 1, uno de los aspectos básicos de la estadística es la recolección de datos. Los datos son mediciones de alguna variable de interés, obtenidas de una población particular mediante la selección de una muestra. Los datos obtenidos de la muestra son de utilidad para obtener estimaciones de los valores de la población. Una población se define como el conjunto de todos los elementos que se somete a un estudio. Un individuo o unidad estadística es cada uno de los elementos que componen la población. Una muestra es un conjunto de elementos extraídos aleatoriamente, cuyo tamaño es menor que la población y que es estadísticamente representativa. El muestreo es la técnica o método con que se extraen los elementos de la población a estudiar. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. S i lanzamos una moneda al aire una ve z obtenemos un posible valor, cara o cruz. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Las medidas descriptivas numéricas asociadas a una población de mediciones se llaman parámetros de la población; las medidas obtenidas de una muestra de una población se le llaman estadísticos. (Ver fig. 2.1). Fig. 2.1.- Población y Espacio muestral 3 Para analizar el comportamiento o distribución de un conjunto de datos comúnmente se inicia calculando los estadísticos básicos; como son: La Media, la Mediana y la Moda, como medidas de tendencia central, y la Varianza, la Desviación estándar y la Amplitud, como medidas de variabilidad, entre otras. 2.1.1 Medidas de tendencia central. Las medidas de tendencia central mas usadas son: ̅ estadístico para la muestra, y La Media Aritmética o Promedio: 𝑿 𝝁 parámetro para la población. Se obtiene a partir de la suma de todos sus datos dividida entre el número total de datos, es decir: 𝑋̅ = 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖 = 𝑛 𝑛 (2.1) 𝜇= 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑁 𝑖=1 𝑥𝑖 = 𝑁 𝑁 (2.2) La Mediana: 𝑴𝒆, 𝒐 ̃ 𝑿 Es un conjunto de números ordenados en orden de magnitud ascendente, es decir, de menor a mayor; el dato que ocupa la posición central corresponde a la mediana. 4 Ejemplo 2.1. Sea el siguiente conjunto de datos, para el caso 1 y caso 2, tenemos que La Moda: 𝑴𝒐 En un conjunto de números es el dato que ocurre con mayor frecuencia, es decir, es el dato mas frecuente. La moda puede no existir en la distribución e incluso puede tener hasta dos o más. En el caso de una moda la distribución es unimodal, en el caso de dos modas es bimodal, en el caso de tres modas es trimodal, y así sucesivamente. En la figura 2.2 se observan las gráficas que muestran los distintos sesgos que se pueden presentar en una distribución de datos, como lo son sesgo a la izquierda o sesgo a la derecha o sin sesgo. Fig. 2.2 Tipos de sesgos 5 2.1.2 Medidas de Dispersión. La dispersión o variabilidad de los datos intenta dar una idea de que tan esparcidos se encuentran los datos de una distribución. Las medidas de dispersión más comunes son: Rango o Amplitud: 𝑅 El Rango R se define, como la diferencia existente entre el dato mayor y el dato menor de un conjunto de datos, esto es 𝑅 = 𝑑𝑎𝑡𝑜𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜𝑚𝑒𝑛𝑜𝑟 (2.3) Ejemplo 2.2. Obtener el rango o amplitud de los siguientes datos, 2 4 3 5 4 3 5 7 6 2 4 5 7 4 El dato mayor es 7 y el dato menor es 2, por consiguiente el rango o amplitud es 𝑅 = 𝑑𝑎𝑡𝑜𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜𝑚𝑒𝑛𝑜𝑟 = 7 − 2 = 5 La Desviación Estándar: 𝑺 estadístico para la muestra, y 𝝈 parámetro para la población. La desviación estándar representa las desviaciones de cada uno de los números obtenidos con respecto a su media aritmética, dividido entre el total de datos menos 1, se representa de la siguiente manera. 6 (2.4) ∑𝑛 (𝑥𝑖 − 𝑥̅ )2 𝑆 = √ 𝑖=1 𝑛−1 (2.5) ∑𝑁 (𝑥𝑖 − µ)2 𝜎 = √ 𝑖=1 𝑁 𝑺𝟐 estadístico para la muestra, y La Varianza: 𝝈𝟐 parámetro para la población. La varianza de una variable aleatoria es una medida de dispersión definida como la suma de cuadrados de las desviaciones de los datos con respecto a su media, esto es ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑆 = 𝑛−1 (2.6) 2 ∑𝑁 𝑖=1(𝑥𝑖 − µ) 𝑁 (2.7) 2 𝜎2 = Coeficiente de Variación: 𝐶𝑉 El Coeficiente de variación (CV), es una medida que se emplea fundamentalmente para: 1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida, por ejemplo, kilos y cms. 2. Comparar la variabilidad entre dos grupos de datos obtenidos entre dos o más personas distintas. 3. Comparar dos grupos de datos que tienen la misma media aritmética. 7 El coeficiente de variación se denota y se define matemáticamente como la expresión 2.8, 𝐶𝑉 = 𝑆 100 𝑋̅ (2.8) Desviación Media: 𝐷𝑀 La desviación media se define como la suma de los absolutos de las desviaciones de los datos con valores respecto a la media dividida entre el total de datos, matemáticamente se expresa como, 𝑛 (2.9) 1 𝐷𝑀 = ∑|𝑥𝑖 − 𝑋̅| 𝑛 𝑖=1 Ejemplo 2.3. Obtener 𝑆, 𝑆 2 , 𝐶𝑉 𝑦 𝐷𝑀 para los datos del ejemplo 2.2, 2 4 3 5 4 3 5 7 6 2 4 5 7 4 El valor de la media es, 𝑋̅ = 2+4+3+5+4+3+5+7+6+2+4+5+7+4 = 4.4 14 El valor de la varianza es, 𝑆2 = 2(2−4.4)2 +4(4−4.4)2 +2(3−4.4)2 +3(5−4.4)2 +(6−4.4)2 +2(7−4.4)2 14−1 = 2.55 El valor de la desviación estándar es, 𝑆 = √2.55 = 1.59 El valor del coeficiente de variación es, 𝐶𝑉 = 1.59 100 = 36.13% 4.4 8 El valor de la desviación media es, 𝐷𝑀 = 2|2 − 4.4| + 4|4 − 4.4| + 2|3 − 4.4| + 3|5 − 4.4| + |6 − 4.4| + 2|7 − 4.4| = 1.27 14 2.1.3 Regla Empírica. En muchos de los casos, los datos que surgen en la práctica se ha observado que; para distribuciones normales, se cumple lo siguiente: 1. 𝑋̅ -S y 𝑋̅ +S (una desviación estándar) están aproximadamente el 68% del total de los datos. 2. 𝑋̅ ± 2S (dos desviaciones estándar) están aproximadamente el 95% del total de los datos. 3. 𝑋̅ ± 3S (3 desviaciones estándar) están aproximadamente el 99.7% del total de los datos. En la práctica es común usar 3 desviaciones estándar. La figura 2.3 Muestra geométricamente los porcentajes de la Regla Empírica Figura 2.3 Representación gráfica de la Regla Empírica 9 Ejemplo 2.4. Aplicar la regla empírica para los datos del ejemplo2.2 2 4 3 5 4 3 5 7 6 2 4 5 7 4 En el ejemplo 2.3 encontramos que Media 4.4 Una desviación Dos desviaciones Tres desviaciones estándar (S) estándar estándar 1.59 3.18 4.77 En la tabla 2.1 se pueden ver los intervalos según la regla empírica. Para una desviación estándar tenemos que, el 68% de los datos están entre 2.81 a 5.99. Para dos desviaciones estándar se tiene que el 95% de los datos están entre 1.22 a 7.58 y si son tres desviaciones estándar el 99.7% de los datos están entre 0 y 9.17. Intervalo 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 % Regla Empírica 𝑋̅ ± 𝑆 2.81 5.99 68% 𝑋̅ ± 2𝑆 1.22 7.58 95% 𝑋̅ ± 3𝑆 0 9.17 99.7% Tabla 2.1 Intervalos de datos según la regla empírica. 10 2.2 Descripción gráfica de un conjunto de datos. 2.2.1 Histograma y tabla de frecuencias. Distribuciones o tabla de frecuencia: La construcción de una tabla de frecuencias requiere solo del conteo del número de elementos o individuos que están dentro de cierta clase o intervalo determinado. El Histograma El histograma es una gráfica de las frecuencias observadas de un conjunto de datos (Montgomery D.C., 1991); es uno de los métodos gráficos más comúnmente usados para ver la distribución de los datos. Tiene varias ventajas, una de ellas es que podemos observar la tendencia central y su dispersión (ver figura 2.4). . Figura 2.4 Histograma 11 Figura 2.5 Formas Típicas del Histogramas 12 Dependiendo de las características de los datos, el histograma puede tomar varias formas típicas, en la figura 2.5 se dan algunos ejemplos de las formas típicas en que suelen presentarse en un histograma. Ejemplo 2.5. Realizar el histograma de los datos de la tabla 2.2 que representan las edades de 40 personas. 36 25 37 24 39 20 36 45 31 31 30 25 24 24 30 35 38 40 30 41 39 24 29 23 41 40 33 24 34 40 35 35 36 29 27 29 35 33 32 38 Tabla 2.2 Edades de 40 personas CONSTRUCCION DEL HISTOGRAMA Usando los datos de la tabla 2.2, el histograma para las edades de las personas se obtiene mediante los siguientes pasos: PASO 1. Calcular el rango de los datos. Rango= Dato mayor – Dato menor = 45-20=25 PASO 2. Determinar el número de clases. Hay varias maneras de determinar el número de clases, el cual varía entre 5 y 15 dependiendo del número de datos, uno de los más comunes es que el número de clases sea aproximadamente igual a la raíz cuadrada del número de datos. En las edades de los adultos se tiene que son 40 datos, entonces el numero de clases será aproximadamente igual a 40 6.32 , como tiene que ser un numero entero, en este caso puede ser el 6 o el 7, tomaremos el numero 6. 13 PASO 3. Fijar la longitud de clase. Una forma de asignar la misma importancia a todas las clases es tomando la longitud de clase (lc) igual a 𝑙𝑐 = 𝑟𝑎𝑛𝑔𝑜 25 = = 4.16 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 6 PASO 4. Construir los intervalos de clase. Los intervalos se obtienen dividiendo el total de los datos en seis intervalos de igual longitud de clase, como se muestra en la tabla 2.3. CLASE INTERVALO 1 20 -24.16 2 24.16-28.32 3 28.32-32.48 4 32.48-36.64 5 36.64-40.80 6 40.80-45.00 Tabla 2.3 Intervalos de clase para las edades de las personas PASO 5. Cuantificar la frecuencia de cada clase. Realizar el conteo de los datos que caen en cada intervalo de clase y especificar su frecuencia, como se ilustra en la tabla 2.4 CLASE INTERVALO FRECUENCIA 1 20 -24.16 7 2 24.16-28.32 3 3 28.32-32.48 9 4 32.48-36.64 10 5 36.64-40.80 8 6 40.80-45.00 3 Tabla 2.4 frecuencias de edades 14 PASO 6. Las frecuencias relativas de cada intervalo de clase. Las frecuencias relativas se obtienen dividiendo cada frecuencia por el total de datos, como se puede ver en la tabla 2.5. CLASE INTERVALO FRECUENCIA FRECUENCIA RELATIVA 1 20 -24.16 7 0.1750 2 24.16-28.32 3 0.075 3 28.32-32.48 9 0.225 4 32.48-36.64 10 0.25 5 36.64-40.80 8 0.20 6 40.80-45.00 3 0.075 Tabla 2.5 Frecuencias relativas para las edades PASO 7. Hacer el histograma de frecuencias o de frecuencias relativas. El histograma consiste en una serie de barras cuya longitud de las bases son los intervalos de clase y la altura representa la frecuencia o la frecuencia relativa de los datos contenida en cada clase. En la figura 2.6 se puede ver el histograma de la frecuencia y en la figura 2.7 esta el histograma de la frecuencia relativa. Histograma Histograma 10 porcentaje=frec. relativa*100 25 frecuencia 8 6 4 2 0 20 15 10 5 0 20 25 30 35 EDADES 40 45 20 25 30 35 EDADES 40 Figura 2.6 Histograma de frecuencias Figura 2.7Histograma de frecuencias para edades relativas para edades 45 15 2.2.2 Diagrama de caja. Un diagrama de Caja o Caja y Bigotes es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes. Ejemplo 2.6. Realizar el diagrama de Caja y-Bigotes de los datos de las edades de 20 personas. 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40 Ordenar los datos de menor a mayor para calcular los estadísticos. 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de cuartiles: Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5 Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; como N es un numero par, la mediana es el valor promedio del decimo dato mas el dato que le sigue, 16 𝑋̃= Q2 = (33 + 34)/ 2 =33,5 Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En este caso, como 3N / 4 = 15, resulta que Q2= (39 + 39) / 2 = 39 DIBUJAR LA CAJA Y LOS BIGOTES; en la figura 2.8 se muestra la gráfica de Caja- Bigotes de las edades de las 20 personas. Figura 2.8 Caja-Bigotes Nótese que en la figura 2.8, el bigote de la parte izquierda representa al 25% de edades ( Xmín, Q1). La primera parte de la caja a (Q1, Q2) es el otro 25%. La segunda parte de la caja a (Q2, Q3) es otro 25% y finalmente el bigote de la parte derecha viene dado por (Q3, Xmáx) y que representa el ultimo 25% de los datos. Interpretaciones de la caja de bigotes Dependiendo de la cantidad de datos y de la dispersión de los datos, el diagrama de caja y bigotes puede presentar algunas variantes en su interpretación, a continuación se presentan algunos casos 1- Si la parte izquierda de la caja es mayor que la de la derecha, ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%. 17 2- El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores. 3- El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años. 2.3 Descripción de datos categóricos. 2.3.1 Diagrama de barras y gráfica circular. El grafico de barras y la grafica circular son muy útiles para cuando los datos son del tipo cualitativo o categórico. Los Datos Cualitativos o Categóricos, son aquellos que expresan atributos o categorías. Para facilitar el análisis estadístico de este tipo de datos frecuentemente se codifican a números, esta codificación da lugar a dos subtipos de datos categóricos: Datos Nominales: Son aquellos datos categóricos que pueden ser codificados numéricamente pero donde hay una relación arbitraria entre los números asignados y el valor de la variable. Datos Ordinales: Son aquellos que al ser codificados numéricamente deben guardar una correspondencia entre los números asignados y el verdadero valor de la variable. Las graficas de barras son de utilidad para describir una variable cuyos valores son categorías o para clasificar variables. En la figura 2.9 o ver la relación entre dos o más esta la grafica de barras que muestra las temperaturas en grados Fahrenheit diarias durante una semana. 18 Fig. 2.9 Gráfica de Barras Gráfica circular que utiliza radios para dividir un círculo en sectores de manera que las áreas de los sectores son proporcionales a las cantidades representadas. Fig. 2.10 Gráfica circular Ejemplo 2.7. En una fábrica de ropa se registran los defectos encontrados en prendas de vestir cuando se hace la inspección final. Los registros de las últimas dos semanas se muestran a continuación. T C H T H O M H T H C H O T H O M H C H O C C C H M M O H H T O Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y T H=HILO. 19 En la Tabla 2.6 se puede ver la tabla de frecuencias para los defectos de ropa encontrados. En las figuras 2.11; y 2.12 se muestran, la gráfica de barras y la gráfica circular respectivamente del ejemplo 2.7. Clase 1 2 3 4 5 Valor C H M O T Frecuencia 6 11 4 6 6 Frecuencia Relativa 0.1818 0.3333 0.1212 0.1818 0.1818 Frecuencia Acumulada 6 17 21 27 33 Frecuencia Rel. acum. 0.1818 0.5152 0.6364 0.8182 1.0000 Tabla 2.6 Tabla de frecuencias para defectos en prendas de vestir Diagrama de Barras de DEFECTO Diagrama de Sectores de DEFECTO 12 18.18% frecuencia 10 18.18% DEFECTO COSTURA HILO MONTAJE CORTE TELA 8 6 18.18% 4 33.33% 2 0 12.12% COSTURA HILO MONTAJE CORTE TELA Figura 2.11 Grafica de barras para defectos en Figura 2.12 Grafica Circular para defectos en prendas de vestir prendas de vestir 2.3.2 Diagrama de Pareto. {[} El Diagrama de Pareto es una forma especial de gráfico de barras {\} {]} {^} {_} {`} verticales que separa los problemas muy importantes de los menos importantes, estableciendo un orden de prioridades. Fue creado sobre la base del principio de Pareto, según el cual, el 80% de los problemas son provenientes de apenas el 20% de las causas (ley 80-20, pocos vitales, muchos triviales). Vilfredo Pareto fue un economista italiano que, en el 20 siglo XIX, presentó una fórmula que mostraba la desigualdad en la distribución de los salarios. El Diagrama de Pareto se usa para, identificar y dar prioridad a las causas o defectos más importantes en cualquier proceso, evaluando el comportamiento de un problema, comparando los datos entre el "antes" y el "después". Ejemplo 2.8. Utilizando los datos del ejemplo 2.7 El de la fábrica de ropa; realizar el diagrama de Pareto. T C H T H O M H T H C H O T H O M H C H O C C C H M M O H H T O Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y T H=HILO. ¿COMO CONSTRUIRLO? Se trazan dos ejes verticales de la misma longitud perpendicular en cada esquina de un eje horizontal. En el eje vertical izquierdo, se traza una escala desde el cero hasta el número de defectos en listados. En el eje vertical derecho haga una escala de 0 a 100%. El 100% corresponderá al total de defectos enlistados. Divida el eje horizontal en intervalos iguales, de acuerdo con la cantidad de categorías o lista de defectos. Construya y denomine las barras, colocando las categorías en orden decreciente de frecuencia, de izquierda a derecha. Trace una línea punteada que conecte el origen con la esquina superior derecha de la primera barra, se suma la altura de la primera barra, la altura de la segunda barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la segunda barra. Sume a esta nueva altura la altura de la tercera barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la tercera barra. Hacer esto, sucesivamente, hasta la última barra .Enlace todos los puntos marcados con una línea, dando continuidad a la línea punteada iniciada en el origen, para formar la curva de Pareto. El último punto representa el 100 % de los eventos. Complete el gráfico con informaciones tales como: nombre del gráfico, período, responsable, etc. 21 Nótese en el diagrama de Pareto de la figura 2.13, que el defecto mas importante en la ropa es el derivado del hilo. Gráfica de Pareto para DEFECTO 40 100.00 87.88 frecuencia 30 69.70 20 51.52 33.33 10 0 Hilo Tela Corte Costura Montaje Figura 2.13 Diagrama de Pareto para defectos en ropa Ejercicios de la unidad 2. Para cada ejercicio del 1 al 8 calcular: • La Media, Mediana y Moda • Identificar si existe sesgo y de que tipo. • Calcular la Amplitud, Varianza, Desviación Estándar y Coeficiente de Variación. • Calcule los porcentajes de datos según la Regla Empírica. • Elabore la tabla de Frecuencias, Histograma, Barras y/o Circular. • Elabore el Diagrama de Caja. • Escribe una breve conclusión o interpretación. 22 Problema 1.- En un estudio de dos semanas sobre la productividad de 100 trabajadores, se obtuvieron los siguientes datos sobre el número total de piezas fabricadas por trabajador. 65 39 54 79 32 43 53 41 40 47 68 35 68 22 35 50 35 43 76 58 46 51 61 65 34 76 69 57 33 40 45 85 84 63 53 64 54 51 52 70 55 55 62 44 28 21 36 34 82 56 60 47 73 53 88 42 56 45 37 48 65 49 52 50 80 41 70 68 38 77 35 55 45 56 51 67 74 74 75 62 36 57 45 82 67 60 61 78 60 26 72 62 73 59 59 74 52 50 61 48 Problema 2.- Se registró el tiempo (en meses) entre el inicio de una enfermedad en particular y su repetición en 50 pacientes. 2.1 19.2 14.1 3.7 9.0 4.1 8.7 1.6 8.2 0.2 8.2 1.3 26.7 9.9 1.2 18.0 0.4 6.1 9.6 1.6 0.3 18.0 32.3 3.3 2.4 5.6 3.9 1.4 7.4 7.4 11.4 2.7 4.3 2.4 23.1 6.6 0.2 14.7 5.8 8.3 4.4 6.9 1.0 12.6 2.0 18.4 24.0 13.5 16.7 3.5 23 Problema 3.-Los datos siguientes son las velocidades del viento promedio (en millas por hora) que se producen en 45 ciudades seleccionadas de la Republica Mexicana. 8.9 7.9 6.2 9.4 12.5 6.2 9.7 8.9 7.9 9.3 9.5 8.2 10.2 7.8 7.0 8.9 10.7 11.9 10.5 7.7 9.1 9.2 8.9 11.5 8.9 12.9 10.4 11.0 9.1 10.8 9.6 8.8 8.3 10.4 9.4 35.3 7.1 10.4 11.1 10.5 11.3 8.7 9.1 8.6 7.9 Problema 4.- Considere la siguiente muestra (La resistencia de 50 lotes de algodón, libras necesarias para romper una madeja). 74 100 90 99 97 89 108 94 87 79 101 90 105 83 91 96 81 98 81 98 105 110 91 99 101 94 106 98 93 82 90 86 96 88 97 103 85 106 92 115 97 101 102 96 100 76 96 81 101 93 24 Problema 5.-.En la elaboración de envases de plástico primero se elabora la preforma, para la cual se tienen varios criterios de calidad, uno de ellos es el peso de esta. Para cierto envase se tiene que el peso debe estar en 28 ±0.5 𝑔. A continuación se muestran los últimos 112 datos. 27.72 28.39 28.21 28.19 28.02 27.93 27.89 27.88 28.06 27.91 27.97 27.95 27.96 27.94 28.04 28.05 27.81 27.74 27.95 27.91 27.93 28.07 28.13 27.98 27.87 27.87 27.82 28.23 27.9 27.91 28.16 27.94 27.86 27.84 27.7 27.98 28.02 28 27.99 28.13 28.26 28.1 27.94 28.07 27.84 27.9 27.87 27.76 27.95 27.94 27.81 27.76 27.96 27.84 27.85 27.93 28.22 27.96 27.88 28.08 28.04 28.19 27.89 28.08 28.09 28.02 27.85 28.27 27.75 27.98 27.75 27.82 28.13 27.88 28.11 28.05 28.14 28.11 28.08 28.16 28.04 28.05 27.75 27.89 27.94 28.19 28.1 27.78 27.63 27.93 27.74 28.1 28.14 27.91 27.84 28.21 27.85 27.84 28.12 28.01 27.97 27.88 28 28.1 28.16 28.16 28.01 28.13 27.97 27.9 27.87 27.94 Problema 6.-Una característica clave en la calidad de las pinturas es su densidad, y un componente que influye en ésta es la cantidad de arenas que se utilizan en su elaboración. La cantidad de arena en la formulación de un lote se controla por medio del número de costales, que según el proveedor contiene 20 kg. Sin embargo, continuamente se tienen problemas en la densidad de la pintura que es necesario corregir con el retrabajo y reprocesos adicionales. En este contexto se decide investigar cuanta arena contiene en realidad los costales. Para ello, se toma una muestra de 30 costales de cada lote o pedido (500). Los pesos obtenidos en las muestras de los últimos tres lotes se muestran en la siguiente tabla. Las especificaciones iniciales que se establecen para el peso de los costales de arena son de 20 ±0.8 𝑘𝑔. 25 Lote Peso en costales Peso en costales Lote Peso en costales 18.6 19.1 19.6 18.6 19.6 18.9 20.1 19.7 19.9 19.2 18.6 19.4 19.5 19.7 19.3 20 19.6 20.4 19.5 19.4 19.8 20 19 18.8 20.2 20.1 20.5 19.2 18.7 19.1 19.9 19.4 18.4 20.2 19.7 20.3 19.1 17.8 20.7 19.7 19.7 19.6 18.4 20.1 19.2 19.7 20 20 18.8 18.8 19.6 19 21 20.4 20.4 20 18.6 19.3 18.5 19.4 19.6 20.8 19.8 20.6 19.3 19.6 19.1 18.9 19.7 20.6 20 19.1 20 18.4 20.3 19.7 19.7 19.8 20.2 18.9 19.4 19 1 Lote 20 21 20 19.8 20.4 19 19 19.1 2 3 Problema 7.- Una característica importante en la calidad de leche de vaca es la concentración de grasa. En una industria en particular se fijo el 3% como el estándar mínimo que debe cumplir el producto que se recibe directamente de los establos lecheros. Por medio de muestreos y evaluaciones en cierta época del año se obtuvieron los siguientes 90 datos sobre concentración de grasa en cierta región. Obtenga resultados e interprete. 2.7 3.4 2.9 3.3 3.3 2.9 3.1 2.8 3 3.4 3.1 3.1 3.2 2.8 3.3 3.2 2.7 2.9 2.2 3 3.2 3.1 2.7 3.3 3.2 3.4 3.8 3.2 3.5 3.2 2.9 3.6 2.9 3.5 3 3.1 3.4 3.1 4 3.4 3 3 3.3 2.9 2.8 2.9 3 3.6 3.3 3.1 3.3 3.1 3.4 3.3 3.4 3.5 2.5 3.2 3.3 3.6 3.3 2.6 3.5 2.9 3.3 2.7 3 3.8 3.6 3.1 3.1 3.5 3.4 3.3 3.2 3.2 3.5 3.1 3.5 3.7 3.4 2.7 2.9 3.5 3.3 3 3.9 3.4 3 3.2 26 Problema 8.- En la elaboración de una bebida se desea garantizar que el porcentaje de 𝐶𝑂2 (gas) éste entre 2.5 y 3. En el monitoreo del proceso se obtuvieron los siguientes 115 datos. Obtenga resultados e interprete. 2.61 2.56 2.63 2.56 2.53 2.64 2.61 2.6 2.48 2.69 2.51 2.64 2.68 2.59 2.63 2.63 2.67 2.56 2.61 2.61 2.57 2.63 2.59 2.67 2.52 2.57 2.7 2.57 2.49 2.59 2.61 2.56 2.67 2.66 2.55 2.65 2.73 2.62 2.56 2.64 2.52 2.64 2.52 2.57 2.52 2.6 2.65 2.66 2.64 2.61 2.62 2.56 2.67 2.61 2.6 2.58 2.69 2.66 2.6 2.6 2.6 2.64 2.65 2.58 2.67 2.66 2.57 2.61 2.59 2.5 2.67 2.71 2.67 2.56 2.58 2.6 2.57 2.56 2.49 2.66 2.64 2.61 2.64 2.59 2.53 2.62 2.52 2.72 2.57 2.53 2.67 2.49 2.58 2.53 2.61 2.65 2.51 2.57 2.57 2.58 2.55 2.64 2.55 2.55 2.52 2.6 2.65 2.65 2.53 Problema 9.-Diseñar el Diagrama de Pareto MARZO Tipo de queja Limpieza de la sala de espera Limpieza Baños Atencion del personal Calidad de los alimentos Existencia de medicamentos Limpieza en camas TOTAL Semana 1 ll llll ll llll llll llll ll lll llll 33 Semana 2 lll llll llll l llll llll l llll llll 34 Semana 3 lll llll llll llll llll l lll llll 31 TOTAL 8 23 40 4 10 13 98 Problema 10.- En una empresa se está buscando reducir las quejas de clientes. Se tienen los registros del último semestre, clasificados por área de trabajo y turno. 27 Área A B C D Turno1 Turno2 Quejas: Ooo oooooooooo o Retrasos x Pedidos xxx xxxxxx + Facturas / Otros ++ / Oooo ooooooooo a) Realice un análisis de Pareto completo. Empezando por un Pareto para problemas, y luego a partir del xx Xxxxxxx +++ / ++ Ooooo Oooooooo x Xxxxx + / Oooo ooooooooooooo xx xxxxx ++ // ++++ mismo, enfocar Paretos para causas. b) ¿Cuál es el problema más importante? c) ¿Cuáles son las principales pistas para encontrar la causa del problema principal? Problema 11.- En una empresa procesadora de carnes frías se tienen los datos de una semana de los defectos en la inspección final de la salchicha se muestran a continuación. Máquina Turno empacadora A B C Defecto y número de paquetes defectuosos Falta de vacío Mancha verde Mancha amarilla I 4300 700 700 II 6300 650 650 I 3500 700 400 II 6600 500 420 I 8500 800 324 II 9120 655 345 Realice un análisis de Pareto completo y encuentre las principales pistas para resolver los problemas en las salchichas. 28