CONTROL DE CALIDAD UNIDAD IV TEORÍA DE DIMENSIÓN ESTADÍSTICA 1 (4.1) DISTRIBUCIÓN NORMAL 2 4.1.1- ASPECTOS GENERALES: • Al graficarse los diferentes valores obtenidos de una variable X se obtiene una distribución normal simétrica (el eje se sitúa en la media) y que además es unimodal porque tiene forma similar a una campana. • En la distribución normal coinciden en un mismo punto la media (µ), mediana y moda. La amplitud de la misma lo determina la desviación estándar (σ). 3 • Es asintótica al eje de las abscisas, es decir, sus colas nunca llegan a tocar el eje. • Toma valores entre -∞ y +∞. • Si se quiere encontrar la probabilidad de que una variable tome valores entre 2 números cualquiera, llámese por ejemplo a y b, lo que se tiene que hacer es calcular el área bajo la curva entre a y b (ver figura siguiente) 4 • El valor de la variable aleatoria Z indica la proporción de la totalidad de la población que tiene esa propiedad, así por ejemplo: Si el 40% tiene Z ≤ -0.253 el 60% tiene Z > -0.253 • Para calcular una probabilidad se utiliza la tabla para la distribución normal; proporciona el área total bajo la curva desde -∞ hasta el valor de la variable aleatoria Z: P (Z ≤ z) Dónde: Z = Variable aleatoria z = probabilidad acumulada hasta este valor Cuando en la distribución normal se tienen los valores: µ=0 y σ=1, estamos en lo que se conoce como: “DISTRIBUCIÓN NORMAL TIPIFICADA O ESTÁNDAR” 5 El Valor de una observación viene dado por: Z= 𝑋−𝜇 𝜎 6 Para que una distribución tienda a ser normal deben cumplirse los siguientes requisitos: 1. Hay un valor que es el más frecuente, que tiende a estar en la parte central. 2. Los datos que más se alejan del valor central, hacia la derecha o hacia la izquierda, tienden a ser menos frecuentes. 3. El promedio y la desviación estándar no dependen uno del otro y la desviación estándar es menor que el promedio. PROPIEDADES: 1. Simetría: P ( Z < -a) = 1 – P (Z < a) 2. P ( µ-σ < x < µ+σ) = 0.6827 (68.27%) 3. P ( µ-2σ < x < µ+2σ) = 0.9545 (95.45%) 4. P ( µ-3σ < x < µ+3σ) = 0.9973 (99.73%) 5. P (x=a) = 0, para cualquier número a. 7 4.1.2- TEOREMA DEL LÍMITE CENTRAL: “Sea X1, X2,…Xn, una muestra aleatoria de cualquier población; y sea 𝑋 la media muestral, entonces, independientemente de cómo sea la distribución de la población de donde se extrajo la muestra, la distribución de 𝑋 (promedios muéstrales) se aproximará (tenderá) a la normal conforme ‘n’ crece”. 8 • A medida que aumenta el tamaño de la muestra, la tendencia mejorará. • Si la distribución no es radicalmente distinta a la normal, entonces la aproximación empieza a ser buena para tamaños de muestra mayores o iguales a n ≥ 4. • Para describir la distribución de los promedios muéstrales, se puede usar la distribución normal estándar tipificada con la siguiente modificación: 𝑍= 𝑥−𝜇 𝜎 𝑛 • El teorema del Límite Central es una de las razones por las que funciona la gráfica de Control X , porque no es necesario ocuparse de si la distribución de las X no es normal (si no es radicalmente distinta), por supuesto, siempre que el tamaño de la muestra sea mayor o igual a 4. 9 X = Tabla de distribución normal 10 B) Si se quiere tener 12.1% del voltaje de suministro menor que 115V, ¿cómo se debe ajustar el voltaje medio? La dispersión (σ) es = 1.20V 11 4.1.3- VERIFICACIÓN DE NORMALIDAD GRÁFICA DE PROBABILIDAD PARA VERIFICAR NORMALIDAD (PAPEL LOGARÍTMICO) La gráfica de probabilidad es un procedimiento que permite determinar en forma visual si los datos muéstrales se ajustan a una distribución específica. Para construir una gráfica de probabilidad se procede de la siguiente forma: 1. Se ordenan los datos de menor a mayor (Xj) 2. Se calcula la frecuencia acumulada con la siguiente fórmula (distribución empírica): 𝑗 − 0.5 𝑛 J = número individual de cada muestra ordenada según el paso 1. 3. Se grafican los datos en una hoja de probabilidad. Si la distribución propuesta describe de manera adecuada los datos, los puntos en la gráfica tenderán a ubicarse a lo largo de una línea recta; pero si los puntos se desvían de manera significativa de una línea recta, eso será evidencia de que los datos no siguen tal distribución. 12 4. Si no se cuenta con papel de probabilidades será necesario determinar los puntajes normales estandarizados: 𝑗 − 0.5 −1 𝑍𝑗 = 𝐹 𝑛 NOTA: Se hayan ubicando para cada valor obtenido de la frecuencia acumulada (paso 2), el valor Z correspondiente en la tabla para la distribución normal. Luego graficamos los datos colocando en el eje X los valores muéstrales (Xj) y en el eje Y, los valores Zj. 5. Trazamos una línea recta que pase lo más cerca posible de los puntos; fijamos la atención en los puntos que están en la parte media de la gráfica en relación a los que se encuentran en los extremos, si los mismos siguen la línea recta, es una evidencia de que los datos muéstrales siguen una distribución normal. 13 EJEMPLO: El peso que deben contener ciertas bolsas de detergente es de 750 gr. con una tolerancia de ± 5 𝑔𝑟. Se desea verificar si es razonable suponer que la distribución del peso sigue una distribución normal. Para ello, se toma una muestra aleatoria de 25 productos, se pesan y se obtienen los siguientes datos: 750,0 749,3 752,5 748,9 749,9 748,6 750,2 748,4 747,8 749,3 749,6 749,0 747,7 748,3 750,5 750,6 750,0 750,4 752,0 750,2 751,4 750,9 752,4 751,7 750,6 14 Número j 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Datos Ordenados X(j) 747,7 747,8 748,3 748,4 748,6 748,9 749,0 749,3 749,3 749,6 749,9 750,0 750,0 750,2 750,2 750,4 750,5 750,6 750,6 750,9 751,4 751,7 752,0 752,4 752,5 Frecuencia Acumulada (j-0.5)/n Puntajes Normales Estandarizados Z(j)=F^(-1) ((j-0.5)/n) 0,02 0,06 0,10 0,14 0,18 0,22 0,26 0,30 0,34 0,38 0,42 0,46 0,50 0,54 0,58 0,62 0,66 0,70 0,74 0,78 0,82 0,86 0,90 0,94 0,98 -2,05 -1,55 -1,28 -1,08 -0,92 -0,77 -0,64 -0,52 -0,41 -0,31 -0,20 -0,10 0,00 0,10 0,20 0,31 0,41 0,52 0,64 0,77 0,92 1,08 1,28 1,55 2,05 15 PRUEBA DE NORMALIDAD PARA EL EJEMPLO DE LAS BOLSAS DE DETERGENTES 16 DATOS NO NORMALES EN LA GRÁFICA DE PROBABILIDAD NORMAL 17