Diseño Estadístico y Herramientas para la Calidad Estimación Expositor: Dr. Juan José Flores Romero [email protected] http://lsc.fie.umich.mx/~juan M. en Calidad Total y Competitividad Estimación Estimación Inferencia Estadística z z Estimación z z z Puntual Intervalos Pruebas de Hipótesis Inferencia Estadística es el procedimiento para inferir propiedades de una población basados en los resultados obtenidos de una muestra de la misma. Estimadores z z z Estimadores: puntuales e intervalos Estimado vs. Estimador Un estimador (fórmula) nos indica como calcular un estimado de un parámetro. Propiedades de los Estimadores z No Sesgado. El valor medio del estadístico para todas las posibles muestras aleatorias de un tamaño dado es igual al parámetro que estima. E (θˆ) =θ ∑ (x − x) 2 ⇒ E(s 2 ) ≠ σ 2 n ∑ ( xi − x ) 2 ⇒ E ( s 2 ) = σ 2 n −1 i Propiedades de los Estimadores z z z Consistente. Si el tamaño de la muestra incrementa, el valor del estimado tiende al valor del parámetro. Eficiente. Un estimador es mas eficiente que otro si la varianza del primero es menor que la del segundo. Suficiente. Usa toda la información de la muestra. Si tenemos un estimador suficiente, no necesitamos otra medida. Estimadores de Intervalo z z z Un estimador de intervalo produce un intervalo, del cual podemos decir, con cierto nivel de convicción, que contiene al parámetro estimado Estamos 100% seguros que el intervalo (-∞, +∞) contiene el parámetro de interés. Estimadores de Intervalo = Intervalos de Confianza (con límites de confianza) Intervalo de Confianza para la Media, dada la Varianza z z z z z Ej. x ± 2σ Si la distribución es normal, dentro de 2 varianzas, cae el 95% de la población. Coeficiente de confiabilidad = 2 Coeficiente de confianza = 95 Coeficiente de confianza = 1-α, donde α es el área bajo la curva normal, fuera del intervalo de confianza. Intervalo de Confianza para la Media z z Intervalo de Confianza para la Media σ x = Error Estándar o Desviación Estándar del Estimador x Intervalo Estimado = (factor de confianza) x (error estándar) x ± z1−α / 2σ x Interpretación del Intervalo de Confianza para la Media z Interpretación Probabilística z z En muestreos repetidos de una población normalmente distribuida, 100(1-α)% de todos los intervalos de la forma x ± z1−α / 2σ x que pueden ser construidos de muestras aleatorias de tamaño n, incluirán la media de la población μ. Interpretación Práctica z Estamos 100(1-α)% seguros de que el intervalo x ± z1−α / 2σ x calculado de muestras aleatorias de tamaño n, contienen la media de la población μ. Interpretación del Intervalo de Confianza para la Media Cálculo del Intervalo de Confianza para la Media z z z z Es trivial construir un intervalo de confianza para la distribución normal estándar. De las tablas, buscar la z que produzca el coeficiente de confianza dado. P(Z<=z)=1-α/2 El mapeo de x a z es conocido. La pregunta es: Dada una media y varianza conocidas, a que x corresponde z? z= Cálculo del Intervalo de Confianza para la Media x−μ σ ⇒ x = z1−α / 2σ x + x Ejemplo z El supervisor de control de calidad de una fábrica de alambres selecciona periódicamente una muestra de especímenes para probar su resistencia a la ruptura. La experiencia le dice resistencia está distribuida normalmente, con una desviación estándar de 200 lb. Una muestra aleatoria de 16 especímenes da una media de 6200lb. Se desea obtener un intervalo de confianza de 95% para la media de la población. Estimaciones en Poblaciones no Normales Ejemplo z z z z z El estimador puntual de μ es ⎯x = 6200 lb. Para un coeficiente de confianza de 0.95, z=1.96. El error estándar es σ/√n = 200/√16 = 50 IC = 6200 ±1.96(50) = [6102, 6298] z Si no conocemos la varianza, no podemos usar la distribución normal para determinar un valor preciso de z. Cuando usamos el estimador σ ≈ s la x x variable resultante es t= z De acuerdo al teorema del límite central, podemos usar el mismo procedimiento para determinar intervalos de confianza para poblaciones con distribuciones no normales, mientras que el tamaño de la muestra sea grande (n>30). El 95% de los intervalos de confianza que sean construidos de esta manera, contendrán a μ. Intervalo de Confianza para la Media, Varianza Desconocida z z x − μx x − μx = sx s/ n A esta distribución se le conoce como distribución “t de student” Cálculo del Intervalo de Confianza z El procedimiento es igual, substituyendo la distribución normal por la t de student. x ± t1−α / 2 s n Ejemplo z En un esfuerzo por establecer un tiempo estándar para realizar cierta tarea, un ingeniero de producción selecciona 16 empleados experimentados para realizarla. La media es de 13 minutos, con una desviación estándar de 3 minutos. El ingeniero desea construir un intervalo de confianza del 95% para el tiempo medio necesario para realizar tal tarea Uso de Tablas de la Distribución t Ejemplo z z z z z El estimador puntual de μ es ⎯x = 13 min. El error estándar es s/√n = 3/ √ 16 = 0.75 Para un coeficiente de confianza de 0.95, (área a la izquierda del límite derecho = 0.975) y n-1=15 grados de libertad, tenemos t0.975=2.1315 IC = 13 ±2.1315(0.75) = [11.4, 14.6] El 95% de los intervalos de confianza que sean construidos de esta manera, contendrán a μ. Uso de Tablas de la Distribución t Parejas de Observaciones z Medir sujetos antes y después de z z z z z Ejemplo z Algún tratamiento Mejora de condiciones de trabajo Capacitación La diferencia puede ser estimada mediante la distribución t de student Si aplica el teorema del límite central, podemos usar la distribución normal z En una muestra aleatoria de 10 compañías electrónicas se determinó cuanto gastan en capacitación anualmente, en este año y hace una década. Firma A B C D E F G H I J Ahora 12 14 8 12 8 10 8 9 10 10 Hace 10 años 10 11 8 7 9 6 10 9 7 9 d 2 3 0 5 -1 4 -2 0 3 1 Construir un intervalo de confianza del 95% para la media de la diferencia d. Estudiar Estimaciones para Ejemplo z z z z z ⎯d = 1.5 sd = 2.3 s⎯d =2.3/√10 = 0.73 El intervalo de confianza del 95% para μd. 1.5 ± 2.2622(0.73) = [-0.2, 3.2] z z z z z z Diferencia entre dos medias, varianzas conocidas Diferencia entre dos medias, varianzas desconocidas Proporciones Diferencia entre dos proporciones Varianza (distribución chi cuadrada) Razón de Varianzas (distribución F) Determinación del Tamaño de la Muestra para Estimar μ z ¿Qué tan grande debe ser la muestra? Determinación del Tamaño de la Muestra para Estimar μ z Puntos Clave: z z z z Se desea estimar, con un intervalo de confianza, la media de la población. Grande → desperdicio de recursos Chica → resultados sin valor estadístico z Precisión Confianza necesaria en el intervalo z Mitad del intervalo (precisión) z Despejando n n= Determinación del Tamaño de la Muestra para Estimar μ z 2σ 2 d2 Intervalo estrecho → d pequeño z depende del nivel de confianza σ2 depende de la variabilidad de lo población n= z z z σ x±z d=z σ n n z 2σ 2 d2 Ejemplo z Una firma publicitaria quiere estimar la cantidad promedio de dinero que cierto tipo de comercio gastó en publicidad durante el año pasado. La experiencia indica que la varianza es aproximadamente de $1’800,000. ¿Qué tan grande debe ser la muestra tomada para que estimar dentro de $500 de la verdadera media con un intervalo de confianza de 95%? n= 1.96 2 (1'800,000) = 27.65 ≈ 28 500 2 Estudiar z Determinar el tamaño de la muestra para estimar proporciones.