Ingenierı́a Industrial Métodos estadı́sticos de la Ingenierı́a Examen Junio 2006. ENUNCIADO Y SOLUCIONES Duración: 2:30 horas. Indicar nombre, apellidos y DNI en cada uno de los folios. Problema 1 Un determinado prefabricado de hormigón puede presentar dos tipos de defectos de manera independiente, que lo hacen inutilizable. El primero de ellos es no cumplir con la norma en lo referente a las dimensiones del objeto y otro no cumplir la norma en relación a la resistencia del mismo, pudiendo presentarse ambos defectos en una misma pieza. Se sabe que el 10% de los prefabricados tienen unas dimensiones incorrectas, mientras que sólo el 5% no cumple las exigencias en cuanto a resistencia. A partir de esta información, determinar: I.1 El porcentaje de prefabricados que son correctos, es decir, no presentan defecto alguno. Empezamos por introducir los sucesos convenientes: sea D=”El prefabricado cumple con las especificaciones de dimensión” y R=”El prefabricado cumple con las especificaciones de resistencia”. Sabemos que P(D) = 0.9 mientras que P(R) = 0.95. Nos piden P(R ∩ D). Por ser los dos sucesos independientes, esta probabilidad se calcula como P(R ∩ D) = P(R)P(D) = 0.95 × 0.9 = 0.855 . I.2 El porcentaje de prefabricados que tendrán que ser eliminados por presentar algún tipo de defecto. Nos piden ahora P(Rc ∪ Dc ) = 1 − P(R ∩ D) = 1 − 0.855 = 0.145. I.3 Determinar, dentro del conjunto de las piezas defectuosas, el porcentaje de piezas que cumplen la norma de resistencia. Queremos calcular P(R|(Dc ∪ Rc )). Por la definición de la probabilidad condicionada, tenemos P(R|(Dc ∪ Rc )) = = = = P(R ∩ (Dc ∪ Rc )) P(Dc ∪ Rc ) P((R ∩ Dc ) ∪ (R ∩ Rc )) P(Dc ∪ Rc ) P((R ∩ Dc )) P(Dc ∪ Rc ) 0.95 × 0.1 ' 0.655. 0.145 Deducimos que, entre las piezas defectuosas, el 65.5% cumple con las especificaciones de resistencia (y por lo tanto sólo incumplen las especificaciones de dimensión). 1 Problema 2 Una empresa dedicada a la fabricación de material de construcción está interesada en estudiar la conductividad térmica de un tipo de ladrillos. Para ello, seleccionó una muestra de 36 unidades de manera aleatoria, obteniendo para esa muestra, una conductividad media de 0.343 y una desviación tı́pica de 0.01. Suponiendo que los datos proceden de una distribución Normal, responder a las siguientes cuestiones: II.1 Construir, detalladamente, un intervalo de confianza al 95% para la conductividad media de dicho tipo de ladrillos. Estamos en el caso en que conocemos la media y la desviación tı́pica muestral. La construcción detallada del intervalo de confianza en este supuesto utiliza la t de Student y se puede encontrar en el apartado c) de la sección VI.3.3 de los apuntes. Obtenemos √ µ = X̄ ± tn−1,1−α/2 S/ n, tenemos x̄ = 0.343, S = 0.01, necesitamos t35,0.975 , que buscamos en la tabla (no aparece 35 grados de libertad pero lo aproximamos por t30,0.95 = 2.045 por ejemplo) y deducimos √ µ = 0.343 ± 0.01 × 2.045/ 36 = 0.343 ± 0.0034 II.2 ¿Qué interpretación tiene un intervalo de confianza al 95%? ver el apartado VI.3.2.2 de los apuntes. II.3 Expresar el intervalo de confianza obtenido en el apartado II.1 en la forma (valor estimado ± Error) ¿Son suficientes 36 ladrillos para cometer un error inferior a 0.01 en la estimación de la conductividad media?. Ya lo he hecho en el apartado II.1. Como el error es menor de 0.01, puedo afirmar que son suficientes 36 ladrillos para conseguir el error deseado. II.4 Un competidor afirma que la conductividad térmica de esos ladrillos es superior a 0.340. Plantear un contraste que nos permitirá contestar a la afirmación realizada anteriormente y tomar una decisión en base a los datos muestrales al 95% de confianza. Planteamos las hipótesis H0 : µ = 0.340, H1 : µ > 0.340, Nos fijamos α = 0.05, suponiendo que trabajamos con 95% de confianza. El estadı́stico de prueba es X̄ − µ0 √ ∼ tn−1 si H0 es cierto. T0 = S/ n La región de rechazo es unilateral : R = {t : t > tn−1,1−α }, la frontera siendo t35,0.95 ' 1.69. (este último valor es aproximado, deducido de la tabla de los cuantiles t de Student). Para la muestra escogida, el valor del estadı́stico de prueba es t0 = X̄ − µ0 0.343 − 0.34 √ = √ = 1.8. S/ n 0.01/ 36 Este valor pertenece a la región de rechazo por lo que deducimos que al 95% de confianza rechazamos H0 : afirmamos que la conductivad media es superior a 0.34. II.5 Determinar una cota inferior y una cota superior para el p-valor del contraste anterior y discutir la conclusión que se obtiene para los niveles de confianza 90%, 95% y 99%. Notar en particular que deducimos en particular, puesto que hemos rechazado H0 al 95% de confianza, que el p-valor es menor que 0.05. En realidad, al igual caracterizamos el p-valor como α0 = P(t > 1.8), 2 donde t es una distribución t de Student con 35 grados de libertad. Podemos utilizar una calculadora estadı́stica para calcular α0 de manera precisa. Si sólo tenemos una tabla a mano, podemos ir probando con distintos niveles de confianza para obtener cuotas razonablemente precisas de α0 . Por ejemplo, de la tabla de los cuantiles de la distribución t, deduzco que el valor del estadı́stico de prueba, T0 = 1.8 es mayor que t35,0.95 pero menor que t35,0.975 . Deduzco que no rechazarı́a H0 al 97.5% de confianza: el p-valor α0 está comprendido entre 0.025 y 0.05. Por lo tanto, rechazaremos H0 al 90 y al 95% de confianza pero la aceptaremos al 99% de confianza. Problema 3 Para un número real −1 < a < 1, consideramos una sucesión de variables aleatorias X1 , X2 , . . . , Xn que satisface: 1 • Por una parte, X1 ∼ N (0, (1−a 2 ) ), • y por otra parte, para n ≥ 1 Xn+1 = aXn + εn , donde las variables ε1 , . . . , εn , . . . son todas independientes, Normales estándar. III.1 Calcular la esperanza y la varianza de X2 . Calcular en general, para todo n ≥ 1 la esperanza y la varianza de Xn . 1 Tenemos que X2 = aX1 + ε1 , sabiendo que X1 ∼ N (0, (1−a 2 ) ) y ε1 ∼ N (0, 1). Deducimos que E[X2 ] = E[aX1 + ε1 ] = aE[X1 ] + E[ε1 ] = a × 0 = 0.. Por otra parte, puesto que X1 y ε1 son independientes, var[X2 ] = var(aX1 + ε1 ) = a2 var(X1 ) + var(ε1 ) a2 1 = = +1= . 1 − a2 1 − a2 Por inducción, es fácil deducir que para todo n ≥ 1, E[Xn ] = 0, var[Xn ] = 1 . 1 − a2 III.2 ¿Qué más puede decir sobre la distribución de X2 ?. Deducir la distribución de Xn . Puesto que cualquier combinación lineal de distribuciones normales es una distribución normal, deducimos que la distribución de X2 es normal, asi como la de Xn , para todo n ≥ 1. III.3 Calcular la covarianza de X1 con X2 , asi como su correlación. Tenemos cov(X1 , X2 ) = cov(X1 , aX1 + ε1 ) = a var(X1 ) + cov(X1 , varepsilon1 ) a = , 1 − a2 donde hemos utilizado la independencia de X1 y ε1 . La correlación es por lo tanto corr(X1 , X2 ) = p p cov(X1 , X2 ) a 2 = × 1 − a 1 − a2 = a. σX1 σX2 1 − a2 3 III.4 En general, para k ≥ 2, calcular la covarianza de X1 con Xk , asi como su correlación. Por inducción, se demuestra que cov(X1 , Xn ) corr(X1 , Xn ) an−1 1 − a2 = an−1 . = Problema 4 En un proceso de fabricación se elaboran dispositivos electrónicos cuyos tiempos de vida vienen determinados por una exponencial de media 1 hora. Los dispositivos se inspeccionan antes de ser exportados, considerándose defectuosos aquellos cuyo tiempo de vida no supere los 12 minutos. Para ello, el responsable de control de calidad pone en funcionamiento cada uno de los dispositivos fabricados durante 12 minutos. IV.1 ¿Qué porcentaje de dispositivos defectuosos se elaboran diariamente? Introducimos la variable T :”Tiempo de vida de un dispositivo escogido al azar”, sabemos que T sigue una distribución exponencial con parámetro λ = 1/60 (las unidades son minutos. Queremos calcular P(T > 12) (proporción de correctos), hemos visto en clase que, al tratarse de una distribución exponencial, se puede calcular como P(T > 12) = e−12/60 = 0.82. El porcentaje de defectuosos es por lo tanto de 18%.) IV.2 Los dispositivos se comercializan en cajas de 300 unidades. ¿Cómo se distribuye la variable “Número de dispositivos con tiempo de vida inferior a 12mn en una caja escogida al azar”? Determinar la probabilidad de que en una caja se encuentren más de 4 dispositivos con tiempo de vida inferior a 12 minutos. ¿Cómo calcuları́a la probabilidad de que, en una caja, haya más de 20 dispositivos defectuosos? Introducimos la variable N :“Número de dispositivos con tiempo de vida inferior a 12mn en una caja escogida al azar”. Reconocemos la repetición de un experimento simple al que va asociada una situación dicotómica, deducimos que l N sigue una distribución binomial de parámetros n = 300 y p = P(T < 12) = 0.18. Queremos calcular P(N > 4). Tenemos P(N > 4) 1 − (P(N = 0) + P(N = 1) + P(N = 2) + P(N = 3) + P(N = 4)) 4 X 300 0.18i 0.82300−i ' 0, = i = i=0 la probabilidad es bajı́sima. En cuanto al cálculo de la probabilidad de que haya más de 20 dispositivos defectuosos, el cálculo exacto es posible pero laborioso, se podrı́a utilizar una calculadora estadı́stica. IV.3 Si un usuario adquiere un dispositivo que ha superado el control de calidad, ¿cuál es la probabilidad de que falle antes de 12 minutos? Traducimos la probabilidad pedida: P(T > 24|T > 12), es decir, sabiendo que el dispositivo ya ha durado 12 minutos, cuál es la probabilidad de que dure otros 12 más (por lo menos 24 en total)? Podemos calcular esta probabilidad usando la definición de la probabilidad condicionada, pero es más rápido usar la propiedad de falta de memoria de la distribución exponencial: sabemos que P(T > 24|T > 12) = P(T > 12) = 0.84, 4