Enunciado y soluciones, Examen Junio 2006.

Anuncio
Ingenierı́a Industrial
Métodos estadı́sticos de la Ingenierı́a
Examen Junio 2006.
ENUNCIADO Y SOLUCIONES
Duración: 2:30 horas. Indicar nombre, apellidos y DNI en cada uno de
los folios.
Problema 1
Un determinado prefabricado de hormigón puede presentar dos tipos de defectos de manera independiente, que lo hacen inutilizable. El primero de ellos es no cumplir con la norma en lo referente a
las dimensiones del objeto y otro no cumplir la norma en relación a la resistencia del mismo, pudiendo
presentarse ambos defectos en una misma pieza. Se sabe que el 10% de los prefabricados tienen unas
dimensiones incorrectas, mientras que sólo el 5% no cumple las exigencias en cuanto a resistencia. A
partir de esta información, determinar:
I.1 El porcentaje de prefabricados que son correctos, es decir, no presentan defecto alguno.
Empezamos por introducir los sucesos convenientes: sea D=”El prefabricado cumple con las especificaciones de dimensión” y R=”El prefabricado cumple con las especificaciones de resistencia”.
Sabemos que P(D) = 0.9 mientras que P(R) = 0.95.
Nos piden P(R ∩ D). Por ser los dos sucesos independientes, esta probabilidad se calcula como
P(R ∩ D) = P(R)P(D) = 0.95 × 0.9 = 0.855
.
I.2 El porcentaje de prefabricados que tendrán que ser eliminados por presentar algún tipo de defecto.
Nos piden ahora
P(Rc ∪ Dc )
= 1 − P(R ∩ D) = 1 − 0.855
= 0.145.
I.3 Determinar, dentro del conjunto de las piezas defectuosas, el porcentaje de piezas que cumplen la
norma de resistencia. Queremos calcular P(R|(Dc ∪ Rc )).
Por la definición de la probabilidad condicionada, tenemos
P(R|(Dc ∪ Rc ))
=
=
=
=
P(R ∩ (Dc ∪ Rc ))
P(Dc ∪ Rc )
P((R ∩ Dc ) ∪ (R ∩ Rc ))
P(Dc ∪ Rc )
P((R ∩ Dc ))
P(Dc ∪ Rc )
0.95 × 0.1
' 0.655.
0.145
Deducimos que, entre las piezas defectuosas, el 65.5% cumple con las especificaciones de resistencia
(y por lo tanto sólo incumplen las especificaciones de dimensión).
1
Problema 2
Una empresa dedicada a la fabricación de material de construcción está interesada en estudiar la
conductividad térmica de un tipo de ladrillos. Para ello, seleccionó una muestra de 36 unidades de
manera aleatoria, obteniendo para esa muestra, una conductividad media de 0.343 y una desviación
tı́pica de 0.01. Suponiendo que los datos proceden de una distribución Normal, responder a las siguientes
cuestiones:
II.1 Construir, detalladamente, un intervalo de confianza al 95% para la conductividad media de
dicho tipo de ladrillos. Estamos en el caso en que conocemos la media y la desviación tı́pica
muestral. La construcción detallada del intervalo de confianza en este supuesto utiliza la t de
Student y se puede encontrar en el apartado c) de la sección VI.3.3 de los apuntes. Obtenemos
√
µ = X̄ ± tn−1,1−α/2 S/ n,
tenemos x̄ = 0.343, S = 0.01, necesitamos t35,0.975 , que buscamos en la tabla (no aparece 35
grados de libertad pero lo aproximamos por t30,0.95 = 2.045 por ejemplo) y deducimos
√
µ = 0.343 ± 0.01 × 2.045/ 36 = 0.343 ± 0.0034
II.2 ¿Qué interpretación tiene un intervalo de confianza al 95%? ver el apartado VI.3.2.2 de los apuntes.
II.3 Expresar el intervalo de confianza obtenido en el apartado II.1 en la forma (valor estimado ± Error)
¿Son suficientes 36 ladrillos para cometer un error inferior a 0.01 en la estimación de la conductividad media?. Ya lo he hecho en el apartado II.1. Como el error es menor de 0.01, puedo afirmar
que son suficientes 36 ladrillos para conseguir el error deseado.
II.4 Un competidor afirma que la conductividad térmica de esos ladrillos es superior a 0.340. Plantear
un contraste que nos permitirá contestar a la afirmación realizada anteriormente y tomar una
decisión en base a los datos muestrales al 95% de confianza.
Planteamos las hipótesis
H0 : µ = 0.340,
H1 : µ > 0.340,
Nos fijamos α = 0.05, suponiendo que trabajamos con 95% de confianza. El estadı́stico de prueba
es
X̄ − µ0
√ ∼ tn−1 si H0 es cierto.
T0 =
S/ n
La región de rechazo es unilateral : R = {t : t > tn−1,1−α }, la frontera siendo t35,0.95 ' 1.69.
(este último valor es aproximado, deducido de la tabla de los cuantiles t de Student).
Para la muestra escogida, el valor del estadı́stico de prueba es
t0 =
X̄ − µ0
0.343 − 0.34
√ =
√
= 1.8.
S/ n
0.01/ 36
Este valor pertenece a la región de rechazo por lo que deducimos que al 95% de confianza rechazamos H0 : afirmamos que la conductivad media es superior a 0.34.
II.5 Determinar una cota inferior y una cota superior para el p-valor del contraste anterior y discutir
la conclusión que se obtiene para los niveles de confianza 90%, 95% y 99%.
Notar en particular que deducimos en particular, puesto que hemos rechazado H0 al 95% de
confianza, que el p-valor es menor que 0.05. En realidad, al igual caracterizamos el p-valor como
α0 = P(t > 1.8),
2
donde t es una distribución t de Student con 35 grados de libertad. Podemos utilizar una calculadora estadı́stica para calcular α0 de manera precisa. Si sólo tenemos una tabla a mano, podemos
ir probando con distintos niveles de confianza para obtener cuotas razonablemente precisas de α0 .
Por ejemplo, de la tabla de los cuantiles de la distribución t, deduzco que el valor del estadı́stico de
prueba, T0 = 1.8 es mayor que t35,0.95 pero menor que t35,0.975 . Deduzco que no rechazarı́a H0 al
97.5% de confianza: el p-valor α0 está comprendido entre 0.025 y 0.05. Por lo tanto, rechazaremos
H0 al 90 y al 95% de confianza pero la aceptaremos al 99% de confianza.
Problema 3
Para un número real −1 < a < 1, consideramos una sucesión de variables aleatorias X1 , X2 , . . . , Xn
que satisface:
1
• Por una parte, X1 ∼ N (0, (1−a
2 ) ),
• y por otra parte, para n ≥ 1 Xn+1 = aXn + εn ,
donde las variables ε1 , . . . , εn , . . . son todas independientes, Normales estándar.
III.1 Calcular la esperanza y la varianza de X2 . Calcular en general, para todo n ≥ 1 la esperanza y
la varianza de Xn .
1
Tenemos que X2 = aX1 + ε1 , sabiendo que X1 ∼ N (0, (1−a
2 ) ) y ε1 ∼ N (0, 1). Deducimos que
E[X2 ] = E[aX1 + ε1 ] = aE[X1 ] + E[ε1 ] = a × 0 = 0.. Por otra parte, puesto que X1 y ε1 son
independientes,
var[X2 ] = var(aX1 + ε1 )
= a2 var(X1 ) + var(ε1 )
a2
1
= =
+1=
.
1 − a2
1 − a2
Por inducción, es fácil deducir que para todo n ≥ 1,
E[Xn ] = 0,
var[Xn ] =
1
.
1 − a2
III.2 ¿Qué más puede decir sobre la distribución de X2 ?. Deducir la distribución de Xn .
Puesto que cualquier combinación lineal de distribuciones normales es una distribución normal,
deducimos que la distribución de X2 es normal, asi como la de Xn , para todo n ≥ 1.
III.3 Calcular la covarianza de X1 con X2 , asi como su correlación.
Tenemos
cov(X1 , X2 )
= cov(X1 , aX1 + ε1 ) = a var(X1 ) + cov(X1 , varepsilon1 )
a
=
,
1 − a2
donde hemos utilizado la independencia de X1 y ε1 .
La correlación es por lo tanto
corr(X1 , X2 ) =
p
p
cov(X1 , X2 )
a
2
=
×
1
−
a
1 − a2 = a.
σX1 σX2
1 − a2
3
III.4 En general, para k ≥ 2, calcular la covarianza de X1 con Xk , asi como su correlación.
Por inducción, se demuestra que
cov(X1 , Xn )
corr(X1 , Xn )
an−1
1 − a2
= an−1 .
=
Problema 4
En un proceso de fabricación se elaboran dispositivos electrónicos cuyos tiempos de vida vienen determinados por una exponencial de media 1 hora. Los dispositivos se inspeccionan antes de ser exportados,
considerándose defectuosos aquellos cuyo tiempo de vida no supere los 12 minutos. Para ello, el responsable de control de calidad pone en funcionamiento cada uno de los dispositivos fabricados durante 12
minutos.
IV.1 ¿Qué porcentaje de dispositivos defectuosos se elaboran diariamente?
Introducimos la variable T :”Tiempo de vida de un dispositivo escogido al azar”, sabemos que T
sigue una distribución exponencial con parámetro λ = 1/60 (las unidades son minutos.
Queremos calcular P(T > 12) (proporción de correctos), hemos visto en clase que, al tratarse de
una distribución exponencial, se puede calcular como P(T > 12) = e−12/60 = 0.82. El porcentaje
de defectuosos es por lo tanto de 18%.)
IV.2 Los dispositivos se comercializan en cajas de 300 unidades. ¿Cómo se distribuye la variable
“Número de dispositivos con tiempo de vida inferior a 12mn en una caja escogida al azar”?
Determinar la probabilidad de que en una caja se encuentren más de 4 dispositivos con tiempo
de vida inferior a 12 minutos. ¿Cómo calcuları́a la probabilidad de que, en una caja, haya más de
20 dispositivos defectuosos?
Introducimos la variable N :“Número de dispositivos con tiempo de vida inferior a 12mn en una
caja escogida al azar”. Reconocemos la repetición de un experimento simple al que va asociada una
situación dicotómica, deducimos que l N sigue una distribución binomial de parámetros n = 300
y p = P(T < 12) = 0.18.
Queremos calcular P(N > 4). Tenemos
P(N > 4)
1 − (P(N = 0) + P(N = 1) + P(N = 2) + P(N = 3) + P(N = 4))
4 X
300
0.18i 0.82300−i ' 0,
=
i
=
i=0
la probabilidad es bajı́sima. En cuanto al cálculo de la probabilidad de que haya más de 20 dispositivos defectuosos, el cálculo exacto es posible pero laborioso, se podrı́a utilizar una calculadora
estadı́stica.
IV.3 Si un usuario adquiere un dispositivo que ha superado el control de calidad, ¿cuál es la probabilidad de que falle antes de 12 minutos?
Traducimos la probabilidad pedida: P(T > 24|T > 12), es decir, sabiendo que el dispositivo ya ha
durado 12 minutos, cuál es la probabilidad de que dure otros 12 más (por lo menos 24 en total)?
Podemos calcular esta probabilidad usando la definición de la probabilidad condicionada, pero es
más rápido usar la propiedad de falta de memoria de la distribución exponencial: sabemos que
P(T > 24|T > 12) = P(T > 12) = 0.84,
4
Descargar