Examen Segunda Convocatoria (8-9

Anuncio
DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA
2o . INGENIERÍA INFORMÁTICA
Estadı́stica. Curso 2007/2008
Examen 2a Conv. Oficial. Fecha: 8-9-2007
1. Sabemos que tiene estudios superiores el 15% de la población española, estudios medios el
40%, estudios primarios el 35% y no tiene estudios el 10%. Los desempleados no se distribuyen
proporcionalmente entre esas categorı́as, dado que de entre los de estudios superiores están sin
trabajo el 10%, entre los de estudios medios el 35%, entre los de estudios primarios el 18%, y entre
los que no tienen estudios el 37%. Obtenga las probabilidades de que extraı́do un individuo al azar,
éste sea: (3 puntos)
(a) Titulado superior, sabiendo que está parado.
(b) Una persona sin estudios y que está en paro.
(c) Una persona con estudios primarios o que está trabajando.
Solución:
Del enunciado extraemos la siguiente información:
0.1
T̄
0.9
T
0.35
T̄
0.65
T
0.18
T̄
0.82
T
0.37
T̄
0.63
T
S
0.15
M
Ω
0.4
0.35
Pr
0.1
N
Apartado (a) Nos piden:
P S T̄
=
↑
T.Bayes
P [S] P T̄ S
P T̄
=
↑
T.P.T otal
0.15 × 0.1
=
0.15 × 0.1 + 0.4 × 0.35 + 0.35 × 0.18 + 0.1 × 0.37
0.015
= 0.05882
=
0.255
=
Apartado (b) Nos piden:
P N ∩ T̄
=
↑
R.M ultipl.
P [N ] P T̄ N = 0.1 × 0.37 = 0.037
Apartado (c) Nos piden:
P [P r ∪ T ] = P [P r] + P [T ] − P [P r ∩ T ] =
= 0.35 + (1 − P T̄ ) − P [P r] P T P r =
= 0.35 + (1 − 0.255) − (0.35 × 0.82) = 0.808
2. Sean X e Y variables aleatorias independientes que representan el diámetro en mm. de dos
piezas redondas A y B, que deben ir emparejadas en un determinado mecanismo industrial. Ambas
variables se distribuyen según leyes normales de igual varianza y además la media de los diámetros
de las piezas A es mayor en 10 mm. que las de las piezas B. La probabilidad de que el diámetro
de una pieza A elegida al azar sea menor de 190 mm es de 0.67 y la probabilidad de que elegidas
al azar una pieza A y otra B, el diámetro de A sea mayor que el de B es 0.833. (4 puntos)
(a) Determinar los parámetros de las distribuciones.
(b) Se eligen 10 pares de estas piezas al azar. Determinar el número esperado de pares en los que
el diámetro de la pieza A es mayor que el de B.
(c) Entre n=10 pares de estas piezas se calcula la media de las medidas de A y la media de las
medidas de B que son dos variables aleatorias. Calcular la probabilidad de que la diferencia
entre la media de las medidas de A y la media de las medidas de B sea mayor de 12 mm.
¿Cuál es el número mı́nimo n de pares que hay que tomar para que esta probabilidad sea
como máximo del 5%?
Solución:
Del enunciado sabemos que:
• X =“diámetro en mm de piezas redondas A”, e Y =“diámetro en mm de piezas redondas
B”.
• X
N (µA , σ), e Y
N (µB , σ), donde µA = µB + 10.
• P [X < 190] = 0.67 y P [X > Y ] = 0.883.
Apartado (a) Nos piden calcular: µA y µB . Planteamos un sistema de dos ecuaciones y dos
incógnitas (µA y σ):
190 − µA
190 − µA
P [X < 190] = P Z <
=φ
= 0.67
σ
σ
√
√
Sabemos que X − Y
N (µA − µB , σ 2 + σ 2 ) = N (10, σ 2). Podemos escribir ahora:
−10
10
10
X − Y − 10
0 − 10
√
√
=P Z> √ =P Z< √ =φ
= 0.833
P
> √
σ 2
σ 2
σ 2
σ 2
σ 2
El sistema serı́a:
190−µA
σ
10
√
σ 2
= 0.44
= 0.97
)
⇒ σ = 7.29, µA = 186.79
(σ = 7.289760631, µA = 186.7925053)
Apartado (b) Definimos: V =“número de pares donde A es mayor que B en n = 10 parejas”.
Podemos asegurar que: V
Bi(n = 10, p = P [A > B] = P [X > Y ] = 0.833).
Nos piden:
E [V ]
= = n × p = 10 × 0.833 = 8.33
↑
Binomial
Apartado (c) Parte I Consideramos:
P10
P10
Yi
σ
i Xi
N (µA , √ ), Ȳ = i
X̄ =
10
10
10
σ
N (µB , √ )
10
Nos piden que calculemos: P X̄ − Ȳ > 12 .
Podemos decir:
W = X̄ − Ȳ
↑
indep.
N (µA − µB = 10,
r
σ2 σ2
σ
+
= √ = 3.26)
10 10
5
Luego, podemos calcular:
12 − 10
√
P X̄ − Ȳ > 12 = P [W > 12] = P Z >
=
σ/ 5
"
√ !
√ #
2 5
2 5
=1−φ
= 1 − φ(0.61348) =
=P Z>
σ
σ
= 1 − φ(0.61) = 1 − 0.729069 = 0.27093
Apartado (c) Parte II Nos piden el valor de n tal que P X̄n − Ȳn > 12 ≤ 0.05.
Sabemos que:
!
r
r
σ2 σ2
2
10.3093
X̄n − Ȳn = Wn
N µA − µB = 10,
+
=σ
= √
n
n
n
n
Luego, podemos escribir:

√ √ n
12
−
10
2 n
2
√
P [Wn > 12] = P Z > q  = P Z > √ = 1 − φ
≤ 0.05
σ 2
σ 2
σ n2

Es decir:
√ 2 n
√
=φ
φ
σ 2
√
2n
σ
!
≥ 1 − 0.05 = 0.95 ⇔
√
2n
≥ 1.65
σ
√ √
√
√
2 n
= 0.19399 n ≥ 1.65 ⇔ n ≥ 8.50559 ⇔ n ≥ 72.34506 ⇔ n ≥ 73
7.29
3. Se estudia el tiempo de funcionamiento de dos tipos de circuitos I y II. Para ello se toma una
muestra de cada tipo de circuitos, obteniéndose los siguientes tiempos: (3 puntos)
Tiempo circuito 1 (I)
Tiempo circuito 2 (II)
10
12
30
28
32
30
23
30
23
20
24
25
20
31
18
15
19
12
35
22
24
40
(a) Usando las salidas de SPSS que se proporcionan, ¿se puede considerar que los datos de los
tiempos en cada circuito provienen de distribuciones normales, al 5%?
(b) ¿Se podrı́a considerar que el tiempo de funcionamiento del circuito 1 es menor que el del
circuito 2? Usar un nivel de significación del 10%.
(c) Consideramos que la proporción de circuitos cuyo tiempo de funcionamiento es superior a
21 horas no es significativamente diferente en ambos tipos de circuitos, suponiendo que los
tamaños muestrales son suficientemente grandes, ¿es cierta esta afirmación usando un nivel
de confianza del 98%?
(d) Con los datos de las salidas de SPSS que se proporcionan, ¿se podrı́a decir que el tiempo
medio de funcionamiento del circuito 1, es menor de 34 horas, al 5%?
Solución:
Apartado (a) Sı́ son poblaciones normales ya que observando la salida de SPSS acerca de la
hipótesis de normalidad (test de Shapiro-Wilk), podemos ver los p-valores no son menores que el
nivel de significación: α = 0.05:
H0 : X
N ormal
, X : p − valor = 0.840 6≤ α = 0.05, Y : p − valor = 0.705 6≤ α = 0.05,
Ha : X 6 N ormal
Luego se acepta en ambos casos la normalidad.
Apartado (b) Nos piden que bajo hipótesis de normalidad, respondamos al contraste de hipótesis
al nivel de significación α = 0.1:
H0 : µ1 − µ2 = 0
,
Ha : µ1 − µ2 < 0
Al tener varianzas poblacionales desconocidas, inicialmente tenemos que estudiar la igualdad de
varianzas:
H0 : σ12 = σ22
,
Ha : σ12 6= σ22
Para estas muestras se tiene:
2
2
x̄ = 23.4, SX
= 49.24, SX = 7.01712, ScX
= 54.71111, ScX = 7.3967
2
ȳ = 24.08333, SY2 = 65.24306, SY = 8.07732, ScY
= 71.17424, ScY = 8.43648
Las respuestas son:
F =
2
Sc1
2
Sc2
Valor de α = 0.1
C.H. de Cociente de Varianzas (o igualdad de varianzas).
Exp= 0.76869 → RC: fuera de (F9,11,α/2=0.05 = 1/F11,9,1−α/2=0.95 = 0.32232, F9,11,1−α/2=0.95 =
2.89622)
Hip. nula = 1 (hip.alt: distinto que)
No está en la región crı́tica, se acepta la igualdad de varianzas.
t= r
x̄ − ȳ − δ0
2
2
n1 S1 +n2 S2
n1 +n2 −2
1
n1
+
1
n2
Valor de α = 0.1
C.H. de Diferencia Medias (vars.iguales desconocidas).
Exp= -0.19986 → RC: < t10+12−2=20,0.1 = −t20,0.9 = −1.32534
Hip. nula = 0 (hip.alt: menor que)
No está en la región crı́tica, se acepta la igualdad de medias.
Apartado (c) Podemos responder, definiendo las variables Bernouilli V1 y V2 , considerando éxito
en el caso de X > 21 y Y > 21, respectivamente. Las probabilidades de éxito p1 = P [X > 21] y
p2 = P [Y > 21], no los podemos calcular para la población.
Luego, estudiaremos para las muestras que tenemos el contraste de hipótesis, al nivel de significación α = 1 − 0.98 = 0.02:
H 0 : p1 = p2
,
Ha : p1 6= p2
V1 V2
0 0
1 1
1 1
1 1
1 0
1 1
0 1
0 0
0 0
1 1
1
1
Z=r
p̂1 − p̂2
p̂(1 − p̂) n11 +
1
n2
,
p̂ =
p̂1 n1 + p̂2 n2
n1 + n2
Valor de α = 0.02
C.H. de Diferencia Proporciones Pob. Bernouilli indep..
Exp= -0.32369 → RC: fuera de (−2.32635, 2.32635 = z1−α/2 = z0.99 )
Hip. nula = 0 (hip.alt: distinto que)
Datos de X: (nX =10, x̄ = p̂1 = 6/10 =0.6)
Datos de Y: (nY =12, ȳ = p̂2 = 8/12 =0.66667)
Aceptamos la hipótesis nula de igualdad de probabilidades.
Intervalo de confianza para la diferencia de proporciones:
r
p̂1 q̂1 p̂2 q̂2
(p̂1 − p̂2 ) ± z1− α2
+
n1
n2
Valor de α = 0.02
Int. de Confianza sobre Diferencia Proporciones Pob. Bernouilli indep.:
(-0.54636,0.41302)
Valores crı́ticos: (2.32635)
Datos de X: (nX =10, x̄ =0.6)
Datos de Y: (nY =12, ȳ =0.66667)
Aceptamos la hipótesis nula ya que el valor 0 está en el intervalo de confianza para
la diferencia de proporciones.
Apartado (d) Podrı́amos responder utilizando o contraste de hipótesis (al nivel de significación
α = 0.05):
H0 : µ1 = 34
,
Ha : µ1 < 34
o también construyendo un intervalo de confianza al 95% para el valor µ1 − 34 (o sobre µ1 ) de una
población normal con varianza desconocida. En este caso la salida de SPSS me da ese intervalo
que en este caso es:
IC(µ1 − 34, σ 2 desconocida) = (−15, 8913, −5, 3087)
El cual nos dice que µ1 − 34 es negativo (al 95%), por lo que podemos asegurar que µ1 < 34.
Descargar