DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA 2o . INGENIERÍA INFORMÁTICA Estadı́stica. Curso 2007/2008 Examen 2a Conv. Oficial. Fecha: 8-9-2007 1. Sabemos que tiene estudios superiores el 15% de la población española, estudios medios el 40%, estudios primarios el 35% y no tiene estudios el 10%. Los desempleados no se distribuyen proporcionalmente entre esas categorı́as, dado que de entre los de estudios superiores están sin trabajo el 10%, entre los de estudios medios el 35%, entre los de estudios primarios el 18%, y entre los que no tienen estudios el 37%. Obtenga las probabilidades de que extraı́do un individuo al azar, éste sea: (3 puntos) (a) Titulado superior, sabiendo que está parado. (b) Una persona sin estudios y que está en paro. (c) Una persona con estudios primarios o que está trabajando. Solución: Del enunciado extraemos la siguiente información: 0.1 T̄ 0.9 T 0.35 T̄ 0.65 T 0.18 T̄ 0.82 T 0.37 T̄ 0.63 T S 0.15 M Ω 0.4 0.35 Pr 0.1 N Apartado (a) Nos piden: P S T̄ = ↑ T.Bayes P [S] P T̄ S P T̄ = ↑ T.P.T otal 0.15 × 0.1 = 0.15 × 0.1 + 0.4 × 0.35 + 0.35 × 0.18 + 0.1 × 0.37 0.015 = 0.05882 = 0.255 = Apartado (b) Nos piden: P N ∩ T̄ = ↑ R.M ultipl. P [N ] P T̄ N = 0.1 × 0.37 = 0.037 Apartado (c) Nos piden: P [P r ∪ T ] = P [P r] + P [T ] − P [P r ∩ T ] = = 0.35 + (1 − P T̄ ) − P [P r] P T P r = = 0.35 + (1 − 0.255) − (0.35 × 0.82) = 0.808 2. Sean X e Y variables aleatorias independientes que representan el diámetro en mm. de dos piezas redondas A y B, que deben ir emparejadas en un determinado mecanismo industrial. Ambas variables se distribuyen según leyes normales de igual varianza y además la media de los diámetros de las piezas A es mayor en 10 mm. que las de las piezas B. La probabilidad de que el diámetro de una pieza A elegida al azar sea menor de 190 mm es de 0.67 y la probabilidad de que elegidas al azar una pieza A y otra B, el diámetro de A sea mayor que el de B es 0.833. (4 puntos) (a) Determinar los parámetros de las distribuciones. (b) Se eligen 10 pares de estas piezas al azar. Determinar el número esperado de pares en los que el diámetro de la pieza A es mayor que el de B. (c) Entre n=10 pares de estas piezas se calcula la media de las medidas de A y la media de las medidas de B que son dos variables aleatorias. Calcular la probabilidad de que la diferencia entre la media de las medidas de A y la media de las medidas de B sea mayor de 12 mm. ¿Cuál es el número mı́nimo n de pares que hay que tomar para que esta probabilidad sea como máximo del 5%? Solución: Del enunciado sabemos que: • X =“diámetro en mm de piezas redondas A”, e Y =“diámetro en mm de piezas redondas B”. • X N (µA , σ), e Y N (µB , σ), donde µA = µB + 10. • P [X < 190] = 0.67 y P [X > Y ] = 0.883. Apartado (a) Nos piden calcular: µA y µB . Planteamos un sistema de dos ecuaciones y dos incógnitas (µA y σ): 190 − µA 190 − µA P [X < 190] = P Z < =φ = 0.67 σ σ √ √ Sabemos que X − Y N (µA − µB , σ 2 + σ 2 ) = N (10, σ 2). Podemos escribir ahora: −10 10 10 X − Y − 10 0 − 10 √ √ =P Z> √ =P Z< √ =φ = 0.833 P > √ σ 2 σ 2 σ 2 σ 2 σ 2 El sistema serı́a: 190−µA σ 10 √ σ 2 = 0.44 = 0.97 ) ⇒ σ = 7.29, µA = 186.79 (σ = 7.289760631, µA = 186.7925053) Apartado (b) Definimos: V =“número de pares donde A es mayor que B en n = 10 parejas”. Podemos asegurar que: V Bi(n = 10, p = P [A > B] = P [X > Y ] = 0.833). Nos piden: E [V ] = = n × p = 10 × 0.833 = 8.33 ↑ Binomial Apartado (c) Parte I Consideramos: P10 P10 Yi σ i Xi N (µA , √ ), Ȳ = i X̄ = 10 10 10 σ N (µB , √ ) 10 Nos piden que calculemos: P X̄ − Ȳ > 12 . Podemos decir: W = X̄ − Ȳ ↑ indep. N (µA − µB = 10, r σ2 σ2 σ + = √ = 3.26) 10 10 5 Luego, podemos calcular: 12 − 10 √ P X̄ − Ȳ > 12 = P [W > 12] = P Z > = σ/ 5 " √ ! √ # 2 5 2 5 =1−φ = 1 − φ(0.61348) = =P Z> σ σ = 1 − φ(0.61) = 1 − 0.729069 = 0.27093 Apartado (c) Parte II Nos piden el valor de n tal que P X̄n − Ȳn > 12 ≤ 0.05. Sabemos que: ! r r σ2 σ2 2 10.3093 X̄n − Ȳn = Wn N µA − µB = 10, + =σ = √ n n n n Luego, podemos escribir: √ √ n 12 − 10 2 n 2 √ P [Wn > 12] = P Z > q = P Z > √ = 1 − φ ≤ 0.05 σ 2 σ 2 σ n2 Es decir: √ 2 n √ =φ φ σ 2 √ 2n σ ! ≥ 1 − 0.05 = 0.95 ⇔ √ 2n ≥ 1.65 σ √ √ √ √ 2 n = 0.19399 n ≥ 1.65 ⇔ n ≥ 8.50559 ⇔ n ≥ 72.34506 ⇔ n ≥ 73 7.29 3. Se estudia el tiempo de funcionamiento de dos tipos de circuitos I y II. Para ello se toma una muestra de cada tipo de circuitos, obteniéndose los siguientes tiempos: (3 puntos) Tiempo circuito 1 (I) Tiempo circuito 2 (II) 10 12 30 28 32 30 23 30 23 20 24 25 20 31 18 15 19 12 35 22 24 40 (a) Usando las salidas de SPSS que se proporcionan, ¿se puede considerar que los datos de los tiempos en cada circuito provienen de distribuciones normales, al 5%? (b) ¿Se podrı́a considerar que el tiempo de funcionamiento del circuito 1 es menor que el del circuito 2? Usar un nivel de significación del 10%. (c) Consideramos que la proporción de circuitos cuyo tiempo de funcionamiento es superior a 21 horas no es significativamente diferente en ambos tipos de circuitos, suponiendo que los tamaños muestrales son suficientemente grandes, ¿es cierta esta afirmación usando un nivel de confianza del 98%? (d) Con los datos de las salidas de SPSS que se proporcionan, ¿se podrı́a decir que el tiempo medio de funcionamiento del circuito 1, es menor de 34 horas, al 5%? Solución: Apartado (a) Sı́ son poblaciones normales ya que observando la salida de SPSS acerca de la hipótesis de normalidad (test de Shapiro-Wilk), podemos ver los p-valores no son menores que el nivel de significación: α = 0.05: H0 : X N ormal , X : p − valor = 0.840 6≤ α = 0.05, Y : p − valor = 0.705 6≤ α = 0.05, Ha : X 6 N ormal Luego se acepta en ambos casos la normalidad. Apartado (b) Nos piden que bajo hipótesis de normalidad, respondamos al contraste de hipótesis al nivel de significación α = 0.1: H0 : µ1 − µ2 = 0 , Ha : µ1 − µ2 < 0 Al tener varianzas poblacionales desconocidas, inicialmente tenemos que estudiar la igualdad de varianzas: H0 : σ12 = σ22 , Ha : σ12 6= σ22 Para estas muestras se tiene: 2 2 x̄ = 23.4, SX = 49.24, SX = 7.01712, ScX = 54.71111, ScX = 7.3967 2 ȳ = 24.08333, SY2 = 65.24306, SY = 8.07732, ScY = 71.17424, ScY = 8.43648 Las respuestas son: F = 2 Sc1 2 Sc2 Valor de α = 0.1 C.H. de Cociente de Varianzas (o igualdad de varianzas). Exp= 0.76869 → RC: fuera de (F9,11,α/2=0.05 = 1/F11,9,1−α/2=0.95 = 0.32232, F9,11,1−α/2=0.95 = 2.89622) Hip. nula = 1 (hip.alt: distinto que) No está en la región crı́tica, se acepta la igualdad de varianzas. t= r x̄ − ȳ − δ0 2 2 n1 S1 +n2 S2 n1 +n2 −2 1 n1 + 1 n2 Valor de α = 0.1 C.H. de Diferencia Medias (vars.iguales desconocidas). Exp= -0.19986 → RC: < t10+12−2=20,0.1 = −t20,0.9 = −1.32534 Hip. nula = 0 (hip.alt: menor que) No está en la región crı́tica, se acepta la igualdad de medias. Apartado (c) Podemos responder, definiendo las variables Bernouilli V1 y V2 , considerando éxito en el caso de X > 21 y Y > 21, respectivamente. Las probabilidades de éxito p1 = P [X > 21] y p2 = P [Y > 21], no los podemos calcular para la población. Luego, estudiaremos para las muestras que tenemos el contraste de hipótesis, al nivel de significación α = 1 − 0.98 = 0.02: H 0 : p1 = p2 , Ha : p1 6= p2 V1 V2 0 0 1 1 1 1 1 1 1 0 1 1 0 1 0 0 0 0 1 1 1 1 Z=r p̂1 − p̂2 p̂(1 − p̂) n11 + 1 n2 , p̂ = p̂1 n1 + p̂2 n2 n1 + n2 Valor de α = 0.02 C.H. de Diferencia Proporciones Pob. Bernouilli indep.. Exp= -0.32369 → RC: fuera de (−2.32635, 2.32635 = z1−α/2 = z0.99 ) Hip. nula = 0 (hip.alt: distinto que) Datos de X: (nX =10, x̄ = p̂1 = 6/10 =0.6) Datos de Y: (nY =12, ȳ = p̂2 = 8/12 =0.66667) Aceptamos la hipótesis nula de igualdad de probabilidades. Intervalo de confianza para la diferencia de proporciones: r p̂1 q̂1 p̂2 q̂2 (p̂1 − p̂2 ) ± z1− α2 + n1 n2 Valor de α = 0.02 Int. de Confianza sobre Diferencia Proporciones Pob. Bernouilli indep.: (-0.54636,0.41302) Valores crı́ticos: (2.32635) Datos de X: (nX =10, x̄ =0.6) Datos de Y: (nY =12, ȳ =0.66667) Aceptamos la hipótesis nula ya que el valor 0 está en el intervalo de confianza para la diferencia de proporciones. Apartado (d) Podrı́amos responder utilizando o contraste de hipótesis (al nivel de significación α = 0.05): H0 : µ1 = 34 , Ha : µ1 < 34 o también construyendo un intervalo de confianza al 95% para el valor µ1 − 34 (o sobre µ1 ) de una población normal con varianza desconocida. En este caso la salida de SPSS me da ese intervalo que en este caso es: IC(µ1 − 34, σ 2 desconocida) = (−15, 8913, −5, 3087) El cual nos dice que µ1 − 34 es negativo (al 95%), por lo que podemos asegurar que µ1 < 34.