Examen de Estadı́stica 2 Ingenierı́a Industrial Cuestiones Nota importante: Las respuestas correctas contarán 1 punto. Las incorrectas valdrán -0.33 (-1/3) para las preguntas con 4 respuestas y –0.25 (-1/4) para las preguntas con 5 respuestas. Estos valores están calculados de manera que E(puntos)=0 para una persona que contesta al azar. La pregunta 7 vale dos puntos (la calificación de cada apartado aparece bajo la tabla). 1. En un diseño factorial 25−2 definido por D = AB y E = BC, la resolución es (a) (b) (c) (d) II III IV NDA (Ninguna de las anteriores) Respuesta: b. Para el diseño propuesto se tiene la siguiente ecuación generatriz completa I = ABD = BCE = ACDE cuya palabra más pequeña tiene longitud tres. Por tanto, resolución III. 2. En el diseño factorial anterior, los efectos confundidos con el factor principal A son: (a) (b) (c) (d) BD; BCE y CDE BDE; BC y BCE BD, ABCE NDA Respuesta: d. Los efectos confundidos con A se obtienen al multiplicar la ecuación generatriz completa por el factor A AI = AABD = ABCE = AACDE ⇔ A = BD = ABCE = CDE, por lo tanto, la respuesta correcta es ”ninguna de las anteriores”, ya que en la c falta el efecto CDE. 3. En un diseño 27−2 la resolución máxima se consigue con la asignación (a) (b) (c) (d) F=ABCDE; G=ABCD F=ABCD; G=ABCE F=AB; G=BC F=BC; G=AB Respuesta: b. Las ecuaciones generatrices para cada opción son las siguientes a) b) c) c) I I I I = = = = ABCDEF = ABCDG = EF G (Resolución III) ABCDF = ABCEG = DEF G (Resolución IV) ABF = BCG = ACF G (Resolución III) BCF = ABG = ACF G (Resolución III), por lo tanto, la asignación con mayor resolución (IV) es la b. 1 4. Si la relación entre las variables Y , X1 , X2 es: log (Y ) = 1, 2 + 0, 04 · X1 + 0, 7 · log (X2 ) , y los coeficientes del modelo son significativos, ¿cuánto se incrementa la variable Y cuando la variable X1 aumenta un una unidad y X2 permanece constante? (a) (b) (c) (d) 0,04 4% 1,24 NDA Respuesta: d. La variable X1 no ha sido transformada, por lo tanto los incrementos sobre ésta se toman unitarios. No sucede lo mismo con la dependiente que tiene un logaritmo, interpretándose como incrementos porcentuales. Por lo tanto, ante un incremento unitario de X1 (dejando X2 constante), se produce un aumento del β1 % en la variable Y , es decir, un aumento del 0, 04%, que no está recogido en ninguna de las respuestas numéricas. 5. Indicar el máximo numero de factores variando en dos niveles que pueden analizarse con 8 observaciones: (a) (b) (c) (d) 8 7 3 NDA Respuesta: b. La respuesta correcta es 7 factores, ya que con ocho observaciones sólo pueden estimarse ocho parámetros y uno de ellos siempre es el valor medio de la variable respuesta. 6. En un diseño factorial 27−4 la estimación de los efectos principales es: A = −10, 9; B = −2, 8; C = −18, 9; D = 0, 5; E = 3, 2; F = −22, 8; G = −3, 4. Calcular mediante el método de la MEDA los efectos significativos. (a) (b) (c) (d) FyC F A, C y F NDA Respuesta: b. Hay que calcular la MEDA de todos los efectos ya que estamos ante un modelo fraccional. La mediana es M ediana = M ed (−10, 9; −2, 8; −18, 9; 0, 5; 3, 2; −22, 8; −3, 4) = −3, 4; y la meda M EDA = M ed (|−10, 9 − (−3, 4)| ; |−2, 8 − (−3, 4)| ; |−18, 9 − (−3, 4)| ; |0, 5 − (−3, 4)| ; |3, 2 − (−3, 4)| ; |−22, 8 − (−3, 4)| ; |−3, 4 − (−3, 4)|) = M ed (|−7, 5| ; |0, 6| ; |−15, 5| ; |3, 9| ; |6, 6| ; |−19, 4| ; |0|) = M ed (0; 0, 6; 3, 9; 6, 6; 7, 5; 15, 5; 19, 4) = 6, 6 2 que, dividiéndola por 0, 675, queda σ̂ θ = 6, 6 = 9, 78. 0, 675 Serán significativos aquellos efectos que en valor absoluto sean mayores que dos veces dicha estimación (2 · 9, 78 = 19, 56). Ası́ que tan sólo el efecto asociado al factor C es significativo. 7. Se realiza un ANOVA para comparar 3 tratamientos. Se sabe que el número de observaciones en cada tratamiento es 5 y las media de cada grupo son 10, 16, 8 y 21, 4. Además, las varianzas corregidas para cada grupos son 10, 3, 7 y 8, 3. Calcular las casillas correspondientes a la suma de cuadrados y grados de libertad de las VE, VNE y VT de la tabla ANOVA. Elija la respuesta adecuada para cada una de las columnas. La puntuación de cada columna se especifica debajo de la tabla. Suma de cuad. VE 263.14 328.93 484.13 65.78 Ninguna Acierto+0.5 Fallo-0.125 Suma de cuad. VNE 88 264 330 2728 Ninguna Acierto+0.5 Fallo-0.125 Suma de cuad. VT 572.13 527.14 2793.78 416.93 Ninguna Acierto+0.25 Fallo-0.0625 Grad. de lib. VE 5 4 3 2 Ninguna Acierto+0.25 Fallo-0.0625 Grad. de lib. VNE 11 12 13 10 Ninguna Acierto+0.25 Fallo-0.0625 Grad. de lib. VT 15 13 14 12 Ninguna Acierto+0.25 Fallo-0.0625 Respuestas: Por columnas y de izquierda a derecha: 328,93; 88; 416,93; 2; 12 y 14. 8. Las ecuaciones normales de regresión indican: (a) Que los datos siguen una distribución normal (b) Que los residuos siguen una distribución normal (c) Que las betas siguen una distribución normal (d) Todas las anteriores (e) Ninguna de las anteriores Respuesta: e. Las ecuaciones normales son las que se resultan de las condiciones de primer orden del problema de minimización de la suma de residuos al cuadrado. Es decir, se usan en la estimación minimo cuadrática de los parámetros y nada tienen que ver con la hipótesis de normalidad. 9. En un modelo de regresión múltiple con tres variables explicativas, X1 , X2 , X3 se sabe que X1 = 2·X2 . Elegir la opción más adecuada. (a) No se puede estimar la ecuación de regresión por no ser invertible la matriz X0X (b) El vector de residuos está perfectamente definido y es perpendicular al subespacio vectorial generado por las columnas de X (c) El vector de valores previstos está perfectamente definido y pertenece al subespacio vectorial generado por las columnas de X 3 (d) Todas las anteriores (e) Ninguna de las anteriores. Respuesta: d. Las afirmaciones hechas en las opciones b y c son ciertas por definición de la regresión múltiple. La hecha en la opción a es cierta en este caso, ya que la segunda columna de X es proporcional a la primera, lo que hace que la matriz X no sea de rango máximo y por tanto X0X no sea invertible. 4 Examen de Estadı́stica 2 Ingenierı́a Industrial Problema 1. Las tres variables son significativas en las regresiones simples porque sus estadı́sticos t son, en valor absoluto, mayores que 2. En las regresiones dobles la única variable que deja de ser significativa es log(PIB CAP) en el modelo con los regresores log(PIB CAP) y log(Hijos promedio). Es un problema de colinealidad. Un incremento del 10% de la proporción de población urbana se traduce en un aumento del 6% en la proporción de alfabetización femenina. 2. En la regresión con tres variables log(PIB CAP) será no significativa. Las demás serán significativas. 3. El modelo más adecuado tiene como regresores el logaritmo de Hijos Promedio y de proporción de población urbana, con un R2 igual a 65.997%. La ecuación del modelo es: log (Alf f em) = 3.71 − 0.64 · log(Hijos P romedio) + 0.3 · log(U rbana) Los valores de los estadı́sticos t son −8.14 para la variable Hijos Promedio y 4.34 para proporción de población urbana. Ambas variables son significativas, ya que sus estadı́sticos t son mayores que 2 en valor absoluto. (a) Si manteniendo constante la proporción de población urbana se incrementa en un 10% la variable hijos promedio, la alfabetización femenina desciende un 6.4%. Si manteniéndose constante la variable hijos promedio se aumenta un 10% la proporción de población urbana, la alfabetización femenina se incrementa un 3%. (b) El intervalo de confianza para el parámetro asociado al logaritmo de Hijos Promedio será: −0.64 ± 2 · 0.0789 = [−0.7979, −0.4821]; y para la proporción de población urbana: 0.30±2·0.0694 = [0.1612, 0.4388]. 4. Definirı́amos una variable dicotómica (0 ó 1) para cada grupo. (a) Protestantes: 1 Pi = 0 Si el paı́s i es mayoritariamente protestante Si no lo es Católicos: Ci = 1 0 Musulmanes: 1 Mi = 0 Si el paı́s i es mayoritariamente católico Si no lo es Si el paı́s i es mayoritariamente musulmán Si no lo es 1 Budistas: 1 0 Si el paı́s i es mayoritariamente budista Si no lo es 1 0 Si el paı́s i es mayoritariamente animista Si no lo es Bi = Animistas: Ai = Otras religiones: 1 Si el paı́s i es mayoritariamente de otra religión diferente Oi = 0 Si no lo es (b) Incluirı́amos en el modelo todas las dicotómicas anteriores salvo una. 2