Universidad de Granada Facultad de Ciencias Económicas y Empresariales Departamento de Métodos Cuantitativos para la Economı́a y la Empresa Econometrı́a 17 Enero 2013 Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DNI: . . . . . . . . . . . . . Nota esperada: . . . . . Teorı́a (elegir 3 preguntas) −1 1. (1’5 puntos) Demostrar que el estimador de β obtenido por MCO es insesgado y que V ar βb = σ 2 · (X t X) . 2. (1’5 puntos) Contraste de permanencia estructural: explicar para qué se usa y especificar su hipótesis nula y regla de decisión. 3. (1’5 puntos) Multicolinealidad: tipos, detección y soluciones. 4. (1’5 puntos) Supongamos que el modelo correcto para explicar la variable Y es Yt = β1 + β2 X2t + β3 X3t + ut , y que por error se especifica el modelo Yt = α1 +α2 X2t +vt . Demostrar que la omisión de una variable puede inducir a que se presente autocorrelación en el modelo especificado. 5. (1’5 puntos) Obtener de forma razonada la aproximación del estadı́stico de Durbin-Watson. Práctica 1. Una de las soluciones empresariales a los cambios que suceden en el entorno dinámico es la flexibilidad en la fabricación. Para desarrollarla, las organizaciones investigan nuevos conocimientos (exploración) o fomentan las habilidades de los trabajadores y de la estructura organizativa (explotación).Con el objetivo de identificar las dimensiones de la flexibilidad en la fabricación que influyen en el desarrollo de la exploración, E, se analiza un modelo de regresión múltiple a partir de la información proporcionada por 151 empresas, obteniéndose: bt E = 0’031 (0’201) + 0’131 ·M ant (0’107) + 0’363 ·M aqt (0’101) + 0’358 ·P rodt (0’084) + 0’433 ·Vt (0’104) + 0’124 ·P roct , (0’099) R2 = 00 946, donde M an, M aq, P rod, V y P roc son, respectivamente, la flexibilidad en la manipulación de materiales, en la maquinaria, en los productos, en el volumen y en el proceso (es decir, las dimensiones de la flexibilidad anteriormente comentadas). Sabiendo además que SCE = 79470 073, se pide: a) (1’5 puntos) Interpretar el signo de los coeficientes de las variables significativas del modelo. b) (1 punto) ¿Es el modelo válido conjuntamente? c) (0’75 puntos) Obtener el coeficiente de determinación corregido. ¿Por qué se calcula este coeficiente? d) (0’5 puntos) Obtener un intervalo de confianza para la varianza de la perturbación aleatoria. e) (0’5 puntos) Con el objetivo de comprobar que se verifican las hipótesis básicas del modelo se calculan los factores de agrandamiento de la varianza de cada variable, los cuales se muestran a continuación: Variable FAV Man 1’481 Maq 1’265 Prod 1’059 V 1’219 Proc 1’151 ¿Qué indican estos datos? f) (0’75 puntos) De igual forma, se realiza también la regresión auxiliar en la que la variable dependiente es el cuadrado de los residuos de la regresión por MCO del modelo original y como independientes todas las variables independientes del modelo original, sus cuadrados y todos los posibles productos cruzados (omitiendo repeticiones), obteniéndose un R2 = 00 1951. ¿Qué técnica se está aplicando? ¿Qué conclusiones obtienes? g) (0’5 puntos) Finalmente, se realiza la prueba de Kolmogorov-Smirnov sobre los residuos del modelo original obteniéndose un p-valor de 0’54. Si la hipótesis nula de este contraste es que los residuos se distribuyen según una normal, ¿qué se puede concluir? Tiempo máximo disponible: 2 horas Solución a) La variable Xi es significativa si rechazo H0 : βi = 0, i = 1, . . . , 6, esto es, cuando |βbi | α texp = √ > tn−k 1 − . σ b wi 2 Teniendo en cuenta que n = 151 y k = 6: H0 : β 1 = 0 texp = 00 031 = 00 1542 6> 10 97646 = t145 (00 975) 00 201 texp = 00 131 = 10 22429 6> 10 97646 = t145 (00 975) 00 107 H0 : β 2 = 0 H0 : β 3 = 0 texp = 00 3631 = 30 594059 > 10 97646 = t145 (00 975) 00 101 H0 : β 4 = 0 texp = 00 358 = 40 2619 > 10 97646 = t145 (00 975) 00 084 texp = 00 433 = 40 1634 > 10 97646 = t145 (00 975) 00 104 H0 : β 5 = 0 H0 : β 6 = 0 00 124 = 10 2525 6> 10 97646 = t145 (00 975) 00 099 Atendiendo a los resultados, podemos afirmar (al 5 % de significación) que la flexibilidad en la maquinaria, en los productos y en el volumen son variables significativas, es decir, que influyen en la exploración. Además, atendiendo al signo del coeficiente de cada una de ellas lo hacen de forma positiva, es decir, cuando aumenta la flexibilidad de estas dimensiones aumenta la investigación en nuevos conocimientos (exploración). texp = b) El modelo será significativo conjuntamente cuando se rechaze la hipótesis H0 : β2 = β3 = · · · = β6 = 0, esto es, cuando Fexp = SCE/(k − 1) R2 /(k − 1) = > Fk−1,n−k (1 − α). SCR/(n − k) (1 − R2 )/(n − k) Como Fk−1,n−k (1 − α) = F5,145 (00 95) = 20 2766 y Fexp = 00 946/5 00 1892 = 0 = 5080 037, 0 0 054/145 0 0003724138 es claro que Fexp > F5,145 (00 95), y entonces (al nivel de significación del 5 %) se rechaza la hipótesis nula. Por tanto, el modelo es significativo conjuntamente (es válido). 2 n−1 0 c) R = 1 − (1 − R2 ) · n−k = 1 − (1 − 00 946) · 150 145 = 0 9441379. Al incluir variables en un modelo, el coeficiente de determinación aumenta aunque las variables que incluyamos no sean significativas. Este problema se resuelve mediante el coeficiente de determinación corregido, ya que penaliza la inclusión de variables. 0 SCE 7947 073 = 84000 711, y entonces, SCR = SCT − SCE = 84000 711 − d) A partir de R2 = SCE SCT se obtiene que SCT = R2 = 00 946 0 0 7947 073 = 453 638. Entonces, el intervalo de confianza (al 95 % de confianza) pedido será ! SCR SCR 4530 638 4530 638 , = , = (20 517, 30 994), 1800 229 1130 556 χ2n−k 1 − α2 χ2n−k α2 donde se ha usado que χ2145 (00 975) = 1800 229 y χ2145 (00 025) = 1130 556. e) Puesto que los valores obtenidos para los FAV están muy próximos a 1 (que es el valor mı́nimo que pueden tomar), se concluye que el modelo está libre de multicolinealidad. f) En este caso se está aplicando el contraste de White para estudiar si existe heteroscedasticidad en el modelo. La hipótesis 2 nula de este contraste es que el modelo es homocedástico, y se rechaza dicha hipótesis si χ2exp = n · Raux > χ2p−1 (1 − α), donde p es el número de regresores de la regresión auxiliar. Puesto que χ2exp = 151 · 00 1951 = 290 4601 6> 310 4104 = χ220 (00 95) = χ2p−1 (1 − α), no se rechaza la hipótesis nula. Por tanto, el modelo es homocedástico (al 5 % de significación). g) Puesto que el p-valor, 0’54, es mayor que el nivel de significación usado, 0’05, no se rechaza la hipótesis nula. Por tanto, los residuos son normales y entonces se puede realizar inferencia en el modelo.