Econometría I- Técnicas Cuantitativas de Gestión I Tema 5. Errores de especificación SOLUCIONES EJERCICIOS 1.a. Se puede demostrar (ver apuntes del tema 5), que el sesgo cometido al omitir la variable lnW es el siguiente: 2 cov(lnY , ln W ) var(lnY ) Por lo tanto, la estimación del parámetro 1 será insesgada cuando la covarianza entre las dos variables explicativas (lnY y lnW) sea cero. b. En este caso, el signo del sesgo será positivo ya que el coeficiente 2 es positivo y la covarianza también. Por lo tanto, el estimador tenderá a sobreestimar el verdadero efecto de la renta en el consumo. c. Los contrastes de hipótesis no son válidos ya que la varianza residual no es un estimador insesgado de la varianza de los errores y las varianzas de los coeficientes estimados también son sesgados. 2.a. Pendiente del modelo: mide en cuántas unidades aumenta el salario de un trabajador cuando aumenta en una unidad el número de años que lleva trabajando en la empresa. b. Podemos contrastar la hipótesis utilizando los estadísticos de la F y la t: F VNE R VNE (70611,4 65894) 15,67 VNE / 222 3 65894/ 219 Contraste de significación individual de la variable años al cuadrado: t ˆ 2 3,96 desv( ˆ 2 ) De acuerdo con estos estadísticos, podemos rechazar la hipótesis nula de que la relación es lineal. c. Contrastes de la forma funcional: - Versión F: se ha realizado una regresión de los salarios como variable dependiente en función de la variable A (años), y los valores predichos de la relación estimada en la tabla anterior al cuadrado. A partir de estos resultados se ha contrastado si los valores predichos al cuadrado son o no significativos con el estadístico de la F. - Versión LM: se ha realizado una regresión de los residuos de la relación entre salario y años como variable dependiente en función de la variable años y los valores predichos de la relación estimada en la tabla al cuadrado. A partir de estos resultados se ha contrastado si los valores predichos al cuadrado son o no significativos utilizando el estadístico LM=n*R2. d y e. Al ser la relación cuadrática y no lineal, la interpretación que damos a esta relación es la siguiente: los salarios aumentan a medida que aumenta el número de años en la empresa, pero este aumento es cada vez menor (rendimientos decrecientes). 1 3. a. H 0 : 1 2 0 H1 : a lg uno 0 (VNE R VNE ) / 2 (103,7982 89,0586) / 2 43,11 VNE / 526 5 89,0586/ 526 5 Por lo tanto, podemos rechazar la hipótesis nula. F b. H0 : 2 0 H1 : 2 0 t ˆ 2 6,4 desv( ˆ 2 ) (VNE R VNE ) / 1 (96,0358 89,0586) / 2 40,82 VNE / 526 5 89,0586/ 526 5 A partir de los dos estadísticos anteriores, podemos rechazar la hipótesis nula. F c. Calculamos los coeficientes de determinación ajustados de cada uno de los modelos: R12 0,395 R22 0,2975 R32 0,349 Elegimos el modelo 1, que es el que tiene un coeficiente de determinación ajustado mayor. Interpretación de los coeficientes: - la relación entre el salario y los años de experiencia es cuadrática lo que indica que a medida que aumenta el número de años de experiencia, los salarios también aumentan aunque cada vez en menor medida. - El coeficiente que acompaña a la variable EDU indica que, ceteris paribus, un aumento de los años de estudio lleva a un aumento del 8,4% en el salario. - El coeficiente que acompaña a la variable MUJER indica que, ceteris paribus, una mujer va a tener un salario un 33,7% más bajo que un hombre. d. Salario Javier (en log) =0,39048+0,03891*18-0,00069*18*18+0,08413*11=1,79273 Salario María (en log) = 0,39048+0,03891*18-0,00069*18*18+0,08413*11-0,33719=1,45554 Salario Javier=6,01 Salario María=4,29 Para contrastar si esta diferencia es significativa, construimos el estadístico t 0,33719 9,28 0,03632 Es decir, podemos rechazar la hipótesis nula de que la variable MUJER no es significativa y concluir que la diferencia de salarios entre Javier y María sí es significativa. 2 4. a. Interpretación de los coeficientes: relación no lineal entre el gasto en alimentación y el nivel de renta. A medida que aumenta el nivel de renta, aumenta el gasto en alimentación, pero este aumento es cada vez menor. dy 0,831 80,352 x dx b. Contraste de significación global: F (2,57 0,659) / 2 VE / k 24,6 VNE / n k 1 0,659/ 17 El valor crítico de la F al 95% de significación con 2 y 17 grados de libertad es 4,74 , por lo que hay evidencia suficiente para rechazar la hipótesis nula de que ninguna de las variables explicativas es significativa. c. Coeficientes de determinación y de determinación ajustado: R2 1 VNE 0,659 1 0,74 VT 2,57 R 2 1 VNE / n k 1 0,659/ 17 1 0,71 VT / n 1 2,57 / 19 d. Contraste de la hipótesis de relación lineal: H0: 2=0; H1: 2 0 (donde 2 es el coeficiente de x2) ˆ 2 40,176 t 3,42 desv( ˆ 2 ) 11,748 Por lo tanto, rechazaremos la hipótesis nula, porque el valor del estadístico es en valor absoluto mayor que 2,11 (t-Student con 17 grados de libertad) 5. a. Calculando la primera derivada respecto a las ventas (0,00030-0,000000034*ventas) e igualando a cero, obtenemos que el nivel de ventas en que se vuelve negativo el efecto marginal es ventas=8823,53. b. H0: 2=0; H1: 2 0 (donde 2 es el coeficiente de las ventas al cuadrado) ˆ 2 0.00000017 t 4,59 ˆ 0 .0000000037 desv( ) 2 Por lo tanto, la variable ventas al cuadrado sí es significativa por lo que podemos decir que la relación I+D-ventas no es lineal sino cuadrática. c. Al eliminar esta variable, que de acuerdo con el apartado anterior es significativa y por lo tanto relevante, obtenemos unos coeficientes estimados también sesgados (estamos ante el problema de la omisión de variables relevantes). d. Contrastamos la significatividad conjunta de ventas y ventas al cuadrado, obteniendo F=4,79, por lo que podemos rechazar la hipótesis nula de que los coeficientes de estas dos variables son iguales a cero. El valor en tablas de una F con 2 y 29 grados de libertad al 5% de significación es 3,33. 3