EXAMEN ECONOMETRIA II. Llic en ECONOMIA. Juny 2002 ADVERTENCIA: Lo que hay a continuación es una guía de las posibles respuestas a las preguntas del examen. Están pensadas para que podáis contrastarlas con vuestra respuesta, pero en ningún caso sustituyen al proceso formal de revisión ni a cualquier otro que precisaría que os pusieseis en contacto con los profesores de la asignatura. QUIQUE A) Se ha estimado una ecuación de Mincer para estimar el gap salarial entre hombres y mujeres, utilizando una muestra de 1387 trabajadores asalariados. Las variables utilizadas en la regresión son el logaritmo del salario bruto por hora, LW, (como variable a explicar) y el número de años de educación, EDU, y el sexo, SEXO (como regresores): LW i = α0 + α1 EDUi + α2 EDUi 2 + α3 SEXOi + εi La estimación de MCO ha proporcionado los siguientes resultados: Dependent Variable: LW Method: Least Squares Sample: 1 1387 Included observations: 1387 Variable Coefficient Std. Error t-Statistic Prob. C EDU EDU^2 SEXO 7.092834 0.113883 -0.015174 5.182898 0.122545 0.036459 0.002789 0.074441 57.87957 3.123585 -5.439947 69.62441 0.0000 0.0018 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.781937 0.781464 1.328523 2440.959 -2360.067 2.032100 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 10.40565 2.841894 3.408893 3.423990 1653.070 0.000000 Dado que hay indicios que apuntan a que la dispersión en los salarios depende del nivel de educación, se realiza un test de White para contrastar el supuesto de perturbación homoscedástica, obteniéndose los siguientes resultados: White Heteroskedasticity Test: F-statistic Obs*R-squared 43.67687 251.7060 Probability Probability 0.000000 0.000000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1 1387 Included observations: 1387 Variable Coefficient Std. Error t-Statistic Prob. C EDU EDU^2 EDU*(EDU^2) EDU*SEXO (EDU^2)^2 (EDU^2)*SEXO SEXO 0.386849 -0.031523 -0.044857 0.017315 0.161257 -0.000822 -0.018806 -0.320248 0.441030 0.185669 0.057306 0.007183 0.190591 0.000278 0.014490 0.602140 0.877149 -0.169781 -0.782759 2.410546 0.846089 -2.962519 -1.297802 -0.531849 0.3806 0.8652 0.4339 0.0161 0.3976 0.0031 0.1946 0.5949 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 1) 0.181475 0.177320 3.276329 14802.65 -3610.042 2.098606 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 1.759884 3.612203 5.217075 5.247270 43.67687 0.000000 Comenta el resultado del contraste y su repercusión para las propiedades de la estimación de MCO de la ecuación de Mincer anterior. (1 punto) • White=T*R2 AUX=251.70 Ese valor deja una probabilidad en la cola de la distribución χ2 (7) que es prácticamente 0. En consecuencia se rechaza la hipótesis nula de homoscedasticidad frente a la alternativa de heteroscedasticidad. • En consecuencia existen claros indicios de no esfericidad en la perturbación del modelo. Esto conlleva a que el estimador de MCO, aún siendo consistente no sea eficiente en ese caso. Adicionalmente la estimación de la matriz de VC de los parámetros estimados no será la correcta: VC (βˆ MCO ) = σˆ 2 ( X' X) −1 ( X' ΩX)( X' X) −1 ≠ σˆ 2 ( X' X) −1 • 2) Esto supone que la inferencia que realicemos sobre los parámetros basada en la estimación MCO no sea correcta. Supongamos que la varianza de cada observación depende del cuadrado del número de años de educación, es decir que E(εi 2 ) = σi 2 =σ2 EDUi 2 . Escribe la matriz Ω que caracterizaría a la matriz de varianzas y covarianzas de la perturbación en ese caso – E(εε’)= σ2 Ω –, y la matriz de transformación, es decir aquella matriz que premultiplicando a la perturbación heteroscedástica da lugar a una perturbación homoscedástica. (1 punto) EDU 12 . Ω = 0 3) . 2 EDU 1387 1 EDU 1 . T = 0 0 . . , 1 EDU 1387 . 0 . . ¿Qué características tendrá el estimador de MCG que erróneamente se base en que la varianza de la perturbación depende del número de años de educación (y no de su cuadrado), es decir que suponga que E(εi 2 ) = σi 2 =σ2 EDUi ? Justifica la respuesta. (1/2 punto) EDU . 0 1 . . • Sea Ω ERR = la matriz erróneamente especificada y Ω la matriz definida en el . 0 EDU 1387 apartado anterior. • 1 1 El estimador de MCG que utilice Ω ERR: βˆ MCGERR = ( X ' Ω−ERR X ) −1 ( X ' Ω −ERR Y ) tendrá las siguientes propiedades: o Insesgado: E βˆ = E β + ( X ' Ω −1 X ) −1 ( X ' Ω − 1 ε ) = β [ o ] [ ]= E [(X' Ω MCGERR No eficiente: [ VC βˆ MCGERR =σ • 4) 2 ERR ERR ] −1 −1 −1 −1 −1 −1 ERR X ) X ' Ω ERR εε ' Ω ERR X ( X ' Ω ERR X ) ] 1 1 1 1 ( X ' Ω −ERR X ) −1 X ' Ω −ERR ΩΩ −ERR X ( X ' Ω −ERR X ) −1 Por tanto el error en la especificación de la estructura de la varianza impide obtener un estimador eficiente. Si TERR es la matriz de transformación correspondiente a esa estructura errónea para la varianza de la perturbación, obtén la expresión para la matriz de varianzas y covarianzas de la perturbación erróneamente transformada, es decir E(TERR εε’ TERR’ ). (1/2 punto) 1 . 0 EDU 1 . . • Dada Ω ERR, la matriz de transformación correspondiente será: TERR = . 1 0 EDU 1387 E [TERR εε ' TERR '] = TERR σ 2 ΩT ERR ' • 1 EDU 1 . = σ2 0 EDU 1 . 2 =σ 0 2 EDU 1 . 1 0 EDU 1387 . 0 . . . 2 ≠ σ I1387 EDU 1387 0 . . . 1 EDU 1 . 2 0 EDU 1387 . 0 0 . . . . 1 EDU 1387 B) Se formula un modelo empírico de demanda de agua para uso doméstico en una ciudad, en el que el logaritmo de dicha demanda (LDAIG) en cada periodo depende del logaritmo del nivel de renta de la ciudad (LRENDA), del logaritmo de su población (LPOBL) y del logaritmo de la demanda observada en el periodo anterior (LDAIG(-1)).: LDAIGt = α0 + α1 LRENDAt + α2 LPOBLt + α3 LDAIGt-1 + εt Para su estimación se dispone de observaciones mensuales para todas las variables en una determinada ciudad en el periodo Mayo de 1980 a Diciembre de 1999. Los resultados obtenidos aplicando MCO se reproducen a continuación: Dependent Variable: LDAIG Method: Least Squares Sample: 1980:05 1999:12 Included observations: 236 Variable Coefficient Std. Error t-Statistic Prob. C LRENDA LPOBL LDAIG(-1) -2.595398 0.224318 1.207262 0.843421 2.559011 0.144464 0.163045 0.028020 -1.014219 1.552769 7.404462 30.10061 0.3115 0.1218 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 5) 0.825074 0.822813 18.04561 75549.38 -1015.577 2.599663 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Con la información disponible en el cuadro anterior, contrasta la hipótesis de no autocorrelación en la perturbación. Señala qué contraste utilizas y por qué, y discute su resultado. (1 punto) • Entre la información disponible se encuentra el estadístico de Durbin-Watson de autocorrelación. No obstante, ese estadístico no puede ser utilizado al encontrarse el retardo de la variable endógena entre el conjunto de regresores (se puede comentar un poco a que es debido que no se pueda utilizar). En su lugar se puede utilizar el test h-Durbin que sí es adecuado en tal circunstancia, y que presenta la misma hipótesis nula y alternativa que el de DW. T 236 DW 2 .599 h − Durbin = 1 − = 1 − = −5 .096 ˆ 2 1 − TVar (α 3 ) 2 1 − 236 * 0. 028 2 • Bajo la hipótesis nula de no autocorrelación la h-Durbin se distribuye asintóticamente como N(0,1), por lo que concluiríamos que existe autocorrelación de primer orden negativa. Los correlogramas de la FAS y FAP muestrales para los residuos de la regresión anterior se reproducen a continuación. Se desprende de ellos que tales residuos no presentan autocorrelación? En caso negativo, qué tipo de autocorrelación podría estar presente? Justifica la respuesta. (1 punto) • 6) 61.93046 42.87014 8.640485 8.699194 364.7596 0.000000 Sample: 1980:05 1999:12 Included observations: 236 Autocorrelation **|. .|**** **|. .|*** *|. .|* *|. .|* *|. .|* *|. .|. .|. .|. .|. *|. .|. *|. .|. *|. .|. .|. .|. .|. Partial Correlation | | | | | | | | | | | | | | | | | | | | | | | | **|. .|**** .|. .|* .|. *|. *|. .|. .|* .|. .|. .|. .|* .|. .|. .|. .|. .|. .|. .|. .|. .|* .|. *|. | | | | | | | | | | | | | | | | | | | | | | | | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 AC PAC Q-Stat Prob -0.303 0.528 -0.240 0.360 -0.165 0.179 -0.187 0.171 -0.089 0.075 -0.087 0.023 0.035 -0.033 0.028 -0.082 0.049 -0.078 0.020 -0.108 0.026 0.023 0.021 -0.022 -0.303 0.480 -0.016 0.096 0.032 -0.072 -0.121 0.065 0.096 -0.051 -0.039 -0.044 0.097 -0.023 -0.009 -0.050 -0.031 -0.018 -0.019 -0.036 -0.030 0.148 0.037 -0.062 21.910 88.812 102.70 134.13 140.77 148.55 157.16 164.39 166.33 167.73 169.61 169.75 170.05 170.32 170.52 172.22 172.85 174.43 174.54 177.58 177.76 177.90 178.02 178.15 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 • • Si, se desprende que hay estructura de autocorrelación en los residuos, porque existen coeficientes significativamente distintos de cero en la FAS y la FAP. En la FAS se aprecia una estructura de decrecimiento alternante, lo que combinado con los dos primeros coeficientes de la FAP distintos de cero llevan a sugerir una estructura AR(2) para los residuos. C) 7) Aparte del análisis de autocorrelación en los residuos efectuado en anteriormente, indica brevemente qué otras pruebas de validación efectuarías en la estimación del modelo de demanda de agua presentada anteriormente. (3/4 punto) • 8) Se realizaría toda la batería de contrastes para proceder a la validación de un modelo econométrico. Entre otras: o Análisis de coeficientes estimados: tanto desde plano económico (signo, magnitud) como econométrico (significación individual y conjunta) o Análisis de residuos: Normalidad, esfericidad (heteros y autocorrelación), observaciones atípicas, etc o Estabilidad estructural: test de Chow o Forma funcional o Capacidad de ajuste y predictiva: R2 , EPAM, EPF, etc Para contrastar la hipótesis de que lo relevante para la demanda de agua es la renta per capita de la ciudad, se plantea la hipótesis de que α1 =-α2 . La estimación de MCO del modelo incorporando esa hipótesis proporciona estos resultados: Dependent Variable: LDAIG Method: Least Squares Sample: 1980:05 1999:12 Included observations: 236 Variable Coefficient Std. Error t-Statistic Prob. C LRENDA-LPOBL LDAIG(-1) 7.313429 -0.406561 0.882648 2.235406 0.116483 0.029707 3.271633 -3.490291 29.71177 0.0012 0.0006 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.792995 0.791218 19.58852 89404.48 -1035.447 2.606361 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 61.93046 42.87014 8.800395 8.844427 446.2874 0.000000 Contrasta dicha hipótesis mediante un test de Razón de Verosimilitud. Asimismo, utiliza los resultados proporcionados por los criterios de información para discutir la validez de la citada hipótesis. (3/4 punto) • • • • Para efectuar el contraste de RV de la citada hipótesis se requiere la estimación tanto del modelo no restringido como del restringido. Dado que disponemos de ambas estimaciones y del valor del log de la verosimilut para cada uno de ellos, lo podemos calcular como sigue: RV=-2(lnLR – ln LNR)=-2(-1035.447-(-1015.577))=39.74 Bajo la hipótesis nula de que α1 =-α2 , el RV~χ2 (1), por lo que claramente el resultado del contraste nos lleva a rechazar la hipótesis nula. Este resultado se vería refrendado por la información proporcionada por los criterios de información. Tanto el AIC como el SC nos proporcionan un valor menor en el caso del modelo general, lo que nos llevaría a seleccionar esa especificación. D) A continuación se reproducen los correlogramas de la FAS y FAP muestrales correspondientes al logaritmo de la serie mensual de importaciones de una economía (LM) y de la primera diferencia regular de la misma D(LM). 9) Es LM estacionaria en la componente regular? Y en la estacional? Justifica la respuesta. (1 punto) Correlogramas de LM Autocorrelation .|******** .|******** .|*******| .|*******| .|*******| .|*******| .|*******| .|*******| .|*******| .|*******| .|*******| .|*******| .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|****** | .|***** | .|***** | .|***** | .|***** | .|***** | .|***** | .|***** | .|***** | .|***** | .|***** | .|**** | .|**** | Correlogramas de D(LM) Partial Correlation .|******** .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | .|. | Autocorrelation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 .|***** .|*** .|*** .|* .|. .|. *|. **|. **|. **|. ***|. ****|. **|. **|. *|. *|. .|. .|. .|* .|* .|* .|* .|. .|. *|. .|. .|. .|. .|. .|. .|. .|. .|. .|. .|. .|. Partial Correlation | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | .|***** .|* .|. *|. .|. *|. *|. *|. *|. *|. *|. ***|. .|*** *|. .|. .|. .|. .|. .|. .|. *|. *|. *|. **|. .|* .|. .|. .|. .|. .|. .|. .|. .|. *|. *|. .|. | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 * El correlograma de la FAS y FAP de la serie en niveles (LM) presenta la estructura típica de los de un proceso no estacionario en la componente regular. Teóricamente la FAS presentará todos los coeficientes igual a 1 y la FAP sólo tendrá el primero distinto de 0 e igual a 1. El correlograma muestral mostrará coeficientes en la FAS próximos a la unidad y con decrecimiento lento, y el primero de la FAP próximo a la unidad. Tras ser diferenciada en la parte regular los correlogramas nos indican que estamos ante una serie estacionaria en la componente regular y que no hay indicios de no estacionariedad en la estacional. En resumen, LM no parece estacionaria en la componente regular aunque sí en la estacional. 9) Propón un proceso estocástico (modelo ARIMA) susceptible de haber generado a LM, argumentando su elección. (1 punto) • Tras la diferenciación en la componente regular, se aprecia una estructura de decrecimiento en la FAS y el primer coeficiente de la FAP como claramente significativo. En consecuencia se podría plantear un AR(1) para la componente regular. Otra opción sería considerar que el segundo coeficiente de FAP también es significativo y proponer un AR(2). No obstante aplicando el principio de parsimonia, quizás sería más razonable comenzar con el proceso menos parametrizado, es decir el AR(1). • Por lo que respecta a la componente estacional, se observa como el coeficiente 12 es el único significativo en la FAS, mientras que en la FAP podría suponerse una estructura de decrecimiento en los coeficientes múltiplos de 12 (estacionales). Eso nos llevaría a sugerir un MA(1)12 para la componente estacional. • En resumen, un posible proceso estocástico generador de la serie temporal sería: ARIMA(1,1,0)(0,0,1)12 11) A partir del siguiente proceso estocástico: (1-0.5L)Xt =2 + εt , donde εt ~N(0,1), a) ¿se trata de un proceso estacionario? Justifica la respuesta (1/2 punto) Sí, dado que la raíz del polinomio autorregresivo (1-0.5L) se encuentra fuera del círculo unidad, al ser el coeficiente |φ|<1 b) obtén el valor esperado y la varianza del proceso (1/2 punto) • Dado que Xt se puede representar como: X t = • * E ( X t ) = E( εt 2 + , 1 − 0 .5 L 1 − 0. 5L εt 2 2 + )= =4 1 − 0 .5 L 1 − 0. 5L 1 − 0. 5 [ ] [ ] γ 0 = E (X t − E( X t )) 2 = E ( 2 + 0 .5 X t −1 + ε t − 2 ) 2 = ... = 0 .5 2 γ 0 + σ 2ε , por lo que • * γ0 = σ 2ε 1 − 0. 5 2 = 1 = 1 .333 0 .75 c) • • • calcula los coeficientes de la FAS y FAP para ese proceso y represéntalos en correlogramas (1/2 punto) Coeficientes de la FAS para un AR(1): ρ k =φk , por tanto: ρ 1 =0.5, ρ 2 =0.25, ρ 3 =0.125, ... Coeficientes de FAP para un AR(1): φ11 =ρ 1 =0.5, φkk =0 ∀k>1 Por tanto, los correlogramas: 0.5 0.5 1 Por favor no sobrepasar esta línea en las respuestas