Tema 3. Regresores Endógenos. 1. Introducción Bibliografía: Wooldridge, 15.1, 15.4 y 16.2 En este tema vamos a estudiar el modelo lineal con regresores potencialmente endógenos. Veremos primero las consecuencias que tiene sobre el estimador MCO el hecho de que alguno de los regresores del modelo sea endógeno, analizando algunos ejemplos de modelos lineales con regresores endógenos. Después introduciremos un estimador apropiado para el modelo lineal con regresores endógenos. Finalmente estudiaremos cómo contrastar si los regresores del modelo son endógenos. Se dice que un regresor es endógeno si está correlacionado con el término de error del modelo. Por el contrario el regresor se dice que es exógeno si no está correlacionado con el término de error del modelo. Es decir, si consideramos el modelo lineal Yt = Xt0 β + ut = β1 + β2 X2t + .. + βj Xjt + .. + βk Xkt + ut Xjt es endógeno Cov(Xjt , ut ) = 0 se dice que exógeno si si Cov(Xjt , ut ) 6= 0, y, por el contrario, se dice que Nótese que, utilizando la ley de las esperanzas iteradas, el supuesto (a) implica que E (Xt ut ) = 0 Xjt es E (ut |Xt ) = 0 y por tanto para que se verique el supuesto (a) necesitamos que todos los regresores del modelo sean exógenos. Por consiguiente, si al menos uno de los regresores es endógeno, no se vericará el supuesto (a) y, como vimos en el Tema 1, el estimador MCO será un estimador sesgado e inconsistente. 2. Modelos con regresores endógenos 2.1. Variables omitidas Consideremos el siguiente modelo para el salario de los trabajadores log(wt ) = β1 + β2 educt + β3 abilt + ut donde wt es el salario, educt son los años de educación y abilt es la habilidad que general- mente es una variable inobservable. Suponemos que este modelo verica los supuestos del modelo de regresión con observaciones iid; en particular, se satisface el supuesto (a). Pero si abilt es inobservable podemos incluirla en el término de error y considerar el modelo log(wt ) = β1 + β2 educt + εt (1) Si la habilidad inobservable está correlacionada con la educación, puesto que el termino de error del modelo (1) incluye la habilidad inobservable, tendremos que 1 Cov(educt , εt ) 6= 0 y por tanto educt será endógena en el modelo por MCO la ecuación (1) (1). Si educt es endógena y estimamos obtendremos un estimador inconsistente de los parámetros del modelo. 2.2. Errores de medida Consideremos el modelo lineal con un único regresor que satisface el supuesto (a) del modelo de regresión con datos iid Yt = βXt + ut , donde la variable para t = 1, 2, ..T Xt es exógena, es decir E(Xt ut ) = 0. Supongamos que la variable Xt está Xt sino que observamos Xt∗ = Xt + ωt , medida con error, es decir nosotros no observamos donde ωt es el error de medida que verica E(ωt ) = E(Xt ωt ) = E(ut ωt ) = 0 Sustituyendo Xt en el modelo Yt = β(Xt∗ − ωt ) + ut = βXt∗ − βωt + ut = βXt∗ + vt y E(Xt∗ vt ) = E [(Xt + ωt )(ut − βωt )] = E(Xt ut )−βE(Xt ωt )+E(ωt ut )−βE(ωt2 ) = −βσω2 6= 0 Por tanto de β. Xt∗ es endógena y el estimador MCO de Yt en Xt∗ no es un estimador consistente Obsérvese que: P ∗ P ∗ X vt Xt Yt b β = P ∗ 2 = β + P t∗ 2 = (X ) (Xt ) P ∗ t 1 X vt βσω2 β + 1T P t∗ 2 −→p β − 6= β. (Xt ) E((Xt∗ )2 ) T En general, en un modelo de regresión múltiple basta con que una de las variables explicativas esté medida con error para que todas las componentes del estimador MCO sean inconsistentes. Si la variable dependiente presenta errores de medida y las variables explicativas son exógenas y no presentan errores de medida, entonces el estimador MCO es consistente. 2.3. Simultaneidad Consideremos ahora el sistema de ecuaciones simultáneas (1) : Y1t = α12 Y2t + β11 X1t + β12 X2t + .. + β1k Xkt + u1t (2) : Y2t = α21 Y1t + β21 X1t + β22 X2t + .. + β2k Xkt . + u2t 2 (1) (2) Como Y2t depende de correlacionado con Y1t u1t , por la ecuación (2), e y por tanto Y2t Y1t está correlacionado con u1t , Y2t está es endógeno en la ecuación (1). Análogamente Y1t es endógena en la ecuación (2). Ejemplo: Consideremos el caso habitual de un modelo de equilibrio de mercado: qdt = α1 pt + α2 yt + udt qst = β1 pt + ust qdt = qst Ecuación de demanda: Ecuación de oferta: Condición de equilibrio: y es renta que se supone determinada fuera del modelo lo que hace que sea exógena y 2 2 suponemos que E [udt |yt ] = E [ust |yt ] = 0; V ar [udt |yt ] = σd ; V ar [ust |yt ] = σs ; E [udt ust |yt ] = 0. Resolviendo para p: donde pt = udt − ust α2 yt + = πyt + νt . β1 − α1 β1 − α1 Tenemos entonces que Cov (pt , udt ) = Cov (pt , ust ) = σd2 6= 0 β1 −α1 σs2 − β1 −α1 6= 0 y por tanto el precio es endógeno tanto en la ecuación de oferta como en la ecuación de demanda. 3. El estimador de variables instrumentales Bibliografía: Wooldridge, 15.1-15.3 3.1. El modelo lineal simple Consideremos el modelo lineal simple Y t = β1 + β2 Xt + u t (1) E(ut ) = 0 (nótese que este supuesto no es restrictivo ya que el modelo incluye β1 se dene como β1 = E(Yt ) − β2 E(Xt )). En este modelo la variable Xt es endógena si Cov(Xt , ut ) = E(Xt ut ) 6= 0. Si la variable Xt es 0 endógena sabemos que el estimador MCO de β = (β1 , β2 ) no es consistente. Para poder obtener un estimador consistente de β necesitamos información adicional. En concreto necesitamos encontrar al menos una variable Zt que no esté correlacionada con el término de error y que esté correlacionada con Xt , es decir que verique: para el que un término constante y por tanto 1. Cov(Zt , ut ) = 0 2. Cov(Zt , Xt ) 6= 0 3 Si Zt para verica los supuestos Xt en el modelo 1 y 2 se dice Zt es una variable instrumental o un instrumento (1). Vamos a empezar estudiando el caso en el que tenemos un único instrumento (modelo exactamente identicado), y posteriormente introduciremos el caso en el que tengamos más de un instrumento (modelo sobreidenticado). Vamos a ver ahora que bajo los supuestos 1 y 2 los parámetros β2 y β1 están identi- 1: cados. Utilizando el supuesto Cov(Zt , Yt ) = β2 Cov(Zt , Xt ) + Cov(Zt , ut ) = β2 Cov(Zt , Xt ) puesto que Cov(Zt , Xt ) 6= 0 por el supuesto 2, el parámetro β2 está denido en la población por β2 = Cov(Zt , Yt ) Cov(Zt , Xt ) El estimador de variables instrumentales (VI) de momentos 1 T βbV I,2 = 1 T donde Z = 1 T T P Zt , Y = t=1 instrumentales de T P (2) β2 T P (Zt − Z)(Yt − Y ) t=1 T P (Zt − Z)(Yt − Y ) t=1 T P = (Zt − Z)(Xt − X) (Zt − Z)(Xt − X) t=1 1 T se obtiene aplicando el método de los t=1 T P Yt t=1 β1 , puesto que y X = 1 T T P Xt . En cuanto al estimador de variables t=1 E(ut ) = 0, β1 = E(Yt ) − β2 E(Xt ) utilizando el método de los momentos βbV I,1 = Y − βbV I,2 X Se puede demostrar que el estimador VI de β es consistente y asintóticamente normal y, en general, es posible obtener un estimador consistente de la varianza límite lo que nos permitirá hacer inferencia (estos resultados se demostrarán en el contexto del modelo de regresión múltiple). Es importante resaltar el papel asimétrico que juegan los supuestos que el supuesto regresión de Xt 1 no es contrastable, el supuesto sobre 2 1 y 2. Mientras sí lo es. Consideremos el modelo de Zt Xt = π1 + π2 Zt + vt (3) puesto que π2 = el supuesto 2 es equivalente a que Cov(Zt , Xt ) , V ar(Zt ) π2 6= 0. Por tanto para contrastar este supuesto con- trastaremos H0 : π2 = 0 H1 : π2 6= 0 4 (3). utilizando el estimador MCO del modelo Si rechazamos la hipótesis nula tendremos evidencia suciente de que se verica el supuesto Puesto que el supuesto 1 2. no es contrastable debe utilizarse la teoría económica u otro tipo de consideraciones para justicar su validez. Por ejemplo, supongamos que queremos estimar los rendimientos de la educación mediante la ecuación log(wt ) = β1 + β2 educt + ut En este tipo de ecuaciones, el término de error representa en parte la habilidad inobservable de los individuos. Hay mucha evidencia empírica que demuestra que la habilidad está correlacionada con la educación, ya que los individuos deciden los años de educación dependiendo de su habilidad. En algunos estudios empíricos se ha utilizado el mes de nacimiento como instrumento para el nivel de educación. Es claro que el mes de nacimiento no está correlacionado con la habilidad de los individuos y por tanto verica el supuesto 1. El problema potencial de este instrumento es si verica el supuesto 2, es decir si está correlacionado con el nivel de educación. Vamos a analizar ahora las consecuencias que tiene sobre las propiedades del estimador VI el que no se verique el supuesto 1. Vamos a calcular entonces el límite en probabilidad de βbV I,2 cuando la covarianza entre 1 T βbV I,2 = 1 T T P t=1 T P = (Zt − Z)(Xt − X) 1 T y ut 1 T t=1 = β2 + Zt 1 T (Zt − Z)(Yt − Y ) 1 T Si Zt T P y ut T P 1 T (Zt − Z)Yt t=1 T P = T P 1 T (Zt − Z)Xt →p β2 + (Zt − Z)Xt (Zt − Z)(β1 + β2 Xt + ut ) t=1 t=1 (Zt − Z)ut t=1 T P no es necesariamente cero T P = (Zt − Z)Xt t=1 Corr(Zt , ut ) σu Cov(Zt , ut ) = β2 + Cov(Zt , Xt ) Corr(Zt , Xt ) σX t=1 no están correlacionadas, es decir si se verica el supuesto es consistente. Sin embargo, si la correlación entre pequeña, si la correlación entre probabilidad de βbV I,2 Zt y Xt Zt y ut 1, el estimador VI no es cero, aunque sea muy está próxima a cero, la diferencia entre el límite en y el verdadero valor del parámetro (lo que se denomina el sesgo de consistencia) puede ser muy grande. Este resultado resalta la importancia de contrastar el supuesto 2, ya que si podemos garantizar que la correlación entre Zt y Xt no está próxima a cero, el sesgo asintótico del estimador VI, si existe será pequeño, siempre y cuando, claro está, la correlación entre Zt y ut esté muy próxima a cero. El estimador MCO es un estimador de variables instrumentales que utiliza instrumento. El límite en probabilidad de βbM CO,2 Xt como es σu βbM CO,2 →p β2 + Corr(Xt , ut ) σX ut no están correlacionados, el estimador MCO es consistente. Cuando tanto Xt y ut como Zt y ut están correlacionados el estimador MCO será preferible al VI (en términos Si Xt y 5 de sesgo asintótico) si es decir si Xt Corr(Zt ,ut ) |Corr(Xt , ut )| < Corr(Zt ,Xt ) . Si Xt y ut no están correlacionados, es exógena, el estimador MCO es consistente y si se verican los demás supuestos básicos, el estimador MCO es más eciente (asintóticamente) que cualquier estimador VI. 3.2. El modelo lineal múltiple con una única variable endógena Consideremos el modelo lineal múltiple Yt = Xt0 β + ut = β1 + β2 X2t + .. + βk Xkt + ut donde β = (β1 , β2 , ..βk )0 y tiene media cero y que las Xt = (1, X2t , .., Xkt )0 . Supondremos que el término variables X2t , .., Xk−1,t son exógenas, es decir E(ut ) = 0 Cov(Xjt , ut ) = E(Xjt ut ) = 0, y Xk de error j = 2, ..k − 1 es potencialmente endógena, es decir la covarianza entre Xkt y ut puede ser dis- tinta de cero. Análogamente al caso del modelo lineal simple, para poder obtener un 0 estimador consistente de β = (β1 , β2 , ..βk ) necesitamos una variable adicional Zkt que no esté correlacionada con el término de error, es decir que verique que 1. Cov(Zkt , ut ) = E(Zkt ut ) = 0 Si denimos el vector que denen el vector Zt = (1, X2t , .., Xk−1,t , Zkt )0 β tenemos k condiciones de momentos en la población E(ut ) = 0 E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0, Cov(Zkt , ut ) = E(Zkt ut ) = 0 j = 2, .., k − 1 (4) El estimador de variables instrumentales se obtiene por el método de los momentos. Las condiciones de momentos poblacionales (4)se pueden escribir como E(Zt ut ) = E(Zt (Yt − Xt0 β) = E(Zt Yt ) − E(Zt Xt0 )β = 0 Si la matriz E(Zt Xt0 ) es no singular, es decir si se verica 2. |E(Zt Xt0 )| = 6 0 el vector de parámetros β está denido en la población por β = E(Zt Xt0 )−1 E(Zt Yt ) Nótese que este supuesto 2 es el análogo al supuesto simple. 6 (5) 2 que hacíamos en el modelo lineal El estimador de variables instrumentales de de los momentos a la condición βbV I = donde Z el vector T 1X Zt Xt0 T t=1 !−1 β se obtiene entonces aplicando el método (5) T 1X Zt Yt = T t=1 T X !−1 Zt Xt0 T X X son las matrices T × k, Z = (Z1 , Z2 , .., ZT )0 T × 1, Y = (Y1 , Y2 , .., YT )0 . y X = (X1 , X2 , .., XT )0 , Al igual que en el modelo de regresión simple, el supuesto 2 si lo es. El supuesto 2 Z 0Y t=1 t=1 y tras que el supuesto −1 Zt Yt = (Z 0 X) 1 e Y es no es contrastable mien- en el modelo de regresión simple era que el instrumento estuviera correlacionado con la variable explicativa. Ahora no basta con Cov(Zkt , Xkt ) 6= 0, ya que claramente si consideráramos Zkt igual a una combinación X2t , .., Xk−1,t , aunque Zkt estuviera correlacionada con Xkt , no nos serviría como 0 instrumento ya que en ese caso la matriz Zt Xt tendría rango k − 1 y por tanto la matriz 0 E(Zt Xt ) sería singular. El supuesto 2 ahora es equivalente a decir que Xkt esté parcialmente correlacionada con Zkt una vez que tenemos en cuenta la correlación entre Xkt y que lineal de las restantes variables explicativas del modelo. Análogamente al caso del modelo lineal 2 estimando un modelo auxiliar. Consideramos el sobre una constante, X2t , .., Xk−1,t , Zkt simple, podemos contrastar el supuesto modelo de regresión múltiple de Xkt Xkt = π1 + π2 X2t + .. + πk−1 Xk−1,t + πk Zkt + vt Se puede demostrar que el supuesto 2 (6) es equivalente a que el coeciente de Zkt en (6) sea distinto de cero. Por tanto para contrastar este supuesto contrastaremos H0 : πk = 0 H1 : πk 6= 0 utilizando el estimador MCO del modelo (6). Si rechazamos la hipótesis nula tendremos evidencia suciente de que se verica el supuesto 2. Supongamos ahora que tenemos dos instrumentos válidos Zk1t y Zk2t , podríamos uti- lizar cualquiera de los dos como instrumento y obtener así dos estimadores de VI distintos. Sin embargo, se puede demostrar que, en general, es posible obtener un estimador más eciente combinando los instrumentos disponibles. Dado que X2t , .., Xk−1,t , Zk1t y Zk2t no están correlacionadas con el término de error, cualquier combinación lineal de estas variables ∗ Zkt = π1 + π2 X2t + .. + πk−1 Xk−1,t + πk1 Zk1t + πk2 Zk2t tampoco estará correlacionada con el término de error y por tanto vericará el supuesto 1. De esta forma vemos que podemos calcular innitos estimadores de variables instrumentales utilizando distintas ponderaciones de las variables exógenas. La pregunta es ¾Cuál de todas estas combinaciones lineales da lugar al estimador asintóticamente más eciente?. Se puede demostrar que si el término de error ut es homocedástico el estimador VI más eciente se obtiene utilizando bkt = π X b1 + π b2 X2t + .. + π bk−1 Xk−1,t + π bk1 Zk1t + π bk2 Zk2t 7 π b = (b π1 , π b2 , .., π bk−1 , π bk1 , π bk2 )0 es el estimador MCO de la regreconstante, X2t , .., Xk−1,t , Zk1t y Zk2t . El estimador VI que utiliza como instrumento, donde sión de bkt X Xkt sobre una como instrumento se denomina estimador de mínimos cuadrados en dos etapas. En este caso para contrastar el supuesto 2 tenemos que considerar el modelo Xkt = π1 + π2 X2t + .. + πk−1 Xk−1,t + πk1 Zk1t + πk2 Zk2t + vt Se puede demostrar que el supuesto conjuntamente signicativas en (7). 2 (7) es equivalente a que las variables Zk1t y Zk1t sean 2 contrastare- Por tanto para contrastar el supuesto mos H0 : πk1 = 0, πk2 = 0 H1 : πk1 6= 0 y/o πk2 6= 0 utilizando el estimador MCO del modelo (7). Si rechazamos la hipótesis nula tendremos evidencia suciente de que se verica el supuesto 3.3. 2. El modelo lineal múltiple con varias variables endógenas Consideremos el modelo lineal múltiple Yt = Xt0 β + ut = β1 + β2 X2t + .. + βk Xkt + ut donde β = (β1 , β2 , ..βk )0 y tiene media cero y que las Xt = (1, X2t , .., Xkt )0 . Supondremos que el variables X2t , .., Xlt son exógenas, es decir E(ut ) = 0 Cov(Xjt , ut ) = E(Xjt ut ) = 0, término de error j = 2, ..l Xl+1,t , .., Xk son potencialmente endógenas, es decir la covarianza entre Xjt y ut , j = l + 1, .., k puede ser distinta de cero. Análogamente al caso de una sola variable explicativa 0 endógena, para poder obtener un estimador consistente de β = (β1 , β2 , ..βk ) necesitamos ahora k − l variables adicionales Zl+1,t , .., Zkt que no estén correlacionadas con el término y de error, es decir que veriquen que 1. Cov(Zjt , ut ) = E(Zjt ut ) = 0, j = l + 1, .., k Zt = (1, X2t , .., Xlt , Zl+1,t , ..Zkt )0 tenemos k condiciones de momentos vector β en la población Si denimos el vector que denen el E(ut ) = 0 E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0, Cov(Zjt , ut ) = E(Zjt ut ) = 0, j = 2, .., l j = l + 1, .., k El estimador de variables instrumentales se obtiene de nuevo por el método de los momentos. Igual que en el caso de una sola variable explicativa endógena, las condiciones de momentos poblacionales se pueden escribir como E(Zt ut ) = E [Zt (Yt − Xt0 β)] = E(Zt Yt ) − E(Zt Xt0 )β = 0 8 Si la matriz E(Zt Xt0 ) es no singular, es decir si se verica 2. |E(Zt Xt0 )| = 6 0 el vector de parámetros β está denido en la población por β = E(Zt Xt0 )−1 E(Zt Yt ) y el estimador VI tiene la misma expresión que en la sección anterior. La diferencia fundamental entre el caso de una sola variable explicativa endógena y el caso de varias variables explicativas endógenas es que en este último caso el supuesto 2 no se puede expresar de forma sencilla en términos de los coecientes de un modelo auxiliar, y por tanto, no es tan fácilmente contrastable como lo era en el modelo con una única variable explicativa endógena. Nótese que si contrastamos la signicatividad conjunta de Zjt , j = l + 1, .., k en cada una de las regresiones Xjt = πj1 + πj2 X2t + .. + πjl Xlt + πj,l+1 Zl+1,t + .. + πjk Zkt + vjt , j = l + 1, .., k y rechazamos la nula en todas ellas, esto no sería suciente para garantizar que se verica el supuesto 2, ya que por ejemplo, si πjk = 0, j = l + 1, .., k, Zkt no estaría parcialmente correlacionada con ninguna de las variables endógenas y por tanto no tendríamos sucientes instrumentos. Existen métodos para contrastar el supuesto 2 cuando hay más de una variable endógena pero no los vamos a ver en este curso. 3.4. Propiedades asintóticas del estimador de variables instrumentales Consistencia del estimador VI Si se verican los supuestos E(ut ) = 0 (1) E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0, Cov(Zjt , ut ) = E(Zjt ut ) = 0, P 1 0 6 0 Zt Xt →p E(Zt Xt0 ) = ΣZX , |ΣZX | = (2) T j = 2, .., l j = l + 1, .., k entonces el estimador VI es consistente. Demostración: βbV I = β + −1 X 1X 1 0 Zt Xt Zt ut T T Consideremos la sucesión de vectores aleatorios Wt Wt = Zt ut . Puesto que los vectores son iid y todos tienen media cero (por el supuesto 1), utilizando la ley de los grandes números tenemos que T 1X Zt ut →p 0 T t=1 9 (1) Por otra parte, utilizando el supuesto 2 1X Zt Xt0 →p ΣZX T Como |ΣZX | = 6 0, por el teorema de la función continua Utilizando (1) y (2) −1 1X 0 Zt Xt →p Σ−1 ZX T (2) tenemos βbV I = β + −1 X 1X 1 0 Zt Xt Zt ut →p β T T Normalidad asintótica del estimador VI Si se cumplen las condiciones: E(ut ) = 0 (1) E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0, Cov(Zjt , ut ) = E(Zjt ut ) = 0, P Zt Xt0 →p E(Zt Xt0 ) = ΣZX , |ΣZX | = 6 0 (2) T1 2 2 (3) E(u Pt |Zt ) 0= σ 0 1 (4) T Zt Zt →p E(Zt Zt ) = ΣZ > 0 entonces j = 2, .., l j = l + 1, .., k √ −1 0 T βbV I − β →d N (0, σ 2 Σ−1 ZX ΣZ ΣZX ). Demostración: −1 1 X √ √ 1X 0 b T βV I − β = T Z t Xt Zt ut ; T T Consideremos la sucesión de vectores aleatorios Wt = Zt ut , ya sabemos que 0 E(Wt ) = 0 0 V ar(Wt ) = V ar(Zt ut ) = E(u2t Zt Zt ) = E(E(u2t Zt Zt |Zt )) 0 0 = E(E(u2t |Zt )Zt Zt ) = σ 2 E(Zt Zt ) = σ 2 ΣZ . Puesto que los vectores Wt son iid y todos tienen media cero y varianza el Teorema Central del Límite √ 1X Zt ut →p N (0, σ 2 ΣZ ) T T Por otra parte, utilizando el supuesto 2 1X Zt Xt0 →p ΣZX T 10 (1) σ 2 ΣZ , utilizando Como |ΣZX | = 6 0, por el teorema de la función continua Utilizando (1) y (2) −1 1X 0 Zt Xt →p Σ−1 ZX T (2) tenemos √ −1 0 T βbV I − β →d N (0, σ 2 Σ−1 ZX ΣZ ΣZX ). Como ya mencionamos anteriormente el estimador MCO es un estimador VI que utiliza Xt como vector de instrumentos. Si todos los regresores son exógenos el estimador MCO es consistente, y si se verican los demás supuestos, el estimador MCO es asintóticamente más eciente que cualquier otro estimador VI. 2 Estimador de σ . 1X 0 (Yt − Xt βbV I )2 . T σ bV2 I = Se puede demostrar que σ bV2 I es un estimador consistente de σ2. La varianza estimada del estimador VI se obtiene utilizando un estimador consistente de la varianza asintótica. Puesto que 1 T 1 T P P 6 0 Zt Xt0 →p ΣZX , |ΣZX | = 0 Zt Zt0 →p E(Zt Zt ) = ΣZ > 0 σ bV2 I →p σ 2 La varianza estimada del estimador VI es σ b2 \ var(βbV I ) = V I T −1 X X −1 1X 1 1 0 0 0 Zt Xt Zt Zt Xt Z t T T T = σ bV2 I (Z 0 X) 4. −1 −1 (Z 0 Z) (X 0 Z) Contrastes de hipótesis con el estimador VI Bibliografía: Wooldridge, 15.1 Supongamos que queremos contrastar: H0 : Rβ = r H1 : Rβ 6= r donde R es una matriz cumplen los supuestos q × k , y r es un vector q × 1, ambos conocidos. (1) a (4) sabemos que √ −1 0 T βbV I − β ' N (0, σ 2 Σ−1 Σ Σ Z ZX ). ZX 11 Suponiendo que se Multiplicando por la izquierda por √ Bajo H0 R −1 0 0 T (RβbV I − Rβ) ' N (0, σ 2 RΣ−1 ZX ΣZ ΣZX R ) √ −1 0 0 T (RβbV I − r) ' N (0, σ 2 RΣ−1 ZX ΣZ ΣZX R ) (1) Puesto que σ bV2 I 1 0 ZX T −1 1 ( Z 0 Z) T Multiplicando por la izquierda por σ bV2 I R 1 0 ZX T −1 1 ( Z 0 Z) T R 1 0 XZ T −1 −1 →p σ 2 Σ−1 ZX ΣZ ΣZX y por la derecha por 1 0 XZ T −1 0 R0 −1 0 0 R0 →p σ 2 RΣ−1 ZX ΣZ ΣZX R (2) (1), (2) y el ejemplo 5 del Tema 1 tenemos que el estadístico de contraste es 0 √ −1 1 0 −1 0 −1 √ 1 0 1 2 0 b b σ bV I R T Z X ( T Z Z) T X Z R T RβV I − r W = T RβV I − r 0 −1 = RβbV I − r σ RβbV I − r = bV2 I R (Z 0 X)−1 (Z 0 Z) (X 0 Z)−1 R0 −1 0 \ 0 b b = R βV I − r Rvar(βV I )R RβbV I − r ' χ2q , bajo H0 . Utilizando Así, para un nivel de signicación α W > χ2q,α . bV I − r bien, dado Rβ rechazaremos H0 si q = 1 podemos utilizar el estadístico W o es un escalar, utilizando (1), (2) y el ejemplo 6 del Tema 1 podemos construir el estadístico de contraste Si RβbV I − r ' N (0, 1) t= q \ 0 b Rvar(βV I )R Bajo H0 Con este estadístico podemos hacer contrastes de una y dos colas (especicar las regiones críticas en los contrastes de una cola y dos colas). En particular, si queremos contrastar una única restricción del tipo: H0 : βj = βj0 H1 : βj 6= βj0 , el estadístico de contraste es βbV Ij − βj0 t= ' N (0, 1) SE(βbV Ij ) donde SE(βbV Ij ) es el error estándar de βbV Ij , es decir la raíz cuadrada del elemento de la matriz de varianzas estimada del estimador VI. 12 Bajo H0 (j, j) 5. Contraste de endogeneidad Bibliografía: Wooldridge, 15.5 Consideremos el modelo de regresión lineal con un único regresor potencialmente endógeno: Yt = β1 + β2 X2t + ... + βk Xkt + ut , (1) donde E(ut ) = 0 E(Xjt ut ) = 0, y Xkt j = 2, ..k − 1 es potencialmente endógena. Queremos contrastar si efectivamente Xkt es o no endógena, es decir queremos contrastar H0 : E(Xkt ut ) = 0 H1 : E(Xkt ut ) 6= 0 Supongamos que Zkt Zkt ), es exógena) es endógena) es un instrumento válido, es decir el modelo de regresión de instrumento (Xkt (Xkt Xkt E(Zkt ut ) = 0 y consideremos sobre todas las variables exógenas del modelo (incluido el es decir Xkt = π1 + π2 X2t + ... + πk−1 Xk−1t + πk Zkt + vt , (2) como las variables explicativas de este modelo no están correlacionadas con exógena si y solo si regresión de ut vt sobre y ut es no están correlacionados. Por tanto si escribimos el modelo de vt ut = γvt + εt , Xkt ut , Xkt es exógena si y solo si γ = 0. Substituyendo (3) (3) en (1) Yt = β1 + β2 X2t + ... + βk Xkt + γvt + εt , y por tanto contrastar si Xkt es endógena es equivalente a contrastar si γ 6= 0. El problema que presenta este contraste es que no se puede llevar a cabo en la practica ya que vt no es observable. Sin embargo, se puede demostrar que el contraste se puede realizar reemplazando los errores vt por los residuos MCO de la regresión (2). De forma que nalmente el contraste de endogeneidad consiste en contrastar H0 : γ = 0 H1 : γ 6= 0 en el modelo Yt = β1 + β2 X2t + ... + βk Xkt + γb vt + ε∗t , donde vbt son los residuos MCO de la regresión signicatividad individual de la variable robusto a heterocedasticidad. vbt (2). Este contraste es un contraste de y se puede utilizar el estadístico de contraste 13 Cuando haya más de una variable potencialmente endógena el contraste de endogeneidad consiste en: Paso1: Para cada variable potencialmente endógena, estimar por MCO el modelo de regresión de dicha variable sobre todas las variables exógenas (incluidos los instrumentos) y calcular los residuos. Paso 2: Estimar por MCO un modelo ampliado que incluya todas las variables explicativas originales y los residuos de las regresiones del paso 1, y contrastar la signicatividad conjunta de todos los residuos de esta regresión ampliada. 14