Tema 3. Regresores Endógenos.

Anuncio
Tema 3. Regresores Endógenos.
1.
Introducción
Bibliografía: Wooldridge, 15.1, 15.4 y 16.2
En este tema vamos a estudiar el modelo lineal con regresores potencialmente endógenos.
Veremos primero las consecuencias que tiene sobre el estimador MCO el hecho de que alguno de los regresores del modelo sea endógeno, analizando algunos ejemplos de modelos
lineales con regresores endógenos. Después introduciremos un estimador apropiado para
el modelo lineal con regresores endógenos. Finalmente estudiaremos cómo contrastar si
los regresores del modelo son endógenos.
Se dice que un regresor es endógeno si está correlacionado con el término de error del
modelo. Por el contrario el regresor se dice que es exógeno si no está correlacionado con
el término de error del modelo. Es decir, si consideramos el modelo lineal
Yt = Xt0 β + ut = β1 + β2 X2t + .. + βj Xjt + .. + βk Xkt + ut
Xjt es endógeno
Cov(Xjt , ut ) = 0
se dice que
exógeno si
si
Cov(Xjt , ut ) 6= 0,
y, por el contrario, se dice que
Nótese que, utilizando la ley de las esperanzas iteradas, el supuesto (a)
implica que
E (Xt ut ) = 0
Xjt
es
E (ut |Xt ) = 0
y por tanto para que se verique el supuesto (a) necesitamos
que todos los regresores del modelo sean exógenos. Por consiguiente, si al menos uno de
los regresores es endógeno, no se vericará el supuesto (a) y, como vimos en el Tema 1, el
estimador MCO será un estimador sesgado e inconsistente.
2.
Modelos con regresores endógenos
2.1.
Variables omitidas
Consideremos el siguiente modelo para el salario de los trabajadores
log(wt ) = β1 + β2 educt + β3 abilt + ut
donde
wt
es el salario,
educt
son los años de educación y
abilt
es la habilidad que general-
mente es una variable inobservable. Suponemos que este modelo verica los supuestos del
modelo de regresión con observaciones iid; en particular, se satisface el supuesto (a). Pero
si
abilt
es inobservable podemos incluirla en el término de error y considerar el modelo
log(wt ) = β1 + β2 educt + εt
(1)
Si la habilidad inobservable está correlacionada con la educación, puesto que el termino de
error del modelo
(1)
incluye la habilidad inobservable, tendremos que
1
Cov(educt , εt ) 6= 0
y por tanto
educt
será endógena en el modelo
por MCO la ecuación
(1)
(1).
Si
educt
es endógena y estimamos
obtendremos un estimador inconsistente de los parámetros del
modelo.
2.2.
Errores de medida
Consideremos el modelo lineal con un único regresor que satisface el supuesto (a) del
modelo de regresión con datos iid
Yt = βXt + ut ,
donde la variable
para
t = 1, 2, ..T
Xt es exógena, es decir E(Xt ut ) = 0. Supongamos que la variable Xt está
Xt sino que observamos Xt∗ = Xt + ωt ,
medida con error, es decir nosotros no observamos
donde
ωt
es el error de medida que verica
E(ωt ) = E(Xt ωt ) = E(ut ωt ) = 0
Sustituyendo
Xt
en el modelo
Yt = β(Xt∗ − ωt ) + ut = βXt∗ − βωt + ut = βXt∗ + vt
y
E(Xt∗ vt ) = E [(Xt + ωt )(ut − βωt )] = E(Xt ut )−βE(Xt ωt )+E(ωt ut )−βE(ωt2 ) = −βσω2 6= 0
Por tanto
de
β.
Xt∗
es endógena y el estimador MCO de
Yt
en
Xt∗
no es un estimador consistente
Obsérvese que:
P ∗
P ∗
X vt
Xt Yt
b
β = P ∗ 2 = β + P t∗ 2 =
(X )
(Xt )
P ∗ t
1
X vt
βσω2
β + 1T P t∗ 2 −→p β −
6= β.
(Xt )
E((Xt∗ )2 )
T
En general, en un modelo de regresión múltiple basta con que una de las variables
explicativas esté medida con error para que todas las componentes del estimador MCO
sean inconsistentes.
Si la variable dependiente presenta errores de medida y las variables explicativas son
exógenas y no presentan errores de medida, entonces el estimador MCO es consistente.
2.3.
Simultaneidad
Consideremos ahora el sistema de ecuaciones simultáneas
(1) : Y1t = α12 Y2t + β11 X1t + β12 X2t + .. + β1k Xkt + u1t
(2) : Y2t = α21 Y1t + β21 X1t + β22 X2t + .. + β2k Xkt . + u2t
2
(1)
(2)
Como
Y2t
depende de
correlacionado con
Y1t
u1t ,
por la ecuación (2), e
y por tanto
Y2t
Y1t
está correlacionado con
u1t , Y2t
está
es endógeno en la ecuación (1). Análogamente
Y1t
es endógena en la ecuación (2).
Ejemplo: Consideremos el caso habitual de un modelo de equilibrio de mercado:
qdt = α1 pt + α2 yt + udt
qst = β1 pt + ust
qdt = qst
Ecuación de demanda:
Ecuación de oferta:
Condición de equilibrio:
y es renta que se supone determinada fuera del modelo lo que hace que sea exógena y
2
2
suponemos que E [udt |yt ] = E [ust |yt ] = 0; V ar [udt |yt ] = σd ; V ar [ust |yt ] = σs ; E [udt ust |yt ]
= 0. Resolviendo para p:
donde
pt =
udt − ust
α2
yt +
= πyt + νt .
β1 − α1
β1 − α1
Tenemos entonces que
Cov (pt , udt ) =
Cov (pt , ust ) =
σd2
6= 0
β1 −α1
σs2
− β1 −α1 6=
0
y por tanto el precio es endógeno tanto en la ecuación de oferta como en la ecuación de
demanda.
3.
El estimador de variables instrumentales
Bibliografía: Wooldridge, 15.1-15.3
3.1.
El modelo lineal simple
Consideremos el modelo lineal simple
Y t = β1 + β2 Xt + u t
(1)
E(ut ) = 0 (nótese que este supuesto no es restrictivo ya que el modelo incluye
β1 se dene como β1 = E(Yt ) − β2 E(Xt )). En este
modelo la variable Xt es endógena si Cov(Xt , ut ) = E(Xt ut ) 6= 0. Si la variable Xt es
0
endógena sabemos que el estimador MCO de β = (β1 , β2 ) no es consistente. Para poder
obtener un estimador consistente de β necesitamos información adicional. En concreto
necesitamos encontrar al menos una variable Zt que no esté correlacionada con el término
de error y que esté correlacionada con Xt , es decir que verique:
para el que
un término constante y por tanto
1. Cov(Zt , ut ) = 0
2. Cov(Zt , Xt ) 6= 0
3
Si
Zt
para
verica los supuestos
Xt
en el modelo
1 y 2 se dice Zt
es una variable instrumental o un instrumento
(1). Vamos a empezar estudiando el caso en el que tenemos un único
instrumento (modelo exactamente identicado), y posteriormente introduciremos el caso
en el que tengamos más de un instrumento (modelo sobreidenticado).
Vamos a ver ahora que bajo los supuestos 1 y 2 los parámetros
β2
y
β1
están identi-
1:
cados. Utilizando el supuesto
Cov(Zt , Yt ) = β2 Cov(Zt , Xt ) + Cov(Zt , ut ) = β2 Cov(Zt , Xt )
puesto que
Cov(Zt , Xt ) 6= 0 por el supuesto 2, el parámetro β2 está denido en la población
por
β2 =
Cov(Zt , Yt )
Cov(Zt , Xt )
El estimador de variables instrumentales (VI) de
momentos
1
T
βbV I,2 =
1
T
donde
Z =
1
T
T
P
Zt , Y =
t=1
instrumentales de
T
P
(2)
β2
T
P
(Zt − Z)(Yt − Y )
t=1
T
P
(Zt − Z)(Yt − Y )
t=1
T
P
=
(Zt − Z)(Xt − X)
(Zt − Z)(Xt − X)
t=1
1
T
se obtiene aplicando el método de los
t=1
T
P
Yt
t=1
β1 , puesto que
y
X =
1
T
T
P
Xt .
En cuanto al estimador de variables
t=1
E(ut ) = 0,
β1 = E(Yt ) − β2 E(Xt )
utilizando el método de los momentos
βbV I,1 = Y − βbV I,2 X
Se puede demostrar que el estimador VI de
β
es consistente y asintóticamente normal y,
en general, es posible obtener un estimador consistente de la varianza límite lo que nos
permitirá hacer inferencia (estos resultados se demostrarán en el contexto del modelo de
regresión múltiple).
Es importante resaltar el papel asimétrico que juegan los supuestos
que el supuesto
regresión de
Xt
1
no es contrastable, el supuesto
sobre
2
1
y
2.
Mientras
sí lo es. Consideremos el modelo de
Zt
Xt = π1 + π2 Zt + vt
(3)
puesto que
π2 =
el supuesto
2
es equivalente a que
Cov(Zt , Xt )
,
V ar(Zt )
π2 6= 0.
Por tanto para contrastar este supuesto con-
trastaremos
H0 : π2 = 0
H1 : π2 6= 0
4
(3).
utilizando el estimador MCO del modelo
Si rechazamos la hipótesis nula tendremos
evidencia suciente de que se verica el supuesto
Puesto que el supuesto
1
2.
no es contrastable debe utilizarse la teoría económica u otro
tipo de consideraciones para justicar su validez. Por ejemplo, supongamos que queremos
estimar los rendimientos de la educación mediante la ecuación
log(wt ) = β1 + β2 educt + ut
En este tipo de ecuaciones, el término de error representa en parte la habilidad inobservable de los individuos. Hay mucha evidencia empírica que demuestra que la habilidad
está correlacionada con la educación, ya que los individuos deciden los años de educación
dependiendo de su habilidad. En algunos estudios empíricos se ha utilizado el mes de
nacimiento como instrumento para el nivel de educación. Es claro que el mes de nacimiento no está correlacionado con la habilidad de los individuos y por tanto verica el supuesto
1. El problema potencial de este instrumento es si verica el supuesto 2, es decir si está
correlacionado con el nivel de educación.
Vamos a analizar ahora las consecuencias que tiene sobre las propiedades del estimador
VI el que no se verique el supuesto 1. Vamos a calcular entonces el límite en probabilidad
de
βbV I,2
cuando la covarianza entre
1
T
βbV I,2 =
1
T
T
P
t=1
T
P
=
(Zt − Z)(Xt − X)
1
T
y
ut
1
T
t=1
= β2 +
Zt
1
T
(Zt − Z)(Yt − Y )
1
T
Si
Zt
T
P
y
ut
T
P
1
T
(Zt − Z)Yt
t=1
T
P
=
T
P
1
T
(Zt − Z)Xt
→p β2 +
(Zt − Z)Xt
(Zt − Z)(β1 + β2 Xt + ut )
t=1
t=1
(Zt − Z)ut
t=1
T
P
no es necesariamente cero
T
P
=
(Zt − Z)Xt
t=1
Corr(Zt , ut ) σu
Cov(Zt , ut )
= β2 +
Cov(Zt , Xt )
Corr(Zt , Xt ) σX
t=1
no están correlacionadas, es decir si se verica el supuesto
es consistente. Sin embargo, si la correlación entre
pequeña, si la correlación entre
probabilidad de
βbV I,2
Zt
y
Xt
Zt
y
ut
1,
el estimador VI
no es cero, aunque sea muy
está próxima a cero, la diferencia entre el límite en
y el verdadero valor del parámetro (lo que se denomina el sesgo de
consistencia) puede ser muy grande. Este resultado resalta la importancia de contrastar el
supuesto
2, ya que si podemos garantizar que la correlación entre Zt
y
Xt
no está próxima
a cero, el sesgo asintótico del estimador VI, si existe será pequeño, siempre y cuando,
claro está, la correlación entre
Zt
y
ut
esté muy próxima a cero.
El estimador MCO es un estimador de variables instrumentales que utiliza
instrumento. El límite en probabilidad de
βbM CO,2
Xt
como
es
σu
βbM CO,2 →p β2 + Corr(Xt , ut )
σX
ut no están correlacionados, el estimador MCO es consistente. Cuando tanto Xt y
ut como Zt y ut están correlacionados el estimador MCO será preferible al VI (en términos
Si
Xt
y
5
de sesgo asintótico) si
es decir si
Xt
Corr(Zt ,ut ) |Corr(Xt , ut )| < Corr(Zt ,Xt ) .
Si
Xt
y
ut
no están correlacionados,
es exógena, el estimador MCO es consistente y si se verican los demás
supuestos básicos, el estimador MCO es más eciente (asintóticamente) que cualquier
estimador VI.
3.2.
El modelo lineal múltiple con una única variable endógena
Consideremos el modelo lineal múltiple
Yt = Xt0 β + ut = β1 + β2 X2t + .. + βk Xkt + ut
donde
β = (β1 , β2 , ..βk )0
y
tiene media cero y que las
Xt = (1, X2t , .., Xkt )0 . Supondremos que el término
variables X2t , .., Xk−1,t son exógenas, es decir
E(ut ) = 0
Cov(Xjt , ut ) = E(Xjt ut ) = 0,
y
Xk
de error
j = 2, ..k − 1
es potencialmente endógena, es decir la covarianza entre
Xkt
y
ut
puede ser dis-
tinta de cero. Análogamente al caso del modelo lineal simple, para poder obtener un
0
estimador consistente de β = (β1 , β2 , ..βk ) necesitamos una variable adicional Zkt que no
esté correlacionada con el término de error, es decir que verique que
1. Cov(Zkt , ut ) = E(Zkt ut ) = 0
Si denimos el vector
que denen el vector
Zt = (1, X2t , .., Xk−1,t , Zkt )0
β
tenemos
k
condiciones de momentos
en la población
E(ut ) = 0
E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0,
Cov(Zkt , ut ) = E(Zkt ut ) = 0
j = 2, .., k − 1
(4)
El estimador de variables instrumentales se obtiene por el método de los momentos. Las
condiciones de momentos poblacionales
(4)se
pueden escribir como
E(Zt ut ) = E(Zt (Yt − Xt0 β) = E(Zt Yt ) − E(Zt Xt0 )β = 0
Si la matriz
E(Zt Xt0 )
es no singular, es decir si se verica
2. |E(Zt Xt0 )| =
6 0
el vector de parámetros
β
está denido en la población por
β = E(Zt Xt0 )−1 E(Zt Yt )
Nótese que este supuesto
2
es el análogo al supuesto
simple.
6
(5)
2
que hacíamos en el modelo lineal
El estimador de variables instrumentales de
de los momentos a la condición
βbV I =
donde
Z
el vector
T
1X
Zt Xt0
T t=1
!−1
β
se obtiene entonces aplicando el método
(5)
T
1X
Zt Yt =
T t=1
T
X
!−1
Zt Xt0
T
X
X son las matrices T × k, Z = (Z1 , Z2 , .., ZT )0
T × 1, Y = (Y1 , Y2 , .., YT )0 .
y
X = (X1 , X2 , .., XT )0 ,
Al igual que en el modelo de regresión simple, el supuesto
2
si lo es. El supuesto
2
Z 0Y
t=1
t=1
y
tras que el supuesto
−1
Zt Yt = (Z 0 X)
1
e
Y
es
no es contrastable mien-
en el modelo de regresión simple era que
el instrumento estuviera correlacionado con la variable explicativa. Ahora no basta con
Cov(Zkt , Xkt ) 6= 0, ya que claramente si consideráramos Zkt igual a una combinación
X2t , .., Xk−1,t , aunque Zkt estuviera correlacionada con Xkt , no nos serviría como
0
instrumento ya que en ese caso la matriz Zt Xt tendría rango k − 1 y por tanto la matriz
0
E(Zt Xt ) sería singular. El supuesto 2 ahora es equivalente a decir que Xkt esté parcialmente correlacionada con Zkt una vez que tenemos en cuenta la correlación entre Xkt y
que
lineal de
las restantes variables explicativas del modelo. Análogamente al caso del modelo lineal
2 estimando un modelo auxiliar. Consideramos el
sobre una constante, X2t , .., Xk−1,t , Zkt
simple, podemos contrastar el supuesto
modelo de regresión múltiple de
Xkt
Xkt = π1 + π2 X2t + .. + πk−1 Xk−1,t + πk Zkt + vt
Se puede demostrar que el supuesto
2
(6)
es equivalente a que el coeciente de
Zkt
en
(6)
sea
distinto de cero. Por tanto para contrastar este supuesto contrastaremos
H0 : πk = 0
H1 : πk 6= 0
utilizando el estimador MCO del modelo
(6).
Si rechazamos la hipótesis nula tendremos
evidencia suciente de que se verica el supuesto
2.
Supongamos ahora que tenemos dos instrumentos válidos
Zk1t
y
Zk2t ,
podríamos uti-
lizar cualquiera de los dos como instrumento y obtener así dos estimadores de VI distintos.
Sin embargo, se puede demostrar que, en general, es posible obtener un estimador más
eciente combinando los instrumentos disponibles. Dado que
X2t , .., Xk−1,t , Zk1t
y
Zk2t
no están correlacionadas con el término de error, cualquier combinación lineal de estas
variables
∗
Zkt
= π1 + π2 X2t + .. + πk−1 Xk−1,t + πk1 Zk1t + πk2 Zk2t
tampoco estará correlacionada con el término de error y por tanto vericará el supuesto 1.
De esta forma vemos que podemos calcular innitos estimadores de variables instrumentales utilizando distintas ponderaciones de las variables exógenas. La pregunta es ¾Cuál de
todas estas combinaciones lineales da lugar al estimador asintóticamente más eciente?.
Se puede demostrar que si el término de error
ut
es homocedástico el estimador VI más
eciente se obtiene utilizando
bkt = π
X
b1 + π
b2 X2t + .. + π
bk−1 Xk−1,t + π
bk1 Zk1t + π
bk2 Zk2t
7
π
b = (b
π1 , π
b2 , .., π
bk−1 , π
bk1 , π
bk2 )0 es el estimador MCO de la regreconstante, X2t , .., Xk−1,t , Zk1t y Zk2t . El estimador VI que utiliza
como instrumento, donde
sión de
bkt
X
Xkt
sobre una
como instrumento se denomina estimador de mínimos cuadrados en dos etapas.
En este caso para contrastar el supuesto
2
tenemos que considerar el modelo
Xkt = π1 + π2 X2t + .. + πk−1 Xk−1,t + πk1 Zk1t + πk2 Zk2t + vt
Se puede demostrar que el supuesto
conjuntamente signicativas en
(7).
2
(7)
es equivalente a que las variables
Zk1t y Zk1t sean
2 contrastare-
Por tanto para contrastar el supuesto
mos
H0 : πk1 = 0, πk2 = 0
H1 : πk1 6= 0 y/o πk2 6= 0
utilizando el estimador MCO del modelo
(7).
Si rechazamos la hipótesis nula tendremos
evidencia suciente de que se verica el supuesto
3.3.
2.
El modelo lineal múltiple con varias variables endógenas
Consideremos el modelo lineal múltiple
Yt = Xt0 β + ut = β1 + β2 X2t + .. + βk Xkt + ut
donde
β = (β1 , β2 , ..βk )0
y
tiene media cero y que las
Xt = (1, X2t , .., Xkt )0 . Supondremos que el
variables X2t , .., Xlt son exógenas, es decir
E(ut ) = 0
Cov(Xjt , ut ) = E(Xjt ut ) = 0,
término de error
j = 2, ..l
Xl+1,t , .., Xk son potencialmente endógenas, es decir la covarianza entre Xjt y ut , j =
l + 1, .., k puede ser distinta de cero. Análogamente al caso de una sola variable explicativa
0
endógena, para poder obtener un estimador consistente de β = (β1 , β2 , ..βk ) necesitamos
ahora k − l variables adicionales Zl+1,t , .., Zkt que no estén correlacionadas con el término
y
de error, es decir que veriquen que
1. Cov(Zjt , ut ) = E(Zjt ut ) = 0,
j = l + 1, .., k
Zt = (1, X2t , .., Xlt , Zl+1,t , ..Zkt )0 tenemos k condiciones de momentos
vector β en la población
Si denimos el vector
que denen el
E(ut ) = 0
E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0,
Cov(Zjt , ut ) = E(Zjt ut ) = 0,
j = 2, .., l
j = l + 1, .., k
El estimador de variables instrumentales se obtiene de nuevo por el método de los momentos. Igual que en el caso de una sola variable explicativa endógena, las condiciones de
momentos poblacionales se pueden escribir como
E(Zt ut ) = E [Zt (Yt − Xt0 β)] = E(Zt Yt ) − E(Zt Xt0 )β = 0
8
Si la matriz
E(Zt Xt0 )
es no singular, es decir si se verica
2. |E(Zt Xt0 )| =
6 0
el vector de parámetros
β
está denido en la población por
β = E(Zt Xt0 )−1 E(Zt Yt )
y el estimador VI tiene la misma expresión que en la sección anterior.
La diferencia fundamental entre el caso de una sola variable explicativa endógena y el
caso de varias variables explicativas endógenas es que en este último caso el supuesto
2 no
se puede expresar de forma sencilla en términos de los coecientes de un modelo auxiliar,
y por tanto, no es tan fácilmente contrastable como lo era en el modelo con una única
variable explicativa endógena. Nótese que si contrastamos la signicatividad conjunta de
Zjt , j = l + 1, .., k
en cada una de las regresiones
Xjt = πj1 + πj2 X2t + .. + πjl Xlt + πj,l+1 Zl+1,t + .. + πjk Zkt + vjt ,
j = l + 1, .., k
y rechazamos la nula en todas ellas, esto no sería suciente para garantizar que se verica
el supuesto
2,
ya que por ejemplo, si
πjk = 0, j = l + 1, .., k, Zkt
no estaría parcialmente
correlacionada con ninguna de las variables endógenas y por tanto no tendríamos sucientes instrumentos. Existen métodos para contrastar el supuesto
2
cuando hay más de
una variable endógena pero no los vamos a ver en este curso.
3.4.
Propiedades asintóticas del estimador de variables instrumentales
Consistencia del estimador VI
Si se verican los supuestos
E(ut ) = 0
(1) E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0,
Cov(Zjt , ut ) = E(Zjt ut ) = 0,
P
1
0
6 0
Zt Xt →p E(Zt Xt0 ) = ΣZX , |ΣZX | =
(2) T
j = 2, .., l
j = l + 1, .., k
entonces el estimador VI es consistente.
Demostración:
βbV I = β +
−1 X
1X
1
0
Zt Xt
Zt ut
T
T
Consideremos la sucesión de vectores aleatorios
Wt
Wt = Zt ut .
Puesto que los vectores
son iid y todos tienen media cero (por el supuesto 1), utilizando la ley de los grandes
números tenemos que
T
1X
Zt ut →p 0
T t=1
9
(1)
Por otra parte, utilizando el supuesto 2
1X
Zt Xt0 →p ΣZX
T
Como
|ΣZX | =
6 0,
por el teorema de la función continua
Utilizando
(1)
y
(2)
−1
1X
0
Zt Xt
→p Σ−1
ZX
T
(2)
tenemos
βbV I = β +
−1 X
1X
1
0
Zt Xt
Zt ut →p β
T
T
Normalidad asintótica del estimador VI
Si se cumplen las condiciones:
E(ut ) = 0
(1) E(Zt ut ) = 0 ⇔ Cov(Xjt , ut ) = E(Xjt ut ) = 0,
Cov(Zjt , ut ) = E(Zjt ut ) = 0,
P
Zt Xt0 →p E(Zt Xt0 ) = ΣZX , |ΣZX | =
6 0
(2) T1
2
2
(3) E(u
Pt |Zt ) 0= σ
0
1
(4) T
Zt Zt →p E(Zt Zt ) = ΣZ > 0
entonces
j = 2, .., l
j = l + 1, .., k
√ −1 0
T βbV I − β →d N (0, σ 2 Σ−1
ZX ΣZ ΣZX ).
Demostración:
−1
1 X
√ √ 1X
0
b
T βV I − β =
T
Z t Xt
Zt ut ;
T
T
Consideremos la sucesión de vectores aleatorios
Wt = Zt ut ,
ya sabemos que
0
E(Wt ) = 0
0
V ar(Wt ) = V ar(Zt ut ) = E(u2t Zt Zt ) = E(E(u2t Zt Zt |Zt ))
0
0
= E(E(u2t |Zt )Zt Zt ) = σ 2 E(Zt Zt ) = σ 2 ΣZ .
Puesto que los vectores
Wt
son iid y todos tienen media cero y varianza
el Teorema Central del Límite
√ 1X
Zt ut →p N (0, σ 2 ΣZ )
T
T
Por otra parte, utilizando el supuesto 2
1X
Zt Xt0 →p ΣZX
T
10
(1)
σ 2 ΣZ ,
utilizando
Como
|ΣZX | =
6 0,
por el teorema de la función continua
Utilizando
(1)
y
(2)
−1
1X
0
Zt Xt
→p Σ−1
ZX
T
(2)
tenemos
√ −1 0
T βbV I − β →d N (0, σ 2 Σ−1
ZX ΣZ ΣZX ).
Como ya mencionamos anteriormente el estimador MCO es un estimador VI que utiliza
Xt
como vector de instrumentos. Si todos los regresores son exógenos el estimador MCO
es consistente, y si se verican los demás supuestos, el estimador MCO es asintóticamente
más eciente que cualquier otro estimador VI.
2
Estimador de σ .
1X
0
(Yt − Xt βbV I )2 .
T
σ
bV2 I =
Se puede demostrar que
σ
bV2 I
es un estimador consistente de
σ2.
La varianza estimada del estimador VI se obtiene utilizando un estimador consistente
de la varianza asintótica. Puesto que
1
T
1
T
P
P
6 0
Zt Xt0 →p ΣZX , |ΣZX | =
0
Zt Zt0 →p E(Zt Zt ) = ΣZ > 0
σ
bV2 I →p σ 2
La varianza estimada del estimador VI es
σ
b2
\
var(βbV I ) = V I
T
−1 X
X
−1
1X
1
1
0
0
0
Zt Xt
Zt Zt
Xt Z t
T
T
T
= σ
bV2 I (Z 0 X)
4.
−1
−1
(Z 0 Z) (X 0 Z)
Contrastes de hipótesis con el estimador VI
Bibliografía: Wooldridge, 15.1
Supongamos que queremos contrastar:
H0 : Rβ = r
H1 : Rβ 6= r
donde
R
es una matriz
cumplen los supuestos
q × k , y r es un vector q × 1, ambos conocidos.
(1) a (4) sabemos que
√ −1 0
T βbV I − β ' N (0, σ 2 Σ−1
Σ
Σ
Z
ZX ).
ZX
11
Suponiendo que se
Multiplicando por la izquierda por
√
Bajo H0
R
−1 0 0
T (RβbV I − Rβ) ' N (0, σ 2 RΣ−1
ZX ΣZ ΣZX R )
√
−1 0 0
T (RβbV I − r) ' N (0, σ 2 RΣ−1
ZX ΣZ ΣZX R )
(1)
Puesto que
σ
bV2 I
1 0
ZX
T
−1
1
( Z 0 Z)
T
Multiplicando por la izquierda por
σ
bV2 I R
1 0
ZX
T
−1
1
( Z 0 Z)
T
R
1 0
XZ
T
−1
−1
→p σ 2 Σ−1
ZX ΣZ ΣZX
y por la derecha por
1 0
XZ
T
−1
0
R0
−1 0 0
R0 →p σ 2 RΣ−1
ZX ΣZ ΣZX R
(2)
(1), (2) y el ejemplo 5 del Tema 1 tenemos que el estadístico de contraste es
0 √ −1 1 0
−1 0 −1 √ 1 0
1
2
0
b
b
σ
bV I R T Z X
( T Z Z) T X Z
R
T RβV I − r
W = T RβV I − r
0
−1
= RβbV I − r σ
RβbV I − r =
bV2 I R (Z 0 X)−1 (Z 0 Z) (X 0 Z)−1 R0
−1 0 \
0
b
b
= R βV I − r
Rvar(βV I )R
RβbV I − r ' χ2q , bajo H0 .
Utilizando
Así, para un nivel de signicación
α
W > χ2q,α .
bV I − r
bien, dado Rβ
rechazaremos H0 si
q = 1 podemos utilizar el estadístico W o
es un escalar,
utilizando (1), (2) y el ejemplo 6 del Tema 1 podemos construir el estadístico de contraste
Si
RβbV I − r
' N (0, 1)
t= q
\
0
b
Rvar(βV I )R
Bajo H0
Con este estadístico podemos hacer contrastes de una y dos colas (especicar las regiones
críticas en los contrastes de una cola y dos colas).
En particular, si queremos contrastar una única restricción del tipo:
H0 : βj = βj0
H1 : βj 6= βj0 ,
el estadístico de contraste es
βbV Ij − βj0
t=
' N (0, 1)
SE(βbV Ij )
donde
SE(βbV Ij )
es el error estándar de
βbV Ij ,
es decir la raíz cuadrada del elemento
de la matriz de varianzas estimada del estimador VI.
12
Bajo H0
(j, j)
5.
Contraste de endogeneidad
Bibliografía: Wooldridge, 15.5
Consideremos el modelo de regresión lineal con un único regresor potencialmente
endógeno:
Yt = β1 + β2 X2t + ... + βk Xkt + ut ,
(1)
donde
E(ut ) = 0
E(Xjt ut ) = 0,
y
Xkt
j = 2, ..k − 1
es potencialmente endógena. Queremos contrastar si efectivamente
Xkt
es o no
endógena, es decir queremos contrastar
H0 : E(Xkt ut ) = 0
H1 : E(Xkt ut ) 6= 0
Supongamos que
Zkt
Zkt ),
es exógena)
es endógena)
es un instrumento válido, es decir
el modelo de regresión de
instrumento
(Xkt
(Xkt
Xkt
E(Zkt ut ) = 0
y consideremos
sobre todas las variables exógenas del modelo (incluido el
es decir
Xkt = π1 + π2 X2t + ... + πk−1 Xk−1t + πk Zkt + vt ,
(2)
como las variables explicativas de este modelo no están correlacionadas con
exógena si y solo si
regresión de
ut
vt
sobre
y
ut
es
no están correlacionados. Por tanto si escribimos el modelo de
vt
ut = γvt + εt ,
Xkt
ut , Xkt
es exógena si y solo si
γ = 0.
Substituyendo
(3)
(3)
en
(1)
Yt = β1 + β2 X2t + ... + βk Xkt + γvt + εt ,
y por tanto contrastar si
Xkt
es endógena es equivalente a contrastar si
γ 6= 0.
El problema que presenta este contraste es que no se puede llevar a cabo en la practica
ya que
vt
no es observable. Sin embargo, se puede demostrar que el contraste se puede
realizar reemplazando los errores
vt
por los residuos MCO de la regresión
(2).
De forma
que nalmente el contraste de endogeneidad consiste en contrastar
H0 : γ = 0
H1 : γ 6= 0
en el modelo
Yt = β1 + β2 X2t + ... + βk Xkt + γb
vt + ε∗t ,
donde
vbt
son los residuos MCO de la regresión
signicatividad individual de la variable
robusto a heterocedasticidad.
vbt
(2).
Este contraste es un contraste de
y se puede utilizar el estadístico de contraste
13
Cuando haya más de una variable potencialmente endógena el contraste de endogeneidad consiste en:
Paso1: Para cada variable potencialmente endógena, estimar por MCO el modelo de
regresión de dicha variable sobre todas las variables exógenas (incluidos los instrumentos)
y calcular los residuos.
Paso 2: Estimar por MCO un modelo ampliado que incluya todas las variables explicativas originales y los residuos de las regresiones del paso 1, y contrastar la signicatividad
conjunta de todos los residuos de esta regresión ampliada.
14
Descargar