Subido por Daniel Mena

Clase 5 - Analisis Longitudinal 2022 - Datos de Panel II

Anuncio
Datos de Panel
Enfoque matricial del método de Mínimos Cuadrados Generalizados
Recordamos que en el caso de existir homocedasticidad y no autocorrelación
las fórmulas pertinentes para el cálculo de los estimadores y de la matriz de
covarianzas de los mismos eran
uˆT uˆ
con
N −k
ˆ
los elementos de û surgen de la estimación de los  como û = Y − X ˆ
ˆ = ( X T X ) −1 X T Y
ˆ ˆ = ˆ u2 ( X T X )−1
ˆ u2 =
El supuesto subyacente era:
  u21  u12


 u22
u =  u12
 ..
..

 u N 1  u N 2
Docente: Julio Fabris
..  u1N 
1

0
..  u 2 N 
=  u2 
..
.. .. 


2
..  uN 
0
0
1
..
0
..
..
..
..
0
0 
.. 

1 
Enfoque matricial del método de Mínimos Cuadrados Generalizados
En el caso de la autocorrelación de orden 1 con coeficiente de autocorrelación
 conocido
ut =  ut −1 +  t
 t ii d (0, 2 )
La transformación adoptada fue:
Yt −  Yt −1 = (1 −  )  1 +  2 ( X 2t −  X 2t −1 ) +  k ( X kt −  X kt −1 ) + ... + (ut −  ut −1 )
Yi * = 1* + 2 X 2*i + ... + k X k*i + ui*
Y los estimadores, bajo esos supuestos, volvían a ser MELI ya que ui =  i
no autocorrelacionado.
*
Este es un caso de GLS.
Por supuesto si
 se desconoce y debe ser estimado, GLS → FGLS
Docente: Julio Fabris
Enfoque matricial del método de Mínimos Cuadrados Generalizados
En este caso fue posible proponer la transformación en forma matricial,
planteando una matriz adecuada.
 1

2

1

 
2
u =  u   2

1

..
..
 ..
  N −1  N − 2  N − 3

..  N −1 

..  N − 2 
2
..  N −3  =  u  

.. .. 
.. 1 
Conocida la matriz es posible demostrar que una estimación GLS de los
parámetros puede obtenerse con:
ˆGLS = ( X T −1 X )−1 X T −1Y
Para una demostración sencilla ver Pindyck y Rubinfeld Apéndice 6.1
Docente: Julio Fabris
Enfoque matricial del método de Mínimos Cuadrados Generalizados
Además la matriz de varianzas y covarianzas de los estimadores resulta:
ˆ =  u2 ( X T −1 X )−1
En el caso usual, en que la matriz  y
estimarse, las fórmulas son:
ˆFGLS = ( X T ˆ −1 X )−1 X T ˆ −1Y
Donde
y
̂
ˆ u2 =
 u2 son desconocidas y deben
ˆ ˆ = ˆ u2  ( X T ˆ −1 X )−1
y
surge de la regresión
T
uˆFGLS
uˆFGLS
N −k
con
uˆt =  uˆt −1 +  t
uˆFGLS = Y − X ˆFGLS
Entonces, para implementar FGLS hacen falta:
u
•
Un modelo teórico de la matriz
•
Estimaciones de sus elementos constituyentes
Docente: Julio Fabris
y
Modelo de efectos aleatorios – Random effects model
El modelo de partida es el modelo inicial:
yit =  +  1 x1it +  2 x2it + ... +  k xk it + uit
u it =  i + vit ;
Ahora
i
 i iid (0, 2 )
i = 1,..., N ; t = 1,...,T
;
vit iid (0, v2 )
ya no es un parámetro a estimar sino una pertubación específica
 i es independiente de vi t
y
X it
es independiente de
 i y vi t
Este modelo es apropiado si estamos seleccionando los individuos de forma
aleatoria desde una población numerosa (ejemplo, encuestas de hogares en
panel).
Para poder hacer inferencia sobre toda la población debería cuidarse de
que, además de aleatoria sea representativa de la misma.
Docente: Julio Fabris
Modelo de efectos aleatorios – Random effects model
En este caso es claro que la matriz de covarianzas de las perturbaciones no
será una matriz escalar.
u i t =  i + vi t ;
u js =  j + v js
Cov(u i t , u j s ) = E (u i t  u j s ) = E [(  i + vi t )  (  j + v j s )] =
= E [  i  j +  i v j s + vi t  j + vi t v j s ] == E [  i  j ] + E [  i v j s ] + E [vi t  j ] + E [vi t v j s ]
0
0
 2 +  v2 i = j t = s

Cov( ui t u j s )   2
i= j ts
 0
i  j  t, s

Con estas especificaciones se busca construir la matriz  que permitirá la
estimación GLS (o en su caso FGLS) del vector
Docente: Julio Fabris
.
Modelo de efectos aleatorios – Random effects model
 = u
 2 +  v2
 2
 2
0
0
0 


2
2
2
2
 +v

0
0
0 
 
  2
 2
 2 +  v2
0
0
0 

=
2
2
2
0
0
 +v

 2 
 0
 0
0
0
 2
 2 +  v2
 2 

 0
0
0
 2
 2
 2 +  v2 
Utilizando esta estructura de la matriz de varianzas y covarianzas y estimando
las varianzas
 2
GLS
Docente: Julio Fabris
y
 v2 se estima el modelo de Efectos Aleatorios (RE) por
Modelo de efectos aleatorios – Estimador GLS
Una sugerencia de Fuller y Battese (1974) consiste en realizar una
transformación de las variables para poder estimarlas por MCO
En este caso cada elemento quedaría como:
yit* = yit −  yi.
Donde
 = 1−
O sea
Fijarse que para MCO,
v
1
con
 = 1−
 =0
12 = T   2 +  v2
1
T   2 /  v2
mientras que para el estimador Within,
Por tanto, los estimadores GLS serán intermedios a los citados
Docente: Julio Fabris
 =1
Modelo de efectos aleatorios – Random effects model
De acuerdo a la estrategia de estimación de las varianzas
 2 y  2v
existen 4 diferentes estimadores GLS
✓ Wallace y Hussain (1969)
✓ Amemiya (1971)
“amemiya”
✓ Swamy y Arora (1972)
✓ Nerlove (1971)
“walhus”
“swar”
“nerlove”
El modelo default de nuestro programa es el de Swamy y Arora
Docente: Julio Fabris
Modelo de efectos aleatorios – ¿Por qué es más eficiente?
Swamy y Arora (1972)
Los autores proponen realizar 2 regresiones diferentes (Within y Between) y
ponderar los resultados
Para el caso de una sola variable explicativa (por simplicidad)
yi t =  +  xi t + i + vi t
Promediando con respecto del tiempo
yi . =  +  xi. + i + vi .
(1)
Restando una ecuación de la otra
yi t − yi . =  ( xi t − xi . ) + (vi t − vi . )
(2)
La ecuación (2) representa al modelo Within como ya vimos, mientras que la
ecuación (1) representa el modelo Between
Docente: Julio Fabris
Modelo de efectos aleatorios – ¿Por qué es más eficiente?
El modelo Between tiene en cuenta la variabilidad entre individuos, mientras
que el modelo Within toma en cuenta la variabilidad temporal para cada
individuo.En el modelo de Swamy y Arora
ˆ GLS = W1 ˆ W + W2 ˆ B
con
W1 + W2 = 1
Correspondiendo los ponderadores de cada modelo a la inversa de su
correspondiente varianza
En resumen:
•
•
•
•
El estimador Within ignora la variación Between (entre individuos)
El estimador Between ignora la variación Within (temporal del
individuo)
MCO contempla ambas con igual ponderación
GLS contempla ambas con ponderación inversa a cada variabilidad.
Este hecho (considerar las dos variabilidades) lo convierte en un
estimador más eficiente.
Docente: Julio Fabris
Modelo de efectos aleatorios – Random effects model
Valores que toma
T=
sigma2_mu =
sigma2_v =
theta =

de acuerdo a los valores de las varianzas
25
1
16
0,2
25
1
4
0,6
25
1
1
0,8
25
4
1
0,9
 MCO
 2 y  2v
25
16
1
0,95
 Within
Algunos ejemplos de la literatura (Ver Croissant y Milio)
✓ Modelo de Comercio Exterior Kinal y Lahiri (1993)
✓ Modelo Bancos
El-Gamal y Inanoglu (2005)
✓ Modelo Electricidad costo-producción Kumbhakar (1996) y Horrace
y Schmidt (1996)
Docente: Julio Fabris
Modelo de efectos aleatorios – Random effects model
Modelo de Comercio Exterior Kinal y Lahiri (1993)
Estimación de las varianzas
 2 y  2v
y cálculo de  . T = 24
> ercomp(imports ~ gnp, FT)
var std.dev share
idiosyncratic 0.08634 0.29383 0.074
individual
1.07785 1.03820 0.926
theta: 0.9423
Como
 1
el estimador GLS se aproxima al estimador Within
within.gnp
0.9023642
Docente: Julio Fabris
random.gnp
0.7681560
pooling.gnp
0.0636640
Wi
GLS
MCO
Be
Docente: Julio Fabris
Modelo de efectos aleatorios – Random effects model
Modelo Bancos
El-Gamal y Inanoglu (2005)
Estimación de las varianzas
 2 y  2v
y cálculo de 
> ercomp(log(cost)~ log(output), TB)
var
std.dev share
idiosyncratic 0.3291
0.5737 0.604
individual
0.2156 0.4643 0.396
theta: 0.6473
Como  0,65 el estimador GLS se aproxima al estimador Within pero
menos que en el caso anterior
within.log(output)
0.5063813
Docente: Julio Fabris
random.log(output)
0.6470614
pooling.log(output)
0.8006578
Wi
GLS
Docente: Julio Fabris
MCO
Be
Modelo de efectos aleatorios – Random effects model
Modelo Electricidad costo-producción Kumbhakar (1996) y
Horrace y Schmidt (1996)
Estimación de las varianzas
 2 y  2v
y cálculo de 
> ercomp(log(cost)~log(output), TE)
var
std.dev
share
idiosyncratic
0.106806 0.326811 0.99
individual
0.001088 0.032990 0.01
theta: 0.08076
Como  0,1 el estimador GLS se aproxima al estimador MCO pooling
within.log(output) random.log(output) pooling.log(output)
2.632529
Docente: Julio Fabris
1.225987
1.180416
Wi
GLS
Be
Docente: Julio Fabris
MCO
Efectos fijos vs. Efectos aleatorios
Los efectos fijos no son fijos por naturaleza. Dentro del mismo enfoque se
pueden tratar como un vector de parámetros constantes o como la realización
de una variable aleatoria, a los efectos de la estimación.
La elección entre una y otra opción depende de la estructura probabilística y
, en particular de la posible correlación con las variables explicativas.
En un micro-panel los efectos aleatorios son en general adecuados ya que se
trabaja con una muestra de numerosos individuos (trabajadores, empresas,
etc.) que son elegidos en forma aleatoria de una población muy grande. No
hay interés en estimar los efectos individuales y el efecto aleatorio es más
apropiado, dada la forma de muestreo.
Por el contrario, en un panel macro, la muestra es fija o casi fija y casi
exhaustiva (por ejemplo, los países del mundo o las grandes empresas de un
mercado).
En este caso el conocimiento de los efectos individuales puede ser importante
y el estimador de efectos fijos aparece como el más indicado
Docente: Julio Fabris
Efectos fijos vs. Efectos aleatorios
De todas maneras, el principal argumento que lleva a la elección de uno u
otro modelo es la posibilidad de correlación entre algunas explicativas y los
efectos individuales
Si se mantiene la hipótesis de que los errores idiosincráticos
vit
no están
correlacionados con las explicativas, pueden darse dos situaciones:
E [ X T  ] = 0 , o sea que los efectos individuales no están correlacionados con
las explicativas. En este caso ambos modelos son consistentes, pero el
modelo de efectos aleatorios es más eficiente que el de efectos fijos
E [ X T  ]  0 , o sea que los efectos individuales están correlacionados con
las explicativas. En este caso sólo el estimador de efectos fijos es consistente,
ya que con la transformación within dichos efectos desaparecen
Docente: Julio Fabris
Test de Hausman (1978) de Endogeneidad
En principio el test consiste en la comparación de dos modelos A y B, a partir
de un test de tipo Wald
H0: E [ X  ] = 0 , en ese caso ambos modelos son consistentes, pero B es
más eficiente que A
T
H1: E [ X  ]  0 , en este caso, solamente A es consistente
Si H0 es cierta, los coeficientes estimados a partir de ambos modelos no
difieren demasiado (convergen para muestra suficientemente grande),
mientras que si H0 no es cierta, divergen.
T
Así , el test se basa en
( ˆ
A
)
− ˆB , mientras que Hausman demuestra que la
matriz de covarianzas de esta diferencia
( ˆ −ˆ ) = ˆ − ˆ
A
B
A
La versión más común de este test compara los modelos:
•
•
A: Efectos Fijos (Estimador Within)
B: Efectos Aleatorios (Estimador GLS)
Docente: Julio Fabris
B
Tests de especificación
Lo primero que corresponde chequear es si existen o no los efectos
individuales. Esto nos lleva a elegir entre el modelo MCO que los ignora y el
modelo Within que los contempla y estima.
En este caso habrá que contemplar la posibilidad de efectos temporales
también.
Para estas pruebas existen dos tipos de tests: F (ya visto) y LM (se verá)
De todas maneras la existencia de efectos individuales no sesga per se los
estimadores ni los torna inconsistentes. El problema surge cuando dichos
efectos se correlacionan con las variables explicativas. En este caso, al no
tenerlos en cuenta, se genera sesgo por variables omitidas. Por lo tanto, de
verificarse dicha correlación, el único estimador consistente sería el Within
(Efectos Fijos).
El test adecuado en este caso es el test de Hausman (ya visto)
Si no se verifica la correlación mencionada, el estimador más eficiente resulta
ser el estimador GLS (Efectos Aleatorios).
Docente: Julio Fabris
Tests de especificación
Test F (Para testear Pooling vs. Efectos Fijos)
H0: No hay efectos fijos individuales
Modelo NR: Modelo LSDV (Within)
g.l. = NT-(N-1)-(K+1)
Modelo R : Modelo Pooling
g.l. = NT-(K+1)
Estadístico de prueba:
F ~ F gl: (N-1) , NT-(N-1)-(K+1)
Breusch-Pagan Test (Para testear Pooling vs. Efectos
Aleatorios)
Es un test de multiplicadores de Lagrange, basado en los residuos de la
regresión OLS
El estimador es:
LM  12 ,
Docente: Julio Fabris
Breusch-Pagan Tests
Es un test muy sencillo porque requiere sólo el cálculo del modelo restringido,
en este caso, el modelo Pooling
Docente: Julio Fabris
Breusch-Pagan Tests
Este test es muy popular, pero presenta 2 problemas
✓
El primero es que la H0 propone que la varianza es distinta de cero
(test a 2 colas), mientras que la varianza sólo puede ser positiva
Honda (1985) y King y Wu (1997) proponen sendas correcciones.
✓
El segundo problema es que el estadístico propuesto puede dar
valores negativos especialmente cuando las varianzas de los
componentes del error son cercanas a cero, mientras que la
distribución que se asume es la chi cuadrada, que no acepta
argumentos negativos.
Gourieroux, Holly and Monfort (1982) modifican el test para evitar dicho
problema.
El estadístico que calcula el software plm incorpora ambas correcciones
Docente: Julio Fabris
Descargar