Macroeconometría Notas sobre la clase de contrastes de raíces

Anuncio
Macroeconometría
Notas sobre la clase de contrastes de raíces unitarias
Josep Lluís Carrion i Silvestre
Marzo de 2001
1 Clasicación de los contrastes de integración
Aunque recogemos bajo una misma denominación de contrastes de raíz unitaria, la literatura
ofrece dos estrategias para determinar el orden de integración de las series temporales. La
primera estrategia da lugar a la especicación de los contrastes de raíz unitaria y consiste en
contrastar las hipótesis:
½
H0 : xt » I (d)
:
H1 : xt » I (d ¡ 1)
La segunda estrategia da lugar a los llamados contrastes de estacionariedad, que reversan las
hipótesis nula y alternativa que especican los contrastes de raíz unitaria. En concreto, en los
contrastes de estacionariedad se formularán las siguientes hipótesis:
½
H0 : xt » I (d ¡ 1)
:
H1 : xt » I (d)
Las propuestas de estadísticos de prueba para contrastar el orden de integración de las series
temporales son muchas. Algunas de ellas se recogen en la Tabla 1.
Table 1. Algunos contrastes de raíces unitarias y de estacionariedad
Contrastes de raíz unitaria
I (1) vs I (0)
Test de Dickey-Fuller (DF)
Test de Phillips-Perron (PP)
Test de Sargan y Bhargava (DW)
Test de variables instrumentales de Hall
Test de Schmidt y Phillips (SP)
Test de von Newman
Test de Bhargava
Test de Durbin y Hausman
Contrastes de estacionariedad
I (0) vs I (1)
Test de Kwiatkowski, Phillips, Schmidt y Shin (KPSS)
Test de Leybourne y McCabe (LMC)
Test de Choi
Test de Park
Test de Bierens y Guo
Test de Arellano y Pantula
Nosotros nos vamos a centrar en presentar los contrastes más usuales en las aplicaciones
econométricas. La exposición va a contemplar, en primer lugar, el caso en el que se supone que
como máximo va a poder existir una raíz unitaria en el polinomio autorgresivo de la variable por
lo que la variable será I (1) o I (0). Una vez presentados los contrastes para esta situación se
comentará como proceder cuando se quiere contrastar la presencia de más de una raíz unitaria.
2
2 Contrastes de raíz unitaria
2.1
Test de Durbin-Watson de Sargan y Bhargava
Sargan y Bhargava (1983) proponen estimar el modelo:
xt = c + ut ;
(1)
y calcular el test de Durbin-Watson:
PT
PT
2
ut ¡ u^t¡1 )2
t=2 (^
t=2 (xt ¡ xt¡1 )
=
DW =
PT
PT
2
^2t
t=1 u
t=1 xt
para realizar el contraste de las hipótesis:
½
H0 : xt » I (1)
:
H1 : xt » I (0)
Nótese que si xt » I (1) también lo será ut dado que lo único que se realiza con la estimación
de (1) es eliminar su media, dejando intactas las propiedades estocásticas de xt , las cuales se
traspasarán a u^t .
Como el test de Durbin-Watson se puede aproximar como:
DW ' 2 (1 ¡ ½) ;
donde ½ es el coeciente de autocorrelación de primer orden, si xt » I (1) ) ½ = 1 y,
consecuentemente, DW = 0. De esta manera, una forma para llevar a cabo el contraste de
integración de una variable consiste en:
½
H0 : DW = 0 ´ xt » I (1)
:
H1 : DW > 0 ´ xt » I (0)
Notas:
² El test de Sargan y Bhargava sólo es útil frente a la alternativa de un proceso AR(1) estacionario;
² No le inuye la especicación determinista;
² La distribución asintótica del contraste no es estándard, ya que depende de procesos Brownianos. Los valores críticos se encuentran tabulados en el trabajo de Sargan y Bhargava
(1983).
2.2
Test de Dickey-Fuller (DF)
El test de Dickey-Fuller se propone en los trabajos de Fuller (1976) y Dickey y Fuller (1979,
1981) y parte del supuesto que la serie temporal que se analiza se puede representar como un
3
proceso autoregresivo de primer orden:
xt = f (t) + Á xt¡1 + "t ;
(2)
con f (t) denotando la componente determinista de la serie temporal y "t » iid (0; ¾ 2" ). Nótese
que (2) se puede expresar como:
(1 ¡ ÁL) xt = f (t) + "t ;
por lo que si jÁj < 1 el proceso será estacionario en varianza, xt » I (0); si jÁj = 1 el proceso
será no estacionario en varianza, xt » I (1); nalmente, si jÁj > 1 el proceso será explosivo.
Cada una de estas expresiones es la forma reducida del modelo:
xt = f 0 (t) + ut ;
(3)
ut = Á ut¡1 + "t :
(4)
Fijémonos que sustituyendo (4) en (3) se obtiene:
"t
xt = f 0 (t) +
;
(1 ¡ ÁL)
= (1 ¡ ÁL) f 0 (t) + Á xt¡1 + "t :
Así, supongamos que
f 0 (t) = 0;
entonces
(1 ¡ ÁL) f 0 (t) = 0;
dando lugar a la ecuación:
xt = Á xt¡1 + "t :
Si se supone que
f 0 (t) = ¹0 ;
entonces
(1 ¡ ÁL) f 0 (t) = (1 ¡ Á) ¹0 ;
= ¹:
Finalmente, se podría suponer que
f 0 (t) = ¹0 + ¯ 0 t;
con lo que
(1 ¡ ÁL) f 0 (t) = (1 ¡ ÁL) (¹0 + ¯ 0 t) ;
= (1 ¡ Á) ¹0 + ¯ 0 (1 ¡ ÁL) t;
4
= (1 ¡ Á) ¹0 + ¯ 0 (t ¡ Á (t ¡ 1)) ;
= (1 ¡ Á) ¹0 + ¯ 0 Á + ¯ 0 (1 ¡ Á) t;
= ¹ + ¯ t:
Las especicaciones deterministas que consideran Dickey y Fuller arrojan los siguientes
modelos:
xt = Á xt¡1 + "t ;
(5)
xt = ¹ + Á xt¡1 + "t ;
(6)
xt = ¹ + ¯ t + Á xt¡1 + "t ;
(7)
con ¹ = (1 ¡ Á) ¹0 para el modelo (6) y con ¹ = (1 ¡ Á) ¹0 + ¯ 0 Á y ¯ = ¯ 0 (1 ¡ Á) para el
modelo (7). Es decir, se consideran tres modelos: el primero no contiene términos deterministas,
el segundo contiene un término independiente y el tercero una tendencia determinista.
Nótese que si el proceso es estacionario, jÁj < 1, la estimación MCO de Á se distribuirá
asintóticamente como:
´
p ³
¡
¡
¢¢
^ ¡ Á » N 0; ¾ 2 1 ¡ Á2 ;
T Á
"
resultado que se obtiene a partir de la aplicación del Teorema Central del Límite. No obstante,
en el caso que el proceso sea no estacionario, jÁj = 1, y el estimador no convergiría hacia una
distribución degenerada ya que
³ ´
¡
¢
^ = ¾ 2 1 ¡ Á2 = 0.
por ser V Á
"
´
p ³
p
^¡1 !
T Á
0;
Para que esto no ocurra será necesario considerar un ratio de convergencia, velocidad de
convergencia, más elevado que el que se da en el caso de procesos estacionarios, los cuales
p
convergen a un ratio de T .
En concreto, Fuller (1976) y Dickey y Fuller (1979, 1981) proponen contrastar el orden de
integración de la variable especicando las siguientes hipótesis:
½
H0 : jÁj = 1 ´ xt » I (1)
;
H1 : jÁj < 1 ´ xt » I (0)
a partir del cálculo de dos estadísticos de prueba: (1) el del sesgo normalizado:
³
´ (1=T ) PT y "
t=2 t¡1 t
^
T Á¡1 =
;
P
2
2
(1=T ) Tt=2 yt¡1
5
(8)
y (2) el del pseudo t-ratio:
³
´
^
Á¡1
tÁ^ = q ± P
;
T
2
¾
^ 2"
y
t=2 t¡1
(9)
^ es la estimación MCO de Á en los modelos (5) a (7), según sea la especicación
donde Á
determinista adoptada. Estos dos estadísticos son conocidos indistintamente como contrastes
de Dickey-Fuller, siendo el más utilizado el pseudo t-ratio.
Una manera alternativa de llevar a cabo el contraste consiste en transformar las ecuaciones
de contraste de la manera siguiente:
xt = ¹ + ¯ t + Á xt¡1 + "t ;
xt ¡ xt¡1 = ¹ + ¯ t + Á xt¡1 ¡ xt¡1 + "t ;
¢xt = ¹ + ¯ t + ® xt¡1 + "t ;
con ® = (Á ¡ 1). Nótese que esta transformación no afecta a la componente determinista.
Ahora las hipótesis de contraste se tendrán que especicar como:
½
H0 : j®j = 0 ´ xt » I (1)
;
H1 : j®j < 0 ´ xt » I (0)
aunque los estadísticos de prueba no se ven alterados. Así, el test del sesgo normalizado será:
³
´ (1=T ) PT y "
t=2 t¡1 t
^¡1 =
T®
^=T Á
;
P
2
2
(1=T ) Tt=2 yt¡1
y el del pseudo t-ratio:
®
^
t®^ = q ± P
:
T
2
¾
^ 2"
y
t=2 t¡1
2.2.1 Los modelos bajo la hipótesis nula y la alternativa
Los tres modelos formulados por las ecuaciones (5) a (7) implican diferentes comportamientos
para la serie temporal bajo la hipótesis nula y bajo la hipótesis alternativa.
Supongamos la especicación dada por (5). Bajo la hipótesis nula de que Á = 1 -o, alternativamente, ® = 0- el PGD de la variable sería:
xt = xt¡1 + "t ;
t¡1
X
"t¡j ;
xt = x0 +
j=0
xt = x0 + St¡1 ;
donde St¡1 =
Pt¡1
j=0 "t¡j
es el proceso de suma parcial. Así, bajo la hipótesis nula fxt g se
comporta como un camino aleatorio sin deriva. Bajo la hipótesis alternativa de que jÁj < 1 -o,
6
alternativamente, ® < 0:
xt = Á xt¡1 + "t ;
el proceso fxt g viene descrito por un autoregresivo sin elementos deterministas:
xt = Á xt¡1 + "t :
En el caso del modelo (6) tenemos que bajo la hipótesis nula de Á = 1 -o, alternativamente,
® = 0:
¹ = (1 ¡ Á) ¹0 = (1 ¡ 1) ¹0 = 0;
por lo que el PGD viene dado por:
xt = x0 + St¡1 ;
mientras que bajo la alternativa fxt g sigue un proceso autoregresivo estacionario que uctura
sobre un valor constante:
xt = ¹ + Á xt¡1 + "t :
Finalmente, en el caso del modelo (7) tenemos que bajo la hipótesis nula de Á = 1 -o,
alternativamente, ® = 0:
¹ = (1 ¡ Á) ¹0 + ¯ 0 Á;
= ¯0
¯ = ¯ 0 (1 ¡ Á) ;
= 0;
por lo que el PGD viene dado por:
xt = x0 + ¯ 0 t + St¡1 ;
mientras que bajo la alternativa fxt g sigue un proceso autoregresivo estacionario que uctura
sobre una tendencia determinista:
xt = ¹ + ¯ t + Á xt¡1 + "t :
2.2.2 Distribución asintótica
A partir de los resultados mostrados anteriormente, sabemos que si "t » iid (0; ¾ 2" ), entonces
¾ 2" = ¾ 2 y:
T
¡1
T
X
t=2
yt¡1 "t ) ¾
2
Z
1
W (r) dW (r) ;
0
¡
¢
´ (1=2) ¾ 2 W (1)2 ¡ 1 ;
7
T
¡2
T
X
2
yt¡1
) ¾
t=2
2
Z
1
W (r)2 dr;
0
por lo que Phillips (1987) demuestra que:
¡ ¤ 2
¢
³
´
(1=2)
W
(1)
¡
1
^¡1 )
T Á
;
R1
¤ (r)2 dr
W
0
¡
¢
(1=2) W ¤ (1)2 ¡ 1
qR
;
tÁ^ )
1
2
¤
W (r) dr
0
donde ) indica convergencia débil a la medida de probabilidad asociada, W ¤ (r) denota un
movimiento Browniano al cual se le ha extraído su media. En el caso del modelo (5): W ¤ (r) =
W (r). Para el modelo (6): W ¤ (r) = W (r) ¡ r W (1). Para el modelo (7): W ¤ (r) =
R1
W (r) ¡ 3 (r2 ¡ r) W (1) + 6 (r2 ¡ r) 0 W (s) ds.
Notas:
² Las distribuciones asintóticas no son estándard, ya que son función de procesos Brownianos
(procesos de Wiener);
² Las distribuciones de cada uno de estos contrastes se encuentran tabuladas en los trabajos de
Fuller (1976) y Dickey y Fuller (1979);
² Como se puede apreciar, las distribuciones de los estadísticos de prueba no son independientes de la especicación determinista que se haya adoptado. Este hecho hará que cada
estadístico posea una distribución asintótica y, consecuentemente, unos valores críticos asociados que variará según sea la componente determinista que se especique.
2.3
Otros contrastes de Dickey-Fuller. Tests de pseudo-F
Se ha podido ver que el hecho de situarse bajo la hipótesis nula o alternativa implica, a parte de
un determinado valor para el parámetro Á, unas restricciones de igualdad para los parámetros
asociados a la componente determinista.
En concreto, de haber especicado el modelo (6), se da que bajo la hipótesis nula
Á = 1 y ¹ = 0.
Dickey y Fuller (1981) proponen aprovechar estas dos restricciones lineales para contrastar la
existencia de una raíz unitaria mediante el uso de un test de pseudo-F que especique:
½
H0 : Á = 1; ¹ = 0
:
H1 : Á < 1; ¹ 6= 0
8
Para el modelo que considera una tendencia determinista se pueden especicar dos conjuntos
de restricciones paramétricas. En primer lugar se puede contrastar:
½
H0 : Á = 1; ¹ = 0
;
H1 : Á < 1; ¹ 6= 0
si se considera que el PGD bajo la nula contiene una deriva o, en segundo lugar,
½
H0 : Á = 1; ¹ = ¯ = 0
;
H1 : Á < 1; ¹ 6= ¯ 6= 0
si se considera que el PGD bajo la nula no contiene una deriva.
Notas:
² Se pueden formular las mismas hipótesis considerando ® en lugar de Á;
² Para llevar a cabo el contraste de estas restricciones paramétricas se puede especicar un test
de tipo F, test de pseudo-F estrictamente hablando;
² La distribución asintótica de este contraste no será estándard, sino que será función de
movimientos Brownianos;
² Para consultar los valores críticos, ver la tabulación que realizan Dickey y Fuller (1981).
La presencia de autocorrelación en el término de perturbación
2.4
Hasta el momento se ha considerado que el término de perturbación de los modelos (5) a (7)
seguía un proceso ruido blanco. No obstante, en la práctica se acostumbran a presentar problemas de autocorrelación invalidan los contrastes de Dickey-Fuller derivados anteriormente, dado
que
T
donde ¸ = (¾ 2 ¡
¡1
T
X
¡
¢
yt¡1 "t ) (1=2) ¾ 2 W (1)2 ¡ 1 + ¸;
t=2
T
X
2
yt¡1
T ¡2
t=2
2
¾ " ) =2, siendo ¾ 2" la
) ¾
2
Z
y ¾ la varianza a largo plazo f"t g:
¾2
W (r)2 dr;
0
varianza a corto plazo de f"t g:
à T
!
X
"2t ;
¾ 2" =plim E
T !1
2
1
t=1
à T !2
X
= plim ST2 =plim E
"t
T !1
= plim E
T !1
T !1
à T
X
t=1
"2t
!
t=1
+ 2 plim E
T !1
9
ÃT ¡1 T
X X
t=1 s=t+1
!
"t "s :
Vemos, por tanto, que en las distribuciones asintóticas de (8) y (9) serán función de dos
parámetros molestos ¾ 2" y ¾ 2 que harán que sean especícas para cada par de valores de ¾ 2" y
¾2.
Para corregir el problema de la presencia de autocorrelación en el término de perturbación
existen dos procedimientos, dos correcciones alternativas:
1. Corrección paramétrica. La aplicación de este método da lugar a la aparición al contraste
de Dickey-Fuller aumentado (Augmented Dickey-Fuller test, ADF). Esta aproximación se
encuentra en los trabajos de Dickey y Fuller (1981) y Said y Dickey (1984).
2. Corrección no paramétrica. En este caso, esta corrección da lugar a los contrastes propuestos
por Phillips (1987) y Phillips y Perron (1988).
Vamos a describir brevemente la corrección paramétrica y la no paramétrica será abordada
en el próximo apartado.
Para presentar la corrección de tipo paramétrico vamos a suponer que el modelo dado por
(3) con (4) que sigue un proceso autoregresivo de orden p, ut » AR (p),
ut = Á1 ut¡1 + Á2 ut¡2 + : : : + Áp ut¡p + "t ;
(10)
con "t » iid (0; ¾ 2" ). Vemos que una sustitución de (10) en (3) proporciona el resultado:
"t
¢;
xt = f 0 (t) + ¡
1 ¡ Á1 L ¡ Á2 L2 ¡ : : : ¡ Áp Lp
(11)
Áp (L) xt = f 0 (t) + "t ;
¡
¢
con Áp (L) = 1 ¡ Á1 L ¡ Á2 L2 ¡ : : : ¡ Áp Lp . Un resultado de interés es el que nos permite
expresar Áp (L) como la suma de dos polinomios:
¡
¢
Áp (L) = (1 ¡ ½L) ¡ ³ 1 L + ³ 2 L2 + : : : + ³ p¡1 Lp¡1 (1 ¡ L) ;
donde
½ = Á1 + Á2 + : : : + Áp ;
¡
¢
³ j = ¡ Áj+1 + Áj+2 + : : : + Áp
8j = 1; 2; : : : ; p ¡ 1:
De esta manera, (11) se puede expresar como:
¢
¡
xt = f 0 (t) + ½ xt¡1 + ³ 1 L + ³ 2 L2 + : : : + ³ p¡1 Lp¡1 ¢xt + "t ;
0
¢xt = f (t) + (½ ¡ 1) xt¡1 +
¢xt = f 0 (t) + ® xt¡1 +
p¡1
X
p¡1
X
³ j ¢xt¡j + "t ;
j=1
³ j ¢xt¡j + "t :
j=1
10
(12)
Vemos que como resultado de considerar el esquema AR(p) de fut g se ha conseguido blan-
quear el término de perturbación de la ecuación de contraste por lo que ahora se puede contrastar
la presencia de una raíz unitaria en el polinomio autoregresivo Áp (L) mediante el contraste de
½
H0 : j®j = 0 ´ xt » I (1)
;
H1 : j®j < 0 ´ xt » I (0)
en la ecuación (12).
Notas:
² Los estadísticos de prueba se calculan de la manera habitual a partir de (8) y (9);
² Los valores críticos asintóticos tabulados bajo el supuesto que el término de perturbación era
ruido blanco -valores críticos de Fuller (1976) y Dickey y Fuller (1979)- son de aplicación
en este caso ya que con la corrección paramétrica se consigue eliminar la dependencia de las
distribuciones asintóticas respecto de los parámetros molestos;
² A partir de la estimación de (12) se pueden realizar los contrastes de restricciones paramétricas de tipo pseudo-F vistos anteriormente;
² Bajo el supuesto que ut » AR (p), las estimaciones de ³ j en (12) se distribuyen siguiendo
una Normal.
² Tenemos dos métodos habituales en la selección del orden del autoregresivo:
a. Said y Dickey (1984)
p indican que bajo el supuesto que ut » AR (p), p puede ser especicado como p = 3 T ;
b. Ng y Perron (1995) proponen seleccionar de manera endógena el valor de p haciendo uso
del hecho que ³ j » N . Se parte de un valor de p = pmax generoso que pueda contener
el auténtico valor de p. Se estima (12) con pmax retardos de la primera diferencia de la
endógena y se contrasta la signicación individual al 10% del último retardo. Si este es
signicativo se acaba el proceso. Si éste no es signicativo se pasa a estimar (12) con
(pmax ¡ 1) retardos, y así sucesivamente;
² Cuando ut » ARM A (p; q) se tendrá que seleccionar un orden para la corrección autoregresiva elevado que permita capturar la componente media móvil. No existe una regla general
para selección, a la práctica siendo de aplicación la segunda estrategia comentada en el punto
anterior.
2.5
El test de Phillips-Perron (PP)
Otra manera alternativa de proceder para eliminar la dependencia que muestran la distribuciones
asintóticas respecto de los parámetros molestos ¾ 2" y ¾ 2 consiste en corregir de manera no
paramétrica el valor de los estadísticos de prueba. Esta idea es la que se propone en los trabajos
de Phillips (1987) y Phillips y Perron (1988).
Una ventaja adicional de la aproximación adoptada por Phillips (1987) y Phillips y Perron
(1988) es que permiten que el término de perturbación sea un proceso ®-mixing (diferencia de
11
martingalas) que permite la presencia de autocorrelación y heteroscedastidad de una manera
más general a la que se permite con los modelos ARMA. No obstante, los modelos ARMA
quedan englobados dentro de los procesos ®-mixing.
Las correcciones que proponen son las siguientes:
² Para el modelo que no incorpora elementos deterministas:
1 (s2 ¡ s2u )
Z® = T ®
^¡
;
P
2
2 T ¡2 Tt=1 yt¡1
(s2 ¡ s2u )
su
1
t®^ ¡
;
³
PT 2 ´1=2
s
2
¡2
s T
t=1 yt¡1
Zt =
² Para el modelo que incorpora un término independiente:
(s2 ¡ s2u )
1
Z® = T ®
^¡
;
P
2 T ¡2 Tt=1 (yt¡1 ¡ y¹¡1 )2
Zt
(s2 ¡ s2u )
su
1
t®^ ¡
=
³
´1=2 ;
P
s
2
s T ¡2 Tt=1 (yt¡1 ¡ y¹¡1 )2
² Para el modelo que incorpora una tendencia determinista:
¢
T6 ¡ 2
^¡
Z® = T ®
s ¡ s2u ;
24Dx
¡
¢
su
T3
t®^ ¡ p 1=2 s2 ¡ s2u ;
Zt =
s
4 3Dx s
donde Dx es el determinante de la matriz (x0 x) con xt = (1; t; yt¡1 )0 .
Los parámetros s2u y s2 que intervienen en la corrección no paramétrica son estimaciones de
la varianza y de la varianza de largo plazo, respectivamente. La varianza se puede estimar de la
manera usual:
s2u
=T
¡1
T
X
u^2t ;
t=1
siendo f^
ut g la estimación MCO de la perturbación del modelo:
¢xt = f (t) + ® xt¡1 + ut :
Para la estimación de la varianza de largo se hace uso de los estimadores no paramétricos
basados en ventanas espectrales. La ventana espectral que utilizan es la de Bartlett, a partir
de la cual:
2
s =T
¡1
T
X
t=1
u^2t
+ 2T
¡1
mT µ
X
1¡
j=1
12
j
mT + 1
¶ X
T
t=j+1
u^t u^t¡j ;
donde mT denota el punto de truncamiento de la ventana espectral (amplitud de la ventana
espectral) de manera que a medida que T ! 1
mT ! 1;
mT
! 0:
T
Notas:
² Phillips (1987) y Phillips y Perron (1988) demuestran que Z® y Zt convergen hacia las respectivas distribuciones asintóticas derivadas por Fuller (1976) y Dickey y Fuller (1979) bajo
el supuesto de que ut » iid;
² La selección de la amplitud de la ventana espectral, mT , que se utiliza para hacer el contraste es un tema que se deja abierto. Es posible utilizar criterios de selección automática
propuestos por Newey y West (1994);
² Las dos correcciones, la paramétrica y la no paramétrica, proporcionan resultados equivalentes asintóticamente. No obstante, en muestra nita las diferencias pueden ser notables;
² Una comparación de las dos correcciones, la paramétrica y la no paramétrica, indica que la
paramétrica ofrece mejores resultados en muestra nita: menor distorsión en el tamaño del
contraste en presencia de esquemas MA;
² Ng y Perron (1998) y Perron y Ng (1998) proponen modicaciones del test PP que proporcionan buenos resultados en muestra nita, es decir, que corrigen los problemas de las
propuestas iniciales.
3 Contrastes de estacionariedad
Aunque se ha destacado la existencia de un amplio número de contrastes de estacionariedad, el más extendido en la práctica econométrica es el contraste propuesto por Kwiatkowski,
Phillips, Schmidt y Shin (1992), conocido como test KPSS. Por esta razón sólo nos vamos a
centrar en este contraste.
3.1
Test KPSS
Kwiatkowski et al. (1992) proponen reversar las hipótesis nula y alternativa de los contrastes
de raíces unitarias para determinar, de manera complementaria, el orden de integración de las
series temporales. En términos formales, el contraste KPSS especica las siguientes hipótesis
nula y alternativa generales:
½
H0 : xt » I (d ¡ 1)
:
H1 : xt » I (d)
Supongamos que se está interesado en contrastar si d = 0 o d = 1. Siguiendo las propuestas
de los contrastes de raíz unitaria, la literatura econométrica permite calcular el contraste KPSS
13
para tres especicaciones deterministas:
xt = "t ;
(13)
xt = ¹ + "t ;
(14)
xt = ¹ + ¯ t + "t :
(15)
La formulación del modelo (13) se puede encontrar en Hobijn, Franses y Ooms (1998) mientras
que la de los modelos (14) y (15) se debe a Kwiatkowski et al. (1992).
El contraste de KPSS es un contraste de multiplicadores de Lagrange que se formula como:
P
T ¡2 Tt=1 St2
KP SSi =
;
s2
con i = 0 para el modelo (13), i = 1 para el modelo (14) y i = 2 para el modelo (15), donde
P
St = tj=1 ^"t es el proceso de sumas parciales, con ^"t la estimación MCO de los residuos de
las ecuaciones (13) a (15), según sea la especicación determinista. El parámetro s2 denota la
estimación de la varianza de largo plazo, tal y como se ha denido en el apartado del test de
Phillips-Perron.
Kwiatkowski et al. (1992) y Hobijn et al. (1998) demuestran, para sus respectivas especicaciones, que
KP SSi )
Z
1
W ¤ (r)2 dr;
0
para i = f0; 1; 2g, siendo W ¤ (r) un movimiento Browniano al que se le ha extraído la media.
En concreto, para i = 0, W ¤ (r) = W (r); para i = 1, W ¤ (r) = W (r) ¡ rW (1); para i = 2,
R1
W ¤ (r) = W (r) ¡ 3 (r2 ¡ r) W (1) + 6 (r2 ¡ r) 0 W (s) ds.
Notas:
² La distribución asintótica del test KPSS no es estándard, y depende de la especicación
determinista adoptada;
² El contraste depende fuertemente de la amplitud de la ventana espectral. Para mitigar esta
dependencia se puede seleccionar la amplitud de la ventana espectral de manera automática
siguiendo el procedimiento de Newey y West (1994);
² El contraste presenta distorsión en el tamaño cuando el término de perturbación incluye
esquemas MA;
² El contraste de Leybourne y McCabe (1994) se puede ver como la propuesta que corrige la
presencia de autocorrelación de manera paramétrica.
14
Figure 1. Estrategia de ?
4 Contrastes de más de una raíz unitaria
Hasta el momento la explicación ha considerado la situación en que se quería discriminar
entre d = 1 o d = 0. No obstante y aunque en menos situaciones, se podría estar interesado en
contrastar la existencia de más de una raíz unitaria.
El trabajo de ? propone seguir una estrategia basada en el principio de ir de la situación más
general hacia la más especíca. Por ejemplo, siguiendo los pasos:
Para ello se deberán modicar convenientemente las ecuaciones de regresión auxiliares en
que se basa el cálculo de los contrates.
Por ejemplo, para el test Durbin-Watson de Sargan y Bhargava (1983):
½
H0 : xt » I (d)
;
H1 : xt » I (d ¡ 1)
con el modelo asociado dado por:
¢d¡1 xt = c + ut :
Para el test ADF:
½
H0 : xt » I (d)
;
H1 : xt » I (d ¡ 1)
15
con el modelo asociado dado por:
d
0
d¡1
¢ xt = f (t) + ® ¢
xt¡1 +
p¡1
X
³ j ¢d xt¡j + "t :
j=1
Para el test KPSS:
con el modelo asociado dado por:
½
H0 : xt » I (d ¡ 1)
;
H1 : xt » I (d)
¢d¡1 xt = f (t) + "t :
Nótese que la especicación determinista se deberá adecuar a las características de la variable
analizada en cada caso.
16
Referencias
Dickey, D. A. y W. A. Fuller (1979), “Distribution of the Estimators for Autoregressive Time
Series with a Unit Root,” Journal of the American Statistical Association, pp. 423–431.
y
(1981), “Likelihood Ratio Statistics for Autoregressive Time Series with a Unit
Root,” Econometrica, (49), 1057–1073.
Fuller, W. A. (1976), Introduction to Time Series Analysis, John Wiley & Sons.
Hobijn, B., P. H. B. Franses, y M. Ooms (1998), “Generalizations of the KPSS-test for Stationarity,” Documento de Trabajo 9802, Econometric Institute. Erasmus University Rotterdam.
Kwiatkowski, D., P. C. B. Phillips, P. J. Schmidt, y Y. Shin (1992), “Testing the Null Hypothesis
of Stationarity Against the Alternative of a Unit Root: How Sure are We that Economic
Time Series Have a Unit Root,” Journal of Econometrics, (54), 159–178.
Leybourne, S. J. y B. P. M. McCabe (1994), “A Consistent Test for a Unit Root,” Journal of
Business & Economic Statistics, (12, 2), 157–166.
Newey, W. K. y K. D. West (1994), “Automatic lag Selection in Covariance Matrix Estimation,”
Review of Economic Studies, (61), 631–653.
Ng, S. y P. Perron (1995), “Unit Root Test in ARMA models with Data-Dependent Methods for
the Selection of the Truncation Lag,” Journal of the American Statistical Association, (90),
268–281.
y
(1998), “Lag Length Selection and the Construction of Unit Root Tests with Good
Size and Power,” Documento de Trabajo, Department of Economics. Boston College.
Perron, P. y S. Ng (1998), “An Autoregressive Spectral Density Estimator at Frequency Zero
for Nonstationarity Tests,” Econometric Theory, (14), 560–603.
Phillips, P. C. B. (1987), “Time Series Regression with a Unit Root,” Econometrica, (55, 2),
277–301.
Phillips, P. C. B y P. Perron (1988), “Testing for a Unit Root in Time Series Regression,”
Biometrika, (75), 335–346.
Said, S. E. y D. A. Dickey (1984), “Testing for Unit Root in Autoregressive-Moving Average
Models of Unknown Order,” Biometrika, (71), 599–608.
Sargan, J. D. y A. Bhargava (1983), “Testing for Residuals from Least Squares Regression for
Being Generated by the Gaussian Random Walk,” Econometrica, (51), 153–174.
17
Descargar