Macroeconometría Notas sobre la clase de contrastes de raíces unitarias Josep Lluís Carrion i Silvestre Marzo de 2001 1 Clasicación de los contrastes de integración Aunque recogemos bajo una misma denominación de contrastes de raíz unitaria, la literatura ofrece dos estrategias para determinar el orden de integración de las series temporales. La primera estrategia da lugar a la especicación de los contrastes de raíz unitaria y consiste en contrastar las hipótesis: ½ H0 : xt » I (d) : H1 : xt » I (d ¡ 1) La segunda estrategia da lugar a los llamados contrastes de estacionariedad, que reversan las hipótesis nula y alternativa que especican los contrastes de raíz unitaria. En concreto, en los contrastes de estacionariedad se formularán las siguientes hipótesis: ½ H0 : xt » I (d ¡ 1) : H1 : xt » I (d) Las propuestas de estadísticos de prueba para contrastar el orden de integración de las series temporales son muchas. Algunas de ellas se recogen en la Tabla 1. Table 1. Algunos contrastes de raíces unitarias y de estacionariedad Contrastes de raíz unitaria I (1) vs I (0) Test de Dickey-Fuller (DF) Test de Phillips-Perron (PP) Test de Sargan y Bhargava (DW) Test de variables instrumentales de Hall Test de Schmidt y Phillips (SP) Test de von Newman Test de Bhargava Test de Durbin y Hausman Contrastes de estacionariedad I (0) vs I (1) Test de Kwiatkowski, Phillips, Schmidt y Shin (KPSS) Test de Leybourne y McCabe (LMC) Test de Choi Test de Park Test de Bierens y Guo Test de Arellano y Pantula Nosotros nos vamos a centrar en presentar los contrastes más usuales en las aplicaciones econométricas. La exposición va a contemplar, en primer lugar, el caso en el que se supone que como máximo va a poder existir una raíz unitaria en el polinomio autorgresivo de la variable por lo que la variable será I (1) o I (0). Una vez presentados los contrastes para esta situación se comentará como proceder cuando se quiere contrastar la presencia de más de una raíz unitaria. 2 2 Contrastes de raíz unitaria 2.1 Test de Durbin-Watson de Sargan y Bhargava Sargan y Bhargava (1983) proponen estimar el modelo: xt = c + ut ; (1) y calcular el test de Durbin-Watson: PT PT 2 ut ¡ u^t¡1 )2 t=2 (^ t=2 (xt ¡ xt¡1 ) = DW = PT PT 2 ^2t t=1 u t=1 xt para realizar el contraste de las hipótesis: ½ H0 : xt » I (1) : H1 : xt » I (0) Nótese que si xt » I (1) también lo será ut dado que lo único que se realiza con la estimación de (1) es eliminar su media, dejando intactas las propiedades estocásticas de xt , las cuales se traspasarán a u^t . Como el test de Durbin-Watson se puede aproximar como: DW ' 2 (1 ¡ ½) ; donde ½ es el coeciente de autocorrelación de primer orden, si xt » I (1) ) ½ = 1 y, consecuentemente, DW = 0. De esta manera, una forma para llevar a cabo el contraste de integración de una variable consiste en: ½ H0 : DW = 0 ´ xt » I (1) : H1 : DW > 0 ´ xt » I (0) Notas: ² El test de Sargan y Bhargava sólo es útil frente a la alternativa de un proceso AR(1) estacionario; ² No le inuye la especicación determinista; ² La distribución asintótica del contraste no es estándard, ya que depende de procesos Brownianos. Los valores críticos se encuentran tabulados en el trabajo de Sargan y Bhargava (1983). 2.2 Test de Dickey-Fuller (DF) El test de Dickey-Fuller se propone en los trabajos de Fuller (1976) y Dickey y Fuller (1979, 1981) y parte del supuesto que la serie temporal que se analiza se puede representar como un 3 proceso autoregresivo de primer orden: xt = f (t) + Á xt¡1 + "t ; (2) con f (t) denotando la componente determinista de la serie temporal y "t » iid (0; ¾ 2" ). Nótese que (2) se puede expresar como: (1 ¡ ÁL) xt = f (t) + "t ; por lo que si jÁj < 1 el proceso será estacionario en varianza, xt » I (0); si jÁj = 1 el proceso será no estacionario en varianza, xt » I (1); nalmente, si jÁj > 1 el proceso será explosivo. Cada una de estas expresiones es la forma reducida del modelo: xt = f 0 (t) + ut ; (3) ut = Á ut¡1 + "t : (4) Fijémonos que sustituyendo (4) en (3) se obtiene: "t xt = f 0 (t) + ; (1 ¡ ÁL) = (1 ¡ ÁL) f 0 (t) + Á xt¡1 + "t : Así, supongamos que f 0 (t) = 0; entonces (1 ¡ ÁL) f 0 (t) = 0; dando lugar a la ecuación: xt = Á xt¡1 + "t : Si se supone que f 0 (t) = ¹0 ; entonces (1 ¡ ÁL) f 0 (t) = (1 ¡ Á) ¹0 ; = ¹: Finalmente, se podría suponer que f 0 (t) = ¹0 + ¯ 0 t; con lo que (1 ¡ ÁL) f 0 (t) = (1 ¡ ÁL) (¹0 + ¯ 0 t) ; = (1 ¡ Á) ¹0 + ¯ 0 (1 ¡ ÁL) t; 4 = (1 ¡ Á) ¹0 + ¯ 0 (t ¡ Á (t ¡ 1)) ; = (1 ¡ Á) ¹0 + ¯ 0 Á + ¯ 0 (1 ¡ Á) t; = ¹ + ¯ t: Las especicaciones deterministas que consideran Dickey y Fuller arrojan los siguientes modelos: xt = Á xt¡1 + "t ; (5) xt = ¹ + Á xt¡1 + "t ; (6) xt = ¹ + ¯ t + Á xt¡1 + "t ; (7) con ¹ = (1 ¡ Á) ¹0 para el modelo (6) y con ¹ = (1 ¡ Á) ¹0 + ¯ 0 Á y ¯ = ¯ 0 (1 ¡ Á) para el modelo (7). Es decir, se consideran tres modelos: el primero no contiene términos deterministas, el segundo contiene un término independiente y el tercero una tendencia determinista. Nótese que si el proceso es estacionario, jÁj < 1, la estimación MCO de Á se distribuirá asintóticamente como: ´ p ³ ¡ ¡ ¢¢ ^ ¡ Á » N 0; ¾ 2 1 ¡ Á2 ; T Á " resultado que se obtiene a partir de la aplicación del Teorema Central del Límite. No obstante, en el caso que el proceso sea no estacionario, jÁj = 1, y el estimador no convergiría hacia una distribución degenerada ya que ³ ´ ¡ ¢ ^ = ¾ 2 1 ¡ Á2 = 0. por ser V Á " ´ p ³ p ^¡1 ! T Á 0; Para que esto no ocurra será necesario considerar un ratio de convergencia, velocidad de convergencia, más elevado que el que se da en el caso de procesos estacionarios, los cuales p convergen a un ratio de T . En concreto, Fuller (1976) y Dickey y Fuller (1979, 1981) proponen contrastar el orden de integración de la variable especicando las siguientes hipótesis: ½ H0 : jÁj = 1 ´ xt » I (1) ; H1 : jÁj < 1 ´ xt » I (0) a partir del cálculo de dos estadísticos de prueba: (1) el del sesgo normalizado: ³ ´ (1=T ) PT y " t=2 t¡1 t ^ T Á¡1 = ; P 2 2 (1=T ) Tt=2 yt¡1 5 (8) y (2) el del pseudo t-ratio: ³ ´ ^ Á¡1 tÁ^ = q ± P ; T 2 ¾ ^ 2" y t=2 t¡1 (9) ^ es la estimación MCO de Á en los modelos (5) a (7), según sea la especicación donde Á determinista adoptada. Estos dos estadísticos son conocidos indistintamente como contrastes de Dickey-Fuller, siendo el más utilizado el pseudo t-ratio. Una manera alternativa de llevar a cabo el contraste consiste en transformar las ecuaciones de contraste de la manera siguiente: xt = ¹ + ¯ t + Á xt¡1 + "t ; xt ¡ xt¡1 = ¹ + ¯ t + Á xt¡1 ¡ xt¡1 + "t ; ¢xt = ¹ + ¯ t + ® xt¡1 + "t ; con ® = (Á ¡ 1). Nótese que esta transformación no afecta a la componente determinista. Ahora las hipótesis de contraste se tendrán que especicar como: ½ H0 : j®j = 0 ´ xt » I (1) ; H1 : j®j < 0 ´ xt » I (0) aunque los estadísticos de prueba no se ven alterados. Así, el test del sesgo normalizado será: ³ ´ (1=T ) PT y " t=2 t¡1 t ^¡1 = T® ^=T Á ; P 2 2 (1=T ) Tt=2 yt¡1 y el del pseudo t-ratio: ® ^ t®^ = q ± P : T 2 ¾ ^ 2" y t=2 t¡1 2.2.1 Los modelos bajo la hipótesis nula y la alternativa Los tres modelos formulados por las ecuaciones (5) a (7) implican diferentes comportamientos para la serie temporal bajo la hipótesis nula y bajo la hipótesis alternativa. Supongamos la especicación dada por (5). Bajo la hipótesis nula de que Á = 1 -o, alternativamente, ® = 0- el PGD de la variable sería: xt = xt¡1 + "t ; t¡1 X "t¡j ; xt = x0 + j=0 xt = x0 + St¡1 ; donde St¡1 = Pt¡1 j=0 "t¡j es el proceso de suma parcial. Así, bajo la hipótesis nula fxt g se comporta como un camino aleatorio sin deriva. Bajo la hipótesis alternativa de que jÁj < 1 -o, 6 alternativamente, ® < 0: xt = Á xt¡1 + "t ; el proceso fxt g viene descrito por un autoregresivo sin elementos deterministas: xt = Á xt¡1 + "t : En el caso del modelo (6) tenemos que bajo la hipótesis nula de Á = 1 -o, alternativamente, ® = 0: ¹ = (1 ¡ Á) ¹0 = (1 ¡ 1) ¹0 = 0; por lo que el PGD viene dado por: xt = x0 + St¡1 ; mientras que bajo la alternativa fxt g sigue un proceso autoregresivo estacionario que uctura sobre un valor constante: xt = ¹ + Á xt¡1 + "t : Finalmente, en el caso del modelo (7) tenemos que bajo la hipótesis nula de Á = 1 -o, alternativamente, ® = 0: ¹ = (1 ¡ Á) ¹0 + ¯ 0 Á; = ¯0 ¯ = ¯ 0 (1 ¡ Á) ; = 0; por lo que el PGD viene dado por: xt = x0 + ¯ 0 t + St¡1 ; mientras que bajo la alternativa fxt g sigue un proceso autoregresivo estacionario que uctura sobre una tendencia determinista: xt = ¹ + ¯ t + Á xt¡1 + "t : 2.2.2 Distribución asintótica A partir de los resultados mostrados anteriormente, sabemos que si "t » iid (0; ¾ 2" ), entonces ¾ 2" = ¾ 2 y: T ¡1 T X t=2 yt¡1 "t ) ¾ 2 Z 1 W (r) dW (r) ; 0 ¡ ¢ ´ (1=2) ¾ 2 W (1)2 ¡ 1 ; 7 T ¡2 T X 2 yt¡1 ) ¾ t=2 2 Z 1 W (r)2 dr; 0 por lo que Phillips (1987) demuestra que: ¡ ¤ 2 ¢ ³ ´ (1=2) W (1) ¡ 1 ^¡1 ) T Á ; R1 ¤ (r)2 dr W 0 ¡ ¢ (1=2) W ¤ (1)2 ¡ 1 qR ; tÁ^ ) 1 2 ¤ W (r) dr 0 donde ) indica convergencia débil a la medida de probabilidad asociada, W ¤ (r) denota un movimiento Browniano al cual se le ha extraído su media. En el caso del modelo (5): W ¤ (r) = W (r). Para el modelo (6): W ¤ (r) = W (r) ¡ r W (1). Para el modelo (7): W ¤ (r) = R1 W (r) ¡ 3 (r2 ¡ r) W (1) + 6 (r2 ¡ r) 0 W (s) ds. Notas: ² Las distribuciones asintóticas no son estándard, ya que son función de procesos Brownianos (procesos de Wiener); ² Las distribuciones de cada uno de estos contrastes se encuentran tabuladas en los trabajos de Fuller (1976) y Dickey y Fuller (1979); ² Como se puede apreciar, las distribuciones de los estadísticos de prueba no son independientes de la especicación determinista que se haya adoptado. Este hecho hará que cada estadístico posea una distribución asintótica y, consecuentemente, unos valores críticos asociados que variará según sea la componente determinista que se especique. 2.3 Otros contrastes de Dickey-Fuller. Tests de pseudo-F Se ha podido ver que el hecho de situarse bajo la hipótesis nula o alternativa implica, a parte de un determinado valor para el parámetro Á, unas restricciones de igualdad para los parámetros asociados a la componente determinista. En concreto, de haber especicado el modelo (6), se da que bajo la hipótesis nula Á = 1 y ¹ = 0. Dickey y Fuller (1981) proponen aprovechar estas dos restricciones lineales para contrastar la existencia de una raíz unitaria mediante el uso de un test de pseudo-F que especique: ½ H0 : Á = 1; ¹ = 0 : H1 : Á < 1; ¹ 6= 0 8 Para el modelo que considera una tendencia determinista se pueden especicar dos conjuntos de restricciones paramétricas. En primer lugar se puede contrastar: ½ H0 : Á = 1; ¹ = 0 ; H1 : Á < 1; ¹ 6= 0 si se considera que el PGD bajo la nula contiene una deriva o, en segundo lugar, ½ H0 : Á = 1; ¹ = ¯ = 0 ; H1 : Á < 1; ¹ 6= ¯ 6= 0 si se considera que el PGD bajo la nula no contiene una deriva. Notas: ² Se pueden formular las mismas hipótesis considerando ® en lugar de Á; ² Para llevar a cabo el contraste de estas restricciones paramétricas se puede especicar un test de tipo F, test de pseudo-F estrictamente hablando; ² La distribución asintótica de este contraste no será estándard, sino que será función de movimientos Brownianos; ² Para consultar los valores críticos, ver la tabulación que realizan Dickey y Fuller (1981). La presencia de autocorrelación en el término de perturbación 2.4 Hasta el momento se ha considerado que el término de perturbación de los modelos (5) a (7) seguía un proceso ruido blanco. No obstante, en la práctica se acostumbran a presentar problemas de autocorrelación invalidan los contrastes de Dickey-Fuller derivados anteriormente, dado que T donde ¸ = (¾ 2 ¡ ¡1 T X ¡ ¢ yt¡1 "t ) (1=2) ¾ 2 W (1)2 ¡ 1 + ¸; t=2 T X 2 yt¡1 T ¡2 t=2 2 ¾ " ) =2, siendo ¾ 2" la ) ¾ 2 Z y ¾ la varianza a largo plazo f"t g: ¾2 W (r)2 dr; 0 varianza a corto plazo de f"t g: à T ! X "2t ; ¾ 2" =plim E T !1 2 1 t=1 à T !2 X = plim ST2 =plim E "t T !1 = plim E T !1 T !1 à T X t=1 "2t ! t=1 + 2 plim E T !1 9 ÃT ¡1 T X X t=1 s=t+1 ! "t "s : Vemos, por tanto, que en las distribuciones asintóticas de (8) y (9) serán función de dos parámetros molestos ¾ 2" y ¾ 2 que harán que sean especícas para cada par de valores de ¾ 2" y ¾2. Para corregir el problema de la presencia de autocorrelación en el término de perturbación existen dos procedimientos, dos correcciones alternativas: 1. Corrección paramétrica. La aplicación de este método da lugar a la aparición al contraste de Dickey-Fuller aumentado (Augmented Dickey-Fuller test, ADF). Esta aproximación se encuentra en los trabajos de Dickey y Fuller (1981) y Said y Dickey (1984). 2. Corrección no paramétrica. En este caso, esta corrección da lugar a los contrastes propuestos por Phillips (1987) y Phillips y Perron (1988). Vamos a describir brevemente la corrección paramétrica y la no paramétrica será abordada en el próximo apartado. Para presentar la corrección de tipo paramétrico vamos a suponer que el modelo dado por (3) con (4) que sigue un proceso autoregresivo de orden p, ut » AR (p), ut = Á1 ut¡1 + Á2 ut¡2 + : : : + Áp ut¡p + "t ; (10) con "t » iid (0; ¾ 2" ). Vemos que una sustitución de (10) en (3) proporciona el resultado: "t ¢; xt = f 0 (t) + ¡ 1 ¡ Á1 L ¡ Á2 L2 ¡ : : : ¡ Áp Lp (11) Áp (L) xt = f 0 (t) + "t ; ¡ ¢ con Áp (L) = 1 ¡ Á1 L ¡ Á2 L2 ¡ : : : ¡ Áp Lp . Un resultado de interés es el que nos permite expresar Áp (L) como la suma de dos polinomios: ¡ ¢ Áp (L) = (1 ¡ ½L) ¡ ³ 1 L + ³ 2 L2 + : : : + ³ p¡1 Lp¡1 (1 ¡ L) ; donde ½ = Á1 + Á2 + : : : + Áp ; ¡ ¢ ³ j = ¡ Áj+1 + Áj+2 + : : : + Áp 8j = 1; 2; : : : ; p ¡ 1: De esta manera, (11) se puede expresar como: ¢ ¡ xt = f 0 (t) + ½ xt¡1 + ³ 1 L + ³ 2 L2 + : : : + ³ p¡1 Lp¡1 ¢xt + "t ; 0 ¢xt = f (t) + (½ ¡ 1) xt¡1 + ¢xt = f 0 (t) + ® xt¡1 + p¡1 X p¡1 X ³ j ¢xt¡j + "t ; j=1 ³ j ¢xt¡j + "t : j=1 10 (12) Vemos que como resultado de considerar el esquema AR(p) de fut g se ha conseguido blan- quear el término de perturbación de la ecuación de contraste por lo que ahora se puede contrastar la presencia de una raíz unitaria en el polinomio autoregresivo Áp (L) mediante el contraste de ½ H0 : j®j = 0 ´ xt » I (1) ; H1 : j®j < 0 ´ xt » I (0) en la ecuación (12). Notas: ² Los estadísticos de prueba se calculan de la manera habitual a partir de (8) y (9); ² Los valores críticos asintóticos tabulados bajo el supuesto que el término de perturbación era ruido blanco -valores críticos de Fuller (1976) y Dickey y Fuller (1979)- son de aplicación en este caso ya que con la corrección paramétrica se consigue eliminar la dependencia de las distribuciones asintóticas respecto de los parámetros molestos; ² A partir de la estimación de (12) se pueden realizar los contrastes de restricciones paramétricas de tipo pseudo-F vistos anteriormente; ² Bajo el supuesto que ut » AR (p), las estimaciones de ³ j en (12) se distribuyen siguiendo una Normal. ² Tenemos dos métodos habituales en la selección del orden del autoregresivo: a. Said y Dickey (1984) p indican que bajo el supuesto que ut » AR (p), p puede ser especicado como p = 3 T ; b. Ng y Perron (1995) proponen seleccionar de manera endógena el valor de p haciendo uso del hecho que ³ j » N . Se parte de un valor de p = pmax generoso que pueda contener el auténtico valor de p. Se estima (12) con pmax retardos de la primera diferencia de la endógena y se contrasta la signicación individual al 10% del último retardo. Si este es signicativo se acaba el proceso. Si éste no es signicativo se pasa a estimar (12) con (pmax ¡ 1) retardos, y así sucesivamente; ² Cuando ut » ARM A (p; q) se tendrá que seleccionar un orden para la corrección autoregresiva elevado que permita capturar la componente media móvil. No existe una regla general para selección, a la práctica siendo de aplicación la segunda estrategia comentada en el punto anterior. 2.5 El test de Phillips-Perron (PP) Otra manera alternativa de proceder para eliminar la dependencia que muestran la distribuciones asintóticas respecto de los parámetros molestos ¾ 2" y ¾ 2 consiste en corregir de manera no paramétrica el valor de los estadísticos de prueba. Esta idea es la que se propone en los trabajos de Phillips (1987) y Phillips y Perron (1988). Una ventaja adicional de la aproximación adoptada por Phillips (1987) y Phillips y Perron (1988) es que permiten que el término de perturbación sea un proceso ®-mixing (diferencia de 11 martingalas) que permite la presencia de autocorrelación y heteroscedastidad de una manera más general a la que se permite con los modelos ARMA. No obstante, los modelos ARMA quedan englobados dentro de los procesos ®-mixing. Las correcciones que proponen son las siguientes: ² Para el modelo que no incorpora elementos deterministas: 1 (s2 ¡ s2u ) Z® = T ® ^¡ ; P 2 2 T ¡2 Tt=1 yt¡1 (s2 ¡ s2u ) su 1 t®^ ¡ ; ³ PT 2 ´1=2 s 2 ¡2 s T t=1 yt¡1 Zt = ² Para el modelo que incorpora un término independiente: (s2 ¡ s2u ) 1 Z® = T ® ^¡ ; P 2 T ¡2 Tt=1 (yt¡1 ¡ y¹¡1 )2 Zt (s2 ¡ s2u ) su 1 t®^ ¡ = ³ ´1=2 ; P s 2 s T ¡2 Tt=1 (yt¡1 ¡ y¹¡1 )2 ² Para el modelo que incorpora una tendencia determinista: ¢ T6 ¡ 2 ^¡ Z® = T ® s ¡ s2u ; 24Dx ¡ ¢ su T3 t®^ ¡ p 1=2 s2 ¡ s2u ; Zt = s 4 3Dx s donde Dx es el determinante de la matriz (x0 x) con xt = (1; t; yt¡1 )0 . Los parámetros s2u y s2 que intervienen en la corrección no paramétrica son estimaciones de la varianza y de la varianza de largo plazo, respectivamente. La varianza se puede estimar de la manera usual: s2u =T ¡1 T X u^2t ; t=1 siendo f^ ut g la estimación MCO de la perturbación del modelo: ¢xt = f (t) + ® xt¡1 + ut : Para la estimación de la varianza de largo se hace uso de los estimadores no paramétricos basados en ventanas espectrales. La ventana espectral que utilizan es la de Bartlett, a partir de la cual: 2 s =T ¡1 T X t=1 u^2t + 2T ¡1 mT µ X 1¡ j=1 12 j mT + 1 ¶ X T t=j+1 u^t u^t¡j ; donde mT denota el punto de truncamiento de la ventana espectral (amplitud de la ventana espectral) de manera que a medida que T ! 1 mT ! 1; mT ! 0: T Notas: ² Phillips (1987) y Phillips y Perron (1988) demuestran que Z® y Zt convergen hacia las respectivas distribuciones asintóticas derivadas por Fuller (1976) y Dickey y Fuller (1979) bajo el supuesto de que ut » iid; ² La selección de la amplitud de la ventana espectral, mT , que se utiliza para hacer el contraste es un tema que se deja abierto. Es posible utilizar criterios de selección automática propuestos por Newey y West (1994); ² Las dos correcciones, la paramétrica y la no paramétrica, proporcionan resultados equivalentes asintóticamente. No obstante, en muestra nita las diferencias pueden ser notables; ² Una comparación de las dos correcciones, la paramétrica y la no paramétrica, indica que la paramétrica ofrece mejores resultados en muestra nita: menor distorsión en el tamaño del contraste en presencia de esquemas MA; ² Ng y Perron (1998) y Perron y Ng (1998) proponen modicaciones del test PP que proporcionan buenos resultados en muestra nita, es decir, que corrigen los problemas de las propuestas iniciales. 3 Contrastes de estacionariedad Aunque se ha destacado la existencia de un amplio número de contrastes de estacionariedad, el más extendido en la práctica econométrica es el contraste propuesto por Kwiatkowski, Phillips, Schmidt y Shin (1992), conocido como test KPSS. Por esta razón sólo nos vamos a centrar en este contraste. 3.1 Test KPSS Kwiatkowski et al. (1992) proponen reversar las hipótesis nula y alternativa de los contrastes de raíces unitarias para determinar, de manera complementaria, el orden de integración de las series temporales. En términos formales, el contraste KPSS especica las siguientes hipótesis nula y alternativa generales: ½ H0 : xt » I (d ¡ 1) : H1 : xt » I (d) Supongamos que se está interesado en contrastar si d = 0 o d = 1. Siguiendo las propuestas de los contrastes de raíz unitaria, la literatura econométrica permite calcular el contraste KPSS 13 para tres especicaciones deterministas: xt = "t ; (13) xt = ¹ + "t ; (14) xt = ¹ + ¯ t + "t : (15) La formulación del modelo (13) se puede encontrar en Hobijn, Franses y Ooms (1998) mientras que la de los modelos (14) y (15) se debe a Kwiatkowski et al. (1992). El contraste de KPSS es un contraste de multiplicadores de Lagrange que se formula como: P T ¡2 Tt=1 St2 KP SSi = ; s2 con i = 0 para el modelo (13), i = 1 para el modelo (14) y i = 2 para el modelo (15), donde P St = tj=1 ^"t es el proceso de sumas parciales, con ^"t la estimación MCO de los residuos de las ecuaciones (13) a (15), según sea la especicación determinista. El parámetro s2 denota la estimación de la varianza de largo plazo, tal y como se ha denido en el apartado del test de Phillips-Perron. Kwiatkowski et al. (1992) y Hobijn et al. (1998) demuestran, para sus respectivas especicaciones, que KP SSi ) Z 1 W ¤ (r)2 dr; 0 para i = f0; 1; 2g, siendo W ¤ (r) un movimiento Browniano al que se le ha extraído la media. En concreto, para i = 0, W ¤ (r) = W (r); para i = 1, W ¤ (r) = W (r) ¡ rW (1); para i = 2, R1 W ¤ (r) = W (r) ¡ 3 (r2 ¡ r) W (1) + 6 (r2 ¡ r) 0 W (s) ds. Notas: ² La distribución asintótica del test KPSS no es estándard, y depende de la especicación determinista adoptada; ² El contraste depende fuertemente de la amplitud de la ventana espectral. Para mitigar esta dependencia se puede seleccionar la amplitud de la ventana espectral de manera automática siguiendo el procedimiento de Newey y West (1994); ² El contraste presenta distorsión en el tamaño cuando el término de perturbación incluye esquemas MA; ² El contraste de Leybourne y McCabe (1994) se puede ver como la propuesta que corrige la presencia de autocorrelación de manera paramétrica. 14 Figure 1. Estrategia de ? 4 Contrastes de más de una raíz unitaria Hasta el momento la explicación ha considerado la situación en que se quería discriminar entre d = 1 o d = 0. No obstante y aunque en menos situaciones, se podría estar interesado en contrastar la existencia de más de una raíz unitaria. El trabajo de ? propone seguir una estrategia basada en el principio de ir de la situación más general hacia la más especíca. Por ejemplo, siguiendo los pasos: Para ello se deberán modicar convenientemente las ecuaciones de regresión auxiliares en que se basa el cálculo de los contrates. Por ejemplo, para el test Durbin-Watson de Sargan y Bhargava (1983): ½ H0 : xt » I (d) ; H1 : xt » I (d ¡ 1) con el modelo asociado dado por: ¢d¡1 xt = c + ut : Para el test ADF: ½ H0 : xt » I (d) ; H1 : xt » I (d ¡ 1) 15 con el modelo asociado dado por: d 0 d¡1 ¢ xt = f (t) + ® ¢ xt¡1 + p¡1 X ³ j ¢d xt¡j + "t : j=1 Para el test KPSS: con el modelo asociado dado por: ½ H0 : xt » I (d ¡ 1) ; H1 : xt » I (d) ¢d¡1 xt = f (t) + "t : Nótese que la especicación determinista se deberá adecuar a las características de la variable analizada en cada caso. 16 Referencias Dickey, D. A. y W. A. Fuller (1979), “Distribution of the Estimators for Autoregressive Time Series with a Unit Root,” Journal of the American Statistical Association, pp. 423–431. y (1981), “Likelihood Ratio Statistics for Autoregressive Time Series with a Unit Root,” Econometrica, (49), 1057–1073. Fuller, W. A. (1976), Introduction to Time Series Analysis, John Wiley & Sons. Hobijn, B., P. H. B. Franses, y M. Ooms (1998), “Generalizations of the KPSS-test for Stationarity,” Documento de Trabajo 9802, Econometric Institute. Erasmus University Rotterdam. Kwiatkowski, D., P. C. B. Phillips, P. J. Schmidt, y Y. Shin (1992), “Testing the Null Hypothesis of Stationarity Against the Alternative of a Unit Root: How Sure are We that Economic Time Series Have a Unit Root,” Journal of Econometrics, (54), 159–178. Leybourne, S. J. y B. P. M. McCabe (1994), “A Consistent Test for a Unit Root,” Journal of Business & Economic Statistics, (12, 2), 157–166. Newey, W. K. y K. D. West (1994), “Automatic lag Selection in Covariance Matrix Estimation,” Review of Economic Studies, (61), 631–653. Ng, S. y P. Perron (1995), “Unit Root Test in ARMA models with Data-Dependent Methods for the Selection of the Truncation Lag,” Journal of the American Statistical Association, (90), 268–281. y (1998), “Lag Length Selection and the Construction of Unit Root Tests with Good Size and Power,” Documento de Trabajo, Department of Economics. Boston College. Perron, P. y S. Ng (1998), “An Autoregressive Spectral Density Estimator at Frequency Zero for Nonstationarity Tests,” Econometric Theory, (14), 560–603. Phillips, P. C. B. (1987), “Time Series Regression with a Unit Root,” Econometrica, (55, 2), 277–301. Phillips, P. C. B y P. Perron (1988), “Testing for a Unit Root in Time Series Regression,” Biometrika, (75), 335–346. Said, S. E. y D. A. Dickey (1984), “Testing for Unit Root in Autoregressive-Moving Average Models of Unknown Order,” Biometrika, (71), 599–608. Sargan, J. D. y A. Bhargava (1983), “Testing for Residuals from Least Squares Regression for Being Generated by the Gaussian Random Walk,” Econometrica, (51), 153–174. 17