1 Universidad de la República Facultad de Ciencias Económicas y de Administración ECONOMETRÍA II RAÍZ UNITARIA - TESTS DE DICKEY – FULLER Ana María Teja - Notas de clases (julio 2006, revisión julio 2008) Tests de Dickey – Fuller en modelos AR(1) El “random walk”, caminata al azar, es un caso especial de un modelo AR(1), el proceso no estacionario más simple. Considere los siguientes procesos: x t = ρ x t −1 + ut ρ < 1 y t = y t −1 + v t Los términos de error ut y vt son normales independientes e idénticamente distribuidos con media cero y varianza unitaria. Tanto xt como yt son modelos AR(1). La diferencia entre los dos modelos es que yt es un caso especial de un proceso xt cuando ρ es igual a uno, es un modelo de caminata al azar o “random walk”. Es un modelo con raíz unitaria puesto que la raíz de la ecuación AR(1) es 1. Los tests más simples y ampliamente usados para detectar si una serie de tiempo tiene una raíz unitaria son los tests de Dickey – Fuller (1979). Considere el modelo AR(1): (1) yt = ρ yt-1 + ut Como se expresó, si ρ = 1 en (1) el proceso es no estacionario y tiene una raíz unitaria, es un proceso “random walk”. Si resta yt-1 a ambos lados de (1) obtiene: Δy t = ( ρ − 1) y t −1 + ut Entonces para testear la hipótesis nula de raíz unitaria, simplemente podemos testear la hipótesis de que el coeficiente de yt-1 es igual a cero, contra la alternativa de que es menor que cero. Este test es a una cola. Similar a un estadístico t recibe el nombre de τ (tau). Su distribución no es la misma que la de un simple estadístico t, aún asintóticamente. 1 2 Los modelos de regresión estimados para aplicar los tests de Dickey – Fuller son: (1) yt = ρ yt-1 + ut (2) yt = α + ρ yt-1 + ut (3) yt = α + ρ yt-1 + δ t + ut Las distribuciones de los estadísticos de los tests de Dickey –Fuller, (D-F), fueron calculadas bajo la hipótesis nula de que el verdadero valor de ρ es la unidad, H0: ρ = 1, y la alternativa H1: ρ < 1. El modelo (1), para H0 cierto describe para yt una caminata al azar. El modelo (2), si la hipótesis nula conjunta H0: (α = 0, ρ = 1) cierta, describe también para yt una caminata al azar. En cambio el modelo (3) permite considerar dos alternativas: una, si la hipótesis nula conjunta: H0: (α = 0, δ = 0, ρ = 1) cierta, describe también para yt una caminata al azar; otra, para H0: (α ≠ 0, δ = 0, ρ = 1) cierta, describe para yt una a caminata al azar con deriva (“drift”). En las aplicaciones el modelo (2) resulta apropiado para datos sobre tasas de interés, rendimientos de activos financiero, etc. mientras que el (3) resultaría más conveniente para series del PIB, Gasto de Consumo Privado, Ingreso Disponible, entre otras. Los regresores determinísticos (RD) incluidos en las regresiones estimadas han sido: en (2) una constante, o vector identidad, [i]; y en (3) una constante y tendencia, o sea la matriz de variables explicativas [i, t]. La elección de los RD a incluir debe ser realizada con cuidado para tener tests con razonables propiedades de potencia. Dickey y Fuller construyeron la tabla con la distribución empírica del estadístico que le llamaron τ ( similar a la “t” de Student,) dado ρ = 1. Restando yt-1 en los dos miembros de las ecuaciones (1) a (3) se tiene: (4) Δ yt = (ρ - 1)yt-1 + ut (5) Δyt = α + (ρ-1) yt-1 + ut (6) Δyt = α + (ρ - 1) yt-1 + δ t + ut Las ecuaciones son una simple transformación lineal de las anteriores y los tests de D–F se aplican para probar: H0: γ = 0 y la alternativa H1: γ < 0, siendo (ρ - 1) = γ. Se hace notar que los tests de D-F son a una cola, porque la alternativa relevante, es que ρ<1 ó γ < 0. Los tests estadísticos de (1) a (6) de D-F tienen distribuciones que tienden a seis diferentes distribuciones asintóticas cuando el tamaño de la muestra tiende a 2 3 infinito. Estas distribuciones asintóticas son conocidas como distribuciones no – estándares o como distribuciones de Dickey – Fuller. Otro posible estadístico a utilizar en las mismas circunstancias planteadas para el τ es el llamado z, donde z = T(ρ^ -1). El término de error del modelo a estimar puede tener autocorrelación. Este es el caso más común en la práctica. Se extienden los tests de D-F para contrastar modelos estimados con términos de error autocorrelacionados. La regresión usada al computar el estadístico de D-F es aumentada con retardos de Δyt, resultando el estadístico conocido como estadístico de Dickey – Fuller Aumentado, (ADF). En general el número de retardos a incluir en la regresión a estimar es desconocido, pero ese número puede ser estimado utilizando criterios de información para comparar distinto número de retardos. Estudios de éste estadístico sugieren que es mejor considerar muchos retardos que pocos y recomiendan usar el criterio de Información de Akaike para estimar el número de retardos, p, a incluir en ADF. Los modelos a estimar en estos casos serán (7) Δyt = γ yt-1 + ζ1 Δyt-1 + ζ2 Δyt-2 + ... + ζp Δyt-p + εt (8) Δyt = γ yt-1 + α + ζ1 Δyt-1 + ζ2 Δyt-2 + .....+ ζp-1 Δyt-p + εt (9) Δyt t = γ yt-1+ α + δ t + ζ1 Δyt-1 + ζ2 Δyt-2 +...+ ζp-1 Δyt-p+ εt Recordar (ρ - 1) = γ, H0: γ = 0 y la alternativa H1: γ < 0, A continuación se presenta un resumen de los tests de raíz unitaria de Dickey-Fuller, según la propuesta de Hamilton (1994).1 Se examinan los casos para los cuales no se considera autocorrelación serial en el término de perturbación u error de la regresión estimada, en forma separada de aquellos en que si se supone la existencia de correlación serial. Se expresan las distintas especificaciones de la regresión estimada y el verdadero proceso generador del dato que dio lugar a las distribuciones empíricas presentadas en las tablas de Dickey y Fuller. (Las tablas respectivas se adjuntan a estas notas). 1 HAMILTON J. -- “Times Series Analysis”, Cap. 17, Table 17.1 y 17.3 (pag. 502) Princeton University Press, 1994. 3 4 Tests de Dickey-Fuller de raíz unitaria en ausencia de autocorrelación del término de error Caso 1 Regresión estimada: yt = ρ yt-1 + ut Verdadero proceso: yt = yt-1 + ut ut ∼ i.i.d.N (0,σ2) ) T ( ρ T −1) tiene la distribución descripta en la Tabla de Dickey- Fuller para ρ^ (Tabla 8.5.1 de W. Fuller, “Introducción to Statistical Time Series”, 1er.ed., Cap.8, pag. 371). ) ) ( ρ − 1) / σ ρ) T tiene la distribución descripta en la Tabla de Dickey- Fuller para τ^ (Tabla 8.5.2 de op. cit. pag. 373). Caso 2 Regresión estimada: yt = α + ρ yt-1 + ut Verdadero proceso: yt = yt-1 + ut ut ∼ i. i. d. N(0,σ2) ) T ( ρ T − 1) tiene la distribución descripta en la Tabla de Dickey- Fuller para ρμ^ (Tabla 8.5.1 de W. Fuller, “Introducción to Statistical Time Series”, Cap.8, pag. 371). ) ) ( ρ T − 1) / σ ρT tiene la distribución descripta en la Tabla de Dickey- Fuller para τμ^ (Tabla 8.5.2 de op. cit. pag. 373). La hipótesis “mantenida” para la derivación del test es que el valor cierto de α es cero. Por tanto, podría parecer más natural para elaborar un test de una raíz unitaria en esta especificación buscar la distribución empírica de la hipótesis conjunta: H0: α = 0 y ρ = 1. Dickey y Fuller (1981)2 utilizaron métodos de Monte Carlo para calcular la distribución de un conjunto de estadísticos que atienden esa posibilidad, y otras que veremos más adelante. Las tablas I y IV del artículo de Dickey y Fuller (1981) presentan los valores de probabilidad de las distribuciones empíricas para someter a prueba la hipótesis conjunta α = 0 y ρ = 1 cuando la regresión estimada es: yt = α + ρ yt-1 + ut 2 DICKEY Y. FULLER, “Likelihood Ratio Statistics for Autorregressive Time Series whith Unit Root”, Econometrica 49 (1981) p. 1063. 4 5 Se trata de las distribuciones empíricas de ταμ^, en la tabla I, y el Φ1 en la tabla IV. Los estadísticos construidos por Dickey y Fuller son por analogía el test t y F respectivamente, de la regresión MCO. Ambos estadísticos pueden utilizarse para someter a prueba la hipótesis conjunta: para (α, ρ) = (0, 1), en el modelo estimado: yt = α + ρ yt-1 + ut. Caso 3 Otra situación es cuando la regresión estimada es la misma que en el Caso 2. Regresión estimada: yt = α + ρ yt-1 + u Verdadero proceso: yt = α + yt-1 + ut α ≠ 0, ut ∼ i.i.d. (0,σ2). Pero se supuso que el proceso cierto es una caminata al azar con deriva. En este caso ambos coeficientes estimados α^ y ρ^ siguen una distribución asintóticamente normal.3 Para someter a prueba H0: ρ = 1, el estadístico es: ) ) ( ρ T − 1) / σ ρ) T → N (0, 1) El motivo es que el regresor yt-1 está asintóticamente dominado por la tendencia α(t-1). En grandes muestras es como si la variable explicativa yt-1 fuera remplazada por la tendencia en el tiempo. Ambos coeficientes son asintóticamente normales: α^ y ρ^. Caso 4 Regresión estimada: yt = α + ρ yt-1 + δ t + ut Verdadero proceso: yt = α + yt-1 + ut α cualquiera, ut ∼ i.i.d.N (0,σ2) Las diferencias con el Caso 3 son que la regresión estimada tiene en forma explícita una variable de tendencia además de la constante y el verdadero proceso generador del dato sigue siendo una caminata al azar con deriva. ) T ( ρ T − 1) tiene la distribución descripta en la Tabla de Dickey- Fuller para ρT^ (Tabla 8.5.1 de W. Fuller, “Introducción to Statistical Time Series”, Cap.8, pag. 371). ) ) ( ρ T − 1) / σ ρ) T tiene la distribución descripta en la Tabla de Dickey- Fuller para τt^ (Tabla 8.5.2 de op. cit. pag. 373). Para ver esto, observemos que yt = α + yt-1 + ut, una caminata al azar con deriva e implica que yt = y0 + αt + (u1 + u2+ ... + ut), aquí se puede demostrar que la tendencia domina sobre los otros componentes al realizar la regresión. 3 5 6 Recurrimos nuevamente a las tablas de Dickey y Fuller (1981) que presentan los valores de probabilidad de las distribuciones empíricas para someter a prueba la hipótesis conjunta α = 0, δ = 0 y ρ = 1 cuando la regresión estimada es: yt = α + ρ yt-1 + δ t + ut Se trata de “estadísticos t de la regresión MCO”. Se adjuntan en las tablas II y III, (τατ^ y τβτ^) y “tests F de la regresión MCO” en las tablas V y VI (Φ2 y Φ3 ) . Dos aclaraciones, la primera simplemente de notación: al coeficiente de tendencia en la regresión estimada se le nombró por β y en la tabla III el estadístico correspondiente es τβτ^; la segunda es sobre la tabla VI, la hipótesis conjunta que se somete a prueba con Φ3 es (α, δ, ρ) = (α, 0, 1). En este último caso H0: ( α ≠ 0, δ = 0, ρ = 1) Tests de Dickey-Fuller Aumentado de raíz unitarias cuando existe autocorrelación serial del término de error de las regresiones estimadas (incluye términos autorregresivos de orden más alto que yt-1) Para introducir el tema se supone que los datos yt fueron generados por un proceso AR(p): (1 - φ1L - φ2L2 -......- φpLp) yt = ut ut ∼ i.i.d.(0, σ2) Se supuso que el proceso que generó yt contiene una sola raíz unitaria. La hipótesis a contrastar es que tiene una raíz unitaria y el resto de las raíces del polinomio de retardos caen fuera del círculo unitario. O sea después de una primera diferencia se tiene un proceso estacionario, yt es un ARIMA (p-1, 1, 0) Caso 1 Regresión estimada: yt = ρ yt-1 + ζ1 Δyt-1 + ζ2 Δyt-2 + ....... + ζp-1 Δyt-p+1 + ut Verdadero proceso: misma especificación que la regresión estimada pero con ρ =1. Cualquier test t ó F que abarque a los coeficientes ζ1, ζ2 ...... ζp-1 pueden ser comparado con las tablas usuales de t ó F para cualquier asintóticamente válido. Para someter a prueba que el proceso autorregresivo contiene una raíz unitaria se pueden utilizar los estadísticos siguientes: [1] p −1 ) ) z DF = T ( ρ T − 1) /(1− ∑ ξ j ) 1 6 7 ) [2] ) τ = ( ρ T − 1) / σ ρ) Las estimaciones son realizadas por MCO en la regresión arriba indicada. Los estadísticos zDF y τ tienen la misma distribución asintótica que en el Caso 1 descrito en Cuadro anterior (Tablas 8.5.1 y 8.5.2 de W. Fuller, “Introducción to Statistical Time Series”, Cap.8), es decir se utilizan las tablas de Dickey – Fuller ya estudiados para el caso de ausencia de autocorrelación de los errores (Caso 1). Caso 2 Regresión estimada: yt = ρ yt-1 + α + ζ1 Δyt-1 + ζ2 Δyt-2 + .....+ ζp-1 Δyt-p+1 + ut Verdadero proceso: una especificación como la regresión estimada con α =0 y ρ =1. Las pruebas t ó F sobre ζ1, ζ2 ...... ζp-1 pueden ser comparadas con las tablas usuales de t ó F para un test válido asintóticamente. Para someter a prueba que el proceso autorregresivo contiene una raíz unitaria se pueden utilizar los estadísticos siguientes: [1] p −1 ) ) z DF = T ( ρ T − 1) /(1− ∑ ξ j ) 1 [2] ) ) τ = ( ρ T − 1) / σ ρ) Las estimaciones son realizadas por MCO en la regresión arriba indicada. Los estadísticos zDF y τ tienen la misma distribución asintótica que en el Caso 2, (ρ^μ y τ^μ), descrito en Cuadro anterior (Tablas 8.5.1 y 8.5.2 de W. Fuller, “Introducción to Statistical Time Series”, Cap.8), es decir, se utilizan las tablas de Dickey – Fuller ya estudiados para el caso de ausencia de autocorrelación de los errores (Caso 2). Dickey y Fuller (op. cit.) demuestran que el “estadístico t de la regresión MCO” en la tabla I, denominado ταμ^, el “test F de la regresión MCO” en la tabla IV, denominado Φ1, se pueden aplicar en procesos autorregresivos de orden más alto que uno. Los estadísticos mencionados pueden utilizarse para someter a prueba la hipótesis conjunta, H0 (α, ρ) = (0,1). 7 8 Caso 4 Regresión estimada: yt = ρyt-1+ α + δ t + ζ1 Δyt-1 + ζ2 Δyt-2 +...+ ζp-1 Δyt-p+1+ ut Verdadero proceso: una especificación como la regresión estimada con α que puede tener cualquier valor, ρ = 1 y δ = 0. Las pruebas t ó F sobre ζ1, ζ2 ...... ζp-1 pueden ser comparadas con las tablas usuales de t ó F para un test asintóticamente válido. Para someter a prueba que el proceso autorregresivo contiene una raíz unitaria se pueden utilizar los estadísticos siguientes: [1] p −1 ) ) z DF = T ( ρ T − 1) /(1− ∑ ξ j ) 1 Las estimaciones son realizadas por MCO en la regresión indicada. [2] ) ) τ = ( ρ T − 1) / σ ρ) Se utilizan las tablas de Dickey – Fuller ya estudiados para el caso de ausencia de autocorrelación de los errores ρ^t y τ^t, (Tablas 8.5.1 y 8.5.2 de W. Fuller, “Introducción to Statistical Time Series”, Cap.8). Como en el Caso 4, cuando no existe autocorrelación de las perturbaciones, también el test de la hipótesis conjunta H0: α ≠ 0 (cualquiera), δ = 0 y ρ =1, es decir hipótesis conjunta (α, δ, ρ) = (α, 0, 1), tiene la distribución asintótica de Tabla de VI, Φ3 - Valores críticos para el test de Dickey – Fuller basado en el test F de la regresión por MCO. Para los tests de D-F los valores críticos de τnoμ, τμ, y τt , igual que los de znoμ, zμ y zt, se hacen más negativos cuando el número de regresores determinísticos en el test de la regresión se incrementa. Finalmente, Hamilton (op. cit) luego de resumir distintos casos, distinguiendo entre la regresión estimada y el verdadero proceso generador del dato, se pregunta: ¿cuál sería entre los presentados el “caso correcto” a usar para el test de una raíz unitaria?. La respuesta no es posible darla en forma general, depende de porque estamos interesados en un test de raíz unitaria. Si al realizar la investigación se tiene una hipótesis nula especificada sobre el PGD, entonces obviamente esta servirá de guía para la elección del test. Es importante, en ausencia de esta guía, adoptar un principio general que sería ajustar una especificación que sea una descripción de los datos admisible bajo ambas hipótesis la nula y la alternativa. El principio sería usar el Caso 4 para series que presentan una tendencia obvia, y el Caso 2 para series sin una tendencia significativa. 8 9 “Es importante hacer una clara distinción entre el Proceso Generador del Dato (PGD) mantenido (el que considero verdadero PGD) y la ecuación de regresión que es usada para someter a prueba la hipótesis nula de una raíz unitaria. Un asunto importante que a menudo causa confusiones es el apropiado tratamiento de la tendencia determinística en yt en la ecuación de regresión estimada para la prueba de raíz unitaria”4. 4 CAMPBELL J. AND PERRON PIERE – “Pitfalls and opportunities: what macroeconomists should know about unit roots” NBE Macroecnomic Annual Cambridge, Mass. :MIT Press 9