ESTADÍSTICA ESPAÑOLA Vol. 48, Núm. 161, 2006, págs. 135 a 174 Los efectos de calendario desde una perspectiva frecuencial(1) por JUAN BÓGALO y ENRIQUE M. QUILIS Instituto Nacional de Estadística RESUMEN En este trabajo se analizan las principales características de los efectos de calendario (ciclo semanal, efecto de Pascua, efecto de laboralidad, etc.) desde una perspectiva espectral, con el fin de diseñar procedimientos no paramétricos de detección y corrección. Estos procedimientos recurren a filtros lineales específicos, diseñados desde el dominio de la frecuencia y pueden ser utilizados de manera conjunta con métodos paramétricos (p.e., como herramienta de diagnóstico de la desestacionalización) o de forma independiente. Palabras clave: efectos de calendario, análisis espectral, ciclo semanal, efecto de Pascua, efecto de laboralidad, estacionalidad, filtros lineales, filtros de Butterworth, filtros de corte, desestacionalización. Clasificación AMS: 62M10, 62M15, 62P20 (1) Los autores agradecen las conversaciones mantenidas con Ana Abad, Alfredo Cristóbal, Rafael Frutos, Agustín Maravall, Francisco Melis y Silvia Relloso sobre diversos aspectos de la modelización, detección y corrección de los efectos de calendario. Las opiniones formuladas en este trabajo corresponden a los autores, sin que el INE coincida de forma necesaria con ellas. 136 ESTADÍSTICA ESPAÑOLA 1. INTRODUCCION Un elevado número de fenómenos económicos poseen una pauta sistemática de recurrencia semanal, de forma que sus niveles oscilan dependiendo del día particular de la semana que se considere. Los ejemplos son numerosos: ventas del comercio minorista, producción industrial, consumo de energía, flujos de importaciones y exportaciones, matriculaciones y otros registros administrativos, ingresos tributarios, utilización de servicios telefónicos y telemáticos, etc. Estas fluctuaciones, denominadas "ciclo semanal", pueden ser notables en términos cuantitativos y presentar un carácter bastante estable aunque no necesariamente determinista, véase Espasa y Cancelo (1996) y van Wijk y van Selow (1999) para un análisis pormenorizado de series económicas diarias. Por otra parte, la medición estadística de estos fenómenos se realiza con una frecuencia menor (p.e., mensual o trimestral), mediante la agregación temporal(2) de los datos diarios. De esta manera, el ciclo semanal ya no es directamente observable, si bien sus efectos se aprecian de una manera indirecta a través del solapamiento (aliasing) de estas oscilaciones con las propias de la frecuencia a la que han sido agregadas, véase Cleveland y Devlin (1980) y Melis (1992) para un tratamiento detallado del solapamiento. Una peculiaridad de esta agregación temporal es que no es uniforme, de manera que los periodos de baja frecuencia (meses, trimestres, años) no siempre tienen el mismo número de observaciones diarias. Este efecto se denomina "duración" en el caso mensual y trimestral y "año bisiesto" en el anual y es una de las características más llamativas del calendario gregoriano que se utiliza para consignar el paso del tiempo. Esta peculiaridad no es la única del calendario. En efecto, existe una correspondencia imperfecta entre dicho calendario y el lunar, que condiciona la celebración de determinadas efemérides, siendo el ejemplo más notable el de la Pascua, cuyo efecto se registra de forma variable en los mismos meses o trimestres de años distintos, debido a la variabilidad de su celebración (entre el 22 de marzo y el 25 de abril). Asimismo, la correspondencia es también imperfecta entre las fechas del calendario y los días de la semana, ya que los años no comienzan siempre el mismo día de la semana, resultado de que la duración de los años no es un múltiplo exacto de la duración de las semanas. Este hecho da lugar a que algunas celebraciones no siempre tengan lugar el mismo día de la semana en los diversos (2 ) Agregación temporal en un sentido amplio: suma, promedio o interpolación. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 137 años, generando una práctica de traslación, sustitución y ampliación (total o parcial) de días no laborables o festivos(3) Todos estos efectos (ciclo semanal, duración, Pascua móvil, fiestas sustituibles) se denominan "efectos de calendario" ya que, pese a su naturaleza y relevancia dispar, deben su existencia, de manera directa o indirecta, a la estructura específica de la unidad de medida temporal utilizada para cuantificar los procesos económicos. Estos efectos pueden tener un impacto notable sobre las propiedades estadísticas de las series, por lo que las tareas de modelización, predicción y extracción de señales (p.e., desestacionalización) han de tenerlos en cuenta de una manera u otra. Existen diversos enfoques para identificar y corregir estos efectos. Así, se ha propuesto el uso de modelos de regresión con errores ARIMA como marco combinado de detección y corrección, véase Liu (1980, 1983), Hillmer (1982), Hillmer et al. (1983), Bell y Hillmer (1983, 1984) y Salinas y Hillmer (1987), entre otros. Los regresores empleados reflejan las consideraciones a priori que el analista considera relevantes para describir los diversos fenómenos de calendario. Ishiguro y Akaike (1981), Kitagawa y Gersch (1984) y Dagum y Quenneville (1989) representan los efectos de calendario como componentes inobservables dentro de un planteamiento estructural en el espacio de los estados, realizando su estimación a través del filtro de Kalman. Alternativamente, Cleveland y Devlin (1980, 1983) emplean un enfoque espectral para la detección y métodos de regresión robusta para la corrección. Finalmente, Souskup y Findley (1999, 2000) combinan ambos enfoques en el marco de la desestacionalización. En este trabajo se identifican los efectos de calendario mediante métodos espectrales, haciendo un uso relativamente intenso de filtros lineales diseñados desde el dominio de la frecuencia tanto para extraer la señal relevante como para corregir, si es menester, los efectos de calendario. Este enfoque, esencialmente espectral y no paramétrico, puede ser utilizado como un análisis exploratorio de naturaleza no paramétrica antes de realizar una modelización explícita, como método de diagnóstico adicional en un proceso de extracción de señales, como hacen Souskup-Findley, o de manera independiente, siguiendo el planteamiento de Cleveland-Devlin. La estructura del trabajo es la siguiente. En la segunda sección se examinan, desde el dominio de la frecuencia, las propiedades de los diversos efectos de calendario: ciclo semanal, duración, Pascua móvil, año bisiesto y fiestas sustituibles. Asimismo, se examina el concepto de laboralidad como forma de integrar (3) Este último fenómeno se conoce coloquialmente como "puente". 138 ESTADÍSTICA ESPAÑOLA todos estos efectos. A continuación, en la tercera sección, se describe un procedimiento de detección basado, principalmente, en el análisis estadístico del espectro de la serie corregida de efectos tendenciales, estacionales y, eventualmente, de observaciones atípicas. A continuación se expone la corrección de los efectos de calendario que hayan sido detectados. Esta corrección recurre a filtros lineales diseñados desde el dominio de la frecuencia y, en particular, del tipo Butterworth y de eliminación selectiva (comb). La quinta sección detalla una aplicación de la metodología a datos reales de la economía española y, la sexta, ofrece las princ ipales conclusiones. 2. EFECTOS DE CALENDARIO En esta sección se exponen las principales características espectrales de los efectos de calendario con el objeto de caracterizar sus propiedades desde una perspectiva frecuencial. En particular, se analiza el ciclo semanal, la Pascua móvil, los años bisiestos, las fiestas fijas pero sustituibles y, como combinación de todas ellas, la laboralidad. 2.1 Ciclo Semanal Un elevado número de series económicas observadas mensual o trimestralmente son el resultado de la agregación temporal de series diarias. A su vez, éstas poseen una pauta de variación que está relacionada con efectos o características de cada uno de los siete días que componen la semana. Esta pauta intrasemanal no es directamente observable debido a la frecuencia de muestreo (mensual o trimestral) que genera las series observadas. No obstante, como se demostrará a continuación, su efecto se manifiesta de una manera indirecta, a través del solapamiento de la frecuencia de las oscilaciones de los datos diarios con la frecuencia en que se ha producido la agregación temporal (mensual o trimestral). La exposición que sigue toma como punto de partida el modelo desarrollado por Cleveland y Devlin (1980) para series mensuales, extendiéndolo al caso trimestral. Sea X(T) una serie diaria cuyo índice de tiempos T varía de forma continua. Se asume que existe una oscilación C(T) de periodicidad semanal exacta, C(T)=C(T+7), y cuya integral sobre un intervalo de 7 días es nula. En consecuencia, C(T) actúa como una pauta “estacional” si se identifica los días con los meses y las semanas con los años. Además del factor oscilatorio C(T), se supone que existe un efecto fijo B≥0 y un factor residual R(T) que incluye, de forma genérica, todos los elementos presentes en la serie diaria no relacionados con el ciclo semanal como, por ejemplo, la tendencia o las oscilaciones vinculadas con el ciclo 139 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA económico o con la estacionalidad. En consecuencia, el modelo para la serie diaria es: X( T) = B + C(T) + R(T) [1] Sea T0 el inicio del primer mes (trimestre) y sea Tt el tiempo, en días, acumulado al final del mes t. Entonces, la serie agregada mensual (trimestral) es: x( t) = Tt Tt Tt− 1 Tt −1 ∫ X(T)dT = ∫ (B + C(T) + R(T))dT = b(t) + c(t) + r(t) t = 1,2,... [2] Las series b(t), c(t) y r(t) son los agregados temporales de B, C(T) y R(T), respectivamente. Por tanto, el componente de calendario en x(t) inducido por el proceso de agregación será b(t) + c(t), donde b(t) es proporcional al número de días en el mes (trimestre) t. Por otra parte, el número de días en un año no bisiesto (365) no es múltiplo exacto de la duración de la semana (7), de forma que aparece una semana con un día perteneciente a un año y los seis restantes a otro, lo que produce que los meses comiencen cada año en una día de la semana diferente y consecutivo al del año precedente. Por tanto, en principio, b(t)+c(t) posee un periodo de 7 años. Esta periodicidad, sin embargo, se compone con la generada por la presencia de los años bisiestos cada 4 años(4), de manera que el periodo completo de b(t)+c(t) es de 28 años, esto es, 336 meses (112 trimestres). De este modo, el espectro de b(t) + c(t) se concentra en las frecuencias 2πj/336, para j = 1, 2, … 168 en series mensuales (2πj/112, para j = 1, 2, … 56 en series trimestrales). Sin embargo, dado el elevado número de frecuencias vinculadas con el ciclo semanal es necesario determinar cuáles son relevantes desde un punto de vista cuantitativo. Teniendo en cuenta que B+C(T) es una función oscilatoria con periodo igual a 7 días, se puede escribir: B + C( T) = ∞ ∑γ k =0 k kT cos 2π + φk 7 [3] donde γk es la amplitud de la onda asociada con la frecuencia de k/7 ciclos/día y φk es la fase. Entonces, para los efectos de calendario temporalmente agregados: (4) En el apartado 2.3.1 se analizan los efectos producidos por los años bisiestos. 140 ESTADÍSTICA ESPAÑOLA b(t) + c(t) = ∞ ∑ γ h (t) [4] k k k =0 donde hk (t) = ∫ Tt Tt −1 kT cos 2π + φk dT . 7 [5] Si se considera, como condición de normalización, que B+C(T) es simétrica respecto a T=0, se obtiene que φk = 0. Este resultado no influye en el cálculo del espectro de hk(t) pero sí lo simplifica. De la ecuación [4], para k=0, se obtiene: h0 ( t) = Tt − Tt−1 = D t [6] Por lo tanto, h0(t) es el número de días en el mes (trimestre) t, esto es, su duración (Dt). Análogamente, de la ecuación [4], para k > 0, se obtiene: hk (t) = sin(w k Tt ) − sin(w k Tt−1) , wk con w k = 2π k . 7 [7] El espectro de hk(t) se calcula para valores reducidos de k (k = 0, 1, 2) ya que Cleveland y Devlin (1980) demuestran que la amplitud γk es insignificante para valores mayores de k. El espectro de hk(t) para series agregadas mensuales y trimestrales se muestran en los gráficos 1 y 2, respectivamente. Las series hk(t) han sido generadas para el periodo comprendido entre 1901 y 2096: 196 años, múltiplo exacto del periodo completo del ciclo semanal (28 años). 141 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 1 ESPECTRO DEL CICLO SEMANAL PARA SERIES MENSUALES hK (t) 3,0 k=0 k=1 k=2 2,5 2,0 1,5 1,0 0,5 0,0 0 1 2 3 4 5 6 ciclos/año Gráfico 2 ESPECTRO DEL CICLO SEMANAL PARA SERIES TRIMESTRALES hk (t) k 2,0 k=0 k=1 k=2 1,5 1,0 0,5 0,0 0 0,5 1 ciclos/año 1,5 2 142 ESTADÍSTICA ESPAÑOLA Los valores del espectro de hk(t) mayores que 0.20, tanto para series agregadas mensuales, como trimestrales y anuales, se muestran en la tabla 1. Las frecuencias correspondientes a esos valores del espectro son las frecuencias críticas del ciclo semanal, siempre que no coincidan con una frecuencia estacional ya que en ese caso aparece un problema de equivalencia observacional entre ambos efectos. Tabla 1 VALORES DEL ESPECTRO DEL CICLO SEMANAL hK (t) MAYORES QUE 0,20 Mensuales Trimestrales Frecuencia Espectro k Anuales Frecuencia Espectro k Frecuencia Espectro k 0.5000 0.21 0 0.5000 1.02 0 0.3571 1.32 0.6964 2.65 1 0.5893 0.29 1 0.5000 0.25 0.8333 0.65 0 0.6786 0.22 2 0.7143 0.75 0.8631 0.47 1 1.0000 0.14 0 1.0000 0.25 1.0000 0.21 0 1 0 2 0 Las frecuencias más importantes aparecen en negrita y en cursiva las que coinciden con las estacionales. Las frecuencias se expresan como fracciones de π. El efecto de calendario también puede present arse en las series anuales. En efecto, repitiendo el esquema seguido para las agregaciones mensuales y trimestrales de datos diarios se obtiene el espectro de hk(t) que se presenta en el gráfico 3: 143 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 3 ESPECTRO DEL CICLO SEMANAL PARA SERIES ANUALES hk (t) k 2,0 k=0 k=1 k=2 1,5 1,0 0,5 0,0 0 0,25 0,5 ciclos/año El gráfico 1 permite apreciar cómo, en las series mensuales, el ciclo semanal básico (vinculado con una periodicidad de 7 días) se concentra en la frecuencias 0.6964π (0.3482 ciclos/mes) y, en menor medida, en 0.8631π (0.4316 ciclos/mes) y apenas tiene repercusión sobre las frecuencias estacionales. Cada frecuencia del espectro está asociada a un determinado número de ciclos por semana. El parámetro k indica ese número de ciclos por semana. Por tanto, es esperable que para cada valor de k apareciera una única frecuencia relevante como ocurre en los casos trimestral y anual. Sin embargo, sorprende el hecho que, para el caso mensual, las dos frecuencias más relevantes estén asociadas a k=1. La frecuencia asociada a k=2 más relevante, en el caso mensual, es 0.6071π con un valor del espectro igual a 0.16, inferior al valor correspondiente a la segunda frecuencia más relevante asociada a k=1. Todo lo contrario ocurre en las series trimestrales, como se observa en el gráfico 2. Así, el ciclo semanal aparece fuertemente concentrado en las frecuencias estacionales, sobre todo en la fundamental (4 trimestres), De menor relevancia cuantitativa son los que se solapan con las frecuencias 0.5893π (0.2946 ciclos/trimestre) y 0.6786π (0.3393 ciclos/trimestre). Una conclusión importante es que el caso de k=0, asociado a la duración del mes (trimestre), tiene exclusivamente una influencia estacional. 144 ESTADÍSTICA ESPAÑOLA Respecto a las series anuales (gráfico 3), las frecuencias más importantes son 0.3571π (0.1786 ciclos/año) y 0.7143π (0.3571 ciclos/año) y no, como podría pensarse a priori, la asociada al año bisiesto de 0.25 ciclos/año. Se han deducido las frecuencias del ciclo semanal generando una serie hk(t) para datos mensuales, trimestrales y anuales siguiendo el método que Cleveland y Devlin (1980) utilizan sólo para datos mensuales. Sin embargo, dichos autores deducen las frecuencias del ciclo semanal para datos anuales mediante agregación temporal de la serie hk(t) mensual. Su método consiste en generar 11 subseries mensuales (3 subseries trimestrales) tal y como se describe a continuación. Sea hkm(s) la serie anual correspondiente a la subserie del mes (trimestre) m de hk(t) tal que: hkm(s) = hk (γ(s − 1) + m) [8] con m = 1, 3, … 12 (m = 1, 3, 4 para trimestres) y γ=12 (caso mensual) ó γ=4 (caso trimestral). Para un valor de k dado, se forman las 11 (3) subseries hkm(s) a partir de hk(t), se calculan sus correspondientes espectros y se promedian. En los cálculos anteriores, se excluye el mes de febrero porque este mes tiene un número exacto de ciclos semanales (4), excepto en los años bisiestos. Por la misma razón, en el caso trimestral, se excluye el segundo periodo, sin la excepción del año bisiesto, de tal forma que los espectros de estas subseries no aportan información alguna sobre el fenómeno objeto de estudio. El espectro medio de las subseries mensuales y trimestrales se ha representado en los gráficos 4 y 5, respectivamente. En ambos se observa que las frecuencias importantes de calendario son las mismas que las representadas en el gráfico 3 si bien con diferente intensidad. Como se verá más adelante, tanto el método como sus resultados van a ser de gran ayuda a la hora de determinar si el efecto del ciclo semanal en una serie dada es significativo o no. 145 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 4 ESPECTRO MEDIO DE LAS SERIES ANUALES hKm(s), DE SUBSERIES MENSUALES 4,0 k=1 k=2 3,0 2,0 1,0 0,0 0 0,25 0,5 ciclos/año Gráfico 5 ESPECTRO MEDIO DE LAS SERIES ANUALES hKm( s), DE SUBSERIES TRIMESTRALES k 1,0 k=1 k=2 0,8 0,6 0,4 0,2 0,0 0 0,25 ciclos/año 0,5 146 2.2 ESTADÍSTICA ESPAÑOLA Pascua En diversas culturas existen unas festividades, usualmente de naturaleza religiosa, cuya ubicación en el calendario gregoriano no es fija, esencialmente porque están ligadas total o parcialmente al calendario lunar. Tal es el caso del Año Nuevo chino, de la Pascua judía, del Ramadán musulmán o de la Pascua cristiana. Estas celebraciones pueden tener un impacto importante sobre diversos aspectos de la actividad económica porque abarcan varios días anteriores a la efemérides principal. Sin pérdida de generalidad, se centrará la exposición en la Pascua cristiana, en adelante simplemente “Pascua”. La Pascua, o domingo de Resurrección, es una fiesta móvil ya que, según el concilio de Nicea del año 325, debe ser el primer domingo siguiente a la primera luna llena posterior al equinoccio de primavera. Por tanto, la Pascua siempre cae en domingo y en una fecha comprendida entre el 22 de marzo y el 25 de abril. Para analizar las propiedades espectrales del efecto de Pascua se genera una serie artificial, Pt(τ), definida como el porcentaje de los τ días anteriores al domingo de Pascua que corresponden al mes (trimestre) t. De esta forma, Pt(τ), tomará un valor distinto de cero en los meses de marzo y/o abril (primer y/o segundo trimestres) y nulo en los restantes. Los valores más usuales de τ son 3, 6 y 9. Según el calendario lunar la Pascua es un fenómeno estacional pero, al ajustarse al calendario gregoriano, pierde parte de esa estacionalidad y aparecen en el espectro otras frecuencias relevantes, véase Stewart (2001). Además, con las reglas del calendario gregoriano, el ciclo de fechas de la Pascua tiene un periodo de casi seis millones de años sufriendo, debido a la evolución astronómica, revisiones (la última efectuada en el año 1900 y la próxima se prevé para el 2200). Por todo ello, la serie Pt(τ) se ha generado para un elevado número de años: desde 1901 hasta 2096 (196 años), de forma que tiene la misma longitud que las series del ciclo semanal antes estudiadas y recoge el efecto de Pascua contemporáneo a nuestras series económicas. En el gráfico 6 se ha representado el espectro de la serie Pt(τ) con τ = 6 para el caso trimestral. Se aprecia cómo el efecto de Pascua tiene un acusado carácter estacional y que también se manifiesta en otras frecuencias, principalmente de tipo irregular. 147 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 6 ESPECTRO SERIE Pt (6) TRIMESTRAL 10 8 6 4 2 0 0 1 2 ciclos/año Con el fin de diseñar procedimientos de detección y corrección del efecto de Pascua que no interfieran con otras señales (tendencia, estacionalidad) conviene eliminar los elementos tendenciales y, sobre todo, estacionales del efecto de Pascua. Con el fin de aislar los elementos no vinculados con la estacionalidad (ni con la tendencia), se aplica el filtro (1-Bs), con s=4 ó 12, de manera que se resaltan las señales no estacionales (no tendenciales), que son el objeto principal del estudio. El filtro (1-Bs) posee una función de ganancia con ceros en las frecuencias estacionales y tendencial, de manera que satisface el requisito de extracción antes señalado. Además de su sencillez su función de ganancia otorga un tratamiento homogéneo a las frecuencias no estacionales, cosa que no ocurre, p.e., con el filtro de agregación móvil U(B)=1+B+…+B s-1. La serie P t(τ) se extiende hasta 2097 para conservar el mismo número de años después de diferenciarla. A continuación, se calcula el espectro de la serie Pt(τ) para los valores de τ=3, 6 y 9 y se representan los resultados en los gráficos 7 (caso mensual) y 8 (caso trimestral). 148 ESTADÍSTICA ESPAÑOLA s Gráfico 7: Espectro de (1-B )Pt(tau) mensual, s=12. Tau = 3 5 4 3 2 1 0 0 1 2 3 ciclos/año 4 5 6 4 5 6 4 5 6 Tau = 6 5 4 3 2 1 0 0 1 2 3 ciclos/año Tau = 9 5 4 3 2 1 0 0 1 2 3 ciclos/año Del examen del gráfico 7 se deduce la existencia de dos frecuencias para el efecto de Pascua intercaladas entre las estacionales, de forma que aparecen diez frecuencias fundamentales para el caso mensual. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 149 Gráfico 8: Espectro de (1-Bs )Pt(tau) trimestral, s=4. Tau = 3 12 10 8 6 4 2 0 0 1 2 ciclos/año Tau = 6 12 10 8 6 4 2 0 0 1 2 ciclos/año Tau = 9 12 10 8 6 4 2 0 0 1 ciclos/año 2 150 ESTADÍSTICA ESPAÑOLA Para el caso trimestral, tal y como se aprecia en el gráfico 8, las frecuencias fundamentales del efecto de Pascua están intercaladas entre las dos frecuencias estacionales, de forma similar al caso mensual. También se puede observar que el efecto de Pascua tiene mayor intensidad en las series trimestrales que en las mensuales. En el caso anual Pt(τ)=1, por lo que carece de sentido su análisis espectral. Por tanto, se emplea el método de las subseries anuales, tal y como se utilizó con el ciclo semanal, para calcular el espectro de Pt(τ) sólo para las subseries correspondientes a marzo y abril (primer y segundo trimestre), ya que el resto de periodos no aportan información por ser inmunes al efecto de Pascua. Como se verá más adelante, este procedimiento se mostrará muy útil para detectar la presencia del efecto de Pascua en una serie dada. El espectro medio de las subseries anuales, con τ = 6, se puede observar en el gráfico 9. Este gráfico es válido tanto para el caso mensual como para el trimestral, ya que las subseries del primer y segundo trimestre son, respectivamente, idénticas a las de marzo y abril. Del análisis de este gráfico se desprende que para las subseries anuales aparece una única frecuencia fundamental que coinc ide prácticamente con la segunda frecuencia del ciclo semanal. Gráfico 9 ESPECTRO MEDIO DE LAS SUBSERIES ANUALES DE P t(6) 5 4 3 2 1 0 0 0,25 ciclos/año 0,5 151 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Con el fin de sintetizar los principales resultados, en la tabla 2 se recogen todas las frecuencias fundamentales del efecto de Pascua. Tabla 2 FRECUENCIAS FUNDAMENTALES DEL EFECTO DE PASCUA Mensuales Frecuencia Espectro Trimestrales Frecuencia Espectro 0.2279 0.4964 0.6837 9.3740 0.2721 0.6948 0.8163 11.1484 0.3946 1.3642 0.4388 1.6353 0.5612 2.4082 0.6054 2.6793 0.7279 3.3487 0.7721 3.5471 0.8946 3.9336 0.9388 4.0062 Subseries Anuales Frecuencia 0.7347 Espectro 3.5597 El valor del espectro correspondiente se ha calculado con τ = 6. 2.3 Otros efectos Los efectos de calendario abarcan otras situaciones que pueden tener incidencia sobre las series económicas, bien porque modifican el intervalo de medida, bien porque el impacto se distribuye de forma variable. 2.3.1 Año bisiesto La duración del año solar es, aproximadamente, 365.24 días. Debido a que en el calendario no se utilizan fracciones de días, cada cuatro años (omitiendo los años que sean múltiplos de 100 pero no de 400) se añade al mes de febrero un día más para compensar el desfase con el año solar. El año en que se realiza este ajuste se denomina bisiesto. Para analizar el efecto del año bisiesto desde una perspectiva espectral se genera la siguiente variable mensual: 1 si t = febrero con 29 días Bt = 0 resto [9] 152 ESTADÍSTICA ESPAÑOLA Si se extiende dicha variable durante un periodo de 28 años, la serie mensual obtenida da lugar a un espectro como el que aparece en el gráfico 10. Gráfico 10 ESPECTRO DEL EFECTO DEL AÑO BISIESTO 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 ciclos/año Se aprecia, en primer lugar, la débil magnitud de la señal asociada a [9], especialmente si se la compara con la del ciclo semanal o la de la Pascua móvil. En segundo lugar, el efecto del año bisiesto está asociado a una pluralidad de frecuencias, distribuidas de forma bastante uniforme. De esta manera, su impacto se reparte entre la tendencia, la estacionalidad y la irregularidad. 2.3.2 Fiestas fijas eventualmente sustituibles En España el calendario de días no laborables es fijado de forma administrativa, interviniendo en el mismo todos los niveles de las Administraciones Públicas: nacional, regional y municipal. De esta manera, el calendario laboral es el resultado de una compleja superposición de tres calendarios básicos. En todos ellos figura de manera preeminente una serie de fechas que se consideran festivas de forma fija pero que, si caen en domingo, son susceptibles de sustitución bien porque se celebren el lunes siguiente bien porque se traslade el carácter de festivo a otra efemérides. El primer tipo de traslado es un efecto esencialmente estacional mientras que el segundo guarda, al menos teóricamente, una cierta semejanza con la Pascua móvil. 153 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Con el fin de centrar el análisis, se va a considerar un caso concreto. Se trata de la festividad, propia del municipio de Madrid, de la Virgen de la Almudena, que se celebra el día 9 de noviembre. Si ese día cae en domingo, se declara no laborable el 9 de septiembre, festividad de Santa María de la Cabeza. De esta manera, se define la siguiente variable mensual: Ft = A t + C t 1 si t = noviembre y el día 9 es domingo con A t = [10] 0 resto 1 si t = septiembre y el día 9 de noviembre no es domingo y con C t = 0 resto Si se genera dicha variable durante un periodo de 28 años, la serie mensual obtenida da lugar a un espectro como el que aparece en el gráfico 11. Se puede apreciar cómo el efecto sobre el espectro de una fiesta fija con sustitución eventual es marcadamente estacional, poseyendo las restantes frecuencias una señal virtualmente inapreciable. Gráfico 11 ESPECTRO DEL EFECTO DE UNA FIESTA FIJA 1,0 0,8 0,6 0,4 0,2 0,0 0 1 2 3 ciclos/añ o 4 5 6 154 2.4 ESTADÍSTICA ESPAÑOLA Combinación de los efectos de calendario: efecto de laboralidad Los efectos de calendario pueden afectar a los niveles de un gran número de series económicas debido al impacto que ejercen sobre la aplicación de los factores productivos al proceso de generación del output . Por esta razón, se considera la posibilidad de recoger este impacto mediante una única variable, llamada "laboralidad", que se define como el número de días no festivos existentes en un período dado (mes o trimestre). La construcción de esta variable requiere la disponibilidad previa de un calendario laboral relevante, lo que puede ser difícil en ciertos casos. Asumiendo que dicho calendario está disponible, la mencionada variable puede calcularse mediante la siguientes expresiones: Ft = α1D 6, t + D 7,t + FFt + FS t + α 2FPt 0 ≤ α1 ≤ 1 0 ≤ α 2 ≤ 1, [11] siendo D6,t y D7,t el número de sábados y domingos; FFt, FSt y FP t son, respectivamente, las fiestas fijas, sustituibles y parciales ("puentes"), todo ello referido al periodo t (mes o trimestre). Los sábados pueden ser considerados de forma íntegra (α1=1), parcial (0<α1<1) o nula (α1=0). Lo mismo ocurre con los "puentes". En consecuencia, el número de días laborables (Lt) queda definido como la diferencia entre la duración del mes correspondiente (Dt) y el número de días festivos (Ft): L t (α1 , α2 ) = D t − Ft . [12] Naturalmente, la determinación de los valores apropiados para α1 y α2 requiere la combinación de consideraciones estadísticas y de información a priori por parte del analista acerca de la variable objeto de análisis, en la misma línea que la elección del calendario laboral adecuado. Asimismo, debe resaltarse que el efecto de la Pascua móvil está repartido entre D7,t (domingos) y FFt (fiestas fijas) y que, adicionalmente, el efecto de laboralidad así definido engloba el impacto de los años bisiestos a través de Dt y, eventualmente, de D7,t. Con el fin de conocer, en la práctica, qué efectos recoge la variable Lt hay que calcular su espectro. Para ello, se ha calculado según el calendario laboral de la Comunidad de Madrid, excluyendo cualquier fiesta local así como los sábados y fiestas parciales (α1=α2=0), desde el año 1991 hasta 2004. Asumiendo que los criterios seguidos en ese intervalo se mantienen fijos, se extiende hasta el año 2018, de forma que abarca un periodo de 28 años para recoger tanto el ciclo semanal de 7 días como el del año bisiesto de 4 años. El espectro de esta serie se muestra en el gráfico 12. 155 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 12 Espectro efectoLABORALIDAD, laboralidad, L Lt . ESPECTRO DELdel EFECTO t 20 15 10 5 0 0 1 2 3 4 5 6 ciclos/año De la observación del gráfico 12 se extraen algunas conclusiones. En primer lugar, el efecto de laboralidad es de naturaleza esencialmente estacional. En segundo lugar, está bastante identificado con el ciclo semanal aunque no de manera predominante. Finalmente, no recoge satisfactoriamente el efecto de Pascua ya que el espectro en sus frecuencias críticas no es significativo (véase el gráfico 7 y la tabla 2). A modo de resumen, en la tabla 3 se presentan las diez frecuencias más significativas del efecto laboralidad. Tabla 3 FRECUENCIAS MAS SIGNIFICATIVAS DEL EFECTO LABORALIDAD Frecuencia Espectro Observaciones 0.1667 0.3333 17.7968 1.6399 Frecuencia estacional Frecuencia estacional 0.4405 0.5000 0.9497 3.6151 Frecuencia crítica del efecto de Pascua Frecuencia estacional 0.6667 1.7592 Frecuencia estacional 0.6964 0.8036 7.1938 1.2466 Primera frecuencia crítica del ciclo sem anal Frecuencia marginal del ciclo semanal 0.8333 1.1881 Frecuencia estacional 0.8631 1.0000 0.6675 2.0633 Segunda frecuencia crítica del ciclo sem anal Frecuencia estacional 156 ESTADÍSTICA ESPAÑOLA La interpretación de los parámetros α1 y α2 depende de las características específicas de la serie objeto de análisis. Así, por ejemplo, para una empresa concreta el parámetro α1 depende del tipo de actividad económica, de las características del sector y α2 es función de la gestión interna de la empresa. Introducir valores no nulos para ambos parámetros supone, en la práctica, establecer a priori un ciclo semanal de forma artificial, por lo que es la señal asociada al ciclo semanal es más potente y su naturaleza estacional no varía significativamente, como se aprecia en la siguiente tabla: Tabla 4 ESPECTRO DEL EFECTO LABORALIDAD ASOCIADO A DETERMINADAS FRECUENCIAS Frecuencias α2 = 0 α1 = 1 α1 = 0 α1 = ½ α1 = 1 α2 = ? α2 = ½ α2 = 1 Estacionalidad fundamental (π/6) 17.80 15.67 13.72 15.90 17.11 21.26 Ciclo Semanal (0.6964π) 7.19 12.15 19.65 19.13 18.88 18.22 3. DETECCIÓN En esta sección se analiza cómo detectar, desde una perspectiva espectral, la presencia de efectos de calendario en series económicas de frecuencia mensual o trimestral. La exposición se centrará, sin pérdida de generalidad, en los efectos vinculados con el ciclo semanal y la Pascua móvil. El proceso de detección consta de cinco etapas principales: determinación de las frecuencias críticas, extracción de la señal relevante mediante filtros lineales, corrección eventual de atípicos, estimación del espectro y criterio de detección. A continuación se expone cada una de estas fases. 3.1 Determinación de las frecuencias críticas En la sección anterior se analizaron las características espectrales de los diversos efectos de calendario. De esta manera se ha obtenido, entre otras cosas, una relación de las frecuencias más relevantes vinculadas con los citados efectos, véanse las tablas 1 y 2. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 157 Como ya se ha comentado, el objetivo consiste en estimar y corregir una serie de los efectos de calendario sin afectar a sus señales estructurales: tendencia y estacionalidad. Dado que algunas de las frecuencias críticas coinciden con las que están asociadas a la estacionalidad, la relación de las mismas es la que se ofrece en la tabla siguiente: Tabla 5 FRECUENCIAS CRÍTICAS DE LOS EFECTOS DE CALENDARIO Mensuales Trimestrales Frecuencia Tipo Frecuencia Tipo 0.2279 Pascua 0.5893 Ciclo semanal 0.2721 Pascua 0.6786 Ciclo semanal 0.3946 Pascua 0.6837 Pascua 0.4388 Pascua 0.8163 Pascua 0.5612 Pascua 0.6054 Pascua 0.6964 Ciclo semanal 0.7279 Pascua 0.7721 Pascua 0.8631 Ciclo semanal 0.8946 Pascua 0.9388 Pascua En adelante, designaremos como w*=(w1,w2,...,wk) al vector de frecuencias críticas vinculadas con los efectos de calendario de una serie mensual (k=12) o trimestral (k=4). 3.2 Extracción de la señal relevante Una de las características más usuales de las series temporales económicas es la presencia de una importante señal tendencial y/o estacional. Estas señales, habitualmente no estacionarias, dominan la variabilidad total de la serie, de manera que otros efectos, como los de calendario, resultan difíciles de detectar. Por lo tanto, resulta fundamental disponer de una serie purgada de dichas señales con el fin de diseñar procedimientos adecuados de detección. 158 ESTADÍSTICA ESPAÑOLA Este proceso de filtrado se puede efectuar de manera paramétrica o no paramétrica. En el primer caso, se identifica, estima y diagnostica un modelo y se diseñan los filtros lineales de manera compatible con dicho modelo. Este es, por ejemplo, el enfoque propuesto, entre otros, por Burman (1980), Hillmer et al. (1983) y Maravall (1987) e implementado en los programas TRAMO y SEATS (Gómez y Maravall, 1996). El enfoque no paramétrico consiste en diseñar filtros lineales que gocen de unas adecuadas propiedades espectrales, sin emplear un modelo explícito para caracterizar al proceso generador de los datos observados. A continuación se expone el segundo enfoque, posiblemente menos conocido. Una forma relativamente sencilla de aplicar la opción no paramétrica consiste en combinar un filtro de paso alto con uno de eliminación selectiva, también llamado "en peine" (comb ). Formalmente: z t = HH (B, F) H C (B, F) x t [13] siendo xt la serie observada. HH(B,F) y HC(B,F) son, respectivamente, filtros simétricos de paso alto y de eliminación selectiva. El primero puede ser uno del tipo Butterworth, véase Oppenheim y Schaffer (1989) y Gómez (1998a) para una exposición de este tipo de filtros. HH (B, F) = (1 − B) d (1 − F)d , (1 − B) (1 − F)d + λ(1 + B)d (1 + F)d d [14] siendo F = B -1 y λ un parámetro asociado a la frecuencia de potencia mitad (wc) y al grado del filtro (d), según: π − w c λ = tan2d 2 −1 . [15] El diseño específico que se ha realizado para este filtro se detalla en la siguiente tabla: 159 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Tabla 6 CARACTERÍSTICAS DEL FILTRO BUTTERWORTH DE PASO ALTO Parámetros Mensual Trimestral Banda de paso [ π/5 , π ] [ 3π/5 , π ] Banda de rechazo [ 0 , π/7 ] [ 0 , 3 π/7 ] Potencia mitad 0.1780π 0.5324π 10 7 Orden La fijación de las bandas de paso y de rechazo determina los parámetros críticos del filtro wc y d, véase Oppenheim y Schaffer (1989). La función de ganancia correspondiente al caso mensual se aprecia en el siguiente gráfico: Gráfico 13 FILTRO BUTTERWORTH DE PASO ALTO MENSUAL 1,0 0,8 0,6 0,4 0,2 0,0 0 1 2 3 4 5 6 ciclos/año Estos filtros se aplican sobre la serie extrapolada en sus extremos mediante un modelo ARIMA ident ificado y estimado mediante el programa TRAMO. 160 ESTADÍSTICA ESPAÑOLA El segundo filtro puede ser un filtro de paso en peine desestacionalizador, véase Gómez (1998b) y Melis (2003)(5). Estos filtros se caracterizan por una función de ganancia con ceros o cortes (notches ) en las frecuencias estacionales ws=2kπ/s, k=1,2, … ,s/2, y s=4 ó 12 según la periodicidad trimestral o mensual de la serie. Su expresión general es: Hc (B, F) = H c (B)Hc (F) [16] Hc (B) = δ(1 + B + Λ + B s−1 ) (1 + aB + Λ + as −1Bs −1) , siendo δ=(1+a+…+as-1)/s. El parámetro a (0<a<1) modula la amplitud de la función de ganancia en torno a las frecuencias estacionales. En el siguiente gráfico se considera el caso mensual con a=0.98. Gráfico 14 FILTRO PEINE DESESTACIONALIZADOR MENSUAL 1,0 0,8 0,6 0,4 0,2 0,0 0 1 2 3 4 5 6 ciclos/año La combinación de ambos filtros elimina la información contenida tanto en la tendencia como en la estacionalidad, lo que permite estimar conjuntamente la (5) También se puede emplear el diferenciador estacional estacional (1−Bs ), con s=4 ó 12 según la frecuencia de la serie. 161 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA señal irregular y los efectos de calendario. Este resultado final se aprecia en el correspondiente gráfico de su función de ganancia: Gráfico 15 FILTRO MENSUAL ESTIMADOR DE LA IRREGULARIDAD 1,0 0,8 0,6 0,4 0,2 0,0 0 1 2 3 4 5 6 ciclos/año 3.3 Corrección de atípicos Las observaciones atípicas pueden distorsionar tanto la detección como la eventual corrección de los efectos de calendario. Dentro del enfoque paramétrico antes mencionado, se puede realizar la corrección mediante el enfoque de detección-corrección secuencial de Chang et al. (1988) y Chen y Liu (1993), tal y como es aplicado en el programa TRAMO, véase Gómez y Maravall (1998). Por otra parte, dentro del enfoque no paramétrico, se puede seguir la propuesta de Cleveland y Devlin (1980) que tiene la ventaja de que controla el efecto del ciclo semanal de forma explícita en el proceso de detección de atípicos y, a continuación, combinarlo con el uso de estimadores robustos para realizar la corrección final. El procedimiento consiste en agrupar las observaciones zt en ocho grupos, los siete primeros formados por las observaciones dependiendo del día de la semana en que comience cada periodo t y el octavo agrupará las observaciones correspondientes al mes de febrero o al segundo trimestre. La serie z t es la irregularidad 162 ESTADÍSTICA ESPAÑOLA estimada mediante los procedimientos no paramétricos antes descritos siendo, por tanto, estacionarios cada uno de los ocho grupos. Para estas series z t,g , con g=1..8, se determinan cuáles se encuentran fuera de un determinado intervalo y se realiza una corrección proporcional para ellas. Dicho intervalo debe ser robusto frente a las observaciones atípicas por lo que una posibilidad es emplear, como medida de posición, la media recortada(6) (µr) y, como medida de dispersión, el valor mediano de las desviaciones respecto a la mediana en valor absoluto (σr)(7), véase García (2000) para una exposición de estos estimadores robustos. Si la observación se encuentra fuera del intervalo [µr ±τσr], donde τ es un parámetro que determina la amplitud del intervalo de corrección(8), se le aplica un factor de ajuste dependiente del cociente σr/σ, siendo σ la desviación típica. Formalmente, el criterio de corrección es: z co t, g z t,g ↔ µ r − τσ r ≤ z t, g ≤ µ r + τσr = σr en los demás casos z t, g σ [17] 3.4 Criterios de detección Una vez que se dispone de una serie apropiada para la detección de los efectos de calendario, es necesario calcular el espectro correspondiente. La primera opción, emplear el periodograma, tiene la ventaja de su sencillez y el inconveniente de su erraticidad y falta de consistencia, véase Otnes y Enochson (1972). Por ello, siguiendo a Souskup y Findley (1999, 2000), se recomienda el uso adicional de un estimador consistente del espectro. En este trabajo, se ha optado por el estimador de Yule-Walker, véase Parzen (1964). Dicho estimador deriva el espectro a partir de la función de ganancia de un modelo autorregresivo de orden elevado, y aquí se considera p=42 para el caso mensual y p=14 para el trimestral, de forma que sean divisores de 336 meses o 112 trimestres(9). La elección de estos valores se basa en Souskup y Findley (1999). Se calcula el espectro en 168 frecuencias equidistantes en el intervalo (0, π] y en 14 frecuencias para las subseries anuales asociadas a los meses y trimestres correspondientes. (6) Usualmente se aplica una censura del 10% en cada cola. (7) Adicionalmente, este estimador es estandarizado dividiéndolo por el percentil 75 de la distribución N(0,1). (8) Habitualmente, τ=3. (9) Esto es, ciclos completos de 28 años. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 163 Básicamente, existen tres formas complementarias de determinar la presencia de efectos de calendario a partir del espectro de la señal relevante (eventualmente corregida de atípicos): a) Examen visual de los gráficos correspondientes: especialmente útil en el caso de análisis detallado de series económicas. b) Determinación de un umbral para el espectro (p.e. el percentil 90 ó 95) de manera que, si el espectro en las frecuencias críticas lo sobrepasa, se considera significativa la presencia del correspondiente efecto de calendario. Este procedimiento es aconsejable para el procesamiento automático de series. Para el efecto de Pascua se puede considerar que está presente si al menos una de sus frecuencias críticas es significativa. c) El método de los espectros promedio de las subseries anuales que, como ya se ha expuesto, consiste en promediar los espectros de las subseries anuales as ociadas a los meses (trimestres) excluyendo febrero (segundo trimestre), véanse los gráficos 4 y 5 para el ciclo semanal y el gráfico 9 para el de Pascua. La combinación de los tres procedimientos reduce sustancialmente los riesgos de sobredetección o subdetección. Un punto importante, especialmente en el caso del tratamiento automático de grandes conjuntos de series temporales, es la determinación más apropiada de los umbrales, con el fin de minimizar los riesgos contrapuestos asociados tanto a las falsas señales (identificación de efectos de calendario inexistentes) como a la subdetección (ignorar efectos de calendario efectivamente presentes). Este aspecto queda fuera del ámbito de este trabajo pero, a tenor de lo expuesto en Souskup y Findley (1999, 2000), la estrategia más prometedora puede residir en un calibrado mediante simulación, de tipo bootstrap o Monte Carlo. 4. CORRECCIÓN Una vez detectada la presencia de un efecto de calendario, éste se corrige aplicando a la serie observada un filtro de corte (notch), diseñado de forma que elimina la información vinculada con la frecuencia de interés. Si el efecto que se desea eliminar está definido sobre varias frecuencias, se aplican en cascada filtros de corte que anulan las frecuencias correspondientes. Este tipo de filtros se emplea para eliminar de forma selectiva la información contenida en un conjunto de frecuencias específicas, dejando inalteradas todas las demás, véase Gómez (1998b) y Melis (2003) para una exposición de estos filtros. 164 ESTADÍSTICA ESPAÑOLA En particular, se va a utilizar un filtro simétrico cuya expresión es: H(B, F; c , w n ) = H(B; c , w n ) ⋅ H(F; c , w n ) [18] siendo B el operador de desfase, tal que Bzt=z t-1 y F=B -1 define al operador de adelanto. Los componentes parciales del filtro anterior son dos operadores ARMA(2,2) de la forma: H(B; c , w n ) = 1 − 2 ⋅ c ⋅ cos(w n ) + c 2 1 − 2 ⋅ cos(w n ) ⋅ B + B2 ⋅ 2 − 2 ⋅ cos(w n ) 1 − 2 ⋅ c ⋅ cos(w n ) ⋅ B + c 2 ⋅ B2 [19] siendo c un coeficiente próximo a la unidad que controla la apertura de la función de ganancia en torno a la frecuencia de corte wn. Se trata de un filtro cuya función de ganancia está superiormente acotada en todo el dominio de definición: 0 ≤ g( w) ≤ 1, ∀w ∈ [0, π] y posee ganancia unitaria en la frecuencia cero, de manera que preserva los niveles de la serie de entrada (input ): g(0) = 1 . En el siguiente gráfico se aprecia cómo, a medida que c tiende a uno, la función de ganancia del filtro [19] se va cerrando, haciendo más selectiva la eliminación de la información contenida en la frecuencia objetivo wn. Gráfico 16 FILTRO CORTE PARA DIFERENTES VALORES DE c 1,0 0,8 0,6 0,4 0,85 0,90 0,96 0,98 0,2 0,0 0,0 0,2 0,4 0,6 0,8 1,0 w / pi La elección apropiada del valor de c depende de la estabilidad del componente asociado a wn, de manera que cuanto más estable es, más apropiado resulta un 165 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA valor elevado para c. Como esta estabilidad es un rasgo inobservable, la elección debe basarse en consideraciones a priori y en un conocimiento específico de las características de la serie. La experiencia práctica con estos filtros sugiere como valores apropiados 0.96 ó 0.98. Si el fenómeno que se desea eliminar está definido en varias frecuencias w*=(w1,w2,...,wk), la corrección se efectúa aplicando en cascada el filtro de corte para cada una de ellas: H(B, F; c , w * ) = k ∏ H(B; c, w ) ⋅ H(F; c, w ) i [20] i i=1 De esta manera, la serie corregida es: zct = H(B, F; c, w *)x t = k ∏ H(B; c, w ) ⋅ H(F; c, w ) x i i t [21] i=1 Un esquema de corrección alternativo, de carácter paramétrico, consiste en aplicar el enfoque basado en modelos de regresión con errores ARIMA. Para el efecto del ciclo semanal se considerarían como regresores las variables antes definidas hk(t), con k=1, 2 y 3, con el fin de asegurar la representación completa de dicho ciclo en todas sus frecuencias de solapamiento, véase McNulty y Huffman (1989). Para el efecto de Pascua se consideraría como regresor la variable (1-Bs)P t(τ), que carece de estacionalidad. 5. APLICACIÓN Con el fin de ilustrar los procedimientos expuestos en las secciones anteriores, se va a analizar una serie susceptible de poseer tanto el efecto del ciclo semanal como el de Pascua. En particular, se considera la serie mensual del consumo de gasolina para automoción, en el intervalo 1976:01-2003:12. Esta serie es un indicador de actividad económica vinculado, entre otros factores, con las pautas de consumo de los hogares (transporte diario, salidas de fin de semana, vacaciones, etc.) por lo que sus niveles pueden recoger algunos de los efectos de calendario examinados en este trabajo. Para estimar su componente irregular, se le aplican los filtros de paso bajo y de eliminación selectiva en peine (comb ) descritos anteriormente. El filtro en peine se utiliza con a=0.96, debido a la fuerte estacionalidad evolutiva que posee la serie. La estimación de su espectro se realiza mediante el procedimiento de Yule- 166 ESTADÍSTICA ESPAÑOLA Walker y es la que aparece en el gráfico 17-1. En este gráfico se indican con 2 líneas verticales oscuras las frecuencias críticas del efecto del ciclo semanal y, con 10 líneas claras, las del efecto de Pascua. Examinado el gráfico 17-1 para el efecto del ciclo semanal, se observa que la primera frecuencia de este efecto es la que más destaca, tomando un valor (0.0030) mayor que el percentil 99 (0.0020). Asimismo, el espectro presenta un pico en su segunda frecuencia crítica y su valor (0.000606) es mayor que el percentil 90 (0.000456) y muy similar al percentil 95 (0.000608). Por todo ello, se puede concluir que el efecto del ciclo semanal es muy significativo en el consumo de gasolina. Para el efecto de Pascua se aprecia que las frecuencias tercera, cuarta, quinta, sexta, novena y décima presentan sendos picos con unos valores del espectro (0.0006, 0.0011, 0.0019, 0.0012, 0.0005 y 0.0010, respectivamente) mayores que el percentil 90 y para las frecuencias quinta, sexta y décima superiores al percentil 95. En consecuencia, este efecto también es bastante significativo en el consumo de gasolina. Los resultados anteriores son confirmados por el espectro medio de las subseries mensuales que aparece en el gráfico 17-2. Comparándolo con los gráficos 4 y 9 se observa cómo aparecen dos picos muy significativos en las frecuencias correspondientes al efecto del ciclo semanal y de Pascua, respectivamente. 167 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 17 CONSUMO DE GASOLINA. SERIE ORIGINAL (1) Espectro de la irregularidad 0,0040 0,0030 0,0020 0,0010 0,0000 0 1 2 3 4 5 6 ciclos / año (2) Espectro medio subseries mensuales 0,0010 0,0008 0,0006 0,0004 0,0002 0,0000 0,00 0,25 0,50 ciclos / año La correción de ambos efectos se realiza mediante filtros de corte aplicados en cascada sobre la serie original en las frecuencias críticas del ciclo semanal y de la Pascua, con un valor de c=0.96 debido a la presencia tan significativa de ambos efectos. El espectro del componente irregular de la serie corregida se muestra en el gráfico 18-1, donde se ha ampliado la escala para poder comprobar claramente cómo, en cada una de las frecuencias críticas, el valor del espectro es prácticamente nulo y en ninguna de ellas se supera el valor mediano (0.000020). Este resultado es corroborado por el análisis del espectro medio de las subseries mensuales, gráfico 18-2, donde ninguna de las leves oscilaciones se aleja significativamente del valor medio global. 168 ESTADÍSTICA ESPAÑOLA Gráfico 18 CONSUMO DE GASOLINA. SERIE CORREGIDA (1) Espectro de la irregularidad 0,0004 0,0003 0,0002 0,0001 0,0000 0 1 2 3 4 5 6 ciclos / año (2) Espectro medio subseries mensuales 0,0010 0,0008 0,0006 0,0004 0,0002 0,0000 0,00 0,25 0,50 ciclos / año La metodología expuesta permite realizar una estimación del ciclo semanal subyacente en la serie mensual agregada. Esta estimación se realiza promediando el efecto del ciclo semanal para cada uno de los siete primeros grupos que resultan aplicando la clasificación expuesta para la corrección de atípicos. De esta forma se obtiene para cada día de la semana una desviación sobre la media semanal. El siguiente gráfico muestra el ciclo semanal estimado para el consumo de gasolina. 169 LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA Gráfico 19 . CICLO SEMANAL MEDIO 1,00% 0,75% 0,50% 0,25% 0,00% -0,25% -0,50% -0,75% -1,00% Dom Lun Mar Mie Jue Vie Sáb Asimismo, se puede evaluar el efecto de Pascua para los meses de marzo y abril, que son los más afectado. Se observa claramente que este efecto es mayor en el mes de abril siempre y cuando la fecha de la Pascua sea posterior al 6 de abril. Gráfico 20 EFECTO DE PASCUA EN LOS MESES DE MARZO Y ABRIL 5% 4% 3% 2% 1% 0% -1% -2% -3% Mar -4% Abr -5% 1976 1979 1982 1985 1988 1991 1994 1997 2000 2003 170 ESTADÍSTICA ESPAÑOLA CONCLUSIONES Los efectos de calendario constituyen una amalgama compleja y variada de factores que inciden sobre un gran número de series temporales económicas, de forma que su presencia ha de ser tenida en cuenta para la modelización estadística y el análisis económico. Así, el ciclo semanal puede manifestarse en las series mensuales de forma notable y claramente diferenciada de los restantes componentes es tructurales (tendencia, estacionalidad) de las series. El efecto en el caso trimestral es diferente, ya que la potencia del efecto es sustancialmente menor y se solapa o coincide con las oscilaciones estacionales. Este hecho explica por qué se identifica con menos frecuencia en estas series así como la (aparente) paradoja de que se detecte en una serie mensual pero no en su agregación trimestral. El ciclo semanal también puede aparecer en las series anuales, si bien su corrección directa es extremadamente delicada, debido a que afecta a elementos de carácter cíclico y a que la longitud habitual de estas series dificulta cualquier intento de corrección, tanto paramétrico como no paramétrico. El análisis del ciclo semanal revela con claridad que el efecto de la duración de los meses (trimestres) sobre el nivel de la serie es de carácter estacional, por lo que su eventual corrección debe realizarse mediante procedimientos de desestacionalización. Por su parte, el efecto de la Pascua móvil es difícil de modelizar, porque carece de una periodicidad diaria precisa y porque su ubicación temporal mezcla elementos estacionales (ligados al ciclo lunar) con el calendario gregoriano. De esta manera, su incidencia espectral es relativamente amplia: 10 frecuencias críticas en el caso mensual y 2 en el trimestral. En lo que concierne a otros efectos, el año bisiesto es un efecto muy débil pero afecta de forma bastante uniforme a casi todas las bandas del espectro y las fiestas fijas eventualmente sustituibles son, esencialmente, un fenómeno estacional. La influencia del número de días hábiles(10) sobre el nivel de actividad, estimada mediante el efecto de laboralidad es, básicamente, de carácter estacional y recoge, de forma marginal, elementos del ciclo semanal. La corrección por días laborables es, por lo tanto y en lo esencial, un ajuste estacional con dos graves (10) Para identificarla, se requiere un calendario laboral efectivo (que no tiene por qué coincidir con el oficial o administrativo), cuya determinación puede ser compleja en numerosas situaciones. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 171 inconvenientes: asume una pauta determinista usualmente poco realista y deteriora la modelización y extracción de señales que se realice a continuación. La detección de los efectos de calendario mediante técnicas espectrales puede ser realizada de forma autónoma o como parte de un sistema de diagnóstico en un contexto de modelización y extracción de señales basado en modelos. En el primer caso, el recurso a filtros especialmente diseñados de filtrado selectivo y de Butterworth de paso alto constituye un procedimiento sencillo y robusto para estimar la señal irregular y, mediante estimadores espectrales consistentes, detectarlos. Igualmente, la corrección de efectos de calendario se puede efectuar de manera autónoma o empleando modelos estadísticos explícitos. En el primer caso, nuevamente, los filtros selectivos de paso en peine (comb ) son una herramienta especialmente útil. Finalmente, las observaciones atípicas pueden distorsionar la detección de los efectos de calendario. Se pueden diseñar procedimientos robustos de corrección de atípicos especialmente preparados para operar en el marco de la correccióndetección de efectos de calendario. REFERENCIAS BELL , W.R. Y HILLMER, S.C. (1983) «Modeling time series with calendar variation», Journal of the American Statistical Association, vol. 78, n. 383, p. 526-534. BELL , W.R. Y HILLMER, S.C. (1984) «Issues involved with the seasonal adjustment of economic time series», Journal of Business and Economic Statistics, vol. 2, p. 291-320. CLEVELAND, W.S. Y DEVLIN, S.J. (1980) «Calendar effects in monthly time series: detection by spectrum analysis and graphical methods», Journal of the American Statistical Association, vol. 75, n. 371, p. 487-496. CLEVELAND, W.S. Y DEVLIN, S.J. (1982) «Calendar effects in monthly time series: modeling and adjustment», Journal of the American Statistical Association, vol. 77, n. 379, p. 520-528. CHANG, I., TIAO, G.C. Y CHEN, C. (1988) «Estimation of time series parameters in the presence of outliers», Technometrics, vol. 30, n. 2, p. 193-204. CHEN, C. Y LIU, L.M. (1993) «Joint estimation of model parameters and outlier effects in time series», Journal of the American Statistical Association, vol. 88, p. 284-297. 172 ESTADÍSTICA ESPAÑOLA DAGUM , E.B. Y QUENNEVILLE , B. (1989) «Dynamic linear models for time series components», Statistics Canada, Working Paper TSRA-89-020E. ESPASA, A. Y CANCELO, J.R. (1996) «Modelling and forecasting daily series of electricity demand», Investigaciones Económicas , vol. 20, n. 3, p. 359-376. GARCÍA, A. (2000) Métodos estadísticos robustos y de remuestreo, Universidad Nacional de Educación a Distancia (UNED), Madrid. GÓMEZ, V. Y MARAVALL , A. (1996) «Programs TRAMO and SEATS», Documento de Trabajo n. 9628, Banco de España. GÓMEZ, V. Y MARAVALL , A. (1998a) «Automatic modeling methods for univariate series», Documento de Trabajo n. 9808, Banco de España. GÓMEZ, V. (1998a) «Butterworth filters: a new perspective», Ministerio de Economía y Hacienda, Documento de Trabajo n. D-98008. GOMEZ, V. (1998b) «MA vs ARMA filters for unobserved components estimation», Documento Interno, Ministerio de Economía y Hacienda. HILLMER, S.C. (1982) «Forecasting time series with trading day variation», Journal of Forecasting, vol. 1, p. 385-395. HILLMER, S.C., BELL , W. Y TIAO, G.C. (1983) «Modeling considerations in the seasonal adjustment of economic time series», en Zellner, A. (Ed.) Applied time series analysis of economic data, U.S. Department of Commerce, Bureau of the Census, Washington, U.S.A. ISHIGURO, M. Y AKAIKE, H. (1981) «A bayesian approach to the trading-day adjus tment of monthly time series», Anderson, O.D. (Ed.) Time series analysis, North Holland, Amsterdam, Holanda. KAISER, R. Y MARAVALL, A. (2004) «Combining filter design with model-based filtering», Banco de España, Documento de Trabajo n. 0417. KITAGAWA , G. Y GERSCH, W. (1984) «A smoothness priors state-space modeling of time series with trend and seasonality», Journal of the American Statistical Association, vol. 79, n. 386, p. 378-389. LIU, L.M. (1980) «Analysis of time series with calendar effects», Management Science, vol. 26, n. 1, p. 106-112. LIU, L.M. (1983) «Identification of time series models in the presence of calendar variation», SCA Corporation, Working Paper n. 102. MCNULTY, M.S. Y HUFFMAN, W.E. (1989) «The sample spectrum of a time series with calendar variation», Economic Letters, vol. 31. p. 367-370. LOS EFECTOS DE CALENDARIO DESDE UNA PERSPECTIVA FRECUENCIA 173 MELIS , F. (1992) «Agregación temporal y solapamiento o 'aliasing’», Estadística Española, n. 130, p. 309-346. MELIS , F. (2003) «Un desestacionalizador ARMA para series económicas sin desfase temporal», Boletín Trimestral de Coyuntura, n. 87, p. 145-165. OPPENHEIM , A.V. Y SCHAFFER, R.W. (1989) Discrete-time signal processing, Prentice Hall, Englewood Cliffs, New Jersey, United States of America. OTNES, R.K. Y ENOCHSON, L. (1972) Digital time series analysis, John Wiley, New York, United States of America. PARZEN, E. (1964) «An approach to empirical time series analysis», Radio Science Journal of Research, vol. 68D, n. 9, p. 937-951. SALINAS, T.S. Y HILLMER, S.C. (1987) «Multicollinearity problems in modeling time series with trading-day variation», Journal of Business and Economic Statistics, vol. 5, n. 3, p. 431-436. SOUKUP , R.J. Y FINDLEY, D.F. (1999) «On the spectrum diagnostics used by X-12ARIMA», Documento Interno, U.S. Bureau of the Census. SOUKUP , R.J. Y FINDLEY, D.F. (2000) «Detection and modeling of trading day effects», Documento Interno, U.S. Bureau of the Census. STEWART, I. (2001) «Estructura temporal cuasi-cristalina de la Pascua», Investigación y Ciencia, n. 295, p. 84-85. VAN W IJK, J.J. Y VAN SELOW, E.R. (1999) «Cluster and calendar based visualization of time series data», IEEE Simposium on Information Visualization, San Francisco, Octubre. 174 ESTADÍSTICA ESPAÑOLA CALENDAR EFFECTS: A FREQUENCY-DOMAIN ANALYSIS ABSTRACT In this paper we analyze the main features of calendar effects (weekly cycle, Easter, working days, etc) from a frequency-domain perspective, in order to design non parametric procedures for detecting and, eventually, correcting calendar effects. These procedures use specific linear filters, designed from a frequency-domain point of view, and can be used jointly with parametric methods (e.gr., as a diagnostic tool for seasonal adjustment) or in an completely independent way. Key words: calendar effects, frequency-domain, weekly cycle, Easter effect, working-day effect, seasonality, linear filters, Butterworth filters, notch filters, seasonal adjustment. AMS : Classification 62M10, 62M15, 62P20