Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. TÉCNICAS DE EXTRACCIÓN DE SEÑALES -Algunas consideraciones finales sobre los modelos ARIMA -Introducción al análisis espectral de series temporales -Métodos de extracción de señales basados en el modelo ARIMA de la serie original Gran parte del contenido de esta sección y un buen número de gráficos presentados se han tomado del artículo de Regina Kaiser y Agustín Maravall, (2000) “Notes on Time Serie Analysis, ARIMA Models and Signal Extraction” Documento de Trabajo 00-12. Servicio de Estudios, Banco de España. (Disponible en internet en www.bde.es) Técnicas avanzadas de series temporales 1 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ALGUNAS REFLEXIONES SOBRE LOS MODELOS ARIMA - La PARSIMONIA en el número de parámetros SIEMPRE debe estar presente en la formulación del modelo ARIMA p, q ≤ 4, P ≤ 1, Q ≤ 2, d ≤ 2, D ≤ 1 - Los modelos ARIMA son una herramienta útil en el análisis a corto plazo. - su flexibilidad y capacidad de adaptación contribuyen a su buen comportamiento en la predicción a corto plazo. - La extrapolación al largo plazo de esta flexibilidad puede resultar inestable. - Como regla general, para el análisis a corto plazo se recomienda diferenciar, mientras que para el análisis a largo plazo puede ser preferible incluir factores deterministas. Técnicas avanzadas de series temporales 2 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ESPECIFICACIÓN DETERMINISTA VS. DIFERENCIACIÓN (a) X t = μ + at (b) ΔX t = (1 − 0.99 L)at - En muestras finitas es IMPOSIBLE distinguir entre estos dos modelos. - El modelo (a) necesita estimar un parámetro, mientras que el modelo (b) pierde una observación. - El modelo (b) es más flexible que el modelo (a) puesto que se puede escribir de la forma: X t = μ ( t ) + at donde μ(t) es una media que se adapta lentamente en el tiempo. Técnicas avanzadas de series temporales 3 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. 3 (c ) X t = μ + ∑ β j d jt +at j =1 (d ) Δ 4 X t = (1 − 0.95 L4 )at - En muestras finitas es IMPOSIBLE distinguir entre estos dos modelos. - El modelo (c) necesita estimar cuatro parámetros, mientras que el modelo (d) pierde cuatro observaciones. - El modelo (d) es más flexible que el modelo (c) puesto que se puede escribir de la forma: Xt = μ 3 (t ) + ∑ β (j t ) d jt +at j =1 donde μ(t) y βj(t) se adaptan lentamente en el tiempo. Técnicas avanzadas de series temporales 4 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Reflexiones: - Desde una perspectiva de corto plazo, no hay razón para mantener la dicotomía y los rasgos deterministas se pueden entender como rasgos estocásticos extremadamente estables. - Además los contrastes de raíces unitarias presentan baja potencia para distinguir entre los modelos (a), (b), (c ) y (d). - El verdadero tamaño del contraste es desconocido cuando se incluyen variables artificiales. - En la práctica algunos programas automáticos (TRAMO) estiman los parámetros asociados a raíces unitarias y basan su decisión sobre diferenciar o no en la proximidad del mismo a la unidad. - Los procedimientos automáticos (TRAMO) basan la selección del orden de los polinomios autorregresivos y de medias móviles en criterios de ajuste, reduciendo la importancia de la identificación a partir de correlogramas. Técnicas avanzadas de series temporales 5 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. MODELO DE LAS LÍNEAS AÉREAS ΔΔ s X t = (1 − θ1 L)(1 − θ s Ls )at • Es un modelo balanceado • Si el parámetro de medias móviles regular θ1 tiende a 1, el comportamiento de la tendencia es muy estable. • Si el parámetro de medias móviles estacional θ12 tiende a 1 pueden ocurrir dos cosas: • La estacionalidad es prácticamente determinista ó • No hay estacionalidad y el modelo está sobrediferenciado. La distinción entre ambos es sencilla contrastando la significatividad de las variables estacionales. Técnicas avanzadas de series temporales 6 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. COMPORTAMIENTOS PERIÓDICOS Las raíces complejas generan comportamientos periódicos del tipo. A t cos( wt + B ) Donde A denota la amplitud, B la fase (el ángulo en t=0), y w la frecuencia (el número de círculos completos en una unidad de tiempo. Período = T = 2π w Técnicas avanzadas de series temporales 7 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Ejemplo: (1-0.46L+0.25L2) G1 , G2 = 0.23 ± 0.44i Módulo=0.50 = 0.232 + 0.44 2 0.44 Ángulo=1.09 radianes 0.23 Período= 5.77 Técnicas avanzadas de series temporales 8 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. DESCOMPOSICIÓN DEL POLINOMIO Δ12 Δ12 = (1 − L12 ) = (1 − L)(1 + L)(1 + L2 )(1 + 3L + L2 )(1 − 3L + L2 )(1 + L + L2 )(1 − L + L2 ) Operador Raíces (1 − L) (1 − L) 1 -1 ±i (1 + L2 ) Frecuencia Período Radianes Meses 0 0 ∞ π 6 2 π /2 3 4 5π / 6 5 12/5 (1 − 3L + L2 ) (− 3 ± i) / 2 (1 + 3L + L2 ) (− 3 ± i) / 2 π /6 1 12 (1 − L + L2 ) ( −1 ± i 3 ) / 2 2π / 3 4 3 (1 + L + L2 ) (1 ± i 3 ) / 2 π /3 2 6 Todas las raíces son de módulo unidad. En el operador se combinan diferentes estructuras cíclicas no estacionarias, cada una de las cuales corresponde a una determinada frecuencia estacional Técnicas avanzadas de series temporales 9 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. DESCOMPOSICIÓN DEL POLINOMIO Δ4 Δ 4 = (1 − L4 ) = (1 − L)(1 + L)(1 + L2 ) Operador (1 − L) (1 − L) (1 + L2 ) Raíces 1 -1 ±i Frecuencia Período Radianes Meses 0 0 ∞ π 6 2 π /2 3 4 Todas las raíces son de módulo unidad. En el operador se combinan diferentes estructuras cíclicas no estacionarias, cada una de las cuales corresponde a una determinada frecuencia estacional Técnicas avanzadas de series temporales 10 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. INTRODUCCIÓN AL ANÁLISIS ESPECTRAL Técnicas avanzadas de series temporales 11 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. • El ESPECTRO es un modo alternativo de analizar e interpretar la información de los momentos de segundo orden de las series. • Es particularmente útil para analizar componentes no observados como la tendencia, estacionalidad o ciclos. • El espectro es la herramienta básica en el denominado ANÁLISIS EN EL DOMINIO DE LAS FRECUENCIAS. • El análisis espectral se basa en la Teoría de Fourier. • T valores se pueden duplicar exactamente mediante: • Un polinomio de orden T-1 ó • La suma de T/2 funciones sinusoidales. Esta segunda opción es la base del análisis de Fourier. Técnicas avanzadas de series temporales 12 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Cada una de las sinusoidales representada en su correspondiente frecuencia Espectro=amplitud vs. frecuencia Técnicas avanzadas de series temporales 13 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Ejemplo: 10 observaciones están generadas por 5 funciones coseno que a su vez se pueden escribir como suma de senos y cosenos T /2 X t = ∑ rjt j =1 con rjt = a j cos w j t + b j sen w j t • aj y bj están relacionadas con la AMPLITUD A2j = a 2j + b 2j • wj es un múltiplo de la frecuencia fundamental w=2π/T Técnicas avanzadas de series temporales 14 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. • El PERIODOGRAMA es el gráfico de Aj2 versus wj con las wj agrupadas en intervalos. • El ESPECTRO es la versión continua del periodograma. • El área bajo la curva muestra la contribución de las frecuencias a la variabilidad de la serie. • El gráfico entre 0 y 2π es simétrico alrededor de π, por eso sólo se muestra en el intervalo 0,π Técnicas avanzadas de series temporales 15 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Ejemplo e introducción del componente estocástico 2 Evolución del proceso zt+0.81zt-2=0 1 0 1 -1 6 11 16 21 26 Su ecuación característica presenta raíces complejas de frecuencia π/2 -2 Su espectro muestra un pico en la única frecuencia que aporta variación Si a la misma ecuación se le añade un componente estocástico zt+0.81zt-2=at la variabilidad se extiende por las frecuencias cercanas. Si la varianza de at aumenta, el espectro refleja este efecto. 16 Técnicas avanzadas de series temporales Cuanto mayor es la varianza del componente estocástico, el componente es menos estable Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. - si una serie contiene un componente importante en una cierta frecuencia, su espectro debería mostrar un pico en dicha frecuencia - existe una relación directa entre el espectro y la función de autocovarianzas: [ ] g ( w) = γ 0 + 2∑ j γ j cos jw Va Técnicas avanzadas de series temporales 17 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ALGUNOS ESPECTROS Ruido Blanco: Su espectro es constante (todas sus autocovarianzas son 0) MA(1) [ ] g ( w) = 1 + θ 2 + 2θ cos w Va Técnicas avanzadas de series temporales 18 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. AR(1) AR(2) [ ] −1 g ( w) = 1 + φ + 2φ cos w Va 2 • Si las raíces son reales, sus efectos son los correspondientes a dos procesos AR(1) • Si son complejas, el espectro mostrará un pico en la frecuencia w. φ>0 φ<0 Técnicas avanzadas de series temporales 19 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ASOCIACIÓN DE FRECUENCIAS EN EL ESPECTRO • Tendencia: máximo en la frecuencia 0 • Estacionalidad: máximos en las frecuencias estacionales • Cíclico: máximo en el rango de frecuencias cíclicas: [0.05π, 0.33π] que corresponden a un período entre 2 y 12 años Técnicas avanzadas de series temporales 20 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. TÉCNICAS DE EXTRACCIÓN DE SEÑALES Técnicas avanzadas de series temporales 21 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. FILTROS LINEALES Y SU GANANCIA CUADRÁTICA Un filtro lineal es una combinación lineal de la serie Xt de la forma: Yt = c− k1 X t − k1 + " + c−1 X t −1 + c0 X t + c1 X t +1 + " + ck 2 X t + k 2 • Yt es una media móvil de observaciones Xt. • Los pesos cj se deben encontrar de forma que capten las variaciones relevantes asociadas con el componente de interés • Un filtro para la tendencia captará la variación asociada con los movimientos de largo plazo y un filtro para el componente estacional capturará la variación de naturaleza estacional. • Si k1=k2 es un filtro simétrico • Los valores futuros son sustituidos por predicciones, lo que hace necesario: • Un modelo para el cálculo de las predicciones • Revisiones de los valores de los componentes ya publicados, según aparece la nueva información Técnicas avanzadas de series temporales 22 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. TERMINOLOGÍA • Valor definitivo o estimador definitivo: cuando el filtro utiliza exclusivamente valores verdaderos de la variable observada. • Valor condicional o estimador condicional: cuando debido a la falta de información se sustituyen valores desconocidos por predicciones. • Valor concurrente o estimador concurrente: es un caso particular del estimador condicional, cuando sólo se dispone de observaciones de la variable agregada hasta el mismo momento para el que se quiere estimar la señal. • Revisión o actualización: es el proceso por el cual se sustituyen las predicciones por los valores observados a medida que éstos se van conociendo. • Error de revisión: es la diferencia entre el valor definitivo y un valor condicional. Técnicas avanzadas de series temporales 23 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. MÉTODOS BASADOS EN EL MODELO ARIMA DE LA SERIE ORIGINAL En un modelo de componentes inobservados, la serie observada Xt se puede expresar como la suma de componentes ortogonales: k X t = ∑ xit , i =1 de forma que x1t, x2t, ..., xkt son los k componentes inobservados. Cada uno de los componentes puede expresarse como un proceso ARIMA, de forma que, φi ( L) xit = θ i ( L)ati donde φi(L) y θi(L) son polinomios finitos en L de órdenes pi y qi, respectivamente, que pueden contener raíces unitarias, y ai son variables ortogonales de ruido blanco con varianzas Vi. Se supone que las raíces de los polinomios autorregresivos son diferentes para cada componente, y que φi(L) y θi(L) no comparten raíces. Técnicas avanzadas de series temporales 24 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Combinando las ecuaciones, se obtiene que, θ i ( L) i at φ ( ) L i =1 i k Xt = ∑ El modelo ARIMA (invertible) para Xt viene dado por: φ ( L) X t = θ ( L)at Con lo que, k φ ( L ) = ∏ φi ( L ) i =1 k θ ( L) = ∑ θ i ( L)φni ( L)ati i =1 donde φni(L) es el producto de todos los polinomios AR excepto φi(L) Técnicas avanzadas de series temporales 25 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. IDENTIFICACIÓN DE LOS PARÁMETROS Los parámetros AR en los modelos para los componentes inobservados se pueden obtener a partir del polinomio AR en la serie observada. Pero existe un número infinito de posibles especificaciones para los parámetros de medias móviles, por lo que la identificación de los modelos requiere el uso de algún supuesto adicional. Requisito Canónico: se maximiza la varianza del componente irregular, especificando los otros componentes de forma que, estén libres de ruido blanco, ortogonal a ellos. Técnicas avanzadas de series temporales 26 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ASIGNACIÓN DE RAÍCES AUTORREGRESIVAS A LOS DISTINTOS COMPONENTES φ ( L) = φ r ( L)φ s ( Ls )Δd ΔD s Δd = (1 − L) d → Tendencia ΔD = (1 − L) D → Tendencia U11 = (1 + L + L2 + " + L11 ) → Estacional Raíces de φr(L): • Raíces reales positivas • Si el módulo es >=k, se asignan al ciclo-tendencia • Si el módulo s < k, se asignan al componente transitorio. • Raíces reales negativas • Si el módulo es >=k, se asigna al componente estacional. • Si el módulo es <k, se asigna al componente transitorio. • Raíces complejas: sea w la frecuencia de la raíz • Si w está alrededor de una frecuencia estacional, se asigna al componente estacional. • De otra forma se asigna al componente transitorio. Técnicas avanzadas de series temporales 27 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. Raíces de φs(Ls): Sea φ la raíz real positiva del polinomio inverso. • Si φ >=k, la raíz (1-fL) se asocia a la tendencia, y las s-1 restantes al componente estacional. • Si φ<k, las raíces se asignan al componente transitorio. De esta forma: φ ( L) = φTendencia ( L)φEstacional ( L)φTransitorio ( L) El orden de los polinomios de medias móviles se obtienen mediante razonamientos técnicos en función del orden de los polinomios AR y MA originales Técnicas avanzadas de series temporales 28 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. MODELOS PARA LOS COMPONENTES φTend ( L)TENDTend ,t = θ Tend ( L)aTend ,t φ Estac ( L)ESTAC Estac ,t = θ Estac ( L)aEstac ,t φTrans ( L)TRANSTrans ,t = θ Trans ( L)aTrans ,t ut = ruido blanco(0,ν ) Una vez que los modelos para los componentes han sido especificados, si se dispone de una realización completa de la serie observada X1, X2, ..., Xn, el estimador del componente i con error cuadrático medio mínimo (ECMM) se calcula utilizando el filtro de Wiener-Kolmogorov (Whittle, 1963 y Bell, 1984). La disponibilidad de modelos explícitos permiten realizar inferencias sobre los resultados de la descomposición. 29 Técnicas avanzadas de series temporales Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. ESPECTRO DE UN MODELO DE LÍNEAS AÉREAS TRIMESTRAL Y DE SUS COMPONENTES Tendencia Proceso original Estacional Ruido Blanco Técnicas avanzadas de series temporales 30 Dpto. de Estadística ,Estr.Eca.y O.E.I. Universidad de Alcalá de Henares. TRATAMIENTO DE LOS ELEMENTOS DETERMINISTAS EN LA EXTRACCIÓN DE SEÑALES 1) PREAJUSTE: Consiste en la previa corrección o ajuste de: • Atípicos • Efecto calendario • Variables de intervención. 2) ASIGNACIÓN A LOS COMPONENTES: • El efecto calendario se asocia al componente estacional • Los atípicos aditivos y transitorio se asocian con el componente irregular. • Los típicos cambio de nivel se asocian a l componente ciclo-tendencia Técnicas avanzadas de series temporales 31