Extracción de los componentes a partir de los modelos ARIMA

Anuncio
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
TÉCNICAS DE EXTRACCIÓN DE SEÑALES
-Algunas consideraciones finales sobre los modelos ARIMA
-Introducción al análisis espectral de series temporales
-Métodos de extracción de señales basados en el modelo
ARIMA de la serie original
Gran parte del contenido de esta sección y un buen número de gráficos
presentados se han tomado del artículo de Regina Kaiser y Agustín Maravall,
(2000) “Notes on Time Serie Analysis, ARIMA Models and Signal Extraction”
Documento de Trabajo 00-12. Servicio de Estudios, Banco de España.
(Disponible en internet en www.bde.es)
Técnicas avanzadas de series temporales
1
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ALGUNAS REFLEXIONES SOBRE LOS MODELOS
ARIMA
- La PARSIMONIA en el número de parámetros SIEMPRE debe estar
presente en la formulación del modelo ARIMA
p, q ≤ 4, P ≤ 1, Q ≤ 2, d ≤ 2, D ≤ 1
- Los modelos ARIMA son una herramienta útil en el análisis a corto plazo.
- su flexibilidad y capacidad de adaptación contribuyen a su buen
comportamiento en la predicción a corto plazo.
- La extrapolación al largo plazo de esta flexibilidad puede resultar
inestable.
- Como regla general, para el análisis a corto plazo se recomienda
diferenciar, mientras que para el análisis a largo plazo puede ser preferible
incluir factores deterministas.
Técnicas avanzadas de series temporales
2
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ESPECIFICACIÓN DETERMINISTA VS.
DIFERENCIACIÓN
(a)
X t = μ + at
(b) ΔX t = (1 − 0.99 L)at
- En muestras finitas es IMPOSIBLE distinguir entre estos dos modelos.
- El modelo (a) necesita estimar un parámetro, mientras que el modelo
(b) pierde una observación.
- El modelo (b) es más flexible que el modelo (a) puesto que se puede
escribir de la forma:
X t = μ ( t ) + at
donde μ(t) es una media que se adapta lentamente en el tiempo.
Técnicas avanzadas de series temporales
3
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
3
(c )
X t = μ + ∑ β j d jt +at
j =1
(d ) Δ 4 X t = (1 − 0.95 L4 )at
- En muestras finitas es IMPOSIBLE distinguir entre estos dos modelos.
- El modelo (c) necesita estimar cuatro parámetros, mientras que el
modelo (d) pierde cuatro observaciones.
- El modelo (d) es más flexible que el modelo (c) puesto que se puede
escribir de la forma:
Xt = μ
3
(t )
+ ∑ β (j t ) d jt +at
j =1
donde μ(t) y βj(t) se adaptan lentamente en el tiempo.
Técnicas avanzadas de series temporales
4
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Reflexiones:
- Desde una perspectiva de corto plazo, no hay razón para mantener la
dicotomía y los rasgos deterministas se pueden entender como rasgos
estocásticos extremadamente estables.
- Además los contrastes de raíces unitarias presentan baja potencia para
distinguir entre los modelos (a), (b), (c ) y (d).
- El verdadero tamaño del contraste es desconocido cuando se incluyen
variables artificiales.
- En la práctica algunos programas automáticos (TRAMO) estiman los
parámetros asociados a raíces unitarias y basan su decisión sobre
diferenciar o no en la proximidad del mismo a la unidad.
- Los procedimientos automáticos (TRAMO) basan la selección del orden
de los polinomios autorregresivos y de medias móviles en criterios de
ajuste, reduciendo la importancia de la identificación a partir de
correlogramas.
Técnicas avanzadas de series temporales
5
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
MODELO DE LAS LÍNEAS AÉREAS
ΔΔ s X t = (1 − θ1 L)(1 − θ s Ls )at
• Es un modelo balanceado
• Si el parámetro de medias móviles regular θ1 tiende a 1, el
comportamiento de la tendencia es muy estable.
• Si el parámetro de medias móviles estacional θ12 tiende a 1 pueden
ocurrir dos cosas:
• La estacionalidad es prácticamente determinista ó
• No hay estacionalidad y el modelo está sobrediferenciado.
La distinción entre ambos es sencilla contrastando la
significatividad de las variables estacionales.
Técnicas avanzadas de series temporales
6
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
COMPORTAMIENTOS PERIÓDICOS
Las raíces complejas generan comportamientos periódicos del tipo.
A t cos( wt + B )
Donde A denota la
amplitud, B la fase (el
ángulo en t=0), y w la
frecuencia (el número
de círculos completos
en una unidad de
tiempo.
Período = T =
2π
w
Técnicas avanzadas de series temporales
7
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Ejemplo: (1-0.46L+0.25L2)
G1 , G2 = 0.23 ± 0.44i
Módulo=0.50
= 0.232 + 0.44 2
0.44
Ángulo=1.09 radianes
0.23
Período= 5.77
Técnicas avanzadas de series temporales
8
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
DESCOMPOSICIÓN DEL POLINOMIO Δ12
Δ12 = (1 − L12 ) = (1 − L)(1 + L)(1 + L2 )(1 + 3L + L2 )(1 − 3L + L2 )(1 + L + L2 )(1 − L + L2 )
Operador
Raíces
(1 − L)
(1 − L)
1
-1
±i
(1 + L2 )
Frecuencia
Período
Radianes Meses
0
0
∞
π
6
2
π /2
3
4
5π / 6
5
12/5
(1 − 3L + L2 )
(− 3 ± i) / 2
(1 + 3L + L2 )
(− 3 ± i) / 2
π /6
1
12
(1 − L + L2 )
( −1 ± i 3 ) / 2
2π / 3
4
3
(1 + L + L2 )
(1 ± i 3 ) / 2
π /3
2
6
Todas las raíces son de módulo unidad.
En el operador se combinan diferentes estructuras cíclicas no estacionarias,
cada una de las cuales corresponde a una determinada frecuencia estacional
Técnicas avanzadas de series temporales
9
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
DESCOMPOSICIÓN DEL POLINOMIO Δ4
Δ 4 = (1 − L4 ) = (1 − L)(1 + L)(1 + L2 )
Operador
(1 − L)
(1 − L)
(1 + L2 )
Raíces
1
-1
±i
Frecuencia
Período
Radianes Meses
0
0
∞
π
6
2
π /2
3
4
Todas las raíces son de módulo unidad.
En el operador se combinan diferentes estructuras cíclicas no estacionarias,
cada una de las cuales corresponde a una determinada frecuencia estacional
Técnicas avanzadas de series temporales
10
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
INTRODUCCIÓN AL ANÁLISIS ESPECTRAL
Técnicas avanzadas de series temporales
11
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
• El ESPECTRO es un modo alternativo de analizar e interpretar la
información de los momentos de segundo orden de las series.
• Es particularmente útil para analizar componentes no observados
como la tendencia, estacionalidad o ciclos.
• El espectro es la herramienta básica en el denominado ANÁLISIS
EN EL DOMINIO DE LAS FRECUENCIAS.
• El análisis espectral se basa en la Teoría de Fourier.
• T valores se pueden duplicar exactamente mediante:
• Un polinomio de orden T-1 ó
• La suma de T/2 funciones sinusoidales.
Esta segunda opción es la base del análisis de Fourier.
Técnicas avanzadas de series temporales
12
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Cada una de las sinusoidales
representada en su correspondiente
frecuencia
Espectro=amplitud vs. frecuencia
Técnicas avanzadas de series temporales
13
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Ejemplo: 10 observaciones están generadas por 5 funciones
coseno que a su vez se pueden escribir como suma de senos y
cosenos
T /2
X t = ∑ rjt
j =1
con rjt = a j cos w j t + b j sen w j t
• aj y bj están relacionadas con
la AMPLITUD
A2j = a 2j + b 2j
• wj es un múltiplo de la
frecuencia fundamental w=2π/T
Técnicas avanzadas de series temporales
14
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
• El PERIODOGRAMA es el gráfico de Aj2 versus wj con las wj
agrupadas en intervalos.
• El ESPECTRO es la versión continua del periodograma.
• El área bajo la curva muestra la
contribución de las frecuencias a
la variabilidad de la serie.
• El gráfico entre 0 y 2π es
simétrico alrededor de π, por eso
sólo se muestra en el intervalo
0,π
Técnicas avanzadas de series temporales
15
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Ejemplo e introducción del componente estocástico
2
Evolución del proceso zt+0.81zt-2=0
1
0
1
-1
6
11
16
21
26
Su ecuación característica presenta raíces
complejas de frecuencia π/2
-2
Su espectro muestra un pico en la
única frecuencia que aporta variación
Si a la misma ecuación se le añade un
componente estocástico zt+0.81zt-2=at
la variabilidad se extiende por las
frecuencias cercanas.
Si la varianza de at aumenta, el
espectro refleja este efecto.
16
Técnicas avanzadas de series temporales
Cuanto mayor es la varianza del componente estocástico, el componente es menos estable
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
- si una serie contiene un componente importante en una cierta frecuencia,
su espectro debería mostrar un pico en dicha frecuencia
- existe una relación directa entre el espectro y la función de
autocovarianzas:
[
]
g ( w) = γ 0 + 2∑ j γ j cos jw Va
Técnicas avanzadas de series temporales
17
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ALGUNOS ESPECTROS
Ruido Blanco:
Su espectro es constante (todas
sus autocovarianzas son 0)
MA(1)
[
]
g ( w) = 1 + θ 2 + 2θ cos w Va
Técnicas avanzadas de series temporales
18
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
AR(1)
AR(2)
[
]
−1
g ( w) = 1 + φ + 2φ cos w Va
2
• Si las raíces son reales, sus efectos
son los correspondientes a dos
procesos AR(1)
• Si son complejas, el espectro
mostrará un pico en la frecuencia w.
φ>0
φ<0
Técnicas avanzadas de series temporales
19
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ASOCIACIÓN DE FRECUENCIAS EN EL ESPECTRO
• Tendencia: máximo en la frecuencia 0
• Estacionalidad: máximos en las frecuencias estacionales
• Cíclico: máximo en el rango de frecuencias cíclicas: [0.05π, 0.33π] que
corresponden a un período entre 2 y 12 años
Técnicas avanzadas de series temporales
20
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
TÉCNICAS DE EXTRACCIÓN DE SEÑALES
Técnicas avanzadas de series temporales
21
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
FILTROS LINEALES Y SU GANANCIA CUADRÁTICA
Un filtro lineal es una combinación lineal de la serie Xt de la forma:
Yt = c− k1 X t − k1 + " + c−1 X t −1 + c0 X t + c1 X t +1 + " + ck 2 X t + k 2
• Yt es una media móvil de observaciones Xt.
• Los pesos cj se deben encontrar de forma que capten las variaciones
relevantes asociadas con el componente de interés
• Un filtro para la tendencia captará la variación asociada con los
movimientos de largo plazo y un filtro para el componente estacional
capturará la variación de naturaleza estacional.
• Si k1=k2 es un filtro simétrico
• Los valores futuros son sustituidos por predicciones, lo que hace
necesario:
• Un modelo para el cálculo de las predicciones
• Revisiones de los valores de los componentes ya publicados, según
aparece la nueva información
Técnicas avanzadas de series temporales
22
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
TERMINOLOGÍA
• Valor definitivo o estimador definitivo: cuando el filtro utiliza
exclusivamente valores verdaderos de la variable observada.
• Valor condicional o estimador condicional: cuando debido a la falta
de información se sustituyen valores desconocidos por predicciones.
• Valor concurrente o estimador concurrente: es un caso particular
del estimador condicional, cuando sólo se dispone de observaciones
de la variable agregada hasta el mismo momento para el que se
quiere estimar la señal.
• Revisión o actualización: es el proceso por el cual se sustituyen las
predicciones por los valores observados a medida que éstos se van
conociendo.
• Error de revisión: es la diferencia entre el valor definitivo y un valor
condicional.
Técnicas avanzadas de series temporales
23
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
MÉTODOS BASADOS EN EL MODELO ARIMA DE LA SERIE
ORIGINAL
En un modelo de componentes inobservados, la serie observada Xt se puede
expresar como la suma de componentes ortogonales:
k
X t = ∑ xit ,
i =1
de forma que x1t, x2t, ..., xkt son los k componentes inobservados. Cada uno de los
componentes puede expresarse como un proceso ARIMA, de forma que,
φi ( L) xit = θ i ( L)ati
donde φi(L) y θi(L) son polinomios finitos en L de órdenes pi y qi, respectivamente,
que pueden contener raíces unitarias, y ai son variables ortogonales de ruido blanco
con varianzas Vi. Se supone que las raíces de los polinomios autorregresivos son
diferentes para cada componente, y que φi(L) y θi(L) no comparten raíces.
Técnicas avanzadas de series temporales
24
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Combinando las ecuaciones, se obtiene que,
θ i ( L) i
at
φ
(
)
L
i =1 i
k
Xt = ∑
El modelo ARIMA (invertible) para Xt viene dado por:
φ ( L) X t = θ ( L)at
Con lo que,
k
φ ( L ) = ∏ φi ( L )
i =1
k
θ ( L) = ∑ θ i ( L)φni ( L)ati
i =1
donde φni(L) es el producto de todos los polinomios AR excepto φi(L)
Técnicas avanzadas de series temporales
25
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
IDENTIFICACIÓN DE LOS PARÁMETROS
Los parámetros AR en los modelos para los componentes
inobservados se pueden obtener a partir del polinomio AR en la serie
observada. Pero existe un número infinito de posibles especificaciones
para los parámetros de medias móviles, por lo que la identificación de
los modelos requiere el uso de algún supuesto adicional.
Requisito Canónico: se maximiza la varianza del componente irregular,
especificando los otros componentes de forma que, estén libres de ruido
blanco, ortogonal a ellos.
Técnicas avanzadas de series temporales
26
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ASIGNACIÓN DE RAÍCES AUTORREGRESIVAS A LOS DISTINTOS
COMPONENTES
φ ( L) = φ r ( L)φ s ( Ls )Δd ΔD
s
Δd = (1 − L) d → Tendencia
ΔD = (1 − L) D → Tendencia
U11 = (1 + L + L2 + " + L11 ) → Estacional
Raíces de φr(L):
• Raíces reales positivas
• Si el módulo es >=k, se asignan al ciclo-tendencia
• Si el módulo s < k, se asignan al componente transitorio.
• Raíces reales negativas
• Si el módulo es >=k, se asigna al componente estacional.
• Si el módulo es <k, se asigna al componente transitorio.
• Raíces complejas: sea w la frecuencia de la raíz
• Si w está alrededor de una frecuencia estacional, se asigna al
componente estacional.
• De otra forma se asigna al componente transitorio.
Técnicas avanzadas de series temporales
27
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
Raíces de φs(Ls): Sea φ la raíz real positiva del polinomio inverso.
• Si φ >=k, la raíz (1-fL) se asocia a la tendencia, y las s-1 restantes al
componente estacional.
• Si φ<k, las raíces se asignan al componente transitorio.
De esta forma:
φ ( L) = φTendencia ( L)φEstacional ( L)φTransitorio ( L)
El orden de los polinomios de medias móviles se obtienen mediante
razonamientos técnicos en función del orden de los polinomios AR y MA
originales
Técnicas avanzadas de series temporales
28
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
MODELOS PARA LOS COMPONENTES
φTend ( L)TENDTend ,t = θ Tend ( L)aTend ,t
φ Estac ( L)ESTAC Estac ,t = θ Estac ( L)aEstac ,t
φTrans ( L)TRANSTrans ,t = θ Trans ( L)aTrans ,t
ut = ruido blanco(0,ν )
Una vez que los modelos para los componentes han sido especificados,
si se dispone de una realización completa de la serie observada X1, X2,
..., Xn, el estimador del componente i con error cuadrático medio mínimo
(ECMM) se calcula utilizando el filtro de Wiener-Kolmogorov (Whittle,
1963 y Bell, 1984).
La disponibilidad de modelos explícitos permiten realizar inferencias
sobre los resultados de la descomposición.
29
Técnicas avanzadas de series temporales
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
ESPECTRO DE UN MODELO DE LÍNEAS AÉREAS TRIMESTRAL
Y DE SUS COMPONENTES
Tendencia
Proceso
original
Estacional
Ruido Blanco
Técnicas avanzadas de series temporales
30
Dpto. de Estadística ,Estr.Eca.y O.E.I.
Universidad de Alcalá de Henares.
TRATAMIENTO DE LOS ELEMENTOS DETERMINISTAS EN LA
EXTRACCIÓN DE SEÑALES
1) PREAJUSTE: Consiste en la previa corrección o ajuste de:
• Atípicos
• Efecto calendario
• Variables de intervención.
2) ASIGNACIÓN A LOS COMPONENTES:
• El efecto calendario se asocia al componente estacional
• Los atípicos aditivos y transitorio se asocian con el componente
irregular.
• Los típicos cambio de nivel se asocian a l componente ciclo-tendencia
Técnicas avanzadas de series temporales
31
Descargar