Series de tiempo Estadı́stica Miguel Ángel Chong R. [email protected] 7 de mayo del 2013 Miguel Chong Series de tiempo Modelos no estacionarios Como dijimos al inicio del curso, cuando tenemos una serie de tiempo observada y graficamos los datos, es posible que notemos que la serie no sea estacionaria, entonces es deseable aplicar alguna trasformación a los datos para hacerlos estacionarios. Si en nuestra serie observada solo se aprecia un compontente de tendencia (media no constante) Xt = mt + Yt , ésta puede eliminarse mediante la aplicación del operador diferencia rd = (1 B)d , con esto buscamos eliminar una tendencia polinomial de orden d en la serie, este tipo de trasformación da origen a los modelos integrados o ARIMA. Miguel Chong Series de tiempo Definición Procesos ARIMA(p,d,q) (causales e invertible) Sea d 2 {1, 2, 3, . . .}. Diremos que {Xt }t2T es un proceso ARIMA(p, d, q) causal e invertible si al diferenciarlo d veces, es decir, Yt = rd Xt = (1 B)d Xt tenemos un proceso ARMA(p, q) causal e invertible. Dicho de otro modo, si {Xt } es un proceso ARIMA(p, d, q) se escribe de la siguiente forma ⇤ 1 1B 2B 2 (B)Xt ... = pB p (1 B)d Xt = p (B)(1 B)d Xt p (B)Yt = = ✓q (B)✏t , 1 + ✓1 B + ✓2 B 2 + . . . + ✓q B q ✏t , ✓q (B)✏t , donde {✏t } es ruido blanco, p (B) y ✓q (B) son los polinomios de retraso de grado p y q respectivamente. Miguel Chong Series de tiempo Observaciones 1 El polinomio ⇤ (B) = p (B)(1 B)d tiene una raı́z de orden d cuando B = 1, o tiene una raı́z unitaria. 2 El proceso es estacionario si solo si d = 0 y ARIMA(p, 0, q) = ARMA(p, q). 3 Aunque los modelos ARIMA(p, d, q) son muy usados para modelar series con tendencia, también pueden ser usados para modelar series sin tendencia. 4 La estimación de los parámetros = ( 1 , 2 , . . . , p ) , ✓ = (✓1 , ✓2 , . . . , ✓q ) y ✏2 se harán con respecto el proceso estacionario (1 B)d Xt . Miguel Chong Series de tiempo Ejemplo Si {Xt } es un proceso ARIMA(1, 1, 1) causal e invertible donde 2 ( 1, 1) y ✓ 2 ( 1, 1) (1 B)(1 (1 donde Yt = (1 invertible. B)Xt B)Yt = (1 + ✓B)✏t , = (1 + ✓B)✏t , B)Xt es un proceso ARMA(1, 1) causal e Miguel Chong Series de tiempo Modelos puramente estacionales Ahora nuestro objetivo es poder describir series de tiempo que tengan además1 una componente estacional, Xt = St + Yt ó Xt = mt + St + Yt . donde la parte estacional {St } se repite en forma “determinı́stica” en un periodo de tamaño s. Primero vamos a hablar de los modelos estacionales puros, la idea en estos modelos es que sólo existe una dependencia entre las observaciones que están separadas un multiplo de s. 1 Con o sin un compontente de tendencia mt . Miguel Chong Series de tiempo Por ejemplo, si tenemos una serie mensual y el periodo del cı́clo s = 12 Meses Años 1 2 3 ... 11 12 1 X1 X2 X3 ... X11 X12 2 .. . X13 .. . X14 .. . X15 .. . ... .. . X23 .. . X24 .. . r 1 r X12(r 2)+1 X12(r 2)+2 X12(r 2)+3 ... X12(r 2)+11 X12(r 1)+1 X12(r 1)+2 X12(r 1)+3 ... X12(r 1)+11 X12(r X12r Es importante notar que aunque la estacionaridad se puede considerar como un fenómeno anual, puede existir un comportamiento periodico con duración menor a un año2 . 2 Semestral o trimestral por ejemplo. Miguel Chong Series de tiempo 1) Definición Diremos que {Xt }t2T es un proceso auto regresivo-medias moviles estacional puro con periodo s de orden (P, Q), y lo denotamos ARMA(P, Q)s donde P, Q 0 y 1 , . . . , P , ⇥1 , . . . , ⇥Q . son reales tales que Xt = 1 Xt s + ... + P Xt Ps +✏t + ⇥1 ✏t s + . . . + ⇥Q ✏t Qs , o equivalentemente 1 1B s ... pB Ps P (B s Xt = )Xt = 1 + ⇥1 B s + . . . + ⇥Q B Qs ✏t ⇥Q (B s )✏t , donde {✏t }t es ruido blanco y los polinomios de retraso tienen ceros en común. P (·) y ⇥Q (·) no Para que el proceso ARMA(P, Q)s sea causal e invertible necesitamos que las raı́ces de los polinomios P (·) y ⇥Q (·) sean en módulo mayores a la unidad. Miguel Chong Series de tiempo Algunos ejemplos de este tipo de procesos son: 1 2 3 ARMA(0, 1)s = MA(1)s , de la forma Xt de autocorrelación está dada por 8 > 1 > < ⇥1 h ⇢h = = 1 + ⇥21 > 0 > : 0 = ✏ t + ⇥ 1 ✏t s, donde la función h=0 si h = s cualquie otro caso. ARMA(1, 0)s = AR(1)s , es decir, Xt = 1 Xt s + ✏t , donde la función de autocorrelación está dada por 8 > <1 h h = 0 h s ⇢h = = si h = s, 2s, 3s, . . . 1 > 0 : 0 cualquie otro caso ARMA(1, 1)s , de la forma Xt = 1 Xt s + ✏t autocorrelación está dada por 8 > 1 > > > (1+ 1 ⇥1 )(⇥1 + 1 ) < h 1+⇥21 +2⇥1 1 ⇢h = = > 0 > 1 > ⇢h s > : 0 Miguel Chong + ⇥ 1 ✏t s, y la función de h=0 h=s si h = 2s, 3s, . . . cualquie otro caso Series de tiempo Modelos estacionales multiplicativos y estacionarios En la mayor parte de los casos los datos no sólo están correlacionados con observaciones que están separadas por un múltiplo de s, sino que también pueden estar correlacionados con observaciones más cercanas. A continuación definiremos una familia de modelos que combinen efectos estacionales y no estacionales. Definición Diremos que {Xt }t es un proceso estacional multiplicativo, con periodo s, y lo denotamos como ARMA(p, q)⇥ARMA(P, Q)S si el proceso se escribe como p (B) P (B s )Xt = ✓q (B)⇥Q (B s )✏t , donde {✏t }t es ruido blanco y los polinomios de retraso son los siguientes: p ··· p (z) = 1 1B pB , s Ps ··· P (z) = 1 1B PB , q ✓q (z) = 1 + ✓1 B + · · · + ✓q B , ⇥Q (z) = 1 + ⇥1 B s + · · · + ⇥Q B Qs . Miguel Chong Series de tiempo Modelos estacionales no estacionarios Si tenemos una serie de la forma Xt = mt + St + Yt , vimos que vı́a difierencias simples rd = (1 B)d podı́amos eliminar la componente mt y hablamos del uso de la diferencia estacional rD B s )D , para eliminar la componente s = (1 St . Estos los operadores los usaremos para describir el modelo más general, es decir, una serie que tiene tanto una componente de tendencia como el de una parte estacional. Definición Sean d, D 2 Z enteros no negativos. Diremos que {Xt }t es un proceso auto-regresivo de promedios moviles integrado estacional multiplicativo de periodo s, denotado por ARIMA(p, d, q) ⇥ ARIMA(P, D, Q)s o SARIMA(p, d, q) ⇥ (P, D, Q)S si el proceso Yt = (1 ⇣ B)d 1 BS ⌘D Xt , es un proceso ARMA(p, q) ⇥ ARMA(P, Q)S causal p (B) P (B donde {✏t }t es ruido blanco. s )Yt Miguel Chong = ✓q (B)⇥Q (B s )✏t , Series de tiempo 1 Identifica el modelo SARIMA(p, d, q) ⇥ (P, D, Q)S 1 0.8B + 0.25B 2 rr12 Xt = Xt 2 1 = (1 + 0.2B) 1 Cómo se ve la ecuación de los modelos 1 2 SARIMA(1, 0, 2) ⇥ (0, 1, 1)3 , SARIMA(1, 1, 2) ⇥ (2, 1, 1)2 , Miguel Chong 0.7B 2 Series de tiempo 1 0.5B 12 ✏t , 0.8B 8 ✏t . Metodologı́a de Box-Jenkins para modelos ARIMA estacionales Etapa de identificación de los órdenes p, d, q, P, D y Q. Una vez que hemos introducido una familia de proceso nuestro objetivo será, dada una serie de tiempo observada {xt }N t=1 , encontrar un(os) modelo( de esa familia del cual podamos suponer que nuestra serie observada sea un elemento muestral. Usando el principio de parsimonia, es decir usar el modelo con el menor número de parámetros posibles. Etapa 1 Identificación de los parámetros d,D,p,P,q y Q No Etapa 2 Estimación de los coeficientes Etapa 3 Verificación de los supuestos El modelo cumple con los supuestos sí Usar el modelo para hacer predicción Miguel Chong Series de tiempo Identificación del modelo, esta parte la podemos dividir en dos partes: 1 Buscamos la estructura no estacionaria (si es que la hay), es decir filtrar la parte de tendencia y/o parte estacional, para quedarnos con la parte estacionaria. 2 Una vez obtenida la parte estacionaria buscarémos cuál es el modelo ARMA que mejor ajusta esta parte. En otras palabras buscamos encontrar una transformación de los datos originales de tal forma que obtengamos una serie estacionaria. Aquı́ tenemos dos posibles tipos de trasformaciones posibles Miguel Chong Series de tiempo Cuando graficamos la serie de tiempo observada y notamos que la varianza no es constante, una forma de corregir este problema es aplicar una transformación del tipo Box Cox a los datos, es decir ( Xt 1 si 6= 0 T (Xt ) = . log (Xt ) si = 0 Cuando graficamos la serie de tiempo observada y notamos que no tiene una media costante es recomendable aplicarle el operador diferencia r; anteriormente habı́amos platicado que el operador diferencia eliminaba tendencias lineales, mt = a0 + a1 t, y que el operador diferenica aplicado dos veces, r2 , elimina tendencias cuadráticas, mt = a0 + a1 t + a2 t 2 . En la práctica no hacen falta diferenciar más de dos veces una serie para quitarle el componente de tendencia. Algunas veces las series de tiempo veces presentan un componente estacional St con periodo s, esto lo podemos notar de manera gráfica a partir de la acf muestral, ya que las autocorrelaciones son muy significativa en los lag�s s, 2s, 3s, 4s, . . . y decrece de manera lenta. En estos casos es aconsejable aplicarle a la serie una diferencia estacional rs = (1 B s ), no es común que se requiera aplicar una diferencia más de una vez. Miguel Chong Series de tiempo 1 2 3 Encontrar d y D tal que la serie Yt = (1 B)d (1 B s )D T (Xt ) tenga aspecto estacionario. Notemos que la serie la serie de tiempo original Xt corre de los ı́ndices t 2 {1, 2, . . . , n}, mientras que la serie estacionaria Yt corre de los ı́ndices t 2 {d + sD + 1, . . . , n}. Examinar la ACF y la PACF muestrales asociadas a {Yt }t para aquellos enteros que son multiplos de s, (identificar los ordenes de P y Q del modelo). Si ⇢b(·) y ˆk k son la ACF y la PACF muestral respectivamente de la serie {Yt }t , entonces P y Q pueden seleccionarse de forma tal que, ⇢b(ks) y ˆsk sk con k = 1, 2, . . .sea compatible con la ACF y la PACF teóricas del modelo ARMA(P, Q)s . Los ordenes de p y q deben ser seleccionados de forma tal que: ⇢b(1), . . . , ⇢b(s 1) sea complatible con la ACF teorica y ˆ1 1 , . . . , ˆs 1 s 1 sea complatible con la PACF la teórica de un proceso ARMA(p, q). En las aplicaciones es usual que d 2 {0, 1, 2} y D 2 {0, 1}. Miguel Chong Series de tiempo