Análisis clásico de series temporales Profesor: Antonio Caparrós Ruiz 1 Análisis clásico de series temporales 1. Introducción Hasta ahora nos hemos ubicado en el campo de la Econometría causal, es decir, una variable dependiente es explicada y predicha por su relación con k variables explicativas: Yt = β1 + β2*X2t + ...+ βk*Xkt + ut Este tipo de análisis conlleva una serie de problemas: 1) La ausencia de una teoría que justifique las posibles variables explicativas que se han de introducir en el modelo. 2) Las predicciones de la variable Y se basan en predicciones de las X’s. Por estas razones surge el análisis clásico de series temporales que permite realizar predicciones de la variable con la única información procedente del pasado de la misma. 2. Componentes de una serie temporal Una serie temporal puede descomponerse en las siguientes cuatro fluctuaciones: a) Tendencia de larga duración o secular (Tt): Recoge el movimiento de la variable a largo plazo, debido a cambios demográficos, tecnológicos o institucionales. Ejemplos de variables con tendencia 1) Gasto público en becas en España 500000 450000 400000 350000 Niveles no universitarios 300000 250000 Niveles universitarios 200000 150000 100000 50000 0 2006 2004 2002 2000 1998 1996 1994 1992 2 2) Paro registrado en España 4500000 4000000 3500000 3000000 2500000 2000000 1500000 1000000 2010M01 2009M05 2008M09 2008M01 2007M05 2006M09 2006M01 2005M05 2004M09 2004M01 2003M05 2002M09 2002M01 2001M05 2000M09 2000M01 1999M05 1998M09 1998M01 1997M05 1996M09 0 1996M01 500000 3) Número de matrimonios 300000 250000 200000 150000 100000 50000 2007 2005 2003 2001 1999 1997 1995 1993 1991 1989 1987 1985 1983 1981 1979 1977 1975 0 b) Movimiento oscilatorio o cíclico Recoge las fluctuaciones originadas por el ciclo económico, que pueden durar entre 4 y 8 años. Ejemplo Componente cíclico de los ocupados en el sector turístico 6 4 2 0 -2 -4 99 00 01 02 España 03 04 05 06 07 Andalucía 3 c) Fluctuaciones estacionales (Et): Son movimientos que se presentan con una periodicidad inferior al año, mes, trimestre, cuatrimestre,...Y suelen ser repetitivas mostrando el efecto de la climatología, la estructura productiva o festividades. Ejemplo. Serie de índice del comercio al por menor 180 160 140 120 100 80 60 40 20 2008M05 2007M07 2006M09 2005M11 2005M01 2004M03 2003M05 2002M07 2001M09 2000M11 2000M01 1999M03 1998M05 1997M07 1996M09 1995M11 1995M01 0 d) Variaciones irregulares (It): Muestra aquellos factores asociados al muy corto plazo y que quedan fuera del control del analista. Dentro de este componente también denominado residual, se encuentran aquellos factores inusuales, pero fácilmente reconocibles como una catástrofe natural. Ejemplo Serie de licitaciones de los ayuntamientos de superficies industriales 1600 1400 1200 1000 800 600 400 200 2009M07 2008M06 2007M05 2006M04 2005M03 2004M02 2003M01 2001M12 2000M11 1999M10 1998M09 1997M08 1996M07 1995M06 1994M05 1993M04 1992M03 1991M02 1990M01 0 4 Ejemplo de descomposición de una serie en componentes PARO TENDENCIA 4500000 4500000 4000000 4000000 3500000 3500000 3000000 3000000 2500000 2500000 2000000 2000000 1500000 1500000 1996 1998 2000 2002 2004 2006 2008 2010 1996 1998 2000 2002 2004 2006 2008 2010 IRREGULAR 80000 ESTACIONALIDAD 150000 60000 100000 40000 50000 20000 0 0 -20000 -50000 -40000 -100000 -60000 -150000 -80000 1996 1998 2000 2002 2004 2006 2008 2010 1996 1998 2000 2002 2004 2006 2008 2010 CICLO 300000 200000 100000 0 -100000 -200000 -300000 1996 1998 2000 2002 2004 2006 2008 2010 Dado que los componentes de una serie no se observan aisladamente, se necesita aplicar hipótesis que representen el proceso generador de los datos: 1) Hipótesis aditiva: Yt = Tt + Ct + Et + It 1) Hipótesis multiplicativa: Yt = Tt * Ct * Et * It 2) Hipótesis mixta: Yt = Tt * Ct * Et + It 5 A nivel práctico hay que elegir entre uno u otro esquema. Hay que considerar que en la hipótesis aditiva los cuatro componentes son independientes, por ejemplo, la existencia de tendencia no condiciona el efecto de la estacionalidad; mientras que en la hipótesis multiplicativa, los elementos están interrelacionados entre sí. Así, la estacionalidad se agrega como un porcentaje de la tendencia y no como una cantidad independiente. Para concretar si la serie temporal sigue un esquema aditivo o uno multiplicativo, se debe analizar la amplitud del ciclo anual (componentes de la serie estacional). Si éste aumenta a medida que lo hace la tendencia (las ondas se agrandan), el modelo es multiplicativo. Si permanece constante es aditivo. Ejemplo 3. Componente estacional: Desestacionalización a) Evolución a medio y largo plazo de la variable Si el objetivo es conocer la evolución de la serie sin estacionalidad, es decir, su evolución a medio y a largo plazo, es necesario obtener su tasa de variación interanual. Así, dado Yt = Tt * Ct * Et * It, con datos trimestrales, se calcula la siguiente tasa: T14 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * Et * It)- ( Tt-4 * Ct-4 * Et-4 * It-4))/ ( Tt-4 * Ct-4 * Et-4 * It-4))*100] Si se supone estacionalidad estable Et = Et-4, entonces: T14 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * It)- ( Tt-4 * Ct-4 * It-4))/ ( Tt-4 * Ct-4 * It-4))*100] Con esta tasa el efecto estacional queda excluido 6 b) Desestacionalización b.1) Método de la razón a la media móvil Con este método se obtienen unos coeficientes que sintetizan en un único valor la estacionalidad para cada periodo temporal. Y a partir de ahí, poder obtener la serie desestacionalizada, es decir, la serie sin el componente estacional. El método supone que: * La serie ha sido generada bajo una hipótesis multiplicativa: Yt = Tt * Ct * Et * It * La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4 o Et=Et-12. 3) La tendencia y el ciclo se obtienen de forma conjunta. El objetivo del método es obtener una estimación de Et. Concretamente, el procedimiento consta de las siguientes partes: 1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles centradas: MMct = Tt * Ct. 2) Primera estimación del componente estacional e irregular (Et*It). Para ello se divide la serie original por MMct : Et*It= Yt / MMct A esta serie de valores se les denominan índices específicos o brutos de variación estacional y constituyen una primera aproximación del componente estacional. 3) Primera estimación del componente estacional: E’j . La diferencia entre los índices estacionales es debida a los factores irregulares. Estos se eliminan tomando la media aritmética para cada una de las fracciones del año. 4) Normalización de los coeficientes: E’j. La estacionalidad media en un esquema multiplicativo correponde a Et=1, para lograr que los índices estacionales tengan como media 1 se normalizan, y se obtienen los índices generales de variación estacional: IGVEj = Ej/ ΣEj/m; j=1,...,m 7 La serie desestacionalizada es Ydt,j= Yt,j / IGVEj. 5) Los IGVEj fluctúan por debajo y por encima de 1. Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01 Sample: 1996M01 2011M01 Included observations: 181 Ratio to Moving Average Original Series: PARO Adjusted Series: PAROSA Scaling Factors: 1 2 3 4 5 6 7 8 9 10 11 12 1.040337 1.043614 1.033282 1.013096 0.986780 0.970998 0.958699 0.967058 0.975154 0.993592 1.011023 1.011117 8 PARO 4500000 4000000 3500000 3000000 2500000 2000000 1500000 1996 1998 2000 2002 2004 2006 2008 2010 2006 2008 2010 2006 2008 2010 PAROSA 4400000 4000000 3600000 3200000 2800000 2400000 2000000 1600000 1996 1998 2000 2002 2004 IGVE 1.06 1.04 1.02 1.00 0.98 0.96 0.94 1996 1998 2000 2002 2004 * Interpretación de los IGVE: 1) (IGVEenero-1)*100 = (1.04-1)*100= 4% La estacionalidad del mes de enero provoca que el paro registrado crezca un 4% por encima de su valor medio anual. 2) (IGVEjulio-1)*100 = (0.95-1)*100= -5% La estacionalidad del mes de julio provoca que el paro registrado caiga un 5% por debajo de su valor medio anual. b.2) Método de la diferencia a la media móvil La hipótesis que subyacen tras este método son las siguientes: 1) La serie ha sido generada bajo una hipótesis aditiva: Yt = Tt + Ct + Et + It 2) La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4 (t es un trimestre) o Et=Et-12 (t es un mes). 9 3) La tendencia y el ciclo se obtienen de forma conjunta. El procedimiento consta de las siguientes partes: 1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles centradas: MMct = Tt + Ct. 2) Primera estimación del componente estacional e irregular (Et+It). Para ello se resta la serie original por MMct : Et+It= Yt - MMct A esta serie de valores se les denominan índices específicos o brutos de variación estacional y constituyen una primera aproximación del componente estacional. 3) Primera estimación del componente estacional: E’j. Bajo la hipótesis de estacionalidad estable, la diferencia entre los índices específicos o brutos de variación estacional es debida a los factores irregulares. Estos se eliminan tomando la media aritmética para cada una de las fracciones del año. 4) Posteriormente se normalizan los coeficientes E’j, para que la media de todos los índices valga 0, obteniéndose los IGVEj. Por ejemplo, si los datos son trimestrales: IGVE1= E’1 - 4 ∑ j =1 E 'j / 4 ; IGVE2= E’2 - 4 ∑ E 'j / 4 ; IGVE3= E’3 - j =1 4 ∑ E 'j / 4 ; IGVE4= E’4 - j =1 4 ∑E ' j /4 j =1 La serie desestacionalizada es Ydt,j= Yt,j - IGVEj. 5) Los IGVEj con la hipótesis aditiva fluctúan por encima y por debajo de 0. Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01 10 Sample: 1996M01 2011M01 Included observations: 181 Difference from Moving Average Original Series: PARO Adjusted Series: PAROSA Scaling Factors: 1 2 3 4 5 6 7 8 9 10 11 12 90308.63 101056.4 80600.01 35253.60 -26940.19 -67270.17 -101920.2 -79824.11 -59737.38 -16859.27 22189.82 23142.91 5000000 4000000 3000000 2000000 1000000 0 -1000000 1996 1998 2000 2002 2004 2006 2008 2010 PAROSA PARO IGVE IGVEenero= 90308. En el mes de enero, la estacionalidad provoca un aumento del paro registrado de 90308 individuos con respecto a su valor medio anual. IGVEjulio= -101920, en el mes de julio la estacionalidad provoca una caída del paro registrado de 101920 individuos. b.3) Método X11 Este método, al contrario que los dos anteriores, supone que el componente estacional varía de forma estocástica a lo largo del tiempo. De forma que arroja un índice estacional para cada periodo, además, permite introducir el efecto de las festividades sobre la variable. Se puede aplicar tanto con una hipótesis aditiva como multiplicativa. 11 Ejemplo 106 104 102 100 98 96 94 1996 1998 2000 2002 2004 2006 2008 2010 INDICES 150000 100000 50000 0 -50000 -100000 -150000 1996 1998 2000 2002 2004 2006 2008 2010 INDICES2 12 c) Variables ficticias estacionales. En este caso, las variables ficticias estacionales se incluyen en el modelo para recoger la característica de la estacionalidad para ello se crean variables de la siguiente forma: Dj,t ⎧⎨1 si t corresponde con el periodo j ( por ejemplo, mes o trimestre) ⎩0 en caso contrario Hay que recordar que para no incurrir en la trampa de las variables ficticias es necesario crear una categoría de referencia. En definitiva, la formulación del modelo econométrico sería la siguiente: Yt = β1 + M ∑β D j j ,t + ut j =2 Ejemplo Variable Ocupados : Indice de ocupación hotelera. Dependent Variable: OCUPADOS Method: Least Squares Sample: 2002M01 2010M01 Included observations: 97 Variable Coefficient Std. Error t-Statistic Prob. C @SEAS(2) @SEAS(3) @SEAS(4) @SEAS(5) @SEAS(6) @SEAS(7) @SEAS(8) @SEAS(9) @SEAS(10) @SEAS(11) @SEAS(12) 93.21111 1.201389 3.226389 6.163889 8.763889 10.18889 11.96389 11.58889 10.33889 7.338889 2.188889 1.513889 0.908864 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 1.324886 102.5578 0.906787 2.435220 4.652391 6.614824 7.690388 9.030126 8.747083 7.803606 5.539260 1.652134 1.142656 0.0000 0.3671 0.0170 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.1022 0.2564 Interpretación: Por ejemplo, en el mes de agosto la estacionalidad provoca un incremento por término medio del índice de ocupación de la hostelería de 11,58 unidades con respecto a enero. 13 Las variables ficticias correspondientes a los meses de febrero, noviembre y diciembre no son significativas, lo que significa que no presentan un comportamiento estacional diferente a la categoría de referencia que es enero. 4. Componente de tendencia-ciclo 4.1 Componente tendencia * Análisis de regresión A partir del análisis de regresión se pretende captar la tendencia de la variable. Consiste en considerar una función matemática que relacione a la variable Ydt con el tiempo (si los datos tienen una periodicidad inferior al año, la variable ha de estar desestacionalizada): Ydt = f(t) + ut Este método supone que los parámetros que definen la tendencia no cambian en el tiempo. A continuación se presentan diversos modelos de tendencia: a.1) Función lineal: Ydt = β1 + β2 t + ut, la variable t se puede construir dándole 1 al primer periodo y así sucesivamente. β2: Mide la variación absoluta que por término medio experimenta la variable Ydt al transcurrir un periodo, ya que: E(Yt-1) = β1 + β2 (t-1) E(Yt) = β1 + β2 t E(Yt) - E(Yt-1) = β2 * Predicción t t’ Ydt IGVEj . . . . 2011.01 15 Yd2011.01 IGVE1 2011.02 16 Yd2011.02 IGVE2 2011.03 17 Yd2011.03 IGVE3 14 Predicción para 2011:04 de Yt: - Hipótesis multiplicativa: ^d ^ Y 2011.04 = Y ^d donde: Y ^ 2011:04 2011.04 * IGVE4 ^ =β 1 +β 2 18 - Hipótesis aditiva: ^ ^d Y 2011.04 = Y 2011.04 + IGVE4 Ejemplo: 15 1) Primero se predice el componente de tendencia: ^ Pr eciosa 2011:02 = 18.51003 + 0.826893 * 74 = 79.70 2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando dependiendo de cómo sea la hipótesis planteada. En este caso, la hipótesis es multiplicativa. ^ Pr ecio 2011:02 = (18.51003 + 0.826893 * 74) * IGVE2 = 79.62 dolares a.2) Función polinómica: La expresión general es: Ydt = β1 + β2 t + β3 t2+ ...+ βp+1 tp + ut En la práctica uno de los valores para p más usuales es p=2, con lo que la expresión resultante es: Ydt = β1 + β2 t + β3 t2+ ut Este tipo de función es apropiada para la representación gráfica de una serie que presenta una tendencia curva, con una variación (crecimiento o decrecimiento), que no es constante si no que es función del periodo considerado. Así, si se supone que el modelo ya está estimado: 16 ^ d Y ^ t ^ =β 1 +β ^ 2 t+β t2 3 ^ ^ ^ ∂ Yt = β 2 +β 3 t ∂t * Predicción: Haciendo uso del ejemplo anterior: - Hipótesis multiplicativa: ^d ^ Y 2011:04 = Y donde ^d Y 2011:04 * IGVE4 ^ 2011.04 ^ ^ =β 1 +β 2 18 + β 3 18 2 - Hipótesis aditiva: ^ ^d Y 2011.04 = Y 2011.04 + IGVE4 Ejemplo 17 Predicción: 1) Primero se predice el componente de tendencia: ^ Pr eciosa 2011:02 = 19.89918 + 0.712716 * 74 + 0.001586 * 74 2 = 81.23 2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando dependiendo de cómo sea la hipótesis planteada, en este caso, hipótesis multiplicativa. ^ Pr eciosa 2011:02 = 1(9.89918 + 0.712716 * 74 + 0.001586 * 74 2 ) * IGVE2 = 81.23 dolares a.3) Función exponencial En ocasiones, el crecimiento de la variable no es moderado si no que parece seguir una ley exponencial, con un ritmo de variación de fuerte crecimiento o caída. En este caso la función de se adjunta es: Ydt = e(β1 + β2t +ut) Representación gráfica 6000 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 18 2 1,8 1,6 1,4 1,2 1 0,8 0,6 0,4 0,2 0 1 2 3 4 5 6 7 8 10 11 12 13 14 15 9 Para estimar la ecuación es necesario linealizarla: ln Ydt = β1 + β2 t + ut ^ Interpretación de β 2 : ^ ∂ Yt d ^ ^ * 100 = β 2 *100 Y td ^ β 2 * 100 es la variación en términos porcentuales que se produce en la variable dependiente cuando transcurre un periodo temporal. Para recuperar los valores ajustados de la variable original: ^ Yt d ^ =e ^ (β 1 + β 2 t + ∑ et2 ) 2T Ejemplo: Precio del barril Brendt (2002.01-2007.11). 100 90 80 70 60 50 40 30 20 10 2002 2003 2004 2005 2006 2007 BARRIL 19 Dependent Variable: LNBARRISA Method: Least Squares Sample: 2002M01 2007M11 Included observations: 71 Variable Coefficient Std. Error t-Statistic Prob. C T 3.149329 0.018201 0.028046 0.000677 112.2913 26.88314 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 0.912846 0.911583 0.116914 0.943155 52.65812 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic 3.804561 0.393187 -1.426989 -1.363252 722.7032 * Realizar una predicción para diciembre del 2007, sabiendo que t es igual a 1 en 2002.1. ^ ^ Y 2007.12 = Y d 2007.12 * IGVE12 = e(3.149+ 0.018201*72+ 0.943155 / 142) * 0.957 = = 83.27 ^ * Interpretación de β 2 * 100: Al transcurrir un periodo la variable “Precio del barril de petróleo desestacionalizada” aumenta por término medio en un 1,82%. a.4) Modelo logístico Se utiliza para describir la evolución temporal de algunos fenómenos que presentan tendencias de crecimiento acotadas a largo plazo, con un punto de inflexión intermedio. Suelen ser útiles para representar funciones de consumo de bienes duraderos que se caracterizan por un fuerte crecimiento al principio, tras el cual se produce un cambio en el ritmo de crecimiento. Concretamente, se produce una desaceleración hasta aproximarse sucesivamente al nivel de saturación del mercado. El modelo de regresión que se ajusta es: 20 Y dt = K 1 + β1e − β 2t eut donde k, β1 y β2 son constantes positivas. Esta función tiene dos asíntotas, cuanto t→ ∞ , Yt tiende a K, y cuando t→- ∞ , Yt tiende a 0, constituyendo este valor su asíntota inferior. Para la estimación directa de este modelo se utilizan métodos no lineales. 4) Función Gomperzt Se utiliza para describir fenómenos similares a la logística y su expresión es: Ydt = k β 1 e − β 2t ut 4.2 Componente cíclico: Filtro de Holdrick-Prescott A partir de este procedimiento se desea obtener el componente cíclico de la variable. Para aplicar este filtro la variable ha de estar desestacionalizada. Se supone una hipótesis aditiva: Ydt = Tt + Ct+ It, t= 1,...,T. A partir de estas consideraciones, se desea obtener la serie suavizada, que en este caso, sería la tendencia Tt. Para ello habría que minimizar la siguiente función: Min[ {Tt } ∑ t =1 (Y d t − Tt ) 2 + λ[ T ∑ ((T t +1 − Tt ) − (Tt − Tt −1 )) 2 ] t =2 tras minimizar la función se obtiene un vector de dimensión 1xT que recoge el componente tendencia: {T1, T2,..., TT}. λ es un parámetro que penaliza la variabilidad del componente tendencia, los autores del método proponen los siguientes valores: λ= 100 con datos anuales λ= 1600 con datos trimestrales λ= 14400 con datos mensuales. Una primera aproximación al componente cíclico sería: C’t = Ydt - Tt; no obstante, en C’t está incluido el componente irregular, así pues, para conseguir la verdadera estimación de Ct hay que volver a aplicar el filtro de Holdrick-Prescott a C’t para obtener, nuevamente, una serie suavizada que sería Ct: 21 Min[ {Tt } ∑ (C 't − Ct ) 2 + λ[ t =1 T ∑ ((C t +1 − Ct ) − (Ct − Ct −1 )) 2 ] t =2 donde Ct es el componente cíclico. Ejemplo Proc/Holdrick-Prescott filter: Serie “Paro registrado” (1996M1-2011M01) Hodrick-Prescott Filter (lambda=14400) 4500000 4000000 3500000 400000 3000000 2500000 200000 2000000 0 1500000 -200000 -400000 1996 1998 2000 2002 2004 2006 2008 2010 PAROSA Trend Cycle 60000 40000 20000 0 -20000 -40000 -60000 -80000 -100000 1996 1998 2000 2002 2004 2006 2008 2010 CICLO 22 5. Predicción Antes de analizar la predicción es necesario señalar que se hagan explícitos los siguientes supuestos: a) Se considera que existe una cierta estabilidad en el fenómeno. Ej. Serie no estable: Nº de terremotos en España en el mes de marzo Número de terremotos 600 500 400 300 Marzo 200 100 0 2007 2005 2003 2001 1999 1997 1995 1993 1991 1989 1987 1985 b) Los datos han de ser homogéneos en el tiempo, es decir, se ha de mantener la definición y los procedimientos de medición de la magnitud objeto de estudio. Ej. La Encuesta de Ocupación Hotelera sustituyó desde enero del 1999 a la Encuesta de Movimiento de Viajeros en Establecimientos Hoteleros, ampliando la investigación a la categoría de una estrella y similares, puesto que además de suponer más del 50% del total de establecimientos, representan más del 5% de entrada de viajeros. Si la variable que se investiga es Yt, el conjunto de información disponible es: Y1, Y2, ..., YT La predicción puede ser de tres tipos: ^ ^ ^ a) Interim: Y1 , Y2 , ..., YT . ^ b) Ex-post: Y T +1 ... 23 ^ ^ ^ c) Ex-ante: Y 0 , Y −1 , Y −2 ,... Al error de predicción se le denomina: ^ et = Y t - Yt. Y el porcentaje del error de predicción se define como: ^ % Error de predicción= ( Y t - Yt/ Yt) *100 * Medidas para valorar la capacidad predictiva de los modelos 1) Error absoluto medio: EAM T EAM = ^ ∑Y t − Yt t =1 , en el interior de la muestra. T M ^ ∑Y EAM = m − Ym , hacia el futuro. m =1 M 2) Porcentaje de error absoluto medio: PEAM T PEAM = ^ ∑ (Y T M PEAM = t − Yt ) / Yt t =1 ^ ∑ (Y , en el interior de la muestra. m − Ym ) / Ym m =1 M , hacia el futuro. 3) Error cuadrático medio: ECM ^ ECM = ∑ (Y t t T − Yt ) 2 , en el interior de la muestra. 24 ∑ ECM = ^ (Y m − Ym ) 2 m M , hacia el futuro. 4) Raíz del error cuadrático medio RECM= ECM Cuanto más cercanas estén a cero todas las medidas anteriores mejor será la capacidad predictiva del modelo. Las limitaciones de las medidas anteriores son que carecen de cota superior. Además los valores que alcancen el EAM, el ECM y la RECM dependen de la unidad de medida de la variable y, por consiguiente, no son adecuados para realizar comparaciones al menos que vengan referidas las predicciones a la misma variable. 5) Coeficiente de desigualdad de Theil T ∑ t =1 U= T ∑ ^ (Y t − Yt ) 2 T ^2 Yt t =1 T T + ∑Y 2 ; t t =1 T éste índice está acotado entre 0 y 1. Además es una medida adimensional. Otra forma de expresar el coeficiente de desigualdad de Theil es exprensándolo al cuadrado: U2. T • Descomposición de U2 = ∑ t =1 ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ T ∑ ^ (Y t − Yt ) 2 T ^2 Yt t =1 T T + ∑Y t =1 T 2 t ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2 = De esta forma: 25 − ^ U = (S ^ − S ) 2 − (Y − Y ) 2 2 ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ T ∑ ^2 Yt t =1 T T + ∑Y t =1 T 2 t ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2 + y ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ T ∑ ^2 Yt t =1 T 2 S ^ S (1 − r^ ) y T + ∑Y ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2 t t =1 T 2 + y y ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ T ∑ ^2 Yt t =1 T y, y T + ∑Y t =1 T 2 t ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2 =[ componente de sesgo +componente de varianza+ componente de covarianza]. Los dos primeros componentes forman la parte sistemática; mientras que el otro, la parte no sistemática, lo ideal es que el componente de varianza y sesgo sean lo más pequeños posibles. Ejemplo * Se ha estimado una modelo exponencial para la variable desestacionalizada del paro: 15.4 15.2 15.0 14.8 .06 14.6 .04 14.4 .02 .00 -.02 -.04 2006 2007 Residual 2008 2009 Actual 2010 Fitted 26 15.4 Forecast: LNPAROSAF Actual: LNPAROSA Forecast sample: 2006M01 2011M01 Adjusted sample: 2006M02 2011M01 Included observations: 60 15.2 15.0 Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion 14.8 14.6 0.021555 0.017285 0.116371 0.000726 0.000000 0.001315 0.998685 14.4 2006 2007 2008 2009 2010 LNPAROSAF Interpretación de la información: *Root mean squared error: RECM. * Mean Absolute Error: EAM. * Porcentaje del error absoluto medio: PEAM. *Theil Inequality Coefficient: U. * Bias Proportion + Variance Proportion + Covariance proportion: 1. 27