Análisis clásico de series temporales Profesor: Antonio Caparrós Ruiz

Anuncio
Análisis clásico de series temporales
Profesor: Antonio Caparrós Ruiz
1
Análisis clásico de series temporales
1. Introducción
Hasta ahora nos hemos ubicado en el campo de la Econometría causal, es decir, una
variable dependiente es explicada y predicha por su relación con k variables
explicativas:
Yt = β1 + β2*X2t + ...+ βk*Xkt + ut
Este tipo de análisis conlleva una serie de problemas:
1) La ausencia de una teoría que justifique las posibles variables explicativas que se
han de introducir en el modelo.
2) Las predicciones de la variable Y se basan en predicciones de las X’s.
Por estas razones surge el análisis clásico de series temporales que permite realizar
predicciones de la variable con la única información procedente del pasado de la
misma.
2. Componentes de una serie temporal
Una serie temporal puede descomponerse en las siguientes cuatro fluctuaciones:
a) Tendencia de larga duración o secular (Tt):
Recoge el movimiento de la variable a largo plazo, debido a cambios
demográficos, tecnológicos o institucionales.
Ejemplos de variables con tendencia
1) Gasto público en becas en España
500000
450000
400000
350000
Niveles no
universitarios
300000
250000
Niveles universitarios
200000
150000
100000
50000
0
2006
2004
2002
2000
1998
1996
1994
1992
2
2) Paro registrado en España
4500000
4000000
3500000
3000000
2500000
2000000
1500000
1000000
2010M01
2009M05
2008M09
2008M01
2007M05
2006M09
2006M01
2005M05
2004M09
2004M01
2003M05
2002M09
2002M01
2001M05
2000M09
2000M01
1999M05
1998M09
1998M01
1997M05
1996M09
0
1996M01
500000
3) Número de matrimonios
300000
250000
200000
150000
100000
50000
2007
2005
2003
2001
1999
1997
1995
1993
1991
1989
1987
1985
1983
1981
1979
1977
1975
0
b) Movimiento oscilatorio o cíclico
Recoge las fluctuaciones originadas por el ciclo económico, que pueden durar
entre 4 y 8 años.
Ejemplo
Componente cíclico de los ocupados en el sector turístico
6
4
2
0
-2
-4
99
00
01
02
España
03
04
05
06
07
Andalucía
3
c) Fluctuaciones estacionales (Et):
Son movimientos que se presentan con una periodicidad inferior al año, mes,
trimestre, cuatrimestre,...Y suelen ser repetitivas mostrando el efecto de la
climatología, la estructura productiva o festividades.
Ejemplo.
Serie de índice del comercio al por menor
180
160
140
120
100
80
60
40
20
2008M05
2007M07
2006M09
2005M11
2005M01
2004M03
2003M05
2002M07
2001M09
2000M11
2000M01
1999M03
1998M05
1997M07
1996M09
1995M11
1995M01
0
d) Variaciones irregulares (It):
Muestra aquellos factores asociados al muy corto plazo y que quedan fuera del
control del analista. Dentro de este componente también denominado residual, se
encuentran aquellos factores inusuales, pero fácilmente reconocibles como una
catástrofe natural.
Ejemplo
Serie de licitaciones de los ayuntamientos de superficies industriales
1600
1400
1200
1000
800
600
400
200
2009M07
2008M06
2007M05
2006M04
2005M03
2004M02
2003M01
2001M12
2000M11
1999M10
1998M09
1997M08
1996M07
1995M06
1994M05
1993M04
1992M03
1991M02
1990M01
0
4
Ejemplo de descomposición de una serie en componentes
PARO
TENDENCIA
4500000
4500000
4000000
4000000
3500000
3500000
3000000
3000000
2500000
2500000
2000000
2000000
1500000
1500000
1996 1998 2000 2002 2004 2006 2008 2010
1996 1998 2000 2002 2004 2006 2008 2010
IRREGULAR
80000
ESTACIONALIDAD
150000
60000
100000
40000
50000
20000
0
0
-20000
-50000
-40000
-100000
-60000
-150000
-80000
1996 1998 2000 2002 2004 2006 2008 2010
1996 1998 2000 2002 2004 2006 2008 2010
CICLO
300000
200000
100000
0
-100000
-200000
-300000
1996 1998 2000 2002 2004 2006 2008 2010
Dado que los componentes de una serie no se observan aisladamente, se necesita aplicar
hipótesis que representen el proceso generador de los datos:
1) Hipótesis aditiva: Yt = Tt + Ct + Et + It
1) Hipótesis multiplicativa: Yt = Tt * Ct * Et * It
2) Hipótesis mixta: Yt = Tt * Ct * Et + It
5
A nivel práctico hay que elegir entre uno u otro esquema. Hay que considerar que en la
hipótesis aditiva los cuatro componentes son independientes, por ejemplo, la existencia
de tendencia no condiciona el efecto de la estacionalidad; mientras que en la hipótesis
multiplicativa, los elementos están interrelacionados entre sí. Así, la estacionalidad se
agrega como un porcentaje de la tendencia y no como una cantidad independiente.
Para concretar si la serie temporal sigue un esquema aditivo o uno multiplicativo, se
debe analizar la amplitud del ciclo anual (componentes de la serie estacional). Si éste
aumenta a medida que lo hace la tendencia (las ondas se agrandan), el modelo es
multiplicativo. Si permanece constante es aditivo.
Ejemplo
3. Componente estacional: Desestacionalización
a) Evolución a medio y largo plazo de la variable
Si el objetivo es conocer la evolución de la serie sin estacionalidad, es decir, su
evolución a medio y a largo plazo, es necesario obtener su tasa de variación
interanual. Así, dado Yt = Tt * Ct * Et * It, con datos trimestrales, se calcula la
siguiente tasa:
T14 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * Et * It)- ( Tt-4 * Ct-4 * Et-4 * It-4))/ ( Tt-4 * Ct-4 * Et-4 * It-4))*100]
Si se supone estacionalidad estable Et = Et-4, entonces:
T14 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * It)- ( Tt-4 * Ct-4 * It-4))/ ( Tt-4 * Ct-4 * It-4))*100]
Con esta tasa el efecto estacional queda excluido
6
b) Desestacionalización
b.1) Método de la razón a la media móvil
Con este método se obtienen unos coeficientes que sintetizan en un único valor la
estacionalidad para cada periodo temporal. Y a partir de ahí, poder obtener la serie
desestacionalizada, es decir, la serie sin el componente estacional.
El método supone que:
* La serie ha sido generada bajo una hipótesis multiplicativa:
Yt = Tt * Ct * Et * It
* La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4
o Et=Et-12.
3) La tendencia y el ciclo se obtienen de forma conjunta.
El objetivo del método es obtener una estimación de Et. Concretamente, el
procedimiento consta de las siguientes partes:
1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles
centradas: MMct = Tt * Ct.
2) Primera estimación del componente estacional e irregular (Et*It). Para ello se divide
la serie original por MMct :
Et*It= Yt / MMct
A esta serie de valores se les denominan índices específicos o brutos de variación
estacional y constituyen una primera aproximación del componente estacional.
3) Primera estimación del componente estacional: E’j .
La diferencia entre los índices estacionales es debida a los factores irregulares. Estos se
eliminan tomando la media aritmética para cada una de las fracciones del año.
4) Normalización de los coeficientes: E’j.
La estacionalidad media en un esquema multiplicativo correponde a Et=1, para lograr
que los índices estacionales tengan como media 1 se normalizan, y se obtienen los
índices generales de variación estacional:
IGVEj = Ej/ ΣEj/m; j=1,...,m
7
La serie desestacionalizada es Ydt,j= Yt,j / IGVEj.
5) Los IGVEj fluctúan por debajo y por encima de 1.
Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01
Sample: 1996M01 2011M01
Included observations: 181
Ratio to Moving Average
Original Series: PARO
Adjusted Series: PAROSA
Scaling Factors:
1
2
3
4
5
6
7
8
9
10
11
12
1.040337
1.043614
1.033282
1.013096
0.986780
0.970998
0.958699
0.967058
0.975154
0.993592
1.011023
1.011117
8
PARO
4500000
4000000
3500000
3000000
2500000
2000000
1500000
1996
1998
2000
2002
2004
2006
2008
2010
2006
2008
2010
2006
2008
2010
PAROSA
4400000
4000000
3600000
3200000
2800000
2400000
2000000
1600000
1996
1998
2000
2002
2004
IGVE
1.06
1.04
1.02
1.00
0.98
0.96
0.94
1996
1998
2000
2002
2004
* Interpretación de los IGVE:
1) (IGVEenero-1)*100 = (1.04-1)*100= 4%
La estacionalidad del mes de enero provoca que el paro registrado crezca un 4%
por encima de su valor medio anual.
2) (IGVEjulio-1)*100 = (0.95-1)*100= -5%
La estacionalidad del mes de julio provoca que el paro registrado caiga un 5%
por debajo de su valor medio anual.
b.2) Método de la diferencia a la media móvil
La hipótesis que subyacen tras este método son las siguientes:
1) La serie ha sido generada bajo una hipótesis aditiva:
Yt = Tt + Ct + Et + It
2) La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4
(t es un trimestre) o Et=Et-12 (t es un mes).
9
3) La tendencia y el ciclo se obtienen de forma conjunta.
El procedimiento consta de las siguientes partes:
1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles
centradas: MMct = Tt + Ct.
2) Primera estimación del componente estacional e irregular (Et+It). Para ello se resta la
serie original por MMct :
Et+It= Yt - MMct
A esta serie de valores se les denominan índices específicos o brutos de variación
estacional y constituyen una primera aproximación del componente estacional.
3) Primera estimación del componente estacional: E’j.
Bajo la hipótesis de estacionalidad estable, la diferencia entre los índices específicos o
brutos de variación estacional es debida a los factores irregulares. Estos se eliminan
tomando la media aritmética para cada una de las fracciones del año.
4) Posteriormente se normalizan los coeficientes E’j, para que la media de todos los
índices valga 0, obteniéndose los IGVEj. Por ejemplo, si los datos son trimestrales:
IGVE1= E’1 -
4
∑
j =1
E 'j / 4 ; IGVE2= E’2 -
4
∑
E 'j / 4 ; IGVE3= E’3 -
j =1
4
∑
E 'j / 4 ; IGVE4= E’4 -
j =1
4
∑E
'
j
/4
j =1
La serie desestacionalizada es Ydt,j= Yt,j - IGVEj.
5) Los IGVEj con la hipótesis aditiva fluctúan por encima y por debajo de 0.
Ejemplo con la serie de paro registrado: periodo 1996:01-2011:01
10
Sample: 1996M01 2011M01
Included observations: 181
Difference from Moving Average
Original Series: PARO
Adjusted Series: PAROSA
Scaling Factors:
1
2
3
4
5
6
7
8
9
10
11
12
90308.63
101056.4
80600.01
35253.60
-26940.19
-67270.17
-101920.2
-79824.11
-59737.38
-16859.27
22189.82
23142.91
5000000
4000000
3000000
2000000
1000000
0
-1000000
1996 1998 2000 2002 2004 2006 2008 2010
PAROSA
PARO
IGVE
IGVEenero= 90308. En el mes de enero, la estacionalidad provoca un aumento del paro
registrado de 90308 individuos con respecto a su valor medio anual.
IGVEjulio= -101920, en el mes de julio la estacionalidad provoca una caída del paro
registrado de 101920 individuos.
b.3) Método X11
Este método, al contrario que los dos anteriores, supone que el componente estacional
varía de forma estocástica a lo largo del tiempo. De forma que arroja un índice
estacional para cada periodo, además, permite introducir el efecto de las festividades
sobre la variable. Se puede aplicar tanto con una hipótesis aditiva como multiplicativa.
11
Ejemplo
106
104
102
100
98
96
94
1996 1998 2000 2002 2004 2006 2008 2010
INDICES
150000
100000
50000
0
-50000
-100000
-150000
1996 1998 2000 2002 2004 2006 2008 2010
INDICES2
12
c) Variables ficticias estacionales.
En este caso, las variables ficticias estacionales se incluyen en el modelo para recoger la
característica de la estacionalidad para ello se crean variables de la siguiente forma:
Dj,t ⎧⎨1 si t corresponde con el periodo j ( por ejemplo, mes o trimestre)
⎩0 en caso contrario
Hay que recordar que para no incurrir en la trampa de las variables ficticias es necesario
crear una categoría de referencia. En definitiva, la formulación del modelo
econométrico sería la siguiente:
Yt = β1 +
M
∑β D
j
j ,t
+ ut
j =2
Ejemplo
Variable Ocupados : Indice de ocupación hotelera.
Dependent Variable: OCUPADOS
Method: Least Squares
Sample: 2002M01 2010M01
Included observations: 97
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
@SEAS(2)
@SEAS(3)
@SEAS(4)
@SEAS(5)
@SEAS(6)
@SEAS(7)
@SEAS(8)
@SEAS(9)
@SEAS(10)
@SEAS(11)
@SEAS(12)
93.21111
1.201389
3.226389
6.163889
8.763889
10.18889
11.96389
11.58889
10.33889
7.338889
2.188889
1.513889
0.908864
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
1.324886
102.5578
0.906787
2.435220
4.652391
6.614824
7.690388
9.030126
8.747083
7.803606
5.539260
1.652134
1.142656
0.0000
0.3671
0.0170
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.1022
0.2564
Interpretación:
Por ejemplo, en el mes de agosto la estacionalidad provoca un incremento por término
medio del índice de ocupación de la hostelería de 11,58 unidades con respecto a enero.
13
Las variables ficticias correspondientes a los meses de febrero, noviembre y diciembre
no son significativas, lo que significa que no presentan un comportamiento estacional
diferente a la categoría de referencia que es enero.
4. Componente de tendencia-ciclo
4.1 Componente tendencia
* Análisis de regresión
A partir del análisis de regresión se pretende captar la tendencia de la variable. Consiste
en considerar una función matemática que relacione a la variable Ydt con el tiempo (si
los datos tienen una periodicidad inferior al año, la variable ha de estar
desestacionalizada):
Ydt = f(t) + ut
Este método supone que los parámetros que definen la tendencia no cambian en el
tiempo.
A continuación se presentan diversos modelos de tendencia:
a.1) Función lineal: Ydt = β1 + β2 t + ut, la variable t se puede construir dándole 1 al
primer periodo y así sucesivamente.
β2: Mide la variación absoluta que por término medio experimenta la variable Ydt al
transcurrir un periodo, ya que:
E(Yt-1) = β1 + β2 (t-1)
E(Yt) = β1 + β2 t
E(Yt) - E(Yt-1) = β2
* Predicción
t
t’
Ydt
IGVEj
.
.
.
.
2011.01
15
Yd2011.01
IGVE1
2011.02
16
Yd2011.02
IGVE2
2011.03
17
Yd2011.03
IGVE3
14
Predicción para 2011:04 de Yt:
- Hipótesis multiplicativa:
^d
^
Y 2011.04 = Y
^d
donde: Y
^
2011:04
2011.04 * IGVE4
^
=β 1 +β 2 18
- Hipótesis aditiva:
^
^d
Y 2011.04 = Y
2011.04 + IGVE4
Ejemplo:
15
1) Primero se predice el componente de tendencia:
^
Pr eciosa 2011:02 = 18.51003 + 0.826893 * 74 = 79.70
2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando
dependiendo de cómo sea la hipótesis planteada. En este caso, la hipótesis es
multiplicativa.
^
Pr ecio 2011:02 = (18.51003 + 0.826893 * 74) * IGVE2 = 79.62 dolares
a.2) Función polinómica:
La expresión general es:
Ydt = β1 + β2 t + β3 t2+ ...+ βp+1 tp + ut
En la práctica uno de los valores para p más usuales es p=2, con lo que la expresión
resultante es:
Ydt = β1 + β2 t + β3 t2+ ut
Este tipo de función es apropiada para la representación gráfica de una serie que
presenta una tendencia curva, con una variación (crecimiento o decrecimiento), que
no es constante si no que es función del periodo considerado. Así, si se supone que
el modelo ya está estimado:
16
^ d
Y
^
t
^
=β 1 +β
^
2
t+β
t2
3
^
^
^
∂ Yt
= β 2 +β 3 t
∂t
* Predicción:
Haciendo uso del ejemplo anterior:
- Hipótesis multiplicativa:
^d
^
Y 2011:04 = Y
donde
^d
Y
2011:04 * IGVE4
^
2011.04
^
^
=β 1 +β 2 18 + β 3 18 2
- Hipótesis aditiva:
^
^d
Y 2011.04 = Y
2011.04 + IGVE4
Ejemplo
17
Predicción:
1) Primero se predice el componente de tendencia:
^
Pr eciosa 2011:02 = 19.89918 + 0.712716 * 74 + 0.001586 * 74 2 = 81.23
2) Posteriormente se le incorpora la estacionalidad, multiplicando o sumando
dependiendo de cómo sea la hipótesis planteada, en este caso, hipótesis
multiplicativa.
^
Pr eciosa 2011:02 = 1(9.89918 + 0.712716 * 74 + 0.001586 * 74 2 ) * IGVE2 = 81.23
dolares
a.3) Función exponencial
En ocasiones, el crecimiento de la variable no es moderado si no que parece seguir una
ley exponencial, con un ritmo de variación de fuerte crecimiento o caída. En este caso la
función de se adjunta es:
Ydt = e(β1 + β2t +ut)
Representación gráfica
6000
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
18
2
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
1
2
3
4
5
6
7
8
10 11 12 13 14 15
9
Para estimar la ecuación es necesario linealizarla:
ln Ydt = β1 + β2 t + ut
^
Interpretación de β 2 :
^
∂ Yt d
^
^
* 100 = β 2 *100
Y td
^
β 2 * 100 es la variación en términos porcentuales que se produce en la variable
dependiente cuando transcurre un periodo temporal. Para recuperar los valores ajustados
de la variable original:
^
Yt d
^
=e
^
(β 1 + β 2 t +
∑ et2
)
2T
Ejemplo: Precio del barril Brendt (2002.01-2007.11).
100
90
80
70
60
50
40
30
20
10
2002
2003
2004
2005
2006
2007
BARRIL
19
Dependent Variable: LNBARRISA
Method: Least Squares
Sample: 2002M01 2007M11
Included observations: 71
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
T
3.149329
0.018201
0.028046
0.000677
112.2913
26.88314
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.912846
0.911583
0.116914
0.943155
52.65812
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
3.804561
0.393187
-1.426989
-1.363252
722.7032
* Realizar una predicción para diciembre del 2007, sabiendo que t es igual a 1 en
2002.1.
^
^
Y 2007.12 = Y d 2007.12 * IGVE12 = e(3.149+ 0.018201*72+ 0.943155 / 142) * 0.957 =
= 83.27
^
* Interpretación de β 2 * 100:
Al transcurrir un periodo la variable “Precio del barril de petróleo desestacionalizada”
aumenta por término medio en un 1,82%.
a.4) Modelo logístico
Se utiliza para describir la evolución temporal de algunos fenómenos que presentan
tendencias de crecimiento acotadas a largo plazo, con un punto de inflexión intermedio.
Suelen ser útiles para representar funciones de consumo de bienes duraderos que se
caracterizan por un fuerte crecimiento al principio, tras el cual se produce un cambio en
el ritmo de crecimiento. Concretamente, se produce una desaceleración hasta
aproximarse sucesivamente al nivel de saturación del mercado. El modelo de regresión
que se ajusta es:
20
Y dt =
K
1 + β1e − β 2t eut
donde k, β1 y β2 son constantes positivas. Esta función tiene dos asíntotas, cuanto t→ ∞ ,
Yt tiende a K, y cuando t→- ∞ , Yt tiende a 0, constituyendo este valor su asíntota
inferior.
Para la estimación directa de este modelo se utilizan métodos no lineales.
4) Función Gomperzt
Se utiliza para describir fenómenos similares a la logística y su expresión es:
Ydt = k β 1 e
− β 2t
ut
4.2 Componente cíclico: Filtro de Holdrick-Prescott
A partir de este procedimiento se desea obtener el componente cíclico de la
variable. Para aplicar este filtro la variable ha de estar desestacionalizada. Se supone
una hipótesis aditiva: Ydt = Tt + Ct+ It, t= 1,...,T. A partir de estas consideraciones, se
desea obtener la serie suavizada, que en este caso, sería la tendencia Tt. Para ello habría
que minimizar la siguiente función:
Min[
{Tt }
∑
t =1
(Y d t − Tt ) 2 + λ[
T
∑ ((T
t +1 − Tt ) − (Tt
− Tt −1 )) 2 ]
t =2
tras minimizar la función se obtiene un vector de dimensión 1xT que recoge el
componente tendencia: {T1, T2,..., TT}. λ es un parámetro que penaliza la variabilidad
del componente tendencia, los autores del método proponen los siguientes valores:
λ= 100 con datos anuales
λ= 1600 con datos trimestrales
λ= 14400 con datos mensuales.
Una primera aproximación al componente cíclico sería: C’t = Ydt - Tt; no obstante, en
C’t está incluido el componente irregular, así pues, para conseguir la verdadera
estimación de Ct hay que volver a aplicar el filtro de Holdrick-Prescott a C’t para
obtener, nuevamente, una serie suavizada que sería Ct:
21
Min[
{Tt }
∑
(C 't − Ct ) 2 + λ[
t =1
T
∑ ((C
t +1 − Ct ) − (Ct
− Ct −1 )) 2 ]
t =2
donde Ct es el componente cíclico.
Ejemplo
Proc/Holdrick-Prescott filter:
Serie “Paro registrado” (1996M1-2011M01)
Hodrick-Prescott Filter (lambda=14400)
4500000
4000000
3500000
400000
3000000
2500000
200000
2000000
0
1500000
-200000
-400000
1996 1998 2000 2002 2004 2006 2008 2010
PAROSA
Trend
Cycle
60000
40000
20000
0
-20000
-40000
-60000
-80000
-100000
1996 1998 2000 2002 2004 2006 2008 2010
CICLO
22
5. Predicción
Antes de analizar la predicción es necesario señalar que se hagan explícitos los
siguientes supuestos:
a) Se considera que existe una cierta estabilidad en el fenómeno.
Ej. Serie no estable: Nº de terremotos en España en el mes de marzo
Número de terremotos
600
500
400
300
Marzo
200
100
0
2007
2005
2003
2001
1999
1997
1995
1993
1991
1989
1987
1985
b) Los datos han de ser homogéneos en el tiempo, es decir, se ha de mantener la
definición y los procedimientos de medición de la magnitud objeto de estudio.
Ej. La Encuesta de Ocupación Hotelera sustituyó desde enero del 1999 a la Encuesta
de Movimiento de Viajeros en Establecimientos Hoteleros, ampliando la
investigación a la categoría de una estrella y similares, puesto que además de
suponer más del 50% del total de establecimientos, representan más del 5% de
entrada de viajeros.
Si la variable que se investiga es Yt, el conjunto de información disponible es:
Y1, Y2, ..., YT
La predicción puede ser de tres tipos:
^
^
^
a) Interim: Y1 , Y2 , ..., YT .
^
b) Ex-post: Y T +1 ...
23
^
^
^
c) Ex-ante: Y 0 , Y −1 , Y −2 ,...
Al error de predicción se le denomina:
^
et = Y t - Yt.
Y el porcentaje del error de predicción se define como:
^
% Error de predicción= ( Y t - Yt/ Yt) *100
* Medidas para valorar la capacidad predictiva de los modelos
1) Error absoluto medio: EAM
T
EAM =
^
∑Y
t − Yt
t =1
, en el interior de la muestra.
T
M
^
∑Y
EAM =
m − Ym
, hacia el futuro.
m =1
M
2) Porcentaje de error absoluto medio: PEAM
T
PEAM =
^
∑ (Y
T
M
PEAM =
t − Yt ) / Yt
t =1
^
∑ (Y
, en el interior de la muestra.
m − Ym ) / Ym
m =1
M
, hacia el futuro.
3) Error cuadrático medio: ECM
^
ECM =
∑ (Y
t
t
T
− Yt ) 2
, en el interior de la muestra.
24
∑
ECM =
^
(Y m − Ym ) 2
m
M
, hacia el futuro.
4) Raíz del error cuadrático medio
RECM= ECM
Cuanto más cercanas estén a cero todas las medidas anteriores mejor será la
capacidad predictiva del modelo.
Las limitaciones de las medidas anteriores son que carecen de cota superior.
Además los valores que alcancen el EAM, el ECM y la RECM dependen de la
unidad de medida de la variable y, por consiguiente, no son adecuados para realizar
comparaciones al menos que vengan referidas las predicciones a la misma variable.
5) Coeficiente de desigualdad de Theil
T
∑
t =1
U=
T
∑
^
(Y t − Yt ) 2
T
^2
Yt
t =1
T
T
+
∑Y
2
;
t
t =1
T
éste índice está acotado entre 0 y 1. Además es una medida adimensional. Otra
forma de expresar el coeficiente de desigualdad de Theil es exprensándolo al
cuadrado: U2.
T
•
Descomposición de U2 =
∑
t =1
⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝
T
∑
^
(Y t − Yt ) 2
T
^2
Yt
t =1
T
T
+
∑Y
t =1
T
2
t
⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠
2
=
De esta forma:
25
−
^
U =
(S ^ − S ) 2
−
(Y − Y ) 2
2
⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝
T
∑
^2
Yt
t =1
T
T
+
∑Y
t =1
T
2
t
⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠
2
+
y
⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝
T
∑
^2
Yt
t =1
T
2 S ^ S (1 − r^ )
y
T
+
∑Y
⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠
2
t
t =1
T
2
+
y y
⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝
T
∑
^2
Yt
t =1
T
y, y
T
+
∑Y
t =1
T
2
t
⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠
2
=[ componente de sesgo +componente de varianza+ componente de covarianza].
Los dos primeros componentes forman la parte sistemática; mientras que el otro, la
parte no sistemática, lo ideal es que el componente de varianza y sesgo sean lo más
pequeños posibles.
Ejemplo
* Se ha estimado una modelo exponencial para la variable desestacionalizada del
paro:
15.4
15.2
15.0
14.8
.06
14.6
.04
14.4
.02
.00
-.02
-.04
2006
2007
Residual
2008
2009
Actual
2010
Fitted
26
15.4
Forecast: LNPAROSAF
Actual: LNPAROSA
Forecast sample: 2006M01 2011M01
Adjusted sample: 2006M02 2011M01
Included observations: 60
15.2
15.0
Root Mean Squared Error
Mean Absolute Error
Mean Abs. Percent Error
Theil Inequality Coefficient
Bias Proportion
Variance Proportion
Covariance Proportion
14.8
14.6
0.021555
0.017285
0.116371
0.000726
0.000000
0.001315
0.998685
14.4
2006
2007
2008
2009
2010
LNPAROSAF
Interpretación de la información:
*Root mean squared error: RECM.
* Mean Absolute Error: EAM.
* Porcentaje del error absoluto medio: PEAM.
*Theil Inequality Coefficient: U.
* Bias Proportion + Variance Proportion + Covariance proportion: 1.
27
Descargar