Práctica 4

Anuncio
PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2007/2008
Práctica 4
1. Planteamiento y Objetivos de la Práctica
En la presente práctica se propone la modelización univariante por medio del
enfoque de Box-Jenkins de tres series temporales con características distintas. En
cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin
de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que
considere más importantes en cada ejemplo y dejar los pasos omitidos para que los
cubran los alumnos después por su cuenta
Con la presente práctica se intenta que el alumno aprenda a construir
modelos ARIMA univariantes para una serie temporal por medio del enfoque de
Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas
hasta elaborar el posible modelo generador de los datos, de forma sintética los
pasos a realizar son los siguientes:
•
Especificación inicial
•
Estimación
•
Chequeo o validación
•
Utilización del modelo 1
En la etapa de especificación inicial se deberá determinar el orden de
integración de la serie temporal, es decir cual es el número de diferencias que se
requerirán y si una de ellas debe ser anual (estacional) para convertir en
estacionaria a la variable objeto de análisis, Zt (d,s).
Zt = (1-B)d (1-Bs ) D
1
El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno
económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas)
estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el
componente estacional
2
Donde: d es el número de diferencias regulares y D es el número de diferencias de
tipo estacional y habitualmente D = 0 ó 1 y habitualmente 0 ≤ d+D ≤ 2.
Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela
determinadas características de la misma, como sus correloramas simple y parcial
y los tests de raíces unitarias.
Una vez decidido el orden d y D, es decir el número de raíces unitarias que
tiene la serie temporal, habrá que decidir el orden del polinomio autorregresivo (p) y
el de medias móviles (q) para lo cual utilizamos como principales instrumentos el
correlograma simple y el parcial de la serie. Los criterios generales que deben
servir de guía para determinar el orden p del polinomio autorregresivo y el orden q
del polinomio medias móviles se recogen en las estructuras de los correlogramas
simple (FAC) y parcial (FAP) y que para los casos más sencillos se han visto en las
clases teóricas. Un resumen de las características de la estructura del correlograma
simple y del parcial se recoge en el esquema adjunto.
Características teóricas de la FAC y de la FAP de los procesos estacionarios
Procesos
FAC
FAP
Decrecimiento rápido hacia
AR (p)
cero sin llegar a anularse
MA (p)
ARMA (p, q)
P primeras autocorrelaciones
distintas de cero y el resto
ceros
q primeras autocorrelaciones
Decrecimiento rápido hacia
significativas y el resto ceros
cero sin llegar a anularse
Decrecimiento rápido hacia
cero sin llegar a anularse
Decrecimiento rápido hacia
cero sin llegar a anularse
Debe quedar claro que la identificación es siempre tentativa por lo que se
deben sugerir varios modelos como posibles procesos generadores de datos. Una
vez que se han sugerido uno o varios modelos se escoge el que parezca más
adecuado y se procede a su estimación, apropiado, usualmente el de máxima
3
verosimilitud pero en Eviews este método no está implementado. Posteriormente se
debe realizar el chequeo ó validación de esas estimaciones, es decir, decidir sobre
varios criterios la validez de dichas estimaciones.
En esta práctica se realiza la modelización de tres series temporales de
datos reales y características distintas. El primer caso se refiere al volumen de
ventas anual de una empresa en términos reales, el segundo analiza el Índice de
empleo de un determinado con frecuencia trimestral y en el último se modeliza a
una serie de frecuencia mensual y con estacionalidad, las ventas de cigarros puros
de una empresa tabaquera.
2.Ejemplo1. Ventas anuales de una empresa
La serie que se modeliza se refiere a las ventas en términos reales de una
determinada empresa dedicada a la producción de cosméticos. Su periodicidad es
anual y el tamaño muestral abarca 51 observaciones que comprenden el periodo
1949-1999; dada su frecuencia anual, esta serie no tendrá componente estacional.
El primer paso que debemos dar para elaborar el modelo univariante de las series
es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e
importamos los datos, tal y como hemos hecho en las prácticas anteriores. La
variable la denominamos ventas
Una vez cargados los datos debemos verificar si la serie temporal es
estacionaria y en caso de que no lo sea realizar las transformaciones pertinentes
hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie
ventas, gráfico que se muestra a continuación.
La instruccione en Eviews para obtener el gráfico de la serie es:
Quik/Graph /ventas/Line Graph
4
Evolución de las ventas
1200
1100
1000
900
800
700
600
500
50
55
60
65
70
75
80
85
90
95
VENTAS
Se observa que tiene una tendencia creciente muy acentuada, lo que es un
claro signo de que la serie no es estacionaria en media, además ese crecimiento
muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto
grado de estabilidad y no es del todo preciso tomar logaritmos.
En segundo lugar obtenemos los correlogramas
Instrucciones en Eviews para obtener los correlogramas de ventas
Quick/Series Statistics/Correlogram/ventas
También de forma alternativa en el objeto serie (ventas)
View/Correlogram
5
El correlograma simple de ventas (AC) confirma la sospecha anterior sobre la no
estacionariedad de la variable ventas al mostrar un decrecimiento muy lento.
Adicionalmente llevamos a cabo el test de raíces unitarias de D-F
Instrucciones en Eviews para el test D-F:
Quick/Series Statistics/unit root/ventas
Null Hypothesis: VENTAS has a unit root
Exogenous: Constant
Lag Length: 1 (Automatic based on SIC, MAXLAG=10)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
6
t-Statistic
Prob.*
-0.906450
-3.571310
-2.922449
-2.599224
0.7780
Dependent Variable: D(VENTAS)
Method: Least Squares
Date: 04/11/06 Time: 17:42
Sample (adjusted): 1951 1999
Included observations: 49 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
VENTAS(-1)
D(VENTAS(-1))
C
-0.001026
0.577317
5.282546
0.001132
0.111009
1.831241
-0.906450
5.200645
2.884682
0.3694
0.0000
0.0059
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.454475
0.430757
1.058424
51.53198
-70.76235
2.399094
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
10.49688
1.402848
3.010708
3.126534
19.16125
0.000001
El Valor del estadístico t (-0.906) es inferior a los valores críticos de la distribución
DF por lo que no se puede rechazar la hipótesis de la existencia de una raíz
unitaria, y por tanto, la serie ventas no es estacionaria
Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria
se prueba con el ajuste de una tendencia lineal determinística a la serie ventas y si
es adecuado eliminar la tendencia de la serie original. Para ello, se ajusta una
tendencia determinística a la variable ventas del tipo:
ventas = c +β
β t + µt
Cuya estimación se presenta a continuación
Instrucciones en Eviews para la estimación de la tendencia determinista :
Quick /estimate equation
Y en la ventana de la ecuación que se abre escribir: ventasc @trend+1
El resultado de la estimación es:
7
Ecuación para la tendencia
Dependent Variable: VENTAS
Method: Least Squares
Date: 04/09/06 Time: 19:17
Sample: 1949 1999
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
@TREND+1
605.9019
10.39500
1.299179
0.043483
466.3730
239.0563
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.999143
0.999126
4.570939
1023.781
-148.8514
0.109129
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
60
70
876.1719
154.5990
5.915740
5.991498
57147.92
0.000000
12
8
4
0
-4
-8
-12
-16
50
55
65
75
80
85
90
95
VENTAS Residuals
Analizando esos resultados podemos observar que la estimación de los
residuos presentan un estadístico Durbin- Watson próximo a cero, lo que es
indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz
unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido
8
blanco. El gráfico de los residuos la serie ventas también muestra esos problemas
y nos indica que los residuos se han mantenido por encima y/o por debajo de la
media durante un periodo demasiado largo. Por lo tanto, ese ajuste no es adecuado
puesto que olvida determinadas propiedades importantes de la serie
Dado que el procedimiento anterior no es el adecuado, la tendencia es tipo
estocástica y utilizamos a continuación el procedimiento de la diferenciación para
convertir a la serie en estacionaria. Tomamos la primera diferencia en la serie
ventas para lo que generamos la serie de Dventas =ventas-ventas(-1), es decir,
transformamos la serie de acuerdo con la siguiente expresión:
Zt =(1-B)ventas
La representación gráfica de la serie transformada y sus correspondientes
correlogramas se muestran a continuación.
Primera diferencia de la serie ventas
15
14
13
12
11
10
9
8
7
50
55
60
65
70
75
80
85
DVENTAS
9
90
95
Tanto el gráfico de la serie Dventas como su correlograma indican que la
primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a
su nivel medio y el correlograma tiende a cero con cierta rapidez . No obstante, se
completa este análisis con el test DFA de raíces unitarias que se muestra a
continuación
Test de D-F Aumentado de Dventas
Null Hypothesis: DVENTAS has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=10)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
10
t-Statistic
Prob.*
-3.777505
-3.571310
-2.922449
-2.599224
0.0057
Dependent Variable: D(DVENTAS)
Method: Least Squares
Date: 04/11/06 Time: 21:55
Sample (adjusted): 1951 1999
Included observations: 49 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
DVENTAS(-1)
C
-0.381068
3.942637
0.100878
1.078866
-3.777505
3.654428
0.0004
0.0006
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.232898
0.216577
1.056413
52.45244
-71.19611
2.473364
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
-0.092714
1.193536
2.987596
3.064813
14.26955
0.000445
El test DFA rechaza la hipótesis nula de una raíz unitaria en Dventas puesto
que el valor del estadístico t (3,78) supera el valor de los puntos críticos de la
distribución DFA. Este resultado corrobora la estacionariedad de la serie Dventas
que indican el gráfico y el correlograma de la serie
Por lo tanto, de estos resultados la transformación que convertiría a la serie
en estacionaria sería:
Zt =(1-B)ventas,, ventas ∼I(1)
Una vez decidido el grado de integración de la serie, es decir, el número de raíces
unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA
que generan la serie.
El análisis de los correlograma de la serie Dventas nos dice que el modelo más
claro que puede generar la serie es un AR(2), puesto que el correlograma simple
tiende a cero con cierta rápidez y el parcial se anula después del segundo retardo.
También se puede sugerir como un modelo alternativo, aunque no tan
rotundamente como en el caso anterior, un MA(3) puesto que el correlograma
simple se anula después del tercero o cuarto retardo. Por otro lado, de la
observación del gráfico de la serie que consideramos estacionaria, D(ventas,1), se
11
observa que su media es distinta de cero, por lo que procede en principio
la
inclusión de un término independiente.
Los modelos sugeridos son:
1.1)
ARIMA(2,1,0) : (1-φ
φ1B- φ2B2 ) (1-B) ventas = C+at
1.2)
ARIMA(0,1,3) : (1-B) ventas = C+ (1- θ1B- θ2B2- θ3B3)at
El análisis de la estructura del correlograma probablemente sugiera algún modelo
adicional pero de momento nos quedamos con los propuestos.
Estimación
Una vez especificados varios modelos alternativos como posibles generadores de
la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se
deben dar las siguientes instrucciones para estimar los modelos sugeridos.
Modelo 1.1:
Quick/Estimate Equation/ LS d(ventas,1) c ar(1) ar(2)
Modelo 1.2:
Quick/Estimate Equation/ LS d(ventas,1) c ma(1) ma(2) ma(3)
Los resultados de la estimación de estos modelos se presentan a continuación :
Estimación Modelo1.1
Dependent Variable: DVENTAS
Method: Least Squares
Date: 04/09/06 Time: 19:10
Sample (adjusted): 1952 1999
Included observations: 48 after adjustments
Convergence achieved after 3 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
AR(1)
AR(2)
10.11214
0.368149
0.388732
0.616994
0.135783
0.127968
16.38936
2.711310
3.037719
0.0000
0.0095
0.0040
R-squared
0.525916
Mean dependent var
12
10.45896
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.504846
0.979571
43.18014
-65.56936
1.991277
Inverted AR Roots
.83
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
1.392085
2.857057
2.974007
24.95999
0.000000
-.47
Estimación modelo 1.2
Dependent Variable: DVENTAS
Method: Least Squares
Date: 04/09/06 Time: 19:02
Sample (adjusted): 1950 1999
Included observations: 50 after adjustments
Convergence achieved after 13 iterations
Backcast: 1946 1948
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
MA(1)
MA(2)
MA(3)
10.43083
0.497157
0.564666
0.632436
0.392970
0.101433
0.097743
0.086339
26.54353
4.901323
5.777057
7.324991
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.557023
0.528133
1.029564
48.76011
-70.31917
2.161780
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Inverted MA Roots
.15-.88i
.15+.88i
10.57670
1.498800
2.972767
3.125729
19.28094
0.000000
-.79
Una vez estimados los modelos especificados se debe validar dichas estimaciones,
es decir, se debe contrastar la adecuación del modelo a los datos, por medio de
una batería de tests estadísticos y econométricos vistos en clase y que se
encuentran en Eviews en el objeto ecuación .
Validación o chequeo
13
En la etapa de validación se presentan tres bloques de análisis: Un primero
referente a los resultados de la estimación, un segundo centrado en el análisis de
los residuos y, finalmente, un tercero dedicado a la comparación de modelos
alternativos.
•
Análisis de la estimación.-
Referente a la significatividad
individual de los coeficientes por medio del
estadístico t de student pone de relieve que todos los coeficientes del modelo 1 son
altamente significativos y también lo son los del modelo 2.
En cuanto a las condiciones de estacionariedad e invertibilidad de los modelos
estimados, todas las raíces de los polinomios de retardos caen fuera de circulo de
radio unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que
Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro
del circulo de radio unidad.
De la observación de los resultados de la estimación se deduce que el modelo 1.1
presenta un error estandar (0,979), ligeramente más bajo que el del modelo 1.2
(1,029) y tanto el estadístico de Akaike como el criterio de Schwarz son inferiores
en el primer modelo, 2,857 y 2,974, frente a 2,973 y 3,126
En esta etapa también se suele analizar las correlaciones entre los coeficientes
estimados para verificar la posible existencia de multicolinealidad en el modelo. La
existencia de multicolinalidad indica una falta de precisión en las estimaciones
obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las
correlaciones entre los coeficientes se acude su matriz de correlaciones que
proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo
siguiente:
View/Correlation Matrix
La ejecución de esta instrucción
muestra la matriz de coeficientes de la
ecuación estimada, para el modelo 1.1 se tiene:
14
Matriz de correlaciones del modelo 1
C
AR(1)
AR(2)
C
0.380682
-0.005342
-0.015880
AR(1)
-0.005342
0.018437
-0.011620
AR(2)
-0.015880
-0.011620
0.016376
Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no
muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la
misma forma que tampoco presentan problemas de multicolinelidad.
Análisis de los residuos.
.El siguiente paso dentro del proceso de validación es el análisis de los
residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen
varios contrastes pero nos limitamos al contraste de que los residuos sean ruido
blanco, inspeccionando el correlograma de residuos, el estadístico Q de BoxPierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto
ecuación
Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics
Los resultados para el modelo1.1 se presenta en la tabla adjunta y se puede
contemplar que las autocorrelaciones de los residuos no son significativas y entran
dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por
su parte, el estadístico Q
no muestra indicios de autocorreción global de los
residuos, puesto que el valor de Q estimado para los diferentes ordenes de
autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto
critico de la χ2 con los correspondientes grados de libertad y los niveles estandar de
significatividad utilizados en el trabajo empírico, lo que nos lleva a rechazar la
hipótesis nula de autocorrelación global de los residuos. el valor de estimado.
Correlograma de los residuos del modelo 1
15
Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals
16
14
12
10
2
8
1
6
0
-1
-2
-3
55
60
65
70
Residual
75
80
Actual
16
85
90
Fitted
95
El gráfico de los residuos también apoya la ausencia de autocorrelación residual,
puesto que la gran mayoría de los residuos entran dentro de las bandas de
confianza, con excepción del correspondiente al año 1962. Por lo tanto, también
muestra claramente que los residuos son ruido blanco.
De la misma forma que el análisis llevado a cabo para el modelo 1.1 se
puede entrar en el objeto ecuación del modelo 1.2 y verificar que sus residuos son
ruido blanco.
Comparación de modelos alternativos.
Del análisis que se acaba de realizar en los dos apartados anteriores se
deduce que el modelo 1.1 superan el conjunto de pruebas estadísticas para validar
sus estimaciones, aunque el modelo 1,2 presenta un problema que es la no
significatividad del parámetro del componente AR(1). Además el modelo 1.1
presenta una menor varianza residual y un menor Akaike, por lo que es preferible
al 1.2.
Por lo tanto, el crecimiento anual de las ventas de la empresa, ∆ventas, que
es la variable modelizada viene explicada de forma satisfactoria
por un modelo
sencillo ARIMA(2,1,0).
3. Ejemplo 2. El Índice de Empleo de un determinado país
La serie a modelizar es el índice de empleo de un determinado país, la serie
está corregida de estacionalidad y tiene frecuencia trimestral. El periodo muestral
abarca 1962:1 1993:4. Una vez creado el el WorKfile y establecido el periodo
muestral, se cargan los datos tal y como se ha hecho en el ejemplo anterior. La
serie la denominamos empleo en el Workfile
El primer paso en la modelización de la serie es su representación gráfica. Para ello
en Eviews, la instrucción es:
17
Quick/ Graph/ Graph Line/empleo
El resultado es el gráfico adjunto 1a en el que se puede contemplar como la serie
empleo muestra una tendencia creciente en los primeros 20 años y después y
muestra un marcado comportamiento çiclico en los 10 años últimos. La serie no
parece mostrar cambios en la varianza ante desplazamientos del tiempo, lo que se
puede comprobar tomando logaritmos en la serie y representando gráficamente esa
serie, vemos que los gráficos de ambas series son similares. Se realiza la
transformación logarítmica y se realiza el gráfico de la serie transformada. Para ello,
en Eviews
GENR Lempleo =LOG(empleo)
y para su representación gráfica :
Quick/ Graph/ Graph Line/ empleo
La representación gráfica de esta serie Lempleo se muestra en el gráfico 1b en el
cual se puede contemplar que la nueva es muy similar a la anterior., lo que es
indicativo de que la serie es estacionaria en varianza. Por lo que trajaremos con la
serie original.
Grafico 1 a
Gráfico 1b
115
4.75
110
4.70
105
4.65
100
4.60
95
4.55
90
4.50
85
4.45
4.40
80
1965
1970
1975
1980
1985
1965
1990
1970
1975
1980
LEMPLEO
EMPLEO
18
1985
1990
También se muestra a continuación el correlograma de la serie empleo
En Eviews una vez dentro del objeto serie empleo
View/Correlogram
El correlograma confirma un elevado grado de dependencia de las observaciones
de la serie empleo y su no estacionariedad en media
Se realiza también el test de DFA de raices unitarias, cuyos resultados se presentan
a continuación. Para ello, en Eviews:
Quick/ SERIES STATISTIC/ Unit root / empleo
19
Test D-F aumentado de la serie empleo
Null Hypothesis: EMPLEO has a unit root
Exogenous: Constant
Lag Length: 1 (Automatic based on SIC, MAXLAG=12)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level
t-Statistic
Prob.*
-2.205738
-3.482879
-2.884477
-2.579080
0.2054
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(EMPLEO)
Method: Least Squares
Date: 04/19/08 Time: 21:29
Sample (adjusted): 1962Q3 1993Q4
Included observations: 126 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
EMPLEO(-1)
D(EMPLEO(-1))
C
-0.039278
0.478736
3.982081
0.017807
0.078727
1.807249
-2.205738
6.080986
2.203394
0.0293
0.0000
0.0294
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.243969
0.231676
1.457341
261.2326
-224.7214
2.064222
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
0.014150
1.662605
3.614626
3.682156
19.84590
0.000000
El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en
empleo puesto que el valor del estadístico t (-2.205) es notablemente inferior a los
valores críticos de la distribución DFA
Si ajustamos una tendencia temporal lineal simple de tipo determinístico a la serie
(empleo y como hicimos en el capítulo 1 del programa de la asignatura y práctica 1 y
en la modelización de la serie ventas que acabamos de realizar, y restamos de
20
empleo la serie ajustada podremos comprobar que ese no es un procedimiento
correcto para convertir a la serie en estacionaria. ( se deja al alumno que lo
compruebe). Por lo tanto, es claro que esa tendencia no es determinista sino
estocástica y debemos proceder con diferenciaciones para eliminar esa tendencia.
Comenzamos tomando una primera diferencia regular en la serie empleo, cuyo
gráfico se muestra a continuación y también su correlograma.
Instrucciones en Eviews:
Genr DEMPLEO =D(EMPLEO,1)
Quick/Graph/Line Graph/DEMPLEO
Quick/Series Statistic/Correlogram
8
6
4
2
0
-2
-4
-6
1965
1970
1975
1980
1985
D(EMPLEO,1)
21
1990
El gráfico de DEMPLEO muestra que la serie podría ser estacionaria y también en
ese sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No
obstante, se
realiza también el test de DFA, cuyos resultados se muestran a
continuación, y corrobora también la no existencia de una raíz unitaria en la serie
DEMPLEO y que , por tanto, esa transformación convierte a la serie en estacionaria.
Test DFA de la serie DEMPLEO
Null Hypothesis: D(EMPLEO,1) has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=12)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level
22
t-Statistic
Prob.*
-6.751657
-3.482879
-2.884477
-2.579080
0.0000
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(EMPLEO,2)
Method: Least Squares
Date: 04/19/08 Time: 21:28
Sample (adjusted): 1962Q3 1993Q4
Included observations: 126 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
D(EMPLEO(-1),1)
C
-0.537417
0.006063
0.079598
0.131846
-6.751657
0.045988
0.0000
0.9634
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.268803
0.262906
1.479881
271.5657
-227.1654
2.029454
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
-0.003332
1.723714
3.637545
3.682566
45.58488
0.000000
Por lo tanto la serie DEMPLEO tiene una raíz unitaria y la primera diferencia
convierte a dicha serie en estacionaria, eliminado su tendencia. La serie es del tipo
:
Zt =(1-B)EMPLEO,, EMPLEO ∼I(1)
Es decir, es integrable de orden 1
Determinado el grado de diferenciación ó de raíces unitarias, pasamos a
especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas
de la serie DEMPLEO se deduce que en la FAC existen 2 ó tres coeficientes que
son distintos de cero y después todos son cero, mientras que en la FAP solo existe
un coeficiente significativo, que no es cero, el primero, y después tienden
rápidamente a cero. Esto sugiere que la serie (DEMPLEO) puede ser generada por
modelos que puede tener una estructura MA hasta orden 2 y un AR(1). Así, los
posibles modelos serian: ARIMA (1,1,0), ARIMA(1;1,2) ó ARIMA(2,1,1).
23
Por otro lado, de la observación del gráfico de la serie DEMPLEO se deduce
que la media de la serie aparentemente es cero por lo que debe no debe incluirse el
término constante en los modelos especificados
Los modelos tentativos serian por tanto:
2.1. ARIMA(1,1,0)
(1- φ1 B)(1-B)EMPLEO = at
,,
θ2B2)at
2.2. ARIMA(1,1,2) ) ,, (1- φ1 B )(1-B)EMPLEO= (1- θ1B-θ
2.3. ARIMA(2,1,1) ) ,, (1- φ1 B+φ
φ2 B2) (1-B)EMPLEO= (1- θ1B) at
Estimación
La estimación de los modelos anteriores en Eviews se hace por medio de las
siguientes instrucciones:
Quick/ Estimate Equation/ LS EMPLEO ar(1)
Quick/ Estimate Equation/ LS EMPLEO ar(1) ma(1) ma(2)
Quick/ Estimate Equation/ LS EMPLEO ar(1) ar(2) ma(1)
Los resultados de la estimación de estos modelos se presentan a continuación:
Estimacion modelo 2.1
Dependent Variable: D(EMPLEO,1)
Method: Least Squares
Date: 04/21/08 Time: 00:48
Sample (adjusted): 1962Q3 1993Q4
Included observations: 126 after adjustments
Convergence achieved after 2 iterations
Variable
Coefficient
Std. Error
t-Statistic
Prob.
AR(1)
0.462622
0.079275
5.835666
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Inverted AR Roots
0.214051
0.214051
1.473962
271.5704
-227.1664
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat
.46
24
0.014150
1.662605
3.621689
3.644200
2.029500
Estimacion modelo 2.2
Dependent Variable: D(EMPLEO,1)
Method: Least Squares
Date: 04/21/08 Time: 01:37
Sample (adjusted): 1962Q3 1993Q4
Included observations: 126 after adjustments
Convergence achieved after 8 iterations
Backcast: 1961Q3 1961Q4
Variable
Coefficient
Std. Error
t-Statistic
Prob.
AR(1)
MA(1)
MA(2)
0.515070
-0.070881
0.008407
0.312357
0.324334
0.170031
1.648981
-0.218544
0.049446
0.1017
0.8274
0.9606
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.215272
0.202513
1.484742
271.1483
-227.0684
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat
Inverted AR Roots
Inverted MA Roots
.52
.04+.08i
.04-.08i
0.014150
1.662605
3.651880
3.719411
1.992157
Estimacion modelo 2.3
Dependent Variable: D(EMPLEO,1)
Method: Least Squares
Date: 04/21/08 Time: 01:12
Sample (adjusted): 1962Q4 1993Q4
Included observations: 125 after adjustments
Convergence achieved after 19 iterations
Backcast: 1961Q4
Variable
Coefficient
Std. Error
t-Statistic
Prob.
AR(1)
AR(2)
MA(1)
-0.459695
0.426099
0.956981
0.094065
0.082802
0.046168
-4.886990
5.145983
20.72805
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.239708
0.227244
1.462870
261.0787
-223.3991
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat
25
0.002497
1.664120
3.622385
3.690265
2.031913
Inverted AR Roots
Inverted MA Roots
.46
-.96
-.92
Validación
En cuanto al modelo 2.1 todos los coeficientes son individualmente significativos,
según el contraste de la t de student y también el ajuste globalmente es aceptable:
también son altamente significativos los coeficientes del modelo 2.3, sin embargo
en el modelo 2.2 los coeficientes de los de los parámetros MA no son significativos
por lo que el modelo es rechazable. Todos los modelos cumplen las condiciones de
estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios
autorregresivos como los de media móvil caen fuera del circulo de radio unidad. A
su vez, las matrices de correlaciones de los coeficientes de estos modelos no
muestran signos de multicolinealidad
Desde el punto de vista del error estandar de los modelos estimados el 2.1 es el
que presenta un valor menor (1,4739) seguido del 2.3, aunque muy cerca (1.4628).
Desde el punto de vista del criterio de Akaike, tanto el modelo 2.1 como el 2.3
presentan el mismo valor (3,622)
El análisis de los residuos de los dos modelos seleccionados a través de sus
correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se
presentan a continuación, nos indica que ambos cumplen las condiciones para ser
considerados como ruido blanco. No obstante, el modelo 2.3 puede ser mejor desde
el punto de vista del error estandar de la ecuación. Ambos modelos presentan
residuos atípicos en la observación 87:1 y en la 92:1 y la raíz del polinomio media
móvil roza la unidad, lo que puede estar indicando sobrediferenciación. Se deja al
alumno que pruebe con la serie original EMPLEO, sin diferenciación, y corrija la
serie de atípicos y pruebe con especificaciones alternativas.
Correlograma de los residuos del modelo 2.1
26
Grafico de residuos del modelo 2.1
8
4
0
8
-4
4
-8
0
-4
1965
1970
1975
Residual
1980
Actual
1985
1990
Fitted
27
Correlograma de los residuos del modelo 2.3
Grafico de residuos del modelo 2.3
8
4
0
8
-4
4
-8
0
-4
1965
1970
1975
Residual
1980
Actual
1985
1990
Fitted
28
4. Ejemplo 3. Ventas de cigarros puros de una empresa tabaquera
La serie a modelizar es el volumen de ventas mensual de puros de una
empresa tabaquera para el periodo. periodo muestral 1989:01 1996:12. El objetivo
que se persigue con este ejercicio es que el alumno aprenda a construir un modelo
univariante de una serie de frecuencia mensual que tiene una marcada tendencia y
estacionalidad.
Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo
muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,
se realiza la representación gráfica de la serie objeto de análisis. La serie se
denomina puros
Instrucciones: Quick/Graph/ puros/Line graph
Ventas de puros de una empresa tabaquera
800
700
600
500
400
300
200
1989 1990 1991 1992 1993 1994 1995 1996
PUROS
29
Este gráfico es indicativo de una serie en la que el nivel disminuye con el
tiempo y muestra, por tanto, una tendencia decreciente y la media no se mantiene
constante y disminuye con el tiempo y la serie muy probablemente no será
estacionaria en media, por lo que necesitará una diferencia regular. También se
observa un marcado patrón estacional con picos en octubre y valores bajos en
diciembre. La varianza es mayor al principio de la muestra (año 1989) que al final,
años 1995 y 1996, pero en el resto de los años parece muy uniforme.
Tomamos logaritmos en la serie puros y realizamos su representación gráfica. Para
ello en Eviews:
GENR Lpuros= log(puros)
Quick/Graph/ Lpuros/Line graph
Evolución logaritmica de las ventas de puros
6.6
6.4
6.2
6.0
5.8
5.6
5.4
1989 1990 1991 1992 1993 1994 1995 1996
LPUROS
Este gráfico del logaritmo de la variable carga (Lpuros ) es muy similar al
anterior y la varianza parece estable, por lo que en adelante trabajar con la
30
transformación logarítmica o sin ella es indiferente, por lo que decidimos trabajar
con la métrica original.
Como hemos visto en los dos ejemplos anteriores el correlograma es un
instrumento útil para verificar la estacionariedad
de la serie. A continuación se
presentan los correlogramas.
Instrucciones: Una vez en el objeto serie puros, View/ Correlogram
El correlograma de la serie puros decae lentamente, tanto en la parte regular como
en la estacional, por lo que confirma la no estacionariedad apuntada anteriormente.
Pasamos, en primer lugar, a corregir la no estacionariedad en la parte regular tomar
31
una diferencia de orden 1 y representar el gráfico de esa serie transformada y su
correspondiente correlograma.
Instrucciones Eviews: Genr dpuros=D(puros,1)
Quick/Graph/dpuros/Line graph
Quick/series statistic/correlogram/dpuros
150
100
50
0
-50
-100
-150
-200
-250
1990
1991
1992
1993
1994
DPUROS
32
1995
1996
Según la gráfica de la primera diferencia regular, d(puros,1), la transformación
parece que ha eliminado la tendencia regular pero persiste una cierta la tendencia
estacional. El análisis del correlograma indica que, si bien se ha corregido la no
estacionariedad de la parte regular, persiste la no estacionariedad en el componente
estacional, al ser significativos en el correlograma simple los retardos 12, 24 y
también podría serlo el de 36, por lo que se debe tomar una diferencia de tipo
estacional junto con la regular.
Instrucciones: Genr dd12puros=d(puros,1,12)
Quick/Graph/Line Graph/dd12puros
Quick/series statistic/correlogram/dd12puros
33
150
100
50
0
-50
-100
-150
1990
1991
1992
1993
1994
1995
1996
DD12PUROS
El gráfico de dd12puros muestra una clara estacionariedad
en media y el
correlograma de esta variable que se muestra a continuación parece que no ofrece
dudas sobre la estacionariedad..
34
No obstante, se elabora el test de DFA para la serie dd12puros para verificar si
esta transformación es estacionaria
Test DFA de la serie dd12puros
Null Hypothesis: DD12PUROS has a unit root
Exogenous: Constant
Lag Length: 1 (Automatic based on SIC, MAXLAG=11)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
35
t-Statistic
Prob.*
-12.63026
-3.513344
-2.897678
0.0001
10% level
-2.586103
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(DD12PUROS)
Method: Least Squares
Date: 04/13/08 Time: 14:33
Sample (adjusted): 1990M04 1996M12
Included observations: 81 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
DD12PUROS(-1)
D(DD12PUROS(-1))
C
-2.275417
0.447603
-0.630273
0.180156
0.101841
4.413679
-12.63026
4.395103
-0.142800
0.0000
0.0000
0.8868
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.828732
0.824341
39.71255
123012.8
-411.6206
2.110029
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
-0.086420
94.75286
10.23755
10.32623
188.7137
0.000000
Los resultados del test DFA son concluyentes sobre la estacionariedad de la serie
dd12lcarga, el estadístico t (-12.630) supera ampliamente los valores críticos de la
distribución ADF, lo que confirma la estacionariedad de esta transformación ya
adelantada por el análisis gráfico y el del correlograma.
A la vista de los resultados anteriores , la transformación que se sugiere es :
Zt =(1-B) (1-B12)puros
Para finalizar la etapa de especificación inicial debemos determinar cuales son los
modelos estacionales multiplicativos
ARMA (p,q) Χ ARMA(P,Q)S que pueden
generar la serie.
Del análisis del correlograma de la serie dd12puros se deduce que el proceso
generador de datos puede tener un componente media móvil regular de orden 1
36
MA(1), puesto que en el correlograma simple después del primer coeficiente
significativo el resto son ceros, y otro estacional de orden MA(1)12 , puesto que
después del coeficiente de orden 12 significativo el resto son ceros, es decir un
ARMA (0,1)(0,1)12.
3.1. ARIMA(0,1,1)×
×(0,1,1)12
(1-B)(1-B12)puros= (1- θ1B)(1-θ
θ12B12)at
,,
Estimación del modelo 3.1
Dependent Variable: DD12PUROS
Method: Least Squares
Date: 04/13/08 Time: 18:09
Sample (adjusted): 1990M02 1996M12
Included observations: 83 after adjustments
Convergence achieved after 14 iterations
Backcast: 1987M12 1988M12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
MA(1)
SMA(12)
-0.677779
-0.867044
0.066918
0.034549
-10.12847
-25.09612
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Inverted MA Roots
0.662434
0.658267
30.88643
77271.69
-401.4760
.99
.49-.86i
-.49-.86i
-.99
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat
.86-.49i
.49+.86i
-.49+.86i
.86+.49i
.00+.99i
-.86+.49i
Grafico residuos del modelo 3.1
37
-0.481928
52.83531
9.722312
9.780597
2.546859
.68
-.00-.99i
-.86-.49i
80
40
0
-40
-80
1990
1991
1992
1993
1994
1995
DD12PUROS Residuals
Correlograma residuos del modelo 3.1
38
1996
3.2. ARIMA(2,1,0)×
×(0,1,1)12
,, (1- φ1B-φ
φ2B2) (1-B)(1-B12) puros= (1-θ
θ12B12)at
Dependent Variable: D(PUROS,1,12)
Method: Least Squares
Date: 04/10/06 Time: 02:01
Sample (adjusted): 1990M04 1996M12
Included observations: 81 after adjustments
Convergence achieved after 7 iterations
Backcast: 1988M01 1988M12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
-0.952059
-0.562088
-0.903840
0.096127
0.095416
0.022752
-9.904132
-5.890927
-39.72502
0.0000
0.0000
0.0000
3.1.
AR(1)
AR(2)
MA(12)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Inverted AR Roots
Inverted MA Roots
0.732067
0.725197
28.01044
61197.62
-383.3443
-.48-.58i
.99
.50+.86i
-.50-.86i
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat
-.48+.58i
.86-.50i
.00+.99i
-.86+.50i
.86+.50i
-.00-.99i
-.86-.50i
-0.148148
53.43293
9.539365
9.628049
2.068255
.50-.86i
-.50+.86i
-.99
Validación
El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de
coeficientes que se puede consultar en la ventana de la ecuación no proporciona coeficientes de
correlación elevados por lo que no presentan signos de multicolinealidad. Analizando los
correlogramas de los residuos se observa que todos los coeficientes de autocorrelación no son
distintos de cero puesto que entran dentro de las bandas de confianza. El gráfico de residuos
también indica que los residuos son ruido blanco. El modelo, en principio, parece válido pero
presenta alguna raíz de la media móvil próxima a la unidad lo que puede indicar
sobrediferenciación. No obstante, la identificación del grado de diferenciación a través del
39
análisis gráfico, los correlogramas de la serie y el test DFA de raíces unitarias se decantaban
por una raíz de tipo regular y otra estacional; sin embargo,. El modelo 3,2 también tiene todos
los coeficientes significativos, los residuos que se pueden consultar en la ventana de la ecuación
son ruido blanco a través de la observación del gráfico de los residuos y de su correlograma.
Este modelo tiene también una raíz de la media móvil próxima a la unidad, sin embargo, tiene
un Akaike inferior al 3,1 y también un error estandar de la ecuación menor por lo que será
preferido al 3.1. La mejora del modelo puede venir por corregir algunos residuos atípicos que
pueden distorsionar el análisis y la especificación.
40
Descargar