criterios y contrastes

Anuncio
Curso de Predicción Económica y Empresarial
www.uam.es/predysim
Edición 2004
UNIDAD 3: MODELOS ARIMA
Breve “recetario” sobre los contrastes de validez
Un primer grupo de contrastes que nos sirven para dar validez al modelo nos vendría
dado por la utilización de medidas elementales del error. Su utilidad se limita, a
nuestros efectos a la realización de comparaciones entre modelos, ya que no
proporcionan medidas “absolutas” de validez. En este sentido podríamos decir que, a
igualdad de otros criterios, preferiremos el modelo con menores “medidas de error”. En
este grupo contamos con:
1) Suma de cuadrados de los residuos, formulado como
n
SCR = ∑ a t2
t =1
2) Desviación típica de la regresión,
σ=
n
∑a
t =1
2
t
/(n − k )
donde k es el número de parámetros del modelo, es decir, p+q.
También contamos con el coeficiente de determinación, a diferencia de los anteriores
acotado entre valores, pero de utilidad, nuevamente para la comparación entre modelos.
El modelo de mayor valor explicativo (mayor R2) será preferido, a igualdad de otros
criterios. Se formula como:
3) Coeficiente de determinación;
S a2
Varianza de los errores
R =1− 2 =1−
Varianza de la variable dependiente
Sy
2
Asimismo, el coeficiente de determinación ajustado por los grados de libertad vendría
dado por
R 2 = 1 − (1 − R 2 )
Página 1 de 3
n −1
n−k
Un segundo grupo de medidas nos vendría dado por ciertos contrastes estadísticos.
Estos sí nos facilitan una medida “absoluta” asociada a cierta probabilidad. Entre ellos
podemos señalar:
4) Contraste t de significación de parámetros.
Con este contraste pretendemos dilucidar si el estimador del parámetro que acompaña a
cada variable es significativamente distinto de cero, esto es, si efectivamente la variable
tiene influencia significativa en la explicación de la dependiente. El contraste se formula
como:
t n−k =
bj
S (b j )
donde bj es el estimador del parámetro poblacional y S(bj) es la varianza del estimador.
Obviamente, un modelo estimado sólo será apropiado cuando los parámetros sean
significativos. Pues bien, a efectos prácticos podemos considerar que tal circunstancia
se produce cuando el valor del estadístico t sea superior a 2, con un nivel de confianza
del 95%.
5) Contraste F de significación conjunta.
Mientras que el contraste t analiza la significatividad individual de cada parámetro, el
contraste F realiza un análisis conjunto, es decir, contrasta la nulidad de todos los
parámetros del modelo. Se formula como
( S y2 − S a2 ) /(k − 1)
F( k −1, n − k ) =
S a2 /(n − k )
Los valores críticos del contraste están convenientemente tabulados. Podemos asumir
que rechazamos la hipótesis nula de nulidad de todos los parámetros cuando el valor del
contraste F sea mayor de 6. Lo habitual es que el estadístico F supere holgadamente esta
cifra. Cuando no sea así, habrá que recurrir al valor exacto del intervalo crítico.
6) Contraste d de Durbin-Watson.
Se utiliza para contrastar la hipótesis de ausencia de autocorrelación en los residuos del
modelo, si bien está diseñado, más estrictamente, para procesos autorregresivos de
orden 1, que son los esquemas más habituales. Se define como:
n
d=
∑ (a
t =2
t
− a t −1 ) 2
n
∑a
t =1
≈ 2(1 − ρˆ )
2
t
Página 2 de 3
En la práctica, consideramos que los residuos se aproximan lo suficiente a la hipótesis
de ruido blanco, cuando el contraste d se sitúa en el entorno de 2 (entre 1,5 y 2,5). El
cálculo exacto del contraste precisa de la obtención de un intervalo de confianza a partir
de un límite superior y un límite inferior que varían con el número de datos y
parámetros.
7) Contraste Q.
Contrasta la hipótesis de ruido blanco de los residuos. Existen dos versiones, la debida a
Box y Pierce en el que para n datos y m coeficientes se formula como:
m
Q = n∑ rk2
k =1
y la debida a Ljung-Box, y que es incorporada por el programa EViews, definida como:
m
Q = n(n + 2)∑ (rk2 / n − m)
k =1
bien entendido que se distribuye como una χ 2 con (n-m-p) grados de libertad. En
nuestras series daremos por razonables residuos con valores del estadístico Q inferiores
a 50. Para mayor precisión es preciso acudir a la tabulación de los valores críticos.
Por último, recogemos un tercer bloque de criterios compuesto por
8) Función logarítmica de verosimilitud.
9) Estadístico AIC (Akaike Information Criterion).
10) Estadístico SC (Schwarz Criterion).
Estos dos últimos se construyen, justamente, a partir de la función logarítmica de
verosimilitud y son calculados automáticamente por los programas informáticos. Todos
ellos alcanzan su utilidad máxima en la comparación de modelos alternativos. En esos
casos, elegiremos, a igualdad de otros criterios, aquel que presente un menor valor del
mismo.
Desarrollaremos con más detalle estas cuestiones en el ejercicio práctico 2.
Página 3 de 3
Descargar