Pruebas de Especificación de Modelos

Anuncio
Pruebas de Especificación de
Modelos Consistentes
Herman J. Bierens
Pennsylvania State University
Modelos de Esperanza Condicional
Modelos de regresión Cross-section
Dada una variable dependiente Y y un vector X ∈ Rk de
variables explicativas, un modelo de regresión paramétrico
tiene la forma
Y = f (X, θ0) + U,
donde
• θ0 es un vector de parámetros desconocido contenido en
un espacio paramétrico Θ ⊂ Rm,
• U es un término de error que satisface E[U 2] < ∞,
• f (x, θ) es una función conocida en Rk × Θ.
Por ejemplo, en el caso de un modelo de regresión lineal,
f (x, θ) = α + β 0x, θ = (α, β 0)0, Θ = Rk+1.
El modelo Y = f (X, θ0) + U está especificado correctamente si
H0 : ∃θ0 ∈ Θ : Pr (f (X, θ0) = E[Y |X]) = 1,
y está especificado de una manera incorrecta si
H1 : ∀θ ∈ Θ : Pr (f (X, θ) = E[Y |X]) < 1.
En cualquier caso, sea
h
i
2
θ0 = arg min E (Y − f (X, θ)) .
θ∈Θ
Entonces
H0 ⇔ Pr (E[U|X] = 0) = 1.
H1 ⇔ Pr (E[U|X] = 0) < 1.
La prueba de momento integrado condicional (ICM)
La pregunta es: Cómo podemos probar la veracidad de la
especificación funcional del modelo Y = f (X, θ0) + U tal
que la prueba tenga potencia asintótica 1 contra H1.
El primer artículo para revisar este problema es:
Bierens, H.J., 1982, Consistent Model Specification Tests,
Journal of Econometrics, 20, 105-134.
El análisis en este artículo se basa en la unicidad de la transformada de Fourier de una función.
Sea
g (X) = E[U|X],
con la transformada de Fourier
ϕ(ξ) = E [g (X) exp (i.ξ 0X)]
√
0
k
= E [U exp (i.ξ X)] , t ∈ R , i = −1.
Entonces
H0 ⇔ sup |ϕ(ξ)| = 0
ξ∈Rk
H1 ⇔ sup |ϕ(ξ)| > 0
ξ∈Rk
Pregunta: Dónde se puede buscar un ξ ∈ Rk tal que |ϕ(ξ)| >
0?
Respuesta:
• Si X es acotado entonces
H1 ⇔ ∀δ > 0, sup |ϕ(ξ)| > 0
|ξ|≤δ
• Si X no está acotado, sea Φ : Rk → Rk una aplicación
uno a uno acotada y sea
ϕ(ξ) = E [U exp (i.ξ 0Φ(X))] , ξ ∈ Rk .
Entonces
H1 ⇔ ∀δ > 0, sup |ϕ(ξ)| > 0
|ξ|≤δ
Denote
Ξ=
×k`=1
£
¤
−ξ `, ξ ` , ξ ` > 0,
y sea µ(ξ) la medida de probabilidad uniforme en Ξ. Entonces
H0 ⇔
H1 ⇔
Z
ZΞ
Ξ
2
|E [U. exp (i.ξ 0Φ(X))]| dµ(ξ) = 0
2
|E [U. exp (i.ξ 0Φ(X))]| dµ(ξ) > 0
Estos resultados sugieren que, dada una muestra aleatoria
(Y1, X1) , ..., (Yn, Xn)
a partir de (Y, X), una prueba consistente puede estar basada
en el estadístico de momento condicional integrado(ICM)
Z ¯
¯2
¯
¯
Tbn = ¯Zbn(ξ)¯ dµ(ξ),
Ξ
donde
n
con
X
1
bj exp (i.ξ 0Φ(Xj )) ,
Zbn(ξ) = √
U
n j=1
bj = Yj − f (Xj , b
U
θn)
θn el estilos residuos no lineales de mínimos cuadrados, y b
mador no lineal de mnimos cuadrados de θ0.
En Bierens (1982) se demostró que
d
H0 ⇒ Tbn → T
p
H1 ⇒ Tbn/n → η > 0
Sin embargo, en ese entonces yo era úncamente capaz de encontrar una expresión para E[T ] pero no para la distribución
nula limitante T .
Por lo tanto, propuse la búsqueda de valores críticos de la
prueba ICM tomando como base la desigualdad de Chebyshev para los primeros momentos.
Me tomó hasta 1990 el darme cuenta cuál es la naturaleza de
T para el caso real exp(.) :
Bierens, H.J.,1990, A Consistent Conditional Moment Test
of Functional Form, Econometrica, 58, 1443-1458.
En este artículo, demostró que bajo H0 el proceso empírico
n
X
1
bj exp (ξ 0Φ(Xj )) ,
Zbn(ξ) = √
U
n j=1
es ajustado en Ξ, y converge débilmente a un proceso Gaussianco con media ceroe Z(ξ):
Zbn ⇒ Z.
De aquí, bajo H0,
Z
Z
d
Tbn = Zbn(ξ)2dµ(ξ) → T = Z(ξ)2dµ(ξ)
Ξ
mientras que bajo H1,
p
Tbn/n → η > 0.
Ξ
Bierens, H.J. and Ploberger, W., 1997, Asymptotic Theory
of Integrated Conditional Moment Tests, Econometrica, 65,
1129-1151.
En este artículo se demostro que mis resultados previos se
pueden extender a más procesos empíricos generales del tipo
n
X
1
bj w (ξ 0Φ(Xj )) ,
Zbn(ξ) = √
U
n j=1
donde w(u) es una función con exponentes en un vecindario
abierto de u = 0 tal que
(d/du)sw(u) |u=06= 0
para todos excepto un número finito de números naturales s.
Ver también
Stinchcombe, M. and White, H., 1998, Consistent Specification Testing With Nuisance Parameters Present Only Under
the Alternative, Econometric Theory, 14, 295-325.
Además, para el caso de funciones ponderadoras de valores
reales w(u) Bierens y Ploberger (1997) demostraron que
Z
∞
X
T = Z(ξ)2dµ(ξ) =
λiε2i
Ξ
i=1
donde
• los valores εi son i.d.d. con distribución N(0, 1)
• los valores λi son los valores propios de la función de covarianza
Γ(ξ1, ξ2) = E [Z(ξ1)Z(ξ2)]
i.e., los valores λi son soluciones para el problema de valores propios
Z
λ.ψ(ξ1) =
Γ(ξ1, ξ2)ψ(ξ2)dµ(ξ2)
Ξ
con funciones de valores propios correspondientes ψi(ξ)
las cuales satisfacen
Z
ψi(ξ)ψj (ξ)dµ(ξ) = I(i = j).
Ξ
Además por el teorema de Mercer
Γ(ξ1, ξ2) = E [Z(ξ1)Z(ξ2)] =
∞
X
λiψ(ξ1)ψ(ξ2)
i=1
Bierens y Ploberger (1997) propusieron usar el estadístico
ICM
R
bn(ξ)2dµ(ξ)
Z
Ξ
Ten = R
b
Ξ Γ(ξ, ξ)dµ(ξ)
b ξ) es un estimador consistente de
donde Γ(ξ,
∞
X
¤
£
Γ(ξ, ξ) = E Z(ξ)2 =
λiψ(ξ)2.
i=1
Entonces, bajo H0
P∞
2
X̀
λ
ε
1
d
i
i
i=1
Ten → P∞
≤ sup
ε2i = T
`≥1 ` i=1
i=1 λi
Cotas superiores para los valores críticos pueden ahora si estar basados en T .
Otros resultados:
• La prueba ICM es admisible, i.e., no existe una prueba más
poderosa uniformemente.
• La prueba ICM
√ tiene poder no trivial contra las alternativas
locales de n :
√
H1L : E[Y |X] = f (X, θ0) + g(X)/ n,
Pr [g(X) = 0] < 1.
Pruebas ICM consistentes para diferentes hipótesis de martingale
Los modelos de regresión de series de tiempo tienen la forma
Yt = ft−1 (θ0) + Ut
donde
ft−1 (θ0) = E (Yt|Zt−1, Zt−2, Zt−3, ....)
con
Zt = (Yt, Xt0)0.
Por lo tanto, para probar la validez de la especificación ft−1 (θ)
se debe probar de manera consistente las diferentes hipótesis
martingale
E (Ut|Zt−1, Zt−2, Zt−3, ....) = 0
Muchos artículos en la literatura ’’resuelven’’ este problema
mediante la prueba
E (Ut|Zt−1, Zt−2, Zt−3, ....Zt−`) = 0
para algunos `. finitos. Sin embargo, estas pruebas no son
consistentes.
Existen únicamente dos artículos que proponen pruebas consistentes de las diferentes hipótesis de martingale:
Bierens, H.J., 1984, Model Specification Testing of Time Series Regressions, Journal of Econometrics, 26, 323-353
En este artículo propuse calcular para cada hipótesis
E (Ut|Zt−1, Zt−2, Zt−3, ....Zt−`) = 0
una prueba ICM Tbn,`, y luego utilizar
Ln
X
α`Tbn,`
`=1
como el verdadero estadístico de prueba, donde α` es una
secuencia
P∞elegida a priori de constantes positivas que satisfacen `=1 α` < ∞, and Ln → ∞ as n → ∞.
De Jong, R., 1996, The Bierens Test Under Data Dependence, Journal of Econometrics, 72, 1-32.
En este artículo, Robert de Jong extendió la prueba ICM a
bn(ξ).
procesos empíricos de dimensión infinita Z
Estimadores consistentes basados en la estimación de núcleos
Hasta principios de los noventas, mis artículos, Bierens (1982,
1984, 1990) fueron la única literatura en pruebas de especificación de modelos consistentes.
A mediados de los noventas, una lista de literatura relacionada
emergió iniciando con
Stute, W., 1997, Nonparametric Model Checks for Regression, Annals of Statistics, 25, 613-641.
El análisis de Stute está bsado en el hecho que
Pr (E[U|X] = 0) < 1 ⇔ ∃x ∈ Rk : E [U.I(X ≤ x)] 6= 0.
Por lo tanto, varias pruebas consistentes pueden estar basadas
en el proceso empírico
n
X
bj I(Xj ≤ x),
U
In(x) = n−1/2
j=1
incluyendo una prueba de tipo ICM.
Escanciano, J.C. ,2006, A Consistent Diagnostic Test for Regression Models Using Projections, Econometric Theory, 22,
1030-1051
Combinando el análisis de Stute con mi análisis ICM.
Otra gran cantidad de literatura acerca de las pruebas de especificación de modelos emergió en los noventas en literatura estadística y econométrica basada en comparaciones,
de varias maneras , de formas funcionales paramétricas y de
estimadores no paramétricos correspondientemente.
Sin embargo,estas pruebas tenían únicamente poder no trivial contra alternativas que aproximan el núcleo a tasas más
√
bajas que n, y esta tasa decrece con la dimensión de X .
Pruebas consistentes para modelos de distribución condicional
Introducción
La máxima verosimilitud requiere que la distribución condicional de una (un vector de) variable(s) dependiente(s) Y ∈
Rm dado un vector X ∈ Rk de variables explicativas está
completamente parametrizado como
Pr [Y ≤ y|X] = F (y|X, θ0)
por ejemplo, donde
F (y|x; θ), θ ∈ Θ,
es una familiade funciones de distribución condicional, con
Θ ⊂ Rp un espacio paramétrico.
Para probar consistentemente la validez de esta especificación
, se necesita probar la hipótesis nula:
H0 : ∃θ0 ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ0)| = 0
a.s.
contra la hipótesis alternativa general que H0 es falsa:
H1 : ∀θ ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ)| > 0
a.s.,
dada una muestra aleatoria
(Y1, X1), ..., (Yn, Xn)
a partir de (Y, X).
Literatura publicada
La literatura publicada acerca de pruebas de consistencia se
limita a dos artículos:
Andrews, D.W., 1997, A Conditional Kolmogorov Test, Econometrica, 65, 1097-1128
propone una prueba de consistencia generalizando la prueba
de Kolmogorov
¯
¯ a:
¯
¯
n ³
´
¯
¯ 1 X
b
¯
Tn = max ¯ √
I(Yj ≤ Yi) − F (Yi|Xj , θ) I(Xj ≤ Xi)¯¯
1≤i≤n ¯ n
¯
j=1
√
Esta prueba es consistente y tiene poder no trivial n local.
Sin embargo, un problema práctico es tal que si la dimensión de Xj es grande, la desigualdad Xj < Xi puede nunca
ocurrir, incluso en muestras grandes.
Zheng, J.X., 2000, A Consistent Test of Conditional Parametric Distributions, Econometric Theory, 16, 667-691
propone una prueba para la valides de densidades condicionales
mediante la comparación de la densidad paramétrica condicional con un estimador no paramétrico del núcleo.
Por tanto, esta prueba es aplicable, únicamente a modelos
con distribución condicional absolutamente continua.
La prueba de Zheng tiene poder no trivial, pero únicamente
contra alternativas √
locales que aproximan el núcleo a una
tasa más lenta que n.
La prueba ICM para modelos de distribución condicional
Como una alternativa a las pruebas de Andrews(1997) y Zheng
(2000),
Bierens, H. J., and L. Wang, 2009, ’’Integrated Conditional
Moment Tests for Parametric Conditional Distributions’’,
enviaron para referato y publicación,
se propone una prueba ICM basada en la diferencia cuadrada
integrada de la función característica empírica utilizada por
el modelo estimado.
Las hipótesis:
H0 : ∃θ0 ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ0)| = 0
a.s.
H1 : ∀θ ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ)| > 0 a.s.
son equivalentes a:
H0 : ∃θ0 ∈ Θ ¯:
¯
R
0
0
¯
supτ ∈Rm E [exp(i.τ Y )|X] − exp(iτ y)dF (y|X, θ0)¯
= 0 a.s.
H1 : ∀θ ∈ Θ :¯
¯
R
0
0
¯
supτ ∈Rm E [exp(i.τ Y )|X] − exp(iτ y)dF (y|X, θ)¯
> 0 a.s.
respectivamente
Estas hipótesis son equivalentes a:
H0 ⇔
¯
¯
¯E [exp(i.τ 0Y ) exp(i.ξ 0X)]
sup
∃θ0 ∈ Θ :
¯
(τ,ξ)∈Rm ×Rk
∙Z
¸¯
¯
0
0
−E
exp(iτ y)dF (y|X, θ0) exp(i.ξ X) ¯¯ = 0
H1 ⇔
¯
¯
¯E [exp(i.τ 0Y ) exp(i.ξ 0X)]
∀θ ∈ Θ :
sup
¯
(τ,ξ)∈Rm ×Rk
∙Z
¸¯
¯
0
0
−E
exp(iτ y)dF (y|X, θ) exp(i.ξ X) ¯¯ > 0
Suponga que Y ∈ Rm y X ∈ Rk son vectores aleatoriosacotados.
Entonces ara valores arbitrarios de ε > 0,
H1 ⇔
¯
¯
¯E [exp(i.τ 0Y ) exp(i.ξ 0X)]
∀θ ∈ Θ :
sup
¯
||τ ||≤ε,||ξ||≤ε
∙Z
¸¯
¯
0
0
−E
exp(iτ y)dF (y|X, θ) exp(i.ξ X) ¯¯ > 0
Si los vectores aleatorios Y y X no son acotados, reemplácelos en las funcionesare complejas exp mediante aplicaciones
uno a uno, Φ1(Y ) and Φ2(X), respectivamente.
Por tanto, para valores arbitrarios de ε > 0,
H1 ⇔
¯
¯
¯E [exp(i.τ 0Φ1(Y ) exp(i.ξ 0Φ2(X))]
∀θ ∈ Θ :
sup
¯
||τ ||≤ε,||ξ||≤ε
¸¯
∙Z
¯
0
0
−E
exp(iτ Φ1(y)dF (y|X, θ) exp(i.ξ Φ2(X)) ¯¯ > 0
Por cuestiones de tiempo, asumiremos que Y y X son vectores aleatorios acotados.
Denote
∙µ
¶
Z
ς (τ, ξ; θ) = E exp (iτ 0Y ) − exp (iτ 0y) dF (y|X, θ)
× exp (iξ 0X)
Υ = ×m
j=1 [−τ j , τ j ] , τ j > 0,
£
¤
k
Ξ = ×j=1 −ξ j , ξ j , ξ j > 0,
y sea µ(τ, ξ) la distribución uniforme en Υ × Ξ.
Entoncs
H0 ⇔ ∃θ0 ∈ Θ :
H1 ⇔ ∀θ ∈ Θ :
Z
Υ×Ξ
|ς (τ, ξ; θ0)|2 dµ(τ, ξ) = 0
Υ×Ξ
|ς (τ, ξ; θ)|2 dµ(τ, ξ) > 0
Z
Esto sugiere que de manera similar a Bierens y Ploberger
(1997) la hipótesis nula puede ser probada por una prueba
ICM de la forma
Z
Tbn =
|Zn(τ, ξ)|2dµ(τ, ξ),
Υ×Ξ
donde
n µ
X
1
Zn(τ, ξ) = √
exp (iτ 0Yj )
n j=1
¶
Z
− exp (iτ 0y) dF (y|Xj , θ̂) exp (iξ 0Xj )
es un proceso empírico continuo de valores complejos en
Υ × Ξ, con θ̂ el estimador de cuasi máxima verosimilitud
(QML) es el estimador de θ0.
Propiedades asintóticas
Sean Y y X vectores aleatorios acotados. Bajo H0,
Zn ⇒ Z on Υ × Ξ,
donde Z es proceso Gaussiano complejo con media cero.
De aquí
Z por el teorema de la aplicación continua,
Z
Tbn =
d
Υ×Ξ
Bajo H1,
|Zn(τ, ξ)|2dµ(τ, ξ) → T =
p lim Tbn/n > 0,
n→∞
de aquí
p lim Tbn = ∞.
n→∞
Υ×Ξ
|Z(τ, ξ)|2dµ(τ, ξ).
Standarización
La condición par que Y y X sean vectores aleatorios no
es esencial, dado que se puede sin pérdida de generalidad,
reemplazar Y y X mediante aplicaciones uno a uno acotadas, Φ1(Y ) y Φ2(X), respectivamente.
Sin embargo, es importante estandarizar Y y X antes de
tomar cualquier transformación acotada para preservar suficiente variación en Φ1(Y ) y Φ2(X).
En particular, en el caso Y ∈ R, sea
¡ −1
¢
Φ1(Y ) = arctan σn (Y − µn) ,
donde µn y σn > 0 son parámetros de localización y escala.
Por ejemplo, escoja para µn la media muestral y la media
para σn el error estándar de la muestra es Y.
Siempre y cuando elijamos µn and σn tal que
√
√
n (µn − µ) = Op (1) , n (σn − σ) = Op (1)
esta estandarización no afecta a las propiedades asintóticas.
La distribución nula
La distribución nula Zasintótica
T =
Υ×Ξ
|Z(τ, ξ)|2dµ(τ, ξ)
depende de un complejo gausiano con media cero Z(τ, ξ),
quien a la vez está determinado por
h la función de covarianza.
i
Γ ((τ1, ξ1), (τ2, ξ2)) = E Z(τ1, ξ1)Z(τ2, ξ2) .
Considere el problema de valores propios:
Encuentre un valor porpio λ y su correpondiente función
propia ψ(τ, ξ)Ztales que
λψ(τ1, ξ1) =
Γ ((τ1, ξ1), (τ2, ξ2)) ψ(τ2, ξ2)dµ(τ2, ξ2).
Υ×Ξ
Este problema tiene muchas soluciones contables λj , ψj (τ, ξ),
j = 1, 2, 3, ......
Propiedades:
• Los valores propios λj son valores reales no negativos.n
• Las funciones propias ψj (τ, ξ) son de valores complejos y
ortonormales:
Z
ψj1 (τ, ξ)ψj2 (τ, ξ)dµ(τ, ξ) = I (j1 = j2)
Υ×Ξ
• Z(τ, ξ) =
P∞
j=1Zgj ψj (τ, ξ),
gj =
donde
Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ)
Υ×Ξ
• Teorema de Mercer
h
i
Γ ((τ1, ξ1), (τ2, ξ2)) = E Z(τ1, ξ1)Z(τ2, ξ2)
=
∞
X
j=1
λj ψj (τ, ξ)ψj (τ, ξ)
P∞
Z(τ, ξ) = j=1 gj ψj (τ, ξ) implica
Z
T =
|Z(τ, ξ)|2dµ(τ, ξ)
ZΥ×Ξ
=
Z(τ, ξ)Z(τ, ξ)dµ(τ, ξ)
Υ×Ξ ⎛
⎞
⎞⎛
Z
∞
∞
X
X
⎝
=
gj1 ψj1 (τ, ξ)⎠ ⎝
ψj2 (τ, ξ)g j2 ⎠ dµ(τ, ξ)
Υ×Ξ
=
=
=
j1 =1
∞
∞ X
X
j1 =1 j2 =1
∞
X
gj1
µZ
Υ×Ξ
j2 =1
¶
ψj1 (τ, ξ)ψj2 (τ, ξ)dµ(τ, ξ) g j
gj g j
j=1
∞
X
j=1
|gj |2, donde gj =
Z
Υ×Ξ
Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ)
Propiedades de gj =
R
Υ×Ξ Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ)
• los gj ’s son de valors complejos con media cero.
• E[gj1 g j2] = λj if j = j1 = j2, E[gj1 g j2] = 0 if j1 6= j2.
Lo anterior implica que gj es independiente.
p
0
• (Re(gj ), Im(gj )) ∼ λj ej donde ej ∼ N2 [0, I2] .
Por lo tanto ,
T =
Z
Υ×Ξ
∼
∞
X
|Z(τ, ξ)|2dµ(τ, ξ) =
∞
X
j=1
|gj |2
λj χ22,j
j=1
donde χ22,j ’s están distribuidos independientemente χ22.
Bootstrap paramétrico
Para b = 1, ..., M , genere las extracciones aleatorias Yeb,j a
patir de F (y|Xj , b
θ), y calcule el estadístico de prueba ICM
Tbb,n para cada muestra bootstrap (Yeb,1, X1), ...., (Yeb,n, Xn).
Entonces ³
´0
d
Tb1,n, ..., TbM,n → (T1, ..., TM )0 ,
donde los
aleatorias de la distribución
R Tb’s son realizaciones
de T = Υ×Ξ |Z(τ, ξ)|2dµ(τ, ξ).
En lugar de calgular los valores críticos bootstrap, es mas
conveniente calcular los p-valores bootstrap
M
´
1 X ³b
pbn,M =
I Tb,n > Tbn
M
b=1
y rechazar H0 al nivel de significancia α × 100% si pbn,M <
α.
Poder local
que
Sea Q(y|X) una función de distribución condicional √
no es idénticamente igual a F (y|X, θ0),y considere la nalternativa local
³
´
Fn(y|X, θ0) = 1 − n−1/2 F (y|X, θ0) + n−1/2Q(y|X)
Entonces
Tbn =
Z
|Zn(τ, ξ)|2dµ(τ, ξ)
Υ×Ξ
Z
d
→ Talt =
|Z(τ, ξ)|2dµ(τ, ξ)
Υ×Ξ
donde E [Z(τ, ξ)] 6= 0.
Denote
gj =
ηj =
Z
ZΥ×Ξ
(Z(τ, ξ) − E [Z(τ, ξ)]) ψj (τ, ξ)dµ(τ, ξ)
E [Z(τ, ξ)] ψj (τ, ξ)dµ(τ, ξ)
Υ×Ξ
Entonces
Talt =
Z
Υ×Ξ
|Z(τ, ξ)|2dµ(τ, ξ) =
∞
X
j=1
|ηj + gj |2
donde al menos uno de los ηj ’s es no nulo.
Esto implica que para todo K > 0,
Pr(Talt > K) > Pr(T > K).
√
Así la prueba ICM tiene poder no trivial contra n-alternativas
locales.
Dominio de integración
La elección de los hipercubos Υ y Ξ no afecta a la consistencia de la prueba ICM, pero puede afectar la potencia de la
muestra pequeña.
Por lo tanto, podemos mejorar la potencia de la muestra pequeña mediante la maximización del estadístico ICM Tbn para
Υ y Ξ, sujeto a las restricciones Υ ⊂ Υ ⊂ Υ y Ξ ⊂ Ξ ⊂ Ξ,
donde Υ y Υ son hipercubos dados en Rm y Ξ y Ξ son hipercubos dados en Rk , puesto que se puede demostrar bajo H0,
R
2
|Z
(τ,
ξ)|
dτ dξ/λ (Υ × Ξ)
n
Υ×Ξ
R
d
→ supΥ⊂Υ⊂Υ, Ξ⊂Ξ⊂Ξ Υ×Ξ |Z(τ, ξ)|2dτ dξ/λ (Υ × Ξ) ,
supΥ⊂Υ⊂Υ, Ξ⊂Ξ⊂Ξ
donde λ (Υ × Ξ) es la medida de Lebesgue Υ × Ξ.
Esto es verdadero, como se demostrará para el siguiente caso
especial.
Sean Υ (c) = [−c, c]m y Ξ (c) = [−c, c]k , donde c ∈ [c, c],
con 0 < c < c < ∞ constantes
Z
Z dadas, y sea
1
2
Tbn(c) =
|Z
(τ,
ξ)|
dτ dξ,
n
m+k
(2c)
ZΥ(c) ZΞ(c)
1
2
|Z(τ,
ξ)|
dτ dξ
T (c) =
(2c)m+k Υ(c) Ξ(c)
luego bajo H0,
d
sup Tbn(c) → sup T (c).
c≤c≤c
c≤c≤c
A pesar de que es demasiado ‘‘ pesado" computacionalmente
hablando, el cálculo del supremo de una manera exacta, este
resultado motiva a llevar a cabo la prueba ICM para varios
valores de c, y usar el máximo de Tbn(c) para estos valores en
la prueba ICM.
La prueba ICM simulada
Pocas distribuciones condicionales no tienen una expresión
cerrada para sus funciones características, especialmente si
Y debe ser transformada en primer primer lugar mediante
una transformación uno a uno acotada.
Para lidiar con este problema, se propone una prueba de momento condicional integrado: Simulated Integrated Conditional Moment (SICM) , en el cual la función característica
condicional³
´ Z
ϕ τ |X; b
θ = exp (i.τ 0y) dF (y|X, b
θ),
es reemplazada con exp(iτ 0Yej ), donde Ỹj es una realización
aleatoria de la distribución condicional estimada F (y|Xj ; θ̂).
Así el proceso empírico Zn(τ, ξ) es reemplazado por
n ³
´
X
1
(s)
0
0
Zbn (τ, ξ) = √
exp(iτ Yj ) − exp(iτ Yej )
n j=1
× exp(iξXj ).
El estadístico de prueba SICM es por lo tanto
Z Z
Tbn(s) =
|Zbn(s)(τ, ξ)|2dµ(τ, ξ).
Υ
Ξ
La principal ventaja de la prueba SICM es que la validez
de los complicados modelos condicionales de distribución
F (y|X ;θ) puede ser probada, simpre que sea posible generar
realizaciones aleatorias Ye a partir de ella.
(s)
Otra ventaja es que Tbn tiene una forma cerrada:
Con Y`,j , Ye`,j y X`,j las componenetes ` de Yj , Yej y Xj , respectivamente, tenemos
Z
Z
1
bn(s)(τ, ξ)|2dτ dξ
Tbn(s)(c) =
|
Z
(2c)m+k [−c,c]m [−c,c]k
⎛
³
´
e
e
n
n−1
m
m
2 X X ⎜Y sin (c(Y`,j1 − Y`,j2 )) Y sin c(Y`,j1 − Y`,j2 )
=
+
⎝
n j =1 j =j +1
c(Y`,j1 − Y`,j2 )
c(Ye`,j1 − Ye`,j2 )
`=1
`=1
1
2
1
³
´
³
´⎞
e
e`,j − Y`,j )
m sin c(Y
m sin c(Y
Y
Y
`,j1 − Y`,j2 )
1
2
⎟
−
−
⎠
e
e
c(Y`,j1 − Y`,j2 )
c(Y`,j1 − Y`,j2 )
`=1
`=1
⎛
³
´⎞
!
à k
e`,j )
n
m sin c(Y − Y
Y sin (c(X`,j − X`,j ))
X
Y
`,j
2
⎟
⎜
1
2
+
1
−
×
⎠
⎝
e
c(X`,j1 − X`,j2 )
n j=1
c(Y`,j − Y`,j )
`=1
`=1
bn(s)(τ, ξ) = Zn(τ, ξ) − Zen(s)(τ, ξ), donde
Sea Z
¶
Z
n µ
X
1
Zn(τ, ξ) = √
exp(iτ 0Yj ) − exp(iτ 0y)dF (y|Xj , θ̂)
n j=1
× exp(iξXj ),
¶
Z
n µ
X
1
Zen(s)(τ, ξ) = √
exp(iτ 0Ỹj ) − exp(iτ 0y)dF (y|Xj , θ̂)
n j=1
Bajo H0,
× exp(iξXj ).
d
Tbn(s) → Ts =
Z Z
Υ
Ξ
|Z(τ, ξ) − Zs(τ, ξ)|2dµ(τ, ξ),
donde Z es la misma ya mencionada, Zs es un proceso Gussiano de valores complejos con media cero, y Z y Zs son
independientes.
Bajo H1,
p lim Tbn(s)/n > 0.
n→∞
Ejecución en una pequeña muestra
La hipótesis nula es tal que la variable dependiente Y es generada por el modelo condicional de Poisson:
H0 : Y |X ∼ Poisson (exp(α + βX))
con datos reales que generen procesos de tipo Poisson y Binomial Negativos (NB) Logit:
(0)
H1 : Y |X ∼ Poisson (exp(X))
(1)
donde
H1 : Y |X ∼ NB(1, p(X))
(2)
H1 : Y |X ∼ NB(5, p(X))
(3)
H1 : Y |X ∼ NB(10, p(X))
p(x) = (1 + exp(−x))−1 , X ∼ N(0, 1).
El tamaño de la muestra es n = 200, el tamaño de la muestra
bootstrap es M = 500. el número de repeticiones es 200.
La prueba SICM utilizada es la prueba MAXSICM
n
o
(s)
(s)
(s)
(s)
(s)
max Tbn (5), Tbn (10), Tbn (15), Tbn (20), Tbn (25)
Ambas Y y X son primero estandarizadas tomando la desviación
de sus medias muestrales y dividiéndolas para sus errores
muestrales estándar, y luego usando la transformación arctan para que sean acotadas.
Los valores simulados Ye se transforman de una manera similar, utilizando la media muestral y los errores estándar muestrales de la verdadera variable Y .
(0)
H1
(1)
H1
(2)
H1
(3)
H1
Table 1: MAXSICM test
Rejection %
1% 5% 10% DGP:
0 5 10 Poisson (exp(X))
52 71 83 NB(1, p(X))
33 56 68 NB(5, p(X))
30 52 66 NB(10, p(X))
El tamaño empírico es muy bueno y el poder de la muestra pequeña contra las alternativas binomiales negativas es
el que se debía esperar para tal muestra.
Note que el decrecimiento en potencia es debido al hecho de
que la distribución condicional NB(m, p(X)) aproxima a la
distribución condicional de Poisson cuando m → ∞.
Aplicación a modelos de contabilidad económica de datos
en salud
Un modelo popular para la contabilidad de datos utiliza una
distribución condicional de Poisson.
La prueba MAXSICM será utilizada para probar si es que
un modelo condicional de Poisson está especificado correctamente.
Los datos provienen del estudio: 1987-1988 National Medical Expenditure Survey. Existen 4406 observaciones de individuos sobre la edad de 66 años.
La variable de interés,Y representan el número de visitas al
doctor por anciano, el cual está explicado por un vector de
varias variables de condiciones de salud y características demográficas.
Y # de visitas a doctores en un ambiente de oficina
X1 Condición de salud: excelentet X9 = 1 si es blanco
X2 Condición de salud:pobre
X10 = 1 si es masculino
X3 # de enfermedades crónicas
X11 = 1 si es casado
X4 estado de discapacidad
X12 años de escolaridad
X5 región: noreste
X13 ingreso familiar
X6 region: medioeste
X14 estado de ocupación
X7 region: oeste
X15 estado de seguro privado
X8 edad
X16 estado de seguridad social
Se concibe que los efectos de las variables X3 hasta X16 son
diferentes por persona con excelente salud (X1 = 1) y con
salud pobre(X2 = 1).
Por tanto, hemos aumentado la lista de variables con X1 ×
Xj and X2 × Xj para j = 3, 4, .., 16, de tal manera que el
número de variables reultantes es 44.
La prueba de hipótesis nula que se va a probar es condicional
es estas 44 variables explicativas, el número Y de visitas al
doctor por parte de los ancianos sigue una distribución de
Poisson con esperanza condicional µ (X) = exp((1, X 0)θ0).
Utilizarmos
n la prueba MAXSICM
o
max Tb(s)(5), Tb(s)(10), Tb(s)(15), Tb(s)(20), Tb(s)(25)
n
n
n
n
n
para probar la hipótesis de Poisson, con tamaño de muestra
bootstrap de 500.
Es suficiente incluir únicamente las 16 variables originales
como variables condicionantes en la prueba.
La variable dependiente Y y las 16 variablesn X han sido
estandarizadas y transformadas que en el estudio de simulación.
El valor de la prueba MAXSICM es 193.197, con p-valor
bootstrap virtualmente cero. Así el modelo de Poisson es
fuertemente rechazado.
Como una comparación hemos realizado también la prueba
de Cameron-Trivedi (1990), basada en la regresión
((Yj − µ
bj )2 − Yj )/b
µj = α.b
µj + εj ,
θ el estimador de máxima
donde µ
b = exp((1, X 0 )b
θ) con b
j
j
verosimilitud de θ0.
Bajo la hipótesis nula que la esperanza condicional y la varianza condicional de Yj sean iguales al parámetro, α debería
ser cero.
t de el estimador de
El estadístico de prueba es el t-valor b
mínimos cuadrados α
b de α. Los resultados son
α
b = 0.874068, b
t = 12.7497.
Así, la prueba de Cameron-Trivedi también rechaza fuertemente a la validez del modelo de Poisson.
Además se ha realizado otra comparación con la prueba Condicional Kolmogorov (CK) de Andrews (1997)
¯
¯
¯
¯
n ³
´
¯
¯ 1 X
b
¯
I(Yj ≤ Yi) − F (Yi|Xj , θ) I(Xj ≤ Xi)¯¯
max ¯ √
1≤i≤n ¯ n
¯
j=1
Sin embargo, para las 16 variables 16 la desigualdad Xj <
Xi para i 6=¯ j nunca sucedió así
que la prueba CK colapsó a
¯ √
√
¯
¯
b
max ¯1 − F (Yj |Xj , θ)¯ / n < 1/ n = 0.015.
1≤j≤n
Este problema no ocurre para nuestra prueba ICM.
Si
Y |X, V ∼ Poisson (V exp((1, X 0)θ0)) ,
donde V representa heterogeneidad no observada, la cual es
independiente de X , y si V tiene distribución Gama (m, β)
entonces la distribución condicional de Y dado X es de tipo
Logit Binomial Negativa(NBL):
Y |X ∼ NBL (m) ,
Si es así, entonces
p
α
b → 1/m
donde α
b es el parámetro de los estimadores OLS de el parámetro
α en el modelo de Cameron-Trivedi.
((Yj − µ
bj )2 − Yj )/b
µj = α.b
µj + εj .
Dado que 1/b
α ≈ 1.144 es relativamente cercano a m = 1
intentaremos ahora un modelo NBL(1).
El estadístico de la prueba MAXSICM involucrado en el
modelo NBL(1) es ahora 10.796, el cual es mucho más bajo
que en el caso de Poisson.
Sin embargo, el p-valor bootstrap es todavía virtualmente
cero, así que el modelo NBL(1) también es rechazado.
Lo mismo se aplica para el modelo NBL(2): el estadístico
de prueba MAXSICM es 15.990 con p-valor bootstrap nuevamente cercano a cero.
La estimación y las pruebas computacionales para estas aplicaciones han sido realizadas mediante la versión modificada
de EasyReg International, la cual puede ser obtenida de manera gratuita de
http://econ.la.psu.edu/~hbierens/EASYREG.HTM
Los módulos EasyReg involucrados están disponibles bajo
solicitud.
Descargar