Pruebas de Especificación de Modelos Consistentes Herman J. Bierens Pennsylvania State University Modelos de Esperanza Condicional Modelos de regresión Cross-section Dada una variable dependiente Y y un vector X ∈ Rk de variables explicativas, un modelo de regresión paramétrico tiene la forma Y = f (X, θ0) + U, donde • θ0 es un vector de parámetros desconocido contenido en un espacio paramétrico Θ ⊂ Rm, • U es un término de error que satisface E[U 2] < ∞, • f (x, θ) es una función conocida en Rk × Θ. Por ejemplo, en el caso de un modelo de regresión lineal, f (x, θ) = α + β 0x, θ = (α, β 0)0, Θ = Rk+1. El modelo Y = f (X, θ0) + U está especificado correctamente si H0 : ∃θ0 ∈ Θ : Pr (f (X, θ0) = E[Y |X]) = 1, y está especificado de una manera incorrecta si H1 : ∀θ ∈ Θ : Pr (f (X, θ) = E[Y |X]) < 1. En cualquier caso, sea h i 2 θ0 = arg min E (Y − f (X, θ)) . θ∈Θ Entonces H0 ⇔ Pr (E[U|X] = 0) = 1. H1 ⇔ Pr (E[U|X] = 0) < 1. La prueba de momento integrado condicional (ICM) La pregunta es: Cómo podemos probar la veracidad de la especificación funcional del modelo Y = f (X, θ0) + U tal que la prueba tenga potencia asintótica 1 contra H1. El primer artículo para revisar este problema es: Bierens, H.J., 1982, Consistent Model Specification Tests, Journal of Econometrics, 20, 105-134. El análisis en este artículo se basa en la unicidad de la transformada de Fourier de una función. Sea g (X) = E[U|X], con la transformada de Fourier ϕ(ξ) = E [g (X) exp (i.ξ 0X)] √ 0 k = E [U exp (i.ξ X)] , t ∈ R , i = −1. Entonces H0 ⇔ sup |ϕ(ξ)| = 0 ξ∈Rk H1 ⇔ sup |ϕ(ξ)| > 0 ξ∈Rk Pregunta: Dónde se puede buscar un ξ ∈ Rk tal que |ϕ(ξ)| > 0? Respuesta: • Si X es acotado entonces H1 ⇔ ∀δ > 0, sup |ϕ(ξ)| > 0 |ξ|≤δ • Si X no está acotado, sea Φ : Rk → Rk una aplicación uno a uno acotada y sea ϕ(ξ) = E [U exp (i.ξ 0Φ(X))] , ξ ∈ Rk . Entonces H1 ⇔ ∀δ > 0, sup |ϕ(ξ)| > 0 |ξ|≤δ Denote Ξ= ×k`=1 £ ¤ −ξ `, ξ ` , ξ ` > 0, y sea µ(ξ) la medida de probabilidad uniforme en Ξ. Entonces H0 ⇔ H1 ⇔ Z ZΞ Ξ 2 |E [U. exp (i.ξ 0Φ(X))]| dµ(ξ) = 0 2 |E [U. exp (i.ξ 0Φ(X))]| dµ(ξ) > 0 Estos resultados sugieren que, dada una muestra aleatoria (Y1, X1) , ..., (Yn, Xn) a partir de (Y, X), una prueba consistente puede estar basada en el estadístico de momento condicional integrado(ICM) Z ¯ ¯2 ¯ ¯ Tbn = ¯Zbn(ξ)¯ dµ(ξ), Ξ donde n con X 1 bj exp (i.ξ 0Φ(Xj )) , Zbn(ξ) = √ U n j=1 bj = Yj − f (Xj , b U θn) θn el estilos residuos no lineales de mínimos cuadrados, y b mador no lineal de mnimos cuadrados de θ0. En Bierens (1982) se demostró que d H0 ⇒ Tbn → T p H1 ⇒ Tbn/n → η > 0 Sin embargo, en ese entonces yo era úncamente capaz de encontrar una expresión para E[T ] pero no para la distribución nula limitante T . Por lo tanto, propuse la búsqueda de valores críticos de la prueba ICM tomando como base la desigualdad de Chebyshev para los primeros momentos. Me tomó hasta 1990 el darme cuenta cuál es la naturaleza de T para el caso real exp(.) : Bierens, H.J.,1990, A Consistent Conditional Moment Test of Functional Form, Econometrica, 58, 1443-1458. En este artículo, demostró que bajo H0 el proceso empírico n X 1 bj exp (ξ 0Φ(Xj )) , Zbn(ξ) = √ U n j=1 es ajustado en Ξ, y converge débilmente a un proceso Gaussianco con media ceroe Z(ξ): Zbn ⇒ Z. De aquí, bajo H0, Z Z d Tbn = Zbn(ξ)2dµ(ξ) → T = Z(ξ)2dµ(ξ) Ξ mientras que bajo H1, p Tbn/n → η > 0. Ξ Bierens, H.J. and Ploberger, W., 1997, Asymptotic Theory of Integrated Conditional Moment Tests, Econometrica, 65, 1129-1151. En este artículo se demostro que mis resultados previos se pueden extender a más procesos empíricos generales del tipo n X 1 bj w (ξ 0Φ(Xj )) , Zbn(ξ) = √ U n j=1 donde w(u) es una función con exponentes en un vecindario abierto de u = 0 tal que (d/du)sw(u) |u=06= 0 para todos excepto un número finito de números naturales s. Ver también Stinchcombe, M. and White, H., 1998, Consistent Specification Testing With Nuisance Parameters Present Only Under the Alternative, Econometric Theory, 14, 295-325. Además, para el caso de funciones ponderadoras de valores reales w(u) Bierens y Ploberger (1997) demostraron que Z ∞ X T = Z(ξ)2dµ(ξ) = λiε2i Ξ i=1 donde • los valores εi son i.d.d. con distribución N(0, 1) • los valores λi son los valores propios de la función de covarianza Γ(ξ1, ξ2) = E [Z(ξ1)Z(ξ2)] i.e., los valores λi son soluciones para el problema de valores propios Z λ.ψ(ξ1) = Γ(ξ1, ξ2)ψ(ξ2)dµ(ξ2) Ξ con funciones de valores propios correspondientes ψi(ξ) las cuales satisfacen Z ψi(ξ)ψj (ξ)dµ(ξ) = I(i = j). Ξ Además por el teorema de Mercer Γ(ξ1, ξ2) = E [Z(ξ1)Z(ξ2)] = ∞ X λiψ(ξ1)ψ(ξ2) i=1 Bierens y Ploberger (1997) propusieron usar el estadístico ICM R bn(ξ)2dµ(ξ) Z Ξ Ten = R b Ξ Γ(ξ, ξ)dµ(ξ) b ξ) es un estimador consistente de donde Γ(ξ, ∞ X ¤ £ Γ(ξ, ξ) = E Z(ξ)2 = λiψ(ξ)2. i=1 Entonces, bajo H0 P∞ 2 X̀ λ ε 1 d i i i=1 Ten → P∞ ≤ sup ε2i = T `≥1 ` i=1 i=1 λi Cotas superiores para los valores críticos pueden ahora si estar basados en T . Otros resultados: • La prueba ICM es admisible, i.e., no existe una prueba más poderosa uniformemente. • La prueba ICM √ tiene poder no trivial contra las alternativas locales de n : √ H1L : E[Y |X] = f (X, θ0) + g(X)/ n, Pr [g(X) = 0] < 1. Pruebas ICM consistentes para diferentes hipótesis de martingale Los modelos de regresión de series de tiempo tienen la forma Yt = ft−1 (θ0) + Ut donde ft−1 (θ0) = E (Yt|Zt−1, Zt−2, Zt−3, ....) con Zt = (Yt, Xt0)0. Por lo tanto, para probar la validez de la especificación ft−1 (θ) se debe probar de manera consistente las diferentes hipótesis martingale E (Ut|Zt−1, Zt−2, Zt−3, ....) = 0 Muchos artículos en la literatura ’’resuelven’’ este problema mediante la prueba E (Ut|Zt−1, Zt−2, Zt−3, ....Zt−`) = 0 para algunos `. finitos. Sin embargo, estas pruebas no son consistentes. Existen únicamente dos artículos que proponen pruebas consistentes de las diferentes hipótesis de martingale: Bierens, H.J., 1984, Model Specification Testing of Time Series Regressions, Journal of Econometrics, 26, 323-353 En este artículo propuse calcular para cada hipótesis E (Ut|Zt−1, Zt−2, Zt−3, ....Zt−`) = 0 una prueba ICM Tbn,`, y luego utilizar Ln X α`Tbn,` `=1 como el verdadero estadístico de prueba, donde α` es una secuencia P∞elegida a priori de constantes positivas que satisfacen `=1 α` < ∞, and Ln → ∞ as n → ∞. De Jong, R., 1996, The Bierens Test Under Data Dependence, Journal of Econometrics, 72, 1-32. En este artículo, Robert de Jong extendió la prueba ICM a bn(ξ). procesos empíricos de dimensión infinita Z Estimadores consistentes basados en la estimación de núcleos Hasta principios de los noventas, mis artículos, Bierens (1982, 1984, 1990) fueron la única literatura en pruebas de especificación de modelos consistentes. A mediados de los noventas, una lista de literatura relacionada emergió iniciando con Stute, W., 1997, Nonparametric Model Checks for Regression, Annals of Statistics, 25, 613-641. El análisis de Stute está bsado en el hecho que Pr (E[U|X] = 0) < 1 ⇔ ∃x ∈ Rk : E [U.I(X ≤ x)] 6= 0. Por lo tanto, varias pruebas consistentes pueden estar basadas en el proceso empírico n X bj I(Xj ≤ x), U In(x) = n−1/2 j=1 incluyendo una prueba de tipo ICM. Escanciano, J.C. ,2006, A Consistent Diagnostic Test for Regression Models Using Projections, Econometric Theory, 22, 1030-1051 Combinando el análisis de Stute con mi análisis ICM. Otra gran cantidad de literatura acerca de las pruebas de especificación de modelos emergió en los noventas en literatura estadística y econométrica basada en comparaciones, de varias maneras , de formas funcionales paramétricas y de estimadores no paramétricos correspondientemente. Sin embargo,estas pruebas tenían únicamente poder no trivial contra alternativas que aproximan el núcleo a tasas más √ bajas que n, y esta tasa decrece con la dimensión de X . Pruebas consistentes para modelos de distribución condicional Introducción La máxima verosimilitud requiere que la distribución condicional de una (un vector de) variable(s) dependiente(s) Y ∈ Rm dado un vector X ∈ Rk de variables explicativas está completamente parametrizado como Pr [Y ≤ y|X] = F (y|X, θ0) por ejemplo, donde F (y|x; θ), θ ∈ Θ, es una familiade funciones de distribución condicional, con Θ ⊂ Rp un espacio paramétrico. Para probar consistentemente la validez de esta especificación , se necesita probar la hipótesis nula: H0 : ∃θ0 ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ0)| = 0 a.s. contra la hipótesis alternativa general que H0 es falsa: H1 : ∀θ ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ)| > 0 a.s., dada una muestra aleatoria (Y1, X1), ..., (Yn, Xn) a partir de (Y, X). Literatura publicada La literatura publicada acerca de pruebas de consistencia se limita a dos artículos: Andrews, D.W., 1997, A Conditional Kolmogorov Test, Econometrica, 65, 1097-1128 propone una prueba de consistencia generalizando la prueba de Kolmogorov ¯ ¯ a: ¯ ¯ n ³ ´ ¯ ¯ 1 X b ¯ Tn = max ¯ √ I(Yj ≤ Yi) − F (Yi|Xj , θ) I(Xj ≤ Xi)¯¯ 1≤i≤n ¯ n ¯ j=1 √ Esta prueba es consistente y tiene poder no trivial n local. Sin embargo, un problema práctico es tal que si la dimensión de Xj es grande, la desigualdad Xj < Xi puede nunca ocurrir, incluso en muestras grandes. Zheng, J.X., 2000, A Consistent Test of Conditional Parametric Distributions, Econometric Theory, 16, 667-691 propone una prueba para la valides de densidades condicionales mediante la comparación de la densidad paramétrica condicional con un estimador no paramétrico del núcleo. Por tanto, esta prueba es aplicable, únicamente a modelos con distribución condicional absolutamente continua. La prueba de Zheng tiene poder no trivial, pero únicamente contra alternativas √ locales que aproximan el núcleo a una tasa más lenta que n. La prueba ICM para modelos de distribución condicional Como una alternativa a las pruebas de Andrews(1997) y Zheng (2000), Bierens, H. J., and L. Wang, 2009, ’’Integrated Conditional Moment Tests for Parametric Conditional Distributions’’, enviaron para referato y publicación, se propone una prueba ICM basada en la diferencia cuadrada integrada de la función característica empírica utilizada por el modelo estimado. Las hipótesis: H0 : ∃θ0 ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ0)| = 0 a.s. H1 : ∀θ ∈ Θ, supy∈Rm |Pr[Y ≤ y|X] − F (y|X; θ)| > 0 a.s. son equivalentes a: H0 : ∃θ0 ∈ Θ ¯: ¯ R 0 0 ¯ supτ ∈Rm E [exp(i.τ Y )|X] − exp(iτ y)dF (y|X, θ0)¯ = 0 a.s. H1 : ∀θ ∈ Θ :¯ ¯ R 0 0 ¯ supτ ∈Rm E [exp(i.τ Y )|X] − exp(iτ y)dF (y|X, θ)¯ > 0 a.s. respectivamente Estas hipótesis son equivalentes a: H0 ⇔ ¯ ¯ ¯E [exp(i.τ 0Y ) exp(i.ξ 0X)] sup ∃θ0 ∈ Θ : ¯ (τ,ξ)∈Rm ×Rk ∙Z ¸¯ ¯ 0 0 −E exp(iτ y)dF (y|X, θ0) exp(i.ξ X) ¯¯ = 0 H1 ⇔ ¯ ¯ ¯E [exp(i.τ 0Y ) exp(i.ξ 0X)] ∀θ ∈ Θ : sup ¯ (τ,ξ)∈Rm ×Rk ∙Z ¸¯ ¯ 0 0 −E exp(iτ y)dF (y|X, θ) exp(i.ξ X) ¯¯ > 0 Suponga que Y ∈ Rm y X ∈ Rk son vectores aleatoriosacotados. Entonces ara valores arbitrarios de ε > 0, H1 ⇔ ¯ ¯ ¯E [exp(i.τ 0Y ) exp(i.ξ 0X)] ∀θ ∈ Θ : sup ¯ ||τ ||≤ε,||ξ||≤ε ∙Z ¸¯ ¯ 0 0 −E exp(iτ y)dF (y|X, θ) exp(i.ξ X) ¯¯ > 0 Si los vectores aleatorios Y y X no son acotados, reemplácelos en las funcionesare complejas exp mediante aplicaciones uno a uno, Φ1(Y ) and Φ2(X), respectivamente. Por tanto, para valores arbitrarios de ε > 0, H1 ⇔ ¯ ¯ ¯E [exp(i.τ 0Φ1(Y ) exp(i.ξ 0Φ2(X))] ∀θ ∈ Θ : sup ¯ ||τ ||≤ε,||ξ||≤ε ¸¯ ∙Z ¯ 0 0 −E exp(iτ Φ1(y)dF (y|X, θ) exp(i.ξ Φ2(X)) ¯¯ > 0 Por cuestiones de tiempo, asumiremos que Y y X son vectores aleatorios acotados. Denote ∙µ ¶ Z ς (τ, ξ; θ) = E exp (iτ 0Y ) − exp (iτ 0y) dF (y|X, θ) × exp (iξ 0X) Υ = ×m j=1 [−τ j , τ j ] , τ j > 0, £ ¤ k Ξ = ×j=1 −ξ j , ξ j , ξ j > 0, y sea µ(τ, ξ) la distribución uniforme en Υ × Ξ. Entoncs H0 ⇔ ∃θ0 ∈ Θ : H1 ⇔ ∀θ ∈ Θ : Z Υ×Ξ |ς (τ, ξ; θ0)|2 dµ(τ, ξ) = 0 Υ×Ξ |ς (τ, ξ; θ)|2 dµ(τ, ξ) > 0 Z Esto sugiere que de manera similar a Bierens y Ploberger (1997) la hipótesis nula puede ser probada por una prueba ICM de la forma Z Tbn = |Zn(τ, ξ)|2dµ(τ, ξ), Υ×Ξ donde n µ X 1 Zn(τ, ξ) = √ exp (iτ 0Yj ) n j=1 ¶ Z − exp (iτ 0y) dF (y|Xj , θ̂) exp (iξ 0Xj ) es un proceso empírico continuo de valores complejos en Υ × Ξ, con θ̂ el estimador de cuasi máxima verosimilitud (QML) es el estimador de θ0. Propiedades asintóticas Sean Y y X vectores aleatorios acotados. Bajo H0, Zn ⇒ Z on Υ × Ξ, donde Z es proceso Gaussiano complejo con media cero. De aquí Z por el teorema de la aplicación continua, Z Tbn = d Υ×Ξ Bajo H1, |Zn(τ, ξ)|2dµ(τ, ξ) → T = p lim Tbn/n > 0, n→∞ de aquí p lim Tbn = ∞. n→∞ Υ×Ξ |Z(τ, ξ)|2dµ(τ, ξ). Standarización La condición par que Y y X sean vectores aleatorios no es esencial, dado que se puede sin pérdida de generalidad, reemplazar Y y X mediante aplicaciones uno a uno acotadas, Φ1(Y ) y Φ2(X), respectivamente. Sin embargo, es importante estandarizar Y y X antes de tomar cualquier transformación acotada para preservar suficiente variación en Φ1(Y ) y Φ2(X). En particular, en el caso Y ∈ R, sea ¡ −1 ¢ Φ1(Y ) = arctan σn (Y − µn) , donde µn y σn > 0 son parámetros de localización y escala. Por ejemplo, escoja para µn la media muestral y la media para σn el error estándar de la muestra es Y. Siempre y cuando elijamos µn and σn tal que √ √ n (µn − µ) = Op (1) , n (σn − σ) = Op (1) esta estandarización no afecta a las propiedades asintóticas. La distribución nula La distribución nula Zasintótica T = Υ×Ξ |Z(τ, ξ)|2dµ(τ, ξ) depende de un complejo gausiano con media cero Z(τ, ξ), quien a la vez está determinado por h la función de covarianza. i Γ ((τ1, ξ1), (τ2, ξ2)) = E Z(τ1, ξ1)Z(τ2, ξ2) . Considere el problema de valores propios: Encuentre un valor porpio λ y su correpondiente función propia ψ(τ, ξ)Ztales que λψ(τ1, ξ1) = Γ ((τ1, ξ1), (τ2, ξ2)) ψ(τ2, ξ2)dµ(τ2, ξ2). Υ×Ξ Este problema tiene muchas soluciones contables λj , ψj (τ, ξ), j = 1, 2, 3, ...... Propiedades: • Los valores propios λj son valores reales no negativos.n • Las funciones propias ψj (τ, ξ) son de valores complejos y ortonormales: Z ψj1 (τ, ξ)ψj2 (τ, ξ)dµ(τ, ξ) = I (j1 = j2) Υ×Ξ • Z(τ, ξ) = P∞ j=1Zgj ψj (τ, ξ), gj = donde Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ) Υ×Ξ • Teorema de Mercer h i Γ ((τ1, ξ1), (τ2, ξ2)) = E Z(τ1, ξ1)Z(τ2, ξ2) = ∞ X j=1 λj ψj (τ, ξ)ψj (τ, ξ) P∞ Z(τ, ξ) = j=1 gj ψj (τ, ξ) implica Z T = |Z(τ, ξ)|2dµ(τ, ξ) ZΥ×Ξ = Z(τ, ξ)Z(τ, ξ)dµ(τ, ξ) Υ×Ξ ⎛ ⎞ ⎞⎛ Z ∞ ∞ X X ⎝ = gj1 ψj1 (τ, ξ)⎠ ⎝ ψj2 (τ, ξ)g j2 ⎠ dµ(τ, ξ) Υ×Ξ = = = j1 =1 ∞ ∞ X X j1 =1 j2 =1 ∞ X gj1 µZ Υ×Ξ j2 =1 ¶ ψj1 (τ, ξ)ψj2 (τ, ξ)dµ(τ, ξ) g j gj g j j=1 ∞ X j=1 |gj |2, donde gj = Z Υ×Ξ Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ) Propiedades de gj = R Υ×Ξ Z(τ, ξ)ψj (τ, ξ)dµ(τ, ξ) • los gj ’s son de valors complejos con media cero. • E[gj1 g j2] = λj if j = j1 = j2, E[gj1 g j2] = 0 if j1 6= j2. Lo anterior implica que gj es independiente. p 0 • (Re(gj ), Im(gj )) ∼ λj ej donde ej ∼ N2 [0, I2] . Por lo tanto , T = Z Υ×Ξ ∼ ∞ X |Z(τ, ξ)|2dµ(τ, ξ) = ∞ X j=1 |gj |2 λj χ22,j j=1 donde χ22,j ’s están distribuidos independientemente χ22. Bootstrap paramétrico Para b = 1, ..., M , genere las extracciones aleatorias Yeb,j a patir de F (y|Xj , b θ), y calcule el estadístico de prueba ICM Tbb,n para cada muestra bootstrap (Yeb,1, X1), ...., (Yeb,n, Xn). Entonces ³ ´0 d Tb1,n, ..., TbM,n → (T1, ..., TM )0 , donde los aleatorias de la distribución R Tb’s son realizaciones de T = Υ×Ξ |Z(τ, ξ)|2dµ(τ, ξ). En lugar de calgular los valores críticos bootstrap, es mas conveniente calcular los p-valores bootstrap M ´ 1 X ³b pbn,M = I Tb,n > Tbn M b=1 y rechazar H0 al nivel de significancia α × 100% si pbn,M < α. Poder local que Sea Q(y|X) una función de distribución condicional √ no es idénticamente igual a F (y|X, θ0),y considere la nalternativa local ³ ´ Fn(y|X, θ0) = 1 − n−1/2 F (y|X, θ0) + n−1/2Q(y|X) Entonces Tbn = Z |Zn(τ, ξ)|2dµ(τ, ξ) Υ×Ξ Z d → Talt = |Z(τ, ξ)|2dµ(τ, ξ) Υ×Ξ donde E [Z(τ, ξ)] 6= 0. Denote gj = ηj = Z ZΥ×Ξ (Z(τ, ξ) − E [Z(τ, ξ)]) ψj (τ, ξ)dµ(τ, ξ) E [Z(τ, ξ)] ψj (τ, ξ)dµ(τ, ξ) Υ×Ξ Entonces Talt = Z Υ×Ξ |Z(τ, ξ)|2dµ(τ, ξ) = ∞ X j=1 |ηj + gj |2 donde al menos uno de los ηj ’s es no nulo. Esto implica que para todo K > 0, Pr(Talt > K) > Pr(T > K). √ Así la prueba ICM tiene poder no trivial contra n-alternativas locales. Dominio de integración La elección de los hipercubos Υ y Ξ no afecta a la consistencia de la prueba ICM, pero puede afectar la potencia de la muestra pequeña. Por lo tanto, podemos mejorar la potencia de la muestra pequeña mediante la maximización del estadístico ICM Tbn para Υ y Ξ, sujeto a las restricciones Υ ⊂ Υ ⊂ Υ y Ξ ⊂ Ξ ⊂ Ξ, donde Υ y Υ son hipercubos dados en Rm y Ξ y Ξ son hipercubos dados en Rk , puesto que se puede demostrar bajo H0, R 2 |Z (τ, ξ)| dτ dξ/λ (Υ × Ξ) n Υ×Ξ R d → supΥ⊂Υ⊂Υ, Ξ⊂Ξ⊂Ξ Υ×Ξ |Z(τ, ξ)|2dτ dξ/λ (Υ × Ξ) , supΥ⊂Υ⊂Υ, Ξ⊂Ξ⊂Ξ donde λ (Υ × Ξ) es la medida de Lebesgue Υ × Ξ. Esto es verdadero, como se demostrará para el siguiente caso especial. Sean Υ (c) = [−c, c]m y Ξ (c) = [−c, c]k , donde c ∈ [c, c], con 0 < c < c < ∞ constantes Z Z dadas, y sea 1 2 Tbn(c) = |Z (τ, ξ)| dτ dξ, n m+k (2c) ZΥ(c) ZΞ(c) 1 2 |Z(τ, ξ)| dτ dξ T (c) = (2c)m+k Υ(c) Ξ(c) luego bajo H0, d sup Tbn(c) → sup T (c). c≤c≤c c≤c≤c A pesar de que es demasiado ‘‘ pesado" computacionalmente hablando, el cálculo del supremo de una manera exacta, este resultado motiva a llevar a cabo la prueba ICM para varios valores de c, y usar el máximo de Tbn(c) para estos valores en la prueba ICM. La prueba ICM simulada Pocas distribuciones condicionales no tienen una expresión cerrada para sus funciones características, especialmente si Y debe ser transformada en primer primer lugar mediante una transformación uno a uno acotada. Para lidiar con este problema, se propone una prueba de momento condicional integrado: Simulated Integrated Conditional Moment (SICM) , en el cual la función característica condicional³ ´ Z ϕ τ |X; b θ = exp (i.τ 0y) dF (y|X, b θ), es reemplazada con exp(iτ 0Yej ), donde Ỹj es una realización aleatoria de la distribución condicional estimada F (y|Xj ; θ̂). Así el proceso empírico Zn(τ, ξ) es reemplazado por n ³ ´ X 1 (s) 0 0 Zbn (τ, ξ) = √ exp(iτ Yj ) − exp(iτ Yej ) n j=1 × exp(iξXj ). El estadístico de prueba SICM es por lo tanto Z Z Tbn(s) = |Zbn(s)(τ, ξ)|2dµ(τ, ξ). Υ Ξ La principal ventaja de la prueba SICM es que la validez de los complicados modelos condicionales de distribución F (y|X ;θ) puede ser probada, simpre que sea posible generar realizaciones aleatorias Ye a partir de ella. (s) Otra ventaja es que Tbn tiene una forma cerrada: Con Y`,j , Ye`,j y X`,j las componenetes ` de Yj , Yej y Xj , respectivamente, tenemos Z Z 1 bn(s)(τ, ξ)|2dτ dξ Tbn(s)(c) = | Z (2c)m+k [−c,c]m [−c,c]k ⎛ ³ ´ e e n n−1 m m 2 X X ⎜Y sin (c(Y`,j1 − Y`,j2 )) Y sin c(Y`,j1 − Y`,j2 ) = + ⎝ n j =1 j =j +1 c(Y`,j1 − Y`,j2 ) c(Ye`,j1 − Ye`,j2 ) `=1 `=1 1 2 1 ³ ´ ³ ´⎞ e e`,j − Y`,j ) m sin c(Y m sin c(Y Y Y `,j1 − Y`,j2 ) 1 2 ⎟ − − ⎠ e e c(Y`,j1 − Y`,j2 ) c(Y`,j1 − Y`,j2 ) `=1 `=1 ⎛ ³ ´⎞ ! à k e`,j ) n m sin c(Y − Y Y sin (c(X`,j − X`,j )) X Y `,j 2 ⎟ ⎜ 1 2 + 1 − × ⎠ ⎝ e c(X`,j1 − X`,j2 ) n j=1 c(Y`,j − Y`,j ) `=1 `=1 bn(s)(τ, ξ) = Zn(τ, ξ) − Zen(s)(τ, ξ), donde Sea Z ¶ Z n µ X 1 Zn(τ, ξ) = √ exp(iτ 0Yj ) − exp(iτ 0y)dF (y|Xj , θ̂) n j=1 × exp(iξXj ), ¶ Z n µ X 1 Zen(s)(τ, ξ) = √ exp(iτ 0Ỹj ) − exp(iτ 0y)dF (y|Xj , θ̂) n j=1 Bajo H0, × exp(iξXj ). d Tbn(s) → Ts = Z Z Υ Ξ |Z(τ, ξ) − Zs(τ, ξ)|2dµ(τ, ξ), donde Z es la misma ya mencionada, Zs es un proceso Gussiano de valores complejos con media cero, y Z y Zs son independientes. Bajo H1, p lim Tbn(s)/n > 0. n→∞ Ejecución en una pequeña muestra La hipótesis nula es tal que la variable dependiente Y es generada por el modelo condicional de Poisson: H0 : Y |X ∼ Poisson (exp(α + βX)) con datos reales que generen procesos de tipo Poisson y Binomial Negativos (NB) Logit: (0) H1 : Y |X ∼ Poisson (exp(X)) (1) donde H1 : Y |X ∼ NB(1, p(X)) (2) H1 : Y |X ∼ NB(5, p(X)) (3) H1 : Y |X ∼ NB(10, p(X)) p(x) = (1 + exp(−x))−1 , X ∼ N(0, 1). El tamaño de la muestra es n = 200, el tamaño de la muestra bootstrap es M = 500. el número de repeticiones es 200. La prueba SICM utilizada es la prueba MAXSICM n o (s) (s) (s) (s) (s) max Tbn (5), Tbn (10), Tbn (15), Tbn (20), Tbn (25) Ambas Y y X son primero estandarizadas tomando la desviación de sus medias muestrales y dividiéndolas para sus errores muestrales estándar, y luego usando la transformación arctan para que sean acotadas. Los valores simulados Ye se transforman de una manera similar, utilizando la media muestral y los errores estándar muestrales de la verdadera variable Y . (0) H1 (1) H1 (2) H1 (3) H1 Table 1: MAXSICM test Rejection % 1% 5% 10% DGP: 0 5 10 Poisson (exp(X)) 52 71 83 NB(1, p(X)) 33 56 68 NB(5, p(X)) 30 52 66 NB(10, p(X)) El tamaño empírico es muy bueno y el poder de la muestra pequeña contra las alternativas binomiales negativas es el que se debía esperar para tal muestra. Note que el decrecimiento en potencia es debido al hecho de que la distribución condicional NB(m, p(X)) aproxima a la distribución condicional de Poisson cuando m → ∞. Aplicación a modelos de contabilidad económica de datos en salud Un modelo popular para la contabilidad de datos utiliza una distribución condicional de Poisson. La prueba MAXSICM será utilizada para probar si es que un modelo condicional de Poisson está especificado correctamente. Los datos provienen del estudio: 1987-1988 National Medical Expenditure Survey. Existen 4406 observaciones de individuos sobre la edad de 66 años. La variable de interés,Y representan el número de visitas al doctor por anciano, el cual está explicado por un vector de varias variables de condiciones de salud y características demográficas. Y # de visitas a doctores en un ambiente de oficina X1 Condición de salud: excelentet X9 = 1 si es blanco X2 Condición de salud:pobre X10 = 1 si es masculino X3 # de enfermedades crónicas X11 = 1 si es casado X4 estado de discapacidad X12 años de escolaridad X5 región: noreste X13 ingreso familiar X6 region: medioeste X14 estado de ocupación X7 region: oeste X15 estado de seguro privado X8 edad X16 estado de seguridad social Se concibe que los efectos de las variables X3 hasta X16 son diferentes por persona con excelente salud (X1 = 1) y con salud pobre(X2 = 1). Por tanto, hemos aumentado la lista de variables con X1 × Xj and X2 × Xj para j = 3, 4, .., 16, de tal manera que el número de variables reultantes es 44. La prueba de hipótesis nula que se va a probar es condicional es estas 44 variables explicativas, el número Y de visitas al doctor por parte de los ancianos sigue una distribución de Poisson con esperanza condicional µ (X) = exp((1, X 0)θ0). Utilizarmos n la prueba MAXSICM o max Tb(s)(5), Tb(s)(10), Tb(s)(15), Tb(s)(20), Tb(s)(25) n n n n n para probar la hipótesis de Poisson, con tamaño de muestra bootstrap de 500. Es suficiente incluir únicamente las 16 variables originales como variables condicionantes en la prueba. La variable dependiente Y y las 16 variablesn X han sido estandarizadas y transformadas que en el estudio de simulación. El valor de la prueba MAXSICM es 193.197, con p-valor bootstrap virtualmente cero. Así el modelo de Poisson es fuertemente rechazado. Como una comparación hemos realizado también la prueba de Cameron-Trivedi (1990), basada en la regresión ((Yj − µ bj )2 − Yj )/b µj = α.b µj + εj , θ el estimador de máxima donde µ b = exp((1, X 0 )b θ) con b j j verosimilitud de θ0. Bajo la hipótesis nula que la esperanza condicional y la varianza condicional de Yj sean iguales al parámetro, α debería ser cero. t de el estimador de El estadístico de prueba es el t-valor b mínimos cuadrados α b de α. Los resultados son α b = 0.874068, b t = 12.7497. Así, la prueba de Cameron-Trivedi también rechaza fuertemente a la validez del modelo de Poisson. Además se ha realizado otra comparación con la prueba Condicional Kolmogorov (CK) de Andrews (1997) ¯ ¯ ¯ ¯ n ³ ´ ¯ ¯ 1 X b ¯ I(Yj ≤ Yi) − F (Yi|Xj , θ) I(Xj ≤ Xi)¯¯ max ¯ √ 1≤i≤n ¯ n ¯ j=1 Sin embargo, para las 16 variables 16 la desigualdad Xj < Xi para i 6=¯ j nunca sucedió así que la prueba CK colapsó a ¯ √ √ ¯ ¯ b max ¯1 − F (Yj |Xj , θ)¯ / n < 1/ n = 0.015. 1≤j≤n Este problema no ocurre para nuestra prueba ICM. Si Y |X, V ∼ Poisson (V exp((1, X 0)θ0)) , donde V representa heterogeneidad no observada, la cual es independiente de X , y si V tiene distribución Gama (m, β) entonces la distribución condicional de Y dado X es de tipo Logit Binomial Negativa(NBL): Y |X ∼ NBL (m) , Si es así, entonces p α b → 1/m donde α b es el parámetro de los estimadores OLS de el parámetro α en el modelo de Cameron-Trivedi. ((Yj − µ bj )2 − Yj )/b µj = α.b µj + εj . Dado que 1/b α ≈ 1.144 es relativamente cercano a m = 1 intentaremos ahora un modelo NBL(1). El estadístico de la prueba MAXSICM involucrado en el modelo NBL(1) es ahora 10.796, el cual es mucho más bajo que en el caso de Poisson. Sin embargo, el p-valor bootstrap es todavía virtualmente cero, así que el modelo NBL(1) también es rechazado. Lo mismo se aplica para el modelo NBL(2): el estadístico de prueba MAXSICM es 15.990 con p-valor bootstrap nuevamente cercano a cero. La estimación y las pruebas computacionales para estas aplicaciones han sido realizadas mediante la versión modificada de EasyReg International, la cual puede ser obtenida de manera gratuita de http://econ.la.psu.edu/~hbierens/EASYREG.HTM Los módulos EasyReg involucrados están disponibles bajo solicitud.