Contrastes de autocorrelacion espacial. Un estudio de Monte Carlo.

Anuncio
ESTADISTICA ESPAÑOLA
Vol. 34, Núm. 130, 1992, págs. 285 a 307
Contrastes de autocorrelación espacial .
Un estudio de Monte Carlo ( *)
por
JESUS MUR LACAMBRA
Departamento de Análisis Económico
Facultad de Ciencias Econbmicas y Ernpresariales
Universidad de Zaragoza
RESUMEN
En este artículo se trata de comparar varios procedimientos propuestos para contrastar la autocorrelacián espacial. Después de una
breve referencia a sus causas y consecuencias se presenta un
análisis de algunos contrastes desarrollados en la literatura, de los
cuales se eligen dos y, mediante un experimento de Monte Carlo, se
comparan sus propiedades para diferentes tamaños muestrales y
bajo diferentes configuraciones espaciales.
Palabras clave.^ Autocorrelación espacial, estadístico de Moran,
multiplicador de Lagrange, experimento de Mante Carlo.
Clasificación AMS: 62P20, 9oA19.
(*) Este trabajo ha sido realizado dentro del proyecto C^NAI HS-20/90. EI autor desea
agradecer las útiles sugerencias formuladas por los profesores J. H. P. Paelinck, J. M. Otero, A.
Novales, M. T. Aparicio y J. Trivez, que juzgaron la Tesis doctoral de la que este artículo extrae
parte del material, así como el gran apoyo encontrado en el profesor A. Aznar, director de la
misma.
'?if^
1.
[.ti f r^[)I^T I( .^ I^;f'A!V( ^ l A
INTRODUCCION
En este trabajo se presentan los resultados de un estudio de Monte Carlo,
cuyo objetivo es examinar el comportamiento de dos contrastes de autocorrelación
espacial en un contexto de muestras finitas.
En la sección 2 se introduce el concepto, causas y consecuencias de la
existencia de un proceso de autocorrelación espacial en las perturbaciones
aleatorias de un modelo econométrico regional. En la sección 3 se examinan los
distintos contrastes de autocorrelación espacial propuestos en la literatura para,
después de comentar sus propiedades y características, seleccionar los dos
estadísticos que parecen ofrecer mayores garantías. Como las propiedades de
estos dos estadisticos sólo han sido obtenidas en un contexto asint^itico, parece
interesante comprobar qué ocurre en un contexto de muestras finitas. Con este
fin, en ia sección 4 se diseña un estudio de Monte Carlo que cubre un conjunto
arnplio de supuestos, y en la 5 se da cuenta de los resultados alcanzados. EI
trabajo finaliza con una serie de conclusiones que se pueden extraer del ejercicia.
2.
^A AUTOCORRELACION ESPACIAL
La característica fundamental de un modelo econométrico espacial es que
trata de explicar cierta variable, observada en una serie de puntos del espacio,
a través de un conjunto de variables observadas en los mismos puntos. Es
decir, el modelo econométrico viene definido por su dimensión espacial, por lo
que deberá tenerse en cuenta que estos datos son fuertemente interdependientes.
A esta circunstancia se refiere Tobler (1970) como «la primera ley de la geografía: cualquier cosa está relacionada con cualquier otra, pero las cosas cercanas
est^n más relacionadas que las distantes», e insisten Cliff y Ord (1981) cuando
dicen que «la propiedad básica de los datos localizados espacialmente es que
el conjunto de valores {x^}, están seguramente relacionados sobre el espacio».
No obstante, la validez de esta proposición está condicionada por el nivel de
agregacián espacial definido y los criterios de regionalización empleados [véase Griffith {1988), Arbia (1989) o Mur (1990)J.
Con carácter general, un modelo econométrico regional autocorrelado
espacialmente puede escribirse como:
y=x^i+u
[2.1]
u= p Wu+^
[2 . 2]
^^N(O,cs2I)
[2.3]
('ONTRAti[f^;ti I)f^. AIICO('OKItFI.A{'ION f^:til'A('IAI,. l1N f^tiTlJl)I( ^ f)f. ti1^ ^ ti[f ^-11t1^ ^
_'^7
siendo y el vector de T observaciones de la variable endógena sobre las T
regiones en las que se ha dividido el espacio relevante, X la matriz de orden T^k
de observaciones en esas mismas regiones, de las k variables exógenas del
modelo y u el vector de T perturbaciones aleatorias, autocorrelado espacialmente
tal como se indica en [2.2]. En esta última expresión, ^ es un vector de ruidos
b{ancos, p es un par^metro de autocorrelación que traduce la intensidad de las
dependencias, y W es la denominada matriz de contactos, cuya función es
indicar, para cada región, el conjunto de regiones con las que ésta es
interdependiente.
EI modelo reflejado en las ecuaciones [2.1 ] a[2.3] no difiere sustancialmente
del modelo econométrico típico con datos de series temporales y perturbación
autorregresiva. La peculiaridad del mismo procede de su dimensián espacial, ya
que, con respecto al tiempo, las relaciones son unidireccionales (del pasado
sobre el presente), mientras que en el espacio son multidireccionales (potencialmente de una región con el resto de regiones). Con respecto a la matriz W
hay que dilucidar dos cuestiones: qué valores se asigna a fos elementos {w^^} de
la misma y en base a qué criterios. En relación al primer punto, la solucián más
empleada es la propuesta par ^1^Aoran (1950}, consistente en asignar un uno al
elemento (i, j) de la matriz W cuando la región i recibe influencias de la j y cero
en otro caso [pueden encontrarse otras alternativas en Cliff et al. (1975), Arora
y Brown (1977) o Hordijk (1978)). Pero, para distribuir este conjunto de unos y
ceros sobre la rnatriz, es necesario conocer el entramado de dependencias
subyacente entre las regiones. Cuando esto no es posible, es preferible utilizar
el criterio de contigi^idad por el cual wi^ será igual a 1 si entre las regiones i y j
existe contacto físico y cero en otro caso. En consecuencia, la matriz W debería
ser simétrica y de tipo binario.
Por último, las consecuencias sobre los estimadores MCO de la existencia
de un proceso de autocorrelación espacial son más perniciosas que en un
contexto temporal, ya que estos estimadores na son consistentes (Anselin,
1988}.
3.
CONTRASTES DE AUTC)CORRELACION ESPACIAL
En términos generales se pueden distinguir dos grupos diferentes de contrastes de autocorrelacián: el primero de ellos, que denominamos contrastes adhoc, incluye una serie de contrastes basados en estadísticos previamente desarrollados en un contexto temporal, y que han sido adaptados al ámbito espacial;
ios del segundo grupo son ei resultado de aplicar el principio máximo-verosímil
al modelo econométrica formulado en [2.1 ] a[2.3].
f,ti rA[)Iti"11('A F^iPA[^tl)(..A
^K^{
Los estadísticos en los que se basan los contrastes ad-hoc, pueden obtenerse
todos ellos como caso particular del denominado estadístico general de productos cruzados:
T
r ^r1 k^is+I
[3.1]
intraducido por Knox ( 1964), en el que k^1 es una medida de interacción entre los
puntos (o regianes) i y j, y s;^ una medida de similitud entre esos dos puntos en
relación a un determinado atributo.
Se puede identificar el conjunto {k;^} con el conjunto {w^} de elementos de la
matriz de contactos. Por otra parte, la medida de similitud puede tener naturaleza cualitativa, formulada en términos de presencia-ausencia de un determinado
atributo en un punto del espacio, o bien cuantitativa. En el primer caso, el
objetiva del análisis será comprobar si la existencia de un determinado atributo
en una región favorece (autocorrelación positiva) o perjudica ( autocorrelación
negativa) !a posibiiidad de que ese misma atributo se manifieste en regiones
circundantes a aquélla. Este estudio puede Ilevarse a cabo utilizando los estadísticos NN, BB y BN, cuyas propiedades y características se detallan en Cliff y
Ord (1981).
Cuando !a medida de interacción es de naturaleza cuantitativa, el concepto
de autocorrelación se perfila con más claridad: el estadistico r medirá hasta qué
punto tienden a producirse concentraciones de regiones en las cuales se observan valores altos del atribu#o, frente a otras regiones caracterizadas por una
escasa dotacián dei mismo. EI caso inverso, autocorrelación espacial negativa,
se produce cuando una concentración elevada del atributo en una región genera
efectos negativas externos para sus vecinas.
En la líteratura pueden encantrarse al menos tres contrastes de autocorrelacián
aplicables a datos cuantitat'rvos, corno san los basados en el estadistico de
Moran (1950}, en el de Geary (1954) y en el de Dacey (1965) y denominados
estadísticos , I, c y d, respectivamente. La obtención de los momentos de estos
estadísticos, asf como sus distribuciones probabilísticas, es compleja dada la
multidireccionalidad de las conexiones; pero no es posible para la d de Dacey.
Por lo cual, los únicos utílízables son la I de Moran y la c de Geary, cuyas
expresiones son :
T
I=
`S©
^,^T w;,(X;-X) (x -X)
`^ T f
2
L.1i=^ \X;-X)
[3.2)
('ON`TKAS'1'F,:S l)f^ AlJ`I'O('ORRt^,LA('I(1N t^.Sl'A('IAI.. l^N t^tiflil)f(t I)f
C i
T-1
^Tw
(X t-X J)^
^1
^l
ZSa
^T ^ {X^-X)2
ti1(tNlf ( ^1Kltt
^K^)
[3.3]
siendo x la observación de la variable x en la región j-ésima, x la rnedia
muestral de la misma y So=^;^w;^ (con ^;^ nos referimos al doble sumatorio de
forma abreviada).
Con respecto a estos dos últimos estadisticos, todos los indicios tienden a
señalar que es preferible la I de Moran. Así, Cliff y l7rd (1981) demuestran que
la I es asintóticamente rnás potente que la c de Geary, conclusión que se ve
corroborada mediante varias simulaciones que Ilevan a cabo ambos autores.
Adicionalmente, King (1981) demuestra que el de Moran es el test localrnente
más potente para contrastar la hipótesis nula Ho: p=0 frente a alternativas del
tipo HA: p>0. En consecuencia y utilizando estos resultados, puede decirse que
el contraste de autocorrelación espacial basado en la I de Moran es el que
ofrece rnás garantías de todo el grupo de contrastes ad-hoc.
Los momentos de primer y segundo orden del estadístico I para los residuos
MCO de un modelo de regresión, obtenidos en un contexto asintótico y bajo el
supuesto de una perturbación incorrelada, son los siguientes [en Cliff y Ord
(1981 } y Anselin (1988) pueden encontrarse los detalles]:
__ ^^w^
I
[3.4]
A , A
U
E [I]=-
^
tr(X X)-'X^WX
T-k
3 . 5]
[tr(X X)-'X'WX]^+tr(MWMW}+tr(MWMW')
E [I2]=
V [I]=E [I2l-(E [I])2
( T-k) ( T-k-2 )
[3 . 6]
[3.7]
siendo M la matriz [l-X(X'X)-'X'], ú=y-X^3, y ^i el vector de estimadores MCO de
[2.1]. Por último, Sen ( 1976) obtiene las condiciones de suficiencia que garantizan la distribucián asintóticamente normal del estadístico, las cuales tienden a
garantizar que la estructura espacial del sistema regional, captada en la matriz
W, esté mínimamente articulada.
^ yC!
E^.STA[:)ItiTlt'A FSPAPJ()LA
EI segundo grupo de contrastes se obtienen de la aplicacián del principio
rnáximo-verosimil al modelo econométrico de [2.1 ] a[2.3], el cual incluye el
contraste de Wald, el contraste del ratio de verosimilitud y el del multiplicador de
Lagrange. Estos tres contrastes gozan de propiedades óptimas en un contexto
asintdtico y han sido usados con profusión.
Una cuestión previa de importancia se refiere a la definición de la función de
verosimilitud del modelo. Tomando como punto de referencia la expresián del
modelo de ^2.1 ] a[2.3], esta función es:
^(Y^Q^ aa^ P)=(2n6z)-ri2 exp{- 1
2c^2
(y-X(3)'A'A(y-X[i)} ^ A ^
[3.8]
siendo A=(I-pW} que se obtiene de hacer ^={/-pVt^u en [2.2], y ^ A ^ el determinante jacobiano de la transformación lineal ^=Au. EI determinante de la matriz A
se obtiene como ei producto de sus T raíces características, las cuales se
obtienen a partir de las ra íces de la matriz W como: µ^=1-p^ , siendo µ^ y^,^ la jésima raíz característica de A y W, respectivamente. Es decir, se cumple que:
T
T
IA I =^ µ^ ^ (1-p^)
l=^
1=^
[3 . 9]
Este determinante debe ser estrictamente mayor que cero, lo cual implica
que: p^ ^ 1^ ^+'(b'j). Esta expresión sintetiza la importancia del operador espacial
W en la especificación del modelo econométrico regional. Debe ser capaz de
captar el mecanisrno de interacción subyacente en el sistema regional, limitando el rango de valores que puede tomar el coeficiente de autocorrelación
espacial. Un estudio más detallado de las propiedades de esta matriz servirá
para acotar el problema.
Por hipótesis, los elementos de la diagonal principal de W son todos cero,
siendo su traza igual a cero, lo cual implica que sus raíces características
deberán ser tanto positivas como negativas de forma que su suma se compense. Por otro lado, corno W es una matriz no negativa e indescomponible,
utilizando el Teorema de Perron-Frobenius, existirá una raíz característica positiva y simple cuyo módulo excede al del resto de raíces. Sea esta raíz ^,+, y sea
^,_ la raíz negativa de mayor valor absoluto (ésta puede ser múltiple), que
cumplen:
^1,+> I ^ j I ^ %l,+ ) < I ^ j I -1
( ^C7^j )
^,+>^^, ^^^,+,^^^ ^-,
Teniendo en cuenta estos resultados, se puede representar gráficamente el
valor de ^ A ^ en función del valor de p, como [Mur ( 1990}]:
t'ONTFtAti"T^E.S Df^: AUTO('URRE:LAt'ION t^tii'A('IAL. l1N E tiiUf)IU [)t: !^1( ^ NTt c',Akl.^ ^
^^a ^
Figura 3.1
EI determinante de A se anula para todos aquellos valores de p en los que
este coeficiente se hace igual a 1/^,^ (j=1, 2, ..., T}, teniendo una forrna sinusoidal
y con tendencia a ser explasiva. Lo que interesa remarcar es que la función ^ A ^
es regular de forma cóncava para valores del coeficiente comprendidos entre
^,=^<p<^,«^, entre los cuales está acotada como: 0< ^ A^<1. EI resto de posibles
valores del coeficiente deben desecharse a la vista de la figura 3.1. Esta
solución puede mejorarse utilizando el Teorema de Fisher, por el cual el valor
de ^,+ está acotado entre:
rmin
<
+
<
^ nax
[ 3 .10 ]
siendo r la suma de los elementos de la j-ésirna fila (o columna), y m^n y rrn^X los
valores mínimo y máximo, respectivamente, de esas sumas. Si cada elemento
de la matriz W se divide por la suma de los elementos de su fila (o columna)
respectiva, m^^ será igual a maX y ambos igual a 1, y el máximo valor que puede
tomar p es también igual a 1. Haciendo esta transformación, la acotación
anteriar se convierte en:
^,l^<p<1
[3.10]
Tras estas precisiones, se puede pasar a comentar las características de los
tres test de autocorrelación espacial que incluimos en este segundo grupo de
contrastes. En el modelo econométrico de [2.1 ] a[2.3] se puede definir el vector
,y,
t^:ti^1 A()ItiTIt.^A E^:SPAti()l.A
de parámetros 8'-[p, a2, pJ', siendo L(yl8) el logaritmo de la función de verosimilitud del modelo. Supóngase que se desea contrastar s restricciones lineales
sobre el vec#or de par^metras, H^: RB=ro, frente a la hipótesis alternativa HA: R9^ro,
donde R es una matriz de constantes de orden s•(k+2} y ro un vector de orden
s• 1, igualmente de constantes. En este caso, se obtiene el test de Wald como:
^
^
W=[R8-ro)' [R^(8)-, ^q']-, [R9 _ro]^S x2( S)
[3.11 ]
siendo ^(8)^' la inversa de la matriz de información. También puede obtenerse
el contraste del ratio de verosimilitudes:
,^
_
[3.12]
LR=-2[L(Y/8R)-L( y/^)]^S x2(S)
^
siendo 8R el correspondiente estimador máximo-verosímil restringido, y el contraste de los multiplicadores de Lagrange:
^
^
LM=^,R,[R^(e)
[3.13]
^^q']^,R^Sx2(S)
^
donde ^.R es la estimacián máximo-verosimil del vector de s multiplicadores,
obtenida del correspondiente problema de maximización restringida [véase Rao
(1965), Engle (1984) y Gadfrey (1988)]. Está demostrado en ia literatura que los
tres contrastes gozan de todas las propiedades asintóticas deseables siendo
asintóticamente equivalentes, aun cuando pueden producirse discrepancias entre ellos para rnuestras de tamaña finito.
Para contrastar la hipótesis nula Ho: p=0 frente a la alternativa HA: p^0, estos
tres contrastes se obtienen a partir del lagaritmo de la función de verosimilitud
del modeio:
L[y/8]=-
T
2
/og2n-
T
2
2
loga -- [y--X^]'A'A[y-X^]
2
2a
+^T log(1-p^^) [3.14]
^_ ^
EI conjunto de (k+2) condiciones necesarias de máximo en [3.14] se obtienen como:
^
aL(y, 8) -©^
^^ ^ ^^
[y'A'AX-R'X'A'AXJ _0
a2
^R
^
c^L(Y^ 8) __0^
^á2
aL(y, 6) ^
-0^
^P
_
^^^
^
T + (Y-x^)'A'^(Y-XR) =0
262
2a4
(y-X[3)'A' W(y-Xa)
T
-^í ^.2
+ ^ ^ -0
6
/_^ 1--p^
[3.15]
t'ON"I^RAtiTF^:ti 1)t•. All^^^O('t)RREt_^C'IC)N F:SF't^C^l:^ ^ L l1N Fti"Tl1Ul( ^ UF- !^1(aN^II^ C^:^Ki t^
?^)^
....
Obsórvese que se utiliza la expresión A para indicar la estimación rnáximoverosímil de la matriz. De la primera y segunda ecuación se obtiene, respectivamente:
^
^^
^^
(3= [X'A'AX ] -' [X'A 'A y]
[3.16]
^^ ^
^! u'A'Au
[3.17]
T
^
^
^
donde u=y-X[i. La estimación de p puede obtenerse Ilevando [3.16] y[3.17] a
[3.14]:
^ ^ ^
^
T
^
^
,
[ 3.18 ]
log{1-p^, )
L(ylj3, a2, p)oc- T log 62+
2
^! ^
cuya maximización implica la minimización de:
r
log[á2 ^ (1-p^,^ y2^^]
^_^
[3.19]
expresión en la cual se puede implementar un proceso de optimización iterativa
no lineal [métodos alternativos de resolución, en cualquier caso complejos,
pueden encontrarse en ^rd (1975), Anselin (1988) y Griffith (1988)]. Por otro
lado, como la restricción impuesta en 9 es que p=o, introduciéndola en el
proceso de optimización, los estimadores máximo-verosímiles restringidos se
convierten en:
^
.....
RR=[X'x]-,x,y
ú ' ^^
,,,.,
6R= ,r
PR-^
Finalmente, la inversa de la matriz de información obtenida bajo la hipótesis
nula y alternativa, respectivamente, es la siguiente {Anselin, 1988):
,
-E Í^ a2L(.Y^e)] ^1
^eae' ^ Ho
a2{x'x)--^ o
0
0
a
-
264
0
T
0 (tr[(W+W')W])-' I
[3.20]
F:ti'T AI)I^TI('A F:^PAÑOL.A
az(X'A'A^ '
0
_,E ^ ^ZL{Y^)] ^
ae^e' J
0
0
2a2td^+d2)
0
-2a2d3
T{d,+d2}--2d^2
T(d,+d2)--2d32
-2a2da
2d3 _^
[ d , +d2- -^ ^
T{d,+d2}--2d^z
[3.21]
T
siendo d,=tr[WA-']'[WA-'], d^=^
^,j2(1-p^)2 y d^=tr[WA-']
j=1
Utilizando todos estos resultados, y sustituyendo en fas expresiones del test
de Wald y en la de los multiplicadores de Lagrange la inversa de la matriz de
informacíón por la estimación consistente respectiva, se obtienen las expresiones finales de los tres contrastes, que resultan ser:
r
LR= T[Iog6R logá2]+2 ^ log(1 p^.}ásx2^,^
j=1
[3.22]
W-p [ T(d, +d2}-2d3]a^2t, ^
[3.23]
LM=
T
tr[(W'+W)W]
ú' Wú 2
ú'ú
2
asx c^^
[3.24]
Observando las expresiones [3.22], [3.23] y[3.24] resulta evidente la notable simplicidad del estadístico LM frente al LR o a W, ya que, para su aplicación,
basta con obtener los estimadores MCO de los parámetros de posición del
modelo, mientras que para utilizar el W o eí LR es necesario resolver un
proceso de optimización iterativa no lineal complejo. Esta razón aconseja seleccionar el estadístico LM frente a los otros dos.
4.
M
D1SEN0 DEL ESTUDIO DE MONTE CARLO
En esta sección se plantea un estudio de Monte Carlo en el que se examina
el comportamiento de los estadísticos seleccionados en la sección anterior
sobre muestras finitas, y utilizando varias especificaciones del operador espacial.
295
('ONTRASTE:S DE AI^TOC'OftREI.,A("I<)N E^:^PAC:'IAL. l1N EtiT'll[)IO UE^ MONTEi. (^ARI (a
EI proceso generador de datos (PGD): Se corresponde con el modelo
econométrico de [2.1 ] a[2.3], que reescribimos a continuación:
[4.1 ]
Y^=X',R+u,
r
u.-P
[4.2]
^ wrjuj+ ^r
j= ^
^,--N(0; ^s2)
r=1, 2, . . . , T
[4.3]
EI objetivo del experimento es investigar dos técnicas econométricas: el
contraste de autocorrelación espacial basado en la I de Moran de las expresiones [3.4] a[3.7], y el del multiplicador de Lagrange de [3.24]. Los eiementos del
PGD que parecen esenciales son los siguientes:
La matriz de contactos entre regiones W.
EI parámetro de autocorrelación espacial p.
EI rnodelo econométrico simulado y la generación de la parte sistemática
y aleatoria del mismo.
EI tarnaño de la muestra y número d'e replicacíones del experimento.
A continuación comentamos brevemente las decisiones tomadas al respecto.
E/ parámetro de autocorre/ación espacial: EI rango de valores que puede
tomar este parámetro depende de la especificación de la matriz W. No obstante,
si la matriz se define de tipo binario ponderada, la acotación relevante de
valores del parámetro es la de [3.10], cualquiera que sea la matriz de contactos.
Esta parece la solución más satisfactoria. En consecuencia, con respecto al
parámetro p, sólo se van a simular valores no negativos comprendidos entre
cero y la unidad. De esta forma, los resultados de la simulación con respecto a
un mismo valor del parámetro p serán directamente comparables, cualquiera
que sea la rnatriz de contactos empleada y el tamaño de la muestra.
La matriz de contactos entre regiones: Esta matriz desernpeña un papel
crucial en cualquier contraste de correlación espacial. Por ello, parece conveniente introducir en la simulación varios tipos de matrices para comprobar la
robustez de los resultados. Se han utilizado dos tipos de matrices, que denorninaremos como matrices espaciales y matrices aespaciales. Las prirneras se
corresponden directamente con el sisterna regional español (es decir, se han
construido en base a un sistema de regiones que existe en la realidad), mientras
que las segundas se construyen de forma artificial sin que exista un mapa
^^)(^
E^^1 A[^ISTIc^A F.tif'AÑc aL.A
regional que las respalde. De estas últimas se han especificado dos tipos que
denominaremos de tipo 1 y de tipo II. En las primeras se ha supuesto que cada
regián tiene contacto con otras cuatro regiones, mientras que en las segundas
se supone que el 50% de las regiones tienen contacto con otras dos regiones, y
el 50% restante lo #ienen con otras seis. De esta forma, las matrices aespaciales
de tipo I se asocian a sisternas regionales equilibrados, mientras que las de tipo
li se asocian a sistemas peor articulados que las anteriores. Igualmente se han
utilizada dos matrices de tipo espacial, como son las obtenidas del sistema de
comunidades autónomas y de provincias español ( en ambos casos se han
excluido las Islas Canarias).
Modelo simulado y generación de la parte sistemática y aleatoria: EI modelo
econométrico que sirve de base para la simulación es el siguiente:
y^=-0.2235+0.2379x^r+0.0843x2^+0.2621 x3r+u^
[4.4]
el cual se corresponde con el de la expresión [4.1 ], y está tomado de Aznar et
a/. (1989). ^a perturbacián u, se obtiene de acuerdo a la expresión [4.2], y el
ruido blanco ^r se genera aleatoriamente de acuerdo a[4.3] con 6=0.052, valor
estimado en el citado modelo econométrico. Finalmente, la obtención de los
datos relativos a las variables exógenas ha seguido un doble camino, dependiendo de si la matriz de contactos es espacial o aespacial:
En el primer caso, los datos se toman directamente de las comunidades y
provincias españolas en el año 1985, año para el que se estimó el modelo de
[4.4]. Cuando se usa una matriz aespacial, se ha diseñado un método especifico de generación artificial de datos, que asegura la congruencia de éstos con
los observados en la realidad española. Es#o último ha sido necesario puesto
que, como se comentará más adelante, se desea utilizar muestras de tamaño
100 para las que no se dispon ía de suficientes datos observados, caso de no
recurrir a otras soluciones menos satisfactorias (duplicacián de datos, utilización de datos panel, etc.). Este método se basa en la técnica de componentes
principales, siendo capaz de generar una muestra del tamaño deseado, manteniendo la estructura de correlaciones observada en la muestra original, lo cual
garantiza que los resultados de la sirnulación no se verán afectados por el
mayor o menor grado de colinealidad existente en muestras diferentes [los
detalles pueden verse en Mur (1990)].
Tamaño muestra/ y número de replicaciones: En el ejercicio se utilizaran
cinco tamaños rnuestrales: 16 y 48 con matrices espaciales y 20, 50 y 100 con
las matrices aespaciales, y el número de replicaciones efectuado en cada
experimento ha sido 1.000.
l'ONf'KAti`i'E•.ti O[- AUTOt'{)KKE-L.A('ION f-tif`At'IAI._ l1N [tiTl![)I{)[)f ti1^ ^ ^1i[ ( 1Ft[t ^
5.
^^)7
RESULTADOS DEL EXPERIMENTO DE MONTE CAR^O
En la sección anterior se han definido las características de este ejercicio de
simulación, en el que se pretende examinar el comportamiento de los contrastes
I de Moran y LM. ^a cobertura del estudio es lirnitada, dado el gran número de
factores que intervienen en el mismo. No obstante, las conclusiones que se
obtengan estarán cimentadas en un número de replicaciones que ofrece garantías. Estas conclusiones se presentan agrupadas en torno a dos situaciones de
interés: simulación bajo la hipótesis nula (p=0) y ba ^ o la hipátesis alternativa
(P^0).
Resultados de la sirnulación bajo la hipótesis nula (p=0)
Los resultados del ejercicio ba ^ o este supuesto se detallan en las dos tablas
siguientes. La primera examina el grado de ajuste de la distribución muestral de
ambos estadísticos a las distribuciones teóricas supuestas. En la siguiente se
presenta el nivel de significación estimado en cada uno de los contrastes.
En la tabla 5.1 aparecen los resultados del contraste de Kolmogorov-Srnirnov
y del estadístico A/C aplicado al misrno conjunto de datos. EI primero es un
contraste bien conocido en la literatura, y su ob ^etivo es contrastar la hipótesis
nufa de que la función de distribución que ha generado una serie de observaciones (en este caso las 1.000 replicaciones de los estadísticos) se corresponde
con una determinada función identificada por el investigador. Es decir, Ho:
F(x)=Fo(x), donde Fa(x) es la función de distribución sornetida a contraste, que
se corresponde con la N(0,1) para la I de Moran (previamente el valor del
estadístico se ha estandarizado) y con la x2^1^ para el LM.
Por otro lado, la utilización del estadístico AIC ha sido muy habitual para
resolver problemas de selección de modelos econométricos [Akaike (1973),
Sakamoto et al. (1986), Aznar (1989)]. EI problema que aqu í nos ocu pa puede
entenderse igualmente como uno de selección de modelos y resolverse utilizando el estadístico A/C. La filosofía que subyace a este estadístico es la
de seleccionar aquel modelo econométrico que aporta un contenido inforrna-tivo mayor. En nuestro caso, tenemos para los estadísticos I y LM una función
de distribución empírica y una función de distribución teórica, caracterizada
cada una de ellas por una determinada distribución de la masa de probabilidad
total sobre el espacio probabilístico. Tomando como referencia la función de
distribución teórica, este espacio probabilístico se puede dividir en una colec-
^^)X
f^^+TAI)IS"Tlt'A E;Sf'AÑl)L..A
Tabla 5.1
Matriz de tipo 1
T= 20
T= 50
T=100
Estadistico I de Moran
Kolmogorov-Smirnov ..................................................
Criterio A!C ...................................................................
1,2017
0,7906
0,9171
-8,5102
-13,5410
-12,9573
Estadistico L.M
Kolrnogorov-Smirnov ...................................................
1,0752
1,2965
0,6325
Criterio AIC ..................................................................
--4, 5494
-2,5812
-8,3331
Matriz de tipo 11
T=20
T=50
T=100
Estadistico t de Moran
K©Imogorov-Smírnov ..................................................
2,4982(*)
Criterio A!C ...................................................................
-7,2276
0,4743
0,7589
-15,7521
-14,2091
Estadístico LM
Kolmogorov-Smirnov ..................................................
1,6128(*)
Criterio AIC ..................................................................
- 38
, 669
Matrices especiates
0,7273
0,6641
- 90
, 233
- 66
, 049
T=16
T=48
Estadístico I de Moran
Kolmogorov-Smirnov ...................................................
Criterio AfC ...................................................................
1,3282
-11,0554
1,0436
-12,2892
Estadístico LM
Kolmogorov-Smirnov ..................................................
1,3914(^*)
Criterio AIC ...................................................................
(*)
(*')
-5,5636
1,7076(**)
-7,6024
Se rechaza a ambos niveles.
Se acepta al 1% y rechaza al 5% de nivel de significación.
ción de intervalos equiprobabilísticos, y medir la verosimilitud del modelo teórico como:
Pr[n^, n2, ..., nklp^, p2, ..., pk]=
n!
n ^^ . n2.^ . . . nk.^ p^n'
p2n2 ... pk^k
L5- ^^
siendo p^ =p (dj } la probabilidad asignada a cada uno de los k intervalos, n^ el
número de observaciones censadas en el intervalo j y n=E k ^ n^ _^1.000. Como el
número de parámetros libres del modelo teórico es cero, fa expresión [5.1] mide
ya directamente el contenido informativo de este rnodelo. Con respecto al
('C)NTRASTE:S [)f.^ Al1TO('ORFtf:LA('ION ESf'A('IAL_. [1N f^,STI ^ [)IO U!- MON"1
.AFtI ()
?^t)
modelo empírico se debe utilizar la misrna expresión [5.1 ], pero la probabilidad
que esta distribución asigna a cada uno de los k intervalos antes definidos viene
dada por p^=(n,n), y los grados de libertad del modelo son (k-1). En consecuencia, el contenido informativo del modelo teórico [AIC(1)] y el del modeto ernpírico [AIC(2)] se puede medir como:
Al C( 1 )=-21og
AIC(2)=-21og
n!
I^2 n2 ... pk ^^
I
n, . n2.1 . . . nk ! p n ^
n!
n^ ^, n2 ^2
n^!nZ! ... nk!
n
n
[5.2]
nk n k +2(k-1)
n
[5.3]
EI criterio AIC aconseja seleccionar el modelo con un valor del estadístico
menor, por lo que una regla de comparación útil puede estar basada en la
diferencia:
T
AIC(1)-AIC(2)=^
n. log(n^)-n log(pn)-(k-1)
j=1
si es negativa seleccionaremos ia distribución teórica; en caso contrario el
resultado de la simulación indica que ésta no es una buena aproximación.
Teniendo en cuenta ios resultados del contraste de Kolmogorov-Smirnov,
parece claro que la adherencia de las distribuciones muestrales de ambos
estadísticos a la distribución teórica respectiva es bastante pobre cuando el
tamaño muestral es reducido pero mejora al aumentar éste. No obstante, para la
I de Moran el salto de 20 a 50 observaciones parece suficiente para alcanzar un
ajuste aceptable, mientras que para el LM parecen ser necesarias un rnayor
número de observaciones. Por otro lado, también parece claro que ambos
estadísticos se ajustan mejor a la distribución teórica cuando la matriz de
contactos tiende a ser regular, aunque con un tamaño muestral grande el efecto
se diluye.
Por lo que respecta a la utilización del estadístico AIC podría pensarse que
los resultados son decepcionantes, dado su escaso poder discriminatorio: en
todos los casos, la distribución teórica es preferida a la empírica. No obstante,
estos resultados podían ser previsibles por cuanto al enfrentar el contenido
informativo de un modelo teórico al de un modelo empíríco ( pero sín teoría),
únicamente se está señalando para aquél un rnínimo de información adicional a
la puramente muestral, la cual, en este caso, parece que los dos modelos
aportan.
En la tabla 5.2 aparecen !os niveles de significación estimados para cada
t^ti t AUttiTI('A ^°SPANI)t_A
Tabla 5.2
Matriz de tipo I
T=20
T=100
T=50
Nivel de significación
LM
I
LM
t
LM
!
0,01 ............................................
0,05 ............................................
0,10 ............................................
2
25
71
10
45
89
6
37
74
13
43
83
2
39
93
7
44
83
Matriz de tipo 11
Nivel de significación
0,01 ............................................
0,05 ............................................
0,10 ............................................
T=20
T=50
T=100
LM
t
LM
t
LM
1
1
21
67
13
50
90
9
43
110
9
49
113
14
46
97
13
56
98
Matrices espaciales
T=16
T=48
Nivel de sig^nificación
LM
t
LM
I
0,01 ............................................
0,05 ............................................
0,10 ............................................
0
23
52
15
47
92
5
46
108
14
49
97
uno de los supuestos que se analizan. Esta tabla se ha construido de la
siguiente forma: para las 1.000 replicaciones del experimento en las que se ha
utilízado un valor de p igual a cero, se resuelven ambos contrastes de la
hipótesis nula Ho: p=0 frente a la alternativa HA: p^0. Los valores que aparecen
en esta tabla indican e! número de contrastes sobre el total de 1.000, en los
cuales se rechaza la hipótesis nula al nivel de significación del 1%, del 5% o del
10%, respectivamente. En este sentido, es importante que el nivel de significación estimado se aproxime 1o más posible al teórico, lo cual significa que, al
menos en las colas, las distribuciones teóricas y empiricas de ambos estadísticos tienden a solaparse.
Las conclusiones que se extraen de esta tabla abundan en la misma dirección que las obtenidas de la tabla anterior. Así, a medida que aumenta el
tamaño de la muestra el nivel de significación estimado se aproxima al teórico.
Pero la mejoría que se observaba en la tabla anterior al pasar de la matriz tipo
II a la de tipo I(rnás regular) aparece más diluida, e incluso para un tamaño
muestral de 100 puede entenderse que el efecto es de empeoramiento. No
obstante, lo que si es evidente es que el estadístico LM tiende a subestimar de
forma muy acusada el nivel de significación teórico del contraste, en comparación a la 1 de Moran.
('ONTRASTF^ti [)f• Al1Tf)(^UR^Rf-:LAC'ION t:SPAC'I^AL. t^N f^STI^UIO C)f^ M( ^ N I^t^ (^:1k1 ^^
3U 1
Resultados de la simulación bajo la hipótesis alternativa (p^Oj
En este caso se ha simutada el modelo de [4.1 ] a[4.3] utilizando valores de1
parámetro p distintos de cero progresivamente mayores, y el objetivo es comprobar ía potencia de los contrastes. La función de potencia de ambos estadísticos se puede estimar medíante el número de veces en las que se rechaza la
hipótesis nula Ho: p=0.
Los valores del parámetro p empleados en 1a simuiación son 0.05, 0.10,
0.15, 0.30, 0.45, 0.60, 0.75, 0.90 y o.95. Los resultados de la simulacián se
presentan en las figuras 5.1, 5.2 y 5.3. Cada uno de !os gráficos reproduce, para
cada tipa de matriz de contactos, el número de rechazos de la hipátesis nula
sobre el total de 1.000 {en ordenadas) obtenido al usar e1 correspondíente valor
de p(en abscisas). Las líneas de trazo continua se asocian a la función de
potencia estimada para 1a I de Moran, y la de traza discontinua a la del estadístico LM, mientras que el grosor de la línea difiere con el tamaño de la muestra
[los datas concretos pueden encontrarse en Mur (1990)].
Figura 5.1
MATRIZ DE TIPO I
^ooo
900
800
700
600
500
400
300
200
100
\\\\^^^.\\\\\-r:
\\\\ .,,..,,.,J
,
_ \^\\\\.^^
^^\\\^\\\\\\\\\
0
0,05
_^..^-
-
^
0,15
0,10
•--- I
(T=20)
-- LM (T=50)
^
^
^
0,30
0,45
0,60
0,75
-- LM (T=20)
•^^•' I
^^\• I
- LM (T=100)
{ T:100 )
(T^50)
0,90
0,95
E^STA[.)IS"Ti('A ESF'AÑI^LA
;0^
Figura 5.2
MATRIZ DE TIPO II
I
(T-20)
-'-' LM (T^50)
- LM (T=20)
•-..• i (T.^SO)
^^^• I
-- LM (T=100)
(T_100)
F'igura 5.3
MATRICES ESPACIALES
1
,.. I
(T=16)
--- LM {T-16)
.... ^
(T_4$)
^- LM (T=4$)
('ONTRASTF.S f)f^ Al1TO('ORRELA('ION E;SPA('IAI, l.lN E?STl_iDlt) [)f^ MONTf. ( ARl_t1
^l ^ ^
La lectura de estas figuras Ileva a conclusiones contundentes: en todos los
casos analizados, la potencia estimada del estadístico ! de Moran es superior a
la del estadístico LM. Esta superioridad es más acusada cuanto menor es el
tamaño de la rnuestra y cuando el parámetro de autocorrelación espacial toma
un valor intermedio o bajo, Si el tamaño de !a m^uestra aumenta a 50, los datos
siguen favoreciendo a!a I de Nlaran, aunque la diferencia ha disminuido sensiblemente, casi para desaparecer cuando el tarnaño muestral es de 100.
Por otro lado, es significativa la escasa potencia de ambos estadísticos para
detectar procesos autocorrelados cuando e! coeficiente toma un valor mediano
o bajo, aunque el aurnento de la rnuestra tiende a corregir de forma notable este
defecto. Con respecto a! tipo de matriz de contactos empleada, no parecen
observarse diferencias significativas al menos con un tamaño muestral de 100,
aunque con muestras de tamaño 20 y 50, la potencia estimada de ambos
estadísticos es superior cuando se mide sobre !a matriz de tipo ! que sobre la de
tipo II, y la de ésta es a su vez superior a la estimada sobre las matrices
espaciales.
6.
CONCLUSIONES
En este trabajo se ha examinado el supuesto de autocorrelación espacial en
las perturbaciones de un modelo econométrico regional, camentando sus causas y consecuencias. Posteriormente se han identificado das grandes grupos
de contrastes de autocorrelación espacial, los ad-hoc y los basadas en el
principio máximo-verosímil, para cada uno de los cuales se ha seleccionado el
que parece mejar: el de la I de Moran y el del multiplicador de La ^ range o LM,
respectivamente. Ambos presentan propiedades óptimas en un contexto asintótico;
por elio a continuación se plantea la realización de un estudio de Monte Carlo,
que permita examinar el comportamiento de ambos estadísticas en un contexto
de muestras finitas, así como estirnar !a función de potencia de cada uno de
ellos bajo el conjunto de supuestos planteados.
Los resultados de este estudio son bastante ilustrativos. Cuando 1a sirnulación se ha Ilevado a cabo bajo la hipótesis de no autocorrelación, todas las
medidas utilizadas tienden a indicar que e! ajuste de la distribución empírica de
ambos estadísticos a la distribución teórica respectiva mejora al aumentar el
tamaño de la muestra, como cabía esperar. No obstante, aunque el grado de
ajuste exhibido por ambos estadisticos es pobre con un tamaño muestral reducido (de 16 ó 20 observaciones}, en la I de Moran se observa una rnejora
significativa al utilizar un tamaño muestra! mediano (de 48 ó 50 observaciones),
^l)-l
F-:tiFAI)Iti7l( ,^ F tiF',^Ñt)1.,^
mientras que en el caso del LM esta mejora sólo se observa con un tarnaño
muestral grande (de 100 observaciones). otra circunstancia que apunta en
favor de la l de Moran es que éste tiende a estirnar con mayor exactitud el nivel
de significacián del contraste, mientras que el Lllrf tiende a subestimarlo, y de
forma muy acusada con un tamaño muestral pequeño.
Con respecto al tipo de matriz de contactos empleada, los resultados del
estudio sugieren que la distribución empirica de ambos estadísticos se ajusta
ligeramente mejor a la teórica, cuando la matriz es más regular, aun cuando no
se aprecian grandes diferencias. En cuaiquier caso, parece que tiene más
incidencia sobre ambos estadísticos el hecho de variar el tamaño de la muestra
que cambiar la especificación del operador espacial. Este hecho creemos que
debe ser atribuido a un cierto efecto de homogeneización logrado al definir la
matriz de tipo binario ponderada, lo cual parece diluir las diferencias estructurales introducidas en las distintas matrices.
La segunda parte del experimento ha estado dedicada a la obtención de la
función de potencia estirnada de los dos estadísticos. De este estudio surge con
fuerza una primera conclusión: en todos los casos analizados, la potencia
estimada def estadístico I es superior a la estimada para el LM, haciéndose rnuy
significativa !a díferencía cuando el tamaño de la muestra es reducido, y cuando
ei coeficiente torna un valor intermedio o bajo. Es necesario matizar esta última
conclusión porque, con muestras pequeñas y valores poco elevados de p, la
potencia estimada de ambos estadísticos es muy pobre. Con respecto al tipo de
matriz empleada, se mantienen los comentarios anteriores. Es decir, si bien se
observa una potencia estimada ligeramente superior al operar con las matrices
de tipo i, asociadas a sistemas regionales más equilibrados, esta díferencía no
parece significativa salvo cuando el tamaño de la muestra es reducido.
En definitiva, a partir de este ejercicio de simulación, creemos que pueden
subrayarse las siguientes conclusiones finales (hay que recordar, en cualquier
caso, que la validez de las mismas está supeditada al conjunto de supuestos
que aqui se han barajado):
Parece aconsejable utilizar en el contraste de autocorrelación espacial
una especificación de la matríz de contactos de tipo binario ponderado,
porque parece que este tipo de matrices tiende a diluir las diferencias en
la estructura del sistema regiona! que captan.
La distribución empírica del estadístico de Moran se ajusta bastante
mejor a la distribución N(o,1) que la del estadístico LM a la x2^,^ y, salvo
que el tamaño de !a muestra sea reducido, la adherencia observada en
ambos estadisticos puede considerarse satisfactoria.
('ON^T^FtAti^T'F^ti Uf• .^liT( ^ t^( ^ kf^E^:l.Al'Il1N i^tif'AC'1,^11 l^N I^til^^l!I)I ^ ) Ut ti1l ^ N^11^ ^.^kl ^ ^
^Ilti
La potencia estimada del estadístico de Moran es sistemáticarnente superior a la del multiplicador de Lagrange, aun cuando sigue siendo reducida para tamaños pequeños de la muestra y/o valores del parámetro de
autocorrelación espacial intermedios o ba ^ os.
BIBLIOGRAFIA
AKAiKE, H. (1973): «Information Theory and an Extension of the Maximum
Likelihood Principle», en Second /nternational Symposium on Inforrnation
Theory, edicián de B. N. Petro y F. Csaki, Akademiai Kiodo, Budapest, 267281
ANSELIN, L. (1988): «Spatial Econometrics: Methods and Models», Londres:
Kluwer.
ARBIA, G. (1989): «Spatial Data Configuration in Statistical Analysis of Regional
Economic and Related Problems», Londres: Kluwer.
ARORA, S., y BROwN, M. (197?): «Alternative Approaches to Spatial Autocorrelation:
an Improvement over current Practice», International Regional Science Review,
2, 67-78.
AZNAR, A. (1989): «Econometric Model Selection: A New Approach», Londres:
Kluwer.
AZNAR, A.; APARICIO, M. T.; TRIVEZ, J., y MuR, J. (1989): «Determinación del
escenario macroeconómico básico de la economía aragonesa para el período 1988-91 », Zaragoza: Diputación General de Aragón.
CLIFF, A.; HAGGETT, P.; ORD, J.; BASSETT, K., y DAVIES, R .
(1975): «Elements of
Spatial Structure. A Quantitative Approach», Cambridge: Cambridge University
Press.
CLIFF, A., y ORD, J. {1981): «Spatial Process. Models and Applications», Londres: Pion.
DACEY, M. (1965): «A Review of Measures of Contiguity for Two and k-color
Maps», en Spatial Analyses: A Reader in Statistical Geography, edición de
B. J. Berry y D. Marble, Englewood Cliffs: Prentice-Hall.
ENGLE, R. (1984): «Wald, Likelihood Ratio and Lagrange Multiplier Test in
Econometrics», en Handbook of Econometrics, edición de Z. Griliches y M.
D. Intrilligator, Amsterdam: North-Holland.
30fi
E^STAUISTI('A E^SPAN()I^A
GEARY, R. (1954): «The Contiguity Ratio and Statistical Mapping», The Incorporated
Statistician, 5, 115-145.
GODFREY, L. (1988): «Misspecification Test in Econometrics», Cambridge:
Cambridge University Press.
GR^FFITH, D. (1988): «Advanced Spatial Statistics», Londres: Kluwer.
HORDIJK, L. (1978): «Problems in Estimating Econometrics Relations in Space»,
Eigteenth European Congress of the Regiona/ Science Association, Fribourg,
Switzerland, August 28, September 1.
K^NG, M. (1981): «A Small Sample ^Property of the Cliff-Ord Test for Spatial
Gorrelation», Journal of the Roya/ Statistical Society B, 43, 263-264.
KNOx, E. (1964): «The Detection of Space-Time Interactions», Applied Statistics,
13, 25-29.
MoRAn,, P. (1950): «A Test for Serial Independence of Residuals», Bíometrica,
37, 17-23.
MuR, J. {1990): «Correlacián espacial: Un estudio de Monte Carlo», Tesis doctoral, Departamento de Análisis Económico, Universidad de Zaragoza.
ORD, K. (1975): «Estimation Methods for Models of Spatial Interaction», Journal
of the American Statistical Associativn, 70, 120-126.
RAO, R. (1965}: «Linear Statistical Inference and its Application», Nueva York:
John Willey and Sons.
SAKAMOTO, Y., e ISHIGURO, H. (1986): «Akaike Information Criterion Statistics»,
Dordrecht: Reidel.
SEN, A. (1976): «Large Sample-Size Distribution of Statistical Used in Testing
for Spatial Correlation», Geographical Analysis, 8, 175-184.
ToB^ER, W. (1970): «A Computer Movie Simulating Urban Growth in the Detroit
Region», Economic Geography, 46, 234-240.
('(>N'ERAti"T"F•^ E)E^ Al1TO{'ORRFLAI'll)N f:tiF'A(•IAL... IIN F"ti"Tl;Ull) F)F• M( ^ yTF (;^kl"^>
TESTING FOR SPATIAL AUTOCORRELATION. A MONTE CARLO
STU DY
SUMMARY
This paper is concerned with the comparison of some procedures
to test spatial autocorrelation. After a brief reference to its causes
and consequences we present a survey of some types of test
developed in the literature, form this we choose two of them and by
means of a Monte Carlo experiment we compare their properties for
different finite sample sizes and under different spatial configurations.
Keywords: Spatial autocorrelation, Moran statistic, Lagrange multiplier,
Monte Carlo experiment.
AMS Classification: 62P20, 90A19.
Descargar