ESTADISTICA ESPAÑOLA Vol. 34, Núm. 130, 1992, págs. 285 a 307 Contrastes de autocorrelación espacial . Un estudio de Monte Carlo ( *) por JESUS MUR LACAMBRA Departamento de Análisis Económico Facultad de Ciencias Econbmicas y Ernpresariales Universidad de Zaragoza RESUMEN En este artículo se trata de comparar varios procedimientos propuestos para contrastar la autocorrelacián espacial. Después de una breve referencia a sus causas y consecuencias se presenta un análisis de algunos contrastes desarrollados en la literatura, de los cuales se eligen dos y, mediante un experimento de Monte Carlo, se comparan sus propiedades para diferentes tamaños muestrales y bajo diferentes configuraciones espaciales. Palabras clave.^ Autocorrelación espacial, estadístico de Moran, multiplicador de Lagrange, experimento de Mante Carlo. Clasificación AMS: 62P20, 9oA19. (*) Este trabajo ha sido realizado dentro del proyecto C^NAI HS-20/90. EI autor desea agradecer las útiles sugerencias formuladas por los profesores J. H. P. Paelinck, J. M. Otero, A. Novales, M. T. Aparicio y J. Trivez, que juzgaron la Tesis doctoral de la que este artículo extrae parte del material, así como el gran apoyo encontrado en el profesor A. Aznar, director de la misma. '?if^ 1. [.ti f r^[)I^T I( .^ I^;f'A!V( ^ l A INTRODUCCION En este trabajo se presentan los resultados de un estudio de Monte Carlo, cuyo objetivo es examinar el comportamiento de dos contrastes de autocorrelación espacial en un contexto de muestras finitas. En la sección 2 se introduce el concepto, causas y consecuencias de la existencia de un proceso de autocorrelación espacial en las perturbaciones aleatorias de un modelo econométrico regional. En la sección 3 se examinan los distintos contrastes de autocorrelación espacial propuestos en la literatura para, después de comentar sus propiedades y características, seleccionar los dos estadísticos que parecen ofrecer mayores garantías. Como las propiedades de estos dos estadisticos sólo han sido obtenidas en un contexto asint^itico, parece interesante comprobar qué ocurre en un contexto de muestras finitas. Con este fin, en ia sección 4 se diseña un estudio de Monte Carlo que cubre un conjunto arnplio de supuestos, y en la 5 se da cuenta de los resultados alcanzados. EI trabajo finaliza con una serie de conclusiones que se pueden extraer del ejercicia. 2. ^A AUTOCORRELACION ESPACIAL La característica fundamental de un modelo econométrico espacial es que trata de explicar cierta variable, observada en una serie de puntos del espacio, a través de un conjunto de variables observadas en los mismos puntos. Es decir, el modelo econométrico viene definido por su dimensión espacial, por lo que deberá tenerse en cuenta que estos datos son fuertemente interdependientes. A esta circunstancia se refiere Tobler (1970) como «la primera ley de la geografía: cualquier cosa está relacionada con cualquier otra, pero las cosas cercanas est^n más relacionadas que las distantes», e insisten Cliff y Ord (1981) cuando dicen que «la propiedad básica de los datos localizados espacialmente es que el conjunto de valores {x^}, están seguramente relacionados sobre el espacio». No obstante, la validez de esta proposición está condicionada por el nivel de agregacián espacial definido y los criterios de regionalización empleados [véase Griffith {1988), Arbia (1989) o Mur (1990)J. Con carácter general, un modelo econométrico regional autocorrelado espacialmente puede escribirse como: y=x^i+u [2.1] u= p Wu+^ [2 . 2] ^^N(O,cs2I) [2.3] ('ONTRAti[f^;ti I)f^. AIICO('OKItFI.A{'ION f^:til'A('IAI,. l1N f^tiTlJl)I( ^ f)f. ti1^ ^ ti[f ^-11t1^ ^ _'^7 siendo y el vector de T observaciones de la variable endógena sobre las T regiones en las que se ha dividido el espacio relevante, X la matriz de orden T^k de observaciones en esas mismas regiones, de las k variables exógenas del modelo y u el vector de T perturbaciones aleatorias, autocorrelado espacialmente tal como se indica en [2.2]. En esta última expresión, ^ es un vector de ruidos b{ancos, p es un par^metro de autocorrelación que traduce la intensidad de las dependencias, y W es la denominada matriz de contactos, cuya función es indicar, para cada región, el conjunto de regiones con las que ésta es interdependiente. EI modelo reflejado en las ecuaciones [2.1 ] a[2.3] no difiere sustancialmente del modelo econométrico típico con datos de series temporales y perturbación autorregresiva. La peculiaridad del mismo procede de su dimensián espacial, ya que, con respecto al tiempo, las relaciones son unidireccionales (del pasado sobre el presente), mientras que en el espacio son multidireccionales (potencialmente de una región con el resto de regiones). Con respecto a la matriz W hay que dilucidar dos cuestiones: qué valores se asigna a fos elementos {w^^} de la misma y en base a qué criterios. En relación al primer punto, la solucián más empleada es la propuesta par ^1^Aoran (1950}, consistente en asignar un uno al elemento (i, j) de la matriz W cuando la región i recibe influencias de la j y cero en otro caso [pueden encontrarse otras alternativas en Cliff et al. (1975), Arora y Brown (1977) o Hordijk (1978)). Pero, para distribuir este conjunto de unos y ceros sobre la rnatriz, es necesario conocer el entramado de dependencias subyacente entre las regiones. Cuando esto no es posible, es preferible utilizar el criterio de contigi^idad por el cual wi^ será igual a 1 si entre las regiones i y j existe contacto físico y cero en otro caso. En consecuencia, la matriz W debería ser simétrica y de tipo binario. Por último, las consecuencias sobre los estimadores MCO de la existencia de un proceso de autocorrelación espacial son más perniciosas que en un contexto temporal, ya que estos estimadores na son consistentes (Anselin, 1988}. 3. CONTRASTES DE AUTC)CORRELACION ESPACIAL En términos generales se pueden distinguir dos grupos diferentes de contrastes de autocorrelacián: el primero de ellos, que denominamos contrastes adhoc, incluye una serie de contrastes basados en estadísticos previamente desarrollados en un contexto temporal, y que han sido adaptados al ámbito espacial; ios del segundo grupo son ei resultado de aplicar el principio máximo-verosímil al modelo econométrica formulado en [2.1 ] a[2.3]. f,ti rA[)Iti"11('A F^iPA[^tl)(..A ^K^{ Los estadísticos en los que se basan los contrastes ad-hoc, pueden obtenerse todos ellos como caso particular del denominado estadístico general de productos cruzados: T r ^r1 k^is+I [3.1] intraducido por Knox ( 1964), en el que k^1 es una medida de interacción entre los puntos (o regianes) i y j, y s;^ una medida de similitud entre esos dos puntos en relación a un determinado atributo. Se puede identificar el conjunto {k;^} con el conjunto {w^} de elementos de la matriz de contactos. Por otra parte, la medida de similitud puede tener naturaleza cualitativa, formulada en términos de presencia-ausencia de un determinado atributo en un punto del espacio, o bien cuantitativa. En el primer caso, el objetiva del análisis será comprobar si la existencia de un determinado atributo en una región favorece (autocorrelación positiva) o perjudica ( autocorrelación negativa) !a posibiiidad de que ese misma atributo se manifieste en regiones circundantes a aquélla. Este estudio puede Ilevarse a cabo utilizando los estadísticos NN, BB y BN, cuyas propiedades y características se detallan en Cliff y Ord (1981). Cuando !a medida de interacción es de naturaleza cuantitativa, el concepto de autocorrelación se perfila con más claridad: el estadistico r medirá hasta qué punto tienden a producirse concentraciones de regiones en las cuales se observan valores altos del atribu#o, frente a otras regiones caracterizadas por una escasa dotacián dei mismo. EI caso inverso, autocorrelación espacial negativa, se produce cuando una concentración elevada del atributo en una región genera efectos negativas externos para sus vecinas. En la líteratura pueden encantrarse al menos tres contrastes de autocorrelacián aplicables a datos cuantitat'rvos, corno san los basados en el estadistico de Moran (1950}, en el de Geary (1954) y en el de Dacey (1965) y denominados estadísticos , I, c y d, respectivamente. La obtención de los momentos de estos estadísticos, asf como sus distribuciones probabilísticas, es compleja dada la multidireccionalidad de las conexiones; pero no es posible para la d de Dacey. Por lo cual, los únicos utílízables son la I de Moran y la c de Geary, cuyas expresiones son : T I= `S© ^,^T w;,(X;-X) (x -X) `^ T f 2 L.1i=^ \X;-X) [3.2) ('ON`TKAS'1'F,:S l)f^ AlJ`I'O('ORRt^,LA('I(1N t^.Sl'A('IAI.. l^N t^tiflil)f(t I)f C i T-1 ^Tw (X t-X J)^ ^1 ^l ZSa ^T ^ {X^-X)2 ti1(tNlf ( ^1Kltt ^K^) [3.3] siendo x la observación de la variable x en la región j-ésima, x la rnedia muestral de la misma y So=^;^w;^ (con ^;^ nos referimos al doble sumatorio de forma abreviada). Con respecto a estos dos últimos estadisticos, todos los indicios tienden a señalar que es preferible la I de Moran. Así, Cliff y l7rd (1981) demuestran que la I es asintóticamente rnás potente que la c de Geary, conclusión que se ve corroborada mediante varias simulaciones que Ilevan a cabo ambos autores. Adicionalmente, King (1981) demuestra que el de Moran es el test localrnente más potente para contrastar la hipótesis nula Ho: p=0 frente a alternativas del tipo HA: p>0. En consecuencia y utilizando estos resultados, puede decirse que el contraste de autocorrelación espacial basado en la I de Moran es el que ofrece rnás garantías de todo el grupo de contrastes ad-hoc. Los momentos de primer y segundo orden del estadístico I para los residuos MCO de un modelo de regresión, obtenidos en un contexto asintótico y bajo el supuesto de una perturbación incorrelada, son los siguientes [en Cliff y Ord (1981 } y Anselin (1988) pueden encontrarse los detalles]: __ ^^w^ I [3.4] A , A U E [I]=- ^ tr(X X)-'X^WX T-k 3 . 5] [tr(X X)-'X'WX]^+tr(MWMW}+tr(MWMW') E [I2]= V [I]=E [I2l-(E [I])2 ( T-k) ( T-k-2 ) [3 . 6] [3.7] siendo M la matriz [l-X(X'X)-'X'], ú=y-X^3, y ^i el vector de estimadores MCO de [2.1]. Por último, Sen ( 1976) obtiene las condiciones de suficiencia que garantizan la distribucián asintóticamente normal del estadístico, las cuales tienden a garantizar que la estructura espacial del sistema regional, captada en la matriz W, esté mínimamente articulada. ^ yC! E^.STA[:)ItiTlt'A FSPAPJ()LA EI segundo grupo de contrastes se obtienen de la aplicacián del principio rnáximo-verosimil al modelo econométrico de [2.1 ] a[2.3], el cual incluye el contraste de Wald, el contraste del ratio de verosimilitud y el del multiplicador de Lagrange. Estos tres contrastes gozan de propiedades óptimas en un contexto asintdtico y han sido usados con profusión. Una cuestión previa de importancia se refiere a la definición de la función de verosimilitud del modelo. Tomando como punto de referencia la expresián del modelo de ^2.1 ] a[2.3], esta función es: ^(Y^Q^ aa^ P)=(2n6z)-ri2 exp{- 1 2c^2 (y-X(3)'A'A(y-X[i)} ^ A ^ [3.8] siendo A=(I-pW} que se obtiene de hacer ^={/-pVt^u en [2.2], y ^ A ^ el determinante jacobiano de la transformación lineal ^=Au. EI determinante de la matriz A se obtiene como ei producto de sus T raíces características, las cuales se obtienen a partir de las ra íces de la matriz W como: µ^=1-p^ , siendo µ^ y^,^ la jésima raíz característica de A y W, respectivamente. Es decir, se cumple que: T T IA I =^ µ^ ^ (1-p^) l=^ 1=^ [3 . 9] Este determinante debe ser estrictamente mayor que cero, lo cual implica que: p^ ^ 1^ ^+'(b'j). Esta expresión sintetiza la importancia del operador espacial W en la especificación del modelo econométrico regional. Debe ser capaz de captar el mecanisrno de interacción subyacente en el sistema regional, limitando el rango de valores que puede tomar el coeficiente de autocorrelación espacial. Un estudio más detallado de las propiedades de esta matriz servirá para acotar el problema. Por hipótesis, los elementos de la diagonal principal de W son todos cero, siendo su traza igual a cero, lo cual implica que sus raíces características deberán ser tanto positivas como negativas de forma que su suma se compense. Por otro lado, corno W es una matriz no negativa e indescomponible, utilizando el Teorema de Perron-Frobenius, existirá una raíz característica positiva y simple cuyo módulo excede al del resto de raíces. Sea esta raíz ^,+, y sea ^,_ la raíz negativa de mayor valor absoluto (ésta puede ser múltiple), que cumplen: ^1,+> I ^ j I ^ %l,+ ) < I ^ j I -1 ( ^C7^j ) ^,+>^^, ^^^,+,^^^ ^-, Teniendo en cuenta estos resultados, se puede representar gráficamente el valor de ^ A ^ en función del valor de p, como [Mur ( 1990}]: t'ONTFtAti"T^E.S Df^: AUTO('URRE:LAt'ION t^tii'A('IAL. l1N E tiiUf)IU [)t: !^1( ^ NTt c',Akl.^ ^ ^^a ^ Figura 3.1 EI determinante de A se anula para todos aquellos valores de p en los que este coeficiente se hace igual a 1/^,^ (j=1, 2, ..., T}, teniendo una forrna sinusoidal y con tendencia a ser explasiva. Lo que interesa remarcar es que la función ^ A ^ es regular de forma cóncava para valores del coeficiente comprendidos entre ^,=^<p<^,«^, entre los cuales está acotada como: 0< ^ A^<1. EI resto de posibles valores del coeficiente deben desecharse a la vista de la figura 3.1. Esta solución puede mejorarse utilizando el Teorema de Fisher, por el cual el valor de ^,+ está acotado entre: rmin < + < ^ nax [ 3 .10 ] siendo r la suma de los elementos de la j-ésirna fila (o columna), y m^n y rrn^X los valores mínimo y máximo, respectivamente, de esas sumas. Si cada elemento de la matriz W se divide por la suma de los elementos de su fila (o columna) respectiva, m^^ será igual a maX y ambos igual a 1, y el máximo valor que puede tomar p es también igual a 1. Haciendo esta transformación, la acotación anteriar se convierte en: ^,l^<p<1 [3.10] Tras estas precisiones, se puede pasar a comentar las características de los tres test de autocorrelación espacial que incluimos en este segundo grupo de contrastes. En el modelo econométrico de [2.1 ] a[2.3] se puede definir el vector ,y, t^:ti^1 A()ItiTIt.^A E^:SPAti()l.A de parámetros 8'-[p, a2, pJ', siendo L(yl8) el logaritmo de la función de verosimilitud del modelo. Supóngase que se desea contrastar s restricciones lineales sobre el vec#or de par^metras, H^: RB=ro, frente a la hipótesis alternativa HA: R9^ro, donde R es una matriz de constantes de orden s•(k+2} y ro un vector de orden s• 1, igualmente de constantes. En este caso, se obtiene el test de Wald como: ^ ^ W=[R8-ro)' [R^(8)-, ^q']-, [R9 _ro]^S x2( S) [3.11 ] siendo ^(8)^' la inversa de la matriz de información. También puede obtenerse el contraste del ratio de verosimilitudes: ,^ _ [3.12] LR=-2[L(Y/8R)-L( y/^)]^S x2(S) ^ siendo 8R el correspondiente estimador máximo-verosímil restringido, y el contraste de los multiplicadores de Lagrange: ^ ^ LM=^,R,[R^(e) [3.13] ^^q']^,R^Sx2(S) ^ donde ^.R es la estimacián máximo-verosimil del vector de s multiplicadores, obtenida del correspondiente problema de maximización restringida [véase Rao (1965), Engle (1984) y Gadfrey (1988)]. Está demostrado en ia literatura que los tres contrastes gozan de todas las propiedades asintóticas deseables siendo asintóticamente equivalentes, aun cuando pueden producirse discrepancias entre ellos para rnuestras de tamaña finito. Para contrastar la hipótesis nula Ho: p=0 frente a la alternativa HA: p^0, estos tres contrastes se obtienen a partir del lagaritmo de la función de verosimilitud del modeio: L[y/8]=- T 2 /og2n- T 2 2 loga -- [y--X^]'A'A[y-X^] 2 2a +^T log(1-p^^) [3.14] ^_ ^ EI conjunto de (k+2) condiciones necesarias de máximo en [3.14] se obtienen como: ^ aL(y, 8) -©^ ^^ ^ ^^ [y'A'AX-R'X'A'AXJ _0 a2 ^R ^ c^L(Y^ 8) __0^ ^á2 aL(y, 6) ^ -0^ ^P _ ^^^ ^ T + (Y-x^)'A'^(Y-XR) =0 262 2a4 (y-X[3)'A' W(y-Xa) T -^í ^.2 + ^ ^ -0 6 /_^ 1--p^ [3.15] t'ON"I^RAtiTF^:ti 1)t•. All^^^O('t)RREt_^C'IC)N F:SF't^C^l:^ ^ L l1N Fti"Tl1Ul( ^ UF- !^1(aN^II^ C^:^Ki t^ ?^)^ .... Obsórvese que se utiliza la expresión A para indicar la estimación rnáximoverosímil de la matriz. De la primera y segunda ecuación se obtiene, respectivamente: ^ ^^ ^^ (3= [X'A'AX ] -' [X'A 'A y] [3.16] ^^ ^ ^! u'A'Au [3.17] T ^ ^ ^ donde u=y-X[i. La estimación de p puede obtenerse Ilevando [3.16] y[3.17] a [3.14]: ^ ^ ^ ^ T ^ ^ , [ 3.18 ] log{1-p^, ) L(ylj3, a2, p)oc- T log 62+ 2 ^! ^ cuya maximización implica la minimización de: r log[á2 ^ (1-p^,^ y2^^] ^_^ [3.19] expresión en la cual se puede implementar un proceso de optimización iterativa no lineal [métodos alternativos de resolución, en cualquier caso complejos, pueden encontrarse en ^rd (1975), Anselin (1988) y Griffith (1988)]. Por otro lado, como la restricción impuesta en 9 es que p=o, introduciéndola en el proceso de optimización, los estimadores máximo-verosímiles restringidos se convierten en: ^ ..... RR=[X'x]-,x,y ú ' ^^ ,,,., 6R= ,r PR-^ Finalmente, la inversa de la matriz de información obtenida bajo la hipótesis nula y alternativa, respectivamente, es la siguiente {Anselin, 1988): , -E Í^ a2L(.Y^e)] ^1 ^eae' ^ Ho a2{x'x)--^ o 0 0 a - 264 0 T 0 (tr[(W+W')W])-' I [3.20] F:ti'T AI)I^TI('A F:^PAÑOL.A az(X'A'A^ ' 0 _,E ^ ^ZL{Y^)] ^ ae^e' J 0 0 2a2td^+d2) 0 -2a2d3 T{d,+d2}--2d^2 T(d,+d2)--2d32 -2a2da 2d3 _^ [ d , +d2- -^ ^ T{d,+d2}--2d^z [3.21] T siendo d,=tr[WA-']'[WA-'], d^=^ ^,j2(1-p^)2 y d^=tr[WA-'] j=1 Utilizando todos estos resultados, y sustituyendo en fas expresiones del test de Wald y en la de los multiplicadores de Lagrange la inversa de la matriz de informacíón por la estimación consistente respectiva, se obtienen las expresiones finales de los tres contrastes, que resultan ser: r LR= T[Iog6R logá2]+2 ^ log(1 p^.}ásx2^,^ j=1 [3.22] W-p [ T(d, +d2}-2d3]a^2t, ^ [3.23] LM= T tr[(W'+W)W] ú' Wú 2 ú'ú 2 asx c^^ [3.24] Observando las expresiones [3.22], [3.23] y[3.24] resulta evidente la notable simplicidad del estadístico LM frente al LR o a W, ya que, para su aplicación, basta con obtener los estimadores MCO de los parámetros de posición del modelo, mientras que para utilizar el W o eí LR es necesario resolver un proceso de optimización iterativa no lineal complejo. Esta razón aconseja seleccionar el estadístico LM frente a los otros dos. 4. M D1SEN0 DEL ESTUDIO DE MONTE CARLO En esta sección se plantea un estudio de Monte Carlo en el que se examina el comportamiento de los estadísticos seleccionados en la sección anterior sobre muestras finitas, y utilizando varias especificaciones del operador espacial. 295 ('ONTRASTE:S DE AI^TOC'OftREI.,A("I<)N E^:^PAC:'IAL. l1N EtiT'll[)IO UE^ MONTEi. (^ARI (a EI proceso generador de datos (PGD): Se corresponde con el modelo econométrico de [2.1 ] a[2.3], que reescribimos a continuación: [4.1 ] Y^=X',R+u, r u.-P [4.2] ^ wrjuj+ ^r j= ^ ^,--N(0; ^s2) r=1, 2, . . . , T [4.3] EI objetivo del experimento es investigar dos técnicas econométricas: el contraste de autocorrelación espacial basado en la I de Moran de las expresiones [3.4] a[3.7], y el del multiplicador de Lagrange de [3.24]. Los eiementos del PGD que parecen esenciales son los siguientes: La matriz de contactos entre regiones W. EI parámetro de autocorrelación espacial p. EI rnodelo econométrico simulado y la generación de la parte sistemática y aleatoria del mismo. EI tarnaño de la muestra y número d'e replicacíones del experimento. A continuación comentamos brevemente las decisiones tomadas al respecto. E/ parámetro de autocorre/ación espacial: EI rango de valores que puede tomar este parámetro depende de la especificación de la matriz W. No obstante, si la matriz se define de tipo binario ponderada, la acotación relevante de valores del parámetro es la de [3.10], cualquiera que sea la matriz de contactos. Esta parece la solución más satisfactoria. En consecuencia, con respecto al parámetro p, sólo se van a simular valores no negativos comprendidos entre cero y la unidad. De esta forma, los resultados de la simulación con respecto a un mismo valor del parámetro p serán directamente comparables, cualquiera que sea la rnatriz de contactos empleada y el tamaño de la muestra. La matriz de contactos entre regiones: Esta matriz desernpeña un papel crucial en cualquier contraste de correlación espacial. Por ello, parece conveniente introducir en la simulación varios tipos de matrices para comprobar la robustez de los resultados. Se han utilizado dos tipos de matrices, que denorninaremos como matrices espaciales y matrices aespaciales. Las prirneras se corresponden directamente con el sisterna regional español (es decir, se han construido en base a un sistema de regiones que existe en la realidad), mientras que las segundas se construyen de forma artificial sin que exista un mapa ^^)(^ E^^1 A[^ISTIc^A F.tif'AÑc aL.A regional que las respalde. De estas últimas se han especificado dos tipos que denominaremos de tipo 1 y de tipo II. En las primeras se ha supuesto que cada regián tiene contacto con otras cuatro regiones, mientras que en las segundas se supone que el 50% de las regiones tienen contacto con otras dos regiones, y el 50% restante lo #ienen con otras seis. De esta forma, las matrices aespaciales de tipo I se asocian a sisternas regionales equilibrados, mientras que las de tipo li se asocian a sistemas peor articulados que las anteriores. Igualmente se han utilizada dos matrices de tipo espacial, como son las obtenidas del sistema de comunidades autónomas y de provincias español ( en ambos casos se han excluido las Islas Canarias). Modelo simulado y generación de la parte sistemática y aleatoria: EI modelo econométrico que sirve de base para la simulación es el siguiente: y^=-0.2235+0.2379x^r+0.0843x2^+0.2621 x3r+u^ [4.4] el cual se corresponde con el de la expresión [4.1 ], y está tomado de Aznar et a/. (1989). ^a perturbacián u, se obtiene de acuerdo a la expresión [4.2], y el ruido blanco ^r se genera aleatoriamente de acuerdo a[4.3] con 6=0.052, valor estimado en el citado modelo econométrico. Finalmente, la obtención de los datos relativos a las variables exógenas ha seguido un doble camino, dependiendo de si la matriz de contactos es espacial o aespacial: En el primer caso, los datos se toman directamente de las comunidades y provincias españolas en el año 1985, año para el que se estimó el modelo de [4.4]. Cuando se usa una matriz aespacial, se ha diseñado un método especifico de generación artificial de datos, que asegura la congruencia de éstos con los observados en la realidad española. Es#o último ha sido necesario puesto que, como se comentará más adelante, se desea utilizar muestras de tamaño 100 para las que no se dispon ía de suficientes datos observados, caso de no recurrir a otras soluciones menos satisfactorias (duplicacián de datos, utilización de datos panel, etc.). Este método se basa en la técnica de componentes principales, siendo capaz de generar una muestra del tamaño deseado, manteniendo la estructura de correlaciones observada en la muestra original, lo cual garantiza que los resultados de la sirnulación no se verán afectados por el mayor o menor grado de colinealidad existente en muestras diferentes [los detalles pueden verse en Mur (1990)]. Tamaño muestra/ y número de replicaciones: En el ejercicio se utilizaran cinco tamaños rnuestrales: 16 y 48 con matrices espaciales y 20, 50 y 100 con las matrices aespaciales, y el número de replicaciones efectuado en cada experimento ha sido 1.000. l'ONf'KAti`i'E•.ti O[- AUTOt'{)KKE-L.A('ION f-tif`At'IAI._ l1N [tiTl![)I{)[)f ti1^ ^ ^1i[ ( 1Ft[t ^ 5. ^^)7 RESULTADOS DEL EXPERIMENTO DE MONTE CAR^O En la sección anterior se han definido las características de este ejercicio de simulación, en el que se pretende examinar el comportamiento de los contrastes I de Moran y LM. ^a cobertura del estudio es lirnitada, dado el gran número de factores que intervienen en el mismo. No obstante, las conclusiones que se obtengan estarán cimentadas en un número de replicaciones que ofrece garantías. Estas conclusiones se presentan agrupadas en torno a dos situaciones de interés: simulación bajo la hipótesis nula (p=0) y ba ^ o la hipátesis alternativa (P^0). Resultados de la sirnulación bajo la hipótesis nula (p=0) Los resultados del ejercicio ba ^ o este supuesto se detallan en las dos tablas siguientes. La primera examina el grado de ajuste de la distribución muestral de ambos estadísticos a las distribuciones teóricas supuestas. En la siguiente se presenta el nivel de significación estimado en cada uno de los contrastes. En la tabla 5.1 aparecen los resultados del contraste de Kolmogorov-Srnirnov y del estadístico A/C aplicado al misrno conjunto de datos. EI primero es un contraste bien conocido en la literatura, y su ob ^etivo es contrastar la hipótesis nufa de que la función de distribución que ha generado una serie de observaciones (en este caso las 1.000 replicaciones de los estadísticos) se corresponde con una determinada función identificada por el investigador. Es decir, Ho: F(x)=Fo(x), donde Fa(x) es la función de distribución sornetida a contraste, que se corresponde con la N(0,1) para la I de Moran (previamente el valor del estadístico se ha estandarizado) y con la x2^1^ para el LM. Por otro lado, la utilización del estadístico AIC ha sido muy habitual para resolver problemas de selección de modelos econométricos [Akaike (1973), Sakamoto et al. (1986), Aznar (1989)]. EI problema que aqu í nos ocu pa puede entenderse igualmente como uno de selección de modelos y resolverse utilizando el estadístico A/C. La filosofía que subyace a este estadístico es la de seleccionar aquel modelo econométrico que aporta un contenido inforrna-tivo mayor. En nuestro caso, tenemos para los estadísticos I y LM una función de distribución empírica y una función de distribución teórica, caracterizada cada una de ellas por una determinada distribución de la masa de probabilidad total sobre el espacio probabilístico. Tomando como referencia la función de distribución teórica, este espacio probabilístico se puede dividir en una colec- ^^)X f^^+TAI)IS"Tlt'A E;Sf'AÑl)L..A Tabla 5.1 Matriz de tipo 1 T= 20 T= 50 T=100 Estadistico I de Moran Kolmogorov-Smirnov .................................................. Criterio A!C ................................................................... 1,2017 0,7906 0,9171 -8,5102 -13,5410 -12,9573 Estadistico L.M Kolrnogorov-Smirnov ................................................... 1,0752 1,2965 0,6325 Criterio AIC .................................................................. --4, 5494 -2,5812 -8,3331 Matriz de tipo 11 T=20 T=50 T=100 Estadistico t de Moran K©Imogorov-Smírnov .................................................. 2,4982(*) Criterio A!C ................................................................... -7,2276 0,4743 0,7589 -15,7521 -14,2091 Estadístico LM Kolmogorov-Smirnov .................................................. 1,6128(*) Criterio AIC .................................................................. - 38 , 669 Matrices especiates 0,7273 0,6641 - 90 , 233 - 66 , 049 T=16 T=48 Estadístico I de Moran Kolmogorov-Smirnov ................................................... Criterio AfC ................................................................... 1,3282 -11,0554 1,0436 -12,2892 Estadístico LM Kolmogorov-Smirnov .................................................. 1,3914(^*) Criterio AIC ................................................................... (*) (*') -5,5636 1,7076(**) -7,6024 Se rechaza a ambos niveles. Se acepta al 1% y rechaza al 5% de nivel de significación. ción de intervalos equiprobabilísticos, y medir la verosimilitud del modelo teórico como: Pr[n^, n2, ..., nklp^, p2, ..., pk]= n! n ^^ . n2.^ . . . nk.^ p^n' p2n2 ... pk^k L5- ^^ siendo p^ =p (dj } la probabilidad asignada a cada uno de los k intervalos, n^ el número de observaciones censadas en el intervalo j y n=E k ^ n^ _^1.000. Como el número de parámetros libres del modelo teórico es cero, fa expresión [5.1] mide ya directamente el contenido informativo de este rnodelo. Con respecto al ('C)NTRASTE:S [)f.^ Al1TO('ORFtf:LA('ION ESf'A('IAL_. [1N f^,STI ^ [)IO U!- MON"1 .AFtI () ?^t) modelo empírico se debe utilizar la misrna expresión [5.1 ], pero la probabilidad que esta distribución asigna a cada uno de los k intervalos antes definidos viene dada por p^=(n,n), y los grados de libertad del modelo son (k-1). En consecuencia, el contenido informativo del modelo teórico [AIC(1)] y el del modeto ernpírico [AIC(2)] se puede medir como: Al C( 1 )=-21og AIC(2)=-21og n! I^2 n2 ... pk ^^ I n, . n2.1 . . . nk ! p n ^ n! n^ ^, n2 ^2 n^!nZ! ... nk! n n [5.2] nk n k +2(k-1) n [5.3] EI criterio AIC aconseja seleccionar el modelo con un valor del estadístico menor, por lo que una regla de comparación útil puede estar basada en la diferencia: T AIC(1)-AIC(2)=^ n. log(n^)-n log(pn)-(k-1) j=1 si es negativa seleccionaremos ia distribución teórica; en caso contrario el resultado de la simulación indica que ésta no es una buena aproximación. Teniendo en cuenta ios resultados del contraste de Kolmogorov-Smirnov, parece claro que la adherencia de las distribuciones muestrales de ambos estadísticos a la distribución teórica respectiva es bastante pobre cuando el tamaño muestral es reducido pero mejora al aumentar éste. No obstante, para la I de Moran el salto de 20 a 50 observaciones parece suficiente para alcanzar un ajuste aceptable, mientras que para el LM parecen ser necesarias un rnayor número de observaciones. Por otro lado, también parece claro que ambos estadísticos se ajustan mejor a la distribución teórica cuando la matriz de contactos tiende a ser regular, aunque con un tamaño muestral grande el efecto se diluye. Por lo que respecta a la utilización del estadístico AIC podría pensarse que los resultados son decepcionantes, dado su escaso poder discriminatorio: en todos los casos, la distribución teórica es preferida a la empírica. No obstante, estos resultados podían ser previsibles por cuanto al enfrentar el contenido informativo de un modelo teórico al de un modelo empíríco ( pero sín teoría), únicamente se está señalando para aquél un rnínimo de información adicional a la puramente muestral, la cual, en este caso, parece que los dos modelos aportan. En la tabla 5.2 aparecen !os niveles de significación estimados para cada t^ti t AUttiTI('A ^°SPANI)t_A Tabla 5.2 Matriz de tipo I T=20 T=100 T=50 Nivel de significación LM I LM t LM ! 0,01 ............................................ 0,05 ............................................ 0,10 ............................................ 2 25 71 10 45 89 6 37 74 13 43 83 2 39 93 7 44 83 Matriz de tipo 11 Nivel de significación 0,01 ............................................ 0,05 ............................................ 0,10 ............................................ T=20 T=50 T=100 LM t LM t LM 1 1 21 67 13 50 90 9 43 110 9 49 113 14 46 97 13 56 98 Matrices espaciales T=16 T=48 Nivel de sig^nificación LM t LM I 0,01 ............................................ 0,05 ............................................ 0,10 ............................................ 0 23 52 15 47 92 5 46 108 14 49 97 uno de los supuestos que se analizan. Esta tabla se ha construido de la siguiente forma: para las 1.000 replicaciones del experimento en las que se ha utilízado un valor de p igual a cero, se resuelven ambos contrastes de la hipótesis nula Ho: p=0 frente a la alternativa HA: p^0. Los valores que aparecen en esta tabla indican e! número de contrastes sobre el total de 1.000, en los cuales se rechaza la hipótesis nula al nivel de significación del 1%, del 5% o del 10%, respectivamente. En este sentido, es importante que el nivel de significación estimado se aproxime 1o más posible al teórico, lo cual significa que, al menos en las colas, las distribuciones teóricas y empiricas de ambos estadísticos tienden a solaparse. Las conclusiones que se extraen de esta tabla abundan en la misma dirección que las obtenidas de la tabla anterior. Así, a medida que aumenta el tamaño de la muestra el nivel de significación estimado se aproxima al teórico. Pero la mejoría que se observaba en la tabla anterior al pasar de la matriz tipo II a la de tipo I(rnás regular) aparece más diluida, e incluso para un tamaño muestral de 100 puede entenderse que el efecto es de empeoramiento. No obstante, lo que si es evidente es que el estadístico LM tiende a subestimar de forma muy acusada el nivel de significación teórico del contraste, en comparación a la 1 de Moran. ('ONTRASTF^ti [)f• Al1Tf)(^UR^Rf-:LAC'ION t:SPAC'I^AL. t^N f^STI^UIO C)f^ M( ^ N I^t^ (^:1k1 ^^ 3U 1 Resultados de la simulación bajo la hipótesis alternativa (p^Oj En este caso se ha simutada el modelo de [4.1 ] a[4.3] utilizando valores de1 parámetro p distintos de cero progresivamente mayores, y el objetivo es comprobar ía potencia de los contrastes. La función de potencia de ambos estadísticos se puede estimar medíante el número de veces en las que se rechaza la hipótesis nula Ho: p=0. Los valores del parámetro p empleados en 1a simuiación son 0.05, 0.10, 0.15, 0.30, 0.45, 0.60, 0.75, 0.90 y o.95. Los resultados de la simulacián se presentan en las figuras 5.1, 5.2 y 5.3. Cada uno de !os gráficos reproduce, para cada tipa de matriz de contactos, el número de rechazos de la hipátesis nula sobre el total de 1.000 {en ordenadas) obtenido al usar e1 correspondíente valor de p(en abscisas). Las líneas de trazo continua se asocian a la función de potencia estimada para 1a I de Moran, y la de traza discontinua a la del estadístico LM, mientras que el grosor de la línea difiere con el tamaño de la muestra [los datas concretos pueden encontrarse en Mur (1990)]. Figura 5.1 MATRIZ DE TIPO I ^ooo 900 800 700 600 500 400 300 200 100 \\\\^^^.\\\\\-r: \\\\ .,,..,,.,J , _ \^\\\\.^^ ^^\\\^\\\\\\\\\ 0 0,05 _^..^- - ^ 0,15 0,10 •--- I (T=20) -- LM (T=50) ^ ^ ^ 0,30 0,45 0,60 0,75 -- LM (T=20) •^^•' I ^^\• I - LM (T=100) { T:100 ) (T^50) 0,90 0,95 E^STA[.)IS"Ti('A ESF'AÑI^LA ;0^ Figura 5.2 MATRIZ DE TIPO II I (T-20) -'-' LM (T^50) - LM (T=20) •-..• i (T.^SO) ^^^• I -- LM (T=100) (T_100) F'igura 5.3 MATRICES ESPACIALES 1 ,.. I (T=16) --- LM {T-16) .... ^ (T_4$) ^- LM (T=4$) ('ONTRASTF.S f)f^ Al1TO('ORRELA('ION E;SPA('IAI, l.lN E?STl_iDlt) [)f^ MONTf. ( ARl_t1 ^l ^ ^ La lectura de estas figuras Ileva a conclusiones contundentes: en todos los casos analizados, la potencia estimada del estadístico ! de Moran es superior a la del estadístico LM. Esta superioridad es más acusada cuanto menor es el tamaño de la rnuestra y cuando el parámetro de autocorrelación espacial toma un valor intermedio o bajo, Si el tamaño de !a m^uestra aumenta a 50, los datos siguen favoreciendo a!a I de Nlaran, aunque la diferencia ha disminuido sensiblemente, casi para desaparecer cuando el tarnaño muestral es de 100. Por otro lado, es significativa la escasa potencia de ambos estadísticos para detectar procesos autocorrelados cuando e! coeficiente toma un valor mediano o bajo, aunque el aurnento de la rnuestra tiende a corregir de forma notable este defecto. Con respecto a! tipo de matriz de contactos empleada, no parecen observarse diferencias significativas al menos con un tamaño muestral de 100, aunque con muestras de tamaño 20 y 50, la potencia estimada de ambos estadísticos es superior cuando se mide sobre !a matriz de tipo ! que sobre la de tipo II, y la de ésta es a su vez superior a la estimada sobre las matrices espaciales. 6. CONCLUSIONES En este trabajo se ha examinado el supuesto de autocorrelación espacial en las perturbaciones de un modelo econométrico regional, camentando sus causas y consecuencias. Posteriormente se han identificado das grandes grupos de contrastes de autocorrelación espacial, los ad-hoc y los basadas en el principio máximo-verosímil, para cada uno de los cuales se ha seleccionado el que parece mejar: el de la I de Moran y el del multiplicador de La ^ range o LM, respectivamente. Ambos presentan propiedades óptimas en un contexto asintótico; por elio a continuación se plantea la realización de un estudio de Monte Carlo, que permita examinar el comportamiento de ambos estadísticas en un contexto de muestras finitas, así como estirnar !a función de potencia de cada uno de ellos bajo el conjunto de supuestos planteados. Los resultados de este estudio son bastante ilustrativos. Cuando 1a sirnulación se ha Ilevado a cabo bajo la hipótesis de no autocorrelación, todas las medidas utilizadas tienden a indicar que e! ajuste de la distribución empírica de ambos estadísticos a la distribución teórica respectiva mejora al aumentar el tamaño de la muestra, como cabía esperar. No obstante, aunque el grado de ajuste exhibido por ambos estadisticos es pobre con un tamaño muestral reducido (de 16 ó 20 observaciones}, en la I de Moran se observa una rnejora significativa al utilizar un tamaño muestra! mediano (de 48 ó 50 observaciones), ^l)-l F-:tiFAI)Iti7l( ,^ F tiF',^Ñt)1.,^ mientras que en el caso del LM esta mejora sólo se observa con un tarnaño muestral grande (de 100 observaciones). otra circunstancia que apunta en favor de la l de Moran es que éste tiende a estirnar con mayor exactitud el nivel de significacián del contraste, mientras que el Lllrf tiende a subestimarlo, y de forma muy acusada con un tamaño muestral pequeño. Con respecto al tipo de matriz de contactos empleada, los resultados del estudio sugieren que la distribución empirica de ambos estadísticos se ajusta ligeramente mejor a la teórica, cuando la matriz es más regular, aun cuando no se aprecian grandes diferencias. En cuaiquier caso, parece que tiene más incidencia sobre ambos estadísticos el hecho de variar el tamaño de la muestra que cambiar la especificación del operador espacial. Este hecho creemos que debe ser atribuido a un cierto efecto de homogeneización logrado al definir la matriz de tipo binario ponderada, lo cual parece diluir las diferencias estructurales introducidas en las distintas matrices. La segunda parte del experimento ha estado dedicada a la obtención de la función de potencia estirnada de los dos estadísticos. De este estudio surge con fuerza una primera conclusión: en todos los casos analizados, la potencia estimada def estadístico I es superior a la estimada para el LM, haciéndose rnuy significativa !a díferencía cuando el tamaño de la muestra es reducido, y cuando ei coeficiente torna un valor intermedio o bajo. Es necesario matizar esta última conclusión porque, con muestras pequeñas y valores poco elevados de p, la potencia estimada de ambos estadísticos es muy pobre. Con respecto al tipo de matriz empleada, se mantienen los comentarios anteriores. Es decir, si bien se observa una potencia estimada ligeramente superior al operar con las matrices de tipo i, asociadas a sistemas regionales más equilibrados, esta díferencía no parece significativa salvo cuando el tamaño de la muestra es reducido. En definitiva, a partir de este ejercicio de simulación, creemos que pueden subrayarse las siguientes conclusiones finales (hay que recordar, en cualquier caso, que la validez de las mismas está supeditada al conjunto de supuestos que aqui se han barajado): Parece aconsejable utilizar en el contraste de autocorrelación espacial una especificación de la matríz de contactos de tipo binario ponderado, porque parece que este tipo de matrices tiende a diluir las diferencias en la estructura del sistema regiona! que captan. La distribución empírica del estadístico de Moran se ajusta bastante mejor a la distribución N(o,1) que la del estadístico LM a la x2^,^ y, salvo que el tamaño de !a muestra sea reducido, la adherencia observada en ambos estadisticos puede considerarse satisfactoria. ('ON^T^FtAti^T'F^ti Uf• .^liT( ^ t^( ^ kf^E^:l.Al'Il1N i^tif'AC'1,^11 l^N I^til^^l!I)I ^ ) Ut ti1l ^ N^11^ ^.^kl ^ ^ ^Ilti La potencia estimada del estadístico de Moran es sistemáticarnente superior a la del multiplicador de Lagrange, aun cuando sigue siendo reducida para tamaños pequeños de la muestra y/o valores del parámetro de autocorrelación espacial intermedios o ba ^ os. BIBLIOGRAFIA AKAiKE, H. (1973): «Information Theory and an Extension of the Maximum Likelihood Principle», en Second /nternational Symposium on Inforrnation Theory, edicián de B. N. Petro y F. Csaki, Akademiai Kiodo, Budapest, 267281 ANSELIN, L. (1988): «Spatial Econometrics: Methods and Models», Londres: Kluwer. ARBIA, G. (1989): «Spatial Data Configuration in Statistical Analysis of Regional Economic and Related Problems», Londres: Kluwer. ARORA, S., y BROwN, M. (197?): «Alternative Approaches to Spatial Autocorrelation: an Improvement over current Practice», International Regional Science Review, 2, 67-78. AZNAR, A. (1989): «Econometric Model Selection: A New Approach», Londres: Kluwer. AZNAR, A.; APARICIO, M. T.; TRIVEZ, J., y MuR, J. (1989): «Determinación del escenario macroeconómico básico de la economía aragonesa para el período 1988-91 », Zaragoza: Diputación General de Aragón. CLIFF, A.; HAGGETT, P.; ORD, J.; BASSETT, K., y DAVIES, R . (1975): «Elements of Spatial Structure. A Quantitative Approach», Cambridge: Cambridge University Press. CLIFF, A., y ORD, J. {1981): «Spatial Process. Models and Applications», Londres: Pion. DACEY, M. (1965): «A Review of Measures of Contiguity for Two and k-color Maps», en Spatial Analyses: A Reader in Statistical Geography, edición de B. J. Berry y D. Marble, Englewood Cliffs: Prentice-Hall. ENGLE, R. (1984): «Wald, Likelihood Ratio and Lagrange Multiplier Test in Econometrics», en Handbook of Econometrics, edición de Z. Griliches y M. D. Intrilligator, Amsterdam: North-Holland. 30fi E^STAUISTI('A E^SPAN()I^A GEARY, R. (1954): «The Contiguity Ratio and Statistical Mapping», The Incorporated Statistician, 5, 115-145. GODFREY, L. (1988): «Misspecification Test in Econometrics», Cambridge: Cambridge University Press. GR^FFITH, D. (1988): «Advanced Spatial Statistics», Londres: Kluwer. HORDIJK, L. (1978): «Problems in Estimating Econometrics Relations in Space», Eigteenth European Congress of the Regiona/ Science Association, Fribourg, Switzerland, August 28, September 1. K^NG, M. (1981): «A Small Sample ^Property of the Cliff-Ord Test for Spatial Gorrelation», Journal of the Roya/ Statistical Society B, 43, 263-264. KNOx, E. (1964): «The Detection of Space-Time Interactions», Applied Statistics, 13, 25-29. MoRAn,, P. (1950): «A Test for Serial Independence of Residuals», Bíometrica, 37, 17-23. MuR, J. {1990): «Correlacián espacial: Un estudio de Monte Carlo», Tesis doctoral, Departamento de Análisis Económico, Universidad de Zaragoza. ORD, K. (1975): «Estimation Methods for Models of Spatial Interaction», Journal of the American Statistical Associativn, 70, 120-126. RAO, R. (1965}: «Linear Statistical Inference and its Application», Nueva York: John Willey and Sons. SAKAMOTO, Y., e ISHIGURO, H. (1986): «Akaike Information Criterion Statistics», Dordrecht: Reidel. SEN, A. (1976): «Large Sample-Size Distribution of Statistical Used in Testing for Spatial Correlation», Geographical Analysis, 8, 175-184. ToB^ER, W. (1970): «A Computer Movie Simulating Urban Growth in the Detroit Region», Economic Geography, 46, 234-240. ('(>N'ERAti"T"F•^ E)E^ Al1TO{'ORRFLAI'll)N f:tiF'A(•IAL... IIN F"ti"Tl;Ull) F)F• M( ^ yTF (;^kl"^> TESTING FOR SPATIAL AUTOCORRELATION. A MONTE CARLO STU DY SUMMARY This paper is concerned with the comparison of some procedures to test spatial autocorrelation. After a brief reference to its causes and consequences we present a survey of some types of test developed in the literature, form this we choose two of them and by means of a Monte Carlo experiment we compare their properties for different finite sample sizes and under different spatial configurations. Keywords: Spatial autocorrelation, Moran statistic, Lagrange multiplier, Monte Carlo experiment. AMS Classification: 62P20, 90A19.