CALIDAD DE LOS DATOS ESPACIALES SIG AMBIENTAL DE NAMIBE. ANGOLA. SPACE DATA QUALITY IN THE MAKING OF THE ENVIRONMENTAL GIS OFF NAMIBE. ANGOLA Autores: Joao Francisco de Sousa Gaspar da Silva1 y Julio Cabrera-Bermúdez2 1 Universidad Agostino Neto, Luanda, Angola. E mail:[email protected] Física, Pinar del Río, Cuba. E mail: [email protected]. Tel. 772815 2 Panificación RESUMEN. En el presente trabajo se describe la concepción asumida para el tratamiento de la calidad de la información gráfica y alfanumérica utilizada en la creación del Sistema de Información Geográfico Ambiental de Namibe (SIGAN), Angola, relacionadas fundamentalmente con sus escalas, fechas, actualidad, disponibilidad y en menor medida el estado de conservación. Se hace además una valoración de algunos de los métodos más conocidos en la estimación de la incertidumbre introducida por los errores en los datos de partida y del modelo empleado, así como la metodología desarrollada por el autor del presente trabajo. ABSTRACT. Presently work described the conception assumed for the quality treatment of graphic and alphanumeric information, in the making of the Invironmental Geographical Information System of Namibe, Angola, fundamentally related with its scales, dates, present time, readiness and in smaller measure the state conservation. It is also made a valuation of some known methods in the estimate of the uncertainty introduced by the errors in the data departure and the used pattern, as well as the methodology developed by the author of the present work. Palabras claves: CALIDAD DE LOS DATOS ESPACIALES, SIG, INCERTIDUMBRE, ANGOLA Keywords: SPACE DATA QUALITY, GIS, UNCERTAINTY, ANGOLA. INTRODUCCIÓN. En un inicio la búsqueda de la información de partida estuvo ceñida al objetivo para el cual se había diseñado el SIG, gestión de información geoambiental en la provincia de Namibe, Como resultado de esta búsqueda se pudo observar que la disponibilidad de la información tanto gráfica como alfanumérica en dicho territorio era insuficiente. Esta insuficiencia está dada, en que la mayoría de los mapas temáticos representativos del medio físico sólo se encuentran en una escala muy pequeña, que no tiene sentido llevar a un SIG destinado a la gestión medioambiental de una provincia; por otro lado la mayoría de esos mapas temáticos son de hace más de 30 años, aunque es justo destacar que en algunos de los temas el paso del tiempo no representa una desactualización de la información en cuanto a contenidos. MÉTODOS. S. Openshaw (citado en Hunter, 1999), considera que en muchas aplicaciones no es necesario saber la cantidad de error, sino poder tener la confianza de que el error y la incertidumbre a esos niveles no pone en duda la validez de los resultados en una situación específica. En tal sentido parece que hoy lo importante ya no es gestionar la incertidumbre o adoptar una estrategia de reducción de la incertidumbre, sino tener el mayor volumen de información posible sobre la misma y que sean los gestionadores los que asuman las consecuencias sobre esa base, fundamental para llevar a cabo tareas de planificación, como bien se puede constatar en (Brunsden et al., 1990; Emmi y Horton, 1996; Davis y Keller, 1997; Collins et al., 2002; Kanti, 2005). Metodología utilizada para el tratamiento de la calidad Se parte inicialmente de la búsqueda exhaustiva de toda la cartografía temática disponible de carácter medioambiental, en el territorio caso de estudio, posteriormente se procede a evaluar la calidad de toda la información recolectada. El método utilizado cuantifica las variables de calidad y posteriormente las introduce en un SIG vectorial, como una variable alfanumérica descriptora de la calidad del tema en cuestión, constituyendo esto una novedad en la gestión medioambiental. La calidad en el contexto de los GIS La calidad de los datos espaciales puede ser considerada como el grado de excelencia en una base de datos, que no es más que la cualidad positiva que poseen los datos para ser utilizados en los análisis. Así se puede plantear que la calidad depende totalmente de la escala, la exactitud, la magnitud, extensión o tamaño del conjunto de datos, y de la edad de los mismos. Así, al considerar que los datos geográficos son “espaciales”, se puede plantear entonces que deben incluir las dimensiones: espacio, tiempo y tema (dónde, cuándo y qué). Tomando entonces en cuenta los estándares de la Comisión sobre la calidad de los datos espaciales, queda claro que la calidad de los datos también contiene otros componentes relacionados con la exactitud, precisión, consistencia e integridad. Entonces al combinar las dimensiones que rigen los datos geográficos y los componentes que definen la calidad de los datos espaciales, se obtiene como resultado una matriz con la cual se puede cuantificar la calidad de la información geográfica disponible. RESULTADOS. El método para medir la calidad de cada uno de los componentes es aplicado a cada una de las capas de información que forman el SIGAN. Las tres dimensiones de los datos geográficos solo es posible evaluarlas para las componentes exactitud, resolución y consistencia, mientras que para el caso de la componente integridad, no es posible determinar estas dimensiones, ya que expresan si el conjunto de datos está completo en lo que se refiere a sus posibilidades de responder a las interrogantes que el usuario quiere hacer y si la representación de ellos es consistente dentro de sí mismo. COMPONENTE EXACTITUD Como la exactitud expresa el grado de coincidencia entre un mapa y los valores reales, verdaderos o aceptados, al analizar una base de datos para un SIGA, es posible considerar la exactitud horizontal y vertical con respecto a la posición geográfica, así como la exactitud del atributo, exactitud conceptual y lógica. Exactitud espacial (horizontal y vertical) Para el caso de las capas temáticas que contienen puntos, la exactitud se determina midiendo la distancia entre la localización codificada (coordenadas en la base de datos) y la localización real obtenida a través de la comparación con puntos de control sobre el terreno. Así se puede estimar el error espacial en varias dimensiones: x, y, z (horizontal y vertical). Para la estimación de la precisión espacial se utiliza el error de la Raíz Media Cuadrática (RMC). Los puntos de control se escogieron partiéndose del criterio de que un punto de control bien definido representa un rasgo del cual se conoce la posición horizontal con un alto grado de precisión con respecto al Datum Geodésico, posteriormente se escoge la fuente independiente de mayor precisión, considerando que esta debe ser la de mayor precisión accesible y viable para evaluar la calidad de los datos. En la figura 1 se ilustran los utilizados en la confección del SIGAN. F ig u ra 1. U b ic ació n d eterm in ació n A n g o la de la de lo s ex a ctitu d p u n to s es p acial de en co n tro l la u tilizad o s P ro v in cia de en la N am ib e . La precisión horizontal se determina mediante la comparación de las coordenadas planimétricas de los puntos de control en los mapas, con las coordenadas de esos mismos puntos obtenidos con la fuente independiente (GPS o Puntos Geodésicos de la Red Nacional) de mayor precisión en el terreno, mientras que la precisión vertical es probada mediante la comparación de las elevaciones en el conjunto de datos con elevaciones de los mismos puntos determinados con la misma fuente independiente. Xp.c.mapa Xp.c.GPS ECMx Yp.c.mapa Yp.c.GPS 2 ECMy 2 n n Donde: ECMx y ECMy - son los errores medio cuadráticos en x, y. Xp.c.mapa y Xp.cGPS - son las coordenadas de los puntos de control medidos sobre el mapa y en la fuente independiente de mayor precisión, respectivamente (GPS o Puntos de la Red Geodésica Nacional Angolana). n- número de puntos de control probados. El error horizontal en un punto de control “i” quedara definido por: ECMp .ci Xp.c.mapa Xp.c.GPS 2 Yp.c.mapa Yp.c.GPS 2 Posteriormente se procede a determinar el error cuadrático medio espacial de los puntos de control que forman parte de la muestra, según la ecuación. Xp.c.m apa Xp.c.GPS Yp.c.m apa Yp.c.GPS 2 ECM n 2 ECM ECMx2 ECMy2 n Ahora, cuando ECMx = ECMy. ECM 2 ECMx 2 2 ECMy 2 . Donde 1.4142ECMx 1.4142ECMy Así se asume que los errores sistemáticos han sido eliminados. Si el error está distribuido normalmente y es independiente en las componentes x,y, se puede utilizar el factor 2.4477 para calcular la precisión horizontal al 95 % del nivel de confianza (Greenwalt y Schultz, 1968). Entonces la precisión puede ser calculada según. PRECISION 2.4477ECMx 2.4477ECMy PRECISION 2.4477ECMr 1.4142 PRECISION 1.7308ECMr Donde ECMr = ECMx = ECMy Pero cuando ECMx ≠ ECMy, en Greenwalt y Schultz (1968), se aconseja la aproximación al error circular estándar, que establece que: si el cociente ECMmin/ECMmax, está entre 0.6 y 1.0, este error (al 39 % de confianza) puede aproximarse como 0.5 (ECMx+ECMy). Si el error está distribuido normalmente y es independiente en las componentes x, y, el valor de la precisión puede aproximarse mediante la siguiente formula. PRECISIÓN = 2.4477*0.5(ECMx+ECMy) Donde: ECMmin, es el menor valor entre ECMx y ECMy y ECMmax, el valor mayor. La Precisión vertical se determina a partir de la siguiente expresión. ECMz Zp.c.mapa Zp.c.GPS 2 n Donde: Zp.c.mapa y Zp.cGPS - son las coordenadas verticales (cota) de los puntos de control medidos sobre el mapa y en la fuente independiente de mayor precisión, respectivamente (GPS o Puntos de la Red Geodésica Nacional Angolana). n- número de puntos de control probados. Si el error vertical está distribuido normalmente, se aplica el factor 1.9600 para calcular el error lineal al 95 % del nivel de confianza (Greenwalt y Schultz, 1968). En consecuencia se calcula la precisión vertical, según la expresión. PRECISIONz 1.9600 ECMz Este análisis se aplica a todas las capas que forman parte del SIGAN, a modo de ilustración en la tabla 1 se presenta un ejemplo de los resultados obtenidos, valores aceptables considerando que Namibe abarca un área de 55 000 km² y la altitud varía de 0 a 5000m. Tabla 1. Resumen del procedimiento seguido en la determinación de la precisión horizontal y vertical, para la capa topografía. Punto de contro l Coordenadas fuente independiente Coordenadas en el mapa X Y Z X Y 1 211461,69 8309815,43 341,70 211400,00 8309800,00 2 237113,79 8313935,41 527,02 237200,00 3 207904,88 8272446,49 248,80 4 216734,54 8243425,61 . 264948,59 . Desviación espacial en X Y Z 321,20 61,69 15,43 20,5 8314000’00 527,00 86,21 64,59 0,20 208000,00 8272400,00 249,00 95,12 46,49 0,20 367,60 216700,00 8243500,00 368,20 34,54 74,39 0,60 8406430,00 1061,00 265000,00 8406500,00 1058,80 51,41 70,00 2,20 215808,00 8442070,13 52,00 215800,00 8442000,00 51,00 8,00 70,13 1,00 . 313550,20 8277930,40 750,20 313500,00 8277900,00 758,20 50,20 30,40 8,00 20 304250,80 8292870,50 1160,00 304200,00 8292900,00 1155,60 50,80 29,50 4,4 239,5 209,9 13,9 ECM Z Precisión (m) Hz y V Al 95% del nivel de confianza 549,96 y 27.15 Exactitud del atributo Este tipo de exactitud se puede analizar a través del modelo que expresa la relación entre la Entidad geográfica, los Atributos que la describen y los Valores cuantitativos y cualitativos que contiene este último, (E-A-V). Aunque se debe tener presente que, para juzgar sobre la capacidad de los datos para ser utilizados, hay primero que juzgar estos datos con respecto a la especificación, y después considerar las limitaciones de la propia especificación. Después de revisado el modelo E-A-V en las capas que conforman el SIGAN y comprobado que la especificaciones y sus limitaciones se aceptan, por que se ajustan al tipo de gestión que se le pretende dar, se ha considerado que está libre de errores. Exactitud temporal Existe si el conjunto de datos del SIG tiene una dimensión temporal y de esta forma los datos de información espaciales tienen la forma de: x, y, z, t. Para el modelo del error es necesario investigar la dependencia entre esta coordenada adicional con las otras tres, para de esta forma prestar atención a la correlación existente. Para el SIGAN esta variable no fue cualificada, por no existir un patrón de comparación temporal real en el conjunto de datos de partida. Exactitud temática El análisis de esta exactitud es conveniente hacerlo después de determinada la exactitud espacial y la del modelo E-A-V, ya que en última instancia la no existencia de errores en dicho modelo, implica generalmente la no existencia de los mismos entre las diferentes capas temáticas componentes del SIGAN y la magnitud de la desviación espacial, puede expresar cuan desviada esta la temática. COMPONENTE RESOLUCIÓN La resolución (o precisión) se refiere a la cantidad de detalle que puede discernirse en el espacio, tiempo o tema. Para el caso del SIGAN, toda la cartografía de partida es capturada a partir de la obtención de imágenes con dimensiones de 8 x 10 pulgadas, con una resolución de 300 dpi, para una dimensión de píxel de 2400 x 3000 píxeles, obteniéndose entonces que: La dimensión de un píxel viene definida por la relación 20.32cm /2400 píxel y 25.4cm/3000 píxel, obteniéndose una dimensión de 0.00846 cm, equivalente a un área de 0.0000715716 cm2. Esta magnitud corresponde linealmente, por ejemplo, para una escala 1:500 000, a 42.3 m, que en términos de área son 0.00178929 Km2. La selección de la escala de un mapa depende fundamentalmente de la resolución que la misma va a permitir. Así el ojo humano no puede observar medidas inferiores a 0.2 mm., (Pascoalinho, 1965). Este valor expresado en metros equivale a 0.0002 m, que representa el pormenor mínimo que en un mapa se puede dibujar a una escala 1/n. Así en un mapa, por ejemplo, a escala 1: 500 000, el límite de percepción visual se puede calcular como: 0.2mm x 500m/mm=100m Para el área el procedimiento es: A=100mx100m=10000m2=0.01km2 Esto significa que, solamente es posible representar en un mapa a escala 1:500000 objetos cuya área sea igual o superior 0.01km2. Ahora bien, si se compara el área del píxel con el valor anteriormente calculado, para un mapa 1: 500 000, es fácil apreciar que es 5.6 veces menor que el mínimo pormenor que se puede dibujar, por lo que se puede afirmar que la resolución y las dimensiones de la imagen garantizan que todos los elementos geográficos visibles en el mapa pueden ser capturados. CONSISTENCIA Esta componente se refiere a la ausencia de contradicciones aparentes y es una medida de la validez interna de una base de datos. La magnitud de la consistencia topológica, se estima a partir de la determinación de la exactitud de los elementos geográficos. Así al evaluar la calidad de los datos, esta magnitud para el caso del SIGAN, donde se ha utilizado una plataforma vectorial del tipo espaguetis, queda garantizada. COMPONENTE INTEGRIDAD La integridad se refiere a una falta de errores de omisión en una base de datos. Se considera que las medidas de omisión y comisión, son suficientes para describir cuán bien los datos cumplen las demandas del usuario. Así en función de la disponibilidad de información, para el caso del SIGAN, se considera que no existen errores de omisión ni comisión. PROCEDIMIENTO SEGUIDO PARA ASEGURAR LA CALIDAD DEL SIGA Primeramente se procede a normalizar escalarmente las magnitudes de las componentes de calidad involucradas en el análisis. Para el caso del SIGAN se utiliza una escala de tres valores que expresan la calidad individual de cada componente en alta, media y baja, según se puede apreciar en la tabla 2. Tabla 2. Normalización escalar de las componentes de calidad Escala de valores normalizados Componentes de la Alta Media Baja (3) (2) (1) 0.00-200 m 200- 500 m Más de 500 m Precisión vertical 0.00-5.00 5.00-15.00 m Más de 15.00 m Exactitud temática 100-80% 80-60% 60% 10 dP Entre 10 y 5.6 (dP) 5.6 dP calidad espacial Precisión horizontal Resolución Posteriormente se utiliza el método AHP, de las Jerarquías Analíticas de Saaty, para ponderar los resultados, tabla 3. Para evaluar la calidad general de una capa, el autor propone determinar una nueva variable a la que denomina Calidad global, (Tabla 4), que para este caso fue 66.6 %. Tabla 3. Resultado de la aplicación del método de ponderación. COMPONENTES Precisión horizontal Grupo B Precisión Exactitud vertical temática Resolución Precisión 5 7 8 9 horizontal Precisión 3 5 8 9 Grupo vertical A Exactitud 2 2 5 8 temática Resolución 1 1 2 5 La suma de los pesos es igual a 1, se obtiene dividiendo la suma de la fila entre el total de la columna SUMA PESOS % SIGNIFICACIÓN % 29 36.25 9.0625 25 31.25 7.8125 17 21.25 5.3125 9 11.25 2.8125 80 100 25% Para las líneas y áreas, donde la situación es más compleja, el autor aborda el problema utilizando la Teoría de Conjuntos Borrosos, a partir de un razonamiento aproximado que utiliza premisas imprecisas tales como: con cierto grado de incertidumbre (Incertidumbre: baja, media y alta). Tabla 4. Ejemplo de determinación de la Calidad global, Tema Suelos. Componentes de la calidad espacial Escala de valores normalizados Alta (3) Media (2) Baja (1) Precisión horizontal x Precisión vertical Exactitud temática x Calidad Global 25 x 3 8.33 Para el SIGAN se ha considerado un conjunto X= ECM, que expresa la desviación espacial máxima calculada según la expresión. 16.6 x Resolución Calidad Global % ECM 16.6 4 1 66.6 ECMx2 ECMy2 n Así, todos los valores comprendidos en el intervalo 0, ECM, expresan una cierta magnitud de incertidumbre, que pueden ser considerados como el universo de discurso para el tratamiento de la incertidumbre espacial. En la figura 2 se puede observar la función característica que define al conjunto X. ENTIDAD A ENTIDAD B 1 0.5 500 250 0 250 500 Incertidumbre baja en A y B Incertidumbre media en B Incertidumbre media en A Incertidumbre alta en B Incertidumbre alta en A Figura 2. Función característica que define al conjunto borroso X. Para definir el grado de incertidumbre que genera el posible desplazamiento del objeto (ej. línea que separa un suelo A de otro B), dentro del intervalo 0, ECM, según se acerque a 0 o a ECM, se introduce un controlador borroso, Ej. Incertidumbre alta, media y baja, como se ilustra en la figura 3. De esta forma se especifican las funciones pertenecientes al conjunto borroso. ENTIDAD A ENTIDAD B 1 500 250 0 187.5 0.5 250 500 Figura 3. Funciones pertenecientes al conjunto borroso que definen el grado de incertidumbre que genera el posible desplazamiento del objeto (ej. línea que separa un suelo A de otro B). Así para cualquier valor del ECM se puede calcular el % de incertidumbre comprendido en la escala de incertidumbre utilizada, por ejemplo para un valor de 187.5 de ECM en dirección de B, se obtiene que la incertidumbre puede ser considerada un 25 % baja y un 75 % media, esto le brinda a los usuarios un universo más flexible a la hora de emitir criterios sobre la certidumbre de los datos empleados en la gestión que realiza, e incorporados al SIGAN al utilizar la herramienta buffer de la plataforma utilizada. CONCLUSIONES. La componente exactitud se determina midiendo la distancia entre la localización codificada y la localización real obtenida a través de la comparación con puntos de control, estimándose la desviación espacial de x, y, z, en. 239.47 m, 209.90 m y 13.85 m respectivamente, para una precisión horizontal y vertical de 549.96 m y 27.15 m. La resolución de los datos se calcula considerando que las dimensiones de píxel son las medidas horizontales y verticales de una imagen, expresadas en píxeles, determinándose sus dimensiones, multiplicando tanto el ancho como la altura por la resolución definida en la captura. La calidad general fue de 66.6 % que en función de la escala establecida, se sitúa entre un mínimo de 33 % y un máximo de 100, no se considera el 0 %, ya que se estima que independientemente de la mala calidad que pueda tener la información de partida, algún valor de uso debe contener. REFERENCIAS. Hunter, G.J. 1999. Managing uncertainty, en Longley, P.A., Goodchild, M.F, Maguire, D.J. y Rhind, D.W. (Eds.): Geographical information systems. Volumen II, New York, John Wiley & Sons, Inc., pp. 633-641. Brunsden, C.; Carver, S.; Charlton, M. & Openshaw, S. 1990. A review of methods for handling error propagation in GIS, Proceedings of the European Conference on GIS, pp. 106-116. Davis, T.J. & Keller, C.P. 1997. Modelling uncertainty in natural resource analysis using fuzzy sets and Monte Carlo simulation: slope stability prediction, International Journal of Geographical Information Science, 11, 5, pp. 409-434. Emmi, P.C. & Horton, C.A. 1996. Seismic risk assessment, accuracy requirements, and GIS-based sensitivity analysis, en Goodchild, M.F, Steyaert, L.T. Y Parks, B.O. (Eds.): GIS and Environmental modeling: progress and research issues. Fort Collins, CO: GIS World Books, pp. 191-195. Collins, G.; Kremer, J.N. & Valiela, I. 2002. Assessing uncertainty in estimates of nitrogen loading to estuaries for research, planning, and risk assessment, Environmental Management, 25, 6, pp.635-645. Greenwalt, C. R., and Schultz, M. E. 1968. Principles And Error Theory And Cartographic Application. ACIC Technical report No. 96, St. Louis. Mo. Kanti, G. M. 2005. Aseguramiento de la calidad del producto durante el ciclo de vida de un GIS. Scientist, Regional Remote Sensing Service Centre. ISRO, Dept. of Space, Kharagpur. Pascoalinho, J. 1965. Topografia Geral. Instituto Superior Tecnico. Edição da Secçao de Folhas da A. E. I. S. T., Angola, 296 pag.