SIG_Ambiental_Namibia

Anuncio
CALIDAD DE LOS DATOS ESPACIALES SIG AMBIENTAL DE NAMIBE.
ANGOLA.
SPACE DATA QUALITY IN THE MAKING OF THE ENVIRONMENTAL GIS OFF NAMIBE.
ANGOLA
Autores: Joao Francisco de Sousa Gaspar da Silva1 y Julio Cabrera-Bermúdez2
1
Universidad Agostino Neto, Luanda, Angola. E mail:[email protected]
Física, Pinar del Río, Cuba. E mail: [email protected]. Tel. 772815
2 Panificación
RESUMEN.
En el presente trabajo se describe la concepción asumida para el tratamiento de la calidad de
la información gráfica y alfanumérica utilizada en la creación del Sistema de Información
Geográfico Ambiental de Namibe (SIGAN), Angola, relacionadas fundamentalmente con sus
escalas, fechas, actualidad, disponibilidad y en menor medida el estado de conservación. Se
hace además una valoración de algunos de los métodos más conocidos en la estimación de
la incertidumbre introducida por los errores en los datos de partida y del modelo empleado,
así como la metodología desarrollada por el autor del presente trabajo.
ABSTRACT.
Presently work described the conception assumed for the quality treatment of graphic and
alphanumeric information, in the making of the Invironmental Geographical Information
System of Namibe, Angola, fundamentally related with its scales, dates, present time,
readiness and in smaller measure the state conservation. It is also made a valuation of some
known methods in the estimate of the uncertainty introduced by the errors in the data
departure and the used pattern, as well as the methodology developed by the author of the
present work.
Palabras claves: CALIDAD DE LOS DATOS ESPACIALES, SIG, INCERTIDUMBRE,
ANGOLA
Keywords: SPACE DATA QUALITY, GIS, UNCERTAINTY, ANGOLA.
INTRODUCCIÓN.
En un inicio la búsqueda de la información de partida estuvo ceñida al objetivo para el cual se
había diseñado el SIG, gestión de información geoambiental en la provincia de Namibe,
Como resultado de esta búsqueda se pudo observar que la disponibilidad de la información
tanto gráfica como alfanumérica en dicho territorio era insuficiente. Esta insuficiencia está
dada, en que la mayoría de los mapas temáticos representativos del medio físico sólo se
encuentran en una escala muy pequeña, que no tiene sentido llevar a un SIG destinado a la
gestión medioambiental de una provincia; por otro lado la mayoría de esos mapas temáticos
son de hace más de 30 años, aunque es justo destacar que en algunos de los temas el paso
del tiempo no representa una desactualización de la información en cuanto a contenidos.
MÉTODOS.
S. Openshaw (citado en Hunter, 1999), considera que en muchas aplicaciones no es
necesario saber la cantidad de error, sino poder tener la confianza de que el error y la
incertidumbre a esos niveles no pone en duda la validez de los resultados en una situación
específica.
En tal sentido parece que hoy lo importante ya no es gestionar la incertidumbre o adoptar
una estrategia de reducción de la incertidumbre, sino tener el mayor volumen de información
posible sobre la misma y que sean los gestionadores los que asuman las consecuencias
sobre esa base, fundamental para llevar a cabo tareas de planificación, como bien se puede
constatar en (Brunsden et al., 1990; Emmi y Horton, 1996; Davis y Keller, 1997; Collins et al.,
2002; Kanti, 2005).
Metodología utilizada para el tratamiento de la calidad
Se parte inicialmente de la búsqueda exhaustiva de toda la cartografía temática disponible de
carácter medioambiental, en el territorio caso de estudio, posteriormente se procede a
evaluar la calidad de toda la información recolectada.
El método utilizado cuantifica las variables de calidad y posteriormente las introduce en un
SIG vectorial, como una variable alfanumérica descriptora de la calidad del tema en cuestión,
constituyendo esto una novedad en la gestión medioambiental.
La calidad en el contexto de los GIS
La calidad de los datos espaciales puede ser considerada como el grado de excelencia en
una base de datos, que no es más que la cualidad positiva que poseen los datos para ser
utilizados en los análisis. Así se puede plantear que la calidad depende totalmente de la
escala, la exactitud, la magnitud, extensión o tamaño del conjunto de datos, y de la edad de
los mismos.
Así, al considerar que los datos geográficos son “espaciales”, se puede plantear entonces
que deben incluir las dimensiones: espacio, tiempo y tema (dónde, cuándo y qué). Tomando
entonces en cuenta los estándares de la Comisión sobre la calidad de los datos espaciales,
queda claro que la calidad de los datos también contiene otros componentes relacionados
con la exactitud, precisión, consistencia e integridad.
Entonces al combinar las dimensiones que rigen los datos geográficos y los componentes
que definen la calidad de los datos espaciales, se obtiene como resultado una matriz con la
cual se puede cuantificar la calidad de la información geográfica disponible.
RESULTADOS.
El método para medir la calidad de cada uno de los componentes es aplicado a cada una de
las capas de información que forman el SIGAN.
Las tres dimensiones de los datos geográficos solo es posible evaluarlas para las
componentes exactitud, resolución y consistencia, mientras que para el caso de la
componente integridad, no es posible determinar estas dimensiones, ya que expresan si el
conjunto de datos está completo en lo que se refiere a sus posibilidades de responder a las
interrogantes que el usuario quiere hacer y si la representación de ellos es consistente dentro
de sí mismo.
COMPONENTE EXACTITUD
Como la exactitud expresa el grado de coincidencia entre un mapa y los valores reales,
verdaderos o aceptados, al analizar una base de datos para un SIGA, es posible considerar
la exactitud horizontal y vertical con respecto a la posición geográfica, así como la exactitud
del atributo, exactitud conceptual y lógica.
Exactitud espacial (horizontal y vertical)
Para el caso de las capas temáticas que contienen puntos, la exactitud se determina
midiendo la distancia entre la localización codificada (coordenadas en la base de datos) y la
localización real obtenida a través de la comparación con puntos de control sobre el terreno.
Así se puede estimar el error espacial en varias dimensiones: x, y, z (horizontal y vertical).
Para la estimación de la precisión espacial se utiliza el error de la Raíz Media Cuadrática
(RMC).
Los puntos de control se escogieron partiéndose del criterio de que un punto de control bien
definido representa un rasgo del cual se conoce la posición horizontal con un alto grado de
precisión con respecto al Datum Geodésico, posteriormente se escoge la fuente
independiente de mayor precisión, considerando que esta debe ser la de mayor precisión
accesible y viable para evaluar la calidad de los datos. En la figura 1 se ilustran los utilizados
en la confección del SIGAN.
F ig u ra
1.
U b ic ació n
d eterm in ació n
A n g o la
de
la
de
lo s
ex a ctitu d
p u n to s
es p acial
de
en
co n tro l
la
u tilizad o s
P ro v in cia
de
en
la
N am ib e .
La precisión horizontal se determina
mediante la comparación de las
coordenadas planimétricas de los
puntos de control en los mapas, con las
coordenadas de esos mismos puntos
obtenidos con la fuente independiente
(GPS o Puntos Geodésicos de la Red
Nacional) de mayor precisión en el
terreno, mientras que la precisión
vertical es probada mediante la
comparación de las elevaciones en el
conjunto de datos con elevaciones de
los mismos puntos determinados con la
misma fuente independiente.
  Xp.c.mapa  Xp.c.GPS 
ECMx 
 Yp.c.mapa  Yp.c.GPS 
2
ECMy 
2
n
n
Donde:
ECMx y ECMy - son los errores medio cuadráticos en x, y.
Xp.c.mapa y Xp.cGPS - son las coordenadas de los puntos de control medidos sobre el
mapa y en la fuente independiente de mayor precisión, respectivamente (GPS o Puntos de la
Red Geodésica Nacional Angolana).
n- número de puntos de control probados.
El error horizontal en un punto de control “i” quedara definido por:
ECMp .ci 
 Xp.c.mapa  Xp.c.GPS 2  Yp.c.mapa  Yp.c.GPS 2
Posteriormente se procede a determinar el error cuadrático medio espacial de los puntos de
control que forman parte de la muestra, según la ecuación.
  Xp.c.m apa Xp.c.GPS  Yp.c.m apa Yp.c.GPS
2
ECM 
n
2

ECM 
ECMx2  ECMy2
n
Ahora, cuando ECMx = ECMy.
ECM  2 ECMx 2  2 ECMy 2 . Donde 1.4142ECMx  1.4142ECMy
Así se asume que los errores sistemáticos han sido eliminados. Si el error está distribuido
normalmente y es independiente en las componentes x,y, se puede utilizar el factor 2.4477
para calcular la precisión horizontal al 95 % del nivel de confianza (Greenwalt y Schultz,
1968). Entonces la precisión puede ser calculada según.
PRECISION 2.4477ECMx  2.4477ECMy
PRECISION 2.4477ECMr
1.4142
PRECISION 1.7308ECMr
Donde ECMr = ECMx = ECMy
Pero cuando ECMx ≠ ECMy, en Greenwalt y Schultz (1968), se aconseja la aproximación al
error circular estándar, que establece que: si el cociente ECMmin/ECMmax, está entre 0.6 y
1.0, este error (al 39 % de confianza) puede aproximarse como 0.5 (ECMx+ECMy).
Si el error está distribuido normalmente y es independiente en las componentes x, y, el valor
de la precisión puede aproximarse mediante la siguiente formula.
PRECISIÓN = 2.4477*0.5(ECMx+ECMy) Donde: ECMmin, es el menor valor entre ECMx y
ECMy y ECMmax, el valor mayor.
La Precisión vertical se determina a partir de la siguiente expresión.
ECMz 
 Zp.c.mapa  Zp.c.GPS 
2
n
Donde:
Zp.c.mapa y Zp.cGPS - son las coordenadas verticales (cota) de los puntos de control
medidos sobre el mapa y en la fuente independiente de mayor precisión, respectivamente
(GPS o Puntos de la Red Geodésica Nacional Angolana).
n- número de puntos de control probados.
Si el error vertical está distribuido normalmente, se aplica el factor 1.9600 para calcular el
error lineal al 95 % del nivel de confianza (Greenwalt y Schultz, 1968). En consecuencia se
calcula la precisión vertical, según la expresión.
PRECISIONz  1.9600 ECMz
Este análisis se aplica a todas las capas que forman parte del SIGAN, a modo de ilustración
en la tabla 1 se presenta un ejemplo de los resultados obtenidos, valores aceptables
considerando que Namibe abarca un área de 55 000 km² y la altitud varía de 0 a 5000m.
Tabla 1. Resumen del procedimiento seguido en la determinación de la precisión horizontal y vertical, para la capa topografía.
Punto
de
contro
l
Coordenadas fuente independiente
Coordenadas en el mapa
X
Y
Z
X
Y
1
211461,69
8309815,43
341,70
211400,00
8309800,00
2
237113,79
8313935,41
527,02
237200,00
3
207904,88
8272446,49
248,80
4
216734,54
8243425,61
.
264948,59
.
Desviación espacial en
X
Y
Z
321,20
61,69
15,43
20,5
8314000’00
527,00
86,21
64,59
0,20
208000,00
8272400,00
249,00
95,12
46,49
0,20
367,60
216700,00
8243500,00
368,20
34,54
74,39
0,60
8406430,00
1061,00
265000,00
8406500,00
1058,80
51,41
70,00
2,20
215808,00
8442070,13
52,00
215800,00
8442000,00
51,00
8,00
70,13
1,00
.
313550,20
8277930,40
750,20
313500,00
8277900,00
758,20
50,20
30,40
8,00
20
304250,80
8292870,50
1160,00
304200,00
8292900,00
1155,60
50,80
29,50
4,4
239,5
209,9
13,9
ECM
Z
Precisión (m)
Hz y V
Al 95% del nivel
de confianza
549,96 y 27.15
Exactitud del atributo
Este tipo de exactitud se puede analizar a través del modelo que expresa la relación entre la
Entidad geográfica, los Atributos que la describen y los Valores cuantitativos y cualitativos
que contiene este último, (E-A-V). Aunque se debe tener presente que, para juzgar sobre la
capacidad de los datos para ser utilizados, hay primero que juzgar estos datos con respecto
a la especificación, y después considerar las limitaciones de la propia especificación.
Después de revisado el modelo E-A-V en las capas que conforman el SIGAN y comprobado
que la especificaciones y sus limitaciones se aceptan, por que se ajustan al tipo de gestión
que se le pretende dar, se ha considerado que está libre de errores.
Exactitud temporal
Existe si el conjunto de datos del SIG tiene una dimensión temporal y de esta forma los datos
de información espaciales tienen la forma de: x, y, z, t. Para el modelo del error es necesario
investigar la dependencia entre esta coordenada adicional con las otras tres, para de esta
forma prestar atención a la correlación existente. Para el SIGAN esta variable no fue
cualificada, por no existir un patrón de comparación temporal real en el conjunto de datos de
partida.
Exactitud temática
El análisis de esta exactitud es conveniente hacerlo después de determinada la exactitud
espacial y la del modelo E-A-V, ya que en última instancia la no existencia de errores en
dicho modelo, implica generalmente la no existencia de los mismos entre las diferentes
capas temáticas componentes del SIGAN y la magnitud de la desviación espacial, puede
expresar cuan desviada esta la temática.
COMPONENTE RESOLUCIÓN
La resolución (o precisión) se refiere a la cantidad de detalle que puede discernirse en el
espacio, tiempo o tema. Para el caso del SIGAN, toda la cartografía de partida es capturada
a partir de la obtención de imágenes con dimensiones de 8 x 10 pulgadas, con una
resolución de 300 dpi, para una dimensión de píxel de 2400 x 3000 píxeles, obteniéndose
entonces que: La dimensión de un píxel viene definida por la relación 20.32cm /2400 píxel y
25.4cm/3000 píxel, obteniéndose una dimensión de 0.00846 cm, equivalente a un área de
0.0000715716 cm2. Esta magnitud corresponde linealmente, por ejemplo, para una escala
1:500 000, a 42.3 m, que en términos de área son 0.00178929 Km2.
La selección de la escala de un mapa depende fundamentalmente de la resolución que la
misma va a permitir. Así el ojo humano no puede observar medidas inferiores a 0.2 mm.,
(Pascoalinho, 1965). Este valor expresado en metros equivale a 0.0002 m, que representa el
pormenor mínimo que en un mapa se puede dibujar a una escala 1/n. Así en un mapa, por
ejemplo, a escala 1: 500 000, el límite de percepción visual se puede calcular como:
0.2mm x 500m/mm=100m
Para el área el procedimiento es:
A=100mx100m=10000m2=0.01km2
Esto significa que, solamente es posible representar en un mapa a escala 1:500000 objetos
cuya área sea igual o superior 0.01km2.
Ahora bien, si se compara el área del píxel con el valor anteriormente calculado, para un
mapa 1: 500 000, es fácil apreciar que es 5.6 veces menor que el mínimo pormenor que se
puede dibujar, por lo que se puede afirmar que la resolución y las dimensiones de la imagen
garantizan que todos los elementos geográficos visibles en el mapa pueden ser capturados.
CONSISTENCIA
Esta componente se refiere a la ausencia de contradicciones aparentes y es una medida de
la validez interna de una base de datos. La magnitud de la consistencia topológica, se estima
a partir de la determinación de la exactitud de los elementos geográficos. Así al evaluar la
calidad de los datos, esta magnitud para el caso del SIGAN, donde se ha utilizado una
plataforma vectorial del tipo espaguetis, queda garantizada.
COMPONENTE INTEGRIDAD
La integridad se refiere a una falta de errores de omisión en una base de datos. Se considera
que las medidas de omisión y comisión, son suficientes para describir cuán bien los datos
cumplen las demandas del usuario. Así en función de la disponibilidad de información, para
el caso del SIGAN, se considera que no existen errores de omisión ni comisión.
PROCEDIMIENTO SEGUIDO PARA ASEGURAR LA CALIDAD DEL SIGA
Primeramente se procede a normalizar escalarmente las magnitudes de las componentes de
calidad involucradas en el análisis. Para el caso del SIGAN se utiliza una escala de tres
valores que expresan la calidad individual de cada componente en alta, media y baja, según
se puede apreciar en la tabla 2.
Tabla 2. Normalización escalar de las componentes de calidad
Escala de valores normalizados
Componentes de la
Alta
Media
Baja
(3)
(2)
(1)
0.00-200 m
200- 500 m
Más de 500 m
Precisión vertical
0.00-5.00
5.00-15.00 m
Más de 15.00 m
Exactitud temática
100-80%
80-60%
 60%
10 dP
Entre 10 y 5.6 (dP)
 5.6 dP
calidad espacial
Precisión horizontal
Resolución
Posteriormente se utiliza el
método AHP, de las Jerarquías
Analíticas
de
Saaty,
para
ponderar los resultados, tabla 3.
Para evaluar la calidad general
de una capa, el autor propone
determinar una nueva variable a
la que denomina Calidad global,
(Tabla 4), que para este caso fue
66.6 %.
Tabla 3. Resultado de la aplicación del método de ponderación.
COMPONENTES
Precisión
horizontal
Grupo B
Precisión
Exactitud
vertical
temática
Resolución
Precisión
5
7
8
9
horizontal
Precisión
3
5
8
9
Grupo
vertical
A
Exactitud
2
2
5
8
temática
Resolución
1
1
2
5
La suma de los pesos es igual a 1, se obtiene dividiendo la suma de la fila entre el
total de la columna
SUMA
PESOS
%
SIGNIFICACIÓN
%
29
36.25
9.0625
25
31.25
7.8125
17
21.25
5.3125
9
11.25
2.8125
80
100
25%
Para las líneas y áreas, donde la situación es más compleja, el autor aborda el problema
utilizando la Teoría de Conjuntos Borrosos, a partir de un razonamiento aproximado que
utiliza premisas imprecisas tales como: con cierto grado de incertidumbre (Incertidumbre:
baja, media y alta).
Tabla 4. Ejemplo de determinación de la Calidad global, Tema Suelos.
Componentes de la
calidad espacial
Escala de valores
normalizados
Alta
(3)
Media
(2)
Baja
(1)
Precisión horizontal
x
Precisión vertical
Exactitud temática
x
Calidad Global
25
x
3
8.33
Para el SIGAN se ha considerado
un conjunto X= ECM, que
expresa la desviación espacial
máxima calculada según la
expresión.
16.6
x
Resolución
Calidad
Global
%
ECM 
16.6
4
1
66.6
ECMx2  ECMy2
n
Así, todos los valores comprendidos en el intervalo 0, ECM, expresan una cierta magnitud de
incertidumbre, que pueden ser considerados como el universo de discurso para el
tratamiento de la incertidumbre espacial. En la figura 2 se puede observar la función
característica que define al conjunto X.
ENTIDAD A
ENTIDAD B
1
0.5
500
250
0
250
500
Incertidumbre baja en A y B
Incertidumbre media en B
Incertidumbre media en A
Incertidumbre alta en B
Incertidumbre alta en A
Figura 2. Función característica que define al conjunto borroso X.
Para definir el grado de incertidumbre que genera el posible desplazamiento del objeto (ej.
línea que separa un suelo A de otro B), dentro del intervalo 0, ECM, según se acerque a 0 o
a ECM, se introduce un controlador borroso, Ej. Incertidumbre alta, media y baja, como se
ilustra en la figura 3. De esta forma se especifican las funciones pertenecientes al conjunto
borroso.
ENTIDAD A
ENTIDAD B
1
500
250
0
187.5
0.5
250
500
Figura 3. Funciones pertenecientes al conjunto borroso que definen el grado de incertidumbre
que genera el posible desplazamiento del objeto (ej. línea que separa un suelo A de otro B).
Así para cualquier valor del ECM se puede calcular el % de incertidumbre comprendido en la
escala de incertidumbre utilizada, por ejemplo para un valor de 187.5 de ECM en dirección
de B, se obtiene que la incertidumbre puede ser considerada un 25 % baja y un 75 % media,
esto le brinda a los usuarios un universo más flexible a la hora de emitir criterios sobre la
certidumbre de los datos empleados en la gestión que realiza, e incorporados al SIGAN al
utilizar la herramienta buffer de la plataforma utilizada.
CONCLUSIONES.
La componente exactitud se determina midiendo la distancia entre la localización codificada y
la localización real obtenida a través de la comparación con puntos de control, estimándose
la desviación espacial de x, y, z, en. 239.47 m, 209.90 m y 13.85 m respectivamente, para
una precisión horizontal y vertical de 549.96 m y 27.15 m.
La resolución de los datos se calcula considerando que las dimensiones de píxel son las
medidas horizontales y verticales de una imagen, expresadas en píxeles, determinándose
sus dimensiones, multiplicando tanto el ancho como la altura por la resolución definida en la
captura.
La calidad general fue de 66.6 % que en función de la escala establecida, se sitúa entre un
mínimo de 33 % y un máximo de 100, no se considera el 0 %, ya que se estima que
independientemente de la mala calidad que pueda tener la información de partida, algún
valor de uso debe contener.
REFERENCIAS.
Hunter, G.J. 1999. Managing uncertainty, en Longley, P.A., Goodchild, M.F, Maguire, D.J. y Rhind, D.W. (Eds.):
Geographical information systems. Volumen II, New York, John Wiley & Sons, Inc., pp. 633-641.
Brunsden, C.; Carver, S.; Charlton, M. & Openshaw, S. 1990. A review of methods for handling error
propagation in GIS, Proceedings of the European Conference on GIS, pp. 106-116.
Davis, T.J. & Keller, C.P. 1997. Modelling uncertainty in natural resource analysis using fuzzy sets and Monte
Carlo simulation: slope stability prediction, International Journal of Geographical Information Science, 11, 5,
pp. 409-434.
Emmi, P.C. & Horton, C.A. 1996. Seismic risk assessment, accuracy requirements, and GIS-based sensitivity
analysis, en Goodchild, M.F, Steyaert, L.T. Y Parks, B.O. (Eds.): GIS and Environmental modeling:
progress and research issues. Fort Collins, CO: GIS World Books, pp. 191-195.
Collins, G.; Kremer, J.N. & Valiela, I. 2002. Assessing uncertainty in estimates of nitrogen loading to estuaries
for research, planning, and risk assessment, Environmental Management, 25, 6, pp.635-645.
Greenwalt, C. R., and Schultz, M. E. 1968. Principles And Error Theory And Cartographic Application. ACIC
Technical report No. 96, St. Louis. Mo.
Kanti, G. M. 2005. Aseguramiento de la calidad del producto durante el ciclo de vida de un GIS. Scientist,
Regional Remote Sensing Service Centre. ISRO, Dept. of Space, Kharagpur.
Pascoalinho, J. 1965. Topografia Geral. Instituto Superior Tecnico. Edição da Secçao de Folhas da A. E. I. S. T.,
Angola, 296 pag.
Descargar