Evaluación de la precisión de clasificación de especies arbóreas

Anuncio
Evaluación de la precisión de clasificación de especies arbóreas esclerófilas a
diferentes resoluciones espectrales y espaciales.
M.A. Peñaa*, P. Cruz a, M. Roiga
*Autor para correspondencia: aUniversidad Mayor, Centro de Estudios de Recursos
Naturales, Oterra,
Camino La Pirámide #5750, Huechuraba, Santiago, Chile, tel: 56-2-3281430,
[email protected]
Resumen
La clasificación hiperespectral es una técnica efectiva para mapear especies vegetales. Sin
embargo, identificar las resoluciones espectral y espacial de imagen más adecuadas para la
discriminación de elementos es un paso metodológico crítico antes de intentar realizar
cualquier procedimiento de clasificación automatizada. En este trabajo abordamos el efecto
que tiene degradar el ancho de banda y el tamaño de píxel original de una imagen
hiperespectral en la precisión de clasificación de especies arbóreas de un bosque
esclerófilo, con el fin de proponer resoluciones espectral y espacial de imagen optimas para
mapear esas especies. Una imagen hiperespectral con resolución espacial submétrica (i.e.,
hiperespacial) fue adquirida en Diciembre de 2009, en un área boscosa localizada en los
faldeos de la cordillera de Los Andes central. Las principales especies arbóreas del área de
estudio fueron localizadas en terreno unos pocos meses después (durante la misma estación
en que fue adquirida la imagen). Después, dos clasificadores hiperespectrales supervisados
(mapeador de ángulos espectrales, SAM, y divergencia espectral, SID) fueron aplicados
sobre las imágenes original y aquellas espectralmente y espacialmente remuestreadas, con
el fin de mapear esas especies. Las precisiones globales más altas de la clasificación (>
80%) fueron alcanzadas usando el clasificador SAM sobre la imagen hiperespectral
previamente sujeta a un procedimiento de reducción de redundancia espectral (fracción
mínima de ruido, MNF) y con sus resoluciones espectral y espacial originales. En general,
las precisiones globales y parciales fueron sensibles al método de clasificación empleado y
las resoluciones originales de la imagen entregaron los mejores resultados. En todos los
casos las precisiones de la clasificación fueron más sensibles a cambios en la resolución
espacial que a cambios en la resolución espectral. Concluimos que la tecnología
simultáneamente hiperespectral e hiperespacial es una poderosa herramienta para lograr una
buena clasificación automatizada de especies arbóreas de bosque esclerófilo.
1. INTRODUCCIÓN
La descripción de la composición y abundancia de especies arbóreas es crítica para la
caracterización ecológica y ecosistémica de las formaciones de bosque, y
consecuentemente para el monitoreo y manejo de áreas boscosas. Sin embargo, la
identificación de especies arbóreas mediante métodos de terreno puede ser una tarea
dificultosa, particularmente en áreas extensas e inaccesibles, debido a los recursos (tiempo,
personal, instrumentos) involucrados para lograr mediciones adecuadas. La teledetección
hiperespectral constituye una aproximación alternativa para lograr tal tarea. Esta es una
tecnología de teledetección óptica pasiva que permite obtener imágenes de la superficie
terrestre en cientos de muestreos espectrales (en adelante bandas) angostos y contiguos
localizados a lo largo de las dimensiones visible e infrarroja del espectro electromagnético
(Goetz, 2009). La resolución espectral mejorada de las imágenes hiperspectrales en
comparación con aquellas multiespectrales (usualmente compuestas de alrededor de cuatro
bandas anchas dentro del rango espectral óptico) las han convertido en una poderosa
herramienta para discriminar elementos espectralmente similares. Dado que las especies de
una formación de bosque se han adaptado a los mismos factores ambientales, ellas
comparten una base fisiológica y fenológica similar. Por lo tanto, sus composiciones
bioquímicas pueden producir similares curvas espectrales a lo largo del espectro óptico
(McCoy 2005, Blackburn 2007). Como consecuencia, a la resolución espectral grosera de
las imágenes multiespectrales las especies arbóreas de una misma formación pueden
mostrar comportamientos espectrales indistintos, restringiendo su discriminación basada en
técnicas de teledetección. La tecnología hiperespectral puede subsanar esta limitante porque
está capacitada para detectar diferencias espectrales más sutiles entre especies vegetales,
aun si sus propiedades biofísicas o bioquímicas se asemejan (Blackburn 2007).
La teledetección hiperespectral añade la capacidad de adquirir imágenes con alta resolución
espacial, usualmente submétrica (i.e., hiperespacial). Esto hace que la adquisición y
procesamiento de estas imágenes requiera enormes recursos computacionales. Por otro
lado, los costos relacionados con la misión de vuelo aumentan si son requeridas altas
resoluciones espaciales y espectrales de imagen, ya que tanto la velocidad como la altitud
de vuelo necesitan ser reducidas (la adquisición completa de bandas no puede ser lograda si
la velocidad de vuelo es demasiado alta y no pueden ser obtenidos píxeles pequeños si la
aeronave vuela muy alejada del suelo).
Este trabajo aborda el efecto que tiene degradar el ancho de banda y el tamaño de píxel
original de una imagen hiperespectral e hiperespacial sobre la precisión de clasificación de
especies arbóreas de bosque esclerófilo, con el fin de proponer una resolución espectral y
espacial óptima para el mapeo de especies arbóreas de este tipo de bosques. Esto no sólo es
útil para propósitos de mapeo sino también para planificar eficientemente de misiones de
vuelo y evitar la producción y procesamiento de montos de datos innecesarios. Para lograr
este objetivo, una imagen hiperespectral e hiperespacial fue adquirida en Diciembre de
2009, sobre un área boscosa localizada en los faldeos de la cordillera de Los Andes central,
Chile. Las principales especies arbóreas del área de estudio fueron muestreadas en terreno
unos meses después, durante la misma temporada en que la imagen fue adquirida. Después,
dos clasificadores hiperespectrales supervisados fueron aplicados sobre la imagen original y
sobre un nuevo conjunto de imágenes sujetas a diferentes remuestreos espectrales y
espaciales, con el propósito de mapear esas especies arbóreas muestreadas. Finalmente, la
precisión de clasificación fue evaluada para cada imagen clasificada.
2. MATERIALES Y MÉTODOS
Área de estudio: El área de estudio (33°42’59,17’’S - 70°30’6.29’’O) corresponde a una
faja angosta de terreno de alrededor de 35 ha ubicada en las proximidades de la reserva río
Clarillo, comuna de Pirque, Región Metropolitana, Chile. Esta tiene un relieve ondulado y
de pendientes suaves y comprende un rango de altitud aproximado de 815 a 885 msnm con
un clima marcadamente mediterráneo. La vegetación corresponde a bosque esclerófilo con
una dosel superior básicamente compuesto de cuatro especies: espino (Acacia caven (Mol.)
Mol.), litre (Lythraea caustica (Mol.) H. et A.), peumo (Cryptocarya alba (Mol.) Looser) y
quillay (Quillaja saponaria Mol.).
Adquisición de la imagen: La imagen fue adquirida por un espectroradiometro de imagen
óptico. Específicamente, un escáner de línea Hyspex© fue usado, el cual es sensible a las
longitudes de onda comprendidas entre los 400 y 1000 nm del espectro electromagnético
(i.e., regiones del visible e infrarrojo cercano). Este rango es muestreado en intervalos de
3,7 nm, lo que resulta en una resolución espectral de 160 bandas. Cada banda tiene un
rango dinámico de 65.536 niveles de voltaje, lo que resulta en una resolución radiométrica
de 16 bits. El campo de visión del escáner es de 17°, en el que se alinean 1600 detectores de
voltaje con un campo de visión instantáneo en dirección cruzada al barrido de 0,185 mrad.
El posicionamiento geográfico de la imagen es logrado con una unidad de medición inercial
que almacena simultáneamente la actitud y desplazamiento de la aeronave y las
coordenadas geográficas del terreno barrido. La imagen fue adquirida el 9 de diciembre,
alrededor de las 2:00 pm, hora local (ángulo de elevación solar de 75°).
Pre-procesamiento de la imagen: Los niveles digitales originales de los píxeles de la
imagen fueron automáticamente convertidos a radiancias absolutas y luego, mediante el uso
de un modelo de corrección atmosférica hiperespectral, esas unidades fueron convertidas a
reflectancias superficiales aparentes (i.e., la razón entre radiancia libre de efectos
atmosféricos de distorsión e irradiancia). La corrección geométrica de la imagen fue
realizada usando un modelo paramétrico.
Remuestreo de la imagen: El tamaño de píxel original de la imagen de 0,3 m fue
remuestreado en una progresión aritmética con una diferencia común de 2 hasta alcanzar un
tamaño de píxel de 2,4 m. Este procedimiento fue detenido en ese tamaño de píxel debido a
que el próximo valor (i.e., 4,8 m) excede el diámetro de copa de muchos de los árboles del
área de estudio. Simultáneamente, el ancho de banda original de la imagen de 3,7 nm fue
remuestreado en una progresión aritmética con diferencia común de 2 hasta alcanzar un
ancho de banda de 14,8 nm. Este procedimiento fue detenido en ese ancho de banda porque
el próximo valor (29,6 nm) entrega una resolución espectral demasiado gruesa para
diferenciar especies vegetales. Adicionalmente, la redundancia espectral de la imagen
original fue reducida aplicando una transformación MNF (minimum noise fraction) (Green
et al., 1988). Este procedimiento fue aplicado sobre cada imagen espectral y espacialmente
remuestreada. Así, 24 combinaciones de imágenes remuestreadas fueron obtenidas: 12
basadas en bandas originales y 12 basadas en bandas transformadas (tabla 1).
Tabla 1. Tamaño de píxel, ancho y cantidad de bandas de cada imagen remuestreada.
Muestreo de especies arbóreas: Ocho rodales fueron visualmente delimitados en la
imagen, para luego realizar un muestreo aleatorio estratificado de sus principales especies
arbóreas. Los estratos correspondieron a las cuatro especies arbóreas dominantes que
componen el dosel superior del área de estudio. En total, 766 copas de árboles fueron
delimitadas y cartografiadas en terreno con la ayuda de un GPS (global positioning system):
188 de espino, 178 de litre, 295 de peumo y 106 de quillay. Posteriormente, la muestra
total de árboles fue dividida en un grupo para propósitos de clasificación (i.e., sitios de
entrenamiento) y otro para propósitos de evaluación de precisión de la clasificación (i.e,
verdad de terreno). Se evitó muestrear especies arbóreas con una condición anómala (e.g.,
enfermos).
Clasificación de imágenes: Dos conocidos algoritmos de clasificación hiperespectral
fueron usados: mapeador de ángulos espectrales (spectral angle mapper, SAM) y
divergencia espectral (spectral information divergence, SID). El primero, clasifica los
elementos de la imagen midiendo la separación angular entre un vector espectral de
referencia y cada vector del píxel en un espacio n-D (Kruse et al., 1993). El segundo,
clasifica los elementos de la imagen midiendo la discrepancia probabilística entre el
espectro de referencia y los espectros de cada píxel (Du et al., 2004). Las formas como
suelo desnudo o pastizal fueron enmascaradas en la imagen mediante el uso de un umbral
de NDVI (normalized difference vegetation index). Los puntos correspondientes al grupo
de árboles muestreados para clasificación fueron superpuestos a la imagen para extraer de
ella sus curvas espectrales según clases de interés (especies arbóreas). Posteriormente, fue
probada la separabilidad estadística de cada par de clases empleando la medida de
divergencia transformada. Debido a la alta dominancia de las clases de interés en la imagen,
los clasificadores fueron forzados a asignar los píxeles a alguna de ellas. Finalmente, la
precisión de cada una de las 24 imágenes clasificadas fue evaluada mediante matrices de
error, usando el grupo de muestras definido para este fin.
3. RESULTADOS
De acuerdo a la tabla 2 en todos los casos la separabilidad estadística entre los sitios de
entrenamiento de las clases derivadas de las imágenes normales está por sobre 1.500 (bajo
ese valor existe un alto riesgo de clasificar incorrectamente los píxeles de la imagen). Los
valores más bajos de separabilidad están asociados a la clase litre, particularmente cuando
esta es comparada con la clase peumo. La separabilidad tiende a aumentar con el tamaño de
píxel. Este incremento es particularmente relevante para la clase litre, cuyos valores críticos
de separabilidad (≈ 1,500) obtenidos con el tamaño de píxel original pasan a ser valores
aceptables (≈ 1,700) con tamaños de píxel de 1,2 y 2,4 m. Estos resultados sugieren que la
variabilidad espectral que cada clase posee con el tamaño de píxel original podría verse
disminuida con la degradación de la resolución espacial de la imagen, lo que entonces
podría tener el efecto de remarcar diferencias espectrales entre clases.
Tabla 2. Separabilidad estadística de todos los pares posibles de los sitios de entrenamiento de las clases de
especies arbóreas para cada remuestreo espectral y espacial, usando la imagen original. Ac: espino (Acacia
caven), Lc: litre (Lythraea caustica), Ca: peumo (Cryptocarya alba), Qs: quillay (Quillaja saponaria).
La tabla 3 muestra la separabilidad estadística entre los sitios de entrenamiento de las clases
derivadas de las imágenes transformadas. De forma opuesta a las imágenes normales, en
este caso la separabilidad decrece con la degradación espacial y espectral de la imagen, lo
cual se asocia con la crecientemente baja resolución espectral que arroja la transformación
MNF con cada aumento del tamaño del píxel. De hecho a tamaños de píxel de 2,4 m todos
los valores de separabilidad están muy por debajo de 1.500. Como con las imágenes
normales, la clase litre exhibe los peores valores de separabilidad. Más aún, en este caso la
mayoría de ellos están por debajo de 1.500. En general, los valores de separabilidad
entregados por las imágenes transformadas fueron más bajos que aquellos entregados por
las imágenes originales, principalmente debido a la más baja resolución espectral de las
primeras en comparación con las segundas.
Tabla 3. Separabilidad estadística de todos los pares posibles de los sitios de entrenamiento de las clases de
especies arbóreas para cada remuestreo espectral y espacial, usando la imagen transformada. Ac: espino
(Acacia caven), Lc: litre (Lythraea caustica), Ca: peumo (Cryptocarya alba), Qs: quillay (Quillaja
saponaria).
De acuerdo a la tabla 4, las precisiones generales que se lograron con el clasificador SAM
para los distintos remuestreos basados en la imagen normal oscilaron entre 57,5 y 58,8% y
la degradación espacial y espectral tuvo un efecto mínimo en dichos valores. Las
precisiones parciales fueron muy bajas para la clase litre.
Tabla 4. Precisiones general y parciales obtenidas con el clasificador SAM aplicado a los remuestreos basados
en la imagen normal.
De acuerdo a la tabla 5, las precisiones generales que se lograron con el clasificador SID
para los distintos remuestreos basados en la imagen normal oscilaron entre 51 y 58,1% y en
comparación con el caso anterior la degradación espacial y espectral tuvo un efecto un poco
mayor en dichos valores. Las precisiones parciales siguieron siendo muy bajas para la clase
litre y la clase espino sufrió un descenso brusco en su precisión al aumentar el tamaño de
píxel a 2,4 m.
Tabla 5. Precisiones general y parciales obtenidas con el clasificador SID aplicado a los remuestreos basados
en la imagen normal.
De acuerdo a la tabla 6, las precisiones generales y parciales que se lograron con el
clasificador SAM para los distintos remuestreos basados en las imágenes transformadas
fueron notoriamente más altas que en los casos anteriores, particularmente usando píxeles
de 0,3 y 0,6 m (> 79,8). Tanto las precisiones general como parciales fueron sensibles a la
degradación del tamaño de píxel y la clase litre siguió exhibiendo la peor precisión.
Tabla 6. Precisiones general y parciales obtenidas con el clasificador SAM aplicado a los remuestreos basados
en las imágenes transformadas.
De acuerdo a la tabla 7, las precisiones generales y parciales que se lograron con el
clasificador SID para los distintos remuestreos basados en las imágenes transformadas
fueron más altas que en los casos basados en la imagen normal, particularmente usando
píxeles de 0,3 y 0,6 m. Sin embargo, ellos no logran ser tan altos como en el caso del
clasificador SAM aplicado a los remuestreos de las imágenes transformadas (figura 6).
Tanto las precisiones general como parciales fueron sensibles a la degradación del tamaño
de píxel y la clase litre nuevamente exhibió la peor precisión.
Tabla 4. Precisiones general y parciales obtenidas con el clasificador SID aplicado a los remuestreos basados
en la imagen transformada.
4. DISCUSIÓN Y CONCLUSIONES
La transformación MNF fue crítica para obtener precisiones de clasificación altas usando
tanto el SAM como el SID. Esto destaca la importancia de reducir la redundancia espectral
para fines de clasificación como el perseguido en este estudio. Por otro lado, para ambos
clasificadores, las precisiones generales obtenidas de los remuestreos basados en las
imágenes transformadas fueron más sensibles al aumento del tamaño de píxel que las
obtenidas de los remuestreos basados en la imagen normal, lo que destaca el impacto
negativo que tiene el incremento del tamaño de píxel en una dimensionalidad espectral tan
reducida como la derivada de la transformación MNF. Sin embargo, para los remuestreos
espaciales submétricos, la degradación de la resolución espectral original de 160 a 39
bandas, no fue tan determinante para lograr buenas precisiones. Esto sugiere que para
clasificar este tipo especies es más importante contar con resoluciones espaciales
submétricas que con resoluciones espectrales inferiores a 7,4 nm.
Las precisiones generales y parciales más altas se lograron empleando el clasificador SAM
aplicado a imágenes transformadas con el tamaño de píxel y el ancho de banda original
(figura 2). Rahman et al. (2003) afirma que si se emplean imágenes hiperespectrales con
resoluciones espaciales menores a 1 m se optimizan los resultados para identificar
propiedades de vegetación con similares funciones. Dalponte et al. (2009) clasificaron
especies arbóreas usando imágenes hiperespectrales y encontraron que las precisiones
bajaron con la degradación espectral. La precisión parcial del espino fue, de forma general,
la que más se redujo con el aumento del tamaño de píxel. Esto se relaciona directamente
con el relativamente bajo diámetro de copa del espino en el área de estudio, lo que implica
una mayor propensión a que se mezcle espectralmente con otros elementos al aumentar el
tamaño de píxel. Por otra parte, el litre siempre presentó precisiones muy por debajo de las
demás especies, lo que puede atribuirse a la posición social de codominancia que este
ocupa en el área de estudio (figura 1), quedando oculto a la visión aérea y dificultando así
su detección espectral. Waser et al. (2010), también obtuvo las peores precisiones (<65%)
en la clasificación de especies no dominantes, aunque cabe destacar que también fueron las
que muestreó en menor cantidad.
Figura 1. Situación de las especies arbóreas en el dosel de bosque esclerófilo del área de estudio.
Otra causa de esta mala clasificación puede atribuirse a la complejidad o ambigüedad
espectral de la especie. En el área de estudio coexisten dos variedades de litre que crecen de
forma simpátrica: Lithraea caustica var. caustica y Lithraea caustica var. Pilosa. Esta
última difiere de la primera por sus ramas jóvenes y hojas, en el envés, densamente
pubescentes (Donoso, 2006). Por lo tanto, la estructura diferente entre las hojas de ambas
variedades pudo ser la causante de una respuesta espectral variable y por tanto
contribuyente de la baja precisión de clasificación lograda para esta especie. La figura
Figura 2. Clasificación de especies arbóreas de los rodales definidos para el área de estudio empleando el
clasificador SAM aplicado a imágenes transformadas con el tamaño de píxel y el ancho de banda original.
Bibliografía
Blackburn G.A. 2007. Hyperspectral remote sensing of plant pigments. Journal of
Experimental Botany. 58(4): 855–867.
Donoso C. 2006. Las especies arbóreas de los bosques templados de Chile y Argentina,
autoecología. Valdivia, Chile. Marisa Cúneo Ediciones.
Du Y., Chang I., Ren H., Chang C., Jensen J.P. 2004. New hyperspectral discrimination
measure for spectral characterization. Optical Engineering. 43(8): 1777-1786.
Goetz A.F.H. 2009. Three decades of hyperspectral remote sensing of the earth: A personal
view. Remote Sensing of Environment. 113: s5-s16.
Green A.A., Berman M., Switzer P., Craig M.D. 1988. A transformation for ordering
multispectral data in terms of image quality with implications for noise removal. IEEE
Transactions on Geoscience and Remote Sensing. 26: 65-74.
Dalponte M., Bruzzone L., Vescovo L., Gianelle D. 2009. The role of spectral resolution
and classifier complexity in the analysis of hyperspectral images of forest areas. Remote
Sensing of Environment. 113: 2345-2355.
Kruse F.A., Lefkoff A.B., Boardman J.W., Heidebrecht K.B., Shapiro A.T., Barloon P.J.,
Goetz A.F.H. 1993. The Spectral Image Processing System (SIPS) – Interactive
visualization and analysis of imaging spectrometer data. Remote Sensing of Environment.
44: 145-163.
McCoy R.M. 2005. Field Methods in Remote Sensing. New York, USA. The Guilford
Press.
Rahman A.F., Gamon J.A., Sims D.A., Schmidt M. 2003. Optimum pixel size for
hyperspectral studies of ecosystem function in southern California chaparral and grassland.
Remote Sensing of Environment. 84:192-207.
Waser L.T., Ginzler C., Kuechler M., Baltsavias E., Hurni L. 2011. Semi-automatic
classification of tree species in different forest ecosystems by spectral and geometric
variables from Airbone Digital Sensor (ADS40) and RC30 data. Remote Sensing of
Environment. 115: 76-85.
Descargar