Evaluación de la precisión de clasificación de especies arbóreas esclerófilas a diferentes resoluciones espectrales y espaciales. M.A. Peñaa*, P. Cruz a, M. Roiga *Autor para correspondencia: aUniversidad Mayor, Centro de Estudios de Recursos Naturales, Oterra, Camino La Pirámide #5750, Huechuraba, Santiago, Chile, tel: 56-2-3281430, [email protected] Resumen La clasificación hiperespectral es una técnica efectiva para mapear especies vegetales. Sin embargo, identificar las resoluciones espectral y espacial de imagen más adecuadas para la discriminación de elementos es un paso metodológico crítico antes de intentar realizar cualquier procedimiento de clasificación automatizada. En este trabajo abordamos el efecto que tiene degradar el ancho de banda y el tamaño de píxel original de una imagen hiperespectral en la precisión de clasificación de especies arbóreas de un bosque esclerófilo, con el fin de proponer resoluciones espectral y espacial de imagen optimas para mapear esas especies. Una imagen hiperespectral con resolución espacial submétrica (i.e., hiperespacial) fue adquirida en Diciembre de 2009, en un área boscosa localizada en los faldeos de la cordillera de Los Andes central. Las principales especies arbóreas del área de estudio fueron localizadas en terreno unos pocos meses después (durante la misma estación en que fue adquirida la imagen). Después, dos clasificadores hiperespectrales supervisados (mapeador de ángulos espectrales, SAM, y divergencia espectral, SID) fueron aplicados sobre las imágenes original y aquellas espectralmente y espacialmente remuestreadas, con el fin de mapear esas especies. Las precisiones globales más altas de la clasificación (> 80%) fueron alcanzadas usando el clasificador SAM sobre la imagen hiperespectral previamente sujeta a un procedimiento de reducción de redundancia espectral (fracción mínima de ruido, MNF) y con sus resoluciones espectral y espacial originales. En general, las precisiones globales y parciales fueron sensibles al método de clasificación empleado y las resoluciones originales de la imagen entregaron los mejores resultados. En todos los casos las precisiones de la clasificación fueron más sensibles a cambios en la resolución espacial que a cambios en la resolución espectral. Concluimos que la tecnología simultáneamente hiperespectral e hiperespacial es una poderosa herramienta para lograr una buena clasificación automatizada de especies arbóreas de bosque esclerófilo. 1. INTRODUCCIÓN La descripción de la composición y abundancia de especies arbóreas es crítica para la caracterización ecológica y ecosistémica de las formaciones de bosque, y consecuentemente para el monitoreo y manejo de áreas boscosas. Sin embargo, la identificación de especies arbóreas mediante métodos de terreno puede ser una tarea dificultosa, particularmente en áreas extensas e inaccesibles, debido a los recursos (tiempo, personal, instrumentos) involucrados para lograr mediciones adecuadas. La teledetección hiperespectral constituye una aproximación alternativa para lograr tal tarea. Esta es una tecnología de teledetección óptica pasiva que permite obtener imágenes de la superficie terrestre en cientos de muestreos espectrales (en adelante bandas) angostos y contiguos localizados a lo largo de las dimensiones visible e infrarroja del espectro electromagnético (Goetz, 2009). La resolución espectral mejorada de las imágenes hiperspectrales en comparación con aquellas multiespectrales (usualmente compuestas de alrededor de cuatro bandas anchas dentro del rango espectral óptico) las han convertido en una poderosa herramienta para discriminar elementos espectralmente similares. Dado que las especies de una formación de bosque se han adaptado a los mismos factores ambientales, ellas comparten una base fisiológica y fenológica similar. Por lo tanto, sus composiciones bioquímicas pueden producir similares curvas espectrales a lo largo del espectro óptico (McCoy 2005, Blackburn 2007). Como consecuencia, a la resolución espectral grosera de las imágenes multiespectrales las especies arbóreas de una misma formación pueden mostrar comportamientos espectrales indistintos, restringiendo su discriminación basada en técnicas de teledetección. La tecnología hiperespectral puede subsanar esta limitante porque está capacitada para detectar diferencias espectrales más sutiles entre especies vegetales, aun si sus propiedades biofísicas o bioquímicas se asemejan (Blackburn 2007). La teledetección hiperespectral añade la capacidad de adquirir imágenes con alta resolución espacial, usualmente submétrica (i.e., hiperespacial). Esto hace que la adquisición y procesamiento de estas imágenes requiera enormes recursos computacionales. Por otro lado, los costos relacionados con la misión de vuelo aumentan si son requeridas altas resoluciones espaciales y espectrales de imagen, ya que tanto la velocidad como la altitud de vuelo necesitan ser reducidas (la adquisición completa de bandas no puede ser lograda si la velocidad de vuelo es demasiado alta y no pueden ser obtenidos píxeles pequeños si la aeronave vuela muy alejada del suelo). Este trabajo aborda el efecto que tiene degradar el ancho de banda y el tamaño de píxel original de una imagen hiperespectral e hiperespacial sobre la precisión de clasificación de especies arbóreas de bosque esclerófilo, con el fin de proponer una resolución espectral y espacial óptima para el mapeo de especies arbóreas de este tipo de bosques. Esto no sólo es útil para propósitos de mapeo sino también para planificar eficientemente de misiones de vuelo y evitar la producción y procesamiento de montos de datos innecesarios. Para lograr este objetivo, una imagen hiperespectral e hiperespacial fue adquirida en Diciembre de 2009, sobre un área boscosa localizada en los faldeos de la cordillera de Los Andes central, Chile. Las principales especies arbóreas del área de estudio fueron muestreadas en terreno unos meses después, durante la misma temporada en que la imagen fue adquirida. Después, dos clasificadores hiperespectrales supervisados fueron aplicados sobre la imagen original y sobre un nuevo conjunto de imágenes sujetas a diferentes remuestreos espectrales y espaciales, con el propósito de mapear esas especies arbóreas muestreadas. Finalmente, la precisión de clasificación fue evaluada para cada imagen clasificada. 2. MATERIALES Y MÉTODOS Área de estudio: El área de estudio (33°42’59,17’’S - 70°30’6.29’’O) corresponde a una faja angosta de terreno de alrededor de 35 ha ubicada en las proximidades de la reserva río Clarillo, comuna de Pirque, Región Metropolitana, Chile. Esta tiene un relieve ondulado y de pendientes suaves y comprende un rango de altitud aproximado de 815 a 885 msnm con un clima marcadamente mediterráneo. La vegetación corresponde a bosque esclerófilo con una dosel superior básicamente compuesto de cuatro especies: espino (Acacia caven (Mol.) Mol.), litre (Lythraea caustica (Mol.) H. et A.), peumo (Cryptocarya alba (Mol.) Looser) y quillay (Quillaja saponaria Mol.). Adquisición de la imagen: La imagen fue adquirida por un espectroradiometro de imagen óptico. Específicamente, un escáner de línea Hyspex© fue usado, el cual es sensible a las longitudes de onda comprendidas entre los 400 y 1000 nm del espectro electromagnético (i.e., regiones del visible e infrarrojo cercano). Este rango es muestreado en intervalos de 3,7 nm, lo que resulta en una resolución espectral de 160 bandas. Cada banda tiene un rango dinámico de 65.536 niveles de voltaje, lo que resulta en una resolución radiométrica de 16 bits. El campo de visión del escáner es de 17°, en el que se alinean 1600 detectores de voltaje con un campo de visión instantáneo en dirección cruzada al barrido de 0,185 mrad. El posicionamiento geográfico de la imagen es logrado con una unidad de medición inercial que almacena simultáneamente la actitud y desplazamiento de la aeronave y las coordenadas geográficas del terreno barrido. La imagen fue adquirida el 9 de diciembre, alrededor de las 2:00 pm, hora local (ángulo de elevación solar de 75°). Pre-procesamiento de la imagen: Los niveles digitales originales de los píxeles de la imagen fueron automáticamente convertidos a radiancias absolutas y luego, mediante el uso de un modelo de corrección atmosférica hiperespectral, esas unidades fueron convertidas a reflectancias superficiales aparentes (i.e., la razón entre radiancia libre de efectos atmosféricos de distorsión e irradiancia). La corrección geométrica de la imagen fue realizada usando un modelo paramétrico. Remuestreo de la imagen: El tamaño de píxel original de la imagen de 0,3 m fue remuestreado en una progresión aritmética con una diferencia común de 2 hasta alcanzar un tamaño de píxel de 2,4 m. Este procedimiento fue detenido en ese tamaño de píxel debido a que el próximo valor (i.e., 4,8 m) excede el diámetro de copa de muchos de los árboles del área de estudio. Simultáneamente, el ancho de banda original de la imagen de 3,7 nm fue remuestreado en una progresión aritmética con diferencia común de 2 hasta alcanzar un ancho de banda de 14,8 nm. Este procedimiento fue detenido en ese ancho de banda porque el próximo valor (29,6 nm) entrega una resolución espectral demasiado gruesa para diferenciar especies vegetales. Adicionalmente, la redundancia espectral de la imagen original fue reducida aplicando una transformación MNF (minimum noise fraction) (Green et al., 1988). Este procedimiento fue aplicado sobre cada imagen espectral y espacialmente remuestreada. Así, 24 combinaciones de imágenes remuestreadas fueron obtenidas: 12 basadas en bandas originales y 12 basadas en bandas transformadas (tabla 1). Tabla 1. Tamaño de píxel, ancho y cantidad de bandas de cada imagen remuestreada. Muestreo de especies arbóreas: Ocho rodales fueron visualmente delimitados en la imagen, para luego realizar un muestreo aleatorio estratificado de sus principales especies arbóreas. Los estratos correspondieron a las cuatro especies arbóreas dominantes que componen el dosel superior del área de estudio. En total, 766 copas de árboles fueron delimitadas y cartografiadas en terreno con la ayuda de un GPS (global positioning system): 188 de espino, 178 de litre, 295 de peumo y 106 de quillay. Posteriormente, la muestra total de árboles fue dividida en un grupo para propósitos de clasificación (i.e., sitios de entrenamiento) y otro para propósitos de evaluación de precisión de la clasificación (i.e, verdad de terreno). Se evitó muestrear especies arbóreas con una condición anómala (e.g., enfermos). Clasificación de imágenes: Dos conocidos algoritmos de clasificación hiperespectral fueron usados: mapeador de ángulos espectrales (spectral angle mapper, SAM) y divergencia espectral (spectral information divergence, SID). El primero, clasifica los elementos de la imagen midiendo la separación angular entre un vector espectral de referencia y cada vector del píxel en un espacio n-D (Kruse et al., 1993). El segundo, clasifica los elementos de la imagen midiendo la discrepancia probabilística entre el espectro de referencia y los espectros de cada píxel (Du et al., 2004). Las formas como suelo desnudo o pastizal fueron enmascaradas en la imagen mediante el uso de un umbral de NDVI (normalized difference vegetation index). Los puntos correspondientes al grupo de árboles muestreados para clasificación fueron superpuestos a la imagen para extraer de ella sus curvas espectrales según clases de interés (especies arbóreas). Posteriormente, fue probada la separabilidad estadística de cada par de clases empleando la medida de divergencia transformada. Debido a la alta dominancia de las clases de interés en la imagen, los clasificadores fueron forzados a asignar los píxeles a alguna de ellas. Finalmente, la precisión de cada una de las 24 imágenes clasificadas fue evaluada mediante matrices de error, usando el grupo de muestras definido para este fin. 3. RESULTADOS De acuerdo a la tabla 2 en todos los casos la separabilidad estadística entre los sitios de entrenamiento de las clases derivadas de las imágenes normales está por sobre 1.500 (bajo ese valor existe un alto riesgo de clasificar incorrectamente los píxeles de la imagen). Los valores más bajos de separabilidad están asociados a la clase litre, particularmente cuando esta es comparada con la clase peumo. La separabilidad tiende a aumentar con el tamaño de píxel. Este incremento es particularmente relevante para la clase litre, cuyos valores críticos de separabilidad (≈ 1,500) obtenidos con el tamaño de píxel original pasan a ser valores aceptables (≈ 1,700) con tamaños de píxel de 1,2 y 2,4 m. Estos resultados sugieren que la variabilidad espectral que cada clase posee con el tamaño de píxel original podría verse disminuida con la degradación de la resolución espacial de la imagen, lo que entonces podría tener el efecto de remarcar diferencias espectrales entre clases. Tabla 2. Separabilidad estadística de todos los pares posibles de los sitios de entrenamiento de las clases de especies arbóreas para cada remuestreo espectral y espacial, usando la imagen original. Ac: espino (Acacia caven), Lc: litre (Lythraea caustica), Ca: peumo (Cryptocarya alba), Qs: quillay (Quillaja saponaria). La tabla 3 muestra la separabilidad estadística entre los sitios de entrenamiento de las clases derivadas de las imágenes transformadas. De forma opuesta a las imágenes normales, en este caso la separabilidad decrece con la degradación espacial y espectral de la imagen, lo cual se asocia con la crecientemente baja resolución espectral que arroja la transformación MNF con cada aumento del tamaño del píxel. De hecho a tamaños de píxel de 2,4 m todos los valores de separabilidad están muy por debajo de 1.500. Como con las imágenes normales, la clase litre exhibe los peores valores de separabilidad. Más aún, en este caso la mayoría de ellos están por debajo de 1.500. En general, los valores de separabilidad entregados por las imágenes transformadas fueron más bajos que aquellos entregados por las imágenes originales, principalmente debido a la más baja resolución espectral de las primeras en comparación con las segundas. Tabla 3. Separabilidad estadística de todos los pares posibles de los sitios de entrenamiento de las clases de especies arbóreas para cada remuestreo espectral y espacial, usando la imagen transformada. Ac: espino (Acacia caven), Lc: litre (Lythraea caustica), Ca: peumo (Cryptocarya alba), Qs: quillay (Quillaja saponaria). De acuerdo a la tabla 4, las precisiones generales que se lograron con el clasificador SAM para los distintos remuestreos basados en la imagen normal oscilaron entre 57,5 y 58,8% y la degradación espacial y espectral tuvo un efecto mínimo en dichos valores. Las precisiones parciales fueron muy bajas para la clase litre. Tabla 4. Precisiones general y parciales obtenidas con el clasificador SAM aplicado a los remuestreos basados en la imagen normal. De acuerdo a la tabla 5, las precisiones generales que se lograron con el clasificador SID para los distintos remuestreos basados en la imagen normal oscilaron entre 51 y 58,1% y en comparación con el caso anterior la degradación espacial y espectral tuvo un efecto un poco mayor en dichos valores. Las precisiones parciales siguieron siendo muy bajas para la clase litre y la clase espino sufrió un descenso brusco en su precisión al aumentar el tamaño de píxel a 2,4 m. Tabla 5. Precisiones general y parciales obtenidas con el clasificador SID aplicado a los remuestreos basados en la imagen normal. De acuerdo a la tabla 6, las precisiones generales y parciales que se lograron con el clasificador SAM para los distintos remuestreos basados en las imágenes transformadas fueron notoriamente más altas que en los casos anteriores, particularmente usando píxeles de 0,3 y 0,6 m (> 79,8). Tanto las precisiones general como parciales fueron sensibles a la degradación del tamaño de píxel y la clase litre siguió exhibiendo la peor precisión. Tabla 6. Precisiones general y parciales obtenidas con el clasificador SAM aplicado a los remuestreos basados en las imágenes transformadas. De acuerdo a la tabla 7, las precisiones generales y parciales que se lograron con el clasificador SID para los distintos remuestreos basados en las imágenes transformadas fueron más altas que en los casos basados en la imagen normal, particularmente usando píxeles de 0,3 y 0,6 m. Sin embargo, ellos no logran ser tan altos como en el caso del clasificador SAM aplicado a los remuestreos de las imágenes transformadas (figura 6). Tanto las precisiones general como parciales fueron sensibles a la degradación del tamaño de píxel y la clase litre nuevamente exhibió la peor precisión. Tabla 4. Precisiones general y parciales obtenidas con el clasificador SID aplicado a los remuestreos basados en la imagen transformada. 4. DISCUSIÓN Y CONCLUSIONES La transformación MNF fue crítica para obtener precisiones de clasificación altas usando tanto el SAM como el SID. Esto destaca la importancia de reducir la redundancia espectral para fines de clasificación como el perseguido en este estudio. Por otro lado, para ambos clasificadores, las precisiones generales obtenidas de los remuestreos basados en las imágenes transformadas fueron más sensibles al aumento del tamaño de píxel que las obtenidas de los remuestreos basados en la imagen normal, lo que destaca el impacto negativo que tiene el incremento del tamaño de píxel en una dimensionalidad espectral tan reducida como la derivada de la transformación MNF. Sin embargo, para los remuestreos espaciales submétricos, la degradación de la resolución espectral original de 160 a 39 bandas, no fue tan determinante para lograr buenas precisiones. Esto sugiere que para clasificar este tipo especies es más importante contar con resoluciones espaciales submétricas que con resoluciones espectrales inferiores a 7,4 nm. Las precisiones generales y parciales más altas se lograron empleando el clasificador SAM aplicado a imágenes transformadas con el tamaño de píxel y el ancho de banda original (figura 2). Rahman et al. (2003) afirma que si se emplean imágenes hiperespectrales con resoluciones espaciales menores a 1 m se optimizan los resultados para identificar propiedades de vegetación con similares funciones. Dalponte et al. (2009) clasificaron especies arbóreas usando imágenes hiperespectrales y encontraron que las precisiones bajaron con la degradación espectral. La precisión parcial del espino fue, de forma general, la que más se redujo con el aumento del tamaño de píxel. Esto se relaciona directamente con el relativamente bajo diámetro de copa del espino en el área de estudio, lo que implica una mayor propensión a que se mezcle espectralmente con otros elementos al aumentar el tamaño de píxel. Por otra parte, el litre siempre presentó precisiones muy por debajo de las demás especies, lo que puede atribuirse a la posición social de codominancia que este ocupa en el área de estudio (figura 1), quedando oculto a la visión aérea y dificultando así su detección espectral. Waser et al. (2010), también obtuvo las peores precisiones (<65%) en la clasificación de especies no dominantes, aunque cabe destacar que también fueron las que muestreó en menor cantidad. Figura 1. Situación de las especies arbóreas en el dosel de bosque esclerófilo del área de estudio. Otra causa de esta mala clasificación puede atribuirse a la complejidad o ambigüedad espectral de la especie. En el área de estudio coexisten dos variedades de litre que crecen de forma simpátrica: Lithraea caustica var. caustica y Lithraea caustica var. Pilosa. Esta última difiere de la primera por sus ramas jóvenes y hojas, en el envés, densamente pubescentes (Donoso, 2006). Por lo tanto, la estructura diferente entre las hojas de ambas variedades pudo ser la causante de una respuesta espectral variable y por tanto contribuyente de la baja precisión de clasificación lograda para esta especie. La figura Figura 2. Clasificación de especies arbóreas de los rodales definidos para el área de estudio empleando el clasificador SAM aplicado a imágenes transformadas con el tamaño de píxel y el ancho de banda original. Bibliografía Blackburn G.A. 2007. Hyperspectral remote sensing of plant pigments. Journal of Experimental Botany. 58(4): 855–867. Donoso C. 2006. Las especies arbóreas de los bosques templados de Chile y Argentina, autoecología. Valdivia, Chile. Marisa Cúneo Ediciones. Du Y., Chang I., Ren H., Chang C., Jensen J.P. 2004. New hyperspectral discrimination measure for spectral characterization. Optical Engineering. 43(8): 1777-1786. Goetz A.F.H. 2009. Three decades of hyperspectral remote sensing of the earth: A personal view. Remote Sensing of Environment. 113: s5-s16. Green A.A., Berman M., Switzer P., Craig M.D. 1988. A transformation for ordering multispectral data in terms of image quality with implications for noise removal. IEEE Transactions on Geoscience and Remote Sensing. 26: 65-74. Dalponte M., Bruzzone L., Vescovo L., Gianelle D. 2009. The role of spectral resolution and classifier complexity in the analysis of hyperspectral images of forest areas. Remote Sensing of Environment. 113: 2345-2355. Kruse F.A., Lefkoff A.B., Boardman J.W., Heidebrecht K.B., Shapiro A.T., Barloon P.J., Goetz A.F.H. 1993. The Spectral Image Processing System (SIPS) – Interactive visualization and analysis of imaging spectrometer data. Remote Sensing of Environment. 44: 145-163. McCoy R.M. 2005. Field Methods in Remote Sensing. New York, USA. The Guilford Press. Rahman A.F., Gamon J.A., Sims D.A., Schmidt M. 2003. Optimum pixel size for hyperspectral studies of ecosystem function in southern California chaparral and grassland. Remote Sensing of Environment. 84:192-207. Waser L.T., Ginzler C., Kuechler M., Baltsavias E., Hurni L. 2011. Semi-automatic classification of tree species in different forest ecosystems by spectral and geometric variables from Airbone Digital Sensor (ADS40) and RC30 data. Remote Sensing of Environment. 115: 76-85.