11.2. GENERACIÓN DE CLASES 135 Figura 11.1: Definición de

11.2. GENERACIÓN DE CLASES Figura 11.1: Definición de clases en el espacio de variables 135 136 TEMA 11. CLASIFICACIÓN Figura 11.2: Datos de reflectividad en las bandas TM3 (x) y TM4 (y) 11.2. GENERACIÓN DE CLASES 137 2. Clasificación no supervisada (análisis clúster). No se establece ninguna clase a priori, aunque es necesario determinar el número de clases que queremos establecer, y se deja que las defina un procedimiento estadístico. El conjunto de clases obtenido de un proceso de clasificación supervisada se denomina clases informacionales y las clases obtenidas de una clasificación no supervisada clases espectrales. Las primeras responden a lo que el usuario de la teledetección quiere encontrar, por lo que en muchos casos son excesivamente subjetivas; las segundas reflejan el conjunto de clases que realmente aparece en la imagen aunque no necesariamente tengan significado para el usuario. Lo más habitual es utilizar ambos análisis conjuntamente y estudiar las relaciones que se establecen entre clases texturales e informacionales para conseguir un conjunto de clases separables y exhaustivas (es decir que no dejen de considerar ninguna clase realmente existente en la imagen). 11.2.1 Clasificación no supervisada Se utilizan algorítmos de clasificación automática multivariante en los que los índividuos más próximos se van agrupando formando clases. Uno de los mas habituales en teledetección es el clustering jerárquico. Este consta de N pasos siendo N el número total de individuos a clasificar. En cada paso se identifican los dos individuos más similares (cercanos en el espacio de variables), se hace una clase con ellos y se sustituyen por el centroide de la clase resultante. De este modo cada paso analiza un individuo menos que el anterior ya que los individuos van siendo sustituidos por clases. El proceso se detiene cuando se ha alcanzado un número de clases igual al número de clases que habia sido establecido a priori o cuando se ha alcanzado un umbral de distancia entre clases por encima del cual no debe continuarse. El resultado final de un proceso de clustering suele ser un dendrograma (figura 11.3) en el que puede verse como los diversos individuos se aglutinan en clases, primero los que estan a una menor distancia (los mas parecidos), y como posteriormente las clases se unen entre si. A partir de un dendrograma podemos elegir el número de clases que queremos mantener en función de diferentes criterios. En las figuras 11.3 y 11.5 puede verse con más detalle como funciona el clustering con los datos del ejemplo. Los individuos más próximos son el 6 y el 3, por tanto se unen en la primera clase. A partir de ese momento, los individuos 6 y 3 ya no existen y se sustituyen por la clase 3-6. De este modo se van aglomerando individuos, individuos con clases (por ejemplo cuando se une la clase 1-4 con el individuo 2) o clases con clases (cuando se une la clase 8-46 con la 10-49-50). El procedimiento continua hasta la fusión de todas las clases en una sola o hasta que se cumpla un criterio establecido a priori: • En cuanto al número de clases • En cuanto a la distancia mínima entre clases El problema de estos criterios automáticos es que pueden dejar fuera consideraciones interesantes. En el ejemplo aparecen píxeles anómalos (13 y 14) que tal vez sería preferible dejar sin clasificar. Las clases A y B 138 TEMA 11. CLASIFICACIÓN Figura 11.3: Dendrograma muestran una buena separabilidad y un número elevado de píxeles en cada una de ellas, pero sólo se separarían seleccionando una distancia mínima muy baja. Cuando se utiliza en teledetección, el cluster jerárquico no utiliza todos los pixels (debido a su elevado número) sino que se toma una muestra para clasificarla. En todo caso el tamaño muestral es demasiado grande como para que la salida pueda ser un dendrograma. En su lugar la salida es un conjunto de clases (el número de clases que hayamos decidido buscar) con sus signaturas espectrales. En general es conveniente tratar de buscar con el clustering más clases de las que suponemos a priori que existen ya que pueden surgir clases de cuya existencia no se sospechaba en principio. Posteriormente las clases redundantes podrán integrarse sin dificultad. 11.2.2 Clasificación supervisada La clasificación supervisada se basa en la disponibilidad de áreas de entrenamiento. Se trata de áreas de las que se conoce a priori la clase a la que pertenecen y que servirán para generar una signatura espectral característica de cada una de las clases. Se denominan clases informacionales en contraposición a las clases espectrales que genera la clasificación no supervisada. 11.2. GENERACIÓN DE CLASES Figura 11.4: Clasificación no supervisada resultante 139 140 TEMA 11. CLASIFICACIÓN Figura 11.5: Clasificación no supervisada resultante (zoom de la figura 11.4) 11.2. GENERACIÓN DE CLASES 141 Figura 11.6: Clasificación supervisada: Mapa de áreas de entrenamiento Las áreas de entrenamiento deben ser lo más homogeneas posibles y deben establecerse en una fecha lo más cercana posible a la pasada del satélite. Cuando la imagen a tratar es antigua cabe la posibilidad de utilizar imágenes de satélite de alta resolución espacial o fotografía aérea para establecer las áreas de entrenamiento. Siguiendo con el ejemplo anterior, en la figura 11.2 los pixeles representados con tres colores diferentes corresponden a tres clases diferentes obtenidas a partir de las áreas de entrenamiento. La figura 11.6 muestra un mapa de áreas de entrenamiento. Las figuras 11.7 a 11.10 muestran algunas áreas de entrenamiento en el campo y sobre la imagen del SIG oleícola. Los colores verdes son áreas de vegetación natural y los azules áreas de regadío. 11.2.3 Con GRASS Clasificación no supervisada GRASS dispone del módulo i.cluster que aplica el algoritmo ISODATA. Los parámetros que requiere son: 142 TEMA 11. CLASIFICACIÓN Figura 11.7: Clasificación supervisada: Ejemplos de áreas de entrenamiento Figura 11.8: Clasificación supervisada: Ejemplos de áreas de entrenamiento 11.2. GENERACIÓN DE CLASES Figura 11.9: Clasificación supervisada: Ejemplos de áreas de entrenamiento Figura 11.10: Clasificación supervisada: Ejemplos de áreas de entrenamiento 143 144 TEMA 11. CLASIFICACIÓN • group, el grupo de imágenes al que se va a aplicar. • subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el módulo i.group (figura 4.1). • sigfile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del subgrupo (figura 4.1). • classes, número de clases que se obtendrán. Otros parámetros no imprescindibles son: seed, un fichero de clases que se utilizarán como valores iniciales en el proceso; sample, intervalo de muestreo en filas y columnas (por defecto se seleccionan 10000 valores); iterations, el algoritmo es iterativo y podemos establecer el número de iteraciones, por defecto son 30; convergence, en un procedimioento iterativo, se asume que las diferencias en los resultados de una iteración a la siguiente van disminuyendo, podemos establecer el grado de similitud (en tanto por ciento) por encima del cual las diferencias que se produzcan son despreciables, por defecto 98 %; separation, separación mínima exigida entre clases, por defecto 0; min_size, tamaño mínimo de una clase, por defecto 17 píxeles; reportfile, fichero de texto que contendrá un informe de los resultados. La salida básica de i.cluster es el fichero de signaturas espectrales. Clasificación supervisada El módulo i.gensig genera un fichero de signaturas espectrales a partir de un mapa raster de áreas de entrenamiento. Los parámetros son: • trainingmap, mapa raster con las áreas de entrenamiento • grupo, el grupo de imágenes al que se va a aplicar • subgroup, el subgrupo, un subconjunto de las capas raster incluidas • signaturefile, fichero de signaturas espectrales resultante. El módulo i.class genera un fichero de signaturas espectrales a partir de áreas de entrenamiento digitalizadas y analizadas de forma interactiva. Tiene la ventaja sobre i.gensigset de hacer un análisis estadístico de las clases, sin embargo es relativamente pesado y no tiene sentido si ya se ha nconseguido áreas de entrenamiento bien con visitas de campo o bien analizando fotografía aérea. El módulo i.gensigset es similar a i.gensig pero el fichero de signaturas espectrales resultante se utiliza por i.smap para hacer clasificación contextual. Utiliza los mismos parámetros que i.gensig más maxsig que establece el número de subclases que se admiten en cada clase. 11.3. ANÁLISIS ESTADÍSTICO DE LAS CLASES 11.2.4 145 Ejercicios 1. Haz una clasificación no supervisada de tu área de trabajo utilizando 15 clases. 2. Visualiza e interpreta el fichero de signaturas creado en /disco2/datos/murcia/usuario/group/grupo/subgroup/subgru 3. Haz una clasificación supervisada de tu área de trabajo generando áreas de entrenamiento con r.digit sobre la imagen compos. Genera un fichero por clase y pégalos con r.patch. Recuerda asignar a cada clase un identificador numérico diferente. 11.3 Análisis estadístico de las clases Sea cual sea la metodología utilizada para crear las clases, puesto que hemos creado las signaturas espectrales con varios pixels de una misma clase, lo que obtenemos no es una signatura en la que a cada banda se asigna un valor de reflectividad, sino una distribución de reflectividades para cada banda con una serie de estadísticos, los más relevantes para el análisis posterior son: • vector de medias (una por banda) • matriz de varianzas-covarianzas • vector de máximos • vector de mínimos En primer lugar habría que determinar si los valores de reflectividad en cada una de las bandas siguien una distribución normal multivariante (lo mismo con cualquier otra variable utilizada en la clasificación. En segundo lugar etablecer el grado de separabilidad de las clases. El índice más sencillo es la distancia normalizada entre dos categorías: dna,b = |N Da,m − N Db,m | sa + sb (11.1) donde N Da,m es la media de niveles digitales en la clase a y sa la desviación típica. Otro índice más complejo pero más flexible es el de divergencia, cuanto mayor sea su valor mayor será la separabilidad: Diva,b = T r{(Va − Vb )(Vb−1 − Va−1 )} T r{(Va−1 + Vb−1 )(Ma − Mb )(Ma − Mb )t } + 2 2 (11.2) En la anterior ecuación Ma es el vector de medias de la clase a, Va es la correspondiente matriz de varianzascovarianzas, T r la función traza de la matriz (sumatorio de la diagonal principal), t indica la matriz transpuesta y − 1 la matriz inversa. 146 TEMA 11. CLASIFICACIÓN Para su interpretación se recomienda acotar el resultado entre unos valores conocidos, por ejemplo con la siguiente ecuación: Da,b = 100(1 − e −Diva,b 8 ) (11.3) A partir de estos valores se pueden establecer a grandes rasgos dos criterios geométricos para definer las regiones del espacio de variables que definen la pertenencia a una u otra clase: • Se divide el espacio de variables en regiones mediante el trazado de fronteras entre las mismas, cada región corresponde a una clase. Este procedimiento se utiliza en los árboles de decisión (figura 9.9), el método de los paralelepípedos y las redes neuronales. • Se asigna a cada clase un punto canónico que constituye el centroide de la clase. Cuanto más cerca este un individuo de este punto canónico más probable es que pertenezca a esta clase (figura ). Se necesita por tanto una medida de distancia que equivale a una medida de semejanza o diferencia entre los diferentes individuos y entre los individuos y las clases. Dos individuos muy parecidos pertenecerán con toda seguridad a la misma clase, mientras que dos individuos distintos pertenecerán a diferentes clases. La medida más utilizada es la distancia euclidiana generalizada para espacios multidimensionales (aunque pueden utilizarse otro tipo de distancias): v uN uX dab = t (Xi,a − Xi,b )2 (11.4) i=1 • En el caso de la clasificación por máxima verosimilitud, el píxel se asigna a la clase a la que más probable es que pertenezca. Esta probabilidad se mide con la función de densidad de una normal mutivariable. Así la probabilidad es máxima en el punto canónico y disminuye al alejarse de el en funciíon de como sea la matriz de varianzas-covarianzas. 11.3.1 Con GRASS Los ficheros de signaturas contienen algunos de los estadísticos básicos en clasificación de imágenes de satélite (vector de medias y matriz de varianzas-covarianzas). Otros pueden conseguirse con el módulor.statistics que calcula estadísticos de una variable cuantitativa (ND o reflectividad) para distintos niveles de una variable cualitativa (clases). Sus parámetros son: • base, mapa de variable cualitativa • cover, mapa de variable cuantitativa • method, estadístico 11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS 147 • output, crea un mapa en el que a cada pixel hace corresponder elvalor del estadístico calculado para la clase del pixel Los estadísticos más relevantes en este caso son: min y max, average y stddev. Con el módulo r.covar puede obtenerse la matriz de varianzas-covarianzas o de correlaciones (opción -r) de un conjunto de bandas. Con el módulo r.stats puede obtenerse una matriz con todas las celdillas especificando la clase y los valores de reflectividad. Al igual que el módulo r.statistics requiere que los valores de las bandas estén en números enteros. 11.4 Adjudicación de píxeles a clases. Técnicas no estadísticas Una vez que se dispone de un conjunto de clases y de sus signaturas espectrales características, vamos a tratar de adjudicar cada uno de los pixels a una clase. Los primeros métodos que se utilizaron eran de tipo no estadístico y con ellos se obtenían resultados bastante mediocres. Su análisis es, sin embargo, útil para comenzar a indagar en los problemas del proceso de clasificación. En el caso de la clasificación no supervisada, hay que hacer la salvedad de que, en teoría no debiera ser necesaria esta segunda fase y a que en el proceso de clustering todos los individuos quedan asignados a una clase. Sin embargo el clustering en teledetección utiliza sólo una muestra de los pixeles, debido al gran número de pixeles existentes en una imagen, por tanto es necesario asignar los restantes de algún modo. 11.4.1 Arboles de clasificación Es una técnica similar a la de las guías de identificación de rocas, árboles, etc. Se van planteando una serie de cuestiones respecto al pixel a clasificar y en función de las respuestas se hacen otras preguntas. Las cuestiones planteadas hacen referencia a los valores de reflectividad en las diferentes bandas de modo que, desde un punto de vista geométrico, trazan lineas que definen fronteras entre clases. Tras pasar a través de diferentes cuestiones respecto al pixel, este queda clasificado. En definitiva se trata de definir hiperplanos en el espacio de variables que subdividan este en regiones. Todos los píxeles ubicados en la misma región se adjudican a la misma clase. Estos hiperplanos tendrán una dimensión menos que el espacio de variables. En la figura 11.11 aparece un ejemplo con el espacio de variables simplificado a dos dimensiones y por tanto los hiperplanos son lineas (una dimensión). La figura 11.12 muestra el algoritmo utilizado. Esta técnica, aunque antigua, se ha retomado en los últimos años con el auge de las técnicas de inteligencia artificial y minería de datos debido a que la potencia de los ordenadores actuales permite abordar métodos de clasificación muy exigentes computacionalmente como este. Tiende a dar ajustes muy buenos con las áreas de entrenamiento pero los algoritmos de clasificación que proporcionan son sólo adecuadas para los problemas en los que se han obtenido. 148 TEMA 11. CLASIFICACIÓN Figura 11.11: Utilización de un árbol de clasificación 11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS Figura 11.12: Utilización de un árbol de clasificación 149 150 11.4.2 TEMA 11. CLASIFICACIÓN Clasificación por mínima distancia Puesto que cada clase dispone de una reflectividad media para cada una de las bandas, podemos utilizar estas medias para situar cada una de las clases en el espacio de variables. Posteriormente, y en este espacio de variables se calcula la distancia entre un pixel cada una de las clases. Evidentemente cada pixel se asignará a la clase respecto a la cual su distancia sea mínima (figura 11.13). Este método no es demasiado bueno ya que sobreclasifica la imagen, es decir ningún pixel queda sin clasificar. Aunque algunos autores señalan esto como una ventaja, realmente es un problema ya que es preferible dejar áreas sin clasificar que clasificarlas sin garantías. Lo más adecuado sería cartografiar estos pixels con problemas de clasificación para determinar cual es la razón e intentar solventarla. Normalmente serán los píxeles situados en la frontera entre clases los que den problemas de clasificación por su propia naturaleza mixta. También puede ocurrir que estos pixeles no clasificados correspondan a clases no tenidas en cuenta a la hora de definir las clases y las áreas de entrenamiento. Por otro lado no se tiene en cuenta las desviación típicas de cada una de las bandas para cada una de las clases, así un clase con una baja desviación típica no debería absorber pixels alejados de su centroide. Por ejemplo, los pixeles de agua muestran una desviación típica reducida, es decir todos ellos muestran valores muy similares y no tendría sentido clasificar como agua un pixel que se apartará de esta norma aunque estuviera más cerca de la media del agua que de cualquier otra media. Por otra parte, los pixeles de suelo muestran una alta dispersión (especialmente en cuanto a reflectividad en el rojo debido a las diferentes composiciones mineralógicas). Esta dispersión implica que pixeles bastante alejados tendrán una probabilidad relativamente alta de pertenencia a esta clase. Tiene la ventaja de aportar un índice cuantitativo (la distancia) del grado de pertenencia de un píxel a una clase. 11.4.3 Clasificación por paralelepípedos Un modo relativamente sencillo de solventar este problema es utilizar el método de los paralelepípedos. En este método se definen una serie de rectángulos, hiperparalelepípedos en el caso de más de 3 dimensiones, que definen las fronteras de cada clase (figura 11.14). La definición de cada uno de los paralelepípedos debe hacerse teniendo en cuenta los valores máximos y mínimos de reflectividad para cada una de las bandas. Con este método pueden aparecer pixels sin asignar o pixels asignados a varias clases. Otro problema es que un paralelepípedo no es una forma adecuada de modelizar la dispersión de las áreas de entrenamiento, especialmente teniendo en cuenta la elevada correlación entre bandas que supone que los pixeles de las áreas de entrenamiento se dispongan como lineas oblicuas en el espacio de variables. 11.4.4 Con GRASS Estos métodos no están directamente implementados en GRASS pero son relativamente fáciles de programar con r.mapcalc. 11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS Figura 11.13: Clasificación por mínima distancia 151 152 TEMA 11. CLASIFICACIÓN Figura 11.14: Clasificación por paralelepípedos 11.5. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS ESTADÍSTICAS: CLASIFICACIÓN POR MÁXIMA V 11.5 Adjudicación de píxeles a clases. Técnicas estadísticas: Clasificación por máxima verosimilitud Puesto que se tiene la media y la desviación típica de cada una de las clases, se puede utilizar algún modelo de distribución de probabilidad. El clasificador de máxima verosimilitud (o máxima probabilidad) asume que los datos siguen una función de distribución normal para asignar la probabilidad de que un pixel cualquiera pertenezca a cada una de las clases. El pixel se asigna de este modo a la clase a la que es más probable que pertenezca. Este método puede usarse de forma automática, o puede establecerse algún criterio que permita asignar pixels a una clase sólo si la probabilidad correspondiente es superior a determinado umbral. Permite por otro lado definir algún tipo de criterio para medir la calidad de la asignación, por ejemplo la diferencia entre la máxima probabilidad y la siguiente. En la figura 11.15 aparecen una serie de elipses rodeando a cada uno de los centroides, se trata de lineas de isoprobabilidad, por tanto el pixel se clasificará como perteneciente a la clase en la que sus valores resulten más probables (figura 11.16). Sin embargo la hipótesis de que los datos de reflectividad siguen una distribución normal no siempre se cumple y debería verificarse. En ocasiones se adopta un enfoque bayesiano y se incluye la probabilidad a priori de que un pixel pertenezca a una clase; por ejemplo la probabilidad de que un píxel sea urbano es menor que la probabilidad de que sea de cultivo. En este caso un píxel se clasificará como de la clase A si: p(x|A)p(A) > p(x|B)p(B) (11.5) para toda clase B tal que A 6= B. La probabilidad a priori de una clase es la proporción que suponemos que cubre en el área de estudio. 11.5.1 Con GRASS El módulo i.maxlik implementa la clasificación de máxima probabilidad. Los parámetros que utiliza este módulo son: • group, el grupo de imágenes al que se va a aplicar • subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el módulo i.group (figura 4.1) • sigfile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del subgrupo (figura 4.1) • class, el mapa de salida que contiene las clases 154 TEMA 11. CLASIFICACIÓN Figura 11.15: Clasificación por máxima probabilidad (elipses de isoprobabilidad) 11.5. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS ESTADÍSTICAS: CLASIFICACIÓN POR MÁXIMA V Figura 11.16: Clasificación por máxima probabilidad 156 TEMA 11. CLASIFICACIÓN • reject, este mapa contendrá para cada celdilla el nivel de confianza con el que la celdilla pertenece a la clase a la que se ha asignado 11.6 Clasificación de imágenes. Técnicas avanzadas Recientemente el desarrollo de los ordenadores ha permitido implementar técnicas de clasificación más sofisticadas que los métodos de mínima distancia o parelepípedos y más robustas que la clasificación de máxima verosimilitud (en el sentido de que no necesitan que los datos cumplan una determinada condición como la de seguir una distribución normal). En general si los datos cumplen estas condiciones es preferible utilizar máxima verosimilitud. El problema es que en muchos casos ni siquiera es posible saber si los datos cumplen esta condición o no. 11.6.1 Clasificación de contexto Todos los métodos estudiados hasta ahora utilizan, para clasificar un pixel, sólo los valores de reflectividad recogidos en dicho pixel. Este hecho no es demasiado problemático si el tamaño de pixel es mayor que los elementos que los diferentes elementos físicos que componen el paisaje. Sin embargo si el tamaño del pixel es más pequeño que las unidades de paisaje podría utilizarse la información de los pixels de alrededor para estimar la pertenencia a una clase o confirmar la estimación. Puede resultar un método útil en combinación con el de máxima probabilidad ya que permite incluir la información de los pixels circundantes para tomar una decisión en caso de que las probabilidades para dos clases sean similares o no exista una clase con probailidades de pertenencia suficientemente altas. Contexto espacial Se trata de incorporar otras fuentes de información distintas a las bandas para la clasificación. Entre esta información estaría la altitud, pendiente, litología, etc. Las distintas formaciones vegetales tienen mayor capacidad para desarrollarse en determinados entornos definidos en parte por estas variables. Por tanto puede ser útil establecer cual es la formación vegetal con mayor probabilidad de desarrollarse en un determinado pixel (en función de topografía y litología) y combinar esta información con la de las bandas. La dificultad estriba en que estas variables raramente siguen una distribución normal (eso las que al menos son cuantitativas) por lo que requerirán utilizar técnicas muy concretas de asignación de clases (árboles de decisión o redes neuronales) que no asuman criterios de normalidad en las variables. 11.6.2 Clasificaciones multitemporales Si lo que se pretende es distinguir entre clases cuya respuesta espectral varían con el tiempo, por ejemplo entre diferentes usos del suelo, puede ser interesante integrar imágenes obtenidas en diferentes fechas. Imágenes de 11.6. CLASIFICACIÓN DE IMÁGENES. TÉCNICAS AVANZADAS 157 primavera y otoño tienen un gran valor discriminante ya que las superficies vegetales, especialmente las de cultivo muestran grandes diferencias. Si se utiliza esta técnica, resulta imprescindible realizar una buena corrección atmosférica de las imágenes. Si todas son de la misma fecha, la influencia de la atmósfera es la misma para todas por tanto podemos asumir que no influye demasiado en la clasificación. Sin embargo si las imágenes proceden de diferentes fechas, la diferente influencia de la atmósfera puede enmascarar y distorsionar los cambios en la respuesta espectral. 11.6.3 Análisis lineal de mezclas espectrales (Spectral mixture analysis) Esta técnica se desarrolló en principio para el análisis de imágenes hiperespectrales pero se ha aplicado también con imágenes multiespectrales. Parte de la base de que en realidad casi ningún píxel responde a una clase pura sino que se trata de mezclas de distintos tipos puros de cobertura (endmembers en inglés) que existen y pueden identificarse en la imagen; por otro lado se asume que el peso de cada tipo puro es proporcional al porcentaje de superficie de píxel que ocupa (esto es sólo válido en el espectro óptico). A partir de estas suposiciones puede construirse la ecuación: ρi,j,k = p X Si,j,m ρm,k + ei,j (11.6) m=1 donde ρi,j,k es la reflectividad del píxel i, j en la banda k, Si,j,m es la proporción del endmember m en el píxel i, j, p el número de endmembers y ei,j un término de error. Puesto que los valores de Si,j,m son proporciones deben estar entre cero y uno y deben sumar uno. Para cada píxel puede definirse una ecuación similar a 11.6 por cada una de las bandas; de este modo si el número de endmembers no supera el número de bandas más uno, tendremos un sistema de ecuaciones lineales fácil de resolver. El resultado será un mapa de proporción de cada endmember y un mapa de errores, siempre que el número de endmembers sea igual o inferior al de bandas. Esta limitación en el número de endmembers no debe considerarse como tal ya que en realidad muchas de las clases que se suelen utilizar en teledetección se pueden considerar mezlcas de endmembers (matorral arbolado, por ejemplo). Generalmente se han utilizado tres (vegetación vigorosa, suelo y sombra) añadiéndose en algunos casos otro de vegetación seca. Dada la sencillez de cálculo, parece que lo más importante a la hora de aplicar este procedimiento es la búsqueda de endmembers adecuados. Aunquie se han propuesto métodos automáticos quizás la mejor opción sea un adecuado conocimiento del territorio. Una de las ventajas del método es que proporciona una imagen de errores de manera que pueden probarse diferentes conjuntos de endmembers para al final quedarnos con el que menor error produzca. Por otro lado los píxeles que muestren errores altos probablemente correspondan a un endmember que no fue tenido en cuenta, con lo que puede rehacerse el proceso. 158 TEMA 11. CLASIFICACIÓN Figura 11.17: Ejemplo de red neuronal 11.6.4 Clasificación por redes neuronales Se basan en el uso de redes neuronales artificiales que, se supone, imitan a las redes neuronales reales en el desarrollo de tareas de aprendizaje. Una neurona artificial es un objeto lógico (se trata de software no de hardware) que recibe diversas entradas, hace una suma ponderada de las mismas y produce una salida a partir de la aplicación de una función umbral a la media ponderada. Si conectamos las asalidas de unas neuronas como entradas de otras obtenemos una red neuronal. Uno de los ejemplos más típicos de red neuronal es el la Back Propagation Neural Network que aparece en la figura 11.17. Consta de una capa de entrada con tantos neuronas como variables de entrada se vayan a introducir en el modelo (en el caso de la teledetección sería una por cada banda utilizada para clasificar), una capa oculta que realiza la mayor parte del cálculo y una capa de salida con tantas neuronas como posibles clases existan. En teledetección esta salida suele consistir en un valor numérico entre 0 y 1 para cada clase, cuanto mayor sea este valor más verosimil resulta que el píxel pertenezca a la clase en cuestión. Para trabajar con una red neuronal existen varias fases: 1. Entrenamiento. Se le introducen a la red la respuesta espectral de pixeles cuya clase se conoce y se compara la salida con la realidad. A partir de esta comparación se modifican los coeficientes de ponderación de todas las neuronas para que se obtenga la respuesta adecuada (se trata de un procedimiento automático) es decir un 1 en la clase correcta y ceros en las incorrectas 2. Estabilización. Al principio del entrenamiento, los factores de ponderación cambian muy deprisa, pero conforme este se desarrolla (y si las áreas de entrenamiento se han seleccionado correctamente) se estabilizan (no se modifican aunque se vuelvan a introducir los pixels de entrenamiento). En este momento finaliza la fase de entrenamiento 11.6. CLASIFICACIÓN DE IMÁGENES. TÉCNICAS AVANZADAS 159 3. Clasificación. Se introducen las respuestas espectrales de los pixels cuya clase no se conoce y se adjudican a la clase que de una respuesta más alta (que no va a ser necesariamente 1). Se trata en definitiva de un método de clasificación no paramétrico y robusto que da buenos resultados cuando las respuestas espectrales de las clases no siguen una distribución normal. La clave está en el conjunto de coeficientes de ponderación que constituyen un conjunto de parámetros que deben ajustarse a unos datos de entrada y salida. Por tanto en cierto modo es equivalente a una regresión con múltiples parámetros. El conjunto de ecuaciones que queda almacenado en la red neuronal es similar a las ecuaciones dividen el espacio de variables en varias regiones. Si se incrementa el número de capas y neuronas por capa se consigue una mejora en la clasificación de la seie de entrenamiento, pero el modelo quedará sobreparametrizado (como una regresión polinómica de orden elevado) y tendrá poca capacidad de generalización. 11.6.5 Clasificadores borrosos Sea cual sea el procedimiento de clasificación utilizado, surge el problema de que algunos pixels resultan inclasificables, bien porque sus probabilidades de pertenencia a cualquier clase sean muy bajas (mínima distaancia, máxima verosimilitud, salidas de un método de redes neuronales, etc.) o porque aparezcan dos o más clases con muy alta probabilidad que se disputen el pixel. En estos casos tiene más sentido no clasificar los pixels de forma unívoca sino establecer cual es su posibilidad de pertenencia a cada una de las clases (el concepto de posibilidad no es exactamente igual al de probabilidad). 11.6.6 COn GRASS El módulo i.smap permite hacer clasificación contextual. Sus parámetros son: • group, el grupo de imágenes al que se va a aplicar • subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el módulo i.group (figura 4.1) • signaturefile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del subgrupo (figura 4.1) • blocksize, tamaño de la submatriz que se procesa al mismo tiempo • output, resultado de la clasificación 160 TEMA 11. CLASIFICACIÓN h A B C D E F Total Error comisión A 50 4 4 0 3 10 60 16.7 B 3 62 4 0 0 3 70 11.4 C 0 3 70 0 2 1 89 21.35 D 0 0 0 64 0 3 64 0 E 2 0 8 0 71 0 77 7.8 F 5 1 3 0 1 33 50 34 Total 60 70 86 64 78 50 410 Error omisión 29.6 13.9 7.9 4.5 12.3 23.2 Tabla 11.1: Matriz de confusiones con 6 clases 11.7 Validación. Error de clasificación Existen dos posibilidades, evaluar una estimación teórica del error en función de las características del algoritmo de clasificación o analizar una serie de áreas test obtenidas del mismo modo que las áreas de entrenamiento pero que no fueron utilizadas para este. El segundo modo de proceder permite obtener una estimación más realista de los errores mientras la muestra de pixels para la estimación del error sea lo suficientemente grande y representativo. Un método simple y apropiado de evaluaciones de los errores es utilizar la matriz de confusión de clases (tabla 11.1). Los valores en filas representan las clases obtenidas tras la clasificación y en columnas aparecen las clases reales. Por tanto debe interpretarse como el número de pixels que perteneciendo a la clase columna han sido adjudicados a la clase fila. El error de comisión de la clase As es el tanto por ciento de píxeles clasificados erroneamente como de la clase A; mientras que el error de omisión de la clase A sería el tanto por ciento de píxeles de la clase A clasificados erroneamente. El estadístico kappa (κ) resume la información de la matriz de confusiones: κ= n Pn Pn i=1 Xii − P 2 n − i= i=1 Xi n +X +i 1 Xi + X + i (11.7) donde Xii hace referencia al número de píxeles correctamente clasificados en la clase i, X+i es el total de píxeles pertenecientes a la clase i y Xi+ es el total de píxeles clasificados en la clase i. El estadístico κ puede también calcularse para una sola clase o incluir coeficientes de ponderación para tener en cuenta el coste desigual de cometer unos u otros errores. Con este tipo de análisis, se obtiene, no sólo una caracterización del error cometido, sino también una medida sobre la adecuación de la clasificación considerada a la realidad y de los parámetros utilizados para caracterizarlas. Puede por tanto utilizarse para definir un nuevo conjunto de clases para realizar una clasificación. 11.7. VALIDACIÓN. ERROR DE CLASIFICACIÓN 11.7.1 161 Con GRASS La validación de una clasificación se realiza con GRASS con el módulo r.kappa utilizando los paŕametros: • classification, capa con los resultados de la clasificación • reference, capa con las áreas de validación • output, fichero que contendra el resultado, matriz de confusión y estadístico κ

11.2. GENERACIÓN DE CLASES 135 Figura 11.1: Definición de

Documentos relacionados

Productos

Apoyo

11.2. GENERACIÓN DE CLASES 135 Figura 11.1: Definición de

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib