11.2. GENERACIÓN DE CLASES 135 Figura 11.1: Definición de

Anuncio
11.2. GENERACIÓN DE CLASES
Figura 11.1: Definición de clases en el espacio de variables
135
136
TEMA 11. CLASIFICACIÓN
Figura 11.2: Datos de reflectividad en las bandas TM3 (x) y TM4 (y)
11.2. GENERACIÓN DE CLASES
137
2. Clasificación no supervisada (análisis clúster). No se establece ninguna clase a priori, aunque es necesario determinar el número de clases que queremos establecer, y se deja que las defina un procedimiento
estadístico.
El conjunto de clases obtenido de un proceso de clasificación supervisada se denomina clases informacionales
y las clases obtenidas de una clasificación no supervisada clases espectrales. Las primeras responden a lo que
el usuario de la teledetección quiere encontrar, por lo que en muchos casos son excesivamente subjetivas; las
segundas reflejan el conjunto de clases que realmente aparece en la imagen aunque no necesariamente tengan
significado para el usuario.
Lo más habitual es utilizar ambos análisis conjuntamente y estudiar las relaciones que se establecen entre
clases texturales e informacionales para conseguir un conjunto de clases separables y exhaustivas (es decir que
no dejen de considerar ninguna clase realmente existente en la imagen).
11.2.1
Clasificación no supervisada
Se utilizan algorítmos de clasificación automática multivariante en los que los índividuos más próximos se van
agrupando formando clases. Uno de los mas habituales en teledetección es el clustering jerárquico. Este consta
de N pasos siendo N el número total de individuos a clasificar.
En cada paso se identifican los dos individuos más similares (cercanos en el espacio de variables), se hace
una clase con ellos y se sustituyen por el centroide de la clase resultante. De este modo cada paso analiza un
individuo menos que el anterior ya que los individuos van siendo sustituidos por clases. El proceso se detiene
cuando se ha alcanzado un número de clases igual al número de clases que habia sido establecido a priori o
cuando se ha alcanzado un umbral de distancia entre clases por encima del cual no debe continuarse.
El resultado final de un proceso de clustering suele ser un dendrograma (figura 11.3) en el que puede verse
como los diversos individuos se aglutinan en clases, primero los que estan a una menor distancia (los mas
parecidos), y como posteriormente las clases se unen entre si. A partir de un dendrograma podemos elegir el
número de clases que queremos mantener en función de diferentes criterios.
En las figuras 11.3 y 11.5 puede verse con más detalle como funciona el clustering con los datos del ejemplo.
Los individuos más próximos son el 6 y el 3, por tanto se unen en la primera clase. A partir de ese momento, los
individuos 6 y 3 ya no existen y se sustituyen por la clase 3-6. De este modo se van aglomerando individuos,
individuos con clases (por ejemplo cuando se une la clase 1-4 con el individuo 2) o clases con clases (cuando
se une la clase 8-46 con la 10-49-50). El procedimiento continua hasta la fusión de todas las clases en una sola
o hasta que se cumpla un criterio establecido a priori:
• En cuanto al número de clases
• En cuanto a la distancia mínima entre clases
El problema de estos criterios automáticos es que pueden dejar fuera consideraciones interesantes. En el ejemplo aparecen píxeles anómalos (13 y 14) que tal vez sería preferible dejar sin clasificar. Las clases A y B
138
TEMA 11. CLASIFICACIÓN
Figura 11.3: Dendrograma
muestran una buena separabilidad y un número elevado de píxeles en cada una de ellas, pero sólo se separarían
seleccionando una distancia mínima muy baja.
Cuando se utiliza en teledetección, el cluster jerárquico no utiliza todos los pixels (debido a su elevado número)
sino que se toma una muestra para clasificarla. En todo caso el tamaño muestral es demasiado grande como
para que la salida pueda ser un dendrograma. En su lugar la salida es un conjunto de clases (el número de clases
que hayamos decidido buscar) con sus signaturas espectrales.
En general es conveniente tratar de buscar con el clustering más clases de las que suponemos a priori que
existen ya que pueden surgir clases de cuya existencia no se sospechaba en principio. Posteriormente las clases
redundantes podrán integrarse sin dificultad.
11.2.2
Clasificación supervisada
La clasificación supervisada se basa en la disponibilidad de áreas de entrenamiento. Se trata de áreas de las que
se conoce a priori la clase a la que pertenecen y que servirán para generar una signatura espectral característica
de cada una de las clases. Se denominan clases informacionales en contraposición a las clases espectrales que
genera la clasificación no supervisada.
11.2. GENERACIÓN DE CLASES
Figura 11.4: Clasificación no supervisada resultante
139
140
TEMA 11. CLASIFICACIÓN
Figura 11.5: Clasificación no supervisada resultante (zoom de la figura 11.4)
11.2. GENERACIÓN DE CLASES
141
Figura 11.6: Clasificación supervisada: Mapa de áreas de entrenamiento
Las áreas de entrenamiento deben ser lo más homogeneas posibles y deben establecerse en una fecha lo más
cercana posible a la pasada del satélite. Cuando la imagen a tratar es antigua cabe la posibilidad de utilizar
imágenes de satélite de alta resolución espacial o fotografía aérea para establecer las áreas de entrenamiento.
Siguiendo con el ejemplo anterior, en la figura 11.2 los pixeles representados con tres colores diferentes corresponden a tres clases diferentes obtenidas a partir de las áreas de entrenamiento.
La figura 11.6 muestra un mapa de áreas de entrenamiento. Las figuras 11.7 a 11.10 muestran algunas áreas
de entrenamiento en el campo y sobre la imagen del SIG oleícola. Los colores verdes son áreas de vegetación
natural y los azules áreas de regadío.
11.2.3
Con GRASS
Clasificación no supervisada
GRASS dispone del módulo i.cluster que aplica el algoritmo ISODATA. Los parámetros que requiere son:
142
TEMA 11. CLASIFICACIÓN
Figura 11.7: Clasificación supervisada: Ejemplos de áreas de entrenamiento
Figura 11.8: Clasificación supervisada: Ejemplos de áreas de entrenamiento
11.2. GENERACIÓN DE CLASES
Figura 11.9: Clasificación supervisada: Ejemplos de áreas de entrenamiento
Figura 11.10: Clasificación supervisada: Ejemplos de áreas de entrenamiento
143
144
TEMA 11. CLASIFICACIÓN
• group, el grupo de imágenes al que se va a aplicar.
• subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el
módulo i.group (figura 4.1).
• sigfile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del subgrupo
(figura 4.1).
• classes, número de clases que se obtendrán.
Otros parámetros no imprescindibles son:
seed, un fichero de clases que se utilizarán como valores iniciales en el proceso; sample, intervalo de muestreo
en filas y columnas (por defecto se seleccionan 10000 valores); iterations, el algoritmo es iterativo y podemos
establecer el número de iteraciones, por defecto son 30; convergence, en un procedimioento iterativo, se asume
que las diferencias en los resultados de una iteración a la siguiente van disminuyendo, podemos establecer el
grado de similitud (en tanto por ciento) por encima del cual las diferencias que se produzcan son despreciables,
por defecto 98 %; separation, separación mínima exigida entre clases, por defecto 0; min_size, tamaño mínimo
de una clase, por defecto 17 píxeles; reportfile, fichero de texto que contendrá un informe de los resultados.
La salida básica de i.cluster es el fichero de signaturas espectrales.
Clasificación supervisada
El módulo i.gensig genera un fichero de signaturas espectrales a partir de un mapa raster de áreas de entrenamiento. Los parámetros son:
• trainingmap, mapa raster con las áreas de entrenamiento
• grupo, el grupo de imágenes al que se va a aplicar
• subgroup, el subgrupo, un subconjunto de las capas raster incluidas
• signaturefile, fichero de signaturas espectrales resultante.
El módulo i.class genera un fichero de signaturas espectrales a partir de áreas de entrenamiento digitalizadas y
analizadas de forma interactiva. Tiene la ventaja sobre i.gensigset de hacer un análisis estadístico de las clases,
sin embargo es relativamente pesado y no tiene sentido si ya se ha nconseguido áreas de entrenamiento bien
con visitas de campo o bien analizando fotografía aérea.
El módulo i.gensigset es similar a i.gensig pero el fichero de signaturas espectrales resultante se utiliza por
i.smap para hacer clasificación contextual. Utiliza los mismos parámetros que i.gensig más maxsig que establece el número de subclases que se admiten en cada clase.
11.3. ANÁLISIS ESTADÍSTICO DE LAS CLASES
11.2.4
145
Ejercicios
1. Haz una clasificación no supervisada de tu área de trabajo utilizando 15 clases.
2. Visualiza e interpreta el fichero de signaturas creado en /disco2/datos/murcia/usuario/group/grupo/subgroup/subgru
3. Haz una clasificación supervisada de tu área de trabajo generando áreas de entrenamiento con r.digit
sobre la imagen compos. Genera un fichero por clase y pégalos con r.patch. Recuerda asignar a cada
clase un identificador numérico diferente.
11.3
Análisis estadístico de las clases
Sea cual sea la metodología utilizada para crear las clases, puesto que hemos creado las signaturas espectrales
con varios pixels de una misma clase, lo que obtenemos no es una signatura en la que a cada banda se asigna
un valor de reflectividad, sino una distribución de reflectividades para cada banda con una serie de estadísticos,
los más relevantes para el análisis posterior son:
• vector de medias (una por banda)
• matriz de varianzas-covarianzas
• vector de máximos
• vector de mínimos
En primer lugar habría que determinar si los valores de reflectividad en cada una de las bandas siguien una
distribución normal multivariante (lo mismo con cualquier otra variable utilizada en la clasificación.
En segundo lugar etablecer el grado de separabilidad de las clases. El índice más sencillo es la distancia normalizada entre dos categorías:
dna,b =
|N Da,m − N Db,m |
sa + sb
(11.1)
donde N Da,m es la media de niveles digitales en la clase a y sa la desviación típica.
Otro índice más complejo pero más flexible es el de divergencia, cuanto mayor sea su valor mayor será la
separabilidad:
Diva,b =
T r{(Va − Vb )(Vb−1 − Va−1 )} T r{(Va−1 + Vb−1 )(Ma − Mb )(Ma − Mb )t }
+
2
2
(11.2)
En la anterior ecuación Ma es el vector de medias de la clase a, Va es la correspondiente matriz de varianzascovarianzas, T r la función traza de la matriz (sumatorio de la diagonal principal), t indica la matriz transpuesta
y − 1 la matriz inversa.
146
TEMA 11. CLASIFICACIÓN
Para su interpretación se recomienda acotar el resultado entre unos valores conocidos, por ejemplo con la
siguiente ecuación:
Da,b = 100(1 − e
−Diva,b
8
)
(11.3)
A partir de estos valores se pueden establecer a grandes rasgos dos criterios geométricos para definer las regiones del espacio de variables que definen la pertenencia a una u otra clase:
• Se divide el espacio de variables en regiones mediante el trazado de fronteras entre las mismas, cada
región corresponde a una clase. Este procedimiento se utiliza en los árboles de decisión (figura 9.9), el
método de los paralelepípedos y las redes neuronales.
• Se asigna a cada clase un punto canónico que constituye el centroide de la clase. Cuanto más cerca este
un individuo de este punto canónico más probable es que pertenezca a esta clase (figura ). Se necesita
por tanto una medida de distancia que equivale a una medida de semejanza o diferencia entre los diferentes individuos y entre los individuos y las clases. Dos individuos muy parecidos pertenecerán con toda
seguridad a la misma clase, mientras que dos individuos distintos pertenecerán a diferentes clases. La
medida más utilizada es la distancia euclidiana generalizada para espacios multidimensionales (aunque
pueden utilizarse otro tipo de distancias):
v
uN
uX
dab = t (Xi,a − Xi,b )2
(11.4)
i=1
• En el caso de la clasificación por máxima verosimilitud, el píxel se asigna a la clase a la que más probable
es que pertenezca. Esta probabilidad se mide con la función de densidad de una normal mutivariable. Así
la probabilidad es máxima en el punto canónico y disminuye al alejarse de el en funciíon de como sea la
matriz de varianzas-covarianzas.
11.3.1
Con GRASS
Los ficheros de signaturas contienen algunos de los estadísticos básicos en clasificación de imágenes de satélite
(vector de medias y matriz de varianzas-covarianzas).
Otros pueden conseguirse con el módulor.statistics que calcula estadísticos de una variable cuantitativa (ND o
reflectividad) para distintos niveles de una variable cualitativa (clases). Sus parámetros son:
• base, mapa de variable cualitativa
• cover, mapa de variable cuantitativa
• method, estadístico
11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS
147
• output, crea un mapa en el que a cada pixel hace corresponder elvalor del estadístico calculado para la
clase del pixel
Los estadísticos más relevantes en este caso son: min y max, average y stddev.
Con el módulo r.covar puede obtenerse la matriz de varianzas-covarianzas o de correlaciones (opción -r) de un
conjunto de bandas.
Con el módulo r.stats puede obtenerse una matriz con todas las celdillas especificando la clase y los valores
de reflectividad. Al igual que el módulo r.statistics requiere que los valores de las bandas estén en números
enteros.
11.4
Adjudicación de píxeles a clases. Técnicas no estadísticas
Una vez que se dispone de un conjunto de clases y de sus signaturas espectrales características, vamos a tratar de
adjudicar cada uno de los pixels a una clase. Los primeros métodos que se utilizaron eran de tipo no estadístico
y con ellos se obtenían resultados bastante mediocres. Su análisis es, sin embargo, útil para comenzar a indagar
en los problemas del proceso de clasificación. En el caso de la clasificación no supervisada, hay que hacer la
salvedad de que, en teoría no debiera ser necesaria esta segunda fase y a que en el proceso de clustering todos
los individuos quedan asignados a una clase. Sin embargo el clustering en teledetección utiliza sólo una muestra
de los pixeles, debido al gran número de pixeles existentes en una imagen, por tanto es necesario asignar los
restantes de algún modo.
11.4.1
Arboles de clasificación
Es una técnica similar a la de las guías de identificación de rocas, árboles, etc. Se van planteando una serie de
cuestiones respecto al pixel a clasificar y en función de las respuestas se hacen otras preguntas. Las cuestiones
planteadas hacen referencia a los valores de reflectividad en las diferentes bandas de modo que, desde un punto
de vista geométrico, trazan lineas que definen fronteras entre clases. Tras pasar a través de diferentes cuestiones
respecto al pixel, este queda clasificado.
En definitiva se trata de definir hiperplanos en el espacio de variables que subdividan este en regiones. Todos los
píxeles ubicados en la misma región se adjudican a la misma clase. Estos hiperplanos tendrán una dimensión
menos que el espacio de variables. En la figura 11.11 aparece un ejemplo con el espacio de variables simplificado a dos dimensiones y por tanto los hiperplanos son lineas (una dimensión). La figura 11.12 muestra el
algoritmo utilizado.
Esta técnica, aunque antigua, se ha retomado en los últimos años con el auge de las técnicas de inteligencia
artificial y minería de datos debido a que la potencia de los ordenadores actuales permite abordar métodos de
clasificación muy exigentes computacionalmente como este.
Tiende a dar ajustes muy buenos con las áreas de entrenamiento pero los algoritmos de clasificación que proporcionan son sólo adecuadas para los problemas en los que se han obtenido.
148
TEMA 11. CLASIFICACIÓN
Figura 11.11: Utilización de un árbol de clasificación
11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS
Figura 11.12: Utilización de un árbol de clasificación
149
150
11.4.2
TEMA 11. CLASIFICACIÓN
Clasificación por mínima distancia
Puesto que cada clase dispone de una reflectividad media para cada una de las bandas, podemos utilizar estas
medias para situar cada una de las clases en el espacio de variables. Posteriormente, y en este espacio de
variables se calcula la distancia entre un pixel cada una de las clases. Evidentemente cada pixel se asignará a la
clase respecto a la cual su distancia sea mínima (figura 11.13).
Este método no es demasiado bueno ya que sobreclasifica la imagen, es decir ningún pixel queda sin clasificar.
Aunque algunos autores señalan esto como una ventaja, realmente es un problema ya que es preferible dejar
áreas sin clasificar que clasificarlas sin garantías. Lo más adecuado sería cartografiar estos pixels con problemas
de clasificación para determinar cual es la razón e intentar solventarla. Normalmente serán los píxeles situados
en la frontera entre clases los que den problemas de clasificación por su propia naturaleza mixta. También
puede ocurrir que estos pixeles no clasificados correspondan a clases no tenidas en cuenta a la hora de definir
las clases y las áreas de entrenamiento.
Por otro lado no se tiene en cuenta las desviación típicas de cada una de las bandas para cada una de las clases,
así un clase con una baja desviación típica no debería absorber pixels alejados de su centroide.
Por ejemplo, los pixeles de agua muestran una desviación típica reducida, es decir todos ellos muestran valores
muy similares y no tendría sentido clasificar como agua un pixel que se apartará de esta norma aunque estuviera
más cerca de la media del agua que de cualquier otra media. Por otra parte, los pixeles de suelo muestran
una alta dispersión (especialmente en cuanto a reflectividad en el rojo debido a las diferentes composiciones
mineralógicas). Esta dispersión implica que pixeles bastante alejados tendrán una probabilidad relativamente
alta de pertenencia a esta clase.
Tiene la ventaja de aportar un índice cuantitativo (la distancia) del grado de pertenencia de un píxel a una clase.
11.4.3
Clasificación por paralelepípedos
Un modo relativamente sencillo de solventar este problema es utilizar el método de los paralelepípedos. En
este método se definen una serie de rectángulos, hiperparalelepípedos en el caso de más de 3 dimensiones,
que definen las fronteras de cada clase (figura 11.14). La definición de cada uno de los paralelepípedos debe
hacerse teniendo en cuenta los valores máximos y mínimos de reflectividad para cada una de las bandas. Con
este método pueden aparecer pixels sin asignar o pixels asignados a varias clases.
Otro problema es que un paralelepípedo no es una forma adecuada de modelizar la dispersión de las áreas
de entrenamiento, especialmente teniendo en cuenta la elevada correlación entre bandas que supone que los
pixeles de las áreas de entrenamiento se dispongan como lineas oblicuas en el espacio de variables.
11.4.4
Con GRASS
Estos métodos no están directamente implementados en GRASS pero son relativamente fáciles de programar
con r.mapcalc.
11.4. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS NO ESTADÍSTICAS
Figura 11.13: Clasificación por mínima distancia
151
152
TEMA 11. CLASIFICACIÓN
Figura 11.14: Clasificación por paralelepípedos
11.5. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS ESTADÍSTICAS: CLASIFICACIÓN POR MÁXIMA V
11.5
Adjudicación de píxeles a clases. Técnicas estadísticas: Clasificación por
máxima verosimilitud
Puesto que se tiene la media y la desviación típica de cada una de las clases, se puede utilizar algún modelo
de distribución de probabilidad. El clasificador de máxima verosimilitud (o máxima probabilidad) asume que
los datos siguen una función de distribución normal para asignar la probabilidad de que un pixel cualquiera
pertenezca a cada una de las clases. El pixel se asigna de este modo a la clase a la que es más probable que
pertenezca.
Este método puede usarse de forma automática, o puede establecerse algún criterio que permita asignar pixels
a una clase sólo si la probabilidad correspondiente es superior a determinado umbral. Permite por otro lado
definir algún tipo de criterio para medir la calidad de la asignación, por ejemplo la diferencia entre la máxima
probabilidad y la siguiente.
En la figura 11.15 aparecen una serie de elipses rodeando a cada uno de los centroides, se trata de lineas de
isoprobabilidad, por tanto el pixel se clasificará como perteneciente a la clase en la que sus valores resulten más
probables (figura 11.16).
Sin embargo la hipótesis de que los datos de reflectividad siguen una distribución normal no siempre se cumple
y debería verificarse.
En ocasiones se adopta un enfoque bayesiano y se incluye la probabilidad a priori de que un pixel pertenezca a
una clase; por ejemplo la probabilidad de que un píxel sea urbano es menor que la probabilidad de que sea de
cultivo. En este caso un píxel se clasificará como de la clase A si:
p(x|A)p(A) > p(x|B)p(B)
(11.5)
para toda clase B tal que A 6= B.
La probabilidad a priori de una clase es la proporción que suponemos que cubre en el área de estudio.
11.5.1
Con GRASS
El módulo i.maxlik implementa la clasificación de máxima probabilidad. Los parámetros que utiliza este módulo son:
• group, el grupo de imágenes al que se va a aplicar
• subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el
módulo i.group (figura 4.1)
• sigfile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del subgrupo
(figura 4.1)
• class, el mapa de salida que contiene las clases
154
TEMA 11. CLASIFICACIÓN
Figura 11.15: Clasificación por máxima probabilidad (elipses de isoprobabilidad)
11.5. ADJUDICACIÓN DE PÍXELES A CLASES. TÉCNICAS ESTADÍSTICAS: CLASIFICACIÓN POR MÁXIMA V
Figura 11.16: Clasificación por máxima probabilidad
156
TEMA 11. CLASIFICACIÓN
• reject, este mapa contendrá para cada celdilla el nivel de confianza con el que la celdilla pertenece a la
clase a la que se ha asignado
11.6
Clasificación de imágenes. Técnicas avanzadas
Recientemente el desarrollo de los ordenadores ha permitido implementar técnicas de clasificación más sofisticadas que los métodos de mínima distancia o parelepípedos y más robustas que la clasificación de máxima
verosimilitud (en el sentido de que no necesitan que los datos cumplan una determinada condición como la de
seguir una distribución normal). En general si los datos cumplen estas condiciones es preferible utilizar máxima verosimilitud. El problema es que en muchos casos ni siquiera es posible saber si los datos cumplen esta
condición o no.
11.6.1
Clasificación de contexto
Todos los métodos estudiados hasta ahora utilizan, para clasificar un pixel, sólo los valores de reflectividad
recogidos en dicho pixel. Este hecho no es demasiado problemático si el tamaño de pixel es mayor que los
elementos que los diferentes elementos físicos que componen el paisaje. Sin embargo si el tamaño del pixel es
más pequeño que las unidades de paisaje podría utilizarse la información de los pixels de alrededor para estimar
la pertenencia a una clase o confirmar la estimación.
Puede resultar un método útil en combinación con el de máxima probabilidad ya que permite incluir la información de los pixels circundantes para tomar una decisión en caso de que las probabilidades para dos clases
sean similares o no exista una clase con probailidades de pertenencia suficientemente altas.
Contexto espacial
Se trata de incorporar otras fuentes de información distintas a las bandas para la clasificación. Entre esta información estaría la altitud, pendiente, litología, etc. Las distintas formaciones vegetales tienen mayor capacidad
para desarrollarse en determinados entornos definidos en parte por estas variables. Por tanto puede ser útil
establecer cual es la formación vegetal con mayor probabilidad de desarrollarse en un determinado pixel (en
función de topografía y litología) y combinar esta información con la de las bandas.
La dificultad estriba en que estas variables raramente siguen una distribución normal (eso las que al menos son
cuantitativas) por lo que requerirán utilizar técnicas muy concretas de asignación de clases (árboles de decisión
o redes neuronales) que no asuman criterios de normalidad en las variables.
11.6.2
Clasificaciones multitemporales
Si lo que se pretende es distinguir entre clases cuya respuesta espectral varían con el tiempo, por ejemplo entre
diferentes usos del suelo, puede ser interesante integrar imágenes obtenidas en diferentes fechas. Imágenes de
11.6. CLASIFICACIÓN DE IMÁGENES. TÉCNICAS AVANZADAS
157
primavera y otoño tienen un gran valor discriminante ya que las superficies vegetales, especialmente las de
cultivo muestran grandes diferencias.
Si se utiliza esta técnica, resulta imprescindible realizar una buena corrección atmosférica de las imágenes. Si
todas son de la misma fecha, la influencia de la atmósfera es la misma para todas por tanto podemos asumir
que no influye demasiado en la clasificación. Sin embargo si las imágenes proceden de diferentes fechas, la
diferente influencia de la atmósfera puede enmascarar y distorsionar los cambios en la respuesta espectral.
11.6.3
Análisis lineal de mezclas espectrales (Spectral mixture analysis)
Esta técnica se desarrolló en principio para el análisis de imágenes hiperespectrales pero se ha aplicado también
con imágenes multiespectrales.
Parte de la base de que en realidad casi ningún píxel responde a una clase pura sino que se trata de mezclas de
distintos tipos puros de cobertura (endmembers en inglés) que existen y pueden identificarse en la imagen; por
otro lado se asume que el peso de cada tipo puro es proporcional al porcentaje de superficie de píxel que ocupa
(esto es sólo válido en el espectro óptico). A partir de estas suposiciones puede construirse la ecuación:
ρi,j,k =
p
X
Si,j,m ρm,k + ei,j
(11.6)
m=1
donde ρi,j,k es la reflectividad del píxel i, j en la banda k, Si,j,m es la proporción del endmember m en el píxel
i, j, p el número de endmembers y ei,j un término de error.
Puesto que los valores de Si,j,m son proporciones deben estar entre cero y uno y deben sumar uno.
Para cada píxel puede definirse una ecuación similar a 11.6 por cada una de las bandas; de este modo si el
número de endmembers no supera el número de bandas más uno, tendremos un sistema de ecuaciones lineales
fácil de resolver. El resultado será un mapa de proporción de cada endmember y un mapa de errores, siempre
que el número de endmembers sea igual o inferior al de bandas.
Esta limitación en el número de endmembers no debe considerarse como tal ya que en realidad muchas de las
clases que se suelen utilizar en teledetección se pueden considerar mezlcas de endmembers (matorral arbolado,
por ejemplo). Generalmente se han utilizado tres (vegetación vigorosa, suelo y sombra) añadiéndose en algunos
casos otro de vegetación seca.
Dada la sencillez de cálculo, parece que lo más importante a la hora de aplicar este procedimiento es la búsqueda
de endmembers adecuados. Aunquie se han propuesto métodos automáticos quizás la mejor opción sea un
adecuado conocimiento del territorio.
Una de las ventajas del método es que proporciona una imagen de errores de manera que pueden probarse
diferentes conjuntos de endmembers para al final quedarnos con el que menor error produzca. Por otro lado los
píxeles que muestren errores altos probablemente correspondan a un endmember que no fue tenido en cuenta,
con lo que puede rehacerse el proceso.
158
TEMA 11. CLASIFICACIÓN
Figura 11.17: Ejemplo de red neuronal
11.6.4
Clasificación por redes neuronales
Se basan en el uso de redes neuronales artificiales que, se supone, imitan a las redes neuronales reales en
el desarrollo de tareas de aprendizaje. Una neurona artificial es un objeto lógico (se trata de software no de
hardware) que recibe diversas entradas, hace una suma ponderada de las mismas y produce una salida a partir
de la aplicación de una función umbral a la media ponderada.
Si conectamos las asalidas de unas neuronas como entradas de otras obtenemos una red neuronal. Uno de los
ejemplos más típicos de red neuronal es el la Back Propagation Neural Network que aparece en la figura 11.17.
Consta de una capa de entrada con tantos neuronas como variables de entrada se vayan a introducir en el modelo
(en el caso de la teledetección sería una por cada banda utilizada para clasificar), una capa oculta que realiza la
mayor parte del cálculo y una capa de salida con tantas neuronas como posibles clases existan. En teledetección
esta salida suele consistir en un valor numérico entre 0 y 1 para cada clase, cuanto mayor sea este valor más
verosimil resulta que el píxel pertenezca a la clase en cuestión.
Para trabajar con una red neuronal existen varias fases:
1. Entrenamiento. Se le introducen a la red la respuesta espectral de pixeles cuya clase se conoce y se
compara la salida con la realidad. A partir de esta comparación se modifican los coeficientes de ponderación de todas las neuronas para que se obtenga la respuesta adecuada (se trata de un procedimiento
automático) es decir un 1 en la clase correcta y ceros en las incorrectas
2. Estabilización. Al principio del entrenamiento, los factores de ponderación cambian muy deprisa, pero
conforme este se desarrolla (y si las áreas de entrenamiento se han seleccionado correctamente) se estabilizan (no se modifican aunque se vuelvan a introducir los pixels de entrenamiento). En este momento
finaliza la fase de entrenamiento
11.6. CLASIFICACIÓN DE IMÁGENES. TÉCNICAS AVANZADAS
159
3. Clasificación. Se introducen las respuestas espectrales de los pixels cuya clase no se conoce y se adjudican
a la clase que de una respuesta más alta (que no va a ser necesariamente 1).
Se trata en definitiva de un método de clasificación no paramétrico y robusto que da buenos resultados cuando
las respuestas espectrales de las clases no siguen una distribución normal. La clave está en el conjunto de
coeficientes de ponderación que constituyen un conjunto de parámetros que deben ajustarse a unos datos de
entrada y salida. Por tanto en cierto modo es equivalente a una regresión con múltiples parámetros.
El conjunto de ecuaciones que queda almacenado en la red neuronal es similar a las ecuaciones dividen el
espacio de variables en varias regiones.
Si se incrementa el número de capas y neuronas por capa se consigue una mejora en la clasificación de la seie de
entrenamiento, pero el modelo quedará sobreparametrizado (como una regresión polinómica de orden elevado)
y tendrá poca capacidad de generalización.
11.6.5
Clasificadores borrosos
Sea cual sea el procedimiento de clasificación utilizado, surge el problema de que algunos pixels resultan
inclasificables, bien porque sus probabilidades de pertenencia a cualquier clase sean muy bajas (mínima distaancia, máxima verosimilitud, salidas de un método de redes neuronales, etc.) o porque aparezcan dos o más
clases con muy alta probabilidad que se disputen el pixel. En estos casos tiene más sentido no clasificar los pixels de forma unívoca sino establecer cual es su posibilidad de pertenencia a cada una de las clases (el concepto
de posibilidad no es exactamente igual al de probabilidad).
11.6.6
COn GRASS
El módulo i.smap permite hacer clasificación contextual. Sus parámetros son:
• group, el grupo de imágenes al que se va a aplicar
• subgroup, el subgrupo, un subconjunto de las capas raster incluidas en el grupo y que se define con el
módulo i.group (figura 4.1)
• signaturefile, fichero de signaturas con la definición de las clases, se almacenará en el directorio sig del
subgrupo (figura 4.1)
• blocksize, tamaño de la submatriz que se procesa al mismo tiempo
• output, resultado de la clasificación
160
TEMA 11. CLASIFICACIÓN
h
A
B
C
D
E
F
Total
Error comisión
A
50
4
4
0
3
10
60
16.7
B
3
62
4
0
0
3
70
11.4
C
0
3
70
0
2
1
89
21.35
D
0
0
0
64
0
3
64
0
E
2
0
8
0
71
0
77
7.8
F
5
1
3
0
1
33
50
34
Total
60
70
86
64
78
50
410
Error omisión
29.6
13.9
7.9
4.5
12.3
23.2
Tabla 11.1: Matriz de confusiones con 6 clases
11.7
Validación. Error de clasificación
Existen dos posibilidades, evaluar una estimación teórica del error en función de las características del algoritmo
de clasificación o analizar una serie de áreas test obtenidas del mismo modo que las áreas de entrenamiento
pero que no fueron utilizadas para este. El segundo modo de proceder permite obtener una estimación más
realista de los errores mientras la muestra de pixels para la estimación del error sea lo suficientemente grande y
representativo.
Un método simple y apropiado de evaluaciones de los errores es utilizar la matriz de confusión de clases (tabla
11.1). Los valores en filas representan las clases obtenidas tras la clasificación y en columnas aparecen las
clases reales. Por tanto debe interpretarse como el número de pixels que perteneciendo a la clase columna han
sido adjudicados a la clase fila.
El error de comisión de la clase As es el tanto por ciento de píxeles clasificados erroneamente como de la clase
A; mientras que el error de omisión de la clase A sería el tanto por ciento de píxeles de la clase A clasificados
erroneamente.
El estadístico kappa (κ) resume la información de la matriz de confusiones:
κ=
n
Pn
Pn
i=1 Xii −
P
2
n − i=
i=1 Xi
n
+X +i
1 Xi + X + i
(11.7)
donde Xii hace referencia al número de píxeles correctamente clasificados en la clase i, X+i es el total de
píxeles pertenecientes a la clase i y Xi+ es el total de píxeles clasificados en la clase i.
El estadístico κ puede también calcularse para una sola clase o incluir coeficientes de ponderación para tener
en cuenta el coste desigual de cometer unos u otros errores.
Con este tipo de análisis, se obtiene, no sólo una caracterización del error cometido, sino también una medida
sobre la adecuación de la clasificación considerada a la realidad y de los parámetros utilizados para caracterizarlas. Puede por tanto utilizarse para definir un nuevo conjunto de clases para realizar una clasificación.
11.7. VALIDACIÓN. ERROR DE CLASIFICACIÓN
11.7.1
161
Con GRASS
La validación de una clasificación se realiza con GRASS con el módulo r.kappa utilizando los paŕametros:
• classification, capa con los resultados de la clasificación
• reference, capa con las áreas de validación
• output, fichero que contendra el resultado, matriz de confusión y estadístico κ
Descargar