Problemas en la definición de clases Fundamentos de la clasificación AGUA CADUCIFOLIAS PERENNIFOLIAS AGR. REGADIO AGR. SECANO 1 2 3 4 5 6 URBANO AGUA CADUCIFOLIAS PERENNIFOLIAS AGR. REGADIO AGR. SECANO URBANO 1 2 3 4 5 6 AGUA CADUCIFOLIAS PERENNIFOLIAS AGR. REGADIO AGR. SECANO URBANO 1 2 3 4 5 6 CLASES INFORMACIONALES CLASES ESPECTRALES (Chuvieco, 1996, p. 371) En caso de problemas: l l l l Modificar la leyenda. Acudir a criterios no-espectrales: texturas, contexto. Emplear información auxiliar: MDT, límites de propiedad. Información multitemporal. Fases de la clasificación l • Supervisado. • No supervisado. l l Entrenamiento l Asignación (categorizar los píxeles de la imagen). Verificación de resultados. Entrenamiento supervisado Agua Áreas forestales Tipo de la leyenda: • Jerárquicas (Anderson, USGS; Corine). • No jerárquicas. l Entrenamiento (definir numéricamente las categorías): Propiedades de la leyenda: Cultivos de riego Pastizal • Clases mutuamente excluyentes. • Clases Exhaustivas. • A tener en cuenta: evitar mezcla de criterios, Apoyo de radiometría de campo. ajustarse a los datos disponibles. Señalar áreas características en la imagen Características de las áreas de entrenamiento l Bien identificados: Cómo obtener estadísticas de entrenamiento l • Localización. • Actualización. l • Se asume máxima variabilidad. • Pueden seleccionarse p íxeles aislados o • Métodos más estándar. l A partir de manchas: segmentación de imágenes Digitizar polígonos. • • • l Tamaño: autocorrelación. Efecto de frontera. Forma: Definición de manchas: • Criterio espectral (homogeneidad del color). • Criterio espacial (contigüidad, • Figuras geom étricas regulares. • Trazado irregular. l Segmentando la imagen en manchas: • Se asume coherencia espacial. • Más ajustado a cartografía convencional. Que cubran todas las clases. A partir de píxeles l píxeles en el interior de polígonos. Suficientemente homogéneos: • Ruido de la escena. • Auto-correlación espacial. l Muestreando píxeles: compacidad). Semillado. • • Distancia espectral. Distancia espacial. Segmentación Criterios para segmentar l l l Original Segmentada Límites Polígonos Selección de las capas de entrada (pueden usarse temáticas). Ponderación de las capas. Criterios de segmentación: • Escala: homogeneidad relativa. • Peso de las propiedades espectrales (color) o espaciales (forma): bordes o compacidad. Multisegmentación Entrenamiento no supervisado Entrenamiento no supervisado Entrenamiento no supervisado 3ª fase 2ª fase 1ª fase 1ª fase Nº GRUPOS (k) Distancia mín. (Dmin) Dispersión máx (Smax) Tamaño mín. (Fmin) Selección centros de clase (C) NO Asignación de los pixels al C + próximo Grupos< k NO Recalcular C con los pixels asignados Pixels que han cambiado de grupo < LIM SI NO Fin del agrupamiento Fundir próximos SI Eliminar X l l l S I Dxy < Dmin Fundir X e Y NO SI Sx > Smax Análisis de estadísticas l S I Fx < Fmin NO Criterio Isodata Dividir en dos C Medidas de centralidad y dispersión. Gráficos de valores promedio. Gráficos de separabilidad. Medidas estadísticas de separabilidad • Distancia normalizada • Divergencia Valores estadísticos Urbano Pastizal Matorral PinarSuelo Banda ETM 1 2 3 4 5 7 X 10,45 11,12 15,65 19,33 21,88 17,04 DT X 2,20 5,57 1,93 7,51 2,66 9,44 2,54 28,80 2,59 26,50 2,70 15,54 DT X 0,77 5,31 0,68 6,29 1,12 9,52 3,85 16,80 1,26 22,62 1,54 15,18 Encinar DT X DT X 1,95 1,35 0,61 13,16 2,32 2,49 0,79 15,74 3,94 3,32 0,83 22,76 4,02 17,53 3,86 25,71 6,67 9,39 1,75 34,34 4,73 5,42 0,94 26,76 Cultivo DT X 5,03 4,49 5,66 5,39 7,64 5,84 4,77 30,84 8,71 14,87 8,15 7,75 Agua DT 0,83 1,08 1,28 3,28 2,11 1,15 X 2,82 3,21 3,29 1,60 2,95 2,65 Gráficos de signaturas 40 DT 0,41 0,29 0,38 0,19 0,18 0,27 35 urbano 30 Coeficiente de variación Banda ETM Urbano Pastizal Matorral Pinar- Suelo Encinar 1 2 3 4 5 7 21,02 17,37 16,98 13,14 11,81 15,85 13,83 9,07 11,86 13,37 4,77 9,88 36,70 36,86 41,37 23,92 29,50 31,13 45,05 31,83 25,06 22,01 18,64 17,26 38,24 35,97 33,58 18,55 25,37 30,47 Cultivo pastizal 25 matorral 20 pinar-enc 15 suelo cultivo 10 Agua agua 5 18,44 19,98 21,88 10,63 14,17 14,84 14,67 8,99 11,51 11,54 6,11 10,14 0 1 2 3 4 5 7 20 Separabilidad Banda 1 gráfica 15 10 Separabilidad gráfica 5 0 urbano pastizal matorral pinar-enc suelo cultivo agua urbano pastizal matorral pinar-enc suelo cultivo agua 40 35 30 25 Banda 4 20 15 10 5 0 50 45 40 35 Banda 3 30 Banda 5 25 20 Banda 4 15 10 5 0 urbano pastizal matorral Elipses de dispersión pinar-enc suelo cultivo agua Separabilidad estadística l Distancia normalizada: dn A,B = Cultivo Suelo l Pastizal sA + sB Divergencia: DivAB = 0,5 Tr [(VA - VB) (VB-1 - VA -1)] + 0,5 Tr [(VA -1 + VB-1) (MA - MB)(MA - MB)T] Banda 4 Matorral Pinar-Encinar ND A - ND B l Urbano Divergencia transformada: DTAB = c (1 - exp (-DivAB /8)) Agua Banda 3 Ejemplo de separabilidad (combutibles forestales) Interés de las medidas de separabilidad Transformed Divergence Determinar las clases problemáticas. l • Revisar el proceso de entrenamiento. • Revisar las bandas seleccionadas. Seleccionar las bandas con mayor poder discriminante. l Bandas más idóneas para la clasificación de combustibles Criterios de asignación DTM Mínima distancia. Paralelepípedos. Máxima probabilidad. Árboles de decisión. Redes neuronales. l 1200 l 1000 ND 800 l 600 400 l 200 0 Rock Dg Water M1a M 1 b M1c M2a M2b M3a M3b M4a M 4 b M5a M5b M5c M6a M6b M7a M 7 b l FUEL TYPES Asignación: mínima distancia Asignación: mínima distancia P 2 Z IRC a Z2 d 12 b Y - Y2 ? Y1 P1 c R X d x, A = 2 - ∑ X1 i =1, m X ( NDx ,i − ND A,i ) 2 -Z 1 Asignación: mínima distancia l l IRC Ventajas: • • Asignación: paralelepípedos a Rápido de ejecutar. Todos los píxeles son clasificados b ? Inconvenientes: • • No considera varianza. Proclive a errores de comisión. ? c R Asignación: paralelepípedos l l Criterio de inclusión: si Inf < ND < Sup Problemas: • • l Asignación: máxima probabilidad IRC a b ? Píxeles en dos grupos Píxeles sin clasificar. Ventajas: • • c Rápido Considera dispersión. R Fundamento del método (2/2) Fundamento del método 0.18 0.36 0.16 0.32 0.14 0.28 0.12 0.24 0.1 NORMAL 0.08 AUMENTADO 0.06 0.12 0.04 0.08 0.02 0.04 0 NORMAL 0.20 0.16 AUMENTADO 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Funciones de probabilidad l l Original: p ( x / A) = 1 2πσ A 2 { exp − ( NDx − ND A )2 / 2σ A Asignación: máxima probabilidad 2 } l Extensión a varias bandas: p (x/A) = (2π)- m/2 |V A |- 0,5 exp {-0,5 (M x- MA )T V A-1 (M x - M A)} ln p (x/A) = (-0,5 ln V A) - (0,5 (M x - MA)T VA- 1 (M x - MA )) Linealizada: ln p (x/A) = - 0,5 ln (2π) - 0,5 ln σ A² - { (NDx - NDA )²/ 2σ A²} Probabilidad ND 1 ND 2 l Probabilidad a priori: l Umbrales a posteriori. p (x/A) p (A) ≥ p (x/B) p (B) ND Uso de los umbrales Clasif. Máxima probabilidad Se rechazan los pixeles con menos del 95 % probabilidad Nuevos métodos de asignación l l l l Clasificación jerárquica: reglas de decisión. Clasificadores de contexto. Redes neuronales. Clasificadores borrosos. Clasificación en árbol Establecer reglas de decisión: Si ρx > 0.3 y ρy < 0.2 y altitud < 900 m l l l - Complejo de entrenar. + Independiente del tipo de variables. Ejemplo: discriminación de nubes IRC < 10% l > 10% l Verde Agua > 30% • Análisis p íxel a p íxel. • Basados en umbrales en el visible e IRT • Dificultad para la selección de umbrales en < 30% MDE SWIR < 40% R O J O > 40% > 30% Urbano (muy probable) Cereal (probable) < 30% Urbano (probable) Cereal (muy probable) < 800m Caducifolios Método de Saunders y Kriebel Albedo C1 y C2 Tb C4 y C5 Test de coherencia espacial (sólo en zonas marinas) Imágenes diurnas NO SD > SD(umbral) NO Alb > Alb (umbral) Empleo del contexto en la clasificación l SI Tb5 < Tmin zonas terrestres. Variabilidad espacial y temporal > 800m Regadío SI l SI • Variables de entrada. • Unidad muestral. SI NO Test para detectar nubes finas Tb4-Tb5 > Tdif. umbral NO SI • Asignación. • Post-asignación. Con nube Sin nube Importancia de las propiedades espaciales Color Asociación Patrón Variables texturales en la clasificación l l Textura l Forma Quickbird Salamanca Aprovecha las propiedades espaciales de las cubiertas para poder discriminarlas. Fases: • Entrenamiento: NO NIR/VIS < 1,6 (tierra) ó 0,75 (mar) Análisis visual Algoritmos automáticos de detección de nubes: l Ventana móvil de desviaciones típicas o de rangos. Densidad de bordes: filtros no lineales (Sobel) Medidas a partir de la matriz de concurrencia. Unidad textural. Medidas sobre ventanas móviles Textura de primer orden Ventana de cálculo (a) Banda 2 original; (b) Desviación t ípica local El contexto en la asignación l Considerar probabilidad de los vecinos: p' (x/ ci ) = l Clasificación con áreas homogéneas l p(x/ c i )q(x/ c i ) ∑i=1,m p(x/ ci )q(x/ ci ) Clasificación espectro-espacial: l • áreas homogéneas. • orientada a objetos. Ejemplo de segmentación/clasificación Clasificadores orientados a objetos l l l Composición 453 Contexto 3x3 píxeles Contexto 21x21 píxeles Clasificador ECHO (Extraction and Classification of Homogeneous Objects) Ketting y Landgreve, 1976. Segmentación y clasificación contextual (Gong y Howarth, 1992). l Aprovechan las propiedades espectrales y espaciales de la imagen. Son adaptables a la escala-resolución de la imagen. Se pueden mantener relaciones a diferentes niveles de detalle. Reduce el ruido en la clasificación, al trabajar con objetos +homogéneos. Se reduce el número de elementos a procesar. Procedimientos con e-cognition l l l l l Segmentar la imagen (diversos procedimientos). Definir jerarquía de las clases. Definir variables para la clasificación. Entrenamiento (espacio de discriminación). Clasificación. Variables a considerar l Definición de las clases l Pueden definirse varios niveles de agregación temática y dependencia. Entrenamiento Pueden ser espectrales del objeto, de los objetos cercanos, de los super o subobjetos, formas, texturas... Variaciones según el espacio de discriminación Espectral Espectral + Des.Típica-Distancia a vecinos Variaciones según la jerarquía de objetos Información de los objetos El contexto tras la clasificación l l l l Criterios de agrupación l Filtro de mayoría: l Filtro modal: Eliminación de píxeles aislados, no relacionados con el contexto. Criterio de agrupación. Tamaño de la ventana. Problemas con las categorías lineales. Efecto de los filtros modales • Al menos > ent (n*m/2)+1 • La clase dominante (puede establecerse un umbral mínimo). l El ruido eliminado puede corresponder a clases bien asignadas (rasgos lineales!!) Filtro modal Efecto del tamaño de la matriz original Imagen de Rapel, Chile, 1998 3x3 7x7 Efecto del tamaño de la matriz Análisis contextual tras la clasificación l Convertir el espacio temático a espacio morfológico: • • l l original 3x3 7x7 l Categorías en función de la cobertura. Categorías en función de la posición. Calcular medidas morfológicas. Emplear propiedades morfológicas en la clasificación. Análisis temporal de las variables morfológicas. Imagen de Rapel, Chile, 1998 Ejemplo de conversión a manchas Redes neuronales artificiales l l Imagen clasificada Imagen binaria Quemado 2350 has Quemado 2350 has Cultivado 8590 has No quemado 17230 has Suelo 6320 has Vegetación 890 has Imagen de grupos Incendio 1 Incendio 2 Incendio 3 Incendio 4 Intentan asimilar el funcionamiento del cerebro humano. Permiten funciones no lineales, con interconexiones múltiples entre variables. Problemas muy complejos. 450 has 620 has 550 has 380 has Esquema de una RNA Parámetros de control l Topología: • • Funciones de activación: l Capa de entrada Capa oculta Capa de salida f(z) = 1/(1+e-z) z = α + β 1x1+ β 2 x2+...+ β kxk l l Número de capas. Número de neuronas: capa de salida = categorías; Capa de entrada = bandas; Capa oculta (entre ambas). Algoritmo de aprendizaje: retropropagación, quick-pro. Número de iteraciones. Niveles de error permitido. Activación de las neuronas Aprendizaje de la RNA 1. Función de calibración: o = f (w x + E) W, vector de pesos; X vector de entradas. La función más habitual es la sigmoide. l 2. Medida del error: l E = ∑ k =1, n ∑m=1,c ( t k,m - ok,m )2 Estructura de la RNA Ejemplo de clasificación por RNA x 1 o w 1 1 w 5 w 2 x w 2 3 o 2 w 4 Entrada Entrenamiento de la RNA w1 0,050 0,375 0,606 0,642 2,224 2,810 2,901 w2 0,100 0,051 0,007 -0,072 -2,215 -2,834 -2,976 w3 0,300 0,418 0,570 0,641 2,213 2,810 2,902 w4 0,150 0,121 0,117 0,196 2,216 2,835 2,977 w5 1,000 0,951 1,240 1,464 3,302 4,529 4,785 w 6 Salida Pesos calculados para la RNA x1 Iteración 0 1 5 10 50 150 250 Oculta o 3 w6 0,500 0,520 0,909 1,034 3,259 4,527 4,784 Error 0,461 0,424 0,391 0,378 0,040 0,007 0,005 o 2,901 1 4,785 2,976 o 3 2,902 x 2 o 2 2,977 Entrada Oculta 4,784 Salida o1 = 2,901 x1 - 2,976 x2 o3 = 4,785 o1 + 4,784 o2 o2 = 2,902 x1 + 2,977 x2 Solución de la RNA Clasif. supervisada-redes Ventajas Inconvenientes l l l No tienes restricciones en cuanto al tipo de variables. Son bastante tolerantes de datos anómalos. Pueden generalizar problemas (autoaprendizaje). Clasificación borrosa l l l l No resulta fácil diseñar la estructura de la red. El tiempo de entrenamiento es bastante largo. Pueden obtenerse mínimos locales. Se puede sobre-entrenar la red: se pierde capacidad de generalización. Regla de clasificación l Media borrosa: l Varianza borrosa: CLASE 1 CLASE 2 * VA = 70 % CLASE 1 15 % CLASE 2 CLASE n ∑i=1, n U A (M i ) M i ∑i=1, n U A (M i ) CLASE 1 CLASE 3 CLASE 4 M*A = 10 % CLASE 3 . 5 %. CLASE 4 T ∑ i=1,n U A (M i)(M i - M*A )(M i - M *A ) ∑ i=1,n U A (Mi ) U: grado de pertenencia a la clase A M: vector de ND de la muestra Va: Matriz de var-cov. l Probabilidad borrosa: P* (x/a) = (2π)- m/2 V* a -0,5 exp {-0,5 (m x- M* A)T V*A-1 (m x - M *A )} (Chuvieco, 1996, p. 419) Clasificación borrosa Clasificación rígida/blanda Clasificación con información auxiliar Clasif. Borrosa l l l DTM Slope Para estratificar la imagen: sectores bioclimáticos. Como variables adicionales (MDT, pendientes, precipitación...). Para reclasificar: límites parcelarios, mapas de suelos... Sampled sites (1998 and 1999) LEGEND Calibrated bands Samples sites Cabañeros N.P. boundaries Spectral unmixing and NDVI Raw bands: TM1-TM7 Texture Fuel Mapping Classification map Clasificación de modelos de combustibles LANDSAT-TM Mapa de combustibles (Gredos) BANDAS 1-6 TEXTURA NO SUPERV SUPERV MTD PENDIENTE ILUMINACIÓN NO SUPERV ALTITUD MIXTA Productos de la clasificación l Archivo: • Corrección geométrica. • Tabla de color. • Información auxiliar (leyenda, escala gráfica, vectores, rótulos, etc.). l Inventario: • Superficie ocupada por cada categoría. • Pureza de áreas de entrenamiento. Corrección geométrica Generación tabla de color Suavización de resultados Ejemplo de tabla de color Clase Red Green Blue Color Agua 0 0 255 Azul Regadío 0 255 0 Verde claro Suelo 255 255 0 Amarillo Herbáceas 255 180 0 Naranja Matorral 150 75 0 Marrón Coníferas 0 125 0 Verde oscuro Urbano 255 0 0 Rojo Residencial 255 0 255 Magenta Vectorización Leyenda temática Inclusión de elementos cartográficos Resultado final Carretera Río Velilla N-III Jaram a Rivas-Urb Arganda Inventario de la clasificación