Problemas en la definición de clases En caso de problemas

Anuncio
Problemas en la definición de
clases
Fundamentos de la clasificación
AGUA
CADUCIFOLIAS
PERENNIFOLIAS
AGR. REGADIO
AGR. SECANO
1
2
3
4
5
6
URBANO
AGUA
CADUCIFOLIAS
PERENNIFOLIAS
AGR. REGADIO
AGR. SECANO
URBANO
1
2
3
4
5
6
AGUA
CADUCIFOLIAS
PERENNIFOLIAS
AGR. REGADIO
AGR. SECANO
URBANO
1
2
3
4
5
6
CLASES
INFORMACIONALES
CLASES
ESPECTRALES
(Chuvieco, 1996, p. 371)
En caso de problemas:
l
l
l
l
Modificar la leyenda.
Acudir a criterios no-espectrales:
texturas, contexto.
Emplear información auxiliar: MDT,
límites de propiedad.
Información multitemporal.
Fases de la clasificación
l
• Supervisado.
• No supervisado.
l
l
Entrenamiento
l
Asignación (categorizar los píxeles de la
imagen).
Verificación de resultados.
Entrenamiento supervisado
Agua
Áreas
forestales
Tipo de la leyenda:
• Jerárquicas (Anderson, USGS; Corine).
• No jerárquicas.
l
Entrenamiento (definir numéricamente
las categorías):
Propiedades de la leyenda:
Cultivos de riego
Pastizal
• Clases mutuamente excluyentes.
• Clases Exhaustivas.
• A tener en cuenta: evitar mezcla de criterios,
Apoyo de radiometría
de campo.
ajustarse a los datos disponibles.
Señalar áreas características
en la imagen
Características de las áreas de
entrenamiento
l
Bien identificados:
Cómo obtener estadísticas de
entrenamiento
l
• Localización.
• Actualización.
l
• Se asume máxima variabilidad.
• Pueden seleccionarse p íxeles aislados o
• Métodos más estándar.
l
A partir de manchas:
segmentación de imágenes
Digitizar polígonos.
•
•
•
l
Tamaño: autocorrelación.
Efecto de frontera.
Forma:
Definición de manchas:
• Criterio espectral (homogeneidad del
color).
• Criterio espacial (contigüidad,
• Figuras geom étricas regulares.
• Trazado irregular.
l
Segmentando la imagen en manchas:
• Se asume coherencia espacial.
• Más ajustado a cartografía convencional.
Que cubran todas las clases.
A partir de píxeles
l
píxeles en el interior de polígonos.
Suficientemente homogéneos:
• Ruido de la escena.
• Auto-correlación espacial.
l
Muestreando píxeles:
compacidad).
Semillado.
•
•
Distancia espectral.
Distancia espacial.
Segmentación
Criterios para segmentar
l
l
l
Original
Segmentada
Límites
Polígonos
Selección de las capas de entrada
(pueden usarse temáticas).
Ponderación de las capas.
Criterios de segmentación:
• Escala: homogeneidad relativa.
• Peso de las propiedades espectrales (color) o
espaciales (forma): bordes o compacidad.
Multisegmentación
Entrenamiento no supervisado
Entrenamiento no supervisado
Entrenamiento no supervisado
3ª fase
2ª fase
1ª fase
1ª fase
Nº GRUPOS (k)
Distancia mín. (Dmin)
Dispersión máx (Smax)
Tamaño mín. (Fmin)
Selección centros
de clase (C)
NO
Asignación de los
pixels al C + próximo
Grupos< k
NO
Recalcular C con
los pixels asignados
Pixels que han
cambiado de
grupo < LIM
SI
NO
Fin del agrupamiento
Fundir
próximos
SI
Eliminar X
l
l
l
S I
Dxy < Dmin
Fundir
X e Y
NO
SI
Sx > Smax
Análisis de estadísticas
l
S I
Fx < Fmin
NO
Criterio
Isodata
Dividir
en dos C
Medidas de centralidad y dispersión.
Gráficos de valores promedio.
Gráficos de separabilidad.
Medidas estadísticas de separabilidad
• Distancia normalizada
• Divergencia
Valores
estadísticos
Urbano
Pastizal Matorral
PinarSuelo
Banda
ETM
1
2
3
4
5
7
X
10,45
11,12
15,65
19,33
21,88
17,04
DT X
2,20 5,57
1,93 7,51
2,66 9,44
2,54 28,80
2,59 26,50
2,70 15,54
DT X
0,77 5,31
0,68 6,29
1,12 9,52
3,85 16,80
1,26 22,62
1,54 15,18
Encinar
DT X DT X
1,95 1,35 0,61 13,16
2,32 2,49 0,79 15,74
3,94 3,32 0,83 22,76
4,02 17,53 3,86 25,71
6,67 9,39 1,75 34,34
4,73 5,42 0,94 26,76
Cultivo
DT X
5,03 4,49
5,66 5,39
7,64 5,84
4,77 30,84
8,71 14,87
8,15 7,75
Agua
DT
0,83
1,08
1,28
3,28
2,11
1,15
X
2,82
3,21
3,29
1,60
2,95
2,65
Gráficos de signaturas
40
DT
0,41
0,29
0,38
0,19
0,18
0,27
35
urbano
30
Coeficiente de variación
Banda ETM Urbano Pastizal Matorral Pinar- Suelo
Encinar
1
2
3
4
5
7
21,02
17,37
16,98
13,14
11,81
15,85
13,83
9,07
11,86
13,37
4,77
9,88
36,70
36,86
41,37
23,92
29,50
31,13
45,05
31,83
25,06
22,01
18,64
17,26
38,24
35,97
33,58
18,55
25,37
30,47
Cultivo
pastizal
25
matorral
20
pinar-enc
15
suelo
cultivo
10
Agua
agua
5
18,44
19,98
21,88
10,63
14,17
14,84
14,67
8,99
11,51
11,54
6,11
10,14
0
1
2
3
4
5
7
20
Separabilidad
Banda 1
gráfica
15
10
Separabilidad gráfica
5
0
urbano
pastizal
matorral
pinar-enc
suelo
cultivo
agua
urbano
pastizal
matorral
pinar-enc
suelo
cultivo
agua
40
35
30
25
Banda 4
20
15
10
5
0
50
45
40
35
Banda 3
30
Banda 5
25
20
Banda 4
15
10
5
0
urbano
pastizal
matorral
Elipses de dispersión
pinar-enc
suelo
cultivo
agua
Separabilidad estadística
l
Distancia normalizada:
dn A,B =
Cultivo
Suelo
l
Pastizal
sA + sB
Divergencia:
DivAB = 0,5 Tr [(VA - VB) (VB-1 - VA -1)] + 0,5 Tr
[(VA -1 + VB-1) (MA - MB)(MA - MB)T]
Banda 4
Matorral
Pinar-Encinar
ND A - ND B
l
Urbano
Divergencia transformada:
DTAB = c (1 - exp (-DivAB /8))
Agua
Banda 3
Ejemplo de separabilidad
(combutibles forestales)
Interés de las medidas
de separabilidad
Transformed Divergence
Determinar las clases problemáticas.
l
• Revisar el proceso de entrenamiento.
• Revisar las bandas seleccionadas.
Seleccionar las bandas con mayor poder
discriminante.
l
Bandas más idóneas para la
clasificación de combustibles
Criterios de asignación
DTM
Mínima distancia.
Paralelepípedos.
Máxima probabilidad.
Árboles de decisión.
Redes neuronales.
l
1200
l
1000
ND
800
l
600
400
l
200
0
Rock
Dg Water M1a M 1 b
M1c M2a
M2b
M3a
M3b
M4a M 4 b
M5a M5b
M5c
M6a
M6b
M7a M 7 b
l
FUEL TYPES
Asignación: mínima distancia
Asignación: mínima distancia
P
2
Z
IRC
a
Z2
d 12
b
Y
-
Y2
?
Y1
P1
c
R
X
d x, A =
2
-
∑
X1
i =1, m
X
( NDx ,i − ND A,i ) 2
-Z
1
Asignación: mínima distancia
l
l
IRC
Ventajas:
•
•
Asignación: paralelepípedos
a
Rápido de ejecutar.
Todos los píxeles son clasificados
b
?
Inconvenientes:
•
•
No considera varianza.
Proclive a errores de comisión.
?
c
R
Asignación: paralelepípedos
l
l
Criterio de inclusión:
si Inf < ND < Sup
Problemas:
•
•
l
Asignación: máxima probabilidad
IRC
a
b
?
Píxeles en dos grupos
Píxeles sin clasificar.
Ventajas:
•
•
c
Rápido
Considera dispersión.
R
Fundamento del método (2/2)
Fundamento del método
0.18
0.36
0.16
0.32
0.14
0.28
0.12
0.24
0.1
NORMAL
0.08
AUMENTADO
0.06
0.12
0.04
0.08
0.02
0.04
0
NORMAL
0.20
0.16
AUMENTADO
0
2 3
4 5
6 7 8
9 10 11 12 13 14 15 16
2 3
4 5
6 7 8
9 10 11 12 13 14 15 16
Funciones de probabilidad
l
l
Original:
p ( x / A) =
1
2πσ A 2
{
exp − ( NDx − ND A )2 / 2σ A
Asignación: máxima probabilidad
2
}
l
Extensión a varias bandas:
p (x/A) = (2π)- m/2 |V A |- 0,5 exp {-0,5 (M x- MA )T V A-1 (M x - M A)}
ln p (x/A) = (-0,5 ln V A) - (0,5 (M x - MA)T VA- 1 (M x - MA ))
Linealizada:
ln p (x/A) = - 0,5 ln (2π) - 0,5 ln σ A² - { (NDx - NDA )²/ 2σ A²}
Probabilidad
ND 1
ND 2
l
Probabilidad a priori:
l
Umbrales a posteriori.
p (x/A) p (A) ≥ p (x/B) p (B)
ND
Uso de los umbrales
Clasif. Máxima probabilidad
Se rechazan los pixeles con
menos del 95 % probabilidad
Nuevos métodos de asignación
l
l
l
l
Clasificación jerárquica: reglas de
decisión.
Clasificadores de contexto.
Redes neuronales.
Clasificadores borrosos.
Clasificación en árbol
Establecer reglas de decisión:
Si ρx > 0.3
y ρy < 0.2
y altitud < 900 m
l
l
l
- Complejo de entrenar.
+ Independiente del tipo de variables.
Ejemplo: discriminación de
nubes
IRC
< 10%
l
> 10%
l
Verde
Agua
> 30%
• Análisis p íxel a p íxel.
• Basados en umbrales en el visible e IRT
• Dificultad para la selección de umbrales en
< 30%
MDE
SWIR
< 40%
R
O
J
O
> 40%
> 30%
Urbano
(muy probable)
Cereal
(probable)
< 30%
Urbano
(probable)
Cereal
(muy probable)
< 800m
Caducifolios
Método de Saunders y Kriebel
Albedo C1 y C2
Tb C4 y C5
Test de coherencia espacial
(sólo en zonas marinas)
Imágenes diurnas
NO
SD > SD(umbral)
NO
Alb > Alb (umbral)
Empleo del contexto en la
clasificación
l
SI
Tb5 < Tmin
zonas terrestres. Variabilidad espacial y
temporal
> 800m
Regadío
SI
l
SI
• Variables de entrada.
• Unidad muestral.
SI
NO
Test para detectar
nubes finas
Tb4-Tb5 > Tdif. umbral
NO
SI
• Asignación.
• Post-asignación.
Con nube
Sin nube
Importancia de las propiedades
espaciales
Color
Asociación
Patrón
Variables texturales en la
clasificación
l
l
Textura
l
Forma
Quickbird Salamanca
Aprovecha las propiedades espaciales
de las cubiertas para poder
discriminarlas.
Fases:
• Entrenamiento:
NO
NIR/VIS < 1,6 (tierra) ó 0,75 (mar)
Análisis visual
Algoritmos automáticos de detección de
nubes:
l
Ventana móvil de desviaciones típicas o
de rangos.
Densidad de bordes: filtros no lineales
(Sobel)
Medidas a partir de la matriz de
concurrencia.
Unidad textural.
Medidas sobre ventanas móviles
Textura de primer orden
Ventana de
cálculo
(a) Banda 2 original; (b) Desviación t ípica local
El contexto en la asignación
l
Considerar probabilidad de los vecinos:
p' (x/ ci ) =
l
Clasificación con áreas
homogéneas
l
p(x/ c i )q(x/ c i )
∑i=1,m p(x/ ci )q(x/ ci )
Clasificación espectro-espacial:
l
• áreas homogéneas.
• orientada a objetos.
Ejemplo de
segmentación/clasificación
Clasificadores orientados a
objetos
l
l
l
Composición 453
Contexto 3x3 píxeles
Contexto 21x21 píxeles
Clasificador ECHO (Extraction and
Classification of Homogeneous Objects)
Ketting y Landgreve, 1976.
Segmentación y clasificación contextual
(Gong y Howarth, 1992).
l
Aprovechan las propiedades espectrales y
espaciales de la imagen.
Son adaptables a la escala-resolución de la
imagen. Se pueden mantener relaciones a
diferentes niveles de detalle.
Reduce el ruido en la clasificación, al trabajar
con objetos +homogéneos.
Se reduce el número de elementos a procesar.
Procedimientos con e-cognition
l
l
l
l
l
Segmentar la imagen (diversos
procedimientos).
Definir jerarquía de las clases.
Definir variables para la clasificación.
Entrenamiento (espacio de
discriminación).
Clasificación.
Variables a considerar
l
Definición de las clases
l
Pueden definirse varios niveles de
agregación temática y dependencia.
Entrenamiento
Pueden ser espectrales del objeto, de
los objetos cercanos, de los super o subobjetos, formas, texturas...
Variaciones según el espacio de
discriminación
Espectral
Espectral +
Des.Típica-Distancia a vecinos
Variaciones según la jerarquía
de objetos
Información de los objetos
El contexto tras la clasificación
l
l
l
l
Criterios de agrupación
l
Filtro de mayoría:
l
Filtro modal:
Eliminación de píxeles aislados, no
relacionados con el contexto.
Criterio de agrupación.
Tamaño de la ventana.
Problemas con las categorías lineales.
Efecto de los filtros modales
• Al menos > ent (n*m/2)+1
• La clase dominante (puede establecerse un
umbral mínimo).
l
El ruido eliminado puede corresponder a
clases bien asignadas (rasgos lineales!!)
Filtro modal
Efecto del tamaño de la matriz
original
Imagen de Rapel, Chile, 1998
3x3
7x7
Efecto del tamaño de la matriz
Análisis contextual tras la
clasificación
l
Convertir el espacio temático a espacio
morfológico:
•
•
l
l
original
3x3
7x7
l
Categorías en función de la cobertura.
Categorías en función de la posición.
Calcular medidas morfológicas.
Emplear propiedades morfológicas en la
clasificación.
Análisis temporal de las variables
morfológicas.
Imagen de Rapel, Chile, 1998
Ejemplo de conversión a
manchas
Redes neuronales artificiales
l
l
Imagen clasificada
Imagen binaria
Quemado 2350 has Quemado
2350 has
Cultivado 8590 has No quemado 17230 has
Suelo
6320 has
Vegetación 890 has
Imagen de grupos
Incendio 1
Incendio 2
Incendio 3
Incendio 4
Intentan asimilar el funcionamiento del
cerebro humano.
Permiten funciones no lineales, con
interconexiones múltiples entre
variables. Problemas muy complejos.
450 has
620 has
550 has
380 has
Esquema de una RNA
Parámetros de control
l
Topología:
•
•
Funciones de activación:
l
Capa de
entrada
Capa oculta
Capa de
salida
f(z) = 1/(1+e-z)
z = α + β 1x1+ β 2 x2+...+ β kxk
l
l
Número de capas.
Número de neuronas: capa de salida = categorías;
Capa de entrada = bandas; Capa oculta (entre
ambas).
Algoritmo de aprendizaje: retropropagación,
quick-pro.
Número de iteraciones.
Niveles de error permitido.
Activación de las neuronas
Aprendizaje de la RNA
1. Función de calibración:
o = f (w x + E)
W, vector de pesos; X vector de entradas.
La función más habitual es la sigmoide.
l 2. Medida del error:
l
E = ∑ k =1, n ∑m=1,c ( t k,m - ok,m )2
Estructura de la RNA
Ejemplo de clasificación por RNA
x
1
o
w
1
1
w
5
w
2
x
w
2
3
o
2
w
4
Entrada
Entrenamiento de la RNA
w1
0,050
0,375
0,606
0,642
2,224
2,810
2,901
w2
0,100
0,051
0,007
-0,072
-2,215
-2,834
-2,976
w3
0,300
0,418
0,570
0,641
2,213
2,810
2,902
w4
0,150
0,121
0,117
0,196
2,216
2,835
2,977
w5
1,000
0,951
1,240
1,464
3,302
4,529
4,785
w
6
Salida
Pesos calculados para la RNA
x1
Iteración
0
1
5
10
50
150
250
Oculta
o
3
w6
0,500
0,520
0,909
1,034
3,259
4,527
4,784
Error
0,461
0,424
0,391
0,378
0,040
0,007
0,005
o
2,901
1
4,785
2,976
o
3
2,902
x
2
o
2
2,977
Entrada
Oculta
4,784
Salida
o1 = 2,901 x1 - 2,976 x2
o3 = 4,785 o1 + 4,784 o2
o2 = 2,902 x1 + 2,977 x2
Solución de la RNA
Clasif. supervisada-redes
Ventajas
Inconvenientes
l
l
l
No tienes restricciones en cuanto al tipo
de variables.
Son bastante tolerantes de datos
anómalos.
Pueden generalizar problemas (autoaprendizaje).
Clasificación borrosa
l
l
l
l
No resulta fácil diseñar la estructura de
la red.
El tiempo de entrenamiento es bastante
largo.
Pueden obtenerse mínimos locales.
Se puede sobre-entrenar la red: se
pierde capacidad de generalización.
Regla de clasificación
l
Media borrosa:
l
Varianza borrosa:
CLASE 1
CLASE 2
*
VA =
70 % CLASE 1
15 % CLASE 2
CLASE n
∑i=1, n U A (M i ) M i
∑i=1, n U A (M i )
CLASE 1
CLASE 3
CLASE 4
M*A =
10 % CLASE 3
.
5 %. CLASE 4
T
∑ i=1,n U A (M i)(M i - M*A )(M i - M *A )
∑ i=1,n U A (Mi )
U: grado de pertenencia a la clase A
M: vector de ND de la muestra
Va: Matriz de var-cov.
l
Probabilidad borrosa:
P* (x/a) = (2π)- m/2 V* a  -0,5 exp {-0,5 (m x- M* A)T V*A-1 (m x - M *A )}
(Chuvieco, 1996, p. 419)
Clasificación
borrosa
Clasificación
rígida/blanda
Clasificación con información
auxiliar
Clasif.
Borrosa
l
l
l
DTM
Slope
Para estratificar la imagen: sectores
bioclimáticos.
Como variables adicionales (MDT,
pendientes, precipitación...).
Para reclasificar: límites parcelarios,
mapas de suelos...
Sampled sites (1998 and 1999)
LEGEND
Calibrated
bands
Samples sites
Cabañeros N.P.
boundaries
Spectral
unmixing
and NDVI
Raw bands:
TM1-TM7
Texture
Fuel Mapping
Classification map
Clasificación de modelos de
combustibles
LANDSAT-TM
Mapa de combustibles (Gredos)
BANDAS 1-6
TEXTURA
NO SUPERV
SUPERV
MTD
PENDIENTE
ILUMINACIÓN
NO SUPERV
ALTITUD
MIXTA
Productos de la clasificación
l
Archivo:
• Corrección geométrica.
• Tabla de color.
• Información auxiliar (leyenda, escala gráfica,
vectores, rótulos, etc.).
l
Inventario:
• Superficie ocupada por cada categoría.
• Pureza de áreas de entrenamiento.
Corrección geométrica
Generación tabla de color
Suavización de resultados
Ejemplo de tabla de color
Clase
Red Green Blue Color
Agua
0
0 255 Azul
Regadío
0
255
0 Verde claro
Suelo
255
255
0 Amarillo
Herbáceas
255
180
0 Naranja
Matorral
150
75
0 Marrón
Coníferas
0
125
0 Verde oscuro
Urbano
255
0
0 Rojo
Residencial 255
0 255 Magenta
Vectorización
Leyenda temática
Inclusión de elementos
cartográficos
Resultado final
Carretera
Río
Velilla
N-III
Jaram
a
Rivas-Urb
Arganda
Inventario de la clasificación
Descargar