04-188 (Clasificador genérico de objetos).indd

Anuncio
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
GENERIC OBJECT CLASIFICATOR ON ETM+ IMAGES
Luis A. Palacios-Sánchez, Fernando Paz-Pellat, José L. Oropeza-Mota, Benjamín Figueroa-Sandoval,
Mario Martínez-Menes, Carlos A. Ortiz-Solorio y Adolfo Exebio-García
Hidrociencias. Campus Montecillo. Colegio de Postgraduados. 56230. Km. 36.5 Carretera MéxicoTexcoco, Montecillo, Estado de México. ([email protected])
RESUMEN
ABSTRACT
Se describe un algoritmo de clasificación genérico, basado en la
forma de la firma espectral de 12 objetos presentes en las imágenes del sensor ETM+ del satélite Landsat 7. El algoritmo es un
árbol de decisión que no requiere de campos de entrenamiento
para llevar a cabo la clasificación, ya que se fundamenta en
operaciones Booleanas que identifican los objetos por formas características de su firma espectral. El algoritmo ha sido utilizado
con éxito en la estimación de superficies sembradas de cultivos
e identificación de cuerpos de agua en imágenes que cubren casi
la totalidad de la República Mexicana.
An algorithm of generic classification is described based on the
form of the spectral signature of 12 objects present on the images
of the ETM+ sensor of Landsat 7 satellite. The algorithm is a
decision tree that does not require training areas to carry out
the classification, since it is backed up by Boolean operations,
which identify the objects by the characteristic forms of their
spectral signature. The algorithm has been successfully used
in estimations of crop areas and in the identification of water
bodies in images that cover almost all México.
Key words: Decision trees, classification, remote sensors.
Palabras clave: Árboles de decisión, clasificación, sensores remotos.
INTRODUCTION
E
INTRODUCCIÓN
very object on the earth’s surface constantly
emits or reflects electromagnetic energy. The
incident fraction of energy which reflects a
surface coverage is called reflectance, which changes
according to wavelength. The distribution of reflectance
as function of the wavelength is called spectral
signature; and varies also by the influence of other
factors, such as atmospheric turbidity, temperature,
biological activity, and geometry sun-sensor. The
spectral signature is different for the distinct types of
coverage and characterizes the objects on the earth’s
surface; that is why it is possible to achieve –up to a
certain degree– their discrimination.
The analysis of images originating from remote
sensors has the objective to obtain information about
objects, areas, or phenomena on the earth’s surface.
These sensors measure the intensity of the energy
emitted or reflected by the objects over samples of the
electromagnetic spectrum called spectral bands. There
is a process of interpretation between this measurement
and the characteristics whose identification is desired;
this process depends on the objectives established.
One of the most important applications of this
type of analysis is generating thematic maps, where
each pixel of the image is labeled by a classification
rule, which specifies the type of object that exists in
the reference zone of the labeled pixel (Cortijo et al.,
1997). In natural resource studies, the identification of
T
odo objeto sobre la superficie terrestre emite o
refleja constantemente energía electromagnética. La fracción de energía incidente que refleja
una cobertura terrestre se denomina reflectividad, la
cual cambia en función de la longitud de onda. La
distribución de la reflectividad como función de la
longitud de onda se denomina firma espectral; ésta varía también por la influencia de otros factores como la
turbidez atmosférica, temperatura, actividad biológica
y geometría sol-sensor. La firma espectral es diferente
para los distintos tipos de cobertura y caracteriza a
los objetos sobre la superficie terrestre, por lo que es
posible lograr, hasta cierto punto, su discriminación.
El análisis de imágenes provenientes de sensores
remotos tiene como fin obtener información acerca
de objetos, áreas o fenómenos sobre la superficie
terrestre. Estos sensores miden la intensidad de la
energía emitida o reflejada por los objetos sobre
muestras del espectro electromagnético denominadas
bandas espectrales. Hay un proceso de interpretación
entre esta medición y las características que se desea
identificar, este proceso depende de los objetivos establecidos.
Recibido: Diciembre, 2004. Aprobado: Mayo, 2006.
Publicado como ARTÍCULO en Agrociencia 40: 613-626. 2006.
613
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
Una de las aplicaciones más importantes de
este tipo de análisis es la generación de mapas temáticos, en los cuales cada píxel de la imagen se
etiqueta mediante una regla de clasificación, que
especifica el tipo de objeto que hay en la zona que
referencia el píxel etiquetado (Cortijo et al., 1997).
Para estudios de recursos naturales, es importante
la identificación de objetos que van desde cuerpos
de agua, vegetación, suelo, nubes, hasta la identificación específica de tipos de suelos, y comunidades
de vegetación.
Existen dos tipos de clasificación temática: con
supervisión y sin supervisión (Schowengerdt, 1997;
Jensen, 2000). En la clasificación con supervisión,
los píxeles se asignan a clases predefinidas que tienen
puntos de control terrestre denominados campos de
entrenamiento. En estos campos de entrenamiento el
algoritmo estima las características espectrales de la
clase que representa, para posteriormente tratar de
asignar una clase a todos los píxeles de una imagen
(Chulhee y Landgrebe, 1991; McCauley, 1995). En
la clasificación sin supervisión no se utilizan campos
de entrenamiento como base para la clasificación,
y las clases se construyen a partir de las agrupaciones espectrales existentes en la imagen. La idea
básica que subyace en estos métodos, llamados de
agrupamiento, es que los píxeles de una clase deben
tener valores espectrales similares, mientras que los
de diferentes clases deberían tener valores diferentes y distinguibles. Adicionalmente existen métodos
híbridos, que combinan características de ambos,
como los de supervisión parcial, basados en ponderaciones de agrupaciones espectrales no supervisadas
(Byeungwoo y Landgrebe, 1999).
El objetivo de este trabajo fue presentar un sistema de clasificación con supervisión que identifica
objetos predefinidos, con base en la forma de la respuesta espectral, de manera rápida, eficiente y sin
necesidad de muestras de campo. La investigación se
orientó a encontrar la forma más rápida y barata para
identificar objetos genéricos, como vegetación, suelo
desnudo, nubes y agua. Barata implicaba no realizar
muestreos de campo, y rápida el procesamiento masivo de imágenes del satélite Landsat 7. El resultado
es un algoritmo simple de identificación de patrones,
pero que cumple con los objetivos.
MATERIALES
Y
MÉTODOS
Las firmas espectrales detectadas por los sensores remotos se
pueden representar como vectores con n componentes, en los que
cada componente es el valor resultante de aplicar una función de
respuesta del sensor a una banda de muestreo del espectro electromagnético.
614
VOLUMEN 40, NÚMERO 5
objects, such as water bodies, vegetation, soil, clouds,
and even the specific identification of soil or crops types
vegetation communities, is important.
There are two types of thematic classification: with
and without supervision (Schowengerdt, 1997; Jensen,
2000). In the classification with supervision, the pixels
are assigned to predefined classes having ground control
points called training areas. In these training areas,
the algorithm estimates the spectral characteristics of
the class it represents, in order to subsequently try to
assign a class to all the pixels of an image (Chulhee
and Landgrebe, 1991; McCauley, 1995). In the
classification without supervision, training areas are
not used a base for classification, and the classes are
constructed starting with the spectral clusters existing
in the image. The basic idea underlying these methods,
called clustering, is that the pixels of one class must
have similar spectral values, whereas those of different
classes should have different and distinguishable
values. Additionally, there are hybrid methods, which
combine the characteristics of both, like those of
partial supervision, based on weighting of unsupervised
spectral clustering (Byeungwoo and Landgrebe, 1999).
The objective of this study was to present a
classification system with supervision, which identifies
predefined objects based on the form of spectral
response, fast, efficiently, and without the need of
field samples. The research was oriented to find the
fastest and cheapest way of identifying generic objects,
such as vegetation, bare soil, clouds, and water. Cheap
implied not conducting field samplings, and fast, mass
processing of Landsat 7 satellite images. The result is
a simple algorithm of pattern identification, but which
achieves the objectives.
MATERIALS
AND
METHODS
The spectral signatures detected by remote sensors can be
represented as vectors with n components, where each component
is the value resulting from applying a sensor response function to a
sampling band of the electromagnetic spectrum.
T
X =⎡
⎣ X1, X 2 ,..., X n ⎤
⎦ ,
∀ X i ∈ Θ i ; i = 1, 2,..., n
(1)
Xi is a random variable belonging to the set of values Θi that takes
band i; these variables represent the pixels which form an image in
matrix array. The typical values of this set for the Thematic Mapper
(TM, n=7) and Enhanced Thematic Mapper (ETM+, n=8) sensors
of the Landsat satellites are Θi={0, 1,…, 255}. The observation
space might be defined by (Cortijo et al., 1997):
n
Φ = ⊗ Θi
i=1
where ⊗ denotes the Cartesian product.
(2)
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
T
X =⎡
⎣ X1, X 2 ,..., X n ⎤
⎦ ,
∀ X i ∈ Θ i ; i = 1, 2,..., n
(1)
Xi es una variable aleatoria perteneciente al conjunto de valores Θi
que toma la banda i; estas variables representan los píxeles que en
arreglo matricial forman una imagen. Los valores típicos de este
conjunto para los sensores Thematic Mapper (TM, n=7) y Enhanced Thematic Mapper (ETM+, n=8) de los satélites Landsat, son
Θi={0, 1,…, 255}. El espacio de observaciones estaría definido por
(Cortijo et al., 1997):
n
Φ = ⊗ Θi
i=1
(2)
donde ⊗ denota el producto cartesiano.
Un sistema de clasificación tiene dos componentes críticas: un
conjunto de clases (cultivo, suelo, agua, etc.) y un conjunto de
reglas –o sistema– para la asignación de las clases. Sin un conjunto
claro y definido de reglas, la asignación de las clases a los diferentes
tipos de características es arbitraria e inconsistente. Adicionalmente, un sistema de clasificación debe satisfacer las restricciones de
ser mutuamente excluyente y exhaustivo. Un sistema es mutuamente
excluyente si cualquier punto en la imagen cae en una y sólo una
categoría definida (clase), y totalmente exhaustivo si a todos los
píxeles de una imagen les corresponde una clase.
Para un sistema de clasificación se debe definir un conjunto
de clases Ω = {ω1, ω2 ,...ωk −1, ωk }, donde en la clase ωk estarían
todas las observaciones que no se puedan asignar con certeza a las
otras k−1 clases.
Un clasificador o sistema de clasificación se define por la función:
f : Φ → Ω, ∀X , f ( X ) ∈ Ω
(3)
Para que cumpla con las restricciones planteadas, el clasificador
debe ser una partición de Φ en k subconjuntos disjuntos R1, R2,…,
R k:
A classification system has two critical components: a set of
classes (crop, soil, water, etc.) and a set of rules –or system– for
the assignment to the classes. Without a clear and well-defined set of
rules, the assignment of classes to the different types of characteristics
is arbitrary and inconsistent. In addition, a classification system must
satisfy the restrictions of being mutually exclusive and exhaustive. A
system is mutually exclusive if any point in the image falls in one,
and only one, definite category (class), and fully exhaustive, if all
the image pixels receive a class label.
For
a
classification
system,
a
set
of
classes
Ω = {ω1, ω2 ,...ωk −1, ωk }, must be defined, where in class ωk
would be all the observations that cannot be assigned with certainty
to the other k−1 classes.
A classifier, or classification system, is defined by the
function:
f : Φ → Ω, ∀X , f ( X ) ∈ Ω
(3)
In order to fulfill the proposed restrictions the classifier must be
a partition of Φ in k disjointed subsets R1, R2,…, Rk:
Φ = {∪i Ri Ri ∩ R j = ∅∀ i ≠ j} ∀X ∈ Ri ⇒ f ( X ) = ωi (4)
where i varies from 1 to k.
The Ri’s are called decision regions, and the borders between
them, decision borders.
The decision trees are within the classification methods with
supervision, whose final objective is to build a decision rule,
based on learning sets (Breiman et al., 1984). In this paper,
the assignment of a class to a X vector was carried out through
the evaluation of a series of logical conditions on the values or
transformations of the Xi variables. These conditions form a binary
tree, which recursively generates partitions of the observation
space, until reaching the terminal nodes, called leaves, composed
by the Ri regions.
Definition of classes
Φ = {∪i Ri Ri ∩ R j = ∅∀ i ≠ j} ∀X ∈ Ri ⇒ f ( X ) = ωi (4)
donde i varía desde 1 hasta k.
A las Ri se les denomina regiones de decisión, y a las fronteras
entre éstas fronteras de decisión.
Los árboles de decisión se encuentran dentro de los métodos de
clasificación con supervisión, cuyo objetivo final es construir una
regla de decisión con base en un conjunto de aprendizaje (Breiman
et al., 1984). En este trabajo la asignación de una clase a un vector
X se realizó mediante la evaluación de una serie de condiciones
lógicas sobre los valores o transformaciones de las variables Xi. Estas condiciones forman un árbol binario que recursivamente genera
particiones del espacio de observaciones, hasta alcanzar los nodos
terminales denominados hojas, los cuales están compuestas por las
regiones Ri.
To formulate the classification system, the classes making up
the Ω set are defined. In the present study, 13 thematic classes were
established, shown in Table 1.
The selection of classes was made considering that they might
be utilized as masks in algorithms of atmospheric correction, for
algorithms of crop classification, and identification of forests, water
bodies, etc. The advantage is that in the end one counts on a set
of 13 classes, starting from a group whose dimension is defined in
Equation (2); which makes it possible to carry out histograms and
pixel counts for the assess of areas.
Definition of observation space
The observation space is made up of the first 7 bands of the
ETM+ sensor, located on Landsat 7 satellite, but the algorithm
PALACIOS-SÁNCHEZ et al.
615
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
Definición de clases
Para formular el sistema de clasificación se definen las clases
que componen el conjunto Ω. En el presente trabajo se establecieron
13 clases temáticas, que se muestran en el Cuadro 1.
La selección de las clases se realizó considerando que podrían
ser utilizadas como máscaras en algoritmos de corrección atmosférica, para algoritmos de clasificación de cultivos e identificación de
bosques, cuerpos de agua, etc. La ventaja es que al final se cuenta
con un conjunto de 13 clases a partir de un conjunto cuya dimensión está definida en la ecuación (2); con las que es posible realizar
histogramas y conteos de píxeles para la estimación de superficies.
Definición del espacio de observaciones
El espacio de observaciones está formado por las primeras 7
bandas del sensor ETM+ ubicado en el satélite Landsat 7, pero el
algoritmo es aplicable a las 7 bandas equivalentes del sensor TM
del satélite Landsat 5 o a cualquier sensor que cuente con bandas
de muestreo similares. Las características de las bandas del sensor
ETM+ se muestran en el Cuadro 2.
Es un requisito que los valores digitales se conviertan a reflectividad medidas en superficie, por lo que es necesario que se les
aplique un proceso de corrección atmosférica. Algunas clases pueden
is applicable to the 7 bands equivalent to the TM sensor of
Landsat 5 satellite or to any sensor that counts on bands of similar
samplings. The characteristics of the ETM+ sensor are shown in
Table 2.
It is a requirement that the digital values shall be converted into
reflectance measured on the surface, for which it is necessary that a
process of atmospheric correction should be applied. Some classes
may be identified without the atmospheric correction process, like
dark vegetation and that of high coverage, water, snow, mist,
and clouds, that is why it can be utilized recursively firstly, for
calculating input variables in the atmospheric correction algorithm,
and subsequently, running it again with the bands transformed by
the corrector.
Band 6 must be transformed to the same spatial resolution
as the others and convert to thermal brightness (BT), in Kelvin
degrees, by means of the procedure explained in the Landsat 7
Users’ Scientific Manual (NASA, 2001).
Definition of the classification function
The classification function is based on the identification of
characteristics of the form of the spectral signature for each class,
therefore it is essential to analyze their form and variations for each
class.
Cuadro 1. Clases temáticas propuestas.
Table 1. Proposed thematic classes.
Número
Nombre
0
1
2
3
4
5
6
7
8
9
10
11
12
Observaciones
Sin datos
Sombra
Nube
Bruma
Hielo
Agua
Asfalto/arena oscura
Suelo
Veg. Cob. Baja
Veg. Cob. Media
Veg. Cob. Alta
Veg. Oscura
Otros
Las partes de la imagen que no tienen información
Sombras proyectadas por nubes y relieve topográfico
Nubes densas
Calina, neblina y nubes poco densas
Glaciares y nieve
Cuerpos de agua
Poblaciones y suelos arenosos oscuros
Suelo desnudo y vegetación senescente o muerta
Vegetación con baja cobertura del suelo
Vegetación con mediana cobertura del suelo
Vegetación con alta cobertura del suelo
Vegetación oscura (bosques, pantanos)
Todo valor que no corresponde a las anteriores
Cuadro 2. Características de las bandas del sensor ETM+.
Table 2. Characteristics of ETM+ sensor bands.
Rango espectral
(micrómetros)
Banda
1
2
3
4
5
6
7
8
(Azul, ρ1)
(Verde, ρ2)
(Rojo, ρ3)
(IRC, ρ4)
(IRM1, ρ5)
(IRT, BT)
(IRM2, ρ7)
(Pancromática)
0.450
0.525
0.630
0.780
1.550
10.400
2.090
0.520
- 0.515
- 0.605
- 0.690
- 0.900
- 1.750
- 12.500
- 2.350
- 0.900
Centro de banda
(micrómetros)
0.48
0.57
0.66
0.84
1.65
11.45
2.22
0.71
Resolución espacial
(m)
30
30
30
30
30
60
30
15
IRC=Infrarrojo Cercano; IRM=Infrarrojo Medio; IRT=Infrarrojo Térmico, BT=Brillantez Térmica ™ IRC=Near Infrared; IRM=Medium
Infrared; IRT=Thermal Infrared; BT=Thermal Brightness.
616
VOLUMEN 40, NÚMERO 5
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
identificarse sin el proceso de corrección atmosférica, como la vegetación oscura y de alta cobertura, agua, nieve, bruma y nubes; por
lo que se puede utilizar de manera recursiva para, primero, calcular
las variables de entrada en el algoritmo de corrección atmosférico y
posteriormente correrlo de nuevo con las bandas transformadas por el
corrector.
La banda 6 debe transformarse a la misma resolución espacial
que las otras y convertirse a brillantez térmica (BT), en grados
Kelvin, mediante el procedimiento explicado en el Manual Científico de Usuarios de Landsat 7 (NASA, 2001).
Definición de la función de clasificación
La función de clasificación tiene como base la identificación
de características de la forma de la firma espectral para cada clase,
por lo que es esencial analizar la forma y variaciones de las firmas
espectrales para cada clase.
Suelos
En la Figura 1 se muestran las firmas espectrales de los cinco
tipos de suelos de acuerdo con la clasificación por patrones espectrales (Stoner y Baumgartner, 1981). Estos autores clasificaron
espectralmente a los suelos, en función de sus patrones típicos, en
cinco clases: 1) suelos de textura moderadamente fina y dominados
por materia orgánica; 2) suelos de textura moderadamente gruesa
y afectados por materia orgánica; 3) suelos lateríticos, dominados
por hierro; 4) suelos ricos en hierro; y, 5) suelos ricos en materia
orgánica.
El rasgo característico de los tres primeros tipos es un incremento en la reflectividad de las bandas visibles al infrarrojo medio
1 (IRM1) y que el infrarrojo medio 2 (IRM2) es menor al IRM1.
Para suelos ricos en hierro y materia orgánica (4 y 5), los rasgos
mencionados son poco marcados o inexistentes, aunque presentan
el patrón típico de que las bandas visibles tienen incrementos en reflectividad (azul<verde<rojo), y las bandas del infrarrojo son muy
similares entre sí. El patrón espectral más característico de un suelo
es un incremento en la reflectividad de las bandas visibles. Para los
tipos de suelos 1 a 3, este patrón incremental se presenta hasta el
IRM1. En la Figura 2 se muestra el efecto del contenido de agua
en el suelo en los patrones espectrales para los tipos de suelo 1 a 3.
Algo similar sucede para los patrones de los tipos de suelo 4 y 5. En
general, el incremento en el contenido de agua del suelo no cambia
los patrones espectrales de éstos, sólo el valor de la reflectividad
(Lobell y Asner, 2002).
Soils
Figure 1 shows the spectral signatures of the five soil types
according to the classification by spectral patterns (Stoner and
Baumgartner, 1981). These authors classified the soils spectrally,
according to their typical patterns, into five classes: 1) soils of
moderately fine texture, dominated by organic matter; 2) soils of
moderately thick texture, affected by organic matter; 3) lateritic
soils, dominated by iron; 4) soils rich in iron; 5) soils rich in
organic matter.
The characteristic trait of the three first types is an increment in
the reflectance in the visible bands at medium infrared 1 (IRM1) and
that medium infrared 2 (IRM2) is lower than IRM1. For soils rich
in iron and organic matter (4 and 5), the mentioned traits are little
marked or nonexistent, though they have the typical pattern of the
visible bands, showing increase in reflectance (blue<green<red),
and the bands of infrared are very similar among them. The
most characteristic spectral pattern of a soil is an increment in
the reflectance of the visible bands. For soil types 1 to 3, this
incremental pattern is presented up to the IRM1. In Figure 2, the
effect of water content in the soil is shown in the spectral patterns
for soil types 1 to 3. Something similar occurs for the patterns of
soil types 4 and 5. In general, the increment in soil water content
does not change their spectral patterns, only the value of reflectance
(Lobell and Asner, 2002).
Vegetation
Live vegetation can be subdivided in subclasses to better discern
natural vegetation and crops, especially the one associated to low
coverage and deciduous leaves. The reflectance simulation model of
two-layer canopies, MCRM2 (Kuusk, 2001), was used to simulate
the spectral behavior of different crops, utilizing type 3 soils as
background (the result is similar for the other soils). Figure 3 shows
the result obtained for alfalfa (Medicago sativa), rice (Oryza sativa),
maize (Zea mays), and potato (Solanum tuberosum) for different
Vegetación
La vegetación viva puede subdividirse en subclases para discriminar mejor la vegetación natural y cultivos, especialmente la asociada a baja cobertura y hojas caducifolias. Se utilizó el modelo de
simulación de reflectividad de doseles de 2 capas MCRM2 (Kuusk,
2001), para simular el comportamiento espectral de diferentes cultivos utilizando como fondo suelos del tipo 3 (el resultado es similar
Figura 1. Firmas espectrales típicas de cinco clases de suelo.
(Adaptado de Stoner y Baumgartner 1981).
Figure 1. Typical spectral signatures of five soil classes (Adapted
from Stoner and Baumgartner, 1981).
PALACIOS-SÁNCHEZ et al.
617
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
Figura 2. Efecto de la humedad en la reflectividad del suelo.
Figure 2. Moisture effect on soil reflectance.
para los otros suelos). La Figura 3 muestra el resultado para alfalfa
(Medicago sativa), arroz (Oryza sativa), maíz (Zea mays) y papa
(Solanum tuberosum), para diferentes índices de área foliar y por
consiguiente del porcentaje de cobertura del suelo.
Del análisis de la Figura 3 se detectan varios patrones básicos
en el desarrollo de un cultivo. El primer patrón que se puede observar, es que la reflectividad de la banda verde es mayor que las
de las bandas azul y roja. El segundo patrón observado es que el
valor máximo de reflectividad en los suelos desnudos y con cobertura vegetal baja corresponde a la banda IRM1, mientras que en
suelos con cobertura vegetal media a alta, el máximo corresponde
a la banda del infrarrojo cercano (IRC); el valor de reflectividad
en esta última banda, se incrementa en función de la cobertura
vegetal hasta alcanzar un valor de saturación. El tercer patrón se
observa en el comportamiento de la reflectividad de las bandas infrarrojas conforme aumenta la cobertura vegetal. Para coberturas
vegetales del suelo bajas a medias, las líneas que unen los valores
de reflectividad IRC, IRM1 e IRM2, presentan una concavidad
hacia arriba, mientras que para coberturas altas, la concavidad es
hacia abajo. En el caso de la vegetación de alta cobertura oscura,
típica de bosques sombreados o pantanos con suelos de alto contenido de humedad, la reflectividad en la banda azul no supera el
10%, la del IRM1 el 15% y la IRC el 30%.
Agua
La Figura 4 muestra dos patrones espectrales típicos de cuerpos
de agua, uno con agua clara y profunda y otro con gran contenido
de sólidos en suspensión.
Se ha observado que el agua de mar tiene una reflectividad
menor a la de los cuerpos de agua terrestres (bajo condiciones similares). Un patrón caraterístico de los cuerpos de agua clara (producto de la absorción de la radiación recibida), es la poca o nula
reflectividad en el infrarrojo, especialmente en el infrarrojo medio
(Jensen, 2000). Este rasgo diferencia a los cuerpos de agua de los
suelos y la vegetación, de acuerdo a los patrones discutidos anteriormente. Los patrones espectrales básicos de los cuerpos de agua
618
VOLUMEN 40, NÚMERO 5
leaf area index and, consequently, for the percentage of ground
coverage.
From the analysis of Figure 3, several basic patterns in the
development of a crop are detected. The first pattern that can be
observed is that the reflectance of the green band is higher than
in the blue and red bands. The second observed pattern is that the
maximum value of reflectance on bare soils and with low vegetal
coverage corresponds to band IRM1, whereas in soils with medium
to high vegetal coverage, the maximum corresponds to the band
of near infrared (IRC): the value of reflectance in this last band
increases according to the vegetal coverage until reaching a saturation
value. The third pattern is observed in the reflectance behavior
of the infrared bands, as vegetal coverage increases. For low and
medium vegetal soil covers, the lines that join the reflectance values
IRC, IRM1, and IRM2, have an upward concavity, while for high
coverage, the concavity is downward. In the case of vegetation of
dark high coverage, typical for shady forests or marsh with soils
of high moisture content, the reflectance in the blue band does not
surpass 10%, in IRM1 15%, and in IRC 30%.
Water
Figure 4 shows two typical spectral patterns of water bodies,
one with clear and deep water, and another with high content of
solids in suspension.
It has been observed that sea water has less reflectance
than that of terrestrial water bodies (under similar conditions).
A characteristic pattern of clear water bodies (product of the
absorption of received radiation) is the scarce or zero reflectance in
infrared, especially in medium infrared (Jensen, 2000). This trait
differentiates the water bodies from soils and vegetation, according
to the previously discussed patterns. The basic spectral patterns of
the water bodies are the almost general situation of Blue<Green
reflectance and the decreasing pattern in the reflectance of infrareds
(including generally also green and red). The reflectance of a water
body depends on the size of the water column (depth) and on the
substrate of the bed.
Shadows
The spectral signature of shadows is very similar to that of water
and, under certain conditions, it is impossible to differentiate them.
The objects that cast shadows are mainly clouds and topographic
elevations. Clouds have different density levels, that go from very
light –such as cirrus– up to dense –like cumulonimbus– reasons
for which a threshold must be specified, from which an object is
considered to have the shadow of a cloud.
Figure 5 presents the spectrum of two shadows of dense clouds
on vegetation and soils. It can be appreciated that what corresponds
to the shadow cast on vegetation, has a maximum in IRC, which
agrees with the reflectance of the diffuse light in this band. The
shadow projected on the soil has a spectral signature that does not
differ from the one shown in Figure 4 for clear water without
sediments.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
Figura 3. Firmas espectrales de cultivos en diferentes etapas de desarrollo.
Figure 3. Spectral signature of crops at different stages of development.
son la situación, casi general, de que la reflectividad Azul<Verde
y el patrón decreciente en la reflectividad de los infrarrojos (incluyendo también generalmente al verde y rojo). La reflectividad de un
cuerpo de agua es dependiente del espesor de la columna de agua
(profundidad) y del substrato del lecho.
Sombras
La firma espectral de las sombras es muy similar a la del
agua y, bajo ciertas condiciones, es imposible diferenciarlas.
Los objetos que proyectan sombras son principalmente nubes y
elevaciones topográficas. Las nubes tienen diferentes niveles de
densidad, que van de muy ligeras, como los cirrus, hasta muy
densas como los cumulo nimbus, por lo que se debe especificar
un umbral a partir del cual se considera que un objeto tiene sombra de nube.
En la Figura 5 se presenta el espectro de dos sombras de
nubes densas sobre vegetación y suelos. Se puede apreciar que la
Clouds, ice, and mist
Clouds and ice have high reflectance in the visible bands that
causes their white color, while mist has a translucent grayish
aspect, which makes it possible to see the subjacent object. These
three objects have the characteristic that their thermal brightness
is very low, compared to the rest of the objects; therefore, the
IRT band transformed to BT is utilized for their identification.
The spectral signature of clouds and ice must adjust to the
saturation of the bands in the ETM+ sensor (and TM), that is
why it is convenient to analyze directly the signature of Landsat
images.
In Figure 6, the spectral signature of clouds, mist, and ice
is shown as well as a spectrum that shows the theoretical sensor
saturation for the date when the image was taken.
On the image it is observed that in the case of snow, IRM1 and
IRM2 bands have little reflectance, a situation associated to water
in liquid state. The saturation values of the ETM+ sensor generate
PALACIOS-SÁNCHEZ et al.
619
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
Figura 4. Firma espectral del agua.
Figure 4. Spectral signature of water.
correspondiente a la sombra proyectada sobre vegetación, tiene un
máximo en el IRC, que corresponde a la reflectividad de la luz
difusa en esta banda. La sombra proyectada sobre el suelo tiene
una firma espectral que no difiere de la mostrada en la Figura 4
para agua clara sin sedimentos.
Nubes, hielo y bruma
Las nubes y el hielo tienen una alta reflectividad en las bandas
visibles, a lo que se debe su color blanco, mientras que la bruma
presenta un aspecto grisáceo translúcido, en el que es posible ver el
objeto subyacente. Estos tres objetos tienen la característica de que
su brillantez térmica es muy baja comparada con los demás objetos,
por lo que se aprovecha la banda IRT transformada a BT para su
identificación. La firma espectral de las nubes y el hielo deben ajustarse a la saturación de las bandas en el sensor ETM+ (y TM), por
lo que en este caso es conveniente analizar directamente las firmas
de imágenes Landsat.
En la Figura 6 se presenta la firma espectral de las nubes, bruma y hielo, así como un espectro que muestra la saturación teórica
del sensor para la fecha en que se tomó la imagen.
En la imagen se observa que en el caso de la nieve las bandas IRM1 e IRM2 presentan poca reflectividad, situación que se
asocia con el agua en estado líquido. Los valores de saturación
del sensor ETM+ generan una firma espectral muy similar a la
de la vegetación vigorosa, pero con valores muy altos de reflectividad.
Figura 5. Firma espectral de las sombras proyectadas sobre vegetación y suelo.
Figure 5. Spectral signature of shadows cast on vegetation and
soil.
a spectral signature, very similar to that of vigorous vegetation, but
with very high values of reflectance.
Asphalt and dark sand
Asphalt and dark sand have similar reflectance values, for which
it is difficult to attain an adequate and generalizable separation for
any image. It is possible as well to get confused with certain types
of soil, but one can also achieve their separation due to the fact that
the reflectance values are similar for all the bands, that is, there is
little contrast, therefore, they look gray. Figure 7 shows the spectral
signature of these two objects.
Classification of algorithm
Based on the form of the spectral signatures of the presented
objects, a classification algorithm was formulated, which is detailed
subsequently. First, a series of auxiliary variables were defined,
generated from the reflectance values ((ρλ, λ=1, 2, 3, 4, 5, and 7)
and the thermal brightness BT, which are presented next:
Asfalto y arena oscura
El asfalto y la arena oscura tienen valores similares de reflectividad, por lo que es difícil lograr una separación adecuada y generalizable a cualquier imagen. También es posible confundirlas con
determinados tipos de suelo, pero es posible lograr su separación
debido a que los valores de reflectividad son similares para todas las
bandas, esto es, existe poco contraste, por lo que se ven de color
gris. En la Figura 7 se presentan las firmas espectrales de estos dos
objetos.
620
VOLUMEN 40, NÚMERO 5
Figura 6. Firmas espectrales de nubes, hielo y bruma.
Figure 6. Spectral signatures of clouds, ice and mist.
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
Algoritmo de clasificación
Con base en la forma de las firmas espectrales de los objetos
mostrados se formuló un algoritmo de clasificación, el cual se detalla a continuación. Primero se definieron una serie de variables
auxiliares generadas a partir de los valores de reflectividad (ρλ,
λ=1, 2, 3, 4, 5 y 7) y la brillantez térmica BT, las cuales se presentan a continuación:
is=
((3 * ρ1 ) − ρ4 − ρ5 − ρ7 )
((3 * ρ1 ) + ρ4 + ρ5 + ρ7 )
ρ1 + ρ3
2
(6)
( ρ4 − ρ3 )
( ρ4 + ρ3 )
(7)
Brillo=
ndvi=
ig=
(5)
( ρ 4 + ρ5 + ρ 7 )
( ρ1 + ρ2 + ρ3 )
(8)
La variable is permite identificar cuerpos de agua y sombras;
un valor alto indica que existe un mayor contraste entre la reflectividad de la banda azul y la reflectividad de las bandas infrarrojas,
tal como se observa en las Figuras 4 y 5. La variable brillo es
el promedio de reflectividad de las bandas azul y roja, las cuales
corresponden a las bandas de absorción por actividad fotosintética; esta variable ayuda a la discriminación de los objetos en
función de su brillantez. El ndvi (normalized difference vegetation
index), es el índice de vegetación de la diferencia normalizada y
representa una relación entre la reflectividad de la banda roja y la
banda infrarroja cercana; permite la identificación de vegetación
y su grado de cobertura del suelo. La variable ig, es la relación
entre la reflectividad de las bandas de la porción infrarroja y la
reflectividad de la porción visible del espectro electromagnético, y
auxilia en la identificación de objetos con poco contraste entre las
bandas visibles e infrarrojas, como el asfalto y algunas sombras y
bruma.
Con base en estas variables y los valores de reflectividad, se
generaron condiciones lógicas a partir de la forma de las firmas espectrales, las cuales usan alguna característica de estas firmas para
formar una partición del espacio de observaciones.
En la Figura 8 se presentan las condiciones lógicas, donde el
símbolo ∩ corresponde al Y lógico y el símbolo ∪ al O lógico. UT
es un umbral térmico (temperatura en °K) que permite identificar
las nubes, hielo y bruma, en función de las condiciones climáticas
de la imagen.
En la Figura 9 se presenta el algoritmo de clasificación genérica
de objetos, donde se utilizan las variables y condiciones previamente definidas, así como umbrales de reflectividad y brillantez
térmica.
Se codificó un programa en lenguaje C++ para realizar la
clasificación genérica. El programa lee inicialmente el umbral térmico y las matrices de reflectividad de las siete bandas. Después
Figura 7. Firma espectral del asfalto y arenas oscuras.
Figure 7. Spectral signature of asphalt and dark sands.
is=
((3 * ρ1 ) − ρ4 − ρ5 − ρ7 )
((3 * ρ1 ) + ρ4 + ρ5 + ρ7 )
Brightness=
ndvi=
ig=
ρ1 + ρ3
2
( ρ4 − ρ3 )
( ρ4 + ρ3 )
( ρ 4 + ρ5 + ρ 7 )
( ρ1 + ρ2 + ρ3 )
(5)
(6)
(7)
(8)
The variable is contributes to identify water bodies and shadows;
a high value indicates that there is a higher contrast between
reflectance of the blue band and the reflectance of infrared bands, as
observed in Figures 4 and 5. The variable brightness is the average
of reflectance of the blue and red bands, which correspond to the
bands of absorption by photosynthetic activity; this variable helps
to discern the objects according to their brightness. The ndvi is the
normalized difference vegetation index and represents a relationship
between the reflectance of the red and the near infrared band;
it helps in the identification of vegetation and its degree of soil
coverage. The variable ig is the relationship between the reflectance
of the bands of infrared portion and the reflectance of the visible
portion of the electromagnetic spectrum, and it helps to identify
objects with little contrast between visible and infrared bands, like
asphalt and some shadows and mist.
Based on these variables and the reflectance values, logical
conditions were generated from the form of spectral signatures, using
a characteristic of these to form a partition of the observation space.
In Figure 8 the logical conditions are shown, where the symbol
∩ corresponds to the logical Y and the symbol ∪ to the logical O.
UT is a thermal threshold (temperature in °K), that allows to identify
the clouds, ice, and mist, according to the climatic conditions of the
image.
Figure 9 shows the algorithm of generic object classification,
where variables and previously defined conditions are utilized as
well as thresholds of reflectance and thermal brightness.
PALACIOS-SÁNCHEZ et al.
621
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
calcula las variables auxiliares y las condiciones lógicas para cada
píxel. Finalmente, clasifica la escena con base en el algoritmo de
la Figura 9 y el resultado se guarda en una matriz con los valores
numéricos del Cuadro 1, que corresponden a cada objeto genérico
identificado.
RESULTADOS
Y
DISCUSIÓN
Debido a que las operaciones del algoritmo son de
carácter Booleano, su ejecución es bastante rápida,
tarda alrededor de 4 minutos en analizar una escena
completa del sensor ETM+ (PC Intel Pentium III,
750 MHz). En comparación, un algoritmo de clasificación temática como el de máxima verosimilitud o
el análisis de agrupamientos, puede tardar un par de
horas en procesar una escena completa. En la Figura
10 se presenta una porción de la escena 25/47 del sistema de referencia mundial versión 2 (WRS2, por sus
siglas en inglés), donde es posible observar la ciudad
de Puebla en la parte central izquierda y el Pico de
Orizaba en la parte central derecha. También es posible ver la presa de almacenamiento de Valsequillo y
el Distrito de Riego 030. La imagen está generada con
las bandas 1-4-7 (Azul, IRC e IRM2), para simular los
colores primarios azul, verde y rojo; de esta manera
se forma una imagen en falso color infrarrojo, donde
la vegetación vigorosa resalta en color verde, mientras
que el hielo se ve de color azul intenso. También se
muestra el resultado de la clasificación genérica, donde se puede apreciar la identificación de las clases y
compararla con la imagen en falso color.
La precisión de un proceso de clasificación se
refiere al grado de concordancia entre las clases
de la imagen y un conjunto de datos de referencia.
Para estimar de manera cuantitativa esta precisión,
se construyó una matriz de error a partir de estos
conjuntos de datos. La matriz consiste de un arreglo
cuadrado de números ordenados en columnas e hileras que especifican el número de unidades muestrales
asignadas a una categoría por el proceso de clasificación, en relación con la categoría de referencia. Las
columnas corresponden al conjunto de referencia,
mientras que las hileras corresponden a las clases
generadas en el proceso. Debido a la característica
del algoritmo de clasificación y a que no es necesario tener puntos de control terrestre para realizar el
proceso, fue posible utilizar el método de muestreo
aleatorio estratificado para formar la matriz de error
a partir del resultado de la clasificación. El tamaño
de la muestra se estimó mediante la fórmula para una
distribución multinomial (Congalton y Green, 1999),
para un nivel de confianza de 95% y una precisión
de 5%:
622
VOLUMEN 40, NÚMERO 5
cond1 = (is > 0.2 ) ∩ ( ndvi < 0.01) ∩ ( ρ1 < 0.2 )
cond 2 = (is > 0.2 ) ∩ ( ndvi ≥ 0.01) ∩ ( ρ1 < 0.2 )
cond3 = [( Brillo > 0.2 ) ∩ ( BT < UT ) ∩ ( ndvi < 0.5)] ∪
⎡
⎣ ( ρ1 > ρ7 ) ∩ ( ρ2 > ρ3 ) ∩ ( ndvi < 0.1)⎤
⎦
cond4 = ( ρ4 ≥ ρ5 )
cond5 = ρ5 > (0.5 * ( ρ4 + ρ7 ))
cond6 = ρ4 > (0.35 * ρ3 + 0.65 * ρ5 )
cond7 = ( ig > 1.0 ) ∩ ( ig < 1.3)
cond8 = ( ρ1 > ρ2 ) ∩ ( BT < UT )
( ρ5 + ρ 7 )
< 0.6
( ρ2 + ρ3 )
cond10 = ( ρ4 < 0.3) ∩ ( ρ5 < 0.15) ∩ ( ρ1 < 0.1)
cond9 =
Figura 8. Condiciones lógicas para la clasificación.
Figure 8. Logical conditions for classification.
A program in C++ language was coded in order to carry
out generic classification. The program initially reads the thermal
threshold and the reflectance matrices of the seven bands. Then
it calculates the auxiliary variables and the logical conditions for
each pixel. Finally, it classifies the scene based on the algorithm
of Figure 9, and the result is kept in a matrix with the numerical
values of Table 1, corresponding to each identified generic
object.
RESULTS
AND
DISCUSSION
Since the operations of the algorithm are of
Boolean character, their execution is rather fast;
analyzing a complete ETM+ sensor scene (PC Intel
Pentium III, 750 MHz) lasts around 4 minutes. In
comparison, an algorithm of thematic classification
like that of maximum likelihood or the analysis of
clustering, may last a couple of hours in processing
a complete scene. Figure 10 presents a segment of
scene 25/47 of the World Reference System version
2 (WRS2), where the city of Puebla can be observed
at the central left part, and the Pico de Orizaba at
the central right part. Also the Valsequillo reservoir
and Irrigation District 030 can be seen. The image
is generated with the bands 1-4-7 (Blue, IRC, and
IRM2) in order to simulate the primary colors blue,
green, and red; this way, an image in false infrared
color was created, where the vigorous vegetation is
emphasized in green, while ice is seen in intense
blue. The result of the generic classification is shown
as well, where the identification of the classes can
be appreciated and compared with the image in false
color.
The accuracy of a classification process refers to
the degree of agreement between the classes of the
image and a set of reference data. In order to estimate
this accuracy quantitatively, a matrix of error was
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
Figura 9. Algoritmo de clasificación genérica de objetos.
Figure 9. Algorithm of generic object classification.
⎛ B Π i (1 − Π i ) ⎞
⎟
n = max⎜
⎟, i =1, 2,...,12
⎜
b2
⎠
⎝
(9)
donde Πi es la fracción de superficie correspondiente a la clase i; B es el valor de la distribución χ2(1,
0.995833)=8.21; b=0.05. Mediante este procedimiento
se estimó un tamaño de muestra de 733, pero se ajustó
a 732 al seleccionar 61 muestras por clase. Las muestras de suelos y los diferentes niveles de cobertura de
la vegetación se obtuvieron a partir de datos de campo
del Distrito de Riego 030, Valsequillo, mientras que
las demás categorías se tomaron a partir de fotointerpretación de la imagen Landsat.
Los valores en la diagonal principal de la matriz
de error, esto es, donde coinciden las etiquetas de referencia y clasificación, corresponden a los aciertos
del proceso. La precisión global de la clasificación
constructed starting from these data sets. The matrix
consists of a square with numbers arranged in columns
and lines, specifying the sample number of units,
assigned to a category by classification process, related
to the reference category. The columns correspond
to the reference set, while the lines correspond
to the classes generated in the process. Due to the
characteristic of the classification algorithm, and since
ground control points are not needed to carry out the
process, it was possible to use the method of stratified
random sampling to form the error matrix from the
classification result. Sample size was estimated by the
formula for multinomial distribution (Congalton and
Green, 1999), for a 95% confidence level and 5%
precision.
⎛ B Π i (1 − Π i ) ⎞
⎟
n = max⎜
⎟, i =1, 2,...,12
⎜
b2
⎠
⎝
PALACIOS-SÁNCHEZ et al.
(9)
623
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
Sombra
Nube
Bruma
Hielo
Agua
Asfalto/arena osc.
Suelo
Veg. baja cob.
Veg. media cob.
Veg. alta.cob.
Veg. oscura
Otros
Falso color infrarrojo (R=7, V=4, A=1)
Resultado de la clasificación genérica
Figura 10. Resultado de la clasificación genérica de objetos.
Figure 10. Result of the generic object classification.
where Πi is the fraction of the surface corresponding
to class i; B is the value of distribution χ2(1,
0.995833)=8.21; b=0.05. By this procedure a sample
size of 733 was estimated, but it was fitted to 732
at selecting 61 samples per class. The soil samples
and the different levels of vegetation coverage were
obtained from the field data of Irrigation District 030,
Valsequillo, whereas the rest of the categories were
taken from the photo interpretation of the Landsat
image.
se obtiene dividiendo la suma de los valores de la
diagonal principal entre el tamaño de la muestra, que
para esta clasificación fue de 92.3%. Dividiendo el
número de aciertos de una clase entre el número total
de muestras en la columna se obtiene la precisión del
productor del mapa y es un indicador de los errores de inclusión (errores de comisión), mientras que
cuando se divide por el total de muestras en la hilera
correspondiente, se obtiene la precisión del usuario,
que es un indicador del error de exclusión (errores de
omisión). En el Cuadro 4 se presenta la precisión del
productor y del usuario para las 12 clases, así como
la superficie estimada para cada clase.
The values on the main diagonal of the error
matrix, that is, where the labels of reference and
Cuadro 3. Matriz de error de la clasificación genérica de objetos.
Table 3. Error matrix of the generic object classification.
Referencia
Clases
Sombra
Nube
Bruma
Hielo
Agua
Asfalto/Ar.Osc.
Suelo
Veg. Baja C.
Veg. Media C.
Veg. Alta C.
Veg. Osc.
Otros
Total
624
Sombra
Nube
Bruma
Hielo
Agua
Asfalto/
Ar.Osc.
54
0
0
0
5
2
0
0
0
0
0
0
61
0
58
0
1
0
0
0
0
0
0
0
2
61
0
0
55
0
3
2
0
0
0
0
0
1
61
0
3
2
52
4
0
0
0
0
0
0
0
61
4
0
2
0
55
0
0
0
0
0
0
0
61
2
0
0
0
0
55
4
0
0
0
0
0
61
VOLUMEN 40, NÚMERO 5
Suelo
0
0
0
0
0
1
57
3
0
0
0
0
61
Veg.
Baja C.
0
0
0
0
0
0
4
57
0
0
0
0
61
Veg.
Media C.
0
0
0
0
0
0
0
2
58
1
0
0
61
Veg.
Alta C.
0
0
0
0
0
0
0
0
2
59
0
0
61
Veg.
Osc.
2
0
0
0
0
0
0
0
0
0
59
0
61
Otros
Total
0
3
1
0
0
0
0
0
0
0
0
57
61
63
64
60
53
66
60
65
62
60
60
59
60
732
CLASIFICADOR GENÉRICO DE OBJETOS EN IMÁGENES ETM+
Cuadro 4. Precisiones del productor y del usuario.
Table 4. Producer’s and user’s accuracy.
Precisión (%)
Núm.
1
2
3
4
5
6
7
8
9
10
11
12
Productor
Usuario
Superficie
(ha)
88.5
95.1
90.2
85.2
90.2
90.2
93.4
93.4
95.1
96.7
96.7
93.4
85.7
90.6
91.7
98.1
83.3
91.7
87.7
91.9
96.7
98.3
100.0
95.0
29 531
61 979
76 737
893
1488
25 957
60 458
254 858
578 589
517 657
111 143
138
Clase
Sombra
Nube
Bruma
Hielo
Agua
Asfalto/Ar.Osc.
Suelo
Veg. Baja C.
Veg. Media C.
Veg. Alta C.
Veg. Osc.
Otros
El algoritmo no siempre separa las sombras de los
cuerpos de agua, debido a que tienen firmas espectrales muy parecidas. En estos casos hay que utilizar
métodos geométricos que calculen la proyección de
sombras sobre la superficie terrestre, para diferenciar
las dos clases. El hielo es otra clase con valores de la
precisión del productor bajos, ya que existe confusión
con las nubes y en los límites de la nieve con otras clases se confunde con el agua. En términos generales,
la clasificación genérica de objetos tiene una precisión
bastante alta comparada con los métodos tradicionales
de clasificación.
Combinado con estadísticas de producción agrícola
y sistemas de información geográficos, el algoritmo se
ha utilizado con éxito en la cuantificación de superficies de cultivos bajo riego en zonas áridas y semiáridas, así como en la identificación de cuerpos de agua
en las Unidades de Riego para el Desarrollo Rural
(Colegio de Postgraduados, 2000-2002)1, y en varias
zonas de riego con fuentes de agua subterránea.
CONCLUSIONES
En este trabajo se ha presentado un algoritmo de
clasificación genérica, que permite identificar 12 objetos de interés para el estudio de los recursos naturales. El algoritmo no requiere campos de entrenamiento ni análisis de agrupaciones para realizar la
clasificación. Es del tipo de árboles de decisión, en
el que las reglas de clasificación se basan en operaciones boleanas que identifican los objetos por formas características de su firma espectral. Por lo mismo, la clasificación la realiza de una manera rápida
y precisa en relación con algoritmos de clasificación
tradicionales como son el de máxima verosimilitud
classification coincide, correspond to the correct
decisions of the process. The global accuracy of
classification is obtained dividing the sum of values
of the main diagonal by the sample size, which was
92.3% for this classification. Dividing the number of
correct classified samples of one class by the total
number of samples in the column, the map producer’s
accuracy is obtained, which is an indicator of the
inclusion errors, whereas at dividing by the total of
samplings in the corresponding line, user’s accuracy
is obtained, indicator of the exclusion errors (omission
errors). Table 4 shows producer’s and user’s accuracy
for the 12 classes, as well as the estimated surface for
each class.
The algorithm does not always separates the shadows
of the water bodies, because they have very similar
spectral signatures. In these cases geometrical methods
have to be used, which calculate the projection of
shadows on the earth’s surface, in order to differentiate
the two classes. Ice is another class with low values
of producer’s accuracy, since there is confusion with
clouds, and at the limits of snow with other classes it is
confused with water. In general terms, generic object
classification has rather high precision compared with
the traditional classification methods.
Combined with statistics of agricultural production
and geographic information systems, the algorithm has
been utilized successfully in quantifying of crop areas
under irrigation in arid and semi-arid zones, as well as
in the identification of water bodies in Irrigation Units
for Rural Development (Colegio de Postgraduados,
2000-2002)1, and in several irrigation zones with
underground water sources.
CONCLUSIONS
In this paper, an algorithm of generic classification
has been presented, which permits to identify 12
objects of interest for the study of natural resources.
The algorithm does not require training areas or
clustering analysis to carry out the classification. It is
the type of decision trees, on which the classification
rules are based on Boolean operations, which identify
the objects by the characteristic forms of their spectral
signature. Likewise, the classification is carried out fast
and precisely in relation with traditional classification
algorithms, such as the one of maximum likelihood or
of clustering analysis. The algorithm has been used
successfully in the estimate of surfaces sown with
crops and in the identification of water bodies.
—End of the English version—
1
Colegio de Postgraduados. 2000-2002. Estimación de Superficies Regadas y Volúmenes Utilizados en Unidades de Riego Mediante Técnicas de Percepción Remota. Trabajo realizado por convenio de participación para la Comisión Nacional del Agua.
PALACIOS-SÁNCHEZ et al.
625
AGROCIENCIA, SEPTIEMBRE-OCTUBRE 2006
o de análisis de agrupaciones. El algoritmo se ha
utilizado con éxito en la estimación de superficies
sembradas de los cultivos y en la identificación de
cuerpos de agua.
LITERATURA CITADA
Breiman L., J. Friedman, R. Olshen, and C. Stone. 1984.
Classification and Regression Trees. Wadsworth International
Group. 368 p.
Byeungwoo J., and D. Landgrebe. 1999. Partially supervised
classification using weighted unsupervised clustering. IEEE
Transactions on Geoscience and Remote Sensing. Vol. 37, No.
2. pp: 1073-1079.
Congalton, R. G., and K. Green, 1999. Assessing the Accuracy
of Remotely Sensed Data: Principles and Practices. Lewis
Publishers, Boca Raton, FL. 160 p.
Cortijo, F. J., N. Pérez de la Blanca, J. Abad, and S. Damas. 1997.
A comparison of multispectral image classifiers using highdimensional simulated data sets. VII National Symposium on
Pattern Recognition and Image Analysis, Barcelona (Spain).
pp: 365-370.
Cheng H., and C. A. Bouman. 2001. Multiscale Bayesian Segmentation
Using a Trainable Context Model. IEEE Transactions on Image
Processing, Vol. 10, No. 4. pp: 511-525.
626
VOLUMEN 40, NÚMERO 5
Chulhee L., and D. Landgrebe. 1991. Fast multistage likelihood
classification. IEEE Transactions on Geoscience and Remote
Sensing, Vol. 29, No. 4, pp: 509-517.
Jensen, J. R. 2000. Remote Sensing of the Environment: An
Earth Resource Perspective. Upper Saddle River, New Jersey.
Prentice Hall. 544 p.
Kuusk, A. 2001. A two-layer canopy reflectance model. Journal of
Quantitative Spectroscopy and Radiative Transfer. Volume 71,
Issue 1. pp: 1-9.
Lobell D., and G. Asner. 2002. Moisture effects on soil reflectance.
Soil Scientific American Journal 66: 722-727.
McCauley, D. 1995. Comparison of scene segmentations and
classifications. SMAP, ECHO, and maximum likelihood. IEEE
Transactions on Geoscience & Remote Sensing, Vol. 33, No.
6: 1313-1316.
Moore, G. K. 1978. Satellite Surveillance of Physical Water Quality
Characteristics, en Proc. Twelfth International Symposium on
Remote Sensing of Environment, Environmental Research
Institute of Michigan, Ann Harbor, MI. pp: 445-462.
NASA. 2001. Landsat 7 Science Data Users Handbook, http://
ltpwww.gsfc.nasa.gov/IAS/handbook/handbooktoc.html.
Noviembre de 2004.
Schowengerdt, R. A. 1997. Remote Sensing-Models and Methods
for Image Processing. Academic Press. 522 p.
Stoner, E. R., and M. F. Baumgardner. 1981. Characteristic
variations in reflectance of surface soils. Soil Scientific
American Journal 45: 1161-1165.
Descargar