clase18

Anuncio
Reconocimiento de Patrones: Segmentación de Imágenes
Trataremos un conjunto de tópicos del área del reconocimiento de patrones. En
particular consideraremos reconocimiento de patrones estadístico, instrumentados
con
técnicas de procesado digital de imágenes. Esto involucra primero localizar y aislar objetos en
una imagen, posteriormente identificando (clasificando) estos objetos usando técnicas de
teoría de decisiones estadística.
Reconocimiento estadístico de patrones.
La rama de visión por computadora, dentro de inteligencia artificial, desarrolla
algoritmos para el analizar el contenido de una imagen. Una gran variedad de aproximaciones
en la dirección del la interpretación de imágenes (image understanding) ha sido empleada, una
de ellas es el reconocimiento estadístico de patrones.
El reconocimiento estadístico de patrones supone que la imagen puede contener uno o
mas objetos y cada objeto corresponde a uno de los diferentes tipos (categorías, clases)
determinados de patrones.
Dada una imagen digitalizada que contiene varios objetos, el reconocimiento de
patrones consiste de tres etapas:

Segmentación de la imagen (aislamiento de los objetos)

Extracción de características

Clasificación.
En la segmentación, se identifican los diferentes objetos y se aíslan del resto de la
imagen.
Durante la extracción de características, los objetos son “medidos”. Por medida vamos
a entender la cuantificación de alguna propiedad del objeto. Una característica es una función
de una o más medidas, calculadas, tales que representan alguna característica importante del
objeto. El proceso de la extracción de características produce un conjunto de propiedades que
juntas producen un vector. Este proceso reduce drasticamente la cantidad de información
La clasificación es una toma de decisión la cual considera las clases a las cuales
pertenece el objeto. Cada objeto se reconoce como perteneciente a algún tipo en particular, y
el reconocimiento se lleva a cabo como un proceso de clasificación. Cada objeto se asigna
como perteneciente a uno o varios grupos predeterminados. Estos grupos o clases son todos
los tipos de objetos que se espera existan dentro de la imagen.
Ejemplo de Reconocimiento de patrones.
Los conceptos básicos del reconocimiento estadístico de patrones, pueden ser
ilustrados con el siguiente ejemplo. Supongamos que se quiere construir un sistema
clasificador de frutas, las frutas son cerezas, manzanas, limones y toronjas. Entonces
necesitamos un sistema procesador de imágenes que observe las frutas que se van
aproximando y clasificar a cada una, para enviarla a la caja adecuada.
Se puede instalar un sistema de digitalización, sobre la banda e instrumentar la
decisión de la clasificación en una computadora.
Para este ejemplo vamos a medir dos cantidades en cada pieza de fruta: Su diámetro y
su color. El programa de la computadora procesara cada imagen y medirá las dos cantidades,
el diámetro en milímetros, así como los parámetros indicativos del color.
Supongamos que tenemos una cámara de color, entonces el programa calcula la
brillantez en cada uno de los tres canales rojo (R), verde (G) y azul (B).
Una de las características que se pueden medir es la razón (cociente) entre los canales
rojo y verde. Esta tomara bajos valores para el amarillo y valores altos para las frutas rojas.. A
esta razón le podemos llamar la medida de cantidad de rojo (redness).
La siguiente figura muestra un espacio bidimensional con las dos características que
nos interesa medir, así como los “amontonamientos” (clusters) producidos por cada una de
las clases. Colocando líneas de decisión apropiadamente sobre el espacio de características,
podemos partir una región para cada clase, y de esta manera establecer la regla de
clasificación.
Cuando un objeto se acerca a la cámara de TV, este es medido y sus características
especifican un punto en el espacio, el cual es asignado a una de las cuatro clases. Tan pronto
como la decisión de la clasificación es terminada, el sistema mecánico enviará la fruta al
compartimento adecuado.
El carácter estadístico de este proceso quedara claro mas adelante, por el momento es
importante mencionar que cada fruta produce una Función de Distribución de Probabilidad
(FDP) en el espacio de características. Las líneas de decisión pueden ser determinadas a
partir de la interacción de las FDP´s de manera tal que el error en la clasificación sea el
mínimo.
Diseño del Sistema de Reconocimiento de Patrones.
El diseño del sistema se lleva a cabo en 5 pasos mostrados en la tabla de abajo.
Paso
Función
Diseño del localizador de objetos
Selecciona el algoritmo para la segmentación
de la escena, la cual aislará los objetos
individuales del resto de la imagen.
Selección de las características
Decide cuales propiedades de los objetos
distinguen
de
una
mejor
manera,
los
diferentes tipos de objetos, y como medir esas
características
Diseño del clasificador
Establece las bases matemáticas del algoritmo
de clasificación y selecciona la estructura del
clasificador que va a ser usado
Entrenamiento del clasificador
Fija los diferentes parámetros (fronteras de
decisión) en el clasificador que se adecuen a
los objetos que están siendo clasificados.
Evaluación del sistema
Calcula los diferentes posibles errores de
clasificación, así como sus porcentajes.
Proceso de segmentación de la imagen
Definimos la segmentación de una imagen como la partición de la imagen digital en
regiones disjuntas (que no se traslapan). Una región es un conjunto de pixeles conectados.
Hay dos formas de definir la conectividad: conectividad cuatro y conectividad 8. La
conectividad cuatro considera solo a los pixeles adyacentes (derecha, izquierda, arriba, abajo).
La conectividad 8 considera a los pixeles sobre la diagonal.
La segmentación de imágenes se puede llevar a cabo de tres maneras: por regiones,
por fronteras y por orillas
Proceso de Segmentación de la Imagen.
Segmentación por umbral

Umbral global

Umbral adaptivo

Selección optica del umbral
Métodos de segmentación basados en el gradiente

Laplaciano
Detección de orillas y continuidad

Operador de sobel

Operador de Roberts

Operador Prewitt

Operador de Kirsch

Transformada de Hough.
Crecimiento de regiones
Morfología (imágenes binarias)

Erosión

Dilatación

Abertura

Cerradura
Transformada de Hough
La transformada de Hough es útil para determinar todos los puntos pertenecientes a
una recta, así como la ecuación de esta.
  x cos( )  y sen( )
Morfologia (imágenes binarias)
Erosión:
Se define como
E = BS = {x,ySxy B}
Esto se lee como: La imagen binaria E que resulta de erosionar B con el elemento estructural
S, es el conjunto de puntos (x,y) tales que si S se traslada y su origen se encuentra (x,y), este
está completamente contenido en B.
Dilatación:
D = BS = {x,ySxy  B  }
La imagen binaria D, resulta de dilatar B con el elemento estructural S, es el conjunto
de puntos (x,y) tales que si S se traslada, y su origen está en (x,y), entonces su intersección
con B es diferente del vacio.
Basados en estas dos operaciones morfológicas básicas, se pueden construir una
combinación de ellas.
Abertura: Elimina objetos pequeños y delgados, generalmente suaviza los bordes.
Rompe la continuidad de las líneas delgadas.
BS = (BS)S
Cerradura. Llena pequeñas regiones, y agujeros conecta objetos cercanos.
BS = (BS)S
Adelgazamiento:
Adelgazamiento y esqueletonización. (a) esqueleto adelgazado (b) eje central medio.
Descargar