Extracción de características

Anuncio
Extracción de características
Gonzalez & Woods, Digital Image Processing, cap. 8
extracción de características
1
Propiedades de las características
• Tienen que ser robustos: la extracción debe ser insensible
al ruido de captura e iluminación.
• Discriminantes (clasificación): las características deben
servir para distinguir objetos de clases distintas.
• Tienen que poseer determinadas invarianzas dependientes
de la aplicación:
– Traslación: los valores de las características son independientes de
la posición.
– Rotación y escalado: idem de la orientación del objeto y de su
tamaño.
– Transformación no lineales de deformación (perspectiva).
extracción de características
2
Códigos de cadena: consiste en representar mediante un código
incremental la frontera (1-pixel, cerrada) del objeto.
Se escoge un punto inicial y se recorre la frontera en el sentido
de las agujas del reloj indicando la dirección que sigue la
frontera.
Sensibilidad al ruido: para aumentarla se submuestrea la frontera con una
malla más basta.
Invarianza a traslación: es inmediata.
Invarianza a rotación: es preciso poder determinar un punto inicial que
pueda ser detectado robustamente en el objeto rotado
Invarianza a escalado: depende del submuestreo de la frontera.
Invarianza a deformaciones: no existe en general
Capacidad discriminante: reducida, exige métodos eficientes de
clasificación de secuencias.
extracción de características
3
Codificación de las direcciones, en
el caso 4y 8 conectado
Ejemplo de frontera y su
submuestreo para disminuir
el efecto del ruido.
Representación gráfica de las
cadenas en el caso 4 y 8
conectado.
extracción de características
4
Las primeras diferencias de los códigos de cadena son invariantes a
rotación.
extracción de características
5
Se obtienen
representaciones mas
robustas frente a
rotaciones, alineando
la malla de
discretización con los
ejes principales del
objeto, o sometiendolo
a una transformación
de Hollerit
previamente a la
discretización.
extracción de características
6
Aproximaciones poligonales: se describe la frontera con el
polígono que la aproxima, dado un cierto error tolerado.
El proceso comienza detectado el eje de mayor elongación y
prosigue añadiendo vértices hasta obtener una cierta precisión
prefijada.
extracción de características
7
Signaturas: representaciónes de la frontera del objeto como
funciones con soporte unidimensional. Usualmente consiste en un
mapa de las coordenadas polares de la frontera tomando como
origen el centro de masa del objeto.
Invarianza a traslación: inmediata
La rotación se convierte en la traslación de una función periódica,
el escalado se convierte en la variación de amplitud de la función
1D.
Capacidad discriminante: depende de la capacidad de reconocer
secuencias 1D.
extracción de características
8
Ejemplos de signaturas de dos objetos sencillos.
extracción de características
9
Esqueleto (eje medial) (Medial Axis transform MAT):
Se define el esqueleto como el conjunto de pixeles equidistantes de
la frontera del objeto. Sirve de base para la descripción estructural
del objeto y su reconocimiento. Es robusto frente a ruido,
invariante a translación y rotación. El escalado no varia su
estructura y es bastante robusto frente a deformaciones.
extracción de características
10
Un algoritmo eficiente para MAT
•Paso 1: marcar para borrado pixeles del contorno (al menos un vecino con valor
0) que cumplen condiciones a,b,c,d.
•Paso 2: Borrar pixeles marcados en el paso 1.
•Paso 3: Marcar para borrado pixeles del contorno que cumplen condiciones
a,b,c’.d’
•Paso 4: Borrar pixeles marcados en el paso 3.
Condiciones
Disposición de los
pixeles en el
vecindario
extracción de características
11
Ejemplos del cálculo del esqueleto o eje medial.
extracción de características
12
Coeficientes de Fourier de la frontera. Se basan en la
transformación de la secuencia de puntos frontera considerados
como números complejos.
Con transformada discreta de Fourier
extracción de características
13
Ejemplo de reconstrucción de la frontera usando descriptores de Fourier.
extracción de características
14
Algunas propiedades de los descriptores de Fourier:
Son invariantes a traslación, excepto el descriptor a(0).
La rotación y el escalado se preservan en el dominio
transformado.
La variación del punto inicial corresponde a un factor constante
multiplicando los coeficientes de Fourier.
extracción de características
15
Generalización de la
signatura: la frontera
puede representarse como
una función 1D de una
variable r arbitraria.
Se puede considerar g(r) como una variable aleatoria v,
calcular su histograma p(vi), y=1,..,K y usar los momentos
centrales como discriminantes
Alternativamente, se puede normalizar g(r) y utilizar sus momentos
extracción de características
16
Momento de orden (p+q) de f(x,y).
En ciertas condiciones, f(x,y) determina unicamente la secuencia
de todos los momentos (mpq) y a la inversa (mpq) determina f(x,y).
Momentos centrales
Caso digital:
Momentos centrales hasta orden 3
extracción de características
17
Momentos centrales normalizados: son invariantes a escalado en
la magnitud de la función f(x,y).
Invariantes de Hu a escalado, rotación y traslación
extracción de características
18
Ejemplo de cálculo de los invariantes de Hu sobre una imagen
en escala de grises
extracción de características
19
Invariantes proyectivos
cap 11, Duda & Hart, Pattern Classification and Scene Analysis, Wiley 1973
Considerando un objeto descrito por un conjunto de puntos
que pueden ser identificados en la imagen, el problema es
determinar relaciones invariantes a las deformaciones de
perspectiva que permitan distinguir objetos distintos
independientemente del punto de vista
extracción de características
20
Un lápiz (pencil) es un conjunto de líneas que pasan por un
punto (el centro del lapiz).
Rango de puntos: cjto de puntos en una línea.
Los rangos son
correspondientes
bajo perspectiva si
son secciones de un
mismo lapiz. i.e:
Son los puntos de un
objeto y sus
proyecciones en la
imagen.
extracción de características
21
Los rangos Z y X están en
correspondencia proyectiva
puesto que comparten la
correspondencia perspectiva
con Y.
Dados dos rangos proyectivos (vistas,
imágenes) siempre existe un tercer
rango (objeto) en perspectiva con los
dos
Dados dos rangos la condición
necesaria y suficiente para que
sean imágenes del mismo objeto
es que estén en correspondencia
proyectiva.
extracción de características
22
Rangos X e Y en perspectiva, pueden considerarse como ejes
de un sistema de coordenadas no ortogonales.
Coordenadas de los
rangos.
Coordenadas del centro del lapiz.
Se cumple para cada
línea:
Restando por pares se
obtienen las ecuaciones
(j,i)
extracción de características
23
Cross-ratio o cociente cruzado:
Se obtiene como [(3,1)x(2,4)]/[(2,1)x(3,4)]
Es independiente de las coordenadas (a,b) del centro del lápiz (centro de
proyección).
Caracteriza el lápiz: todas las secciones (rangos) de un lápiz tienen el mismo ratio.
Si dos lápices tienen el mismo cross ratio deben tener alguna seccion (rango)
común.
El cross ratio es un invariante proyectivo: dos rangos son proyectivos si tienen el
mismo cross ratio.
Una condición necesaria para que dos vistas correspondan a un mismo objeto es
que el cross ratio de todos los conjuntos de 4 puntos coincidan. Podemos
discriminar objetos bajo distintas vistas utilizando el cross ratio.
extracción de características
24
El cross ratio es independiente del origen de coordenadas.
Lápices en distintos planos pueden tener el mismo cross ratio.
La definición del cross ratio depende del etiquetado de los
puntos. De las 24 formas de etiquetarlos, solo 6 dan
definiciones distintas del cross ratio.
extracción de características
25
Coordenadas proyectivas:
Dados puntos A,B,C,U (U punto unitario) y un punto P cualquiera, la
coordenada proyectiva de P en el eje AC viene dad por el cociente
cruzado (análogamente para los ejes AB y BC):
El conocimiento de dos de las tres
coordenadas proyectivas determina
completamente el punto P, excepto
para puntos en los lados del
triangulo de referencia.
extracción de características
26
Invarianza proyectiva de las coordenadas proyectivas
Centro de la lente
Las coordenadas proyectivas de P’
en A’,B’,C’,U’ son las mismas que
las de P en A,B,C,U.
CR(A, X, Y, C) es la coordenada de P en AC.
Plano imagen
En el plano ALC se cumple
Plano objeto
extracción de características
Por tanto, la
coordenada proyectiva
de P en AC es la
misma que la de P’ en
A’C’. Analogamente
para los restantes ejes.
27
Procedimiento para el reconocimiento invariante a proyección
de objetos planos basado en las coordenadas proyectivas.
-Selección de 5 o mas puntos (coplanares)
- Seleccionados los 4 ptos de referencia, se calculan las
coordenadas proyectivas de los restantes puntos.
La condición necesaria para que dos imágenes muestren el
mismo objeto es que puntos correspondientes tengan
coordenadas proyectivas identicas.
extracción de características
28
Propiedades cuasi proyectivas: responden a la cuestión de la
segunda vista de forma limitada, no general.
Dadas imágenes A,B,C la aproximación cuasi proyectiva solo puede responder si
un par (A y B ó C y B) son imágenes del mismo objeto
Las líneas que unen los puntos
de proyección de un punto del
objeto y los puntos donde la
linea interlentes atraviesan los
planos imagen se interesecan
en la linea XZ de intersección
de los planos imagen.
extracción de características
29
Dados cuatro puntos de un
mismo objeto 3D existen
dos lapices C1 y C2 que
tienen un rango comun, por
tanto tienen los mismos
cocientes cruzados y son
correspondientes en
perspectiva los puntos de las
imágenes que forman estos
lápices.
En la práctica, dados puntos especificos en las imagen, se trata de
encontrar los centros de los lápices que hagan correspondientes en
perspectiva a todos los posibles conjuntos de 4 puntos.
extracción de características
30
Descargar