Analísis del movimiento Estimación & Seguimiento Antoine MANZANERA – ENSTA/LEI UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 1 Aplicaciones (1) Compresión e Indexación Vigilancia de aldea (University of Surrey) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 2 Aplicaciones (2) Navegación robótica Movimiento fluido (Ecole des Mines / CMM) Seguimiento automático UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 3 ¿ Qué información extraer ? Modelo no rígido Nivel conceptual estructura Modelo rígido forma velocidad ubicación número tamaño parametros de transformación Mapa binaria móvil/fijo Campo de desplazamiento Cálculos bajo nivel alarma Cuantidad de información UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 4 Detección – Estimación – Persecución DETECCIÓN ESTIMACIÓN seguimiento Objetivo: Identificar en cada imágen, píxeles que pertenecen a objetos móviles Objetivo: calcular el movimiento aparente (velocidad instantanea) de cada píxel Objetivo: aparear ciertas estructuras espaciales por cada par de imágenes. • Cierta continuidad temporal • Continuidad temporal • Discontinuidad temporal • Movimiento de la cámara cero o muy sencillo. • « procesar después » • « procesar antes » Capítulo 1 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI Capítulo 2 5 MOVIMIENTO 1 Estimación ÍNDICE CAPÍTULO • Campo de velocidades aparentes y aplicaciones • Técnicas por apareamiento • Técnicas diferenciales 1: Lucas y Kanade • Técnicas diferenciales 2: Horn y Schunck UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 6 Cálculo del movimiento aparente (1) El cálculo de un movimiento aparente global (mapeo) entre dos imágenes corresponde a la estimación de parámetros de una transformación que afecta a todos los puntos de la imágen: traslación, rotación, escalamiento, afinidad, ... (2) El cálculo de un movimiento aparente local consiste en asociar a cada píxel (x,y,t) de I un vector (vxt,vyt) que representa la velocidad aparente del píxel (x,y) en el instante t. Calculo del flujo óptico (= Campo de movimiento) Idealmente: el vector (vxt,vyt) representa la proyección sobre el plano imágen del vector velocidad (Vxt,Vyt,Vzt) de los objetos de la escena respecto a un sistema de referencia imágen (O,x,y,z). Sera calculado a partir de las variaciones temporales de la función I(x,y,t). UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 7 Ejemplos de flujo óptico Fuente: Pierre Kornprobst - INRIA UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 8 ¿ Cuales informaciones puede proveer el flujo óptico ? movimiento dominante « discontinuidades », singularidades contornos * tiempo antes colision núcleo de expansión (FOE) * profundidad * ego-movimiento * orientación de superficie Nivel conceptual UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 9 Distorción perspectiva Se denota (X,Y,Z) las coordenadas de un punto de la escena. (x,y) las coordenadas de la proyección del mismo en la imagen. f la distancia focal de la cámara Distorción perspectiva (modelo estenopeico) : X x f UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Z Antoine MANZANERA – ENSTA/LEI X x f Z Y y f Z 10 Movimiento proyectivo Supongamos que la cámara se mueve a la velocidad (-X’,-Y’,-Z’) respecto a una escena estática (escena no deformable, sin objetos móviles), entonces todos los puntos de la escena tienen misma velocidad (X’,Y’,Z’) respecto a la cámara (con X’ = dX/dt ; Y’ = dY/dt ; Z’ = dZ/dt). Derivando respecto al tiempo las ecuaciones de distorción perspectiva, obtenemos: X ' XZ ' x' f 2 Z Z Y ' YZ ' y' f 2 Z Z UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 x' 1 f Soit : Z y' 0 Antoine MANZANERA – ENSTA/LEI 0 f X ' x Y ' y Z ' 11 Un modelo más realista… En realidad, el centro óptico (proyección del diafragma sobre el plano imágen) no está generalmente en el centro del imágen sino en un punto (xc,yc). Además, la distorción perspectiva no es generalmente la misma en ambas direcciones, y la distancia focal se representa con el par (fx,fy) : x' 1 fx y' Z 0 0 fy X ' ( x xc ) Y ' ( y yc ) Z ' Los parametros { xc , yc , fx , fy } dependen del sensor y de la óptica. Son estimados en una fase de calibración de la cámara. Por otro lado, si se toma en cuento el componente de rotación = (x,y,z) de la cámara respecto a la escena: x' 1 f x y' Z 0 0 fy factores de perspectiva UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 X ' ( x xc )( y yc ) ( x xc ) fy Y ' ( y yc ) 2 ( y yc ) f y fy Z' coordenadas del centro óptico componente de traslación Antoine MANZANERA – ENSTA/LEI fy ( y yc ) 2 fy ( x xc f)( y yc ) x x ( y y ) c fy y ( x xc ) z fx componente de rotación 12 Traslación pura y profundidad • Traslación pura de la cámara según el eje x, sea T = (-X’,0,0) y = (0,0,0) X' x' f x Z y' 0 sea Z fx X' x' Velocidades aparentes horizontales, de modulos inversamente proporcionales a la profondidad. • Traslación pura de la cámara según el eje z, sea T = (0,0,-Z’) y = (0,0,0) ( x xc ) Z ' x' Z ( y yc ) Z ' y' Z sea ( x xc ) Z ' Z x' ( y yc ) Z ' Z y' Zoom sobre la imágen con núcleo de expansión en el centro óptico. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 13 El núcleo de expansión (FOE) Durante la traslación de la cámara en una escena estática, las direcciones de velocidad de los puntos proyectados sobre el plano imágen, convergen hacia un punto del plano proyectivo denominado FOE. En lo siguiente, se supone que la cámara se mueve según la traslación T = (-X’,-Y’,-Z’). Para simplificar las notaciones, se supone además que fx = fy = f et (xc,yc) = (0,0). Sea (X0,Y0,Z0) un punto de la escena. Después de un tiempo t, esta proyectado sobre la imágen en el punto (xt,yt), con: X 0 tX ' Y0 tY ' ( xt , yt ) f ,f Z 0 tZ ' Z 0 tZ ' (xFOE,yFOE) ( xFOE , y FOE ) lim ( xt , yt ) t X ' Y' f ,f Z' Z' (x0,y0) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 14 Tiempo antes colisión P(t2) P(t1) d f Z foe movimiento en una escena estática: f ' 2 Z ' Z f Z y pues Z ' Z' tiempo antes colisión UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 15 Cálculo del flujo óptico: limitaciones ! (1) Se supone: MOVIMIENTO VARIACIÓN DE INTENSIDAD () Se supone que una variación de intensidad observada en la imágen traduce la presencia de un movimiento en la escena. Esto corresponde a una hipótesis de iluminación constante en la escena. () Es el cambio de intensidad en la imágen que permite recoger el movimiento aparente del objeto. Se supone entonces que la luz reflejada por cada punto del objeto se mantiene constante independientemente del movimiento relativo objeto/cámara. La hipótesis subyacente es que los objetos son de superficie lambertiana: luz incidente UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 luz reflectada La intensidad de la luz reflectada es constante en todas las direcciones. Antoine MANZANERA – ENSTA/LEI 16 Cálculo del flujo óptico: limitaciones ! (2) PROBLEMA DE LA APERTURA El movimiento aparente de un punto se recoge gracias a un cálculo realizado en una vecindad limitada de este punto. Solo se puede calcular el componente de movimiento en la dirección del gradiente (es decir, perpendicular al contorno). Fuente : PROJET TELESUN http://telesun.insa-lyon.fr UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 17 Técnica por apareamiento Se considera B Z2 vecindad del origen: Medida de apareamiento: 2 I x b , y b , t I x x b , y y b , t 1 1 2 1 2 A(tx , y ) (x, y ) ( b1 ,b2 )B x Es la suma de diferencias cuadradas (SSD) entre 2 bloques: x + x tipicamente: B de tamaño 9×9, 15×15... y + y y It It+1 Solución del flujo óptico: (vxt , v ty ) arg min A(tx , y ) (x, y ) x ,y K K(x,y) B(x+x,y+y) KI para limitar el tiempo de calculo + Estrategias de optimización… UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI I 18 Apareaemiento: estrategías de optimización El principio de las estrategías de optimización es explorar de manera diferente el espacio de búsqueda K para minimizar la complejidad de cálculo del mínimo de la función de apareamiento: y y y x EXHAUSTIVA K x SEPARADA K x K JERÁRQUICA y x MÉTODO DEL GRADIENTE UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 K Para cada punto de K, se cálcula la suma de diferencias mientras que se mantiene por debajo de un cierto umbral T. La solución corresponde al punto de K por el cual mas diferencias han sido sumadas. SECUENCIAL Antoine MANZANERA – ENSTA/LEI • Estas técnicas excluyentes y combinarse. no son pueden • Sin hipótesis sobre la función de apareamiento (separabilidad, convexidad ...) en el espacio K, sólo la búsqueda exhaustiva asegura el cálculo del óptimo global sobre K. 19 Ejemplo: normas mpeg de compresión vídeo • Cada imágen esta cortada en bloques 16×16 ou 32×32. • Hipótesis de mismo desplazamiento para todos los píxeles de cada bloque. • Codificación: Vectores de desplazamiento + errores comprimidos... Compresión estática JPEG : • Transformada de coseno discreto • Cuantificación Flujo óptico submuestreado • Código entrópico Fuente : VcDemo TU Delft Trama predicha UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Errores de predicción Antoine MANZANERA – ENSTA/LEI 20 Técnicas diferenciales (1) LUCAS & KANADE 1981 El principio del método de Luca y Kanade es de calcular el mínimo de la función de apareamiento cuatrático (SSD), suponiendo que el desplazamiento buscado es pequeño, como el punto donde las derivadas de la función de apareamiento se anulan, respecto a x y a y. (vxt , vty ) arg min A(x, y) x ,y K arg min I ( x, y, t ) I ( x x, y y, t 1) 2 x ,y K ( x , y )B Bajo la hipótesis de que I es regular y que el desplazamiento (x ,y) es pequeño, se escribe la formula de Taylor al orden 1 de I: I ( x x, y y, t 1) I ( x, y, t ) I I I x y x y t La función de apareamiento A se vuelve: I I I A(x, y ) x y y t ( x , y )B x UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 2 21 Técnicas diferenciales (1) I I I A(x, y ) x y y t ( x , y )B x 2 LUCAS & KANADE 1981 Ecuaciones de Euler-Lagrange de minimización de A: Anulación de las derivadas primeras respecto a x y a y : 2 I I I I x y 0 y t x ( x , y )B x I I I I 2 x y 0 y t y ( x , y )B x Lo que conduce a la resolución del sistema lineal: H.v b con xI 2 xI yI H (x, y)BI I (x, y)BI 2 y x y y (x, y)B (x, y)B xI It b (x, y)BI I y t (x, y)B y v = (vx,vy) el desplazamiento buscado. La resolución del sistema (S) está finalmente realizada por un método iterativo, tipo Gauss-Seidel: Inicialización: Para k > 0: UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 vx(0)0;vx(0)0 vx(k) H111 bH12v(yk1); v(yk)H122 bH12vx(k); Antoine MANZANERA – ENSTA/LEI 22 Técnicas diferenciales (1) LUCAS & KANADE 1981 La existencia y la estabilidad de una solución al sistema (S) depende de la matriz H : xI 2 xI yI (x, y)B (x, y)B H I I I 2 x y y (x, y)B (x, y)B NB : Encontraremos de nuevo esta matriz en el capítulo 2 para el cálculo de los puntos de interés… La matriz H debe ser de rango 2 « en el sentido fuerte », es decir poseer 2 autovalores (1,2) grandes. Los autores proponen usar = min(1,2) como índice de confianza en el desplazamiento calculado. Esta propriedad corresponde a una interpretación algebraica del problema de la apertura… UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 23 Rango 0: zona homogénea Zona con poca textura: 2 autovalores débiles Función de apareamiento A Fuentes : Steven Seitz UW-Seattle UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 24 Rango 1: contorno simple Contorno recto: 1 única autovalor grande Función de apareamiento A Fuentes : Steven Seitz UW-Seattle UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 25 Rango 2: punto anguloso Punto anguloso: 2 autovalores grandes Función de apareamiento A Fuentes : Steven Seitz UW-Seattle UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 26 Técnicas diferenciales (2) HORN & SCHUNCK 1981 Explotación directa de la limitación (1) : I ( x, y, t ) I ( x x, y y, t t ) Formula de Taylor ENTONCES: I I I I ( x, y, t ) x y t ... x y t I I v 0 t I ( con Ecuación del movimiento aparente (EMA) I I , ) gradiente espacial x y v (v xt , v ty ) I t Términos de ordenes superiores abandonados incognitas gradiente temporal o: ecuación del flujo óptico UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 27 Interpretación de la EMA (1) Bajo la hipótesis de cierta regularidad del campo y de pequeños desplazamientos, los cambios temporales son equivalentes (a la primera orden) al producto escalar de los cambios espaciales y de la velocidad aparente. (2) Derecha de determinación: vty v v̂ vel. real vel. calculada I ( x, y, t ) apertura subdeterminación (1 ec., 2 inc.) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 vˆ I t I v̂ Antoine MANZANERA – ENSTA/LEI v t x v 28 Resolución de la EMA HORN & SCHUNCK 1981 Resolución de la EMA por agregación de una hipótesis de regularidad. Regularización del problema mal puesto por hipótesis de campo de desplazamiento suave. Minimización de una función de costo: t 2 t 2 t 2 t 2 vx vx v y v y I t t t C( x , y ) (v x , v y ) I v t x y x y 2 EMA REGULARIZACIÓN factor de ponderación UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 29 Resolución de la EMA HORN & SCHUNCK 1981 1. Minimización de una función cuadrática: C( x, y ) (u, v) I xu I y v I t ux2 u y2 vx2 v y2 2 (u,v) componentes del campo (desconocidos) a calcular {Ix, Iy, It} derivadas parciales de la imágen con: {ux, uy,vx, vy} derivadas parciales de los componentes del campo Anulación de las derivadas primeras /u(…) = 0 ; /v(…) = 0 Ecuaciones de Euler-Lagrange de minimización de C: 0 0 2I u I v I I 2 2I x u I y v I t I x 2 u x entonces: y t I u I v I I I u I v I I y u x v v x x y t x u 0 x y t y v 0 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 u x u u u y y v x v v v y y con: Antoine MANZANERA – ENSTA/LEI 2u 2u u 2 2 x y 2v 2v v 2 2 x y laplacianos de u y v 30 Resolución de la EMA 2. ~ ~ fff f = media de f dentro de cierta vecindad (v v~)I x2 I y2 I y I xu~ I y v~ I t (u u~)I 2 I 2 I I u~ I v~ I Approximación del laplaciano: pues: x 3. 2 y Resolución itérativa: x x 1 x ALGORITMO DE HORN & SCHUNCK 2 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 k 1 I y v~ k 1 t 0 • Initialización : vx 2 x I 2 y 0 v0y 0 • Repetir hasta convergencia: I ~ k 1 I ~ k 1 I vx v y x y t I I D x y v v~ k 1 I y con: N I I 1 k Sea, tomando las notaciones originales: I u~ t u u~ k 1 I x I xu~ k 1 I y v~ k 1 I t I x2 I y2 k Método de Gauss-Seidel: y I x I k k 1 ~ vy vy y v xk v~xk 1 2 Antoine MANZANERA – ENSTA/LEI N D N D 31 Estimación multi escala Nivel 2 (1) initialización (2) afinación 1 0 Ventajas: • Cálculo de desplazamientos grandes • Adaptación del nivel de régularización UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 32 Principio del calculo multi escala ALGORITMO POR APAREAMIENTO ALGORITMO DIFERENCIAL (v( sn )tx , v( sn )ty ) arg min n A(t x , y ) (x, y ) x ,y K • Initialización: v(s0 )0x 0 v(s0 )0y 0 • Repetir hasta convergencia: I x I k k 1 ~ v ( s0 ) y v ( s0 ) y y v( s0 ) kx v~ ( s0 ) kx 1 t n1 x v(s ) K (nx , y ) N D N D v(sn1 )ty B(x+x,y+y) 0 • Init. : v(s1 ) x v(s0 )x v(s1 )0y v(s0 )y • Repetir hasta convergencia: I n con: K ( x , y ) vsn 1 x 1 vsn 1 y 2 t UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 t I x I k k 1 ~ v( s1 ) y v ( s1 ) y y v( s1 ) kx v~ ( s1 ) kx 1 Antoine MANZANERA – ENSTA/LEI …/… N D N D 33 Conclusión Capítulo 1 EXPLOTACION DEL FLUJO OPTICO Movimiento dominante Profundidad Tiempo antes colision METODOS POR APAREAMIENTO METODOS DIFERENCIALES Lucas et Kanade Horn et Schunck METODOS MULTI-ESCALA UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 34 Bibliografía Capítulo 1 • B.D. Lucas & T. Kanade 1981 « An iterative image registration technique with an application to stereo vision » International Journal of Computer Vision and Artificial Intelligence 674-679 • B.K.P Horn & B. Schunck 1981 « Determining Optical Flow » Artificial Intelligence 23 185-203 • D.H. Ballard & C.M Brown 1982 « Computer Vision » Prentice Hall (Ch. 3, Ch. 7) • J.M. Jolion & A. Rosenfeld 1994 « A pyramid framework for early vision » Kluwer Academic Publishers Dordrecht, NL • R. Jain, R. Kasturi & B. Schunck 1995 « Machine Vision » McGraw-Hill Inc. (Ch.14) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 35 MOVIMIENTO 2 Registracion y seguimiento INDICE CAPITULO • Registracion: métodos frecuenciales • seguimiento 1 : Harris y Invariantes de Hilbert • seguimiento 2 : SIFT UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 36 Introducción Cuando la amplitud del movimiento es grande, los métodos de estimación por apareamiento o diferenciales están condenadas al fracaso, por 2 motivos principales: (1) El desplazamiento aparente puede ser superior a los períodos espaciales de las imágenes (aliasing temporal, véase el ejemplo a la izquierda) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 37 Introducción (2) La escena está sujeta a distorsiones geométricas complejas que invalidan la hipótesis de traslación local (véase el ejemplo a continuación) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 38 Introducción Por lo tanto: Es esencial disponer de descriptores que sean la mas invariantes posible a las transformaciones geométricas: rotación, homotecia, etc. Esto, inevitablemente, induce un cálculo multi-escala. Los descriptores tendrán carácter mucho menos local, e incluso global, pues ya no tendremos un campo denso como en los métodos de estimación, pero, en el mejor, un campo disperso. Lo que vemos en este capítulo: TRANSFORMACIÓN GLOBAL: Un solo parámetro para toda la imágen (traslación, rotación, homotecia): Métodos frecuenciales. MOVIMIENTO CUALQUIER: ¿ Cuáles son los puntos utilizados para el cálculo ? Puntos de Harris, Maximos locales en el espacio de escala, ... ¿ Qué descriptores utilizar para el apareamiento ? Invariantes diferenciales, histogramas de orientación, ... Aplicaciones: Reconocimiento de objetos, indexación de imágenes, ubicación de los robots,… UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 39 Técnicas frécuenciales Las técnicas frecuenciales de estimacion de movimiento entre dos imágenes se basan en la equivalencia traslación / cambio de fase de la transformada de Fourier: Recuerde: la expresión de una imagen en el dominio frecuencial consiste en descomponer la función de dos dimensiones en sumas de funciones senos complejas: Los coeficientes de los diferentes senos se calculan por la transformada de Fourier: Notacion (modulo, fase) : 1 w1 h 1 I ( x, y ) F (u, v)e 2i (ux vy) / wh wh u 0 v 0 w1 h 1 F (u, v) I ( x, y)e 2i (ux vy) / wh x 0 y 0 Transformada de Fourier discreta inversa Transformada de Fourier discreta directa F (u, v) F (u, v) eiF (u,v) Propriedad de traslacion/cambio de fase: si F es la Transformada de Fourier (TF) de I : I ( x, y ) TF F (u , v) Entonces la TF de I traslada de (-x,-y), es G, con: I ( x x, y y) TF G(u, v) F (u, v)e2i (uxvy ) / wh pues: G(u, v) F (u, v) La diferencia de fase entre F y G es: y: G (u, v) F (u, v) 2 (ux vy) / wh (u, v) 2 (ux vy) / wh Por lo tanto, es suficiente en teoría considerar esta diferencia de fase para 2 parejas (u, v), para calcular (x, y), pero esta técnica es sensible al ruido y a los cambios de iluminación que inducen cambios en las frecuencias bajas. Se utiliza más bien la técnica de correlación de fase. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 40 Correlación de fase La técnica de correlacion de fase explota una consecuencia directa de la propiedad de la traslación / cambio de fase. Si F es la TF de I y G la TF de I traslada de (-x,-y), entonces la diferencia entre F y G es igual a su espectro de potencia cruzado normalizado (PSNA), es decir, : * F (u , v)G (u, v) F * (u , v)G (u, v) e 2 i ( ux vy ) / wh La TF inversa del PSNA es igual entonces a la function de Dirac del vector de traslacion: δx,y(x, y) La técnica de correlacion de fase consiste entonces en: 1. 2. 3. 4. Calcular las TF de I(x,y,t) y I(x,y,t+1), sea F1 et F2 Calcular c el PSNA de F1 y F2 Calcular D la TF inversa de c Buscar al maximo de D Correlacion de fase (INRIA) Ventajas y inconvenientes + Robusto por qué todas las frecuencias contribuyen al calculo + Relativamente rapido gracia al calculo de la FFT - En practica limitado a un desplazamiento global sobre la imagen entera UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 41 Invariantes de Fourier-Mellín El uso de la transformada de Fourier-Mellin permite calcular los parámetros de una similitud (homotecia y rotación) como un vector de traslacion de una manera similar al caso anterior, a través de una representacion log-polar del espacio de frecuencias espaciales (u,v) (q, log r): Sea g la imagen transformada de f por una rotacion de angulo , una homotecia de razon s, y una traslacion de vector (x0,y0): g ( x, y) f s cosx sin y x0 ,s sin x cosy y0 Los modulos de las transformadas de Fourier de f y g son vinculados por la relacion siguiente: G u, v 1 s2 F s1 u cos v sin , s1 u sin v cos • no depende de la traslacion (x0,y0). Pues el modulo: • sufre une rotacion de angulo . • sufre un cambio de escale de factor 1/s. Pasando las frecuencias en coordenadas polares: Fp q , r F r cosq , r sin q ;0 q 2 ,0 r G p q , r G r cosq , r sin q ;0 q 2 ,0 r tenemos: G p q , r Por fin, pasando la coordenada radial al logaritmo: r log r s logs Flp q , r Fp q , r Glp q , r G p q , r r Fp q , s s 1 2 tenemos: Glp q , r 1 s2 Flp q , r s Entonces la similitud en el dominio espacial se traduce por una traslacion en el espacio de frecuencias log-polares. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 42 Invariantes de Fourier-Mellín q correlacion de fase (SPOMF) FMI log r q FMI log r Un ejemplo de uso de la transformada de Fourier-Mellin: cálculo de la posición de la cabeza de robots Aibo en la imagen por correlación de fase de los invariantes de Fourier-Mellin. (FMI-SPOMF : Fourier-Mellin Invariant Symmetric Phase Only Matched Filtering) : J.C. Baillie et M. Nottale 2004. ! La información de fase en la imagen original se pierde en el FMI. El FMI-SPOMF equivale a buscar la mejor (rotación, homotecia) que pone en correspondancia los 2 espectros de amplitud. Por lo tanto, no refleja los parámetros de traslación entre las dos imágenes, y además, la información llevada por la fase ya no existe. Para completar esta transformación, podemos aplicar una correlación de fase clásica sobre la pareja de imagens iniciales, después de aplicarse a una de las imágenes la transformacion (rotación, dilatación) proporcionado por el FMI-SPOMF. Por último, observe que, al igual de la correlación de fase, este método se utiliza en la práctica para estimar las transformaciones globales, porque utiliza la contribución de todo el espectro (o por lo menos de una gran parte del mismo), lo que supone una importante extensión espacial de los píxeles usados para estimar cada transformación. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 43 Deteccion de puntos de interés Los puntos de interés (o puntos angulosos, puntos salientes,...), son puntos que « contienen gran cantidad de información » en relación con la imagen. Son los puntos al vecindad de los cuales la imagen varía considerablemente en varias direcciones. Una medida de las variaciones locales de la imagen I en el punto (x,y) asociada a un desplazamiento (x,y) es la funcion de autocorrelacion: c ( x, y ) ( x,y ) I x , y I x xk , y k W k k x, yk y 2 k W ( x, y ) Donde W es una ventana centrada en el punto (x,y). W+ Pues, usando una aproximacion de la primera orden: I xk x, yk y I xk , yk I x xk , yk I y x y xk , yk Entonces: c ( x, y) xk , yk W I x xk , yk I y x xk , yk y 2 xI xk , yk 2 xk , yk W x y xI xk , yk yI xk , yk xk , yk W x , y x , y x I x xk , yk W k I y k k k x , y I y xk , yk W 2 k k y ( x, y ) Matriz de autocorrelacion de la imagen I en (x,y) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 44 Deteccion de puntos de interés xk , yk ( x, y ) xI xk , yk yI xk , yk xk , yk W I x xk , yk W 2 x , y x , y I x xk , yk W k I y xk , yk W k I y k xk , yk 2 k La matriz de autocorrelacion representa la variacion local de la imagen I en (x,y). (x,y) sera considerado punto de interés de I si para todos los desplazamientos (x,y), la cuantidad (x,y).(x,y).(x,y)t es grande. Los puntos de interés son los puntos (x,y) para los cuales la matriz de autocorrelacion (x,y) tiene dos autovalores grandes. Esto corresponde a los puntos para los cuales existe localmente una base de autovectores de describiendo variaciones locales importantes de la imagen. El detector de Harris calcula una funcion de interés Q(x,y) : Q( x, y ) det traza El primer término corresponde al producto de las autovalores, el segundo término penaliza los puntos de contorno con una sola forte autovalor grande. Los puntos de interés corresponden a los maximos locales de la funcion Q cuya valor supera un cierto umbral (tipicamente el 1% de la valor maxima de Q). [Harris 88] UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 45 Utilización de los invariantes diferenciales Objetivo : representar los puntos de interes por indices que sean invariantes por rotacion y cambio de escala. El principio usado aqui es basado sobre el calculo de las derivadas multi escala: s Lij I * Gij El «local jet » de I : Se denota: s s Gij con: L ;0 i j 3 L, L , L , L s ij x y xx i j x i y j G s y: s G ( x, y) , Lxy , Lyy , Lxxx, Lxxy , Lxyy , Lyyy 1 2s 2 exp x2 y 2 2s 2 (derivadas hasta la orden 3) La idea es combinar estas derivadas para obtener cuantidades invariantes por rotacion: Por ejemplo, el laplaciano Ixx + Iyy es invariante por rotacion: y Y X x = X cos + Y sin X = x cos + y sin y = X sin – Y cos Y = –x sin y cos IX = Ix cos + Iy sin x IY= Ix sin – Iy cos y: IXX = Ixx cos2 + 2Ixy cos sin + Iyy sin2 IYY = Ixx sin2 – 2Ixy cos sin + Iyy cos2 entonces: IXX + IYY = Ixx + Iyy UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 46 Utilización de los invariantes diferenciales Asi se puede construir una familia de cuantidades invariantes por rotacion: los invariantes diferenciales de Hilbert. L Li Li Li Lij L j Lii Lij Lij ij L jkl Li Lk Ll L jkk Li Ll Ll L L L L L L L L ijk i j k ijj j k k ij L jkl Li Lk Ll Lijk Li L j Lk xx yy 0 xy yx 1 Con: (notaciones de Einstein: sumacion sobre los indices), por ejemplo: 2 Li Lij L j Lx Lxx Lx 2Lx Lxy Ly Ly Lyy Ly 7 ij L jkl Li Lk Ll Lxxy Lx Lx Lx 2 Lx Ly Ly Lxyy 2 Lx Lx Ly Ly Ly Ly Lyyy Lx Ly Ly Lxxx Lx Lx Ly NB: ¡ invariancia por rotacion del nucleo gausiano ! Asi, los vectores son calculados por todos los puntos de interés a diferentes escalas, y apareados utilizando una distancia (e.g. distancia euclidiana). [Schmid et Mohr 97] UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 47 Espacio de escalas gausiano y derivadas escala gs ( x) s1 exp x 2 s gs I UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 2 gs x 2 g s x I x I I I x y 2 2 Antoine MANZANERA – ENSTA/LEI 2I x 2 n I gs I n gs 2I xy I 2I x 2 2I y 2 48 Aplicación del detector de Harris 1. Se calcula las dérivadas primeras a partir de convoluciones con derivadas de gausiana (desviacion estandar s1) 2. Se calcula los componentes de la matriz de autocorrelacion calculando una media local de las derivadas bajo la forma de una gausiana (desviacion estandar s2, tipicamente s2 = 2 s1) 3. Se calcula la funcion de interés: Q = det() – traza() (tipicamente = 0,06). 4. Se calcula los maximos locales de Q superiores a un cierto umbral (tipicamente el 1% de Qmax). s1 es el parametro de escala del detector de Harris, determinando la amplitud espacial de las operaciones de derivacion y integracion (media). UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 49 Detector de Harris multi escala s=1 s=3 s=2 Puntos de Harris obtenidos calculando las derivadas primeras por convolucion con una derivada de gausiana de desviacion estandar s. s=5 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI s = 10 50 Detector SIFT: extrema en el espacio de escala G0 G1 L1 escala Lk+1(x,y) Lk(x,y) Lk-1(x,y) UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 G2 L2 G3 L3 La funcion Gk(x,y) = G(x,y,ks) es la imagen suavizada por una gausiana de desviacion estandar ks. Las funciones Lk(x,y) corresponden a la diferencia (normalizada aqui) entre 2 gausianas consecutivas. La funcion Lk(x,y) es una representacion laplaciana de la imagen, es decir una decomposicion frecuencial localizada: contribucion de las estructuras de escala (tamaño) ks en el punto (x,y). Los puntos seleccionados por SIFT son los maximos y minimos locales de la funcion Lk(x,y), a la vez en la escala corriente y en las escalas adyacentes (vease a la izquierda). Antoine MANZANERA – ENSTA/LEI 51 Puntos de interés SIFT Por cada extremo del espacio de escala de las diferencias de gausianas (punto de interés SIFT), se calcula la direccion asociada de la manera siguiente: G sy ( x, y ) q ( x, y ) arct an s G x ( x, y ) con Gxs ( x, y) x G( x, y,s ) I ( x, y) * x gs ( x, y) (donde s es la escala seleccionada) Al la izquierda, puntos de interés SIFT: la direccion de la flecha representa la direccion q et su largura la escala s asociada. Imagen 1: 589 puntos detectados. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 52 Descriptor SIFT: histograma de orientacion Los descriptores asociados a los puntos SIFT son histogramas de las orientaciones locales alrededor del punto. • Se divide el espacio alrededor de cada punto de interés (x,y) en N2 cuadrados 4x4. • Se calcula el gradiente (Gx(a,b,s), Gy(a,b,s)) para los 4x4xN2 puntos (a,b). • Para cada cuadrado 4x4, se calcula un histograma de las orientaciones cuantifiadas en 8 direcciones, ponderando los valores por: (1) el modulo del gradiente (2) la inversa de la distancia al punto de interés (x,y). • Para lograr invariancia en rotacion: la orientacion local del punto de interés q(x,y) esta usada como origen (orientacion nula) de los histogramas. Pues los descriptores formados son vectores de tamaño 8xN2, que seran apareados usando una distancia (e.g. distancia euclidiana) Ej: N = 2 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 53 Apareamiento por SIFT Resultado de apareamiento por SIFT entre la imagen (2) a la izquiera, 510 puntos detectados, y la imagen (1) a la derecha, 589 puntos detectados. 51 puntos fueron apareados, lo que corresponde a una distancia euclidiana entre los descriptores por debajo de cierto umbral. UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 54 Conclusión Capítulo 2 REGISTRACIÓN: Movimiento global Correlacion de fase: traslación Invariantes de Fourier-Mellin: rotación / escalamiento SEGUIMIENTO Puntos de interés Harris: puntos angulosos SIFT: extremos en el espacio de escala Descriptores Invariantes diferenciales Histogramas de orientación UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 55 Bibliografía del Capítulo 2 • H. Foroosh, J. Zerubia & M. Berthod 2002 « Extension of phase correlation to subpixel registration » IEEE Transactions on Image Processing 11(3) pp 188-200 • Q. Chen, M. Defrise & F. Deconinck 1994 « Symmetric Phase-Only Matched Filtering of Fourier-Mellin Transforms for Image Registration and Recognition » IEEE Transactions on Pattern Analysis and Machine Intelligence 16(12) pp 1156-1168 • C. Harris & M. Stephens 1988 « A combined corner and edge detector » Alvey Vision Conference pp 147-151 • C. Schmid & R. Mohr 1997 « Local grayvalue invariants for image retrieval » IEEE Transactions on Pattern Analysis and Machine Intelligence 19(5) pp 530-534 • D.G. Lowe 2004 « Distinctive Image Features from Scale-Invariant Keypoints » International Journal of Computer Vision 60-2 pp 91-110 UNAL – Maestría Ingeniería Bio-médica Bogotá 2008 Antoine MANZANERA – ENSTA/LEI 56