XIX Verano de la Investigación Científica y Tecnológica del Pacífico DETECCIÓN DE MANOS USANDO DESCRIPTORES HOG PARA ROBOTS DE SERVICIO Fernando Arturo Sanchez Carmona Ingeniería en Sistemas Computacionales del Instituto Tecnológico Superior de Ciudad Constitución, [email protected], Asesor Dr. Iván Vladimir Meza Ruiz Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la Universidad Nacional Autónoma de México, [email protected]. A) Planteamiento del problema De manera natural, somos capaces de identificar objetos en el ambiente por medio de nuestra visión, es decir, un conjunto de información que es recabada por la vista para luego ser procesada en el cerebro. De forma similar, se ha querido emular esta habilidad de ver y detectar objetos de forma artificial. Durante años se ha estado trabajando en la mejor técnica que pueda ayudar a resolver dicho problema. Actualmente, en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM, se están investigando las formas en las que el robot de servicio Golem-II+ pueda adquirir nuevas habilidades de visión, como la detección de manos. B) Metodología Para la detección de manos es necesario, primeramente, contar con ejemplos positivos y negativos de imágenes con manos (al menos 5000 imágenes), posteriormente se extrae información importante utilizando HOG (Histogram of Oriented Gradients), el cual consiste en una técnica de división de la imagen en bloques distribuidos a lo largo y ancho de la misma. Cada bloque se divide en celdas sobre los cuales se calcula la magnitud y orientación de los gradientes en cada píxel. Los gradientes miden el cambio relativo entre dos puntos. De cada bloque se calcula el HOG promediando la agrupación de los vectores con ángulos similares. De esto se obtiene un vector que se denomina descriptor HOG de la imagen. Hecho esto, se utiliza, para la clasificación de los vectores de características (descriptor HOG), máquinas de clasificación basadas en soporte vectorial (SVM). SVM clasifica muestras en dos posibles conjuntos, para este caso los conjuntos son manos y no manos. C) Conclusiones generales La utilización de métodos HOG y SVM, nos ofrece una metodología robusta en cuanto a detección de elementos en imágenes orientado a la visión computacional, ya que no importa tanto factores como diferencia de iluminación en las imágenes, HOG normaliza de cierta forma las condiciones de la imagen. Con esto podemos entrenar el algoritmo de clasificación SVM, con base en ejemplos positivos (manos) y ejemplos negativos (no manos), y así obtener un clasificador que logre hacer una distinción entre ambos conjuntos. © Programa Interinstitucional para el Fortalecimiento de la Investigación y el Posgrado del Pacífico Agosto 2014