XIX Verano de la Investigación Científica y Tecnológica del Pacífico SERVICIO

Anuncio
XIX Verano de la Investigación Científica y Tecnológica del Pacífico
DETECCIÓN DE MANOS USANDO DESCRIPTORES HOG PARA ROBOTS DE
SERVICIO
Fernando Arturo Sanchez Carmona Ingeniería en Sistemas Computacionales del Instituto
Tecnológico Superior de Ciudad Constitución, fasc_15@hotmail.com, Asesor Dr. Iván Vladimir
Meza Ruiz Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la
Universidad Nacional Autónoma de México, ivanvladimir@turing.iimas.unam.mx.
A) Planteamiento del problema
De manera natural, somos capaces de identificar objetos en el ambiente por medio de
nuestra visión, es decir, un conjunto de información que es recabada por la vista para
luego ser procesada en el cerebro. De forma similar, se ha querido emular esta habilidad
de ver y detectar objetos de forma artificial. Durante años se ha estado trabajando en la
mejor técnica que pueda ayudar a resolver dicho problema. Actualmente, en el Instituto
de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM, se
están investigando las formas en las que el robot de servicio Golem-II+ pueda adquirir
nuevas habilidades de visión, como la detección de manos.
B) Metodología
Para la detección de manos es necesario, primeramente, contar con ejemplos positivos y
negativos de imágenes con manos (al menos 5000 imágenes), posteriormente se extrae
información importante utilizando HOG (Histogram of Oriented Gradients), el cual
consiste en una técnica de división de la imagen en bloques distribuidos a lo largo y
ancho de la misma. Cada bloque se divide en celdas sobre los cuales se calcula la
magnitud y orientación de los gradientes en cada píxel. Los gradientes miden el cambio
relativo entre dos puntos. De cada bloque se calcula el HOG promediando la agrupación
de los vectores con ángulos similares. De esto se obtiene un vector que se denomina
descriptor HOG de la imagen. Hecho esto, se utiliza, para la clasificación de los vectores
de características (descriptor HOG), máquinas de clasificación basadas en soporte
vectorial (SVM). SVM clasifica muestras en dos posibles conjuntos, para este caso los
conjuntos son manos y no manos.
C) Conclusiones generales
La utilización de métodos HOG y SVM, nos ofrece una metodología robusta en cuanto a
detección de elementos en imágenes orientado a la visión computacional, ya que no
importa tanto factores como diferencia de iluminación en las imágenes, HOG normaliza
de cierta forma las condiciones de la imagen. Con esto podemos entrenar el algoritmo
de clasificación SVM, con base en ejemplos positivos (manos) y ejemplos negativos (no
manos), y así obtener un clasificador que logre hacer una distinción entre ambos
conjuntos.
© Programa Interinstitucional para el Fortalecimiento de la Investigación y el Posgrado del Pacífico
Agosto 2014
Descargar