UNIVERSIDAD DE GRANADA

– Actualmente, las búsquedas y clasificaciones en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual que contienen

– Esta técnica pionera, desarrollada en la UGR, permite clasificar fotos o imágenes según aparezcan o no personas en ellas, o algún tipo objeto concreto

Investigadores de la Universidad de Granada han desarrollado una nueva técnica informática que permite “enseñar” al a interpretar el contenido visual de una imagen en movimiento o una fotografía. Este avance permitiría, por ejemplo, clasificar de forma automática fotografías según aparezcan o no personas en ellas, o algún tipo de objeto concreto, o clasificar escenas de vídeo donde aparecen personas con una pose determinada.

En la actualidad, las búsquedas y clasificaciones de fotografías en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual contenida en ellas. El trabajo realizado en la Universidad de Granada permite utilizar este parámetro, y a corto plazo hará que estas técnicas se puedan usar para clasificar escenas de vídeo según la acción que realizan en ellas las personas.

La investigación ha sido llevada a cabo por Manuel Jesús Marín Jiménez, que actualmente trabaja en la Universidad de Córdoba, y dirigida por el profesor Nicolás Pérez de la Blanca Capilla, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.

Una pose concreta

Además de detectar cuándo aparecen personas en fotogramas de vídeos o películas de TV, estas nuevas técnicas permiten estimar la posición de sus miembros superiores (cabeza, torso, brazos y antebrazos), así como llevar a cabo una clasificación automática de escenas de vídeo donde aparecen personas con una pose concreta, y reconocer acciones humanas en secuencias de vídeo, tales como caminar, saltar, agacharse….

Como explica Marín Jiménez, en la actualidad existe, a nivel mundial, un gran interés, por parte de multitud de compañías potentes como Microsoft o Google, en conseguir que los computadores sean capaces de interpretar de forma automática el contenido visual de las imágenes y vídeo. “Nuestro trabajo –afirma el investigador- presenta pequeñas aportaciones para avanzar en ese ambicioso problema”.

Los resultados de esta investigación han sido presentados en importantes congresos internacionales, como el International Conference in Pattern Recognition (ICPR) en 2006, o el Computer Vision and Pattern Recognition (CVPR) en 2008 y 2009. Parte de dichos trabajos han sido desarrollados en colaboración con investigadores de la University of Oxford y el ETH de Zurich.

 

 

Imágenes ilustrativas:
– Detección de personas en TV:
http://www.robots.ox.ac.uk/~vgg/software/UpperBody/index.html
– Estimación y reconocimiento de poses humanas:
http://www.robots.ox.ac.uk/~vgg/research/pose_estimation/index.html