UNIVERSIDAD DE

– Actualmente, las búsquedas y clasificaciones en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual que contienen

– Esta técnica pionera, desarrollada en la UGR, permite clasificar fotos o imágenes según aparezcan o no personas en ellas, o algún tipo objeto concreto

Investigadores de la Universidad de Granada han desarrollado una nueva técnica informática que permite “enseñar” al ordenador a interpretar el contenido visual de una imagen en movimiento o una fotografía. Este avance permitiría, por ejemplo, clasificar de forma automática fotografías según aparezcan o no personas en ellas, o algún tipo de objeto concreto, o clasificar escenas de vídeo donde aparecen personas con una pose determinada.

En la actualidad, las búsquedas y clasificaciones de fotografías en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual contenida en ellas. El trabajo realizado en la Universidad de Granada permite utilizar este parámetro, y a corto plazo hará que estas técnicas se puedan usar para clasificar escenas de vídeo según la acción que realizan en ellas las personas.

La investigación ha sido llevada a cabo por Manuel Jesús Marín Jiménez, que actualmente trabaja en la Universidad de Córdoba, y dirigida por el profesor Nicolás Pérez de la Blanca Capilla, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.

Una pose concreta

Además de detectar cuándo aparecen personas en fotogramas de vídeos o películas de TV, estas nuevas técnicas permiten estimar la posición de sus miembros superiores (cabeza, torso, brazos y antebrazos), así como llevar a cabo una clasificación automática de escenas de vídeo donde aparecen personas con una pose concreta, y reconocer acciones humanas en secuencias de vídeo, tales como caminar, saltar, agacharse….

Como explica Marín Jiménez, en la actualidad existe, a nivel mundial, un gran interés, por parte de multitud de compañías potentes como Microsoft o Google, en conseguir que los computadores sean capaces de interpretar de forma automática el contenido visual de las imágenes y vídeo. “Nuestro trabajo –afirma el - presenta pequeñas aportaciones para avanzar en ese ambicioso problema”.

Los de esta investigación han sido presentados en importantes congresos internacionales, como el International Conference in Pattern Recognition (ICPR) en 2006, o el Computer Vision and Pattern Recognition (CVPR) en 2008 y 2009. Parte de dichos trabajos han sido desarrollados en colaboración con investigadores de la University of y el ETH de Zurich.

 

 

Imágenes ilustrativas:
– Detección de personas en TV:
http://www.robots.ox.ac.uk/~vgg/software/UpperBody/index.html
– Estimación y reconocimiento de poses humanas:
http://www.robots.ox.ac.uk/~vgg/research/pose_estimation/index.html