UNIVERSIDAD DEL PAÍS VASCO

Desarrollará un software de Reconocimiento Automático del Habla que potenciará la accesibilidad a los vídeos de las sesiones plenarias

La de la UPV/EHU ha llegado a un acuerdo con el Parlamento Vasco para la financiación de una investigación aplicada que permitirá tanto subtitular los vídeos que actualmente se ofrecen a través de la web de la Cámara, como realizar búsquedas en su contenido. Se trata de un proyecto de carácter pionero, en el que se aplicarán tecnologías de reconocimiento automático del habla para transcribir las intervenciones de los oradores.

Los trabajos de investigación y desarrollo comenzarán en los próximos días del presente mes de septiembre y se extenderán a lo largo de dos años. Inicialmente, en una primera fase comprendida entre septiembre y diciembre de 2010, el Grupo de Trabajo en Tecnologías Software, integrado en el Departamento de Electricidad y Electrónica de la Facultad de Ciencia y Tecnología (UPV/EHU), comenzará la prestación de un primer servicio en periodo de pruebas.

La aplicación inicial consistirá en el subtitulado de los videos de las sesiones plenarias, sincronizándolos automáticamente con el texto de las actas de las sesiones. “Posteriormente -puntualiza el profesor Germán Bordel, director del grupo de trabajo- con el proyecto lo que se pretende es que la transcripción automática de voz a texto sea cada vez más precisa posibilitando la búsqueda y posicionamiento en puntos concretos de los videos. La existencia de actas transcritas nos permitirá valorar los avances en la calidad del sistema”.

Estos trabajos parten de la aplicación de un sistema ya desarrollado del que uno de los aspectos más innovadores consiste en que “entiende” los idiomas euskera y castellano no como composición de dos reconocedores sino como uno único. Técnicamente esta es una diferencia cualitativa frente a una aproximación estándar y permite transcribir discursos en los que los dos idiomas se entremezclan de cualquier modo, aunque se intercalen fragmentos en un idioma dentro de frases en el otro.

La mencionada primera fase de subtitulado de videos, se enmarca en la atención a la accesibilidad para personas discapacitadas y en consecuencia la Mesa ha considerado hacerlo público como muestra de su responsabilidad al respecto. Así, el pasado mes de julio, la presidenta del Parlamento vasco, Arantza Quiroga, presentó el sistema automático de reconocimiento de voz, que facilita el acceso de las personas sordas al debate político, en el marco de la reunión del Grupo de Trabajo E-Democracia del Comité Permanente de la Conferencia de Asambleas Legislativas de Regiones en Europa (CALRE).

Los presidentes de los Parlamentos Regionales Europeos que forman parte de este grupo de E-Democracia tienen entre sus retos el de favorecer la integración y participación política de los ciudadanos con algún tipo de discapacidad. El Parlamento vasco ha mostrado el liderazgo en este aspecto, dando a conocer al mismo tiempo las tecnologías que en este campo se desarrollan en la UPV/EHU.

El Grupo de Trabajo de Tecnologías Software de la Facultad de Ciencia y Tecnología de la UPV/EHU centra su trabajo en diversos aspectos (tanto teóricos como aplicados) del reconocimiento automático del habla: transcripción automática de voz a texto, identificación de personas, reconocimiento de la lengua, búsquedas en recursos hablados, etc.