EN | EU | ES

Aholab Signal Processing Laboratory

Aholab Signal Processing Laboratory es un grupo con gran experiencia en todos los campos de las tecnologías del habla. Mantiene relaciones estables con buen número de empresas y centros tecnológicos y cuenta con un amplio historial de transferencia de tecnología. Integrado por ingenieros/as especialistas en el tratamiento digital de señales de voz/audio, su actividad se articula en torno a los siguientes ámbitos de aplicación de las tecnologías del habla:
 
Discapacidad
Será una línea prioritaria, ya que las personas con incapacidad para producir mensajes hablados (más de 410.000 en España y el 0.4% de la población europea, según datos del INE y Eurostat, respectivamente) quedan habitualmente excluidas del foco del mercado. Aholab cuenta con tecnología para el despliegue de un banco de voces que permita a sus usuarios obtener una voz artificial personalizada, así como con una serie de aplicaciones Android que facilitan el uso de las voces personalizadas en cualquier entorno. Las siguientes tareas a realizar, de naturaleza muy aplicada, consisten en implantar el banco de voces como parte del protocolo de atención del Hospital de Cruces y evaluar la usabilidad de las aplicaciones en un trabajo conjunto con el Hospital de Basurto. Esto dará previsiblemente lugar a la aparición de nuevos retos. Por otra parte, de nuevo en colaboración con hospitales, se realizará investigación básica en técnicas que mejoren la inteligibilidad del habla esofágica (la producida por personas laringectomizadas) o disártrica (la producida por personas que no pueden articular el habla por transtornos neuromotores o fisiológicos), transformándola en tiempo real para compensar los síntomas de las respectivas patologías. Se estudiarán también técnicas de reconocimiento automático de habla robustas frente a este tipo de voces a fin de mejorar la comunicación de este colectivo también con máquinas. Por último se investigará la generación de voz a partir de otras señales (activación muscular, posición de órganos articuladores detectada magnéticamente, etc.).
 
Enseñanza
Las tecnologías del habla tienen una presencia cada vez mayor en el ámbito de la enseñanza no presencial, sobre todo la de segundas lenguas. Durante los últimos años se vienen desarrollando herramientas para la evaluación de la pronunciación y la verificación de enunciados basadas en tecnologías de reconocimiento de voz. Actualmente se está en disposición de transferir estas herramientas a agentes del sector para su uso y/o comercialización. Las tareas previstas son fundamentalmente de integración y evaluación, si bien cabe la posibilidad de comenzar nuevos trabajos en la medida en que se aprecien necesidades en el sector.
 
Lengua y cultura vasca
Aholab desempeña un papel protagonista en la obtención de recursos y el desarrollo de tecnologías del habla para el euskera. Como nueva línea, durante el último año se ha comenzado a estudiar la síntesis de voz cantada, en general, y del género de la Bertsolaritza en particular, habiendo recopilado para ello bases de datos con material adecuado. Se llevará a cabo una tesis doctoral en esta línea (en curso).
 
Seguridad
Dado el creciente interés por la seguridad y protección de datos, se inauguró recientemente una línea específica de trabajo. Se ha desarrollado un sistema de detección de voz sintética que, complementando al reconocimiento biométrico tradicional, evita suplantaciones de identidad por medio de voces artificiales transformadas. Se ha desarrollado también una técnica de inserción de bits de información en señales de voz de manera imperceptible para el usuario. El siguiente paso previsto es usar transformaciones de voz para ?anonimizar? grabaciones, insertando de manera oculta en el audio la información necesaria para revertir la transformación y recuperar la voz original. Entre las aplicaciones de tal sistema se encontrarían, por ejemplo, las comunicaciones seguras y la protección de identidad de los pacientes en hospitales.

Institution: 
University of the Basque Country (UPV/EHU)

Science Field: 
Engineering & Technology

RIS3 priorities: 
Advanced manufacturing

Keywords: 
Tratamiento digital de la señal; reconocimiento de voz; síntesis de voz; voz esofágica y traqueoesofágica

Main Research Lines: 
Tecnologías del habla y discapacidad
Generación

Main Researcher: 
Hernáez Rioja, Inmaculada

Address: 
Escuela Técnica Superior de Ingeniería