Un instituto futurista tiene como objetivo preservar (y recrear) las voces de las personas utilizando inteligencia artificial.
Los investigadores que participan en la iniciativa "banco de voces" esperan cambiar la vida de todas las personas que pierden la voz como resultado de una enfermedad o un accidente. Perder la voz no es exactamente como tener una baja momentánea del sonido o una ronquera. La pérdida de la voz es en parte la pérdida de identidad.
Todo comenzó a partir de una colaboración entre Northeastern University of Boston y el Vocales D.. Es importante proporcionar a aquellos que pierden el uso del habla una forma de conservar el sentido de su identidad después de un cáncer de garganta o una enfermedad degenerativa. Este proyecto les permitirá "hablar" utilizando una forma sintética muy similar a su propia voz.
Es el primer centro de este tipo, y será dirigido por el prof. Rupal Patel, fundador y CEO de VocaliD.
La compañía ya ofrece dicho servicio para individuos, dice Patel, pero muchas personas carecen de equipos de calidad suficiente para muestrear adecuadamente las voces. La creación de un "banco de voces" permite a los futuros pacientes retener su voz cuando todavía tienen la oportunidad.
"A menudo los pacientes acuden a nosotros en el último momento", dados. “No tienen suficiente tiempo para mantener su voz porque están a merced de enfermedades, operaciones y más. Y es muy frustrante ”.
El banco de voces
El resultado fue la colaboración con Northeastern para difundir la tecnología al público. El corazón del proyecto es la Clínica de Preservación de Voz, un centro donde los pacientes en riesgo de perder su voz pueden registrarla para protegerla.
El enfoque es mucho más complicado que los basados en síntesis de voz tradicionales: Un algoritmo de aprendizaje automático reconstruye ligaduras, fonemas e incluso ritmo en relación con la respiración. En una cabina especial, se graban pequeñas historias, poemas o conversaciones sobre diferentes temas. Alguien incluso bromeó acerca de perder la voz, una forma autocrítica de lidiar con un gran miedo.
“Lo que se necesita son unas dos o tres horas de charla. A partir de estas grabaciones, nuestra inteligencia artificial es capaz de generar un motor de voz que tiene el mismo sonido. Es como devolver la voz a quien la ha perdido ”.
La voz regenerada se puede usar como síntesis de voz para hablar mediante la conversión de textos escritos, y se puede integrar mañana con software que genera palabras, imágenes o acciones a partir de caminos mentales.
Una mejora muy rápida.
La tecnología, dice Patel, está mejorando rápidamente, y pronto podrá reproducir un discurso que no se puede distinguir del lenguaje humano.
El equipo también podrá "envejecer" la voz para adaptarla a la edad de la persona, mientras que todavía no es posible "hacer crecer" la voz de un niño transformándola en un adulto.