Un instituto futurista tiene como objetivo preservar (y recrear) las voces de las personas utilizando inteligencia artificial.
Los investigadores involucrados en la iniciativa "banco de voces" esperan cambiar la vida de todas las personas que se encuentran perdiendo la voz como resultado de enfermedades o accidentes. Perder la voz no es realmente como tener una disminución momentánea del sonido o una ronquera. La pérdida de la voz es en parte la pérdida de la identidad.
Todo comenzó a partir de una colaboración entre Northeastern University of Boston y el Vocales D.. Es importante proporcionar a aquellos que pierden el uso del habla una forma de conservar un sentido de su identidad después de un cáncer de garganta o una enfermedad degenerativa. Este proyecto les permitirá "hablar" utilizando una forma sintética muy similar a su propia voz.
Es el primer centro de este tipo, y será dirigido por el prof. Rupal Patel, fundador y CEO de VocaliD.
La compañía ya ofrece este servicio para individuos, dice Patel, pero muchas personas carecen de equipos de calidad suficiente para muestrear voces de manera adecuada. La construcción de un "banco de voz" permite a los futuros pacientes mantener su voz cuando todavía tienen la oportunidad.
"A menudo, los pacientes acuden a nosotros en el último momento", dados. “No tienen suficiente tiempo para mantener su voz porque están a merced de enfermedades, operaciones y más. Y es muy frustrante".
El banco de voces
El resultado fue la colaboración con Northeastern para difundir la tecnología al público. El corazón del proyecto es la Clínica de Preservación de Voz, un centro donde los pacientes en riesgo de perder su voz pueden registrarla para protegerla.
El enfoque es mucho más complicado que los basados en síntesis de voz tradicionales: Un algoritmo de aprendizaje automático reconstruye ligaduras, fonemas e incluso ritmo en relación con la respiración. En una cabina especial, se graban pequeñas historias, poemas o conversaciones sobre diferentes temas. Alguien incluso bromeó acerca de perder la voz, una forma autocrítica de lidiar con un gran miedo.
“Lo que se necesita son unas dos o tres horas de hablar. A partir de estas grabaciones nuestra inteligencia artificial es capaz de generar un motor de voz que tiene el mismo sonido. Es como devolver la voz a quien la ha perdido”.
La voz regenerada se puede usar como síntesis de voz para hablar mediante la conversión de textos escritos, y se puede integrar mañana con software que genera palabras, imágenes o acciones a partir de caminos mentales.
Una mejora muy rápida.
La tecnología, dice Patel, está mejorando rápidamente, y pronto podrá reproducir un discurso que no se puede distinguir del lenguaje humano.
El equipo también podrá "envejecer" la voz para adaptarla a la edad de la persona, mientras que aún no es posible "hacer crecer" la voz de un niño transformándola en un adulto.