Investigadores de la Universidad de California en San Diego construyeron recientemente un sistema de aprendizaje automático que predice qué pájaros están a punto de cantar.
Si no encuentra grandes posibilidades prácticas, empiezo por decirle que la síntesis de voz predictiva en tiempo real para prótesis de voz ya sería una gran cosa. Pero las implicaciones de comprender el canto de los pájaros podrían ir mucho más allá.
El canto de los pájaros, un mundo extremadamente articulado
El canto de los pájaros es una forma compleja de comunicación que involucra ritmo, tono y, lo más importante, comportamientos aprendidos.
Según los investigadores, enseñar a una IA a comprender (y ser capaz de construir lo suficiente para anticipar) el canto de los pájaros es un paso valioso en el camino hacia la sustitución de las vocalizaciones humanas biológicas.
Las prótesis motoras utilizaron primates como modelo animal. No existe un modelo similar para prótesis de voz. Esta es quizás la razón por la que estos son más limitados en términos de tecnología de interfaz neuronal, cobertura cerebral y diseño de estudios de comportamiento.

No es fácil "pensar" en el canto de los pájaros, pero es un paso importante
Los pájaros cantores son un modelo interesante de comportamiento vocal complejo aprendido. El canto de los pájaros comparte una serie de similitudes únicas con el lenguaje humano. Su estudio ya ha proporcionado una excelente información general sobre los mecanismos y circuitos que subyacen al aprendizaje, la ejecución y el mantenimiento de las habilidades motoras vocales.
Pero traducir vocalizaciones en tiempo real no es un desafío fácil. Los sistemas actuales todavía son lentos en comparación con nuestros patrones naturales de pensamiento y habla.
Piénselo, porque es genial: los sistemas de procesamiento de lenguaje natural de última generación todavía luchan, y mucho, para mantenerse al día con el pensamiento humano.
Todavía somos demasiado rápidos para un coche
Al interactuar con nuestro Asistente de Google o Alexa, a menudo hay una pausa más larga de lo que esperaríamos al hablar con una persona real. Esto se debe a que la inteligencia artificial está procesando nuestro discurso, determinando el significado de cada palabra en relación con sus capacidades y luego descubriendo a qué reacciones o programas acceder para responder.
Por supuesto, ya sorprende que estos sistemas basados en la nube funcionen a esta velocidad. Pero todavía no son lo suficientemente buenos para crear una interfaz en tiempo real que permita a los sin voz hablar a la velocidad del pensamiento.
Investigación sobre el canto de los pájaros

Primero, el equipo implantó electrodos en una docena de cerebros de pájaros (pinzones cebra) y luego comenzó a registrar la actividad cerebral durante el canto de los pájaros.
Pero no es suficiente entrenar una inteligencia artificial para que reconozca la actividad neuronal de los pájaros durante su canto: incluso el cerebro de un pájaro es demasiado complejo para mapear completamente el funcionamiento de las comunicaciones entre sus neuronas.
Para ello, los investigadores entrenaron otro sistema de reducción de canciones en tiempo real a patrones reconocibles con los que puede trabajar la inteligencia artificial.
Es muy interesante, porque proporciona una solución a un problema pendiente.
El procesamiento de cantos de pájaros en tiempo real es impresionante y replicar estos resultados con lenguaje humano sería histórico.
Pero este primer trabajo aún no está listo. Y aún no se puede adaptar a otros sistemas de voz. Puede que no funcione más allá del canto de los pájaros.
Pero si lo hiciera, sería uno de los primeros y gigantescos saltos tecnológicos para las interfaces cerebro-computadora desde el resurgimiento del aprendizaje profundo en 2014.