¿Te imaginas un gato gris? Bien. Ahora, imagínelo con pelaje blanco. Ahora, imagínelo caminando sobre la Gran Muralla China. ¿Hecho? Aquí, en estos momentos, una rápida serie de activaciones neuronales en su cerebro produjo variaciones de la imagen presentada, basadas en su conocimiento previo del mundo.
Fácil de imaginar, para nosotros los seres humanos. Sin embargo, para una inteligencia artificial es una historia completamente diferente. A pesar de los avances en las redes neuronales, que igualan o superan el desempeño humano en ciertas actividades, las computadoras aún están lejos de la capacidad humana para imaginar cosas.
¿Imagina? Imposible para una IA. Al menos hasta ayer.
Ahora, un equipo de investigación de la USC ha desarrollado inteligencia artificial que utiliza capacidades similares a las humanas para imaginar un objeto nunca antes visto con diferentes atributos. El documento, titulado "Síntesis Zero-Shot con aprendizaje supervisado en grupo", fue lanzado en mayoy la investigación colateral ha florecido desde entonces.
"Nos inspiraron las habilidades de generalización visual humana para intentar simular la imaginación humana en máquinas", dice el autor principal del estudio. Yunhao Ge. “Los seres humanos pueden separar su conocimiento aprendido por atributos, como forma, pose, posición, color y luego recombinarlo para imaginar un nuevo objeto. Nuestro artículo intenta simular este proceso utilizando redes neuronales ”.
El problema de la generalización de la inteligencia artificial
Supongamos que queremos crear un sistema de inteligencia artificial que genere imágenes de automóviles. Al principio, proporcionamos al algoritmo algunas imágenes de un automóvil. La tarea sería generar muchos tipos de automóviles, en cualquier color, desde múltiples ángulos. Este es un serio desafío: crear redes neuronales capaces de extraer las reglas subyacentes y aplicarlas a una amplia gama de ejemplos nuevos nunca antes vistos. Pero las redes hoy en día se entrenan sobre características de muestra, sin tener en cuenta los atributos de un objeto.
En este nuevo estudio, los investigadores intentaron superar esta limitación.
¿El secreto? Se llama desenredar
El trabajo del equipo de investigación se basó en la aplicación de un método llamado desenredado. Desenredar se puede utilizar para generar deepfake, por ejemplo, sintetizando nuevas imágenes y videos que reemplacen la identidad de una persona con otra, pero manteniendo el movimiento original.
El nuevo enfoque toma un grupo de imágenes de muestra, no una muestra a la vez como los algoritmos tradicionales. Dd extrae la similitud entre ellos para obtener algo llamado "aprendizaje de representación desenredado controlable".
Luego, recombina este conocimiento para obtener una "nueva síntesis controlable de imágenes". Podríamos usar el verbo "imaginar".
Es un proceso muy similar a cómo los humanos extrapolamos: cuando un humano ve el color de un objeto, podemos aplicarlo fácilmente a cualquier otro objeto reemplazando el color original por el nuevo. Usando la técnica de desenredar, el equipo generó un nuevo conjunto de datos que contiene 1,56 millones de imágenes que podrían ayudar a futuras investigaciones en el campo.
Imaginar ayuda a comprender el mundo
Si bien desenredar no es una idea nueva, los investigadores dicen que su estructura puede ser compatible con casi cualquier tipo de datos o conocimientos. Esto amplía las oportunidades de aplicaciones.
En el campo de la medicina, por ejemplo, desenredarlos podría ayudar a los médicos y biólogos a descubrir fármacos más útiles al separar la función médica de otras propiedades y luego recombinarlas para sintetizar una nueva medicina. Ser capaz de hacer que las máquinas “imaginen” también podría ayudar a crear una inteligencia artificial más segura. Por ejemplo, permitir que los vehículos autónomos imaginen y eviten escenarios peligrosos nunca antes vistos durante el entrenamiento.
“El aprendizaje profundo ya ha demostrado un rendimiento y una promesa insuperables en muchos campos. Sin embargo, con demasiada frecuencia, esto ha sucedido a través de un mimetismo superficial y sin una comprensión más profunda de los atributos separados que hacen que cada objeto sea único ”, dijo Laurent Itti, profesor de informática. "Este nuevo enfoque desenredante, por primera vez, realmente desata un nuevo sentido de imaginación en los sistemas de IA, acercándolos a la comprensión humana del mundo".