Lo sé, a todos nos distrajo otra cosa: en enero de 2021 OpenAI, la empresa fundada por Elon Musk y respaldada por Microsoft, ha lanzado su proyecto más ambicioso hasta la fecha: un sistema de aprendizaje automático llamado DALL-E.
¿Qué hace esta inteligencia artificial? Dicho rápidamente: produce imágenes a partir de una simple descripción de texto. ¿Un ejemplo? Escribe "Un camello con un libro como sombrero", o "Una corbata hecha de tenedores" y dibuja, crea, en fin: saca una imagen.
Ahora, Open AI ha presentado la segunda versión de DALL-E, y las cosas se han puesto bastante serias: la resolución ha mejorado mucho y el tiempo de producción es mucho menor. Una típica dinámica exponencial a la que las inteligencias artificiales nos han acostumbrado, y sobre todo nos acostumbrarán. También porque, si recuerdan, el jefe de Open AI acaba de decir que estas máquinas tal vez (tal vez) se están volviendo sensibles.
Un poco de Wall-E, un poco de Dali
La versión uno de DALL-E (un acrónimo de "Dali", como artista, y "WALL-E", como el personaje animado de Disney) pudo generar imágenes y unir varias fotos en un collage, ofreciendo perspectivas editables, y deducir elementos de una imagen por sí mismos, por ejemplo, efectos de sombreado.
Un diseñador súper bueno, con todas las imágenes del mundo a su disposición, que interpreta los pedidos y dibuja al instante.
"A diferencia de un motor de renderizado 3D, que requiere entradas precisas, DALL-E a menudo puede 'llenar los espacios en blanco' cuando el título implica que la imagen debe incluir un elemento determinado que no está expresamente indicado", escribió el equipo el año pasado. en el blog de IA abierta.
¿Cómo funciona la IA que se basa en la demanda?
DALL-E no estaba destinado a ser un producto comercial y el equipo de OpenAI decidió que sería lo mejor. Los investigadores le "impedieron", por ejemplo, crear imágenes con un trasfondo sexual o político, para evitar que el sistema sea utilizado para generar desinformación. Lo mismo ocurre con los nombres específicos: imposible preguntarle, decir, "dibuja a Frank Sinatra jugando al tenis con un oso polar".
DALL-E 1, en esencia, aprovecha el increíble intérprete de lenguaje GPT-3 (aqui te hablo mas a fondo, si te interesa) y dibuja lo que entiende más que lo que “siente”.
A diferencia de la primera versión, que estaba disponible para todos en el sitio web de OpenAI, esta solo está disponible para que la pruebe un número limitado de socios: espero unos días una respuesta de OpenAI para unirme al grupo.