Lo sé, a todos nos distrajo otra cosa: en enero de 2021 OpenAI, la empresa fundada por Elon Musk y respaldada por Microsoft, ha lanzado su proyecto más ambicioso hasta la fecha: un sistema de aprendizaje automático llamado DALL-E.
¿Qué hace esta inteligencia artificial? Dicho rápidamente: produce imágenes a partir de una simple descripción de texto. ¿Un ejemplo? Escribe "Un camello con un libro como sombrero", o "Una corbata hecha de tenedores" y dibuja, crea, en fin: saca una imagen.
Ahora, Open AI ha presentado la segunda versión de DALL-E, y las cosas se han puesto bastante serias: la resolución ha mejorado mucho y el tiempo de producción es mucho menor. Una típica dinámica exponencial a la que las inteligencias artificiales nos han acostumbrado, y sobre todo nos acostumbrarán. También porque, si recuerdan, el jefe de Open AI acaba de decir que estas máquinas tal vez (tal vez) se están volviendo sensibles.

Un poco de Wall-E, un poco de Dalí
La versión uno de DALL-E (un acrónimo de "Dali", como artista, y "WALL-E", como el personaje animado de Disney) pudo generar imágenes y unir varias fotos en un collage, ofreciendo perspectivas editables, y deducir elementos de una imagen por sí mismos, por ejemplo, efectos de sombreado.
Un diseñador súper bueno, con todas las imágenes del mundo a su disposición, que interpreta los pedidos y dibuja al instante.
"A diferencia de un motor de renderizado 3D, que requiere una entrada precisa, DALL-E a menudo puede 'llenar los espacios en blanco' cuando el título implica que la imagen debe incluir un elemento determinado que no se indica específicamente", escribió el equipo el año pasado. en el blog de IA abierta.

¿Cómo funciona el dibujo bajo demanda con IA?
DALL-E no estaba destinado a ser un producto comercial y el equipo de OpenAI decidió que sería lo mejor. Los investigadores le "impedieron" crear imágenes sexuales o políticas, por ejemplo, para evitar que el sistema fuera utilizado para generar desinformación. Lo mismo para nombres específicos: imposible preguntarle, decir, "dibuja a Frank Sinatra jugando al tenis con un oso polar".
DALL-E 1, en esencia, aprovecha el increíble intérprete de lenguaje GPT-3 (aqui te hablo mas a fondo, si te interesa) y dibuja lo que entiende más que lo que "siente".

A diferencia de la primera versión, que estaba disponible para todos en el sitio web de OpenAI, esta solo está disponible para que la pruebe un número limitado de socios: espero unos días una respuesta de OpenAI para unirme al grupo.