Google acaba de presentar a Géminis, su nueva frontera en inteligencia artificial, con una demostración que asombró al mundo. Un vídeo publicado en YouTube muestra la extraordinaria capacidad de Géminis para interpretar y responder a estímulos visuales y verbales.
La prueba aparentemente sencilla se convierte rápidamente en una increíble demostración de las capacidades "casi humanas" de esta IA para comprender e interactuar con el mundo circundante.
Google Gemini: un salto cuántico en inteligencia artificial
El surgimiento de Google Gemini (que cubrimos en septiembre pasado en los primeros anuncios) marca un punto de inflexión en el panorama de la inteligencia artificial. La capacidad de Géminis para interpretar y responder a diferentes señales visuales y verbales supera todo lo que hemos visto hasta ahora en las tecnologías de inteligencia artificial.
Esto no es simplemente un gran avance en el reconocimiento visual o la comprensión del lenguaje natural. Lo que se ve en la demostración es una integración extremadamente fluida de ambas capacidades, una que acerca la IA a una verdadera comprensión del contexto humano.
La demostración de Google Gemini: una ventana al futuro
Primero que nada, si te lo perdiste DEBES verlo. Aqui esta ella:
La demostración comienza con un participante humano que le pide a Gemini que describa lo que ve. Géminis interpreta fácilmente la simple acción de colocar un Post-it y dibujar una línea improvisada en él. Pero es la continuación de la prueba la que revela el verdadero poder de Géminis.
A medida que el dibujo evoluciona hacia una figura reconocible, un pato, Gemini no sólo identifica correctamente el objeto, sino que también proporciona detalles sobre el entorno circundante, demostrando una comprensión total del contexto visual.
Más allá del reconocimiento: interacción y traducción
La inteligencia de Google Gemini no se limita a la mera interpretación visual. Cuando el participante presenta juegos y solicitudes de traducción, Géminis responde con precisión. Su capacidad para traducir “pato” a varios idiomas y para comprender y participar en juegos simples resalta un nivel de interactividad y versatilidad que antes parecía dominio exclusivo de los humanos.
¿La aplicación práctica de una tecnología como Google Gemini? Eh. Es imposible definir sus límites. Desde la cirugía hasta la educación, desde las aplicaciones domésticas hasta las industrias creativas, las posibilidades parecen infinitas. Gemini podría revolucionar la forma en que interactuamos con la tecnología, haciendo que la interfaz hombre-máquina sea más intuitiva, natural y eficiente.
Sí, pero ¿cuándo podremos utilizarlo?
Después de la sincera admiración por lo que vimos en la demo, sinceridad por sinceridad también debo señalar que hasta ahora la "gorda" procedente de Google ha sido poca. Bardo, arrastrado a la arena del enfrentamiento con ChatGPT de OpenAI y Claude de Anthropic, se presentó con demasiadas expectativas. La tecnología "en el campo" es inferior a la de la competencia (limitada al modelo de lenguaje: otras IA como la de Deepmind se vienen grandes resultados). Y el hecho de que Google Gemini todavía no tenga una fecha de lanzamiento oficial produce cierta frustración.
Tal vez parezca "demasiado avanzado para ser verdad", tal vez sea porque no puedes esperar a familiarizarte con ello, pero el tiempo de las demostraciones se acabó. La demostración de Google Gemini promete superar las limitaciones actuales de las tecnologías de inteligencia artificial: veámoslo en acción, entonces.
No me dejen sospechar que esto es sólo otra manera de ganar tiempo.
Editar 8/12/2023: Aquí estás. Ni siquiera hacerlo a propósito. Después de la insistencia de muchos usuarios, Google admite que la demostración real de Gemini se creó “usando imágenes fijas de películas y mensajes de texto”, en lugar de que Gemini respondiera a un dibujo o un cambio en los objetos sobre la mesa en tiempo real, o incluso lo predijera. Esto es mucho menos impresionante de lo que el video quiere hacer creer y, peor aún, la falta de una declaración sobre el método de entrada real hace que la preparación de Gemini sea bastante cuestionable, al igual que el comportamiento de Google.