La inteligencia artificial está cambiando la forma en que interactuamos con las computadoras. Una versión actualizada de Soneto de Claudio 3.5, el modelo insignia de IA de Antrópico, es un claro ejemplo de esta evolución: si la versión anterior se limitaba al diálogo de texto, esta nueva actualización recién anunciado Es capaz de interpretar interfaces gráficas e interactuar con aplicaciones de forma autónoma.
Un enfoque que abre nuevas posibilidades para la automatización de actividades digitales, "moviéndose" tal como lo haría una persona en una PC. Veamos juntos cómo funciona esta tecnología y cuáles son sus aplicaciones reales.
Cómo funciona la interacción con la PC
Claude 3.5 Sonnet utiliza un sistema llamado "Computer Use API" para interactuar con el escritorio. En la práctica, la IA observa la pantalla a través de capturas de pantalla y analiza lo que ve, tal como lo haría un usuario humano. Cuando tiene que interactuar con una aplicación, calcula la distancia en píxeles para llegar al punto deseado y simula las acciones necesarias: clics del ratón, escritura en el teclado, movimientos del cursor.
Entrenamos a Claude para ver lo que sucede en la pantalla y luego utilizar las herramientas de software disponibles para realizar las tareas.
Antrópico
¿La principal innovación de esta versión? Una habilidad muy esperada: la posibilidad de utilizar cualquier aplicación de escritorio. Ya no se trata sólo de responder preguntas o generar texto, sino interactuar activamente con el software.
El nuevo Sonnet 3.5, aplicaciones prácticas
Las posibilidades de uso son numerosas. Por ejemplo, Repita, una plataforma de desarrollo de software, ya utiliza Claude 3.5 Sonnet para crear un “verificador autónomo” que evalúa las aplicaciones durante su desarrollo. Canva, la plataforma de edición de gráficos en línea, está explorando formas de integrar la IA en el proceso de diseño y edición.
¿Es todo tan “guau” como parece? No. ¿Nos robará nuestros trabajos? Ni. Es importante ser realista acerca de las capacidades actuales del sistema. En una prueba de reserva de vuelo, el Claude 3.5 Sonnet logró completar con éxito menos de la mitad de las tareas asignadas. Incluso tareas aparentemente simples como desplazarse y hacer zoom pueden resultar problemáticas.
Por otra parte, ella misma lo admite. Antrópico:
El uso que hace Claude de la computadora sigue siendo lento y, a menudo, propenso a errores. Alentamos a los desarrolladores a comenzar con tareas de bajo riesgo.
¿Cuánto tiempo pasará antes de que Sonnet 3.5 sea perfecto? ¿Pasarán años, meses o semanas? Si lo piensas bien, ya sabes la respuesta, o algo muy parecido.
Algunas notas sobre seguridad
La cuestión de la seguridad es fundamental. Antrópico, que pasa por ser el “buen chico” de las empresas de IA, ha implementado varias medidas preventivas:
- La IA no está entrenada en capturas de pantalla de los usuarios;
- No tiene acceso a la web durante el entrenamiento;
- Se han desarrollado clasificadores para evitar acciones de alto riesgo;
- Las capturas de pantalla sólo se conservan durante 30 días, como medida de seguridad.
Perspectivas de futuro
Paralelamente al desarrollo de la nueva versión de Claude 3.5 Sonnet, Antrópico También anunció la llegada de una versión actualizada de Haiku, el modelo más económico y eficiente de la serie Claude. Un pequeño paso en el campo de la IA accesible en diferentes niveles de uso. Por supuesto, esto todavía consume mucho, demasiado en términos de energía y recursos.
De todas formas me parece especialmente interesante cómo esta tecnología está cambiando nuestra relación con los ordenadores. Ya no hablamos de simples scripts de automatización, sino de sistemas que entienden e interactúan con interfaces gráficas de forma casi humana.
Claude Sonnet 3.5: pasos equilibrados hacia adelante, pero en una dirección sorprendente
Como suele ocurrir en el campo de la IA, el verdadero valor de esta innovación no se medirá tanto en sus capacidades técnicas, sino en cómo podemos integrarla de manera útil en nuestros flujos de trabajo diarios. El desafío del futuro será encontrar el equilibrio adecuado entre automatización y control humano, aprovechando el potencial de esta tecnología sin perder de vista sus límites y responsabilidades éticas.
Las capacidades del Claude 3.5 Sonnet, que no son impresionantes en sí mismas, sí lo son por la dirección que muestra. Todavía estamos al comienzo de este viaje tecnológico: ¿qué pasará pronto?