Desde el debut de ChatGPT en adelante, varios retadores (o aspirantes) han alzado la voz para robar parte de la atención que de otro modo se dedicaría al modelo OpenAI. Y hoy hay un nombre que está haciendo mucho ruido: Claude 2.0. Sí, has leído bien, hay otro sheriff en la ciudad y promete hacer cumplir la ley. Echemos un vistazo a lo que hace que Claude 2.0 sea tan especial.
La "revuelta" de los exiliados
La versión 2.0 de Claude (puedes encontrarlo aquí) no es simplemente una actualización. Este modelo de IA nacido de Antrópico, una startup fundada por dos antiguos colaboradores de OpenAI, supone un salto cualitativo respecto a su versión anterior, la 1.3.
Los datos hablan por sí solos. En la prueba Códex HumanEval, diseñado para evaluar la competencia en la programación de Python, Claude 2.0 obtuvo un impresionante 71,2%, una notable mejora con respecto a al anterior 56,0%.
Eso no es todo: también demostró habilidades matemáticas superiores, con una puntuación en un 88,0% en GSM8k, un conjunto de problemas matemáticos de nivel de grado. Claude es la IA que a todos les gustaría tener a su lado durante un examen.
Claude 2.0, el gigante “bueno”
Entre sus características distintivas, Claude 2.0 incluye ciertamente un diseño más "educado", que pone especial énfasis en la reducción de daños, intentando evitar contenidos ofensivos o peligrosos. En comparación con la versión anterior, Claude 1.3, el nuevo modelo es dos veces más eficaz a la hora de generar respuestas seguras. Esto lo convierte en una opción ideal para empresas que buscan resultados seguros y respetuosos con el medio ambiente.
Sin embargo, la definición de "gigante" se gana a nivel cuantitativo: Claude 2.0 puede procesar una enorme cantidad de datos a la vez. Estoy hablando de 100.000 tokens, o alrededor de 75.000 palabras. ¡Es como leer una novela en segundos!
¿Claude es más fuerte que ChatGPT?
La pregunta del millón de euros. ¿Cómo le va a Claude 2.0 con ChatGPT? Me disculparás si No creo que Bard esté a la altura todavía.. Consideraría 3 factores y algunos "despojos".
Límites de contexto:
claudio 2.0: como se mencionó, tiene un límite de 100.000 tokens, lo que le permite procesar indicaciones de texto más largas y tener una ventana de contexto y memoria más grande.
ChatGPT: Tiene varias limitaciones dependiendo de la versión: GatoGPT-3 tiene un límite de 4096 fichas, GPT4 (8K) tiene un límite de 8000 tokens e GPT4 (32K) Tiene un límite de 32000 tokens. Esto significa que la "memoria" de conversaciones de ChatGPT no se remonta a la de Claude 2.0.
Tiempo de procesamiento:
claudio 2.0: Diseñado para un rendimiento más rápido, con un tiempo de respuesta promedio de aproximadamente 5 segundos.
ChatGPT: Por lo general, lleva desde unos pocos segundos hasta 30 segundos generar una respuesta. La velocidad puede disminuir durante los períodos de máxima demanda.
Resultados de los exámenes: USMLE, BAR y GRE:
claudio 2.0: Obtuvo una puntuación mejor que ChatGPT en la sección de escritura del GRE y en el examen de la barra.
ChatGPT: Obtuvo mejores calificaciones que Claude en las secciones verbal y cuantitativa del GRE y en el examen USMLE.
USMLE: Significa "Examen de licencia médica de los Estados Unidos". Es un examen para médicos que desean obtener una licencia para ejercer la medicina en los Estados Unidos. El examen evalúa la capacidad de un médico para aplicar conocimientos, conceptos y principios y demostrar habilidades fundamentales para la práctica segura y eficaz de la medicina. BAR: Se refiere al examen de la barra, que es un examen que una persona debe aprobar para ser admitido a ejercer la abogacía en una jurisdicción particular. Los exámenes de la barra varían de un estado a otro en los Estados Unidos, pero generalmente consisten en una serie de pruebas escritas sobre diversos temas legales. GRE: Significa "Examen de registro de posgrado". Es un examen estandarizado que se utiliza para la admisión a programas de maestría y doctorado en muchas universidades, particularmente en los Estados Unidos. Evaluar las habilidades de escritura verbal, cuantitativa y analítica del candidato.
Otras cosas a considerar
En las notas al margen: ChatGPT es más popular, mientras que Claude solo está disponible en los EE. UU. y el Reino Unido (pero puedes probarlo incluso si no estás en estos dos países, usando una VPN). De nuevo: por el momento Claude es gratuito, mientras que ChatGPT tiene dos versiones: gratuita y de pago. ¿Otro? Oh sí. ChatGPT tiene complementos, Claude 2.0. Pero Claude 2.0 se actualizó a 2023 y ChatGPT a 2021. Pero ChatGPT puede conectarse en línea y Claude 2.0 no.
En resumen, se dan una buena razón. Todavía encuentro a ChatGPT por delante, pero debo decir que Claude 2.0 es un excelente retador y pronto podría intentar adelantar. Por nariz, ¿cuál elegirías? O más bien: ¿ya estás usando ambos? ¿Cuál prefieres? ¡Estamos aquí para leerte, cuéntanos tu opinión en los canales sociales de Futuro Prossimo!