Cómo probar Claude 2.0, el último rival de ChatGPT
El nuevo modelo Claude 2.0 es mejor en codificación, matemáticas y razonamiento, según su Director General, Dario Amodei. A diferencia de su predecesor, está disponible para uso general de los consumidores.

La startup de IA Anthropic lanzó su próximo gran modelo y, esta vez, podés ver cómo se compara con otros destacados de la IA como ChatGPT de OpenAI o Pi de Inflection.

Anthropic anunció el martes el lanzamiento de Claude 2, un modelo de lenguaje amplio que, según la empresa, mejoró en varios aspectos clave, como la codificación, las matemáticas y el razonamiento, y produjo menos respuestas erróneas.

Claude 2 está disponible en su segunda gran iteración. Anthropic lanzó un nuevo sitio web de pruebas beta para que los usuarios en general se registren en EE.UU. y el Reino Unido - claude.ai - al tiempo que abre el nuevo modelo a las empresas mediante API al mismo precio que pagaron por el modelo anterior de Anthropic, Claude 1.3, que aún funciona.

En una entrevista, el cofundador y CEO de Anthropic, Dario Amodei, dijo a Forbes que el nuevo modelo representaba un "salto mayor más que un salto gigantesco" respecto a su predecesor. "Se trata en gran medida de un progreso evolutivo", afirma Amodei. "Hay que delimitar las cosas en algún sitio, y nos pareció que ésta era una mejora lo bastante sustancial, aunque forme parte de una progresión general".

 

¿Cómo se comporta Claude 2 en acción?

 

En las pruebas, Claude 2.0 superó a su predecesor en múltiples medidas. En una prueba de programación en Python obtuvo un 71,2%, frente al 56% anterior; en un examen de matemáticas de secundaria subió del 85,2% al 88%; y en el examen de acceso a la universidad subió del 73% al 76,5%. 

Y mientras que la versión anterior ya podía analizar un texto de hasta 75.000 palabras -aproximadamente la extensión del primer libro de Harry Potter-, Claude 2.0 puede manejar el doble, aproximadamente la extensión de una novela épica, como Cien Años de Soledad, de Gabriel García Márquez. (Amodei declaró a Forbes que Anthropic está aplazando la ampliación del límite de tamaño de las solicitudes para más adelante).

La startup de IA Anthropic lanzó su próximo gran modelo y, esta vez, podés ver cómo se compara con otros destacados de la IA como ChatGPT de OpenAI o Pi de Inflection.

El anuncio del nuevo modelo insignia de Anthropic se produce menos de dos meses después de que revelara 450 millones de dólares en nueva financiación liderada por Spark Capital, con una valoración de más de 4.000 millones de dólares. Miles de empresas ya estuvieron trabajando con la API de Claude, según reveló la empresa. Anthropic también está trabajando con varios grandes clientes -entre los que se encuentran Zoom, Notion y el generador de imágenes Midjourney- en la creación de modelos personalizados. No quiso dar más detalles.

Los origenes del negocio

Para una empresa que se separó de OpenAI en 2021, supuestamente por diferencias existenciales en torno a la comercialización, el lanzamiento de Claude 2.0 parece representar una especie de marcha atrás. Pero Amodei dijo que comercializar de tal manera siempre fue parte del "plan básico" de Anthropic. "¿Nos ajustamos algo en un sentido u otro en función de lo que descubramos en el campo? Por supuesto", añadió.

Parte de ese ajuste, dijo Amodei a Forbes, se debió a que Anthropic determinó que los usuarios comerciales podían ofrecer un "campo de pruebas de seguridad" más amplio para examinar los posibles peligros del modelo. A la luz de las mejoras adicionales de Claude 2.0, la empresa decidió abrirlo aún más, dijo. Por ahora, la versión para consumidores es gratuita, aunque Amodei señaló que la empresa podría llegar a monetizarla. "Consideramos que se trata de un experimento", afirmó.

Al igual que los modelos anteriores de Claude, la nueva versión se entrenó mediante "IA constitucional", un marco de entrenamiento de modelos en el que la supervisión de la IA mejora sus resultados sin la intervención humana. Sin embargo, en Claude 2.0 se siguió utilizando este método junto con la supervisión y los comentarios humanos, explica Amodei. Por ello, Anthropic afirma que Claude 2.0 es el doble de bueno que su predecesor a la hora de limitar los resultados nocivos.

"Es casi una certeza que alguien va a encontrar alguna nueva fuga en el modelo, alguien va a encontrar alguna mala alucinación. Hay demasiadas cosas que se pueden decir al modelo, y demasiadas cosas que el modelo puede responder", admitió Amodei. "Estas cosas nunca van a ser perfectas".

Al igual que los modelos anteriores de Claude, la nueva versión se entrenó mediante "IA constitucional", un marco de entrenamiento de modelos en el que la supervisión de la IA mejora sus resultados sin la intervención humana. 

El lanzamiento del modelo de Anthropic también se produce menos de dos meses después de que Amodei se uniera al CEO de OpenAI, Sam Altman, al CEO de Google DeepMind, Demis Hassabis, y a más de 300 personas en la firma de una carta advirtiendo del "riesgo de extinción de la IA." Obviamente, Anthropic cree que puede trabajar para mitigar ese escenario catastrófico sin dejar de lanzar nuevos modelos, en contraste con algunos destacados líderes tecnológicos que pidieron una congelación temporal de su lanzamiento.

En lugar de un embargo de la industria sobre el lanzamiento de modelos, Amodei propuso que los principales lanzamientos de modelos, o incluso la formación de nuevos modelos, requieran demostrar que los modelos superaron ciertas comprobaciones de seguridad. "Tal vez deberíamos preguntarnos cómo podemos medir y poner normas al problema de los modelos, en lugar de hacer una pausa durante un periodo de tiempo determinado", afirmó.

*Con información de Forbes US