Presentación de Claude 3.5: Soneto Antropico

Hoy lanzamos Claude 3.5 Sonnet, nuestra primera versión en la próxima familia de modelos Claude 3.5. Claude 3.5 Sonnet eleva el estándar de la industria en inteligencia, superando a modelos de la competencia y a Claude 3 Opus en una amplia gama de evaluaciones, con la velocidad y el costo de nuestro modelo de gama media, Claude 3 Sonnet.

Claude 3.5 Sonnet está disponible de forma gratuita en Claude.ai y en la aplicación Claude iOS, mientras que los suscriptores de los planes Claude Pro y Team pueden acceder a él con límites de tasa significativamente más altos. También está disponible a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. El modelo tiene un costo de $3 por millón de tokens de entrada y $15 por millón de tokens de salida, con una ventana de contexto de 200K tokens.

Inteligencia de vanguardia a 2 veces la velocidad

Claude 3.5 Sonnet establece nuevos puntos de referencia en la industria para el razonamiento a nivel de posgrado (GPQA), el conocimiento a nivel de pregrado (MMLU) y la competencia en codificación (HumanEval). Muestra una mejora notable en la comprensión del matiz, el humor y las instrucciones complejas, y es excepcional para escribir contenido de alta calidad con un tono natural y empático.

Claude 3.5 Sonnet funciona al doble de la velocidad de Claude 3 Opus. Este impulso en el rendimiento, combinado con una fijación de precios rentable, hace que Claude 3.5 Sonnet sea ideal para tareas complejas como el soporte al cliente sensible al contexto y la orquestación de flujos de trabajo con múltiples pasos.

En una evaluación interna de codificación agente, Claude 3.5 Sonnet resolvió el 64% de los problemas, superando a Claude 3 Opus que resolvió el 38%. Nuestra evaluación prueba la capacidad del modelo para corregir un error o agregar funcionalidad a una base de código abierto, dada una descripción en lenguaje natural de la mejora deseada. Cuando se le instruye y se le proporcionan las herramientas relevantes, Claude 3.5 Sonnet puede escribir, editar y ejecutar código de forma independiente con una sofisticada capacidad de razonamiento y resolución de problemas. Maneja las traducciones de código con facilidad, lo que lo hace particularmente efectivo para actualizar aplicaciones heredadas y migrar bases de código.

LEAR  Cómo reiniciar el control remoto de Apple TV.

Visión de vanguardia

Claude 3.5 Sonnet es nuestro modelo de visión más sólido hasta ahora, superando a Claude 3 Opus en pruebas de visión estándar. Estas mejoras de cambio drástico son más notables para las tareas que requieren razonamiento visual, como la interpretación de gráficos. Claude 3.5 Sonnet también puede transcribir con precisión texto de imágenes imperfectas, una capacidad fundamental para sectores como el comercio minorista, la logística y los servicios financieros, donde la IA puede extraer más información de una imagen, gráfico o ilustración que solo de texto.

Artefactos—una nueva forma de usar Claude

Hoy también presentamos Artefactos en Claude.ai, una nueva función que amplía la interacción de los usuarios con Claude. Cuando un usuario le pide a Claude que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web, estos Artefactos aparecen en una ventana dedicada junto a su conversación. Esto crea un espacio de trabajo dinámico donde pueden ver, editar y construir sobre las creaciones de Claude en tiempo real, integrando sin problemas el contenido generado por IA en sus proyectos y flujos de trabajo.

Esta función de vista previa marca la evolución de Claude desde una IA conversacional a un entorno de trabajo colaborativo. Es solo el comienzo de una visión más amplia para Claude.ai, que pronto se expandirá para admitir la colaboración en equipo. En un futuro próximo, los equipos—y eventualmente organizaciones enteras—podrán centralizar de manera segura su conocimiento, documentos y trabajo en curso en un espacio compartido, con Claude sirviendo como un compañero de equipo bajo demanda.

Compromiso con la seguridad y la privacidad

LEAR  Gurman: Apple Vision Pro 2 en camino para ser lanzado entre otoño de 2025 y primavera de 2026

Nuestros modelos se someten a pruebas rigurosas y se han entrenado para reducir el mal uso. A pesar del salto en inteligencia de Claude 3.5 Sonnet, nuestras evaluaciones de equipo rojo han concluido que Claude 3.5 Sonnet se mantiene en ASL-2. Se pueden encontrar más detalles en el anexo de la tarjeta del modelo.

Como parte de nuestro compromiso con la seguridad y la transparencia, hemos colaborado con expertos externos para probar y mejorar los mecanismos de seguridad dentro de este último modelo. Recientemente proporcionamos Claude 3.5 Sonnet al Instituto de Seguridad de Inteligencia Artificial del Reino Unido (UK AISI) para una evaluación de seguridad previa a la implementación. El UK AISI completó pruebas de 3.5 Sonnet y compartió sus resultados con el US AI Safety Institute (US AISI) como parte de un Memorándum de Entendimiento, hecho posible por la colaboración entre los AISIs del Reino Unido y EE. UU. anunciada a principios de este año.

Hemos integrado comentarios de políticas de expertos externos en el tema para asegurar que nuestras evaluaciones sean sólidas y tengan en cuenta las nuevas tendencias en abuso. Esta participación ha ayudado a nuestros equipos a mejorar nuestra capacidad para evaluar 3.5 Sonnet contra varios tipos de mal uso. Por ejemplo, utilizamos comentarios de expertos en seguridad infantil en Thorn para actualizar nuestros clasificadores y ajustar aún más nuestros modelos.

Uno de los principios constitucionales fundamentales que guían el desarrollo de nuestros modelos de IA es la privacidad. No entrenamos nuestros modelos generativos con datos enviados por los usuarios a menos que un usuario nos dé permiso explícito para hacerlo. Hasta la fecha, no hemos utilizado ningún dato enviado por el cliente o el usuario para entrenar nuestros modelos generativos.

LEAR  Copa Mundial 2034: Arabia Saudita será sede tras la no presentación de Australia

Próximamente

Nuestro objetivo es mejorar sustancialmente la curva de intercambio entre inteligencia, velocidad y costo cada pocos meses. Para completar la familia de modelos Claude 3.5, lanzaremos Claude 3.5 Haiku y Claude 3.5 Opus más adelante este año.

Además de trabajar en nuestra familia de modelos de próxima generación, estamos desarrollando nuevas modalidades y funciones para admitir más casos de uso para empresas, incluidas integraciones con aplicaciones empresariales. Nuestro equipo también está explorando funciones como Memoria, que permitirá que Claude recuerde las preferencias de un usuario y el historial de interacciones como se especifica, haciendo que su experiencia sea aún más personalizada y eficiente.

Estamos trabajando constantemente para mejorar Claude y nos encanta recibir comentarios de nuestros usuarios. Puedes enviar comentarios sobre Claude 3.5 Sonnet directamente en el producto para informar nuestra hoja de ruta de desarrollo y ayudar a nuestros equipos a mejorar tu experiencia. Como siempre, esperamos ver lo que construyes, creas y descubres con Claude.