Le puissant modèle Opus 4.1 d’Anthropic est ici – comment y accéder (et pourquoi vous voudrez)

Les principaux plats de ZDNET
- Anthropic a lancé Claude Opus 4.1.
- Le modèle dépasse les performances du prédécesseur sur les tâches complexes.
- Il est disponible pour les utilisateurs de Claude payés, Claude Code, API, Amazon Bedrock et Google Cloud’s Vertex AI.
En mai, Anthropic a publié Claude Opus 4, que la société a surnommé son modèle le plus puissant à ce jour et le meilleur modèle de codage au monde. Seulement trois mois plus tard, Anthropic augmente davantage la mise en lançant le très attendu Claude Opus 4.1, qui prend désormais la couronne de son prédécesseur en tant que modèle le plus avancé d’Anthropic.
La famille Opus de modèles est les modèles d’IA les plus avancés de l’entreprise destinés à s’attaquer aux problèmes complexes. En conséquence, Claude Opus 4.1, publié mardi, excelle dans ces tâches et peut même augmenter son prédécesseur sur les tâches agentiques, le codage réel et le raisonnement, selon Anthropic.
Le modèle intervient également alors que l’industrie s’attend bientôt au lancement du GPT-5 d’OpenAI.
Aussi: Openai pourrait lancer GPT-5 à une minute maintenant – à quoi s’attendre
Comment Claude Opus 4.1 fonctionne-t-il?
L’un des cas d’utilisation les plus impressionnants de Claude Opus 4 a été ses performances sur le Bench SWE Vérifié, un sous-ensemble filtré par l’homme du SWE-Bench, une référence qui évalue les capacités des LLMS pour résoudre des tâches d’ingénierie logicielle réelles provenant de GitHub. Les performances de Claude Opus 4 sur le SWE-Bench ont vérifié l’affirmation selon laquelle il s’agissait du «meilleur modèle de codage au monde». Comme le montre le poteau ci-dessus, l’OPU 4.1 a fonctionné encore plus haut.
Claude Opus 4.1 a également balayé ses modèles précédents à travers le tableau de référence, y compris le MMMLU, qui teste des capacités multilingues; AIME 2025, qui teste la rigueur sur les questions de compétition de matchs du secondaire; GPQA, qui teste des performances sur les invites de raisonnement au niveau des diplômés; Et plus. Lorsqu’ils sont épinglés contre les modèles de raisonnement des concurrents, y compris Openai O3 et Gemini 2.5 Pro, il les surpasse dans divers repères, dont SWE-Bench vérifié.
Avec le communiqué, Anthropic a également publié son carte systèmequi délimite toutes les évaluations et évaluations de la sécurité qu’il a effectuées sur le modèle, ainsi que ses faiblesses, risques et limitations. Un aperçu rapide du document de 22 pages montre que le modèle a été déployé avec une norme de niveau de sécurité AI (ASL-3) sous la politique de mise à l’échelle responsable d’Anthropic (RSP), et elle est toujours sujette à la plupart des mêmes vulnérabilités.
Comment pouvez-vous accéder à Claude Opus 4.1?
Si vous souhaitez essayer le modèle par vous-même, il est maintenant disponible pour tous via les plans Claude payants, qui incluent Claude Pro pour 20 $ par mois et Claude Max pour 100 $ par mois. Il est disponible dans Claude Code, l’API, le substratum rocheux d’Amazon et le sommet de Google Cloud.
Obtenez les meilleures histoires du matin dans votre boîte de réception chaque jour avec notre Newsletter Tech Today.