Anthropic élargit les capacités de son nouveau modèle. Cette mise à jour intègre des flux de travail autonomes dans Claude Code. Il ajuste l’effort de l’IA et réduit les coûts du mode rapide. Ce nouveau géant d’Anthropic maximise l’honnêteté du modèle face aux tâches complexes.
Anthropic vient de lancer Claude Opus 4.8 avec les flux de travail dynamiques (dynamic workflows) pour Claude Code. Ce modèle s’adresse aux entreprises qui ont besoin de programmation à grande échelle et d’agents autonomes comme Claude Opus. L’IA pilote désormais prendre en charge des projets logiciels complets comme les migrations et les refactorisations à grande échelle. Ces quelques exemples indiquent que l’intelligence artificielle pour les développeurs continue ses progrès.
Des workflows dynamiques à l’assaut des grands projets d’ingénierie
Les abonnés Enterprise, Team et Max de Claude Code testent déjà cette fonctionnalité en version d’évaluation. Elle gère des tâches complexes qui dépassent le cadre d’un simple fichier. Claude arrive à planifier les tâches avec des centaines de sous-agents et à vérifier les résultats de manière autonome. Le CTO d’Anthropic Rahul Patil a déclaré que l’outil cible les gros chantiers qui nécessitent un important groupe de travail. L’IA est désormais capable de corriger un grand volume de code, qui seront ensuite validés par des tests.
Quels sont les tarifs et la disponibilité de Claude Opus 4.8 ?
Le modèle est accessible sur le Claude AI pour les utilisateurs qui ont un abonnement Pro, Max, Team et Entreprise. Le nouveau modèle est au même tarif que Claude Code et l’API Claude soit 5 $ par million de tokens entrés et 25 par millions de tokens en sortie.
En revanche, le mode rapide (fast mode) est désormais 2,5 fois plus rapide et 3 fois moins cher que sur les modèles précédents. Cette évolution permet aux équipes qui vont utiliser Claude Opus 4,8 de mieux gérer leurs tâches.
Pourquoi Anthropic mise-t-il avant tout sur l’honnêteté du modèle Claude Opus 4.8 ?
Anthropic mise sur la transparence. Elle veut en effet rendre ses travaux de programmation complexes plus fiables . Le CTO Rahul Patil a indiqué le 28 mai dernier que le modèle progresse de 64,3 à 69,2 sur le benchmark SWE-bench Pro. L’entreprise veut mettre l’accent sur la capacité de l’outil à reconnaître ses limites.
L’architecture de Claude Opus 4.8 indique ce dont elle n’est pas sûre au lieu de masquer une avancée mineure sous un travail terminé. Le modèle est alors quatre fois moins susceptible de donner des réponses inexactes que la version 4.7. Ce qui réduit la supervision humaine. Le modèle se démarque aussi par sa capacité à adopter des comportements prosociaux sans tromperie.
Une gestion fine de l’effort et des évolutions techniques
L’éditeur introduit également le contrôle de l’effort (Effort Controls) sur claude.ai et Cowork. Ce paramètre permet de choisir l’énergie que Claude va consacrer à trouver une réponse. Son niveau Standard combine la rapidité d’exécution des et la qualité de réponse. Le niveau “Low Effort” ordonne à l’IA de réduire ses efforts de réflexion pour générer une réponse. Les niveaux Xhigh et Max sont utiles pour les tâches complexes qui nécessitent un temps de traitement plus long.L’API Messages permet aussi d’intégrer les instructions système directement dans le tableau des messages. Cela n’affecte pas le cache des requêtes. Anthropic teste actuellement le modèle Claude Mythos Preview dans le cadre du projet Glasswing consacré à la cybersécurité.
- Partager l'article :

