API, réflexion, codage, Claude 3.7 Sonnet écrase la concurrence

Un nouveau concurrent arrive pour rivaliser avec DeepSeek R1 et openAI o3. Et ce n’est autre que Claude Sonnet 3.7, un modèle de raisonnement hybride annoncé par Anthropic le 24 février, fournissant des réponses en temps réels et disposant d’une capacité de réflexion étendue.

Il n’est donc pas comme Gemini, o3 ni R1 qui désormais décomposent les problèmes complexes pour pouvoir fournir des réponses plus précis, une méthode qui augmente la consommation en ressources.

Claude Sonnet 3.7, d’après ce qu’Anthropic a publié sur son site, propose deux options dans la génération des réponses.

En premier lieu, le modèle peut générer ses réponses de manière instantanée. Mais il pourra également réfléchir à la question et répondre aux prompts étape par étape.

Cela dit, pour ceux qui utilisent l’API, ils ont le contrôle sur le budget de réflexion (on en parlera plus tard) du modèle dans la génération de ses réponses.

Mais ce n’est pas tout, Claude 3.7 Sonnet intègre aussi un nouvel outil de codage, Claude Code

Toujours d’après ce que j’ai pu lire sur le site officiel d’Anthropic, Claude 3.7 Sonnet bénéficie d’une nouvelle mise à jour de ses fonctionnalités de codage.

Le chatbot intègre dorénavant l’outil Claude Code, une fonction dédiée au codage et au développement web front-end.

Claude Code agit comme un assistant de développement qui explore et analyse votre code.

Il peut par ailleurs modifier vos fichiers, créer et lancer des tests tout en poussant vos modifications sur GitHub.

Bien qu’encore en phase préliminaire, Claude Code est rapidement devenu un outil essentiel pour notre équipe de développement chez intelligence-artifivielle.com.

Claude Code excelle particulièrement dans les tests automatisés, la résolution de bugs complexes et les opérations massives de refactoring.

Les premières évaluations sont d’ailleurs impressionnantes. Claude Code accomplit en une seule opération des tâches qui prendraient habituellement plus de 45 minutes manuellement.

Pourtant, Anthropic prévoit d’autres améliorations dans les prochaines semaines en se basant sur les retours d’utilisation. Notamment la fiabilité des fonctions, le support des commandes longue durée, l’optimisation de l’interface utilisateur et le renforcement des capacités de Claude.

Introducing Claude 3.7 Sonnet: our most intelligent model to date. It's a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking.

One model, two ways to think.

We’re also releasing an agentic coding tool: Claude Code. pic.twitter.com/jt7qQmFWuC
— Anthropic (@AnthropicAI) February 24, 2025

D’accord, mais qui peut accéder à Claude 3.7 Sonnet ?

Jusqu’à l’heure, Claude 3.7 Sonnet est accessible gratuitement pour tous les utilisateurs. Free, Enterprise, Team, Pro, tous ces niveaux offrent un accès illimité à cette nouvelle mise à jour de Claude.

Il est même disponible sur l’API et sur d’autres plateformes comme Vertex AI de Google Cloud et Amazon Bedrock.

Par contre, le plan free ou gratuit ne permet pas d’accéder au mode de réflexion, contrairement aux abonnements payants.

Gratuit, mais est-ce vraiment le meilleur de sa catégorie ?

La disponibilité de Claude 3.7 Sonnet est déjà un point fort pour Anthropic. Côté performance, ce modèle génère des réponses dont la qualité est nettement améliorée. Surtout pour les tâches nécessitant une réflexion approfondie, comme les mathématiques, le codage, et la physique.

Anthropic affirme d’ailleurs sur son site que Claude 3.7 Sonnet est à la fois un modèle de raisonnement et un modèle classique.

Il incombe donc aux utilisateurs d’activer ou non le mode raisonnement. Dans les deux cas, la 3.7 Sonnet est une version améliorée de Claude 3.5.

Pour ce qui est de l’utilisation de Claude 3.7 Sonnet sur l’API, comme je l’ai mentionné au début de cet article, il est possible pour les utilisateurs de limiter le budget de réflexion du modèle.

Ce qui est plutôt intéressant puisque c’est à nous de définir la limite et à mon avis, c’est ce qu’il y a de mieux pour trouver le juste équilibre entre le prix des abonnements et la qualité des résultats.

Les plateformes sont unanimes sur les performances de Claude 3.7 Sonnet

Les évaluations initiales ont mis en évidence la position dominante de Claude dans le domaine des compétences de programmation sur tous les aspects.

D’après Cursor, Claude surpasse à nouveau ses concurrents dans les applications pratiques de codage, avec des progrès notables dans plusieurs domaines, notamment la navigation dans des bases de code élaborées et l’exploitation d’outils sophistiqués.

Claude 3.7 Sonnet entête de classement sur les benchmarks — ©anthropic.com

Selon Cognition, Claude dépasse largement les autres modèles dans la planification des modifications de code et la coordination des mises à jour full-stack.

Vercel, quant à lui, a remarqué l’exactitude remarquable de Claude dans la gestion de flux d’agents sophistiqués.

Pour Replit, il a réussi à utiliser Claude pour développer des applications web et des tableaux de bord élaborés depuis la base, là où d’autres modèles rencontrent des limitations.

Pour ce qui est des tests menés par Canva, ils ont révélé que Claude génère régulièrement du code prêt à l’emploi avec un sens esthétique supérieur et nettement moins d’erreurs.

Partager l'article :