Selon les dernières données de la LMArena publiées ce 16 février 2026, Google perd sa couronne au profit d’Anthropic. Porté par le lancement fracassant d’Opus 4.6, l’outsider s’empare de la première place mondiale, tandis qu’OpenAI confirme son déclin en restant exclu du Top 10 pour le deuxième mois consécutif.
Le classement Elo de la LMArena, basé sur des milliers de duels anonymes arbitrés par les utilisateurs, est sans appel. Et l’hiérarchie établie fin 2024 est totalement balayée.
Si 2025 a été l’année de la montée en puissance de Google, février 2026 marque l’avènement de l’ère Claude Opus 4.6, signant une hégémonie américaine sans partage après l’éviction du modèle chinois Ernie (Baidu).
Le sacre d’Anthropic et l’innovation « Thinking »
La montée en puissance d’Anthropic s’explique par le succès immédiat de sa nouvelle architecture Opus 4.6.
Le modèle se décline en deux versions qui occupent les deux premières places du podium mondial.
La version « Thinking » (raisonnement approfondi) s’impose comme la référence absolue pour les requêtes complexes, le suivi d’instructions de haut niveau et l’écriture créative.
Ce succès propulse Anthropic au rang de leader sur les tâches généralistes, délogeant Gemini 3 Pro qui rétrograde à la troisième place.
On note également l’émergence de Dola, une société californienne dont le modèle Seed 2.0 Pro parvient à se hisser à la 6e place mondiale, s’imposant comme un nouvel acteur sérieux face aux Big Tech.
Top 10 des modèles les plus performants
Le classement général toutes tâches confondues reflète désormais une domination technique répartie entre trois acteurs majeurs : Anthropic, Google et xAI (Grok).
- Claude Opus 4.6 « thinking » ;
- Claude Opus 4.6 ;
- Gemini 3 Pro ;
- Grok 4.1 « thinking » ;
- Gemini 3 Flash ;
- Dola Seed 2.0 Pro ;
- Claude Opus 4.5 « thinking » ;
- Claude Opus 4.5 ;
- Grok 4.1 ;
- Gemini 3 Flash « thinking ».
Analyse par catégorie : à chaque usage son champion
Au-delà de la performance brute, les leaderboards thématiques révèlent des spécialisations marquées selon les éditeurs.
Développement web et Code
Claude Opus 4.6 écrase littéralement la concurrence dans ce domaine. Anthropic occupe cependant les trois premières places (versions 4.6 et 4.5). Ce qui confirme que son modèle est devenu l’outil de référence pour les ingénieurs logiciel.
OpenAI sauve l’honneur en parvenant à placer son GPT-5.2 « high » au pied du podium (4e place).
Vision et Recherche Web
Google conserve un avantage stratégique sur le traitement de l’image. Les modèles Gemini 3 Pro et Flash dominent l’analyse visuelle.
Concernant la recherche d’informations en temps réel, Google occupe également la tête avec ses versions Grounding, suivi de près par les solutions Search d’OpenAI (GPT-5.2 et 5.1).
Création d’images
C’est la seule catégorie où OpenAI maintient son leadership historique. L’éditeur de ChatGPT reste premier pour la génération et la retouche d’image, bien que Gemini et Grok comblent rapidement l’écart en se plaçant juste derrière.

Comprendre le mécanisme de la LMArena
Le score Elo utilisé par la plateforme garantit une impartialité maximale. Chaque modèle est en effet soumis à des tests en aveugle : l’utilisateur reçoit deux réponses pour un même prompt sans connaître l’identité des IA.
Le choix de la meilleure réponse ajuste le score des modèles. Ce système valorise les victoires contre des modèles plus forts et sanctionne lourdement les contre-performances face à des modèles moins bien classés, expliquant ainsi les chutes brutales de certains leaders historiques.
- Partager l'article :

