Une grande première dans le domaine de l’IA générative ! Athropic vient de détrôner OpenAI et tient la première place du top 3 sur ChatGPT Arena face à ChatGPT. Claude Opus 3, pour la première fois depuis plusieurs mois, a réussi à surpasser GPT-4, le grand modèle de langage alimentant ChatGPT.
À titre d’information, Chatbot Arena n’est autre qu’un outil de classement que les chercheurs utilisent pour évaluer les performances et la popularité des modèles de langage.
Nick Dobos, développeur de logiciels, déclare sur son compte Twitter (actuellement X) que le roi est mort. Une déclaration qui fait suite à un article visant à comparer Claude 3 et GPT-4 Turbo.
Après le lancement du classement le 3 mai 2023, GPT-4 a toujours été en première place sur Chatbot Arena.
Mais les choses ont changé après que le modèle de langage d’Anthropic, Claude Opus 3 s’est positionné dans le top 1 mardi dernier.
Fin du monopole pour OpenAI
OpenAI a depuis un certain temps monopolisé la fourniture de modèles de langage. Mais Anthropic devient aujourd’hui un fournisseur offrant le juste rapport qualité prix. Du moins, c’est ce qu’indique le classement de Chatbot Arena.
Si Claude AI est considéré comme plus fiable pour les tâches plus avancées, Haiku, un plus petit modèle, a le vent en poupe au niveau du prix et de l’efficacité.
Simon Willison, chercheur en intelligence artificielle, ne tarde pas à donner son avis. Selon lui, il est important pour chaque utilisateur, chaque client de disposer d’une variété de modèles de langage.
Il ajoute que la diversité des fournisseurs constitue également une opportunité pour les acteurs du domaine de l’IA générative.
Quant au classement proprement dit, il joue un rôle important pour les chercheurs. Il s’agit d’ailleurs des résultats de plusieurs comparaisons entre les chatbots IA. Ce qui, par la suite, permet de présenter « le meilleur » système en fonction des critères de sélection de chaque utilisateur.
À 1 contre 4, Claude AI remporte le match contre ChatGPT
Bien qu’OpenAI ait apporté plusieurs mises à jour à GPT-4, Claude 3 l’a facilement surpassé. Il y a notamment le modèle GPT-460314, GPT-4-0613, GPT-4-1106-preview, et GPT-4-0125-preview.
OpenAI de son côté, déclare que l’apparition de ces versions a pour objectif de réduire les cas de paresse constaté il y a deux mois, depuis janvier 2024 chez ChatGPT.
Sauf que même avec 4 modèles de langage, ChatGPT n’a pas pu concurrencer avec Claude 3 cette fois-ci. Quant à Anthropic, il s’est hissé en au sommet du classement peu de temps après la sortie de sa dernière mise à jour.
D’un autre côté, Claude 3 fait également partie des IA génératives qui ont remplacé ChatGPT. OpenAI devrait cependant s’attendre à voir sa part de marché baisser au profit d’Anthropic.
Un autre grand modèle de langage connaît aussi une popularité grandissante auprès des utilisateurs. Ce n’est autre que Google Gemini ayant des capacités semblables à celles de Claude Opus 3.
Le bouleversement dans le classement Chatbot Arena représente une mise en garde pour OpenAI. C’est peut-être la raison pour laquelle elle vise à lancer très prochainement la dernière version de son LLM GPT-5.
- Partager l'article :