OpenAI félicite Grok 3, mais pas pour ses performances

Plus tôt cette semaine, Elon Musk a annoncé un éventuel lancement du modèle Grok 3. Aujourd’hui, le LLM est disponible et accueille apparemment des avis positifs venant des experts, en particulier le fondateur d’OpenAI. Cela dit, Grok 3 performe mieux dans les tâches complexes. Mais cela ne veut pas dire que le modèle n’a pas d’inconvénients.

Premier point faible : Grok 3 sera plus coûteuse puisqu’il nécessite plus de puissance de calcul que son prédécesseur.

Par contre, le modèle serait plus performant que ceux d’OpenAI et d’Anthropic, avec des scores benchmarks surpassant ceux de GPT-4o et de Claude 3.5.

xAI propose néanmoins une version plus compacte de Grok 3 et une autre dotée de la capacité de raisonnement. Celui-ci étant idéalement efficace pour la résolution des problèmes scientifiques et mathématiques.

Que vallent les scores benchmarks de Grok 3

Quand j’ai vérifié les benchmarks de Grok 3 sur Imarena.ai, le modèle s’est placé en tête du classement avec un score de plus de 1 400.

Il est donc numéro sur toutes les catégories des chatbots, dépassant ainsi Gemini, Claude et GPT-4o.

Mais je tiens à préciser qu’il se pourrait que vous obteniez différents résultats dans le cadre d’un usage réel.

En d’autres termes, ne vous fiez jamais aux scores benchmarks. Même s’ils indiquent généralement le score d’un modèle par rapport à un autre.

À titre d’exemple, le modèle 3.5 de Claude affiche un score inférieur à ceux des autres modèles sur les benchmarks de codage.

Pourtant, convaincus que Claude reste le meilleur choix pour les tâches de programmation, les utilisateurs le préfèrent aux autres modèles.

Grok 3 is, uh, not great at coding pic.twitter.com/ABA1rRWDtF
— Theo – t3.gg (@theo) February 18, 2025

« Félicitations à xAI d’avoir créé Grok 3 »

En plus de ses performances sur les benchmarks, Grok 3 a également reçu le compliment d’Andrej Karpathy, fondateur d’OpenAI.

« D’après ce que j’ai pu remarquer quand j’ai testé Grok 3, le modèle a une meilleure capacité de raisonnement logique. En activant la fonctionnalité « Think », comparable à « Raisonner » de ChatGPT, le modèle peut gérer avec efficacité les tâches les plus complexes. Notamment les problèmes que l’on ne pouvait résoudre que sur o1-pro d’OpenAI », a-t-il déclaré.

Côté mathématique, l’activation de la fonction « Think » permet au modèle d’améliorer la précisons de ses résultats.

Il est donc plus facile de compter les lettres et comparer les nombres décimaux, d’après ce qu’a indiqué Karpathy.

BREAKING: Grok 3 beats several competitors across several benchmarks pic.twitter.com/c9XCtqpk0B
— The Spectator Index (@spectatorindex) February 18, 2025

Nouvelle fonction DeepSerach

Si nous entrons dans les détails, on s’aperçoit que Grok 3 dispose également de la fonction DeepSearch dont la qualité est similaire à celle de Perplexity.

Il est même possible d’obtenir des réponses liées à des sujets d’actualité. Comme les prochaines sorties Apple, etc.

Mais comme tout autre chatbot alimenté par IA, Grok 3 n’est pas exempt de défauts. Le modèle semble des fois générer de faux URL ou fournir des réponses non fondées.

Et en tant que propriété de xAI, Grok 3 ne cite même pas les publications X que si vous lui demandez. C’est comme s’il ne savait pas que X existait.

Tout cela pour dire que malgré l’éloge du fondateur d’OpenAI, la fonction DeepSearch de Grok 3 n’a pas encore le même niveau de qualité que Deep Research de ChatGPT.

XAI double le prix alors et lève les restrictions

Ces nouvelles fonctionnalités de Grok 3, ainsi que sa performance, font naturellement référence à des prix plus élevés que prévu.

Du côté de X, on a droit à une hausse de l’abonnement mensuel premium à 50 $. SuperGrok, le tarif s’élève à 30 $ par mois pour accéder à toutes les fonctionnalités du modèle.

À ce prix, on a droit à des générations d’images en illimité et une baisse des limites quant au nombre de messages destinés à DeepSearch.

Pour ce qui est de l’accessibilité, Grok 3 sera disponible en version web. Pour y accéder, il suffit d’aller sur www.grok.com.

Mais ne vous réjouissez pas trop vite, cette interface web n’est pas encore accessible pour ceux qui résident au Royaume-Uni et dans l’Union européenne.

Updated the X app, still no grok 3 access

Was looking forward to using it to up my shit posting game

pic.twitter.com/k24VPS4fDQ
— CMDR ✈️ ETHDenver (@CommanderCrypt0) February 18, 2025

Partager l'article :

Facebook
Twitter
LinkedIn

Restez à la pointe de l'information avec
INTELLIGENCE-ARTIFICIELLE.COM !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Actualités

OpenAI enterre son navigateur IA censé révolutionner Internet

OpenAI met fin à son navigateur Atlas, pourtant présenté comme une petite révolution. Lancé en octobre dernier, il aura vécu moins d’un an. Avec Atlas,

14 juillet 2026

IA Générative

OpenAI dévoile GPT-5.6 Sol, Terra et Luna : trois versions pour concurrencer Anthropic

OpenAI a officialisé le lancement de sa gamme GPT-5.6, déclinée en trois versions distinctes : Sol, Terra et Luna. L’objectif ? Tenir tête à la

13 juillet 2026

IA Générative

Alerte ! Google vole vos photos et votre voix pour son IA

L’évolution des technologies d’apprentissage nécessite une quantité phénoménale de données de manière continue. Et pour répondre à ce besoin, Google veut désormais exploiter les fichiers

9 juillet 2026

IA Générative

Claude dispose-t-il de la même structure que notre cerveau ?

Selon une étude, des chercheurs ont cartographié Anthropic J-space, une structure interne de Claude qui ressemble au système cognitif humain central. Seize chercheurs d’Anthropic viennent

9 juillet 2026

Sous-titres IA

Submagic contre CapCut : qui est le vrai maître du sous-titrage automatique ?

Le duel Submagic contre CapCut agite les communautés de créateurs pour désigner le roi absolu de l’édition verticale. Pour capter l’attention des utilisateurs sur les

8 juillet 2026

IA Générative

Claude Fable 5 : fin de la gratuité après seulement 7 jours

Anthropic vient d’imposer à ses utilisateurs le Claude Fable 5 payant. Après une semaine de réouverture suite à des restrictions, tout le monde doit désormais

8 juillet 2026

OpenAI félicite Grok 3, mais pas pour ses performances

Que vallent les scores benchmarks de Grok 3

« Félicitations à xAI d’avoir créé Grok 3 »

Nouvelle fonction DeepSerach

XAI double le prix alors et lève les restrictions

OpenAI enterre son navigateur IA censé révolutionner Internet

OpenAI dévoile GPT-5.6 Sol, Terra et Luna : trois versions pour concurrencer Anthropic

Alerte ! Google vole vos photos et votre voix pour son IA

Claude dispose-t-il de la même structure que notre cerveau ?

Submagic contre CapCut : qui est le vrai maître du sous-titrage automatique ?

Claude Fable 5 : fin de la gratuité après seulement 7 jours

Laisser un commentaire Annuler la réponse

IA, conformité et souveraineté : l’open source européen pour la protection des données publiques

L’IA sur-mesure, un impératif légal face à l’urgence de la conformité

Pourquoi les femmes sont au cœur de l’urgence légale et éthique de l’IA ?

Que vallent les scores benchmarks de Grok 3

« Félicitations à xAI d’avoir créé Grok 3 »

Nouvelle fonction DeepSerach

XAI double le prix alors et lève les restrictions

ARTICLES SIMILAIRES

Laisser un commentaire Annuler la réponse

Tendances

La newsletter IA du futur

Interviews