Plus tôt cette semaine, Elon Musk a annoncé un éventuel lancement du modèle Grok 3. Aujourd’hui, le LLM est disponible et accueille apparemment des avis positifs venant des experts, en particulier le fondateur d’OpenAI. Cela dit, Grok 3 performe mieux dans les tâches complexes. Mais cela ne veut pas dire que le modèle n’a pas d’inconvénients.
Premier point faible : Grok 3 sera plus coûteuse puisqu’il nécessite plus de puissance de calcul que son prédécesseur.
Par contre, le modèle serait plus performant que ceux d’OpenAI et d’Anthropic, avec des scores benchmarks surpassant ceux de GPT-4o et de Claude 3.5.
xAI propose néanmoins une version plus compacte de Grok 3 et une autre dotée de la capacité de raisonnement. Celui-ci étant idéalement efficace pour la résolution des problèmes scientifiques et mathématiques.
Que vallent les scores benchmarks de Grok 3
Quand j’ai vérifié les benchmarks de Grok 3 sur Imarena.ai, le modèle s’est placé en tête du classement avec un score de plus de 1 400.
Il est donc numéro sur toutes les catégories des chatbots, dépassant ainsi Gemini, Claude et GPT-4o.
Mais je tiens à préciser qu’il se pourrait que vous obteniez différents résultats dans le cadre d’un usage réel.
En d’autres termes, ne vous fiez jamais aux scores benchmarks. Même s’ils indiquent généralement le score d’un modèle par rapport à un autre.
À titre d’exemple, le modèle 3.5 de Claude affiche un score inférieur à ceux des autres modèles sur les benchmarks de codage.
Pourtant, convaincus que Claude reste le meilleur choix pour les tâches de programmation, les utilisateurs le préfèrent aux autres modèles.
Grok 3 is, uh, not great at coding pic.twitter.com/ABA1rRWDtF
— Theo – t3.gg (@theo) February 18, 2025
« Félicitations à xAI d’avoir créé Grok 3 »
En plus de ses performances sur les benchmarks, Grok 3 a également reçu le compliment d’Andrej Karpathy, fondateur d’OpenAI.
« D’après ce que j’ai pu remarquer quand j’ai testé Grok 3, le modèle a une meilleure capacité de raisonnement logique. En activant la fonctionnalité « Think », comparable à « Raisonner » de ChatGPT, le modèle peut gérer avec efficacité les tâches les plus complexes. Notamment les problèmes que l’on ne pouvait résoudre que sur o1-pro d’OpenAI », a-t-il déclaré.
Côté mathématique, l’activation de la fonction « Think » permet au modèle d’améliorer la précisons de ses résultats.
Il est donc plus facile de compter les lettres et comparer les nombres décimaux, d’après ce qu’a indiqué Karpathy.
BREAKING: Grok 3 beats several competitors across several benchmarks pic.twitter.com/c9XCtqpk0B
— The Spectator Index (@spectatorindex) February 18, 2025
Nouvelle fonction DeepSerach
Si nous entrons dans les détails, on s’aperçoit que Grok 3 dispose également de la fonction DeepSearch dont la qualité est similaire à celle de Perplexity.
Il est même possible d’obtenir des réponses liées à des sujets d’actualité. Comme les prochaines sorties Apple, etc.
Mais comme tout autre chatbot alimenté par IA, Grok 3 n’est pas exempt de défauts. Le modèle semble des fois générer de faux URL ou fournir des réponses non fondées.
Et en tant que propriété de xAI, Grok 3 ne cite même pas les publications X que si vous lui demandez. C’est comme s’il ne savait pas que X existait.
Tout cela pour dire que malgré l’éloge du fondateur d’OpenAI, la fonction DeepSearch de Grok 3 n’a pas encore le même niveau de qualité que Deep Research de ChatGPT.
XAI double le prix alors et lève les restrictions
Ces nouvelles fonctionnalités de Grok 3, ainsi que sa performance, font naturellement référence à des prix plus élevés que prévu.
Du côté de X, on a droit à une hausse de l’abonnement mensuel premium à 50 $. SuperGrok, le tarif s’élève à 30 $ par mois pour accéder à toutes les fonctionnalités du modèle.
À ce prix, on a droit à des générations d’images en illimité et une baisse des limites quant au nombre de messages destinés à DeepSearch.
Pour ce qui est de l’accessibilité, Grok 3 sera disponible en version web. Pour y accéder, il suffit d’aller sur www.grok.com.
Mais ne vous réjouissez pas trop vite, cette interface web n’est pas encore accessible pour ceux qui résident au Royaume-Uni et dans l’Union européenne.
Updated the X app, still no grok 3 access
— CMDR ✈️ ETHDenver (@CommanderCrypt0) February 18, 2025
Was looking forward to using it to up my shit posting game
pic.twitter.com/k24VPS4fDQ
- Partager l'article :