in ,

OpenAI félicite Grok 3, mais pas pour ses performances

Elon Musk fier des performances de Grok 3

Plus tôt cette semaine, a annoncé un éventuel lancement du modèle Grok 3. Aujourd’hui, le LLM est disponible et accueille apparemment des avis positifs venant des experts, en particulier le fondateur d’. Cela dit, 3 performe mieux dans les tâches complexes. Mais cela ne veut pas dire que le modèle n’a pas d’inconvénients.

Premier point faible : Grok 3 sera plus coûteuse puisqu’il nécessite plus de puissance de calcul que son prédécesseur.

Par contre, le modèle serait plus performant que ceux d’OpenAI et d’, avec des scores benchmarks surpassant ceux de -4o et de 3.5.

propose néanmoins une version plus compacte de Grok 3 et une autre dotée de la capacité de raisonnement. Celui-ci étant idéalement efficace pour la résolution des problèmes scientifiques et mathématiques.

YouTube video

Que vallent les scores benchmarks de Grok 3

Quand j’ai vérifié les benchmarks de Grok 3 sur Imarena.ai, le modèle s’est placé en tête du classement avec un score de plus de 1 400.

Il est donc numéro sur toutes les catégories des chatbots, dépassant ainsi Gemini, Claude et GPT-4o

Mais je tiens à préciser qu’il se pourrait que vous obteniez différents résultats dans le cadre d’un usage réel.

En d’autres termes, ne vous fiez jamais aux scores benchmarks. Même s’ils indiquent généralement le score d’un modèle par rapport à un autre.

À titre d’exemple, le modèle 3.5 de Claude affiche un score inférieur à ceux des autres modèles sur les benchmarks de codage.

Pourtant, convaincus que Claude reste le meilleur choix pour les tâches de programmation, les utilisateurs le préfèrent aux autres modèles.

« Félicitations à xAI d’avoir créé Grok 3 »

En plus de ses performances sur les benchmarks, Grok 3 a également reçu le compliment d’Andrej Karpathy, fondateur d’OpenAI.

« D’après ce que j’ai pu remarquer quand j’ai é Grok 3, le modèle a une meilleure capacité de raisonnement logique. En activant la fonctionnalité « Think », comparable à « Raisonner » de , le modèle peut gérer avec efficacité les tâches les plus complexes. Notamment les problèmes que l’on ne pouvait résoudre que sur o1-pro d’OpenAI », a-t-il déclaré.

Côté mathématique, l’activation de la fonction « Think » permet au modèle d’améliorer la précisons de ses résultats.

Il est donc plus facile de compter les lettres et comparer les nombres décimaux, d’après ce qu’a indiqué Karpathy.

Nouvelle fonction DeepSerach

Si nous entrons dans les détails, on s’aperçoit que Grok 3 dispose également de la fonction DeepSearch dont la qualité est similaire à celle de Perplexity.

Il est même possible d’obtenir des réponses liées à des sujets d’actualité. Comme les prochaines sorties , etc.

Mais comme tout autre chatbot alimenté par IA, Grok 3 n’est pas exempt de défauts. Le modèle semble des fois générer de faux URL ou fournir des réponses non fondées.

Et en tant que propriété de xAI, Grok 3 ne cite même pas les publications X que si vous lui demandez. C’est comme s’il ne savait pas que X existait.

Tout cela pour dire que malgré l’éloge du fondateur d’OpenAI, la fonction DeepSearch de Grok 3 n’a pas encore le même niveau de qualité que Deep Research de ChatGPT.

YouTube video

XAI double le prix alors et lève les restrictions

Ces nouvelles fonctionnalités de Grok 3, ainsi que sa performance, font naturellement référence à des prix plus élevés que prévu.

Du côté de X, on a droit à une hausse de l’abonnement mensuel premium à 50 $. SuperGrok, le tarif s’élève à 30 $ par mois pour accéder à toutes les fonctionnalités du modèle.

À ce prix, on a droit à des générations d’images en illimité et une baisse des limites quant au nombre de messages destinés à DeepSearch.

Pour ce qui est de l’accessibilité, Grok 3 sera disponible en version web. Pour y accéder, il suffit d’aller sur www.grok.com.

Mais ne vous réjouissez pas trop vite, cette interface web n’est pas encore accessible pour ceux qui résident au Royaume-Uni et dans l’Union européenne.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *