GPT-4.5, un fiasco à plusieurs milliards ? Voici pourquoi les critiques fusent

Par Narindra R. Publié le 5 mars 2025 | 3 minutes de lecture

Plus de 100 millions de dollars, c’est le coût estimé de la formation du modèle GPT-4 d’OpenAI. Quant à GPT-4.5, son coût d’entrée est estimé à 30 fois plus cher que celui de GPT-4. Pourtant, ce dernier modèle d’OpenAI semble fournir des performances d’un poil supérieur à celles de son prédécesseur. Les critiques sont donc mitigées. Le processus de formation de GPT-4.5 ne porterait-il pas ses fruits ?

« Rien de bon », « c’est un citron », les critiques des experts sont sévères à l’égard de GPT-4.5.

La réponse d’OpenAI : « tout est un peu mieux ». Ce qui semble vaguement indiquer que les résultats du dernier modèle ne correspondent pas à ce qui a été prévu.

Tout est dit, GPT-4.5 est un fiasco total est OpenAI a pris les mesures nécessaires pour calmer cette énorme déception.

Ce qu’elle a fait ? Elle a juste annoncé que cette version n’est qu’un aperçu de recherches. Elle a même fait exprès de publier les limites actuelles du modèle sur son site.

Plus volumineux, mais moins performant

Il faut savoir que c’est un modèle plus volumineux par rapport à GTP-4. Il est donc logique qu’il nécessite plus de puissance de calcul.

Cette taille se fait également sentir au niveau de son prix. Mais en tout cas, ce nouveau modèle ne va pas remplacer le fameux GTP-4o, comme l’a indiqué OpenAI.

Par ailleurs, l’entreprise hésite encore entre proposer GPT-4.5 dans l’API ou non. En attendant, ils travaillent sur comment trouver le juste équilibre entre le développement des prochains modèles et la prise en charge des capacités actuelles de ses modèles.

Le moins que l’on puisse dire, c’est que même avec une assez grande taille, GPT-4.5 reste encore en dessous des modèles o1 et o3 sur plusieurs benchmarks.

À savoir les tests AIME auxquels il a obtenu un score médiocre de 36,7 % contre un score de presque 90 % pour o3-mini, 87,3 % pour être précis.

Côté prix, le coût de GPT-4.5 est largement supérieur à celui de modèle o3-mini, particulièrement pour les traitements des entrées.

GPT-4.5 asked for 1 truly novel human insight (might be my favourite answer on this prompt) pic.twitter.com/8ZgGpK18j9
— adi (@adonis_singh) February 28, 2025

Même pas dans le top 10 des meilleurs modèles pour le codage

Pour évaluer ce que vaut ce modèle en codage, on a du effectuer des tests sur le benchmark Polygot Coding d’Aider.

Étonnamment, malgré les vanteries d’OpenAI, les résultats des tests indiquent que GPT-4.5 se positionne en 10ᵉ place.

Ce qui veut dire que le modèle ne vaut pas son prix. Pourtant, les tests qu’OpenAI a menés indiquent des améliorations par rapport à GPT-4o en ce qui concerne les domaines scientifiques.

Pour les tests MMLU, donc en connaissances générales, GPT-4.5 a obtenu un score de 85,1 % contre 81,5 % pour GPT-4o.

Aussi, OpenAI réitère que ce dernier modèle fait rarement face à des hallucinations. Il génère de ce fait moins de fausses réponses que ses prédécesseurs.

Alors qu’en disent les évaluateurs humains ? Alors ici, GPT-4.5 affichent de meilleurs résultats. Ceux interrogés affirment préférer les réponses de GPT-4.5 à celles de GPT-4o.

On ne peut donc pas nier qu’il y a des améliorations, bien que modestes, dans la génération des réponses de GPT-4.5.

GPT-4.5 n’est pas un modèle de raisonnement

GPT-4.5 n’est pas bon en codage ni en connaissances générales. Et les scores benchmark prouvent sa régression par rapport à GPT-4.

Sam Altman, PDG d’OpenAI, ne dit pas le contraire. Il allègue sur X que GPT-4.5 manque encore de force analytique.

« Il s’agit du seul modèle qui, d’après moi, me donne l’impression de vraiment parler avec un être humain », a-t-il ajouté.

!! pic.twitter.com/shWj7H6STl
— Sam Altman (@sama) March 3, 2025

Ce qu’il faut savoir dans cette histoire, c’est que GPT-4.5 n’est pas un modèle de raisonnement. Il s’agirait d’un autre type d’intelligence d’après Sam Altman. Mais lequel ?

Ce qui est sûr, c’est que la version 4.5 de GPT est le dernier modèle traditionnel qu’OpenAI va déployer. À l’avenir, on espère un GPT-5 qui serait un mariage entre les modèles de raisonnement et les LLM non raisonnés.