GPT-5 : révolution ou simple coup de com ? On a fait les tests

GPT-5 est le tout dernier modèle de langage qu’OpenAI a développé et lancé officiellement le jeudi 7 août 2025. Il fait référence à une consolidation des générations précédentes. Dont GPT-4, GPT-4o, GPT-4.1, GPT-4.5, les séries o3, o4-mini, et autres modèles de l’entreprise. GPT-5 vient alors les réunir dans un modèle unifié qui adapte automatiquement ses capacités selon nos besoins. Notamment la rapidité ou la profondeur du raisonnement. Ce qui fait que ChatGPT va ajuster automatiquement son niveau de raisonnement en fonction de la complexité de nos requêtes.

Accessible via ChatGPT, en version gratuite comme payante, ainsi que par API, GPT-5 offre différents niveaux de modèles.

Le choix va dépendre en grande partie des cas d’usage de chaque utilisateur. Mais en général, on a le choix entre GPT-5 standard, mini, thinking, thinking-mini, et plus encore.

Mais que vaut-il vraiment ? Après nos tests, GPT-5 peut s’aligner aux autres modèles phares de ses concurrents.

Sauf qu’en seulement 24 heures, OpenAI a dû remettre sur pied l’ancien modèle GPT-4o après que les utilisateurs se sont plaints de GPT-5.

Sur quelle architecture repose GPT-5 et comment il fonctionne ?

GPT-5 repose sur un système de routing dynamique (routeur en temps réel) qui choisit le sous-modèle le plus adapté à chaque requête.

Ce routeur intègre une logique de sélection entre un modèle à haut débit rapide et un modèle « thinking » tourné vers le raisonnement plus complexe.

Par exemple, une question simple peut être traitée instantanément par GPT-5-mini, tandis qu’une recherche approfondie ou nécessitant une réflexion poussée déclenche le modèle GPT-5-thinking plus lent, mais plus rigoureux.

Cela simplifie l’expérience utilisateur, car il n’est plus nécessaire de choisir manuellement entre différents modèles.

Mais cette automatisation peut aussi dérouter certains utilisateurs habitués à contrôler le modèle sollicité.

First test with GPT-5 and v0.

Vibe-coded a basic operating system, apps and some games.

What have you created with GPT-5 so far? pic.twitter.com/PDACRpVkhY
— Jerrod Lew (@jerrod_lew) August 7, 2025

Intégrations pratiques, tarification et accessibilité

ChatGPT avec GPT-5 propose des personnalités de conversation comme Cynic, Robot, Listener ou Nerd pour ajuster le ton des échanges.

Il intègre également des connecteurs que je trouve assez pratiques vers Gmail, Google Calendar, et propose même un mode voix avancé. Ce qui lui offre plusieurs options esthétiques et sonores.

GPT-5 est disponible en plusieurs variantes : Standard, Mini, Nano, Pro et Thinking. Cela afin de convenir à différentes utilisations, du plus économique au plus puissant.

Les tarifs qu’OpenAI propose vont jusqu’à 10 $ pour un million de jetons de sortie, avec d’autres modèles de tarification qui peuvent varier selon les usages.

Que vaut GPT-5 sur les benchmarks ?

Sur les benchmarks dédiés au codage, GPT-5 marque des points impressionnants. Par exemple, sur SWE-bench Verified (problèmes de développement Python en contexte réel), il atteint 74,9 %, contre 69,1 % pour o3 et seulement 54,6 % pour GPT-4.

Sur Aider Polyglot (édition de code multilingue), il obtient 88 %, avec une réduction drastique d’erreurs.

En outre, en mode « thinking » (raisonnement encadré), les performances s’améliorent encore, avec un gain de +22,1 points sur SWE-bench et +61,3 points sur Aider Polyglot.

En mathématiques avancées, on peut dire que GPT-5 excelle dans le domaine. Sur AIME 2025 (problèmes mathématiques sans outils), il atteint 94,6 % (vs 88,9 % pour o3), et sur le HMMT, il obtient 93,3 % (vs 85 % pour o3).

En revanche, sur FrontierMath (math experte avec outil Python), il affiche 26,3 %, devant o3 (15,8 %).

Quant aux tâches de révision de code (PR Benchmark), la version à budget moyen de GPT-5 atteint 72,2, celle à petit budget 67,8, ce qui constitue un solide résultat compte tenu de l’équilibre entre vitesse et ressources.

On a testé GPT-5 en raisonnement médical multimodal

GPT-5 excelle particulièrement dans le domaine médical, notamment dans les évaluations multimodales (texte + images).

Sur des benchmarks comme MedQA, MedXpertQA, MMLU médical et VQA-RAD, GPT-5 dépasse les performances de GPT-4o.

Il affiche d’ailleurs des gains de plus de 29 % en raisonnement, et même jusqu’à 36 % en compréhension, surpassant des experts humains en plusieurs mesures.

???? IQ BENCHMARK ????

GPT-5 PRO (vision) – Highest IQ in offline test ( 3rd rank is 5 pro normal)

GPT-5 PRO (normal) – Highest IQ in online test ( 3rd rank is 5 pro vision)

Gemini 2.5 pro is the second rank in both online and offline tests ( this is more impressive) pic.twitter.com/WBZaNSyH8Y
— Chetaslua (@chetaslua) August 13, 2025

Encore des hallucinations et des erreurs ?

Les tests montrent que GPT-5 réduit significativement les hallucinations comparé aux modèles précédents.

Sur certains benchmarks ouverts, il atteint un taux d’erreur inférieur à 1 %, avec environ 1,6 % sur des cas médicaux difficiles (HealthBench).

En « mode thinking », ses erreurs en situation réelle chutent de 11,6 % à 4,8 %. Toutefois, un autre test par Vectara note un taux légèrement plus élevé que certains modèles spécialisés (1,4 % vs 1,2 %).

Des plateformes indépendantes comme Vellum, Artificial Analysis ou LMArena indiquent que GPT-5 domine ses concurrents (Google Gemini, Grok, etc.) dans des domaines comme le raisonnement, les mathématiques, le codage ou la compréhension visuelle.

Là où il manque de peu la première place, c’est sur des tests de type « reasoning social » comme SimpleBench, où Gemini ou Claude l’emportent.

Scénarios réalistes et intelligence émotionnelle

Selon plusieurs sources, GPT-5 surpasse GPT-4 dans plusieurs situations réalistes. Comme la résolution d’énigmes policières (en adoptant une approche forensique méthodique). Ou encore les synthèses créatives, la planification budgétaire pratique, le soutien émotionnel empathique, l’écriture narrative impactante, etc.

GPT-5 s’impose en effet comme un partenaire de pensée le plus convaincant et le plus réaliste, du mois sur le papier. Il faudra faire des tests pratiques pour en être sûr.

Dans les cas concrets, il y a ceux qui décrivent GPT-5 comme un modèle qui manque de qualité et de performances.

What the heck???

OpenAI GPT-5 Thinking is the worst model on IQ tests.

GPT-5 Thinking scored 85 on Mensa Norway and 57 on the offline test.

GPT-5 scored 118 on Mensa Norway and 70 on the offline test.

Something is seriously broken with GPT-5. pic.twitter.com/LEPgH0d1w6
— AshutoshShrivastava (@ai_for_success) August 9, 2025

Ce qui a emmené les utilisateurs à des critiques dès le premier jour

Le lancement de GPT-5 a généré des avis contrastés. Wired et d’autres médias saluent un jalon majeur vers l’AGI, mettant en avant la vitesse, la précision, la baisse des hallucinations, ainsi que la puissance multimodale et de programmation.

Cependant, certains utilisateurs expriment une certaine déception. Malgré sa qualité technique, GPT-5 est parfois perçu comme froid ou impersonnel (un cas typique des chatbots IA apparemment), et moins attachant que GPT-4o.

Les autres reproches concernent aussi les limitations de réponse (weekly question limit) ou l’absence du choix explicite de modèle.

En réponse, OpenAI a restauré l’accès à GPT-4o pour les abonnés Plus et travaille à des indicateurs UI montrant quel modèle est utilisé.

Quelles sont les forces et limites réelles de GPT-5 ?

Dès les premiers jours après sa sortie, les tests de sécurité ont révélé de faibles performances.

L’expert SPLX obtient un score de 2,4 % en sécurité, 13,6 % en sûreté, et 1,7 % en alignement business. À en croire, je me dis que la version par défaut de GPT-5 est quasi inutilisable en entreprise.

Selon Neuraltrust, le modèle a même été poussé à générer des instructions précises pour fabriquer des explosifs.

OpenAI et Microsoft ont de leur côté affirmé que des tests internes indiquaient un des meilleurs profils de sécurité parmi les modèles publiés.

Mais la discordance avec les résultats externes accentue les inquiétudes sur la robustesse et la fiabilité du modèle en contexte professionnel.

Pourquoi GPT-5 suscite-t-il à la fois enthousiasme et prudence ?

Alors que GPT-5 marque une étape remarquable, certains experts ajoutent une perspective plus prudente.

L’article de The New Yorker suggère que les progrès récents reflètent plutôt des gains progressifs (diminishing returns) que des avancées radicales. Il ajoute que l’IA pourrait bientôt atteindre un plateau sans véritable AGI.

GPT-5 est sans doute le modèle le plus sophistiqué et performant lancé par OpenAI à ce jour.

Sa capacité à s’adapter dynamiquement, ses performances exceptionnelles en santé ou en codage, et sa fiabilité accrue en font un outil puissant.

Toutefois, son adoption initiale a révélé des tensions entre technique et expérience utilisateur, et des vulnérabilités de sécurité soulignent la nécessité d’une vigilance continue.

Au final, GPT-5 incarne une avancée majeure, mais pas (encore) l’aboutissement de l’intelligence artifificielle générale.

With GPT-5 making so many waves,

I decided to run a GPT-5 vs Claude 4 sonnet test by building anInteractive app called PHYSICS UNLOCKED on @EmergentLabsHQ

You wouldn’t believe the results I got! pic.twitter.com/aqwTpnhL8m
— AI Frontliner (@AIFrontliner) August 9, 2025

FAQ — Questions fréquentes

Qu’est-ce que signifie « GPT-5 Thinking » ?

C’est le mode de raisonnement approfondi du modèle. Lorsqu’un prompt nécessite une réflexion complexe, GPT-5 active cette version plus lente, mais plus rigoureuse, offrant des réponses plus précises et documentées.

Puis-je choisir le modèle utilisé (mini, thinking, etc.) ?

Non, GPT-5 utilise un routeur automatique pour déterminer le meilleur sous-modèle selon la requête. Cependant, OpenAI commence à proposer des indicateurs visuels pour informer l’utilisateur du modèle utilisé.

GPT-5 est-il vraiment plus fiable que GPT-4 ?

Oui, dans de nombreux tests, GPT-5 affiche des taux d’hallucination plus faibles et de meilleures performances dans des domaines critiques comme la santé.

Y a-t-il des risques à utiliser GPT-5 dans un contexte professionnel ?

Certaines évaluations suggèrent que, dès le départ, le modèle présente des failles de sécurité. Des entreprises tierces qualifient la version par défaut de quasi inutilisable sans ajustements supplémentaires.

GPT-5 est-il une étape vers l’intelligence artificielle générale (AGI) ?

OpenAI le présente comme une étape significative vers l’AGI, mais plusieurs experts considèrent ses progrès comme progressifs, et non révolutionnaires

Partager l'article :

Facebook
Twitter
LinkedIn

Restez à la pointe de l'information avec
INTELLIGENCE-ARTIFICIELLE.COM !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Actualités

GPT-5 : révolution ou simple coup de com ? On a fait les tests

Sur quelle architecture repose GPT-5 et comment il fonctionne ?

Intégrations pratiques, tarification et accessibilité

Que vaut GPT-5 sur les benchmarks ?

On a testé GPT-5 en raisonnement médical multimodal

Encore des hallucinations et des erreurs ?

Scénarios réalistes et intelligence émotionnelle

Ce qui a emmené les utilisateurs à des critiques dès le premier jour

Quelles sont les forces et limites réelles de GPT-5 ?

Pourquoi GPT-5 suscite-t-il à la fois enthousiasme et prudence ?

FAQ — Questions fréquentes

Qu’est-ce que signifie « GPT-5 Thinking » ?

Puis-je choisir le modèle utilisé (mini, thinking, etc.) ?

GPT-5 est-il vraiment plus fiable que GPT-4 ?

Y a-t-il des risques à utiliser GPT-5 dans un contexte professionnel ?

GPT-5 est-il une étape vers l’intelligence artificielle générale (AGI) ?

Comprendre l’IA physique, des écrans aux robots

Le nouveau Siri arrive avec la première bêta publique d’iOS 27

Meta lance un détecteur d’images IA, mais un simple recadrage suffit à le piéger

OpenAI enterre son navigateur IA censé révolutionner Internet

OpenAI dévoile GPT-5.6 Sol, Terra et Luna : trois versions pour concurrencer Anthropic

OpenAI lance GPT-5.6 et ChatGPT Work pour contrer Anthropic

IA, conformité et souveraineté : l’open source européen pour la protection des données publiques

L’IA sur-mesure, un impératif légal face à l’urgence de la conformité

Pourquoi les femmes sont au cœur de l’urgence légale et éthique de l’IA ?

Sur quelle architecture repose GPT-5 et comment il fonctionne ?

Intégrations pratiques, tarification et accessibilité

Que vaut GPT-5 sur les benchmarks ?

On a testé GPT-5 en raisonnement médical multimodal

Encore des hallucinations et des erreurs ?

Scénarios réalistes et intelligence émotionnelle

Ce qui a emmené les utilisateurs à des critiques dès le premier jour

Quelles sont les forces et limites réelles de GPT-5 ?

Pourquoi GPT-5 suscite-t-il à la fois enthousiasme et prudence ?

FAQ — Questions fréquentes

Qu’est-ce que signifie « GPT-5 Thinking » ?

Puis-je choisir le modèle utilisé (mini, thinking, etc.) ?

GPT-5 est-il vraiment plus fiable que GPT-4 ?

Y a-t-il des risques à utiliser GPT-5 dans un contexte professionnel ?

GPT-5 est-il une étape vers l’intelligence artificielle générale (AGI) ?

ARTICLES SIMILAIRES

Tendances

La newsletter IA du futur

Interviews

Sur quelle architecture repose GPT-5 et comment il fonctionne ?

Pourquoi GPT-5 suscite-t-il à la fois enthousiasme et prudence ?