GPT-5 est le tout dernier modèle de langage qu’OpenAI a développé et lancé officiellement le jeudi 7 août 2025. Il fait référence à une consolidation des générations précédentes. Dont GPT-4, GPT-4o, GPT-4.1, GPT-4.5, les séries o3, o4-mini, et autres modèles de l’entreprise. GPT-5 vient alors les réunir dans un modèle unifié qui adapte automatiquement ses capacités selon nos besoins. Notamment la rapidité ou la profondeur du raisonnement. Ce qui fait que ChatGPT va ajuster automatiquement son niveau de raisonnement en fonction de la complexité de nos requêtes.
Accessible via ChatGPT, en version gratuite comme payante, ainsi que par API, GPT-5 offre différents niveaux de modèles.
Le choix va dépendre en grande partie des cas d’usage de chaque utilisateur. Mais en général, on a le choix entre GPT-5 standard, mini, thinking, thinking-mini, et plus encore.
Mais que vaut-il vraiment ? Après nos tests, GPT-5 peut s’aligner aux autres modèles phares de ses concurrents.
Sauf qu’en seulement 24 heures, OpenAI a dû remettre sur pied l’ancien modèle GPT-4o après que les utilisateurs se sont plaints de GPT-5.
Sur quelle architecture repose GPT-5 et comment il fonctionne ?
GPT-5 repose sur un système de routing dynamique (routeur en temps réel) qui choisit le sous-modèle le plus adapté à chaque requête.
Ce routeur intègre une logique de sélection entre un modèle à haut débit rapide et un modèle « thinking » tourné vers le raisonnement plus complexe.
Par exemple, une question simple peut être traitée instantanément par GPT-5-mini, tandis qu’une recherche approfondie ou nécessitant une réflexion poussée déclenche le modèle GPT-5-thinking plus lent, mais plus rigoureux.
Cela simplifie l’expérience utilisateur, car il n’est plus nécessaire de choisir manuellement entre différents modèles.
Mais cette automatisation peut aussi dérouter certains utilisateurs habitués à contrôler le modèle sollicité.
First test with GPT-5 and v0.
Vibe-coded a basic operating system, apps and some games.
What have you created with GPT-5 so far? pic.twitter.com/PDACRpVkhY— Jerrod Lew (@jerrod_lew) August 7, 2025
Intégrations pratiques, tarification et accessibilité
ChatGPT avec GPT-5 propose des personnalités de conversation comme Cynic, Robot, Listener ou Nerd pour ajuster le ton des échanges.
Il intègre également des connecteurs que je trouve assez pratiques vers Gmail, Google Calendar, et propose même un mode voix avancé. Ce qui lui offre plusieurs options esthétiques et sonores.
GPT-5 est disponible en plusieurs variantes : Standard, Mini, Nano, Pro et Thinking. Cela afin de convenir à différentes utilisations, du plus économique au plus puissant.
Les tarifs qu’OpenAI propose vont jusqu’à 10 $ pour un million de jetons de sortie, avec d’autres modèles de tarification qui peuvent varier selon les usages.
Que vaut GPT-5 sur les benchmarks ?
Sur les benchmarks dédiés au codage, GPT-5 marque des points impressionnants. Par exemple, sur SWE-bench Verified (problèmes de développement Python en contexte réel), il atteint 74,9 %, contre 69,1 % pour o3 et seulement 54,6 % pour GPT-4.
Sur Aider Polyglot (édition de code multilingue), il obtient 88 %, avec une réduction drastique d’erreurs.
En outre, en mode « thinking » (raisonnement encadré), les performances s’améliorent encore, avec un gain de +22,1 points sur SWE-bench et +61,3 points sur Aider Polyglot.
En mathématiques avancées, on peut dire que GPT-5 excelle dans le domaine. Sur AIME 2025 (problèmes mathématiques sans outils), il atteint 94,6 % (vs 88,9 % pour o3), et sur le HMMT, il obtient 93,3 % (vs 85 % pour o3).
En revanche, sur FrontierMath (math experte avec outil Python), il affiche 26,3 %, devant o3 (15,8 %).
Quant aux tâches de révision de code (PR Benchmark), la version à budget moyen de GPT-5 atteint 72,2, celle à petit budget 67,8, ce qui constitue un solide résultat compte tenu de l’équilibre entre vitesse et ressources.
On a testé GPT-5 en raisonnement médical multimodal
GPT-5 excelle particulièrement dans le domaine médical, notamment dans les évaluations multimodales (texte + images).
Sur des benchmarks comme MedQA, MedXpertQA, MMLU médical et VQA-RAD, GPT-5 dépasse les performances de GPT-4o.
Il affiche d’ailleurs des gains de plus de 29 % en raisonnement, et même jusqu’à 36 % en compréhension, surpassant des experts humains en plusieurs mesures.
🚨 IQ BENCHMARK 🚨
— Chetaslua (@chetaslua) August 13, 2025
GPT-5 PRO (vision) – Highest IQ in offline test ( 3rd rank is 5 pro normal)
GPT-5 PRO (normal) – Highest IQ in online test ( 3rd rank is 5 pro vision)
Gemini 2.5 pro is the second rank in both online and offline tests ( this is more impressive) pic.twitter.com/WBZaNSyH8Y
Encore des hallucinations et des erreurs ?
Les tests montrent que GPT-5 réduit significativement les hallucinations comparé aux modèles précédents.
Sur certains benchmarks ouverts, il atteint un taux d’erreur inférieur à 1 %, avec environ 1,6 % sur des cas médicaux difficiles (HealthBench).
En « mode thinking », ses erreurs en situation réelle chutent de 11,6 % à 4,8 %. Toutefois, un autre test par Vectara note un taux légèrement plus élevé que certains modèles spécialisés (1,4 % vs 1,2 %).
Des plateformes indépendantes comme Vellum, Artificial Analysis ou LMArena indiquent que GPT-5 domine ses concurrents (Google Gemini, Grok, etc.) dans des domaines comme le raisonnement, les mathématiques, le codage ou la compréhension visuelle.
Là où il manque de peu la première place, c’est sur des tests de type « reasoning social » comme SimpleBench, où Gemini ou Claude l’emportent.
Scénarios réalistes et intelligence émotionnelle
Selon plusieurs sources, GPT-5 surpasse GPT-4 dans plusieurs situations réalistes. Comme la résolution d’énigmes policières (en adoptant une approche forensique méthodique). Ou encore les synthèses créatives, la planification budgétaire pratique, le soutien émotionnel empathique, l’écriture narrative impactante, etc.
GPT-5 s’impose en effet comme un partenaire de pensée le plus convaincant et le plus réaliste, du mois sur le papier. Il faudra faire des tests pratiques pour en être sûr.
Dans les cas concrets, il y a ceux qui décrivent GPT-5 comme un modèle qui manque de qualité et de performances.
What the heck???
— AshutoshShrivastava (@ai_for_success) August 9, 2025
OpenAI GPT-5 Thinking is the worst model on IQ tests.
GPT-5 Thinking scored 85 on Mensa Norway and 57 on the offline test.
GPT-5 scored 118 on Mensa Norway and 70 on the offline test.
Something is seriously broken with GPT-5. pic.twitter.com/LEPgH0d1w6
Ce qui a emmené les utilisateurs à des critiques dès le premier jour
Le lancement de GPT-5 a généré des avis contrastés. Wired et d’autres médias saluent un jalon majeur vers l’AGI, mettant en avant la vitesse, la précision, la baisse des hallucinations, ainsi que la puissance multimodale et de programmation.
Cependant, certains utilisateurs expriment une certaine déception. Malgré sa qualité technique, GPT-5 est parfois perçu comme froid ou impersonnel (un cas typique des chatbots IA apparemment), et moins attachant que GPT-4o.
Les autres reproches concernent aussi les limitations de réponse (weekly question limit) ou l’absence du choix explicite de modèle.
En réponse, OpenAI a restauré l’accès à GPT-4o pour les abonnés Plus et travaille à des indicateurs UI montrant quel modèle est utilisé.
Quelles sont les forces et limites réelles de GPT-5 ?
Dès les premiers jours après sa sortie, les tests de sécurité ont révélé de faibles performances.
L’expert SPLX obtient un score de 2,4 % en sécurité, 13,6 % en sûreté, et 1,7 % en alignement business. À en croire, je me dis que la version par défaut de GPT-5 est quasi inutilisable en entreprise.
Selon Neuraltrust, le modèle a même été poussé à générer des instructions précises pour fabriquer des explosifs.
OpenAI et Microsoft ont de leur côté affirmé que des tests internes indiquaient un des meilleurs profils de sécurité parmi les modèles publiés.
Mais la discordance avec les résultats externes accentue les inquiétudes sur la robustesse et la fiabilité du modèle en contexte professionnel.
Pourquoi GPT-5 suscite-t-il à la fois enthousiasme et prudence ?
Alors que GPT-5 marque une étape remarquable, certains experts ajoutent une perspective plus prudente.
L’article de The New Yorker suggère que les progrès récents reflètent plutôt des gains progressifs (diminishing returns) que des avancées radicales. Il ajoute que l’IA pourrait bientôt atteindre un plateau sans véritable AGI.
GPT-5 est sans doute le modèle le plus sophistiqué et performant lancé par OpenAI à ce jour.
Sa capacité à s’adapter dynamiquement, ses performances exceptionnelles en santé ou en codage, et sa fiabilité accrue en font un outil puissant.
Toutefois, son adoption initiale a révélé des tensions entre technique et expérience utilisateur, et des vulnérabilités de sécurité soulignent la nécessité d’une vigilance continue.
Au final, GPT-5 incarne une avancée majeure, mais pas (encore) l’aboutissement de l’intelligence artifificielle générale.
With GPT-5 making so many waves,
— AI Frontliner (@AIFrontliner) August 9, 2025
I decided to run a GPT-5 vs Claude 4 sonnet test by building anInteractive app called PHYSICS UNLOCKED on @EmergentLabsHQ
You wouldn’t believe the results I got! pic.twitter.com/aqwTpnhL8m
FAQ — Questions fréquentes
Qu’est-ce que signifie « GPT-5 Thinking » ?
C’est le mode de raisonnement approfondi du modèle. Lorsqu’un prompt nécessite une réflexion complexe, GPT-5 active cette version plus lente, mais plus rigoureuse, offrant des réponses plus précises et documentées.
Puis-je choisir le modèle utilisé (mini, thinking, etc.) ?
Non, GPT-5 utilise un routeur automatique pour déterminer le meilleur sous-modèle selon la requête. Cependant, OpenAI commence à proposer des indicateurs visuels pour informer l’utilisateur du modèle utilisé.
GPT-5 est-il vraiment plus fiable que GPT-4 ?
Oui, dans de nombreux tests, GPT-5 affiche des taux d’hallucination plus faibles et de meilleures performances dans des domaines critiques comme la santé.
Y a-t-il des risques à utiliser GPT-5 dans un contexte professionnel ?
Certaines évaluations suggèrent que, dès le départ, le modèle présente des failles de sécurité. Des entreprises tierces qualifient la version par défaut de quasi inutilisable sans ajustements supplémentaires.
GPT-5 est-il une étape vers l’intelligence artificielle générale (AGI) ?
OpenAI le présente comme une étape significative vers l’AGI, mais plusieurs experts considèrent ses progrès comme progressifs, et non révolutionnaires
- Partager l'article :

