in

GPT-5.5 (Spud) : OpenAI récupère sa couronne et propulse l’IA dans l’ère de l’autonomie totale

GPT-5.5 Spud

Le séisme que tout le secteur attendait a enfin eu lieu. Hier soir, OpenAI a levé le voile sur son projet « Spud », officiellement baptisé GPT-5.5. Après une période de domination partagée avec Anthropic et Google, la firme de Sam Altman reprend seule la tête des classements mondiaux. 

Conçu pour le travail autonome multi-étapes, GPT-5.5 planifie, exécute et valide des projets complexes de 20 heures sans intervention humaine

Mais il faut reconnaître que cette puissance brute a un prix, tant financier que sécuritaire.

Spud n’a plus besoin de supervision

La grande rupture de GPT-5.5 réside dans sa capacité à déléguer des tâches complexes de bout en bout

YouTube video

Il s’agit en effet d’un agent de travail automatisé capable de découper un projet en plusieurs étapes, analyser les résultats intermédiaires et corriger sa propre trajectoire.

Et avec un score de 82,7 % sur Terminal-Bench 2.0, il écrase son prédécesseur et ses concurrents. Il peut même résoudre des problèmes de programmation qui nécessiteraient normalement une semaine de travail humain.

Mais malgré sa complexité, le modèle est plus efficace. Spud offre même des performances de pointe à un coût d’inférence réduit de moitié par rapport aux modèles de codage actuels.

Une infrastructure dopée par NVIDIA (GB300)

Le déploiement de GPT-5.5 marque également le succès de l’intégration matérielle. Développé sur les nouveaux systèmes NVIDIA GB200 et GB300-NVL72, le modèle affiche une vitesse de génération des jetons accrue de 20 %

Cette optimisation permet de maintenir une latence très faible malgré une intelligence bien supérieure.

Mais cette puissance a un coût qui engendre des tarifs Pro stratosphériques

Si l’accès via ChatGPT est immédiat pour les abonnés, les tarifs de l’API (prévue prochainement) font déjà grincer des dents.

  • GPT-5.5 Standard : 5 $ / 1M jetons entrée ;
  • GPT-5.5 Pro : un tarif record de 30 $/ 1M jetons entrée et 180$ / 1M sortie.
    Ce positionnement élitiste réserve la version Pro aux tâches de recherche scientifique critique ou aux analyses financières massives, comme celle réalisée en interne sur plus de 71 000 pages de formulaires fiscaux, bouclée en quelques jours.

Que vaut GPT-5.5 face à la concurrence ?

Référence (Benchmark)GPT-5.5Claude Opus 4.7Gemini 3.1 Pro
Terminal-Bench 2.0 (Code)82,7 %69,4 %68,5 %
FrontierMath (Maths Niv. 4)35,4 %22,9 %16,7 %
SWE-Bench Pro (Codage)58,6 %64,3 %54,2 %
ARC-AGI-2 (Raisonnement)85,0 %75,8 %77,1 %
Diamond GPQA (Science)93,6 %94,2 %94,3 %

Si GPT-5.5 domine largement sur le code brut et les mathématiques de haut niveau, Claude Opus 4.7 conserve une légère avance sur le codage agentique réel (SWE-Bench Pro), tandis que Gemini 3.1 Pro reste le maître de la science pure (GPQA).

Des filtres renforcés et un accès restreint

OpenAI a classé son nouveau modèle comme présentant un risque « élevé » en cybersécurité et en biologie/chimie. 

En conséquence, les filtres sont devenus beaucoup plus stricts, ce qui pourrait frustrer les utilisateurs initiaux. 

Pour les chercheurs légitimes, l’entreprise impose désormais une authentification via le programme « Trusted Access for Cyber », actant la fin de l’accès totalement libre aux modèles de frontière.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !