Réalité ou simple stratégie marketing ? On verra plus tard ce que vaut vraiment ce nouveau modèle o3-pro d’OpenAI. Mais en tout cas, l’entreprise le considère comme le modèle d’IA le plus avancé jamais créé jusqu’à aujourd’hui.
Ce modèle est avant tout une version plus avancée de o3 présenté en début d’année. Celle-ci fonctionne d’ailleurs selon le principe de réflexion progressive.
C’est ainsi que l’on obtient des réponses plus fiables et plus précises, même pour les sujets plus complexes comme les mathématiques et le codage.
o3-pro va-t-il remplacer o1-pro ?
Considéré comme un remplaçant à o1-pro, le modèle o3-Pro d’OpenAI sera déployé de manière échelonnée.
Les utilisateurs Pro et Team peuvent déjà accéder à ce nouveau modèle d’après les indications d’OpenAI.
Pour les abonnés Edu et Enterprise, il faut attendre la semaine prochaine pour avoir accès à o3-pro.
Côté prix, l’utilisation d’o3-pro via l’interface développeur suit un système de facturation basé sur les jetons.
Le coût s’élève en effet à 20 $ pour un million de jetons utilisés en entrée et 80 $ pour un million de jetons générés en sortie.
Pour rappel, un million de jetons correspond à 750 000 mots, soit l’équivalent de Guerre et Paix, le roman de Tolstoï.
Un must selon les experts
Les tests menés par des spécialistes révèlent qu’o3-pro surpasse systématiquement sa version précédente o3.
Cette supériorité se manifeste d’ailleurs dans tous les domaines évalués. Notamment les sciences, l’enseignement, le développement informatique, les applications commerciales et l’assistance rédactionnelle.
Les experts ont particulièrement apprécié les améliorations d’o3-pro concernant la netteté des explications. Mais aussi la complétude des réponses, le respect des consignes données et l’exactitude des informations fournies.
Concrètement, le modèle o3-pro dispose de capacités étendues qui enrichissent considérablement son utilité.
Elle peut par exemple effectuer des recherches internet, examiner et traiter différents types de documents.
OpenAI o3-pro peut aussi analyser des images et des contenus visuels. Et cela sans parler de son aptitude à exécuter du code Python et à mémoriser les préférences utilisateur pour personnaliser ses interactions.
Malgré ses performances, o3-pro présente encore certains inconvénients par rapport à son prédécesseur o1-pro.
C’est-à-dire que son temps de réponse est généralement plus long. Une latence qui s’explique avant tout par la complexité des traitements qu’il effectue.
D’autres limites à prendre en compte ?
Outre ses temps de réponses relativement longs, o3-pro fait aussi face à plusieurs contraintes d’utilisation.
Comme les discussions éphémères avec cette intelligence artificielle qui sont momentanément indisponibles dans ChatGPT pendant qu’OpenAI résout des difficultés techniques.
Par ailleurs, contrairement à d’autres modèles, o3-pro ne peut pas non plus créer d’illustrations ou de visuels.
Il est même impossible d’accéder à l’outil Canvas, quel que soit votre abonnement, bien que le modèle coûte 20 $ par mois.
o3-pro vs Claude 4 et Gemini 2.5
Malgré ces restrictions, ce nouveau modèle d’OpenAI démontre tout de même des capacités remarquables lors des évaluations standardisées.
Les mesures de performance qu’OpenAI a réalisées en interne révèlent des résultats exceptionnels sur les tests de référence les plus reconnus du secteur.
Dans l’évaluation AIME 2024, qui mesure les aptitudes mathématiques, o3-pro devance Gemini 2.5 Pro, le système le plus avancé de Google.
Il s’agit également d’une supériorité qui se confirme face à Claude 4 Opus d’Anthropic lors du test GPQA Diamond. Rappelons que cette dernière une évaluation particulièrement exigeante qui sonde les connaissances scientifiques de niveau universitaire avancé.
Grâce à ces résultats, o3-pro se positionne comme un concurrent sérieux dans la course à l’excellence en IA. Cela malgré les limitations techniques actuelles.
- Partager l'article :