GPT-5 : Ce que l’on sait déjà sur cette prochaine mise à jour

Le successeur de GPT-4 se profile à l’horizon. GPT-5, le nouveau modèle de langage d’OpenAI, GPT-5, promet des capacités accrues. En attendant sa sortie officielle, quelques informations distillées par OpenAI nourrissent l’impatience du grand public. Voici tout ce que l’on sait pour le moment sur cette nouvelle mise à jour majeure de la start-up de Sam Altman.

Comprendre GPT-5 en quelques lignes

GPT ou Generative Pre-trained Transformer est un modèle de langage développé par la start-up californienne OpenAI. La prochaine version, très attendue, GPT-5 est la cinquième itération de ce modèle.

Depuis son lancement initial en 2018, GPT a connu une évolution constante. GPT-2 a été publié en 2019, suivi de GPT-3 en 2020. Fin 2023, OpenAI a lancé ChatGPT, une IA générative basée sur GPT-3.5. Cette technologie a rapidement gagné en popularité pour sa capacité à comprendre le langage naturel et à répondre aux requêtes de manière fluide et cohérente. C’est d’ailleurs à partir du lancement de cette grande nouveauté de la start-up que l’IA n’a plus cessé de faire parler d’elle.

L’entreprise a effectué une nouvelle mise à jour de son modèle et lance en avril 2023 GPT-4. Cette nouvelle version se distingue par l’intégration de GPT-Vision, lui permettant de comprendre et d’interpréter les images. OpenAI n’a cessé de perfectionner ce modèle. En novembre, GPT-4 Turbo a propulsé la technologie à un niveau supérieur. Multimodal, il s’agit actuellement du LLM le plus puissant du secteur.

D’autres acteurs du secteur ont développé leurs propres LLM pour rivaliser GPT-4. Google, entre autres, a relevé le défi en lançant Gemini en décembre. Suite à des améliorations apportées par le géant américain, son modèle a pu surpasser GPT-4 d’OpenAI. En revanche, le modèle Turbo d’OpenAI reste pour le moment en tête du classement.

L’avenir s’annonce encore plus radieux avec l’arrivée prochaine de GPT-5. Ce modèle s’appuie sur les bases de ses prédécesseurs et promet des capacités encore plus impressionnantes. Entraîné sur un vaste ensemble de données textuelles et visuelles telles que des articles, livres et publications sur les réseaux sociaux, GPT-5 sera en mesure de répondre aux requêtes des utilisateurs avec des performances encore accrues. Comme les précédentes versions, ce système d’intelligence artificielle repose sur l’architecture des réseaux de neurones à transformateurs.

Quelles innovations majeures pouvons-nous attendre de ce modèle ?

Lors du Sommet mondial des gouvernements qui s’est déroulé à Dubaï, Sam Altman a indiqué quelques innovations qui distingueront GPT-5.

Un LLM avec moins d’hallucinations

L’un des points forts de GPT-5 réside dans sa capacité à réduire les hallucinations. Ce problème, fréquent chez les LLM, se traduit par des réponses inventées de toutes pièces, souvent erronées ou trompeuses.

GPT-5 s’annonce plus précis et fiable que ses prédécesseurs. Il aura la capacité de vérifier la véracité des informations générées en s’appuyant sur des sources externes. Lorsqu’il aura un doute sur une réponse, GPT-5 sera également en mesure de reconnaître son incertitude et de l’indiquer à l’utilisateur. Cet effort accru pour contrôler la justesse des réponses fournies permettra de faire plus confiance au modèle. On peut donc s’attendre à une IA plus performante, générant des réponses certifiées.

La prise en charge des vidéos

GPT-4 a déjà ouvert la voie à l’interaction multimodale en gérant les textes, les images et les sons. Vous pouvez par exemple lui montrer une photo et poser des questions concernant celle-ci et l’IA vous répondra. GPT-4 dispose aussi d’une fonctionnalité de commande vocale. Si vous ne voulez pas écrire votre prompt, vous pouvez tout simplement le dicter. Mais, il manquait encore une pièce maîtresse à ce puzzle : la vidéo. C’est là que GPT-5 promet de révolutionner l’IA. Ce modèle offre une prise en charge complète de ce format. Il s’agit donc d’un LLM entièrement multimodal.

Mais cette nouvelle capacité de GPT-5 suscite des interrogations. En fait, on ne sait pas encore si le modèle aura la capacité d’analyser des vidéos, d’en générer ou les deux. Pour information, OpenAI a lancé récemment Sora, une IA génératrice de vidéos. Cette innovation pourrait laisser penser que GPT-5 serait capable de générer des vidéos.

here is sora, our video generation model:https://t.co/CDr4DdCrh1

today we are starting red-teaming and offering access to a limited number of creators.@_tim_brooks @billpeeb @model_mechanic are really incredible; amazing work by them and the team.

remarkable moment.
— Sam Altman (@sama) February 15, 2024

Modularité et personnalisation

GPT-4 a déjà marqué une avancée significative en matière de personnalisation avec l’introduction des GPT personnalisés vers la fin de l’année 2023. Cette nouvelle fonctionnalité vous permet de créer un GPT sur-mesure dans le domaine de votre choix : cuisine, voyage, mode, création graphique, en codage, etc.

GPT-5 devrait pousser plus loin encore ce concept de personnalisation. Et, en plus de cela, le modèle sera modulaire. Les utilisateurs devront pouvoir sélectionner les modules dont ils souhaitent utiliser. « Nous voulons rendre possible l’utilisation de vos propres données. La capacité de vous connaître, de connaître votre courrier électronique, votre calendrier, la façon dont vous souhaitez prendre vos rendez-vous, la connexion à d’autres sources de données externes, tout cela constitue quelques-uns des domaines d’amélioration les plus importants », a annoncé le patron d’OpenAI.

GPT-5, la première AGI ?

i have been told that gpt5 is scheduled to complete training this december and that openai expects it to achieve agi.

which means we will all hotly debate as to whether it actually achieves agi.

which means it will.
— Siqi Chen (@blader) March 27, 2023

Atteindre l’AGI ou intelligence artificielle générale forte est l’ambition des chercheurs de l’IA. Cette forme d’IA forte rivalise avec le cerveau humain. En d’autres termes, elle a la capacité d’effectuer n’importe quelle tâche qu’un être humain peut réaliser.

Le GPT-5 d’OpenAI pourrait-il être le premier modèle à atteindre cette suprématie ? Rappelons que l’entreprise californienne a connu une crise interne en novembre engendrant le licenciement de Sam Altman. En fait, le conseil d’administration a licencié le PDG de l’entreprise pour manque de transparence. En cause, un projet secret baptisé Q*, jugé trop proche de l’AGI et donc potentiellement dangereux. Les rumeurs circulaient alors que le prochain LLM de la start-up, c’est-à-dire le GPT-5 se rapprochera d’une AGI.

Ce qui est déjà sûr est que GPT-5 surpassera GPT-4 dans tous les domaines. Selon Sam Altman, le modèle connaîtra des améliorations dans quasiment toutes les tâches que le modèle entreprend. Il a ajouté que « ce n’est pas d’un simple mis à niveau, mais d’une nouvelle frontière dans la capacité de l’IA à comprendre, interagir et aider ».

Il compare notamment l’avènement de GPT-5 à l’arrivée des premiers téléphones portables. À leurs débuts, ils servaient uniquement à passer des appels, et ce stade est déjà dépassé. Aujourd’hui, les smartphones intègrent des technologies d’IA révolutionnaires qui transforment notre façon de vivre et de travailler. De même, GPT-5 promet de dépasser les limitations de ses prédécesseurs.

Le nombre de paramètres de GPT-5 n’a pas encore été communiqué par OpenAI, mais il pourrait dépasser le trillion selon les rumeurs. Un bond spectaculaire par rapport aux 175 milliards de GPT-4. Pour permettre l’entrainement efficace d’un modèle aussi vaste, les équipes travailleraient également sur des méthodes de parallélisation et d’optimisation poussées des calculs. L’objectif est de réduire les coûts et les temps de traitement.

Quelles seront les utilisations de GPT-5 ?

GPT-5 conservera toutes les fonctionnalités de GPT-4, mais avec des performances accrues. Par exemple, pour la conversation, il sera capable d’échanges plus pertinents et naturels, aussi bien à l’écrit qu’à l’oral. Ce modèle polyvalent peut endosser de nombreux rôles : coach personnel, professeur particulier, assistant virtuel, etc.

Côté rédaction de contenus, GPT-5 produira des textes de meilleure qualité, en respectant vos consignes de longueur, de style et de ton. Vous pourrez l’utiliser pour rédiger des articles de blog, des publications sur les réseaux, des synthèses… avec une écriture créative. En entreprise, GPT-5 trouvera de multiples usages : production de rapports, rédaction de contrats juridiques, génération de nouveaux concepts créatifs, etc.

Outre les textes, ce modèle génèrera également des contenus multimédias comme des sons, des images, voire des vidéos réalistes. Un atout précieux si vous travaillez dans le marketing. Dans l’éducation, GPT-5 personnalisera l’apprentissage en fournissant des tutoriels adaptés à chaque élève. Il les accompagnera pour développer leur esprit critique et d’autres compétences essentielles.

Et pour les codeurs, ce modèle vous permettra de générer du code complet, sans avoir à vous creuser la tête. GPT-5 est également capable de corriger les erreurs de code. Plus besoin de passer des heures à rechercher la source d’un problème. Il suffit de prendre une photo du code erroné et de le soumettre à GPT-5.Le modèle identifiera les erreurs et vous proposera des solutions de correction.

Les possibilités qu’offriront par GPT-5 semblent infinies. Ce modèle de langage révolutionnaire se présente comme un véritable assistant du quotidien, capable de vous assister dans une multitude de tâches.

Quand sortira alors GPT-5 ?

La communauté de l’intelligence artificielle attend avec impatience la sortie de GPT-5. Initialement prévu pour fin 2023, OpenAI n’a toujours pas officialisé la date de sortie du modèle. GPT-4 avait été présenté en mars 2023. Son successeur sera-t-il dévoilé avant ou après cette date ? La question reste pour le moment sans réponse. Pour rappel, la start-up californienne a déposé la marque GPT-5 auprès de l’United States Patent and Trademark Office au cours de l’été dernier.

Pendant ce temps, la pression monte côté concurrence, Google en tête. Après le lancement de Gemini 1.0 en décembre 2023, le géant américain a rapidement enchaîné avec Gemini Ultra, réputé supérieur à GPT-4, suivi de Gemini 1.5 une semaine après. Face à ce rythme effréné d’innovations, OpenAI semble se retrouver sous pression pour dévoiler sa nouvelle avancée en matière de grand modèle de langage.

Partager l'article :