Il y a tout juste deux jours, je vous ai parlé du dernier modèle de génération d’images natif d’OpenAI. Celui-ci permet de créer des images via ChatGPT et Sora sas avoir à passer par DALL-E 3. Et comme l’a indiqué OpenAI dans son communiqué, ce modèle générateur d’images natifs de ChatGPT est déjà disponible pour tous les utilisateurs gratuits, Plus, Pro et Team. Si vous êtes abonné à ChatGPT Edu et Enterprise, le modèle vous sera accessible dès la semaine prochaine.
Peu de temps après sa sortie, ce modèle natif de génération d’images de ChatGPT a été considéré comme l’un des meilleurs outils disponibles pour générer des images via l’IA.
Mais ceux qui ont un compte gratuit devront se confronter à certaines limites. Notamment une limitation du nombre de téléchargements.
Un modèle qui repose sur le RLHF
L’un des plus grands avantages de cette IA générative de ChatGPT, c’est la qualité et le réalisme des rendus.
Les textes générés sur les images sont également plus lisibles comparé à d’autres IA génératives d’images.
Et cette capacité vient d’une autre technique d’apprentissage qui répond au nom de RLHF ou Reinforcement Learning from Human Feedback. Ou Apprentissage par renforcement à partir du feedback humain en français.
Comme l’a indiqué Gabriel Goh, chercheur principal du projet, OpenAI a dû faire appel à une centaine de formateurs humains. Ces derniers ont ensuite examiné ce modèle de génération d’image natif de ChatGPT.
Tous les défauts, particulièrement les déformations du visage et des mains, ainsi que les fautes de frappe, ont été identifiées et inspectées en vue de les améliorer.
J’ai testé le nouveau modèle GPT 4o et il est extraordinaire.
C’est le modèle de génération d’image le plus abouti et d’assez loin.
Petit thread 🧵 pic.twitter.com/a8DQdXq0hA— Imho 🌊🌵 (@Issakimho) March 27, 2025
OpenAI promet une meilleure précision dès la semaine prochaine
Ce modèle natif de génération d’images de GPT-4o permettrait par ailleurs de créer des arrière-plans transparents.
Ce qui est un atout notable puisque pour les créateurs, ils pourront facilement concevoir des logos en format PNG. Cela sans recourir à un autre outil pour supprimer l’arrière-plan de l’image.
Bien qu’OpenAI ait déjà identifié et résoudre certains défauts de ce modèle de génération d’images, il y a encore d’autres points d’améliorations sur lesquels se concentrer davantage.
Comme pour le cas de ChatGPT, avant et jusqu’à maintenant d’ailleurs, le modèle semble encore faire des hallucinations.
Mais d’après ce qu’a publié OpenAI, ils sont sur le point de préparer de nouvelles mises à jour pour résoudre le problème.
On devrait de ce fait ne plus se confronter à ce genre de gène d’ici la semaine prochaine. En attendant, j’aimerais vous parler d’un autre élément essentiel dans le cadre de l’utilisation des IA génératives d’images.
Les images générées par ChatGPT sont-elles protégées contre la copie ?
Cette question relève de l’éthique et de la législation. Et comme d’habitude, OpenAI insiste sur le fait que ses modèles sont entraînés à partir des données accessibles au grand public.
Jusqu’ici, tout va bien. Mais d’un autre côté, l’entreprise fait aujourd’hui l’objet de plusieurs poursuites judiciaires. E cela pour vol de données et non-respect du droit d’auteur.
Pourtant, en ce qui concerne cet outil de génération d’images de ChatGPT, il semble que toutes les images qui proviennent du modèle n’incluent pas de filigranes.
À la place, OpenAI utilisera une autre stratégie pour protéger ses contenus. Et ce n’est autre que des métadonnées C2PA qui sont jusqu’ici la norme en matière de protection de contenus.
- Partager l'article :