GauGAN2, l’IA de Nvidia, transforme les phrases en images photoréalistes en temps réel.
Il y a quelques mois, Nvidia a lancé un nouvel outil qui permet de générer des images photoréalistes à partir de simples croquis. Cette fois, ce sont de simples mots d’une phrase que l’IA utilise pour générer des images proches de la réalité.
Nvidia va toujours de l’avant avec GauGAN2
GauGAN est un outil développé par Nvidia qui permet de générer des photos à l’aide des réseaux antagonistes génératifs (GAN). Il s’agit d’un algorithme de deep learning utilisé pour générer des instances de données semblables à de données existantes.
Nvidia a conçu GauGAN pour faciliter la création de scènes photoréalistes à partir de rien. Cette IA utilise différentes textures d’objets à la place des couleurs pour créer des images. Il y a quelques mois, l’entreprise a lancé un outil appelé Nvidia Canvas, doté de l’IA GauGAN, qui transforme les croquis en images photoréalistes.
Pour cette nouvelle version GauGAN2, Nvidia propose de créer des images en utilisant uniquement des mots. Autrement dit, ce nouvel outil transforme les phrases en photos vraisemblables.
Générer une photo grâce à la saisie d’un texte
Pour générer une photo avec GauGAN2, il suffit de taper une phrase simple. L’IA génère une scène en temps réel au fur et à mesure qu’un mot est ajouté. Si l’utilisateur modifie un mot ou ajoute un adjectif, les GAN modifient l’image instantanément. Et à mesure qu’un mot s’ajoute à la phrase, l’image générée par l’IA s’enrichit.
Entre autres, ce modèle d’IA combine la cartographie par segmentation, l’inpainting et la transformation de texte en image. GauGAN permet de donner forme à la vision de chaque créateur dans une image de haute qualité. Par la suite, les utilisateurs peuvent personnaliser les résultats avec les autres outils de Nvidia, en ajoutant par exemple plus d’arbres ou des nuages dans le ciel. L’outil peut également servir à créer des images surréalistes, comme la vision d’une planète imaginaire.
GauGAN2 a été entraîné sur 10 millions d’images de paysage de haute qualité. L’équipe de Nvidia a utilisé le supercalculateur Selene qui est l’un des meilleurs au monde. Nvidia propose déjà aux utilisateurs de tester les nouvelles fonctionnalités de GauGAN2 sur NVIDIA AI Demos.
- Partager l'article :