dans

GAN, le meilleur moteur de rendu du visage en images de synthèse

GAN pour le rendu du visage en images de synthèse

Le GAN s’est révélé être la technologie qui révolutionnerait les images de synthèse, mais le visage lui donne du fil à retordre.

Devant une photo générée par une IA et une photo réelle, vous pourrez avoir des difficultés à faire la distinction. Mais aujourd’hui encore, il reste un écart considérable entre les vidéos en images de synthèses et réelles. Néanmoins, que ce soit pour les photos ou pour les vidéos, le rendu du visage reste un véritable défi.

Le visage synthétique, un défi irrésolu

Les GAN ou les réseaux antagonistes génératifs sont des algorithmes de deep learning capable de générer des données ressemblant à des données réelles. Par exemple, un GAN peut créer un visage en 3D très réaliste. Cette forme d’IA s’est révélée comme la solution ultime pour générer des médias synthétiques convaincants. InterFaceGAN est peut-être le moteur de rendu de visage en images de synthèse GAN le plus avancé. Mais pour produire des vidéos, il semble encore être loin du compte.

Par conséquent, les chercheurs en synthèse faciale GAN reportent leur attention sur les visages CGI paramétriques traditionnels. Dans ce domaine, Disney a pris le devant avec son initiative Rendering with Style. Celle-ci associe les cartes de textures traditionnelles à l’imagerie générée par le GAN pour créer des animations de type deepfake. Cela a permis d’apporter des améliorations considérables dans le rendu de visage en images de synthèses GAN, notamment les changements de pose et d’expression de la tête. Mais cette technique n’est toujours pas à la hauteur pour conserver la texture des cheveux et le positionnement des traits basiques du visage. Il en est de même pour les 3DMM, l’OSFR et les NeRF.

Les GAN sont-ils alors réellement utiles dans les images de synthèse de visage ?

Les utilisateurs de GAN continuent d’explorer toutes les pistes pour réaliser des expressions et des poses réalistes du visage en images de synthèse. Malgré les différents défis susmentionnés, les réseaux antagonistes génératifs restent la meilleure technique pour générer des images de haute résolution. Néanmoins, des technologies complémentaires telles que la segmentation sémantique ou les visages paramétriques 3DMM continueront, eux aussi, de jouer un rôle clé.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.