Imagen, le modèle d’IA text-to-image de Google offrirait un niveau de photoréalisme sans précédent.
Avec l’intelligence artificielle, la créativité prend une nouvelle dimension. Les générateurs de texte en image sont actuellement en vogue chez les grandes entreprises technologiques. Ils permettent de donner vie à l’imagination sans avoir grand-chose à faire. Google se joint également à la partie avec sa nouvelle IA.
Imagen : la nouvelle IA text-to-image de Google
Quelques semaines après la sortie de DALL-E 2, Google lance son propre modèle d’IA text-to-image nommé Imagen. Pour rappel, il s’agit d’une technologie qui permet de créer des images à partir d’une invite textuelle. Les créateurs peuvent générer des tableaux de peinture ou des images photographiques.
Selon Google, les résultats montrent un niveau de « photoréalisme sans précédent ». Pour évaluer le modèle, les chercheurs de Google Brain ont créé un nouveau benchmark appelé DrawBench. La métrique comprend une liste d’environ 200 invites de texte.
L’équipe a ensuite évalué Imagen sur DrawBench en la comparant avec d’autres modèles, dont DALL-E 2, VG+GAN+CLIP et les modèles de diffusion latente (LDMs). Des évaluateurs humains ont été chargés d’évaluer chaque image. Selon Google, ces derniers ont préféré Imagen pour la qualité et la correspondance entre la description et les images.
Inaccessible au grand public
Pour l’instant, Google estime que le générateur text-to-image ne convient pas au grand public. La capacité de pouvoir générer une image de tout ce passe par notre imagination pourrait aussi être un problème. En effet, Imagen pourrait être utilisé comme outil pour créer de fausses informations.
D’autre part, l’équipe s’appuie sur de grands ensembles de données dont la plupart proviennent du Web. Cependant, ces ensembles de données reflètent généralement des stéréotypes sociaux conduisant alors à des résultats non représentatifs. Autrement dit, Google reconnaît qu’Imagen a hérité des mêmes préjugés sociaux. Les chercheurs ont effectivement découvert ce problème lors de l’évaluation.
Par conséquent, la version actuelle restera réservée à un nombre limité de bêta-testeurs. Néanmoins, l’équipe n’exclut pas entièrement l’idée de donner un libre accès limité dans les travaux futurs. Et en attendant, vous pouvez essayer Imagen sur leur site en créant une description avec des phrases présélectionnées pour générer une photo ou une image de style peinture à l’huile.
- Partager l'article :