Imagen 2 de Google repousse les limites de la génération d'images

Google continue d’innover dans le domaine de l’intelligence artificielle. Après avoir présenté récemment Gemini, son grand modèle de langage (LLM), le mastodonte du Web dévoile Imagen 2, son intelligence artificielle de génération d’images. Plus intelligente, cette nouvelle technologie s’accompagne de fonctionnalités poussées qui la distinguent de ses concurrents.

Images sur-mesure et de qualité, logos… Imagen 2 a de l’avance !

C’est DeepMind, la filiale spécialisée dans l’intelligence artificielle de Google, qui est à l’origine de la création d’Imagen 2. Cette IA permet de générer des images de qualité à partir d’un simple prompt, une description textuelle de l’image souhaitée.

Lors de sa présentation par Google, Imagen 2 a impressionné par sa capacité à générer des images correspondant exactement aux requêtes, même les plus précises, longues et détaillées. L’outil a été, par exemple, testé avec un prompt demandant une image d’un dentifrice avec le mot « CYMBAL » écrit dessus, placé sur un meuble de salle de bain, juste à côté d’un lavabo. L’IA a produit précisément la scène décrite. Le tube de dentifrice, le mot écrit, le mobilier ou encore le lavabo, tout y est.

Outre la précision avec laquelle Imagen 2 génère des images fidèles aux invites fournies, la qualité du rendu visuel est également au rendez-vous. Les images produites présentent une définition et une résolution élevées.

De plus, l’IA offre des fonctionnalités inédites intéressantes. Par exemple, il est possible de lui demander de créer une image avec un texte superposé. Imagen 2 peut aussi générer des logos abstraits. Ces créations graphiques peuvent par la suite être utilisées sur divers supports tels que des cartes de visite, des vêtements, etc. Autre atout majeur : cette IA de DeepMind a une compréhension multilingue, ce qui permet à l’utilisateur de générer des logos dans la langue de son choix.

La réponse de Google à DALL-E 3 de Bing

Le principal concurrent d’Imagen 2 reste sans conteste DALL-E 3 d’OpenAI, désormais intégré au moteur de recherche Bing de Microsoft. Ceci a probablement motivé Google à créer son propre outil générateur d’images IA. Meta a aussi lancé Imagine with Meta AI il y a plusieurs jours. Initialement restreinte à ses logiciels de messagerie, cette IA est à présent accessible via un site web dédié. Récemment, Midjourney s’est également affranchi de la plateforme de messagerie Discord, pour devenir une IA génératrice disponible sur le Web.

On assiste donc à une accélération significative dans la course à l’IA générative d’images. Néanmoins, en se référant à la présentation faite par Google, Imagen 2 semble surpasser sur ses concurrents. Ses images plus réalistes et précises ainsi que ses fonctionnalités innovantes en font un outil puissant et polyvalent.

Meet Imagen 2: our most advanced text-to-image diffusion technology. ✨

It features high-quality, photorealistic outputs and stronger consistency with your prompts. 🖼

Now available to use via @GoogleCloud’s #VertexAI platform. → https://t.co/T1IIJMbIW9 pic.twitter.com/iWIzi2jgZH

— Google DeepMind (@GoogleDeepMind) December 13, 2023

Pour pouvoir répondre aux requêtes des utilisateurs, Imagen 2 a été formé sur un ensemble de données massif d’images et de textes. Cependant, DeepMind n’a pas communiqué sur les sources de données exactes utilisées pour le processus d’entraînement de son IA.

Cet outil est disponible sur Vertex AI, la plateforme dédiée à l’IA de Google Cloud. Ce qui permet aux développeurs et aux professionnels de l’utiliser facilement pour leurs projets. Google assure que son intelligence artificielle est équipée de filtres de sécurité efficaces qui empêchent la génération de contenu inapproprié. La question reste de savoir si cette nouvelle technologie séduira un large public.

Partager l'article :