Un nouveau modèle de retouche photo alimenté par IA fait mouche sur le web. Et il semblerait que c’est Google qui en est à l’origine. Il s’agit en effet de nano-banana, le surnom que l’on a donné au nouvel outil image Flash Gemini 2.5 de Google DeepMind.
Ce dernier est déjà disponible depuis mardi via l’application Gemini. Tous les utilisateurs de l’API, de Vertex AI et de Google AI Studio peuvent aussi y accéder.
La mise à jour a pour objectif de permettre aux utilisateurs de mieux modifier leurs images avec plus de précision et de cohérence.
Et c’est l’un des plus grands avantages de Google par rapport à ses concurrents dont les modèles tendent à modifier les visages, même si l’on ne demande qu’une modification de couleur.
Nano-banana vs. Midjourney & GPT-4o : L’IA de retouche photo la plus cohérente ?
L’arrivée de Nano-banana, le modèle Image Flash Gemini 2.5 de Google, repositionne la bataille des IA génératives. L’argument principal de Google vise directement les faiblesses des leaders.
Effectivement, Midjourney et GPT-4o excellent en génération pure. Seulement, les deux peuvent manquer de cohérence lors des retouches d’images complexes.
Notre analyse explore si Gemini 2.5 surpasse réellement ses rivaux sur ce point. Google mise sur la capacité du modèle à modifier un arrière-plan sans altérer le visage d’un personnage. C’est l’atout majeur pour les créateurs de contenu professionnel.
Cette comparaison intègre aussi l’aspect tarifaire, car Google propose une tarification très compétitive pour les jetons de sortie. Enfin, la présence du filigrane numérique SynthID chez Google soulève un enjeu de traçabilité que ses concurrents n’abordent pas avec la même rigueur.
Image Flash Gemini 2.5, le meilleur modèle pour conserver la cohérence des personnages
Vous l’aurez compris, Google a misé sur la cohérence des personnages pour espérer battre les leaders de la génération d’images par intelligence artificielle comme Midjourney.
Cela dit, on peut facilement demander à Gemini 2.5 Flash Image de modifier le décor, la coiffure ou l’apparence du sujet tout en gardant son apparence.
Il est même possible de combiner plusieurs images et de demander des modifications spécifiques à partir d’une description textuelle.
Peu de temps après son apparition, cet éditeur d’images par IA a vite attiré l’attention. On a même vu sur les réseaux sociaux plusieurs contenus générés à partir de cet outil qui serait l’œuvre de Google DeepMind.
Et sur les benchmarks, le modèle explose déjà les records en surpassant de loin Flux.1, Qwen Image Edit et GPT-4o.
« Notre objectif est de vraiment assurer la qualité visuelle des contenus. Et nos avons amélioré la capacité du modèle à suivre les instructions », indique le chef de produit Google DeepMind, Nicole Brichtova.
À quel prix ?
30 $ par millions de jetons de sortie, soit près de 25 €, c’est le prix que Google propose pour Image Flash Gemini 2.5.
Ce qui équivaut à 0,029 $ par image, soit 1 290 jetons de sortie pour chaque génération. Pour les autres modalités d’entrée et de sortie, Google a gardé la tarification standard de Gemini 2.5 Flash.
Côté sécurité, chaque image générée avec le nouveau modèle nano-banana de Google inclut un filigrane numérique SynthID invisible.
Celui-ci reste d’ailleurs détectable après modifications pour assurer la traçabilité de l’origine des images.
En somme, cette première version d’édition d’images de Google se positionne déjà parmi les meilleurs modèles de retouche d’images par IA.
Et il pourrait devenir le canal grâce auquel Google va pouvoir rattraper son retard par rapport à OpenAI sur le nombre d’utilisateurs.
FAQ
C’est le surnom viral donné au nouveau modèle de retouche photo de Google DeepMind. Son nom officiel est Image Flash Gemini 2.5.
Son atout majeur est la cohérence des personnages. Contrairement à certains modèles, il permet de modifier les décors ou la coiffure d’un sujet sans altérer son visage ou son apparence initiale.
Sur les benchmarks, Nano-banana explose les records en édition d’images, surpassant des modèles comme GPT-4o sur la capacité à suivre des instructions précises et à maintenir la qualité visuelle.
Chaque image générée avec Gemini 2.5 inclut un filigrane numérique SynthID invisible. Ce filigrane assure la traçabilité de l’origine de l’image, même après modifications.
Il est disponible via l’application Gemini et également accessible aux utilisateurs de l’API, de Vertex AI, et de Google AI Studio pour des usages professionnels.
- Partager l'article :

