Une mystérieuse IA de Google fuite juste avant Google I/O 2026

Par Narindra R. Publié le 18 mai 2026 | 3 minutes de lecture

À la veille de l’ouverture officielle de la Google I/O 2026, l’écosystème de Mountain View est en ébullition. Des bandeaux d’interface et des fuites de code repérés par TestingCatalog et 9to5Google révèlent le projet le plus ambitieux de l’entreprise : Gemini Omni.

Mais serait-ce un simple modèle de génération comme VEO ? Ou Google va-t-il annoncer un modèle multimodal capable d’unifier la création de texte, d’images, de voix et de vidéo au sein d’une seule interface conversationnelle ?

Gemini Omni, un nouvel agent de création en vue chez Google ?

Découvert dans l’interface de la version Web de Gemini, le bandeau de test « Create with Gemini Omni » a été localisé juste à côté de « Toucan », le nom de code interne désignant le moteur actuel adossé à Veo. Cette proximité confirme qu’il s’agit d’une mise à niveau directe ou d’une alternative majeure à l’infrastructure existante.

Sinon, Gemini Omni devrait tirer sa force de son statut d’agent de création, et non dans la simple production de séquences isolées.

Google l’a d’ailleurs conçu pour orchestrer des sources hétérogènes (images fixes, scripts textuels, clips existants) et générer des vidéos de 10 à 15 secondes synchronisant de façon native la vidéo, la voix, la musique et le texte incrusté à l’écran.

Vous pouvez ensuite modifier, remixer ou affiner le projet de manière itérative directement dans le chat par des vagues de prompts successifs ou en appliquant des modèles prédéfinis.

Et pour garantir un déploiement massif au sein de l’écosystème applicatif, Google prévoit également de mettre à disposition une API dédiée permettant aux développeurs tiers d’intégrer cette intelligence vidéo dans leurs propres logiciels.

La fonction Avatar s’invite aussi dans la production

L’autre révélation majeure issue de cette fuite logicielle est l’apparition d’une option baptisée Avatar.

Le protocole se veut grand public d’après la fuite. Ce qui veut dire que l’on peut désormais réaliser une courte vidéo selfie depuis notre smartphone afin de scanner les expressions et la structure de notre visage. L’algorithme génère alors un avatar 3D hyperréaliste associé directement au compte Google de l’utilisateur.

Ce double virtuel peut ensuite être inséré de manière fluide dans n’importe quel scénario vidéo généré par Gemini Omni.

Cette innovation s’inscrit dans la lignée de la fonction Likeness développée pour Android XR et le casque de réalité mixte Samsung Galaxy XR.

Les prémices de cette technologie avaient déjà été repérées en février dernier par le média Android Authority au sein des menus cachés du lanceur Gemini sur smartphone.

Pourtant, cette approche rappelle les Personas de l’Apple Vision Pro, mais l’étend ici à une production vidéo automatisée et accessible depuis n’importe quel navigateur web.

Google I/O leaks: Veo 4 / Gemini Omni

– Veo 4 is pushing beyond simple single camera AI clips into full multi-angle scene generation
– Biggest upgrade seems to be dynamic camera switching where scenes can change perspectives naturally while maintaining overall coherence
– Audio… pic.twitter.com/kmEiasXdH4
— Pankaj Kumar (@pankajkumar_dev) May 16, 2026

Un timing stratégique à l’aube de la Google I/O 2026

L’apparition de ces nouveautés dans les builds de production de Gemini coïncide parfaitement avec le calendrier de l’entreprise.

La grande keynote d’ouverture de la Google I/O 2026 débute ce mardi 19 mai au Shoreline Amphitheatre de Mountain View.

Cet événement succède à un Android Show 2026 déjà particulièrement dense, marqué par les annonces de Gemini Intelligence et du système Googlebooks.

Si la prudence reste de mise face à des fonctionnalités encore non officialisées par la direction de Google, la maturité des éléments graphiques et des chaînes de texte laisse présager une présentation sur scène.

Reste à savoir si Gemini Omni sera déployé immédiatement en version bêta ou s’il s’agira d’une démonstration technologique destinée à contrer les récents lancements de GPT-5.5 par OpenAI et de Mythos par Anthropic.