in

Google a libéré son Genie de sa lampe

Google Genie IA générative

Un véritable génie, comme son nom l’indique, la toute nouvelle IA de baptisée a la capacité de créer un jeu de plateforme 2D à partir d’une simple image. Les IA génératives n’ont cessé d’évoluer depuis l’évènement de en 2022.

Aujourd’hui encore, les géants de l’ continuent à nous surprendre. Récemment Google a annoncé un nouveau modèle d’IA générative qui suscite un débat auprès des développeurs de jeux vidéo. Genie, d’après Google, est en mesure de créer des jeux entièrement jouable à partir d’une seule image.

Genie de Google pourrait devenir le modèle de base pour les futurs agents d’IA

Pour son apprentissage, Genie a dû accéder à des données de vidéos du web disponibles au grand public. À partir de là, elle peut transformer n’importe quel type d’image en un jeu de plateforme 2D qui reste encore assez simpliste.

YouTube video

Le résultat fourni est assez bluffant. Quelle que soit l’invite d’image utilisée, qu’il s’agisse d’une peinture, d’une simple photographie ou d’un croquis, le modèle Genie de Google le transforme avec une polyvalence inégalée.

Du côté des développeurs, Genie représente la nouvelle génération de modèles pouvant servir à la formation d’agents d’IA. Les équipes de Google DeepMind responsables du développement de Genie affirment d’ailleurs qu’il pourrait s’agir d’un modèle de base pour l’apprentissage des modèles à venir. « Genie repose sur des paramètres 11B et inclut un modèle de dynamique autorégressive, un tokeniseur vidéo spatio-temporel, ainsi qu’un modèle d’action latente simple et évolutif », ont-elles ajouté.

Performant, oui ! Mais à quel prix ?

Genie est une solution innovante qui donne aux utilisateurs la possibilité d’interagir avec des environnements générés image par image. Et le plus grand avantage de ce modèle, c’est qu’il n’a pas besoin d’étiquetage fastidieux des actions durant la phase d’entraînement. Contrairement aux approches traditionnelles dans le domaine des modèles de monde qui requièrent généralement l’incorporation de connaissances spécifiques au domaine applicatif, Genie parvient à apprendre des espaces d’actions latents de manière entièrement auto-supervisée.

Cette approche ouvre la voie au développement d’agents dotés de capacités d’adaptation et d’apprentissage généralistes. En effet, l’espace d’actions latent appris par Genie permet à des agents entraînés sur des environnements simulés de reproduire des comportements complets à partir de vidéos jamais vues auparavant.

Si Google reste optimiste quant aux capacités de génération de Genie, rien ne prouve que ce modèle ne va pas reproduire le travail des développeurs. Comme le cas de ses prédécesseurs, dont ChatGPT qui a fait l’objet d’une poursuite en justice par New York Times au mois de décembre dernier.  

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *