Si la majorité des géants de l’IA se précipitent vers le développement de chatbots plus puissants et plus performants, Microsoft adopte une autre approche. L’entreprise a conçu une IA qui permettrait de contrôler un robot de manière autonome. Baptisé Magma, ledit modèle de Microsoft est doté de capteurs qui vont ensuite envoyer les informations vers un système d’IA qui va les traiter pour permettre au robot d’accomplir une tâche.
Sur le site Microsoft GitHub, Magma est présenté comme un modèle multimodal. Les commandes peuvent en effet prendre la forme d’une image, d’une vidéo ou d’un texte.
Ce qui veut dire que l’on peut l’utiliser pour réaliser de nombreuses tâches. Notamment, et surtout, la manipulation d’un robot entier.
Le pas de géant de Microsoft vers l’AGI
Toujours d’après ce que Microsoft a publié sur microsoft.github.io, le modèle Magma a la capacité de formuler des plans d’actions avant de les exécuter en automatique.
Il a d’ailleurs été formé sur des données accessibles au grand public pour justement avoir cette aptitude à transférer et à traiter les informations contenues dans les commandes efficacement.
Le moins que je puisse dire, c’est que Microsoft semble aussi vouloir atteindre l’AGI. Et Magma représente un grand pas vers le développement d’agents IA autonomes capables de prendre le contrôle d’un robot.
Il s’agit en effet du principal concurrent à Operator, un agent IA qu’OpenAI a récemment créé et qui peut naviguer sur internet sans intervention humaine.
Pourtant, Operator, bien qu’il puisse exécuter les tâches de manière autonome, nécessite encore une surveillance.
Je dirai que finalement, aucun agent n’est vraiment autonome dans ce qu’il fait. Du moins jusqu’à présent.
Microsoft presents:
— Aran Komatsuzaki (@arankomatsuzaki) February 19, 2025
Magma: A Foundation Model for Multimodal AI Agents
– SotA on UI navigation and robotic manipulation tasks
– Pretrained on a large dataset annotated with Set-of-Mark (SoM) for action grounding and Trace-of-Mark (ToM) for action planning. pic.twitter.com/0bTT1dm9fr
Magma en action dans ces vidéos de démonstration
Quoi qu’il en soit, Magma surpasse les autres modèles en termes de navigation et de manipulation robotique.
C’est du moins ce qu’a annoncé Microsoft en publiant quelques vidéos de démonstration montrant Magma exécuter quelques tâches.
Dans les vidéos, on peut voir comment Magma manipule un bras robotisé pour placer un champignon dans un bol et passer coupe de chiffon sur un plan de travail.
Une autre vidéo indique également comment Magma pourrait assister son utilisateur dans un jeu d’échec.
Mais gros hic : les chercheurs de Microsoft affirment que la représentation des identités et des activités dans les vidéos pédagogiques ne reflète pas fidèlement la diversité de la population mondiale et de la société.
La menace souvent sous-estimée par les entreprises
Parallèlement, on devrait aussi se concentrer davantage sur les risques que représente cette évolution vers l’IA agentique.
Les conséquences sont nombreuses, particulièrement en ce qui concerne la vulnérabilité de ces systèmes en termes de cybersécurité.
Ce que je veux dire, c’est que plus l’IA évolue, plus les outils qu’utilisent cybercriminels sont performants.
Ils pourraient, par le biais d’un code malveillant ou des jailbreaks, pirater les systèmes comme Magma.
La question que l’on devrait se poser, c’est de savoir les conséquences si un code malveillant arrive à contrôler les systèmes robotisés.
Ce serait la catastrophe et on vivra dans un monde dominé par les machines. Mais de vous à moi, je préfère ne pas imaginer ce qui va arriver.
- Partager l'article :