in

Microsoft s’émancipe enfin d’OpenAI pour la génération d’images avec MAI-Image-2 

Microsoft MAI-Image-2

Microsoft lance enfin son propre modèle de génération d’images nommé MAI-Image-2. L’éditeur souhaite réduire sa dépendance historique envers les technologies d’OpenAI. Ce modèle se classe déjà troisième sur le benchmark indépendant Arena.ai. Olivier souligne ce changement stratégique majeur pour l’avenir de Copilot.

🔥 Nous recommandons Artspace.ai

Artspace.ai est le meilleur générateur d’image pour de nombreuses raisons. Intuitif, il offre des options diversifiées pour inspirer votre créativité. Que vous soyez artiste, créateur de contenu ou simplement curieux, Artspace.ai stimule l’inspiration et vous accompagne à chaque étape de votre processus visuel

L’équipe AI Superintelligence a conçu ce nouveau modèle performant en interne. Et l’outil est désormais accessible via le MAI Playground pour un déploiement progressif. 

Microsoft a également collaboré avec des designers pour améliorer le rendu photoréaliste. Ainsi, la gestion de la lumière et des textures est particulièrement soignée dans cette nouvelle version. Quant au texte intégré dans les images, il devient enfin lisible et fiable

Les experts ont d’ailleurs salué les performances de MAI-Image-2

Comme atout, le modèle MAI-Image-2 de Microsoft gère efficacement les scènes complexes et les proportions physiques

YouTube video

Les premiers retours confirment d’ailleurs une excellente maîtrise de la cohérence visuelle

Quitte à dire que MAI-Image-2 surpasse parfois ses concurrents directs lors des tests à l’aveugle

Microsoft propose aussi cette solution via sa plateforme Microsoft Foundry. Et ce choix permet de maîtriser les coûts de calcul sur le long terme. Les professionnels quant à eux, bénéficient d’un accès prioritaire à l’API de génération.

La vitesse n’est pas au rendez-vous

La modération actuelle de MAI-Image-2 s’avère toutefis extrêmement stricte pour les utilisateurs créatifs

MAI-Image-2 Microsoft Score Benchamrk Arena AI
©arena.ai

Le système bloque souvent des scènes anodines jugées trop ambiguës par l’algorithme. 

Et chaque génération impose un délai d’attente frustrant de trente secondes environ. La production quotidienne est d’ailleurs plafonnée à seulement quinze images par compte

Le format reste également bloqué au carré 1:1 sans option portrait ou paysage comme sur les autres modèles comme Midjourney

Et ce sont ces contraintes techniques qui freinent pour l’instant un usage professionnel intensif du modèle de génération d’images de Microsoft par rapport à ses concurrents.

Peu, ou pas du tout de fonctionnalités de retouche

J’ai aussi constaté que les fonctionnalités de retouche avancée manquent encore cruellement à l’appel

Le service fonctionne uniquement à partir de requêtes textuelles simples aujourd’hui. Donc sur des invites de création d’images.

Aucune option d’édition ou de modification d’image n’est encore disponible. Microsoft possède néanmoins un socle technique solide pour ses futures innovations. 

Le géant de Seattle a tout de même repris la main sur son écosystème d’IA générative et le déploiement dans Bing Image Creator marquera une étape décisive.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !