Est-ce que c’est la fin pour Midjourney ? Peut-être que oui, peut-être que non. En tout cas, de plus en plus d’entreprises se lancent dans le développement d’IA génératives d’images. Cas de Freepik qui vient de dévoiler Mystic, un modèle de génération d’images par intelligence artificielle, et qui, selon Javi Lopez, son créateur, est le plus avancé que nous connaissons jusqu’à ce jour.
Bien sûr, on a déjà pris connaissance avec FLUX, un autre modèle qui a pu surpasser Midjourney dans la représentation de l’anatomie humaine.
Celui-ci dispose d’ailleurs d’une meilleure capacité à suivre les invites textuelles et d’une aptitude à générer des images plus réalistes.
Mais côté paramétrage et édition, Midjourney remporte le duel, surtout avec la récente sortie de la fonctionnalité d’édition d’images disponible en version web.
Fruit d’une collaboration entre photographes, experts en VFX et artistes numériques
En décortiquant Mystic, on peut dire que le modèle s’appuie sur une série d’ajustements minutieux apportés aux technologies déjà existantes. À savoir FLUX, Magnific et Stable Diffusion.
Derrière sa performance se cache d’ailleurs un processus de développement collaboratif. Une équipe pluridisciplinaire a cependant contribué à son élaboration et à la sélection rigoureuse des images d’entraînement.
Photographes, artistes numériques, experts en effets visuels, designers, plusieurs acteurs ont contribué au développement de Mystic d’après le porte-parole de Freepik.
« Des spécialistes internes dotés d’un œil aiguisé ont consacré de nombreuses heures à perfectionner chaque détail », a-t-il déclaré.
Les capacités de Magnific, de Stable Diffusion et de FLUX rassemblées dans un seul outil
Techniquement, Mystic se distingue par l’activation d’un workflow sophistiqué qui exploite le mode Flux.
C’est-à-dire l’un des modèles de base les plus performants actuellement dans le domaine de l’IA générative d’images.
Ce processus intègre également certains mécanismes de diffusion stable. Mais aussi les améliorations qu’a apportées l’équipe de développement. Sans oublier les capacités de mise à l’échelle de Magnific.
Le porte-parole de Freepik a aussi mis en avant les avantages de ce système. Selon lui, l’approche qu’ils ont adoptée permet de produire des visuels saisissants en haute résolution.
On peut donc s’attendre à des images allant jusqu’à une résolution de 2K, sans passer par d’étapes supplémentaires.
Voici comment l’IA de Freepik interprète les prompts
Toujours d’après le porte-parole de l’entreprise, Mystic aurait une capacité à saisir et à saisir rapidement les descriptions textuelles.
Mais comme toutes entreprises ayant développé une IA générative d’images, les vanteries sont vite devenues une tendance.
J’ai alors moi-même créé des prompts pour générer quelques images sur Mystic et apparemment, l’outil a bien fait ses preuves.
Sinon, la fonction d’amélioration rapide fait également partie des atouts les plus vantés de Mystic. Raison de plus pour moi de tester l’outil et de voir ce qu’il a dans le ventre.
Rassurez-vous, j’ai inclus l’ensemble des invites que j’ai utilisées juste en bas de chaque image. Vous pouvez, vous aussi, les utiliser et mettre vos résultats en commentaires.
Vous voulez mon avis ?
Le plus grand avantage de Mystic, à mon avis, c’est la possibilité de jouer avec le paramétrage des images depuis un volet qui se trouve dans la partie gauche de son interface.
On n’a donc pas besoin de les saisir manuellement comme dans Midjourney si on veut changer le style, le format de l’image, la vitesse de génération, etc.
Par contre, si vous vous êtes souscrit à la formule gratuite, vous ne disposerez que de 20 crédits. Ce qui vous permettra de générer pas plus de 5 images sur Mystic.
- Partager l'article :