FLUX.1 a débarqué à l’improviste sur le web et a bafoué le règne de Midjourney. Des images plus réalistes, une meilleure compréhension des prompts, les doigts et les pieds recréés avec perfection, tout montre que l’IA générative d’images de Black Forest Labs est en passe de devenir le nouveau champion des images IA.
Mais il n’y a pas que Midjourney. La concurrence s’est amplifiée et de plus en plus d’entreprises se sont lancées dans le développement de modèles d’IA génératrices d’images.
Il y a notamment DALL-E, Adobe FireFly et Stable Diffusion. Google a également pris sa part de marché en lançant dernièrement Imagen 3.
FLUX, de son côté, semble tirer son épingle du jeu malgré les limites qu’il connaît actuellement. Et c’est en quelque sorte le modèle qui génère les images les plus réalistes.
De quoi s’agit-il exactement ?
Le 1ᵉʳ août 2024, Black Forest Labs, nouvel acteur européen du GenAI, a lancé FLUX.1, une IA générative d’images en open source.
Cela dit, le modèle est accessible gratuitement et tout le monde peut modifier son code source pour éventuellement l’intégrer dans un générateur personnalisé.
Si Midjourney n’est généralement accessible que via le serveur Discord, Flux peut s’exécuter en local, à condition que le PC dispose de la configuration minimale requise.
Sinon, Black Forest Labs affirme aussi que le modèle Flux est désormais disponible sur les plateformes telles que Nightcafe et Poe.
En ce qui concerne le modèle en question, Black Forest Labs a fait en sorte que chaque profil puisse avoir accès facilement à Flux.
Elle a en effet déployé trois versions du modèle : Pro si vous souhaitez bénéficier d’une licence commerciale, Dev pour ceux qui ont un espace de stockage limité, et Shcnell, la plus rapide des trois variantes.
Le choix de version varie cependant en fonction des besoins des utilisateurs. Mais le point commun entre ces trois variantes relève du réalisme du contenu qu’elles génèrent.
En local ou en ligne, plusieurs alternatives pour utiliser Flux ?
Comme mentionné plus haut, vous avez le choix entre utiliser Flux en local ou en version web. Donc pour le téléchargement du fichier poids, vous pouvez tout de suite y avoir accès depuis Hugging Face.
Sachez tout de même que l’utilisation d’une interface graphique telle que ComfyUI est nécessaire pour une exécution en local de Flux.
Mais il me semble que la version web est plus interactive et plus intuitive. L’utilisation en ligne peut alors se faire sur Fal.ai, DZine et Replicate.
Pour ce qui est de la description textuelle, des prompts en d’autres termes, Flux est plus performant si ces derniers sont de style verbeux.
Les invites concises, courtes et laconiques ne sont donc pas recommandées si vous voulez tirer parti des meilleures performances du modèle.
Cependant, je vous conseille vivement, avant toute tentative de génération, de tester vos prompts avant de les saisir.
Sinon, en cas de doute, vous pouvez toujours consulter comment rédiger un bon prompt selon Google dans cet article.
Un seul mot pour décrire les performances de Flux
Exceptionnelle, c’est le seul mot qui peut définir les performances de Flux
salué comme « le modèle tant attendu » par de nombreux membres de la communauté, particulièrement après la déception causée par SD3, Flux a reçu un accueil enthousiaste du côté des créateurs.
Sa capacité à produire des images fidèles, sa rapidité d’exécution et sa qualité globale sont tout à fait remarquables.
Quant à Flux 1 Pro et Flux 1 Dev, ces deux versions ont su redéfinir les standards dans leurs catégories respectives.
Ils surpassent même les modèles phares tels que Midjourney v6.0, DALL-E 3 (HD) et Stable Diffusion 3-Ultra dans plusieurs domaines. Notamment au niveau de la qualité visuelle, du respect des consignes, de flexibilité des formats et de la typographie.
Pour ce qui est de Flux 1 Schnell, elle se distingue comme le modèle le plus avancé de sa catégorie, du moins jusqu’à ce jour.
Sur les benchmarks, elle surclasse non seulement ses concurrents directs, mais aussi des modèles non distillés puissants comme Midjourney et DALL-E 3.
Pour prouver le réalisme de Flux en termes de génération d’images, nous allons faire une comparaison de visuels créés sur Midjourney et Flux dans les paragraphes qui suivent.
Qualité et esthétique des images, qui prendra le dessus ?
Si on veut vraiment comparer Flux à Midjourney, il va falloir passer au crible la qualité de leur rendu, leur fidélité aux prompts, leur rapidité, ainsi que leur accessibilité.
Côté qualité d’image et esthétique, Flux et Midjourney produisent des images de haute qualité. Midjourney est reconnu pour son style artistique distinctif.
Flux, disposant d’une architecture avancée et d’un plus grand nombre de paramètres, vise à atteindre ou surpasser ce niveau de qualité.
Ce premier exemple de Flux montre des détails impressionnants et une maîtrise technique de la génération d’images par IA. Mais la subjectivité de l’art rend difficile une comparaison définitive.
En second lieu, Flux pourrait se démarquer dans l’interprétation précise des prompts. Black Forest Labs a mis l’accent sur cette capacité et vise une meilleure correspondance avec les intentions de l’utilisateur.
Midjourney, parfois critiqué pour ses libertés créatives, pourrait être moins précis dans ce domaine, même avec la V6.
Trois fois plus rapide que Midjourney
Question rapidité et efficacité, FLUX.1 est largement supérieur à Midjourney. Si Flux parvient à garder cette vitesse tout en maintenant la qualité, cela pourrait constituer un avantage significatif.
Niveau utilisation et prise en main, on apprécie mieux Midjourney pour son interface conviviale et son intégration à Discord.
Flux, plus récent, pourrait nécessiter du temps pour développer une interface aussi accessible. Par contre, en tant que modèle open source, on pourrait bientôt avoir à disposition des outils communautaires plus variés.
Enfin, il y a le côté législation qui, aujourd’hui, est au cœur des débats des entreprises d’intelligence artificielle.
Et Flux comme Midjourney font aujourd’hui face à des défis éthiques similaires. L’approche transparente de Black Forest Labs pourrait permettre de solidifier la surveillance, et donc d’apporter le plus rapidement possible des améliorations.
Une grande question se pose cependant : est-ce qu’on peut en déduire que Flux est meilleur que Midjourney ?
C’est une question plutôt difficile à répondre. Chaque Modèle, qu’il s’agisse de Flux ou de Midjourney, représente le sommet de la technologie de génération d’images par intelligence artificielle.
Chacun d’entre eux a aussi ses avantages et ses inconvénients. Flux se distingue par son architecture avancée et son attention particulière à la fidélité des prompts.
Ces caractéristiques lui permettent potentiellement d’offrir un contrôle plus fin et une qualité supérieure dans certaines situations.
Parallèlement, ses versions open source ouvrent la voie à de nombreuses possibilités de personnalisation et d’intégration, ce qui pourrait s’avérer particulièrement avantageux pour les développeurs et les chercheurs.
En revanche, Midjourney bénéficie d’une solide réputation, d’une communauté d’utilisateurs vaste et dynamique, ainsi que d’une esthétique distinctive appréciée par de nombreux créateurs.
Son intégration à Discord et son interface intuitive le rendent accessible à un large éventail d’utilisateurs, indépendamment de leur niveau d’expertise technique.
À mon avis, on ne peut pas répondre à cette question par un oui ou par un non. Plusieurs éléments sont à prendre en compte. Notamment le cas d’utilisation, vos préférences personnelles, les capacités évolutives de chaque plateforme, etc.
- Partager l'article :