Black Forest Labs a annoncé jeudi dernier FLUX.1, son tout premier modèle d’IA générative de texte en image. Black Forest est, à titre d’information, une startup allemande ayant pour objectif de développer une IA génératrice d’images et de vidéos plus avancées que les modèles déjà disponibles.
FLUX.1 fait suite à la récente sortie de Stable Diffusion 3 Medium qui a eu lieu il y a près de deux mois.
Par contre, malgré les vanteries de Stability AI, son modèle n’arrive toujours pas à recréer parfaitement certaines parties du corps.
Alors suite aux critiques, trois ingénieurs de Stability AI ont décidé de quitter la société pour fonder Black Forest.
Il s’agit notamment de Dominik Lorenz, d’Andreas Blattman, et de Robin Rombach.
Trois modèles disponibles
D’après les déclarations de Black Forest, Flux.1 se décline sous trois variantes : « dev », « pro », et « schnell ».
Le premier modèle, dev, est la version haut de gamme de FLUX.1. « Pro » de son côté, représente le modèle milieu de gamme. Tandis que « schnell », signifiant rapide en allemand, est la version la plus rapide des tris modèles.
Cela dit, FLUX.1 est apparemment le tout premier modèle d’IA générative pouvant surpasser DALL-E et Midjourney dans la génération d’images n’ayant aucune perfection au niveau de l’anatomie humaine.
Cette capacité vient du fait de FLUX.1 repose sur une structure hybride. Ce qui veut dire que le modèle, avec 12 milliards de paramètres, combine deux techniques en même temps : la transformation et la diffusion.
FLUX.1 : le modèle qui redéfinit les limites de Midjourney 6
FLUX.1 apporte plusieurs avancées techniques, en particulier une approche appelée « Flow Matching ».
Cette méthode élargit les possibilités des modèles existants et ajoute des éléments techniques spécifiques pour améliorer considérablement les résultats et l’utilisation du matériel informatique.
Les images que crée FLUX.1 se démarquent par leur qualité visuelle, leur fidélité aux descriptions données, et leur variété ; des visuels qui surpassent même ceux de DALL-E et de la V6 de Midjourney.
Les spécialistes du domaine ont rapidement reconnu le potentiel important de cette nouvelle technologie appelée FLUX.1.
Un expert influent, Bindu Reddy, l’a d’ailleurs décrite comme une avancée majeure pour l’intelligence artificielle capable de traiter différents types de données, et comme un progrès vers une IA plus générale et en open source.
Le premier modèle capable de reproduire la main humaine avec perfection ?
La quasi-totalité des IA génératives d’images que nous connaissons actuellement n’arrive toujours pas générer des images sans défauts. Surtout au niveau de certaines parties du corps.
Mais FLUX.1 semble disposer de cette capacité. Il arrive même à recréer avec perfection les mains humaines.
Par contre, le fichier de poids de FLUX.1 pèse 23 Go, d’où la nécessité d’une quantification pour que l’on puisse réduire sa taille et l’exécuter localement.
Sinon, FLUX.1 est accessible via Hugging Face ou directement depuis ce lien. Il vous suffit de suivre le petit tuto ci-dessous pour tester par vous-même les vraies capacités de FLUX.1.
Try out the official FLUX.1 [schnell] demo official demo from the goated new @bfl_ml team, state of the art in 4 steps! 🦶
▶️ https://t.co/cEbKIxF3gx https://t.co/DirQuKbN4Q pic.twitter.com/9KNTQZSvrH— apolinario 🌐 (@multimodalart) August 1, 2024
La sécurité avant tout
Black Forest a pour ambition de gagner la confiance des utilisateurs par rapport à la sécurité de leurs données.
Mais comme les autres entreprises d’IA, la startup n’a pas précisé la source des données d’entraînement de FLUX.1.
« FLUX.1 a tendance à générer des imitations de personnages qui sont protégées par le droit d’auteur », a avancé un chercheur souhaitant rester anonyme.
Ce qui veut dire que le modèle aurait probablement été entraîné sur une vaste collection d’images récupérées sur internet sans autorisation. Mais ce n’est qu’une hypothèse.
Mais ne vous inquiétez pas ! FLUX.1 n’a fait aucun objet de problème de confidentialité, du moins jusqu’à aujourd’hui.
Vous avez donc le feu vert pour essayer cette nouvelle IA générative d’images. Et surtout, n’oubliez pas de nous faire pat de vos impressions en commentaires.
- Partager l'article :