La startup spécialisée dans l’IA visuelle Recraft vient de dévoiler un nouveau modèle de génération d’images qui, selon des évaluations indépendantes, établit de nouveaux standards de performance. Baptisé Recraft V3, ce modèle se démarque par sa capacité à intégrer du texte dans les images avec une grande précision. Mais aussi à respecter l’anatomie dans ses créations, à suivre fidèlement les consignes données et à produire des rendus de haute qualité.
L’une de ses principales avancées réside dans la possibilité de générer correctement de longs passages de texte en une seule fois. Là où la plupart des autres modèles comme Midjourney se limitent généralement à quelques mots seulement.
Un exemple d’image générée par Recraft V3 montre une écriture turquoise sur fond orange, illustrant cette faculté de gestion du texte.
D’après les résultats publiés, Recraft V3 se hisse à la première place du benchmark texte-image de Hugging Face avec un score ELO de 1 172.
Ce classement repose sur des tests en aveugle où les utilisateurs comparent des paires d’images issues de différents modèles à l’aide d’un système de notation ELO similaire à celui des échecs.
Le modèle devance ainsi ses récents concurrents, dont Flux et Ideogram jusqu’ici les meilleurs dans la génération de textes sur image.
Quels outils d’édition d’images sont intégrés à Recraft V3 ?
Avec sa version V3, Recraft introduit de nouveaux outils de contrôle pensés pour les designers professionnels.
Le modèle permet désormais de définir l’emplacement précis d’un texte, de choisir les dimensions exactes des visuels et même d’utiliser plusieurs images de référence afin d’assurer une parfaite cohérence graphique avec l’identité d’une marque.
Recraft a d’ailleurs précisé que ces ajustements ne nécessitent aucun réentraînement du modèle.
Un exemple d’image générée illustre ces capacités : un portrait surréaliste avec des éléments flottants en turquoise et orange, parfaitement aligné avec les instructions fournies.
Le modèle se distingue aussi par sa gestion des requêtes complexes. Il génère des créations détaillées qui respectent fidèlement les contraintes de géométrie et de palette de couleurs.
Prompt: "a jellyfish on the beach"
— fofr (@fofrAI) November 2, 2024
Once again, recraft-v3 is smashing it.
1. recraft
2. flux 1.1 pro
3. sd3.5 large
4. Midjourney v6.1 pic.twitter.com/fZkdKrToRa
Autre point fort de Recraft v3
La génération de graphiques vectoriels, allant des icônes minimalistes aux illustrations sophistiquées.
Recraft enrichit également son offre avec une panoplie d’outils d’édition basés sur l’IA. Notamment la gomme, la modification de zone, l’inpainting, l’outpainting, le mockuper, un upscaler intelligent, des réglages fins ainsi qu’un outil de suppression d’arrière-plan.
Une démonstration visuelle montre par ailleurs des formes 3D vectorielles rendues avec une grande précision et dans différentes variations de couleurs.
Sinon, l’outil est accessible via une interface web qui accorde 50 crédits gratuits par jour. Pour un usage plus intensif, un abonnement de base propose 1 000 crédits pour 10 € par mois.
Une API est également disponible pour les développeurs et les entreprises souhaitant intégrer ces fonctionnalités dans leurs propres solutions.
- Partager l'article :
