in

Ideogram, un bleu qui se fait passer pour un roi !

Ideogram tout savoir

Entre , et DALL-E, il est difficile de faire le choix de l’IA générative d’image à utiliser. Chacune d’entre elles a ses forces et ses faiblesses. Mais seulement serait en mesure de porter la couronne. Laquelle ? Telle est la question ! Et pourtant, nous ne sommes pas encore à la phase où l’IA générative d’image est à son apogée. Un startup décide alors d’entrer dans la course et lance . Qui sait, ce sera elle, peut-être, qui va se hisser en tête de liste.

C’est tout à fait envisageable parce que derrière Ideogramm se trouvent des anciens ingénieurs de et d’autres membres de quelques instituts de renom. Notamment des experts de l’Université Carnegie Mellon, de l’UC Berkeley, et de l’Université de Toronto. Selon leurs propos, Ideogram représente l’IA générative la plus avancée. Le modèle permet même d’activer la fonction « Magic prompt », un particularité offrant la possibilité d’avoir les meilleurs prompts pour la génération d’une image. Quoi qu’il en soit, nous allons sans plus tarder décortiquer cette IA générative et voir ce qu’elle a vraiment dans le ventre. Après, on verra si elle est vraiment digne de porter la couronne et de rivaliser avec DALL-E 3.

YouTube video

Une polyvalence assez bluffante par rapport aux autres IA génératives d’images

Ideogram AI est une novatrice qui vise à relever un défi majeur auquel sont confrontés les systèmes de génération d’images par texte descriptif. Notamment l’intégration cohérente de mots et de textes dans les images créées.

Contrairement à ses concurrents, dont DALL-E et Midjourney, qui peinent souvent à reproduire fidèlement des mots ou des marques connues, Ideogram a été spécifiquement conçu pour offrir une dimension textuelle pertinente aux visuels générés.

En tant qu’utilisateur, vous pourrez ainsi fournir une description détaillée de l’image souhaitée. Par exemple des mots ou des phrases spécifiques que vous souhaitez y voir apparaître. Ideogram AI interprète alors ces indications sémantiques et produit des créations visuelles tenant compte du sens réel des textes mentionnés. Bien que cette soit encore récente et imparfaite, nos tests ont révélé des résultats étonnamment cohérents et visuellement attrayants.

En somme, le vrai potentiel d’Ideogram réside dans sa capacité à intégrer des textes de manière naturelle dans divers styles, contextes et supports visuels. On peut ainsi créer des visuels 3D de prénoms ou encore incruster des logos sur des écrans. Cette IA générative permet également de reproduire des calligraphies lisibles dans des manuscrits, ou même fabriquer des pochettes d’albums ou des affiches de fictifs incorporant du texte cohérent.

Bien que comportant encore des imperfections, notamment pour les sujets plus complexes que les portraits, Ideogram semble offrir une polyvalence et une fonctionnalité unique en matière d’intégration sémantique de textes dans les images générées par IA.

Les options et fonctionnalités disponibles sur Ideogram

Ideogram AI est un outil complet offrant diverses fonctionnalités pour la génération d’images basée sur des descriptions textuelles. Son utilisation principale réside dans la génération d’images à partir d’un prompt rédigé par l’utilisateur, qui se verra proposer quatre visuels correspondants.

Lors de la rédaction du prompt, plusieurs options permettent d’orienter le style visuel de la génération. À savoir les rendus cinématographiques, les illustrations, les photographies, les dessins animés ou encore les rendus 3D. Une option typographique dédiée vise également à faciliter l’intégration de texte lisible dans les images, bien que cette fonctionnalité reste encore à parfaire.

L’utilisateur peut également choisir le format d’image (carré, paysage ou portrait), ainsi qu’uploader une image existante en plus du prompt textuel pour influencer davantage le résultat généré.

Au-delà de la création, Ideogram comprend aussi un volet communautaire avec une galerie permettant d’explorer les créations récentes, populaires ou des utilisateurs suivis. Les créations publiques peuvent alors être consultées, et leurs prompts récupérés pour être remixés.

Avec ses nombreuses options de styles, formats et sa dimension participative, Ideogram se positionne comme un outil riche et polyvalent pour la génération d’images visuellement attrayantes intégrant du texte de manière cohérente.

YouTube video

Des portraits plus réalistes avec Ideogram, un point pour le bleu

Produire des images réalistes de personnes représente depuis un défi de taille pour les générateurs d’images basés sur l’intelligence artificielle. En raison de la complexité du corps humain et du phénomène connu sous le nom d’effet de vallée dérangeante, il est difficile pour ces systèmes automatisés de créer des représentations convaincantes.

Cependant, cet outil en particulier semble exceller dans ce domaine. Lors de nos premiers essais,  nous avons été frappés par la qualité exceptionnelle du résultat obtenu.

Ideogram semble en effet avoir été conçu spécifiquement pour produire des portraits humains d’une grande fidélité. Donc des visuels exempts des défauts communément observés dans les images générées par l’intelligence artificielle. Notamment que les mains déformées, les visages froissés ou autres artefacts indésirables.

Moins performant dans la génération d’un groupe de personnes et d’animaux, quel dommage !

Bien que les performances d’Ideogram pour générer des portraits humains réalistes soient impressionnantes, cet outil n’est pas non plus exempt de défauts. La technologie de génération d’images par intelligence artificielle étant encore à un stade précoce, les erreurs et imperfections demeurent monnaie courante. Ideogram, en tant que nouveau venu dans le domaine, n’échappe pas à cette tendance générale.

YouTube video

En effet, dès que l’on s’écarte des simples portraits pour aborder des sujets plus complexes comme les groupes de personnes ou les animaux, la qualité des images produites par Ideogram se dégrade considérablement. Les photos de groupe présentent souvent des visages déformés de manière choquante. Quant aux représentations d’animaux, elles oscillent entre de légères imperfections et des résultats complètement irréalistes. Même les images de nourriture affichent une finition étrangement artificielle qui les rend peu appétissantes.

Cependant, en considérant les erreurs flagrantes commises par d’autres générateurs d’images IA, les défauts d’Ideogram apparaissent relativement mineurs. On ne peut donc pas lui en tenir rigueur outre mesure.

Gratuit ou payant ?

Ideogram est accessible via une version gratuite permettant de générer jusqu’à 25 prompts par jour, avec téléchargement des images au format JPG sans restriction sur les droits d’utilisation.

Deux formules payantes sont également disponibles pour les utilisateurs souhaitant accéder à des fonctionnalités étendues :

  • L’abonnement à 8 $ par mois offre une génération prioritaire jusqu’à 400 prompts mensuels (100/jour), un téléchargement en qualité d’origine au format PNG, ainsi qu’un accès à l’éditeur d’images.
  • La formule premium à 20 $ par mois inclut toutes les fonctionnalités ci-dessus, avec 1000 prompts prioritaires par mois, une génération illimitée en mode non prioritaire, ainsi que la possibilité d’uploader ses propres images pour influencer la génération et de créer des images en mode privé.
YouTube video

Alors comment accéder et utiliser cette nouvelle IA générative ?

En tant qu’interface web, Ideogram permet de générer des images à partir de descriptions textuelles, sans nécessiter l’installation d’une ou l’utilisation de Discord. Après une inscription rapide avec votre compte Google, vous accédez directement à une interface similaire à Pinterest. À la seule différence que les images proviennent des descriptions textuelles et non des artistes. Ces images, créées gratuitement et libres de droits, sont générées par l’IA en fonction de vos instructions.

Une particularité d’Ideogram est la possibilité de consulter les créations d’autres utilisateurs. Cependant, contrairement à d’autres plateformes, le filtrage semble moins strict, avec la présence potentielle de contenus choquants ou illégaux.

À l’instar de ChatGPT et de Midjourney, la qualité des résultats dépendent de la précision de votre prompt descriptif. Bien qu’Ideogram propose quelques boutons de styles graphiques, c’est à vous de décrire précisément la scène souhaitée. Mais aussi son style et les éventuels mots à intégrer. En ce qui concerne le rendu par défaut, c’est un carré de 1024 x 1024 pixels. Mais des formats 10:16 et 16:10 sont aussi disponibles.

Bien que fonctionnant en français, vous obtiendrez des résultats plus détaillés en anglais. Dans ce cas, nous recommandons d’utiliser , un traducteur basé sur l’IA, pour sa performance supérieure à Google Translate.

Peut-on, un jour, espérer une IA générative sans défaut ?

Pour les générateurs d’images par intelligence artificielle en phase de perfectionnement, dont Ideogram, il est toujours difficile de définir les invites ou prompts textuels. Mais à l’instar de toute nouvelle technologie, ces outils vont continuer à évoluer. Ideogram fait d’ailleurs figure de précurseur en parvenant déjà à mieux gérer la génération de prises de vue humaines réalistes que de nombreuses solutions actuelles sur le marché.

Cependant, l’idée que ces générateurs d’IA puissent un jour atteindre la perfection absolue reste difficile à envisager. Tout bien considéré, ils peinent encore avec de nombreux types d’images basiques, et reproduire un réalisme véritablement fidèle sera tout aussi ardu que dérangeant.

Pour tirer le meilleur parti de ces outils, la clé réside dans la formulation des prompts. Pour ce faire, nous vous invitons à lire notre guide des meilleures invites à utiliser avec les services d’intelligence artificielle génératrice d’images. Vous pourrez ainsi exploiter pleinement leur potentiel dès à présent.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *