in

MidJourney : tout savoir sur la bête noire d’OpenAI

MidJourney

est apparu il y a quelques mois et a commencé à faire mouche sur internet et les réseaux sociaux. D’ailleurs, cette IA génératrice arrive à créer des images époustouflantes. Et les internautes n’ont pas tardé à faire une comparaison entre MidJourney et DALL-E.

Depuis sa sortie, MidJourney est vite devenu le chouchou des utilisateurs et des créateurs d’art visuel. Mais certains se confrontent encore à des difficultés sur comment utiliser MidJourney ou sur les différentes fonctionnalités du générateur d’images. Voici alors tout ce qu’il faut savoir sur MidJourney, le principal rival de DALL-E d’.

Qu’est-ce que MidJourney et comment l’utiliser ?

MidJourney est un système ayant presque le même fonctionnement que DALL-E. Il est alimenté par l’intelligence artificielle et est utilisé pour créer des images à partir d’une description textuelle, également appelée « invites ». En d’autres termes, il s’agit d’une IA text-to-image , c’est-à-dire un système qui a pour principale utilité de générer une image plus artistique. A la différence de DALL-E d’OpenAI qui se concentre sur le réalisme de ses résultats, MidJourney se focalise sur le côté artistique.

Comment utiliser MidJourney ?

MidJourney ne fonctionne pas en tant qu’ web. Les utilisateurs devront s’inscrire sur le site web pour pouvoir profiter des fonctionnalités du système. Une fois que vous aurez reçu votre invitation, vous aurez accès à un bot auquel vous allez envoyer vos invites. Le bot en question s’appelle Discord et il livrera l’image correspondant aux invites pour un certain délai.

Midjourney sur Discord

Accès gratuit et payant

À titre d’information, Discord fonctionne de manière similaire à Slack. Et il est accessible sur mobile comme sur ordinateur via les navigateurs classiques tels que Chrome, Safari, Firefox, etc. Le vrai bémol avec MidJourney c’est qu’avec un accès gratuit, vous disposez d’une version d’essai. Le salon de discussion dans lequel vous interagissez est de ce fait très fréquenté. Par contre, il s’agit d’une manière de voir comment MidJourney génère les images à partir des précédentes invites des autres utilisateurs. Pour une meilleure expérience utilisateur, vous devez opter pour un abonnement mensuel de 10 euros. Ainsi, vous bénéficiez d’un salon et d’une conversation privée avec votre bot Discord.

Durée de génération des images

Sinon, en ce qui concerne la génération des images par l’IA, cela va prendre moins d’une heure pour que le système révèle une première vignette. Comparé au délai d’exécution de DALL-E, MidJourney est deux fois moins rapide. Par contre, il est possible à tout utilisateur de regarder MidJourney faire son travail et générer les images progressivement. C’est-à-dire des vignettes initiales aux vignettes finales.

Téléchargement des vignettes

À l’issue de la génération des vignettes finales, vous pouvez déjà télécharger les images, bien qu’elles ne soient qu’en petit format (256 px). Mais comme il ne s’agit que d’une version initiale, chaque utilisateur peut optimiser la qualité de l’image en la mettant à l’échelle selon leurs besoins. À noter que c’est une étape qui sera payée à part et va durer environ une minute.

Création de différentes variations pour une image MidJourney

Une autre fonctionnalité intéressante avec MidJourney : la possibilité de créer plusieurs variations pour une seule image. C’est un paramètre que DALL-E n’a pas et qui permet d’obtenir jusqu’à quatre images différentes avec une seule invite. Et pour un prix de 10 euros par mois, c’est largement suffisant pour créer jusqu’à plus de 600 variantes pour seulement 200 invites.

Le genre d’images pouvant être créées avec MidJourney

Pour ceux qui ne le savent pas encore, MidJourney est capable de générer des images plus créatives et plus détaillées. Du moins, c’est ce que le système peut faire aujourd’hui parce qu’avant, il se conjugue à un certain type d’image. Notamment des images très décorées, voire fractales.

YouTube video

Des images 90 % photo-réalistes

Aujourd’hui, on a accès à la version 3 de MidJourney. Des mises à jour ont été apportées et le système a gagné en puissance et en adaptabilité. Ce qui lui permet de générer des images moins frappantes qu’auparavant.

On peut même dire que MidJourney ne fait pas de photos banales. Il crée plutôt des œuvres d’art. Les images générées par ce modèle d’apprentissage automatique sortent du commun et sont considérées comme de vraies pièces de CGI (imagerie générée par ordinateur). Certains disent même qu’il y a une vraisemblance entre les vraies photographies ou les photos qui ont passé un traitement Photoshop et les images que génère MidJourney qui sont ultra nettes et ultra détaillées. Mais comment ça se fait ?

En réalité, la formation de MidJourney lui a permis de comprendre l’ensemble du jargon technique de la photographie. D’où sa capacité à reproduire l’ambiance, l’éclairage et l’exposition souhaités par chaque utilisateur.

Art visuel, illustrations 2D et peinture

MidJourney ne se limite pas au fait de pouvoir créer des images plus artistiques. Il a également la capacité de se référer aux styles d’arts historiques et aux chefs-d’œuvre des siècles d’avant pour générer des images de type peinture, illustrations abstraites et 2D, et croquis numériques et analogiques.

Création d’illustrations 3D

Pour en finir avec les possibles utilisations de MidJourney, les créateurs d’arts, particuliers comme professionnels, peuvent recourir au système pour créer des illustrations 3D. Sa capacité de générer des images ultra-nettes lui permet de mettre à l’échelle des ornements complexes et tout autre style d’image en 3D.

Les plus grands avantages de MidJourney

Nous n’avons pas cessé de le dire depuis tout à l’heure que les images générées par l’IA génératrice MidJourney sont plus esthétiques que celles de ses concurrents. Et même avec une seule invite, les utilisateurs pourraient obtenir plusieurs variantes différentes de qualité artistique.

Parallèlement, le système ajoute à chaque image des traits anthropomorphiques. Ce qui n’est pas possible avec DALL-E qui se résume aux instructions fournies par les utilisateurs. En d’autres termes, MidJourney semble être plus cohérent et plus instructif. Par contre, il y a un petit inconvénient qui, dans la plupart des cas, fait en sorte que le système ne prend pas compte des styles demandés par l’utilisateur. C’est-à-dire que par défaut, MidJourney a tendance à privilégier la beauté de ses images. Et cela sans vraiment s’intéresser, bien que dans la majorité des cas, au côté réaliste.

Midjourney

Sinon, on a accès à plusieurs styles différents qui nous permettent d’obtenir une vignette qui se rapproche le mieux des résultats attendus. À cela s’ajoute le fait que les styles ne se marient pas avec perfection. Et si l’on devait inscrire la même invite, il est possible d’obtenir un autre résultat tout à fait différent du précédent.

La sauvegarde des vignettes est activée par défaut sur MidJourney. Ce qui permet de télécharger ultérieurement le contenu sans restrictions. Ce n’est pas le cas avec DALL-E qui n’offre que la possibilité de télécharger les 50 dernières vignettes. À moins de télécharger manuellement chaque illustration.

Les réglementations qui régissent l’utilisation de MidJourney

MidJourney impose une limitation surtout au niveau du type d’images générées. Dans son ensemble, le système exclut tout ce qui est relatif aux images pouvant entraîner un gène pour les utilisateurs. Notamment les images présentant des violences, et surtout le contenu considéré comme sexuel. Pour ce qui en est des autres styles d’images, dont la maladie et la santé, les personnalités publiques, le contenu politique, il n’y a pas de contrainte.

Il y a donc une plus grande ouverture chez MidJourney que chez OpenAI. Si vous souhaitez créer une image représentant un super-soldat, une illustration politique ou un contenu lié à la santé par exemple, il est préférable de recourir à MidJourney.

Comment se connecter et accéder à MidJourney ? Notre guide du débutant

MidJourney a recours à Discord pour l’insertion des invites. Mais il n’est pas recommandé d’avoir un compte Discord pour accéder à MidJourney.

Guide mise en route MidJourney

En premier lieu, vous avez deux options : accéder directement au serveur Discord et participer à la version bêta de Midjourney ou vous servir de votre serveur privé. Sinon, vous pouvez directement allez sur https://discord.com/invite/midjourney et attendre le mail d’invitation.

Saisir votre invite

Une fois sur le serveur Discord de MidJourney, vous pouvez déjà rejoindre des canaux pour débutants disponibles. À ce stade, c’est dans le champ « Message » que tout va se passer. Avant tout, veuillez saisir la commande /, puis appuyer sur « Espace ». Cette petite manipulation vous permettra d’activer le paramètre « Invite » pour ensuite, saisir votre description textuelle.

Vous pouvez par exemple saisir « /imagine prompt little girl with a rabbit » pour obtenir l’image d’une jolie fille accompagnée d’un petit lapin. MidJourney va, à partir de cette invite, générer quatre vignettes différentes. À titre d’information, vous pouvez saisir de simples invites comme des invites plus complexes.

Mise à l’échelle des vignettes

Une fois l’image générée, des boutons apparaissent juste en dessous : U1, U2, U3 et U4. Chaque bouton correspond à une mise à l’échelle précise. Vous n’avez qu’à choisir celle qui vous convient. La taille par défaut des images est de 512 x 512 px. Mais on peut les mettre à l’échelle pour obtenir une résolution de 1024 x 1024 px, voire 1664 x 1664 px.

Midjourney version 5 : en quoi est-ce différent ?

L’équipe de Midjourney a constamment mis à jour le logiciel depuis son lancement. Ils en sont maintenant à la cinquième itération.

Celle-ci, selon les propres termes de l’équipe, offre une meilleure qualité d’image, des résultats plus diversifiés. En outre, elle prend en charge les textures sans couture, des rapports d’aspect plus larges, une meilleure promotion de l’image et une gamme dynamique plus étendue.

 Cela fait beaucoup de changements quelque peu vagues, mais il s’agit essentiellement de mettre l’accent sur des niveaux de détail plus élevés dans les images. Les gouttes de pluie, l’iris d’un œil ou l’arrière-plan d’une montagne seront tous plus hyperréalistes. Cela permettra d’extraire plus de détails à partir d’invites plus détaillées, alors que le modèle aurait auparavant laissé de côté des informations supplémentaires.

Il s’agit de la version du modèle qui est désormais disponible pour tous les utilisateurs.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *