15 secondes, c’est la durée maximale des vidéos que l’on peut générer sur Grok Imagine. Le modèle peut même créer du contenu NSFW. Mais est-ce suffisant pour rivaliser avec OpenAI et Google qui détiennent la tête du classement des meilleures Ia génératives de vidéos du marché ? On fait le point en faisant un vs entre Grok Imagine, Sora et Veo 3.
À titre d’information, xAI a lancé Grok Imagine le week-end dernier. Aujourd’hui, le modèle, disponible sur iOS et Android via l’application Grok, peut générer des images et des vidéos.
Aussi, je tiens à rappeler que Grok Imagine est uniquement disponible pour les abonnés Super Grok et Premium X.
Des performances globales assez décevantes pour l’IA d’Elon Musk
Jusqu’à l’heure, les outils de génération de contenu par intelligence artificielle constituent une alternative moins coûteuse pour la production de vidéos.
Mais ils ne sont pas sans risques puisque le contenu généré pourrait multiplier les deepfake et propager encore plus la désinformation.
Quoi qu’il en soit, Grok Imagine est là, et même Midjourney s’est aussi mis à la génération de vidéos par IA.
Alors que vaut ce modèle de xAI face à Sora d’OpenAI ou a d’autres outils tels que Veo 3 de Google ?
Le moins que je puisse dire, c’est que c’est Veo 3 qui domine jusqu’ici le marché des vidéos générées par intelligence artificielle.
Sora quant à lui, je le positionne en deuxième place, juste devant le modèle générateur de vidéos de Midjourney.
En ce qui concerne Grok Imagine, je ne suis pas sûr de vraiment être impressionné par les résultats que j’ai obtenus par rapport à ceux de Veo 3 et de Sora.
Bien sûr, il s’agit d’un tout nouveau modèle. Et comme l’a souligné Elon Musk, Grok Imagine va prendre le temps de s’améliorer.
Mais au moment où j’ai rédigé ces lignes, le modèle de xAI me semble encore loin de pouvoir concurrencer avec celui d’OpenAI et de Google.
Grok Imagine vs Veo 3 et Sora, que vaut l’IA vidéo de xAI ?
Pour vraiment savoir qui est le meilleur générateur de vidéo IA, j’ai pris Veo 3, Sora et Grok Imagine de xAI.
J’ai ensuite saisi le même prompt sur chaque modèle. Déjà à ce stade, Grok Imagine et Veo 3 ont une différence majeure.
Veo 3, le générateur de vidéos IA de Google, peut directement créer des vidéos à partir d’une invite textuelle.
Grok Imagine quant à lui, doit d’abord créer une image. Et c’est à partir de cette image qu’il va générer la vidéo en animant l’image.
Il s’agit donc avant tout d’un modèle text-to-image et non un modèle text-to-video comme Veo, tout comme Midjourney.
Vous l’aurez compris, Veo 3 est meilleur que Grok Imagine au niveau de la génération proprement dite de vidéos IA.
Niveau réalisme, Grok Imagine me semble en retrait par rapport au rendu de Veo 3 et de Sora AI. Vous pouvez le voir sur cette publication de Timothy Beck Werth.
Grok Imagine completely failed to understand the "security camera" part of the prompt. I tried modifiers like "Ring camera footage" or "black and white surveillance footage," but the results were identical. Here are the images and video Grok generated: pic.twitter.com/xo7AXba0ie
— Timothy Beck Werth (@beck_werth) August 4, 2025
Voici d’ailleurs le résultat obtenu avec Sora pour que vous puissiez vous-même faire une comparaison entre Grok Imagine et les autres outils.
How did Sora from OpenAI do? It understood the assignment perfectly based solely on a text prompt, no image required. The video itself needs some refinement. pic.twitter.com/ufWkj2xM6Q
— Timothy Beck Werth (@beck_werth) August 4, 2025
Pour Midjourney, les résultats me semblent plutôt satisfaisants. Mais il a fallu plus d’une tentative pour aboutir à ce résultat.
Midjourney passed this simple test too. Like Grok Imagine, Midjourney doesn't offer text-to-video. First, you create an image from a prompt, then animate the video. Based on the same prompt, Midjourney created this image and video: pic.twitter.com/WvYXNQKISj
— Timothy Beck Werth (@beck_werth) August 4, 2025
Autres inconvénients de Grok Imagine par rapport à Veo 3 et à Sora
Il n’y a pas que la qualité des vidéos qui manque à l’appel en ce qui concerne Grok Imagine de xAI. L’audio constitue aussi un de ses points faibles.
Avec Veo 3 de Google, on a droit à des dialogues cohérents et bien synchroniser, ainsi que des effets sonores.
Sur Grok Imagine, les vidéos se limitent généralement à des effets sonores approximatifs.
Mais Elon Musk se justifie en mentionnant qu’il s’agit outil qui a pour objectif de générer du contenu amusant.
Il est donc normal que dans un premier temps, Grok Imagine soit optimisé pour du contenu du genre anime et mèmes.
Au-delà de ces deux types de vidéos, je pense qu’il vaut mieux opter pour d’autres outils plus performants.
Cela ne veut pas dire que Grok Imagine n’a pas de point fort. Il en a, et l’un d’entre eux n’est autre que la vitesse à laquelle il génère ses vidéos.
Los de mes tests, j’ai constaté que l’IA de xAI génère du contenu plus rapidement que ses concurrents. Et sa vitesse va jusqu’à deux fois plus rapide.
Je vous ai tout de même préparé un petit guide sur comment tester et essayer Grok Imagine dans cet article. Bonne lecture et n’hésitez pas de donner votre avis en commentaire.
- Partager l'article :