Si OpenAI a fait un flop avec GPT-5, on espère un rebond du modèle avec le lancement de la nouvelle version de Sora 2, son générateur de vidéos IA. Dans le cas contraire, Google va conserver sa place de leader avec Veo 3.
Je m’attends personnellement à ce qu’OpenAI déploie Sora 2 d’ici les prochaines semaines. Et c’est tout à fait possible si l’on prend compte du lancement rapide de GPT-5.
À titre d’information, vous pouvez déjà profiter de Sora et de ses fonctionnalités si vous êtes abonné à ChatGPT Pro.
Ce qui vous permettra de générer des clips vidéos d’une durée maximale de 20 secondes. Auf que son modèle sous-jacent comment à devenir obsolète.
Et les rendus perdent en qualité, en particulier au niveau du contrôle de mouvement. Or, ses concurrents, dont Veo et Kling 2, performent mieux dans la gestion du rendu physique.
Comment OpenAI pourrait-il améliorer Sora 2 pour un meilleur rendu de ses vidéos
Il n’y a pas que Veo 3 qui se révèle comme le principal concurrent de Sora 2. Il y a aussi Meta et xAI qui ont leur propre modèle d’IA générative de vidéos. Sans oublier Midjourney qui s’est aussi mis dans la génération de vidéos par intelligence artificielle.
Ce qu’OpenAI devrait faire pour rendre Sora 2 plus compétitif, c’est avant tout d’exploiter ses capacités multimodales.
Je pense qu’il faudra également que l’entreprise envisage d’étendre les fonctionnalités de Sora. Cela tout en poussant l’intégration du modèle à ChatGPT.
Cela reviendrait à permettre à Sora de gérer la vidéo et l’audio en même temps puisqu’à défaut de son, il sera désavantagé.
Et c’est là où Veo 3 se démarque. Il permet aujourd’hui de générer des vidéos IA avec des effets sonoFres, des dialogues, ainsi que des bruits ambiants. Et tout cela fait partie des fonctionnalités principales du modèle.
OpenAI Sora was out of the game on day one.
To be fair, I compared it with Hunyuan, which dropped 6 days ago, it's an open-source AI model and you can run it locally for free.
TBH, if I were to compare it to Hailuo AI or Kling AI, Sora would look even worse.
Let’s dive in: pic.twitter.com/xyLfOmvIKg— el.cine (@EHuanglu) December 10, 2024
Tout est question de physique
Il n’est pas seulement question de résolution quand on parle d’IA générative de vidéos. La physique en constitue l’élément principal pour obtenir le meilleur réalisme visuel.
En ce qui concerne Sora, du moins la version actuelle, il a encore du mal à gérer les mouvements et génère souvent des distorsions physiques.
Je parle ici des anomalies telles que l’eau qui défie la gravité, les mouvements anormaux, ainsi que les transformations imprévisibles.
Pourtant, le modèle devrait déjà avoir la capacité de comprendre les allures humaines, le comportement réel et la mécanique des fluides.
Peut-être qu’OpenAI doit intégrer un moteur physique à Sora 2 pour atteindre ces objectifs pour enfin, en finir avec les membres déformés et les arrière-plans qui fondent.
L’incitation à la conversation, une nouvelle norme à appliquer pour Sora 2 ?
Je ne dirai pas que Sora, ni OpenAI, n’a pas d’atouts dans le lancement de Sora. L’entreprise à ChatGPT qui est aujourd’hui le chatbot le plus utilisé dans le monde. OpenAI prévoit même de lancer une offre spéciale de moins de 5 euros pour l’Inde.
Aussi, ChatGPT a déjà permis à des millions d’utilisateurs de comprendre comment engager une conversation avec l’intelligence artificielle.
Pour Sora, Sam Altman devrait trouver un moyen de convertir la génération de vidéos par IA en une pratique ressemblant à un dialogue, et non à de la programmation.
Sora sera alors plus compétitif s’il arrive à permettre aux utilisateurs de saisir des invites plus courantes et plus intuitives.
OpenAI killed Sora for this.
— How 2 AI (@How2use_AI) August 8, 2025
They put the new GPT-5 model exclusively into Higgsfield as a creative assistant, and the game has completely changed.
Let’s break it down. pic.twitter.com/HhsLbc6Wbf
Qu’en est-il de la cohérence des vidéos de Sora 2 ?
J’ai failli oublier ! Sora semble encore avoir du mal au niveau de la cohérence des personnages. Voyez par vous-même ! Si vous demandez à Sora de générer deux extraits d’une fille en robe blanche, il va vous créer deux personnages totalement différents.
Il se pourrait même que le modèle produise des visuels de style différent à chaque génération. Ce qui rend difficile la création d’histoire cohérente avec Sora. Surtout si l’on a besoin de plusieurs personnages et de plusieurs scènes.
Ce qui n’est pas le cas avec Kling 2.1 qui propose une meilleure cohérence au niveau des personnages et de l’éclairage.
Pour Veo, et avec l’intégration de Flow, Google est déjà à un autre niveau. Il permet d’ailleurs d’utiliser des styles artistiques ou des images en tant qu’ingrédients pour enrichir encore plus chaque scène générée.
Je suis optimiste, OpenAI peut encore reprendre son leadership avec Sora
Malgré ses défauts, Sora peut encore se démarquer de ses concurrents et permettre à OpenAI de reprendre son leadership.
Pour Veo 3, il est vite devenu une référence grâce à sa capacité de générer nativement du son. Quant à Kling et MiniMax, ils ont pu repousser leurs limites.
Runaway, de son côté, a apporté de nouvelles améliorations à Gen-4. Pourtant, le modèle est assez similaire à Sora en termes de qualité.
OpenAI doit donc non seulement ajouter d’autres fonctionnalités à Sora, mais aussi faire en sorte que le prochain déploiement n’est pas seulement une simple mise à jour.
- Partager l'article :


