in

Après le flop de GPT-5, Sora 2 pourrait sauver OpenAI, voici pourquoi

Vidéos Sora 2 OpenAI

Si OpenAI a fait un flop avec GPT-5, on espère un rebond du modèle avec le lancement de la nouvelle version de Sora 2, son générateur de vidéos IA. Dans le cas contraire, Google va conserver sa place de leader avec Veo 3.

Je m’attends personnellement à ce qu’OpenAI déploie Sora 2 d’ici les prochaines semaines. Et c’est tout à fait possible si l’on prend compte du lancement rapide de GPT-5.

À titre d’information, vous pouvez déjà profiter de Sora et de ses fonctionnalités si vous êtes abonné à ChatGPT Pro.

Ce qui vous permettra de générer des clips vidéos d’une durée maximale de 20 secondes. Auf que son modèle sous-jacent comment à devenir obsolète.

Et les rendus perdent en qualité, en particulier au niveau du contrôle de mouvement. Or, ses concurrents, dont Veo et Kling 2, performent mieux dans la gestion du rendu physique.

YouTube video

Comment OpenAI pourrait-il améliorer Sora 2 pour un meilleur rendu de ses vidéos

Il n’y a pas que Veo 3 qui se révèle comme le principal concurrent de Sora 2. Il y a aussi Meta et xAI qui ont leur propre modèle d’IA générative de vidéos. Sans oublier Midjourney qui s’est aussi mis dans la génération de vidéos par intelligence artificielle.

Ce qu’OpenAI devrait faire pour rendre Sora 2 plus compétitif, c’est avant tout d’exploiter ses capacités multimodales.

Je pense qu’il faudra également que l’entreprise envisage d’étendre les fonctionnalités de Sora. Cela tout en poussant l’intégration du modèle à ChatGPT.

Cela reviendrait à permettre à Sora de gérer la vidéo et l’audio en même temps puisqu’à défaut de son, il sera désavantagé.

Et c’est là où Veo 3 se démarque. Il permet aujourd’hui de générer des vidéos IA avec des effets sonoFres, des dialogues, ainsi que des bruits ambiants. Et tout cela fait partie des fonctionnalités principales du modèle.

Tout est question de physique

Il n’est pas seulement question de résolution quand on parle d’IA générative de vidéos. La physique en constitue l’élément principal pour obtenir le meilleur réalisme visuel.

En ce qui concerne Sora, du moins la version actuelle, il a encore du mal à gérer les mouvements et génère souvent des distorsions physiques.

Je parle ici des anomalies telles que l’eau qui défie la gravité, les mouvements anormaux, ainsi que les transformations imprévisibles.

Pourtant, le modèle devrait déjà avoir la capacité de comprendre les allures humaines, le comportement réel et la mécanique des fluides.

Peut-être qu’OpenAI doit intégrer un moteur physique à Sora 2 pour atteindre ces objectifs pour enfin, en finir avec les membres déformés et les arrière-plans qui fondent.

YouTube video

L’incitation à la conversation, une nouvelle norme à appliquer pour Sora 2 ?

Je ne dirai pas que Sora, ni OpenAI, n’a pas d’atouts dans le lancement de Sora. L’entreprise à ChatGPT qui est aujourd’hui le chatbot le plus utilisé dans le monde. OpenAI prévoit même de lancer une offre spéciale de moins de 5 euros pour l’Inde.

Aussi, ChatGPT a déjà permis à des millions d’utilisateurs de comprendre comment engager une conversation avec l’intelligence artificielle.

Pour Sora, Sam Altman devrait trouver un moyen de convertir la génération de vidéos par IA en une pratique ressemblant à un dialogue, et non à de la programmation.

Sora sera alors plus compétitif s’il arrive à permettre aux utilisateurs de saisir des invites plus courantes et plus intuitives.

Qu’en est-il de la cohérence des vidéos de Sora 2 ?

J’ai failli oublier ! Sora semble encore avoir du mal au niveau de la cohérence des personnages. Voyez par vous-même ! Si vous demandez à Sora de générer deux extraits d’une fille en robe blanche, il va vous créer deux personnages totalement différents.

Il se pourrait même que le modèle produise des visuels de style différent à chaque génération. Ce qui rend difficile la création d’histoire cohérente avec Sora. Surtout si l’on a besoin de plusieurs personnages et de plusieurs scènes.

Ce qui n’est pas le cas avec Kling 2.1 qui propose une meilleure cohérence au niveau des personnages et de l’éclairage.

Pour Veo, et avec l’intégration de Flow, Google est déjà à un autre niveau. Il permet d’ailleurs d’utiliser des styles artistiques ou des images en tant qu’ingrédients pour enrichir encore plus chaque scène générée.

YouTube video

Je suis optimiste, OpenAI peut encore reprendre son leadership avec Sora

Malgré ses défauts, Sora peut encore se démarquer de ses concurrents et permettre à OpenAI de reprendre son leadership.

Pour Veo 3, il est vite devenu une référence grâce à sa capacité de générer nativement du son. Quant à Kling et MiniMax, ils ont pu repousser leurs limites.

Runaway, de son côté, a apporté de nouvelles améliorations à Gen-4. Pourtant, le modèle est assez similaire à Sora en termes de qualité.

OpenAI doit donc non seulement ajouter d’autres fonctionnalités à Sora, mais aussi faire en sorte que le prochain déploiement n’est pas seulement une simple mise à jour.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !