in

OpenAI prépare la sortie de Sora 2, une version qui intégrera enfin le son

Sora 2 bientôt ?

Après l’annonce de l’outil de génération de vidéo de Midjourney, OpenAI prépare aussi le lancement de Sora 2, son modèle d’IA générative de vidéos. Mais rien n’a encore été officialisé. Ce qui est sûr, c’est que cette version de Sora constituera le principal rival de Veo 3 de Google.

L’avantage majeur de Sora réside dans la qualité de ses images. Mais cette fois-ci, je pense qu’il ne faut pas se limiter aux visuels et créer des films muets.

Le son constitue également un élément majeur des vidéos générées par intelligence artificielle. Ce qui est d’ailleurs le point fort de Veo 3.

Alors, OpenAI pourra-t-il enfin donner du son à ses vidéos ? Si oui, à quel prix éthique et moral pour l’entreprise ?

YouTube video

Comment la version 2 de Sora pourrait-elle se démarquer ?

Si OpenAI veut réussir à surpasser Google, il faudrait qu’il réussisse à intégrer des éléments sonores convaincants dans les vidéos.

Il pourrait s’agir d’un effet, d’une voix ou encore d’un bruit de fond. Soit des éléments qui se marient parfaitement avec la richesse visuelle des vidéos.

Mais ce n’est pas une mince affaire si l’on prend en compte la complexité de la reproduction du son, ainsi que de la synchronisation des lèvres.

Bien sûr, Veo 3 n’est pas exempt de défauts en matière de synchronisation audio-vidéo. Mais certaines créations montrent une précision étonnante entre le mouvement des lèvres et le son, accompagnées d’une bande-son cohérente avec l’ambiance et d’effets sonores bien intégrés à la narration.

Il est vrai que la durée limitée à huit secondes par vidéo réduit à la fois les risques et les possibilités. Mais au-delà du timing, c’est bien la fidélité à la scène représentée qui reste le critère central.

De son côté, Sora a déjà prouvé sa capacité à générer des séquences visuellement convaincantes, comme ces chats semblant vraiment plonger dans une piscine.

Si OpenAI parvient à maintenir ce niveau de réalisme sur des clips de 30 secondes ou plus, la plateforme pourrait séduire un public avide de formats plus longs et plus expressifs dans l’univers de la vidéo générée par l’IA.

Sora encore muet, un point pour Veo 3 de Google

Avec Sora, OpenAI propose déjà des vidéos générées en haute qualité pouvant dépasser les 20 secondes.

Intégré à l’écosystème ChatGPT, l’outil peut aussi s’inscrire dans des projets créatifs plus vastes, ce qui lui confère une meilleure flexibilité.

Pourtant, il est encore loin de pouvoir rivaliser avec Veo 3 à cause de l’absence de son dans ses vidéos. 

Je m’attends personnellement à ce qu’OpenAI puisse atteindre ce niveau. Sans quoi, il sera pour moi un outil de génération de vidéos banal.

Or, pousser les performances de Sora 2 trop loin pourrait bien soulever de nouveaux enjeux éthiques et sécuritaires.

Certes, OpenAI comme Google imposent des restrictions strictes sur les contenus sensibles, qu’il s’agisse de représentations de personnes réelles, de scènes violentes ou d’œuvres protégées par des droits d’auteur.

Mais l’introduction de l’audio dans ce type de modèles pourrait ouvrir un nouveau champ de complexité.

Des voix de plus en plus réalistes impliquent un autre niveau de contrôle sur leur provenance et leur usage. Mais également des risques de mésusage, de manipulation ou de deepfakes audio-vidéo.

YouTube video

Il y a aussi la question décisive du prix

Pour accéder à Veo 3 de Google, il faut passer par Gemini Advanced, et souscrire à l’abonnement AI Ultra facturé 250 $ par mois.

Ce qui veut dire que l’outil reste jusqu’ici réservé aux utilisateurs les plus engagés. Et si OpenAI décide d’adopter le même plan tarifaire en intégrant Sora 2 à ChatGPT Pro ou à ChatGPT Plus, il risque de limiter son public.

Mais si la version la plus accessible de son offre parvient à rivaliser en qualité et en fonctionnalités, elle pourrait rapidement séduire un public bien plus large.

Je dis cela puisque pour la majorité des utilisateurs, le choix d’une IA générative de vidéos dépendra autant de son prix que de sa facilité d’usage, de ses capacités techniques et de la qualité des rendus.

Et OpenAI a encore des défis à relever pour que Sora 2 devienne un acteur crédible dans cette course technologique.

Mais il ne fait plus guère de doute que l’issue de ce duel se jouera très prochainement. Quand ? On attend l’annonce officielle d’OpenAI pour en avoir le cœur net.

En attendant, je vous ai préparé un article, disponible ici, qui montre comment Veo crée des films IA en un clic avec Flow.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !