in ,

Ajouter du son à vos vidéos IA ? Oui, c’est possible grâce à la V2A

V2A DeepMind Voix IA pour vidéo IA

On a déjà eu droit à de courtes séquences vidéos générées par l’. Mais cette fois-ci, les ingénieurs de ont développé un outil d’IA qui permet de générer du son pour les vidéos. Il s’agit d’une V2A, vidéo-audio, un modèle de diffusion qui combine la transcription de dialogues et de bandes sonores.

Le concept est assez simple ! À partir d’une simple description, autrement dit d’un prompt, vous pouvez facilement générer une bande sonore.

V2A de DeepMind est également capable de générer une musique, des bruits d’ambiance, voire des dialogues parfaitement adaptés à l’action à l’écran.

YouTube video

DeepMind et ses deepfakes vocaux

Cette technologie repose cependant sur un modèle d’intelligence artificielle surdoué. C’est-à-dire un modèle entraîné sur un mélange de sons, dialogues et d’extraits vidéo.

Grâce aux deepfakes vocaux de DeepMind, les voix générées auront alors l’air d’être prononcées par les vrais personnages.

Un outil donc, qui pourrait bien transformer la création audiovisuelle. Mais en bien ou en mal ? Telle est la question !

En tout cas, il s’agit d’une nouvelle corde que les professionnels de l’audiovisuel pourraient ajouter à leur arc.

Reste à voir si cette technologie de rupture deviendra incontournable ou soulèvera des inquiétudes, surtout à l’ère de la désinformation par deepfakes.

Google DeepMind hésite encore dans le lancement de V2A

Malgré les arguments qu’a lancés DeepMind, V2A est loin d’être parfait. Et c’est tout à fait normal, vu qu’il n’est qu’à ses débuts.

Bien sûr, cette nouvelle IA a la capacité de comprendre les pixels bruits pour ensuite, les synchroniser avec une séquence vidéo.

Mais d’après la déclaration des équipes de Google DeepMind, elles ont formé V2A sur une petite quantité de données.

Les sons générés sont donc de moindre qualité, du moins jusqu’à ce que DeepMind rectifie son tir. Raison pour laquelle la V2A n’est pas encore disponible au grand public.

Google appelle au secours

DeepMind affirme en effet collaborer avec des créateurs et cinéastes renommés pour recueillir des avis divers sur sa technologie V2A.

Ces retours guideront leurs recherches et le développement des prochaines générations de V2A. 

Donc avant toute mise à disposition publique, V2A subira des évaluations et des tests de sécurité approfondis.

L’entreprise présente V2A comme un outil précieux pour les archivistes et ceux travaillant sur des images historiques.

Parallèlement, ce type d’IA générative pourrait aussi bouleverser l’industrie cinématographique et télévisuelle.

Des mesures de protection du travail très strictes seront nécessaires pour éviter que ces outils de médias génératifs ne suppriment des emplois, voire des professions entières dans certains cas.

« Avant toute tentative de lancement, nous envisageons de soumettre V2A à des tests de sécurité. C’est ainsi que nous pourrions garantir la sécurité de nos clients », ont déclaré les équipes de DeepMind.

On ne créera donc pas un dossier complet sur V2A avant que DeepMind le rende public. Mais vous pouvez toujours consulter nos autres guides, tutoriels et dossiers sur cette page.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *