ByteDance, la société mère de TikTok, a développé une IA révolutionnaire nommée OmniHuman, capable de créer des vidéos réalistes à partir d’une simple photo. Cette technologie surpasse les modèles précédents, qui ne permettaient d’animer que des visages ou le haut du corps.
OmniHuman génère des vidéos complètes qui montrent des personnes en train de parler, chanter et se déplacer de manière naturelle. Cette avancée pourrait transformer l’industrie du divertissement et des communications numériques.
Le fonctionnement d’OmniHuman
OmniHuman utilise un système de génération de vidéos basé sur l’IA qui intègre une approche « omni-conditions ». Cette méthode permet à l’IA d’apprendre à partir de vastes ensembles de données comprenant du texte, de l’audio et des mouvements corporels.
L’équipe de ByteDance a formé OmniHuman en utilisant 18 700 heures de données vidéo humaines. Grâce à cela, le système peut générer des vidéos en tenant compte des gestes et des positions corporelles. Le résultat ? Des vidéos fluides et réalistes, avec des gestes parfaitement synchronisés au discours.
L’animation humaine de bout en bout
Les chercheurs ont détaillé dans un article publié sur arXiv les progrès réalisés par OmniHuman. Ils ont indiqué que les méthodes traditionnelles étaient limitées. « Les systèmes existants peinaient à s’adapter à de grands modèles de génération vidéo. Cela limitait leur potentiel. »
OmniHuman résout cette contrainte en intégrant plusieurs types de signaux pendant l’entraînement. Ainsi, l’IA réduit le gaspillage de données. Ce système permet de produire des vidéos plus riches et diversifiées. Par exemple, il anime des personnes jouant d’un instrument de musique ou prononçant des discours. Cette capacité à animer le corps entier représente une avancée majeure dans l’animation par IA.

Concurrence croissante dans la génération de vidéos par IA
OmniHuman émerge dans un domaine où OpenAI, Google, Meta et Microsoft développent également des technologies similaires. Cependant, ByteDance a fait un grand bond en avant avec cette technologie. Cette avancée pourrait donner un avantage décisif à TikTok car elle permettra à la plateforme d’intégrer des vidéos générées par IA dans ses contenus créatifs. Grâce à OmniHuman, TikTok pourrait révolutionner la création de contenu sur les réseaux sociaux et dans les médias traditionnels.
Les possibilités et les risques de cette technologie
Cette percée offre des possibilités infinies pour la création de contenus éducatifs, de divertissement et de communication. Cependant, elle soulève aussi des inquiétudes. La facilité avec laquelle cette technologie peut créer des vidéos trompeuses inquiète de nombreux experts. « Elle pourrait devenir un outil dangereux pour générer des médias synthétiques à des fins malveillantes, » expliquent certains analystes. Ainsi, la véracité des informations pourrait être mise en péril.
Les chercheurs de ByteDance présenteront leurs résultats lors d’une conférence sur la vision par ordinateur, bien qu’aucune date n’ait encore été précisée. Cette technologie marque un tournant dans l’utilisation de l’IA pour créer des vidéos réalistes. OmniHuman semble être une innovation extrêmement prometteuse, mais son déploiement soulève des questions éthiques. Il faudra donc veiller à son utilisation, notamment concernant la protection de la vie privée et la création de contenus.
- Partager l'article :