Si OpenAI tarde à lancer Sora AI au grand public, les Chinois ont profité du retard du géant californien en se prenant une place dans la course à l’intelligence artificielle. C’est dans ce contexte que Kuaishou Technology dévoile Kling, son IA générative de vidéo qui va rivaliser avec celle d’OpenAI.
Rappelons tout de même que ce n’est pas la première IA vidéo chinoise. On a déjà pris connaissance de Vidu lors du Zhongguancun Forum 2024.
Ce n’est pas tout, Luma a également lancé Dream Machine, une autre IA générative de vidéo. À trop attendre, OpenAI semble creuser sa propre tombe.
Du jamais vu !
Le premier avantage de Kling, c’est qu’il génère des séquences de vidéos dont la durée est plus longue que celle des autres modèles.
On parle également de contenus qui peuvent contenir plusieurs plans. Il ne s’agit donc pas de courtes vidéos de 5 secondes comme sur Dream Machine.
Contrairement aux modèles déjà disponibles, Kling a une vraie capacité de simuler le monde réel, avec une résolution allant jusqu’à 1080p et une fréquence de 30ips.
À l’instar de Sora, cet outil repose sur une architecture de type Transformer avec un processus de diffusion.
Grâce à sa technologie exclusive, il peut s’adapter à une grande diversité de formats et de compositions visuelles.
Par ailleurs, ce système intègre également une fonctionnalité de modélisation tridimensionnelle des visages et des silhouettes.
Et c’est ce qui permet au modèle d’enrichir l’expressivité et la fluidité des mouvements dans les séquences générées.
Le niveau de réalisme de Kling dépasse toutes les attentes
Les premières créations partagées par les utilisateurs de Kling offrent un aperçu varié. On y trouve notamment un jeune cycliste, un équidé dans un paysage aride, un individu savourant un plat de nouilles, ou encore un adolescent dégustant un sandwich.
Ce qui m’a particulièrement frappé, c’est le degré élevé de réalisme de ces séquences.
Bien que certaines présentent encore des imperfections de netteté, comme c’est souvent le cas avec les vidéos générées par IA, avec Kling, ces défauts sont nettement atténués.
La séquence mettant en scène un perroquet, par exemple, est d’un réalisme tel qu’il est presque impossible de déterminer son origine artificielle. Le même constat s’applique à la vidéo de l’homme mangeant son sandwich.
Même dans les scènes impliquant des liquides en mouvement, un défi reconnu pour la plupart des IA, Kling démontre une maîtrise remarquable.
Dans son ensemble, Kling semble particulièrement doué dans la reproduction des mouvements naturels.
Il en est de même au niveau du respect des principes et des lois physiques. En somme, les résultats sont plus authentiques et plus réalistes.
Mauvaise nouvelle pour l’Europe, bonne nouvelle pour OpenAI
Kling est déjà disponible en Chine sous iOS. Pour y avoir accès, il suffit d’une inscription sur la liste d’attente que Kuaishou a mise en place.
Par contre, on ne sait pas encore si la startup chinoise va lancer ou non Kling en dehors de la Chine.
Jusqu’à l’heure, seuls les numéros de téléphone chinois sont acceptés lors de l’inscription.
Pour les Européens, la nouvelle est assez frustrante. Mais pour OpenAI, c’est une bouffée d’air qui lui permettra de peaufiner Sora AI avant son lancement.
En tout cas, on n’attend que vos commentaires et votre avis sur qui est la plus performante IA générative de vidéos.
- Partager l'article :