NVIDIA dévoile des IA aux voix plus expressives et réalistes -

NVIDIA a mis au point des nouveaux modèles d’IA qui produisent des voix plus réalistes et expressives que les anciens systèmes.

Les IA conversationnelles sont connues pour discuter dans le langage naturel des humains. Leur amélioration est indéniable depuis les GPS jusqu’aux assistants vocaux d’aujourd’hui. Néanmoins, au niveau de l’élocution, il reste évident que ce ne sont pas de véritables personnes qui parlent. Mais aux dernières nouvelles, NVIDIA a développé des nouveaux modèles d’IA capables de produire des voix plus naturelles.

RAD-TTS, l’IA de NVIDIA qui peut reproduire parfaitement la voix humaine

Effectivement, la manière dont les assistants vocaux tels que Alexa, Google Assistant et Siri s’expriment est impressionnante. Avec précision, ils génèrent des discours réalistes et cohérents à la manière des humains. Mais ils seraient encore plus étonnants si leurs rythmes et leurs intonations étaient plus naturels.

C’est ainsi que NVIDIA a mis au point de nouveaux outils capables d’acquérir des qualités vocales naturelles. Pour ce faire, ils s’entraînent avec la voix d’une véritable personne.

Le système, appelé RAD-TTS a récemment remporté un concours qui avait pour objet de développer l’avatar le plus réaliste. Entre autres, il permet à une personne d’entraîner un modèle de synthèse vocale avec sa propre voix pour lui attribuer le rythme, la tonalité, le timbre, etc.

Par ailleurs, les outils d’IA développés par NVIDIA permettent également de prononcer les mots d’un locuteur avec la voix d’une autre personne. Cette fonctionnalité de RAD-TTS s’appelle la conversation vocale. Selon les chercheurs de NVIDIA, l’interface du système offre un contrôle précis sur la hauteur, la durée et l’énergie de la voix synthétisée, au niveau de l’image.

Une narration vocale conversationnelle

Des exemples de ces nouveaux outils ont été utilisés dans la série de vidéos « I am AI ». Les chercheurs de NVIDIA ont créé une narration vocale conversationnelle avec des voix synthétisées par l’IA au lieu de voix humaines.

Dans une vidéo, le producteur s’enregistre en train de lire le script. Puis, à l’aide du RAD-TTS, il a converti son discours dans la voix d’une narratrice. Le producteur vidéo pouvait ensuite ajuster les accents et le rythme de la narration pour mieux exprimer le ton et le style de la vidéo, d’après NVIDIA.

Bien que les GPU NVIDIA permettent d’accélérer l’entraînement des modèles, une partie de la recherche est disponible en open source pour d’autres développeurs.

Partager l'article :

Facebook
Twitter
LinkedIn

Restez à la pointe de l'information avec
INTELLIGENCE-ARTIFICIELLE.COM !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Actualités

Comprendre l’IA physique, des écrans aux robots

Pendant longtemps, l’intelligence artificielle est restée associée aux écrans. Elle analysait des données, répondait à des questions, générait des textes ou créait des images. Son

16 juillet 2026

Assistant vocaux

Le nouveau Siri arrive avec la première bêta publique d’iOS 27

Apple a ouvert ce 14 juillet 2026 la première bêta publique d’iOS 27. Après plusieurs semaines réservées aux développeurs, cette version peut désormais être installée

15 juillet 2026

Algorithme

Meta lance un détecteur d’images IA, mais un simple recadrage suffit à le piéger

Avec la sortie de Grok 4.5, Meta dévoile un outil censé repérer ses images générées par intelligence artificielle. Problème : il ne marche plus dès

14 juillet 2026

IA Générative

OpenAI enterre son navigateur IA censé révolutionner Internet

OpenAI met fin à son navigateur Atlas, pourtant présenté comme une petite révolution. Lancé en octobre dernier, il aura vécu moins d’un an. Avec Atlas,

14 juillet 2026

IA Générative

OpenAI dévoile GPT-5.6 Sol, Terra et Luna : trois versions pour concurrencer Anthropic

OpenAI a officialisé le lancement de sa gamme GPT-5.6, déclinée en trois versions distinctes : Sol, Terra et Luna. L’objectif ? Tenir tête à la

13 juillet 2026

Algorithme

OpenAI lance GPT-5.6 et ChatGPT Work pour contrer Anthropic

OpenAI vient de libérer sa nouvelle génération de modèles auprès du grand public, accompagnée d’une solution logicielle conçue pour exécuter des tâches administratives complexes à

13 juillet 2026

NVIDIA dévoile des IA aux voix plus expressives et réalistes

RAD-TTS, l’IA de NVIDIA qui peut reproduire parfaitement la voix humaine

Une narration vocale conversationnelle

Comprendre l’IA physique, des écrans aux robots

Le nouveau Siri arrive avec la première bêta publique d’iOS 27

Meta lance un détecteur d’images IA, mais un simple recadrage suffit à le piéger

OpenAI enterre son navigateur IA censé révolutionner Internet

OpenAI dévoile GPT-5.6 Sol, Terra et Luna : trois versions pour concurrencer Anthropic

OpenAI lance GPT-5.6 et ChatGPT Work pour contrer Anthropic

Laisser un commentaire Annuler la réponse

IA, conformité et souveraineté : l’open source européen pour la protection des données publiques

L’IA sur-mesure, un impératif légal face à l’urgence de la conformité

Pourquoi les femmes sont au cœur de l’urgence légale et éthique de l’IA ?

RAD-TTS, l’IA de NVIDIA qui peut reproduire parfaitement la voix humaine

Une narration vocale conversationnelle

ARTICLES SIMILAIRES

Laisser un commentaire Annuler la réponse

Tendances

La newsletter IA du futur

Interviews