Des images générées par intelligence artificielle, des modèles capables de doubler votre voix, l’IA promet beaucoup de choses. Mais parallèlement, elle constitue une menace aussi bien pour les utilisateurs que pour les employés. La prolifération des deepfakes audio fait partie des plus grands défis liés à l’utilisation de l’intelligence artificielle. C’est justement dans ce contexte qu’ElevenLabs propose la solution qu’il a trouvée contre les deepfakes audio.
La startup œuvre dans la génération de synthèse vocale, le clonage et le doublage audio par intelligence artificielle.
Le modèle, baptisé Suno AI, prend en charge plus de 28 langues pour le clonage et le doublage. Pour les utilisateurs, il s’agit d’une véritable innovation. Pour les autorités par contre, ce n’est autre qu’une technologie potentiellement dangereuse.
ElevenLabs face à une menace invisible
Les progrès rapides de l’intelligence artificielle soulèvent des inquiétudes croissantes quant à la recrudescence d’arnaques sophistiquées.
En particulier dans les situations où les escrocs usurpent l’identité de proches, de représentants officiels ou même d’intérêts amoureux grâce à des systèmes de clonage vocal convaincants.
Le responsable de l’IA à la Maison Blanche, Bruce Reed, a d’ailleurs souligné que cette technologie était l’une de ses principales préoccupations.
L’année dernière, certains utilisateurs ont réussi à détourner un outil comme celui d’ElevenLabs. Cela dans le but de générer des deepfakes outranciers et à caractère discriminatoire.
Les contenus, d’après les informations rapportées par Vice, mettaient en scène des célébrités.
Néanmoins, pour le cofondateur d’ElevenLabs, Piotr Staniszewski, cette technologie de synthèse vocale représente avant tout un formidable espoir.
Elle permettrait notamment aux personnes souffrant de troubles neurodégénératifs comme la SLA de continuer à s’exprimer par leur propre voix malgré l’incapacité de parler.
Elle pourrait aussi constituer un outil précieux pour faciliter la communication entre langues et cultures différentes.
Comment ElevenLabs et les géants de l’IA vont-ils stopper les deepfakes audio ?
Le maire de New York, Eric Adams, a utilisé la technologie de synthèse vocale d’ElevenLabs pour diffuser des messages audio automatisés dans plusieurs langues comme le mandarin, le yiddish et le créole haïtien.
Selon ses dires, cela lui a permis de toucher plus efficacement les résidents new-yorkais non anglophones.
Conscient des risques de fraude liés à ces systèmes d’IA générative, le cofondateur d’ElevenLabs, Piotr Staniszewski, estime qu’il faudra permettre aux utilisateurs d’identifier si une voix est générée par une IA ou s’il s’agit d’un véritable locuteur humain.
Comme solution, Staniszewski a évoqué auprès de The Atlantic l’idée de marquer numériquement les voix synthétiques afin de les distinguer des voix réelles.
Pour mettre en œuvre cette approche, ElevenLabs doit d’abord collaborer avec d’autres acteurs majeurs de l’IA.
L’entreprise a ainsi noué des partenariats avec OpenAI, Anthropic, Google et Meta dans le but de lutter contre les deepfakes audio, notamment en vue des élections de 2024.
Mais jusqu’à aujourd’hui, ElevenLabs n’a pas encore répondu aux demandes de commentaire de Business Insider sur le sujet.
On attend donc les prochaines nouvelles qui devraient arriver d’ici une semaine.
- Partager l'article :