Ces chercheurs ont créé la méthode de détection de deepfakes avec le meilleur taux de précision jusqu’à ce jour.
Alors que les médias synthétiques se font de plus en plus nombreux, la création d’outils pour les identifier devient tout aussi importante. En 2020, le dispositif le plus performant affichait un taux de précision de 65,18 %. Bien que la technologie ait bien évolué depuis, la détection des deepfakes reste un défi de taille.
Manipulation du visage et des expressions faciales
Des informaticiens de l’université de Californie à Riverside ont publié un document de recherche intitulé « Detection and Localization of Facial Expression Manipulations ». Pour les deepfakes de visage, une méthode consiste à échanger l’identité faciale et une autre se concentre sur les expressions.
L’article présente une nouvelle méthode pour détecter la manipulation d’expressions faciales dans les vidéos synthétiques. Toutefois, elle était également aussi précise pour identifier les substitutions de visage. Cette technique pourrait donc s’appliquer à tous types de manipulation faciale afin d’accroître la précision dans la détection automatique des vidéos deepfakes.
Détection des deepfakes : cette méthode affiche 99 % de précision
Avec le nombre de logiciels de montage de vidéos existants, la manipulation d’un visage dans une vidéo est devenue facile. Mais certaines technologies sont plus avancées que d’autres à tel point que même les humains trouvent que les visages deepfakes sont plus fiables que les images réelles.
Par conséquent, il devient urgent de mettre au point des solutions de détection plus efficaces afin de prévenir l’usage abusif des faux médias. Alors que la détection des visages substitués est assez facile, ce n’est pas le cas avec les expressions permutées.
La nouvelle méthode proposée par les chercheurs de l’UC Riverside s’appelle Expression Manipulation Detection (EMD). Dans un premier temps, le réseau neuronal profond identifie les expressions. Cela se fait au niveau des zones telles que la bouche, des yeux, du front, etc. Par la suite, une architecture d’encodage-décodage se charge de détecter les manipulations.
Après avoir testé le modèle sur deux ensembles de données complexes sur la manipulation faciale, les chercheurs ont démontré que l’EMD est plus efficace que les méthodes les plus performantes. En effet, leur méthode de détection des vidéos deepfakes a affiché une précision de 99 %.
- Partager l'article :