dans

Les données synthétiques peuvent-elles former les modèles de computer vision ?

Données synthétiques pour la computer vision

Les données synthétiques pourraient remplacer les données réelles dans la formation des modèles d’IA pour la computer vision.

Avec l’évolution de la technologie, l’intelligence artificielle permet désormais de créer des médias (images, sons, texte) qui ressemblent aux données réelles. Plutôt que de servir pour tromper des gens sur internet, ces données synthétiques pourraient avoir une plus grande utilité.

Des données synthétiques pour la computer vision

La computer vision ou la vision par ordinateur est une branche de l’intelligence artificielle. Et comme tout système d’IA, elle repose sur des données d’entraînement pour apprendre à résoudre une tâche.

Parmi les nombreux défis rencontrés par les développeurs d’algorithmes d’IA et computer vision, l’insuffisance des données est un véritable problème. Un moyen d’y remédier consiste à utiliser des données synthétiques. Mais pour former des systèmes vraiment efficaces, les données doivent reproduire fidèlement la réalité.

Ainsi, des chercheurs du MIT ont conduit une nouvelle étude pour déterminer si les images générées par les modèles génératifs sont suffisamment réalistes. Si c’est le cas, les données synthétiques pourraient alors remplacer les données réelles pour former les algorithmes de computer vision. 

L’évolution des GAN

En termes de création de données synthétiques, les réseaux antagonistes génératifs (GAN) ont beaucoup évolué au cours de ces dernières années. Rappelons qu’il s’agit d’un algorithme de deep learning constitué d’un générateur qui crée les données et d’un discriminateur qui permet de distinguer les données réelles et synthétiques.

Les résultats sont des images, des vidéos, des sons ou des textes qui sont indiscernables des médias réels, ou presque. Un exemple de technologie populaire des GAN est le Deepfake.

L’objectif pour les chercheurs du MIT était de déterminer si les modèles de computer vision formés sur les données synthétiques sont aussi performants que ceux formés sur des données réelles.

Certains soutiennent que cette nouvelle approche serait potentiellement un moyen de réduire les biais des systèmes d’IA. Mais les données générées sont généralement le reflet du modèle génératif, ici les GAN. Une autre préoccupation des chercheurs concerne la cohérence des données. En effet, avec l’IA générative, l’imagination n’a aucune limite. Par conséquent, l’algorithme de computer vision pourrait normaliser une scène qui n’aurait aucun sens dans le monde réel.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.