Les chercheurs ont enfin trouvé la solution pour mieux entraîner un modèle de vision par ordinateur afin d’offrir une meilleure classification des images. Cette fois-ci, il s’agit d’une approche apportant plus de précision, mais qui est parallèlement moins coûteuse.
Un modèle d’apprentissage doit être formé avant qu’il puisse réaliser la tâche qu’on lui attribue. On parle alors de formation de modèles de classification d’images basée sur un très grand nombre de données.
Eviter les infractions grâce au contenu des programmes d’IA génératrices d’images
D’après les chercheurs du MIT, utiliser des images réelles peuvent entraîner des problèmes éthiques et pratiques en même temps. Les images utilisées peuvent en effet violer les législations sur le droit d’auteur. Cela pourrait même provoquer une violation de la vie privée.
Face à ces problèmes, les scientifiques ont opté pour une autre méthode pour la préformation d’un modèle de vision par ordinateur ou de computer vision. D’où l’idée d’utiliser des programmes d’intelligence artificielle pouvant générer des images libres de droit. Cela va par la suite servir de base de données synthétiques pour l’apprentissage automatique du modèle.
Cependant, cette approche semble encore être mal maîtrisée par les scientifiques. Et souvent, elle nécessite l’intervention d’un spécialiste pour pouvoir créer des programmes ayant la capacité de générer des images adaptées à la formation.
Entraîner les modèles de vision par ordinateur avec des programmes déjà disponibles au grand public
Face à cette découverte, les chercheurs ont décidé d’adopter une autre méthode. Celui d’utiliser des programmes de génération d’image déjà accessibles au grand public. Plus de 20 000 programmes ont alors été sélectionnés et leurs collections ont été utilisées pour la formation d’un modèle de vision par ordinateur.
Après l’apprentissage des modèles, ces derniers ont affiché des résultats plus précis que ceux des modèles formés avec des méthodes synthétiques. Les chercheurs sont également revenus à la conclusion que leurs modèles de vision par ordinateurs ont gagné en performances. Ce qui pourrait représenter une autre avancée dans le domaine du machine learning.
La génération d’images pour créer des données synthétiques
De manière générale, les modèles d’apprentissage automatique bénéficient d’une préformation. L’entraînement se fait alors en deux temps. La formation sur une base de données et la création de paramètres. Cette dernière sera utile pour pouvoir réaliser une tâche bien précise.
On peut par exemple parler d’un modèle de classification des rayons X qui est préformé avant tout grâce à un ensemble d’images générées par IA. Cela afin qu’il puisse, par la suite, être formé avec des images réelles de rayons X de plus petites tailles.
« Nous pouvons et nous allons utiliser de nombreux programmes d’IA génératrices d’images dans le but de créer une base de données synthétiques. Cela va nous servir pour la formation du modèle de vision par ordinateur. Par contre, on doit faire en sorte que ces programmes soient conçus de manière soignée. Cela dit, les images synthétiques doivent correspondre aux propriétés des images réelles. Ce qui nous a donné du fil à retordre », affirment les chercheurs.
- Partager l'article :