dans

Distraire un système de deep learning pour mieux le former

Distraire les systèmes de deep learning

Pour entraîner efficacement un système de deep learning, le meilleur moyen serait de le distraire.

 

Des scientifiques néerlandais et espagnols ont déterminé comment l’intelligence artificielle apprend à mieux reconnaître les images lorsqu’elle est distraite. Leur nouvelle méthode permet de simplifier le processus en se focalisant sur les caractéristiques secondaires.

Les limites de l’apprentissage en profondeur

L’algorithme de deep learning déployé pour la reconnaissance d’images est constitué de réseaux de neurones convolutifs (CNN). Mais malgré leur efficacité, le fonctionnement de ces CNN reste difficile à comprendre. C’est ce qu’a déclaré Estefanía Talavera Martinez, enseignante et chercheuse à l’Institut Bernoulli de mathématiques, d’informatique et d’intelligence artificielle de l’Université de Groningue aux Pays-Bas.

Ses précédents travaux consistaient à analyser des images à l’aide de ces réseaux de neurones convolutifs tout en étudiant le comportement humain. Le système de deep learning devait donc reconnaître les différents contextes d’interaction des gens avec la nourriture.

Au cours de ses recherches, elle a constaté que le système faisait des erreurs dans la classification de certaines images. Talavera Martinez a donc analysé elle-même une partie des images utilisées par les CNN avec des cartes thermiques. Elle en conclut que le système n’examinait pas assez de détails. Pour identifier une cuisine à partir d’une tasse, par exemple, l’IA pouvait en conclure un salon ou un bureau qui est également susceptible d’inclure une tasse dans le décor.

C’est ainsi qu’avec ses collègues, elle a développé une nouvelle solution qui consiste à distraire le système de deep learning.

Comment distraire un système de deep learning ?

Avec cette nouvelle méthode, Talavera Martinez accompagnée par David Morales et Beatriz Remeseiro, tous deux basés en Espagne proposent de détourner les réseaux neuronaux de leur principale cible.

Plus précisément, ils ont commencé par former les CNN avec un ensemble d’images. Puis, grâce aux cartes thermiques, ils ont identifié et ensuite flouté les parties des images utilisées pour la classification. Dès lors, le système a été formé une nouvelle fois sur le même ensemble d’images de manière à chercher de nouveaux identifiants.

Ce nouveau procédé permet alors d’obtenir une classification plus précise, selon Talavera Martinez.

En plus des résultats concluants, cette nouvelle technique nécessiterait moins de temps de calcul. Au lieu de combiner des ensembles de CNN, distraire le système de deep learning s’avère être une approche plus légère.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.