Ces chercheurs ont développé un hyperréseau qui serait en fait une IA capable d’en créer une autre.
Depuis la naissance du concept jusqu’à ce jour, l’intelligence artificielle n’a cessé d’évoluer. Les efforts fournis par les ingénieurs ont abouti à des solutions qui ont changé la vie d’innombrables personnes et entreprises. Mais ils n’ont pas fini de nous étonner avec leurs travaux. Voilà que des chercheurs ont créé une IA qui, elle-même, permettrait de créer une autre IA.
Créer une IA à l’aide d’un hyperréseau ?
L’ambition de l’IA a toujours été d’imiter l’intelligence humaine. La plus proche avancée jusqu’ici est sûrement le réseau de neurones artificiels qui visent à reproduire le réseau neuronal biologique des humains. Par ailleurs, la méthode la plus efficace pour former les réseaux neuronaux est l’utilisation de l’algorithme du gradient stochastique (SGD). Mais cette approche implique la préexistence d’un réseau neuronal à optimiser.
Ainsi, pour construire un réseau de neurones initial, les ingénieurs s’appuient généralement sur des intuitions. Par exemple, ils comparent plusieurs architectures pour choisir la meilleure. Cependant, il s’agit d’un long processus qui ne permet pas de prendre en compte chaque architecture.
Un chercheur en IA de Google Brain, Mengye Ren, a développé une autre approche appelée hyperréseau graphique (GHN). Elle consiste en l’utilisation de graphes mathématiques pour trouver la meilleure architecture de réseau neuronal.
La naissance du GHN-2
Boris Knyazev, un chercheur de l’Université de Guelph en Ontario a amélioré l’approche de Ren. Le GHN-2, comme lui et son équipe l’ont nommé, s’appuie sur les mêmes principes de représentation graphique et d’analyse prédictive.
Le nouvel hyperréseau permet de trouver la meilleure IA, mais aussi de prédire les paramètres du meilleur réseau. Autrement dit, GHN-2 peut aider à concevoir une nouvelle architecture. Et selon les chercheurs, si le réseau neuronal nouvellement conçu n’est pas le meilleur, ils auront alors recours au SGD pour l’entraîner à le devenir.
Knyazev et son équipe ont ensuite testé leur méthode sur une tâche de classification d’images dans différentes bases de données. Le réseau neuronal prédit par GHN-2 a alors atteint une précision de 66, 9 % pour CIFAR-10, de 58,6 % pour ResNet-50 et de 27,2 % pour ImageNet.
Les résultats semblent assez convaincants. Toutefois, Petar Veličković, un chercheur de DeepMind, fait valoir que la prédiction des paramètres d’un nouveau réseau par un hyperréseau ne se traduit pas réellement par la création d’une IA.
- Partager l'article :