Mephisto de Meta est une plateforme collaborative pour échanger les meilleures pratiques dans la collecte de données de formation des modèles d’IA.
L’intelligence artificielle a trouvé une application dans presque tous les secteurs pour fournir des solutions à divers problèmes. Pour y parvenir, elle doit d’abord s’entraîner sur une grande quantité de données. En termes simples, l’intelligence des machines repose avant tout sur les données.
Mephisto — la collecte de données selon Meta AI
Le concept d’open source est l’une des grandes tendances actuelles de l’intelligence artificielle. En effet, les plateformes ouvertes permettent à toute une communauté de progresser et de faire progresser les recherches. Meta en a fait une de ses valeurs fondamentales.
Dans ce cadre, la société a lancé une nouvelle plateforme open source pour les chercheurs en IA. Mephisto est un environnement collaboratif pour la collecte de données. Il s’agit de la première étape de développement de tout modèle et qui est confronté à un défi majeur.
Souvent, les ensembles de données publics utilisés pour former des modèles d’IA présentent des erreurs d’étiquetage. Il existe différentes techniques pour contrôler la qualité des données. Avec Mephisto, Meta propose à la communauté d’échanger les meilleures pratiques en termes de collecte des données. En d’autres termes, elle offre une plateforme centralisée pour collecter les exemples d’utilisations de ces méthodes de contrôle.
Une plateforme collaborative
En matière d’IA, la quantité de données de formation nécessaire est énorme. Celles-ci sont utilisées dans différents domaines de recherche ou pour configurer les serveurs. Avec cette nouvelle plateforme, chaque tâche peut être exécutée avec le même code. Selon Meta, en publiant le code de collecte de données sur Mephisto, les chercheurs le rendent reproductible. Cela permettrait alors à d’autres chercheurs de recréer un ensemble de données similaires ou d’étendre le dataset existant.
De ce fait, lorsque les chercheurs souhaitent collecter des données pour une tâche donnée, ils peuvent consulter une tâche similaire existante. À partir du code de ce modèle, il pourra facilement accéder aux données et aux annotations relatives pour les affiner.
Concernant les mesures de sécurité, le protocole actuellement en vigueur dissimule l’identification des collaborateurs. Néanmoins, Meta prévoit d’ajouter des fonctionnalités supplémentaires à mesure que les contributions augmentent sur Mephisto.
- Partager l'article :