Petit à petit, Mistral AI, la start-up française, se démarque de la concurrence. Elle vise cependant à devenir le leader du marché français de l’IA, mais aussi à rivaliser avec les géants américains et chinois. C’est justement de ce contexte qu’elle lance Mistral Codestral, son modèle générateur de code par IA.
L’annonce a eu lieu le 29 mai à l’occasion de l’acquisition de la licence « non-production », le modèle Codestral de Mistral ne va pas se limiter à la recherche ni au test.
C’est avant tout un modèle limité qui sera mis à la disposition des éditeurs de code. Un vrai outil qui va sûrement propulser la place de la France dans la course à l’IA.
Codestral de Mistral déjà numéro 1 sur les benchmarks
Codestral est un modèle d’intelligence artificielle entraîné par Mistral AI sur plus de 80 langages de programmation.
Les données d’entraînement vont cependant des langages plus courants comme Python, Java, C/C++ aux plus rares comme Swift ou encore Fortran.
Malgré ses seulement 22 milliards de paramètres, Codestral surpasse la plupart des autres modèles de code sur divers benchmarks. Notamment CodeLlama qui est plus volumineux et qui a près de 70 milliards de paramètres.
Des tests comparatifs ont d’ailleurs été menés par Mistral sur différentes tâches de génération de code. Les résultats ont montré les excellentes performances de Codestral 22B.
Celui-ci a atteint un niveau de précision moyen de 61,5 % sur tous les langages évalués, et jusqu’à 81,1% d’accuracy en Python.
Donc première impression, avec Codestral, Mistral devance ses concurrents CodeLlama 70B, DeepSeeker Coder 33B et Llama 3 70B sur la majorité des langages.
En somme, grâce à ses 32 000 tokens, Codestral se révèle être un outil particulièrement performant. En particulier pour analyser et générer du code à partir de requêtes en langage naturel.
Une nouvelle licence qui limite l’usage commercial
Dans le cadre du lancement de son modèle Codestral, Mistral AI instaure une licence inédite baptisée MNPL (Mistral AI Non-Production License).
Celle-ci restreint l’utilisation des modèles concernés aux usages non commerciaux et à la recherche académique.
C’est alors sous le régime de cette licence MNPL que Codestral est rendu disponible. L’entreprise parisienne justifie néanmoins l’introduction de cette licence par la nécessité d’assurer la pérennité de son activité.
En particulier face à ce qu’elle considère comme une menace sur l’ouverture liée aux agissements de certains acteurs majeurs de l’IA.
Mistral précise toutefois qu’elle continuera parallèlement à publier d’autres modèles sous la licence open source Apache 2.0.
En somme, si vous voulez accéder à Codestral, vous pouvez toujours passer par l’API et l’interface de chat de Mistral.
Sinon, Mistral a aussi intégré Codestral aux plateformes Hugging Face, LlamaIndex et LangChain.
Mais également aux extensions Continue.dev et Tabnine, deux addiciles dédiés aux environnements de développement VSCode et JetBrains.
Vous savez maintenant ce que Mistral propose avec Codestral. Alors à vous de jouer ! Et n’oubliez pas de mentionner vos impressions en commentaires.
- Partager l'article :