Après le lancement de Llama 3.1 par Meta, Mistral AI, la startup française a également dévoilé sous tout nouveau modèle d’IA baptisé Mistral Large 2. Celui-ci, d’après les annonces de la startup, arrive à égalité avec le Modèle d’OpenAI et de Meta en termes de raisonnement, de mathématiques et de génération de code.
Le lancement du nouveau modèle Mistral Large 2 suit de près celui de Llama 3.1 405B, la dernière innovation open source de Meta, dévoilée la veille.
Mistral se dit confiant que Large 2 établit de nouvelles références en matière d’efficacité et d’économie parmi les modèles ouverts.
L’entreprise française appuie d’ailleurs ces affirmations en présentant quelques résultats de tests comparatifs.
Un modèle plus compact, mais plus performant
D’après les données présentées, le modèle Large 2 paraît plus performant que Llama 3.1 405B dans les domaines de la programmation et des calculs mathématiques.
Ce qui est particulièrement remarquable, c’est qu’il atteint ces résultats avec une architecture nettement plus compacte, utilisant seulement 123 milliards de paramètres, soit moins d’un tiers de ceux de son concurrent.
Selon les informations que Mistral a partagées, l’un des axes majeurs du développement de Large 2 était de réduire les risques d’inexactitudes dans les réponses générées.
La société indique avoir mis l’accent sur l’entraînement du modèle à faire preuve d’une plus grande prudence dans ses affirmations.
L’objectif était donc d’amener Mistral Large 2 à admettre ses limites de connaissances plutôt que de produire des réponses qui, bien que semblant cohérentes, pourraient être erronées.
Le nouvel acteur qui défie les géants de la technologie avec son modèle d’IA
Récemment, la jeune entreprise d’IA basée à Paris a réussi une importante levée de fonds.
Avec General Catalyst en tête, Mistral a obtenu un financement de 640 millions de dollars lors de sa série B, portant sa valeur estimée à 6 milliards de dollars.
Bien que relativement nouvelle dans l’écosystème de l’intelligence artificielle, la société se distingue tout de même par sa capacité à développer et à lancer rapidement des modèles d’IA innovants et performants.
Il convient tout de même de préciser que la définition d’open source appliquée aux modèles de Mistral diffère de l’acception habituelle.
L’utilisation commerciale de ces modèles est soumise à l’obtention d’une licence payante.
Par ailleurs, bien que ces modèles soient plus accessibles que certains concurrents comme GPT-4, leur déploiement reste un défi technique considérable.
Peu d’organisations disposent cependant des compétences et des ressources nécessaires pour exploiter un modèle de cette envergure.
Cette observation s’applique d’autant plus au modèle Llama, dont l’architecture comprend 405 milliards de paramètres.
Mistral Large 2 vs Llama 3.1 vs GPT-4o
En gros, on a observé un élément notable qui fait défaut à la fois chez Mistral Large 2 et dans la récente version Llama 3.1 de Meta : la fonctionnalité multimodale.
Dans ce domaine, OpenAI maintient une avance significative avec ses systèmes d’IA capables de traiter simultanément des données visuelles et textuelles.
Cette capacité multimodale devient un objectif de développement de plus en plus prisé par diverses entreprises émergentes du secteur de l’IA, qui cherchent à combler cet écart technologique.
Néanmoins, Mistral Large 2 a une fenêtre contextuelle de 128 000 jetons. Ce qui lui permet de traiter un grand volume de données en un seul prompt.
Le modèle prend également en charge plusieurs langues. Dont le français, l’anglais, l’italien, l’espagnol, l’allemand et le portugais.
Mistral Large 2 accessible en France ?
Mistral Large 2 reste ouvert sur plusieurs plateformes cloud majeures. Notamment Google Vertex AI, Amazon Bedrock, Azure AI Studio et IBM watsonx.ai.
Les développeurs ont également la possibilité d’y accéder directement sur l’infrastructure de Mistral, où il est référencé sous l’identifiant « mistral large-2407 ».
Pour ceux qui souhaitent explorer les capacités de ce modèle sans engagement, Mistral propose une option d’essai gratuit.
Celle-ci est disponible sur Le Chat, l’interface conversationnelle développée par la startup française, qui se positionne comme une alternative à ChatGPT.
- Partager l'article :