Voilà, c’est officiel, un nouveau-né vient de rejoindre la grande pupille de l’IA ! Mistral vient de sortir son modèle d’IA dédié à la génération d’audio, de surcroît open-source, et qui semble déjà séduire un grand nombre d’utilisateurs ! Mais que vaut réellement ce modèle de Mistral AI par rapport aux autres modèles déjà établis ? Essayons de faire le point dans ce qui suit !
Elle est toute fraîche, pleine de potentiels, disponible en open-source et française ! Elle, c’est Voxtral, le nouveau modèle d’IA lancé par Mistral AI, la pépite française de l’intelligence artificielle. Après avoir marqué les esprits lors du VivaTech en juin, il faut croire que la startup fondée par Arthur Mensch continue son ascension fulgurante.
Avec son nouveau modèle d’IA vocal pensée pour les entreprises et les développeurs web, Mistral AI veut clamer sa souveraineté numérique par rapport à la concurrence. Dans un secteur où des modèles déjà établis comme Whisper d’OpenAI ou de Gemini de Google, Mistral propose une alternative pour tous, à la fois plus accessible, plus éthique et moins coûteuse. Mais que vaut ce modèle par rapport aux autres ? La réponse ci-dessous !
Voxtral : de la transcription à l’intelligence vocale, un modèle d’IA audio qui sait tout faire ?
Voxtral c’est le premier modèle audio open source qu’on peut exploiter en production, et elle est française. Pour Mistral AI, ce modèle présente un virage qui le sépare des autres grosses boîtes tech, et qui semble séduire les utilisateurs.
On doit se l’avouer lorsqu’on parle d’IA open-source, soit on est confronté à des modèles ouverts mais limités avec beaucoup d’imprécisions, soit on se retrouve avec des modèles puissants mais fermés avec un coût largement exorbitant.
C’est dans ce contexte que Mistral AI a décidé de casser les codes avec Voxtral qui permet de :
- transcrire jusqu’à 40 minutes d’audio
- interroger le chatbot vocalement
- générer des résumés
- exécuter des actions en temps réel
D’ici peu, une autre corde sera ajoutée à l’arc de Voxtral. Le modèle de LLM pourra bientôt analyser les émotions et reconnaître les locuteurs. Une ambition qui épouse parfaitement la révolution industrielle actuelle !
Trois modèles adaptés à des besoins différents
Un autre point intéressant à retenir avec Voxtral c’est qu’il est composé de trois variantes pour répondre à des besoins différents. Nous avons entre autres Voxtral Small, Voxtral Mini et Voxtral Mini Transcribe. Si le premier est composé de 24 milliards de paramètres, le second en embarque 3 milliards, et il peut être déployé en local ou en Edge.
Le troisième modèle quant à lui est optimisé exclusivement pour la transcription audio par IA. Selon ses concepteurs, ce modèle dépasse largement les performances de Whisper v3, le tout à moitié prix ! En effet, ces modèles sont disponibles en open weights et ne coûte que 0,001 $ par minute.
Pour un test gratuit, il vous suffit de vous rendre sur Hugging Face. Vous pouvez également y accéder via l’assistant vocal maison de Mistral AI Le Chat. Vous pouvez essayer et vérifier les performances de Voxtral avant de vous abonner !
Avec ce lancement de Voxtral, Mistral AI marque son territoire devant les géants américains. En effet, en plus de se présenter comme une excellente alternative aux modèles disponibles actuellement sur le marché, Voxtral demeure un précurseur de l’IA ouverte, accessible, performante et souveraine. Un véritable game-changer qui permet de faire la différence dans cette course sans pitié à l’IA !
- Partager l'article :
