Samedi 5 avril, Meta annonce l’arrivée des nouveaux modèles inclus dans Llama 4. Le communiqué du 5 avril indique trois modèles bien distincts. Notamment Llama 4 Scout et Llama 4 Maverick qui sont déjà disponibles en téléchargement sur Hugging Face et sur Llama.com, mais pas en France.
Il y a cependant un troisième modèle qui répond au nom de Llama 4 Behemoth. Mais qui est encore en phase d’entraînement selon le rapport de Meta.
Pour l’intégration des nouveaux modèles Llama 4, ils seront désormais disponibles sur les plateformes de réseaux sociaux de l’entreprise.
À savoir Instagram, Messenger et WhatsApp. Mais les fonctionnalités multimodales de LLama 4 ne sont accessibles qu’en anglais, donc uniquement aux États-Unis.
Llama 4 serait-il le nouveau champion de l’IA ?
Les trois nouveaux modèles Llama 4 reposent sur l’architecture MoE, que l’on connaît généralement sous le nom de mixture of experts ou mélange d’experts.
Il s’agit, selon le billet de blog de Meta, de l’approche la plus efficace de tout ce que l’on connaît jusqu’ici.
Les modèles Llama 4 Scout et Llama 4 Maverick ne fonctionnent donc pas de manière similaire à ceux d’OpenAI ni d’Anthropic.
Comme le premier modèle possède 16 experts, seul celui susceptible d’accomplir la tâche demandée par l’utilisateur sera activé.
Côté performance, avec 17 milliards de paramètres actifs sur les 400 paramètres au total, le modèle Llama 4 Maverick surpasse de loin Gemini 2.0 et GPT-4o.
Et quand on l’évalue sur les benchmarks, Maverisk se positionne en première place en affichant les meilleurs scores en termes de codage, de compréhension d’images et de raisonnement.
Pour ce qui est de Llama 4 Scout qui est plus compact par rapport à Maverick, et qui dispose de 109 milliards de paramètres au total, il est le modèle idéal pour les tâches d’analyse et de résumé de documents.
Alright guys, hear me out
— Flavio Adamo (@flavioAd) April 6, 2025
I was skeptical about Llama 4 coding skills… until I started comparing it to other models, including the earlier version of GPT-4o
This thing is free, open source, and honestly pretty close to GPT-4o (pre-update), wild if you think about it pic.twitter.com/yuMZjn4Nkp
Usage spécifique pour chaque modèle
Comme ces nouveaux modèles Llama 4 reposent sur l’architecture mélange d’experts, Scout et Maverick sont conçus avec des objectifs distincts.
Pour Llama 4 Scout par exemple, il se positionne comme un modèle optimisé pour fournir une meilleure performance avec une possibilité de limiter les coûts d’infrastructure. Cela dit, il peut fonctionner même sur un seul GPU H100.
Quant à Llama 4 Maverick, Meta le présente en tant que solution d’assistant virtuel haut de gamme polyvalent. Il est donc destiné à des usages plus généralistes, mais avec un niveau de qualité supérieure.
En ce qui concerne Llama 4 Behemoth, c’est le plus puisant des trois modèles. Il dispose d’ailleurs de 2.000 milliards de paramètres actifs. Ce qui fait de lui le modèle enseignant le plus intelligent pour la distillation.

Llama 4 en open source, mais sous licence restrictive, empêchant la France d’y avoir accès
Bien que Llama 4 soit présenté comme un modèle open source, il faut reconnaître que sa licence contient en réalité des restrictions importantes.
Les organisations situées dans l’Union européenne ne peuvent donc pas l’utiliser. Et les entreprises dépassant le seuil de 700 millions d’utilisateurs par mois doivent demander une permission spécifique avant toute utilisation.
Meta explique avoir mis en place ces limitations en raison des exigences réglementaires actuelles et pour assurer une gestion responsable des données.
- Partager l'article :