Alibaba bombarde d'Amérique avec une nouvelle arme d'IA

Qu’est-ce qui se passe vraiment en Chine ? Il y a moins de deux semaines, DeepSeek a fait une série d’annonces qui a impacté le marché de l’IA américain. Et même les géants comme OpenAI ont tremblé devant cette start-up chinoise. Aujourd’hui, c’est autour d’Alibaba d’annoncer l’arrivée d’un autre modèle d’IA chinois, mais qui, cette fois-ci, surpasserait celui de DeepSeek. Une annonce qui met déjà la pression à ses concurrents, nationaux comme internationaux.

Qwen 2.5-Max, ledit modèle, aurait même des capacités surpassant celles de ChatGPT et de Llama.

Mais bon, après tout, tout le monde dit pouvoir battre les géants de l’IA dès qu’ils sortent un nouveau modèle de langage. On vérifiera cette hypothèse plus tard.

En tout cas, Alibaba a vu le cours de ses actions augmenter de 1,2 % à l’heure où j’ai rédigé cet article. Soit une hausse de 25 % au cours du dernier semestre.

Nouvelle guerre entre les États-Unis et la Chine

Comme rapporté dans cet article du 28 janvier dernier, Donald Trump, président récemment élu des États-Unis, considérait déjà la sortie de DepepSeek comme un signal d’alarme pour les entreprises d’IA américaines.

Face à l’émergence de la Chine et à leur future domination du marché de l’IA, les États-Unis devraient se concentrer davantage sur la concurrence.

Trump s’est également dit que le pays devrait prendre exemple sur la Chine pour maintenir leur domination du secteur de l’intelligence artificielle.

Par contre, il n’a pas oublié de mentionner qu’on devrait se préparer à une nouvelle guerre commerciale entre la Chine et les États-Unis.

On attend donc si le président va ou non imposer les droits de douane de 60 % sur les importations chinoises, comme il l’avait indiqué lors de sa campagne.

Alibaba $BABA just came out with another global AI shocker. It released #Qwen 2.5-Max that outperformed #DeepSeekR1 (the current leader) in several key benchmarks. Advanced reasoning capabilities give incumbents like #ChatGPT a run for its money. Alibaba’s platform potentially… pic.twitter.com/Pv2AU6xWuF
— Brian Tycangco 鄭彥渊 (@BrianTycangco) January 29, 2025

Alibaba lâche une deuxième bombe après celle de DeepSeek

De son côté, Alibaba a aussi fait son entrée dans cette course à l’IA entre la Chine et les États-Unis.

Le géant de l’e-commerce a donc lancé Qwen 2.5-Max, le tout premier rival de DeepSeek le premier jour du Nouvel An lunaire.

Cette situation intervient alors que DeepSeek bouleverse le marché avec un modèle conçu à partir de puces plus abordables et développé pour un coût estimé à moins de 6 millions de dollars.

Son arrivée déstabilise alors les acteurs historiques du secteur, contraints de repenser leurs stratégies face à cette concurrence inattendue.

Pourtant, les avancées récentes de DeepSeek ne se sont pas contentées de perturber les acteurs américains de l’IA et les fabricants de semi-conducteurs.

D’après plusieurs sources, elles auraient également poussé ByteDance, la maison mère de TikTok, à accélérer le développement de ses propres modèles d’intelligence artificielle.

De son côté, Alibaba a réagi en dévoilant Qwen 2.5, un modèle conçu pour rivaliser avec DeepSeek.

Et selon un message diffusé sur WeChat, le géant du commerce en ligne affirme que Qwen 2.5 serait plus performant que la V3 de DeepSeek.

Que disent les chiffres ? L’IA d’Alibaba surpasse-t-elle vraiment DeepSeek ?

Pour en être sûr que Qwen 2.5-Max surpasse réellement DeepSeek R1 et les autres modèles américains, j’ai réalisé une étude comparative sur les performances de Qwen2.5-Max face aux différents modèles linguistiques actuels, qu’ils soient commerciaux ou open source.

Dans mon analyse, j’ai utilisé plusieurs critères d’évaluation reconnus. J’ai donc choisi MMLU-Pro pour évaluer les connaissances académiques. Et LiveCodeBench pour tester les compétences en programmation.

Pour une évaluation globale des capacités, j’ai opté pour LiveBench et Arena-Hard pour les évaluations qui correspondent aux préférences humaines.

J’ai cependant considéré à la fois les modèles de base et leurs versions adaptées aux instructions.

Je me suis d’ailleurs concentré sur les modèles adaptés aux instructions, qui sont particulièrement importants pour les applications de dialogue et de programmation.

Ensuite, j’ai comparé les performances de Qwen2.5-Max avec celles des modèles de référence comme DeepSeek V3, GPT-4o et Claude-3.5-Sonnet.

Dans le tableau ci-dessus, on peut déjà voir que Qwen2.5-Max dépasse DeepSeek V3 sur plusieurs benchmarks. Notamment Arena-Hard, LiveBench, LiveCodeBench et GPQA-Diamond.

Mais le tableau affiche également des performances satisfaisantes sur d’autres métriques comme MMLU-Pro.

En ce qui concerne l’analyse des modèles de base, j’ai dû me limiter aux comparaisons avec les solutions open source, car je n’avais pas accès aux modèles propriétaires pour les tests.

À titre d’information, cette petite analyse porte sur la comparaison entre QWEN 2.5-Max et trois autres modèles.

À savoir DeepSeek V3 (un modèle MoE open source), Llama-3.1-405B (le plus grand des modèles denses open source), et Qwen2.5-72B (un autre modèle dense open source performant).

Et comme indiqué sur l’image, QWEN 2.5-Max se place en tête de liste. Ce qui affirme les dires d’Alibaba comme quoi, son modèle surpasse celui de deepSeek.