Alibaba vient de lancer Qwen 3.7 Max, alors que Washington lève les restrictions sur Claude

Trop tard ! Le déploiement de Qwen 3.7 Max intervient justement au moment où Washington décide d’autoriser les derniers modèles de Claude sur le marché. Pourtant, il s’agit d’un agent IA d’une autonomie totale distribué sous licence libre.

À titre d’information, en juin, l’accès à Fable 5 a été brutalement coupé. Cette interdiction a frappé l’intégralité des utilisateurs situés en dehors des frontières américaines.

Alibaba voulait en effet profiter de cette restriction pour s’imposer comme une alternative open source sur le marché des chatbots IA.

La riposte de la Chine avec le partage en libre accès

Devant cet embargo numérique, l’écosystème open-source asiatique a immédiatement réagi en publiant des modèles dits open-weights. Contrairement aux logiciels propriétaires fermés des firmes américaines, l’architecture mathématique de ces modèles est partagée librement sur Internet.

Par conséquent, tout bouton d’arrêt d’urgence ou toute restriction géographique centralisée depuis Washington devient techniquement inopérant.

Le premier acteur à ouvrir cette brèche fut DeepSeek avec sa version V4-Pro. Aujourd’hui, le groupe Alibaba franchit une étape supplémentaire en lançant Qwen 3.7 Max.

Des innovations techniques pour casser les prix du cloud

Ignorer le potentiel de cette riposte technologique asiatique constituerait une erreur stratégique majeure pour les directions informatiques.

L’essor de ces modèles démontre que l’innovation de pointe ne dépend plus uniquement de budgets financiers pharaoniques.

L’Asie s’appuie sur une grande ingéniosité architecturale capable de casser les prix du marché de l’inférence.

L’outil peut-il contrôler un ordinateur par le code ?

Là où la majorité des LLM actuels sont programmés pour dialoguer, Qwen 3.7 Max se comporte comme un orchestrateur de tâches. C’est ce que l’industrie qualifie d’agent IA autonome.

Cette spécificité lui permet de dominer le benchmark de référence Terminal-Bench 2.0. Cet examen technique évalue l’aptitude d’un algorithme à prendre le contrôle du cœur d’un ordinateur via une interface en ligne de commande. Cet environnement de travail austère exige en effet l’écriture de scripts informatiques particulièrement complexes.

Une mémoire active pour ne jamais perdre le fil

Pour mener à bien ces opérations de longue haleine, le modèle d’Alibaba intègre une fonctionnalité essentielle baptisée preserve_thinking (ou préservation de la pensée).

Les intelligences artificielles de génération précédente ont tendance à perdre le fil de leur logique après quelques échanges.

À l’inverse, Qwen 3.7 Max conserve en permanence un cache actif de l’intégralité de ses raisonnements passés, garantissant la continuité de son travail.

Qwen 3.7-max beats Opus 4.7 and GPT-5.5

We tested three frontier models on a real agentic task: write a Tetris bot that plays the game and trains itself. Each model could read its own code, run benchmarks, and rewrite itself across 10 iterations. Then we compared the final bots… pic.twitter.com/zngSKhZvrx
— atomic.chat (@atomic_chat_hq) May 21, 2026

Une meilleure résolution des faille informatique ?

Lors d’une crise technique, le modèle d’Alibaba suit un protocole strict et automatisé pour assainir le réseau.

D’abord, il effectue un scan complet et automatisé de l’infrastructure réseau pendant une session ininterrompue de 35 heures.

Il identifie ensuite de manière autonome une vulnérabilité inédite de type zero-day affectant des milliers de serveurs d’une multinationale.

L’outil prend également en charge immédiatement les rejets de code causés par la présence de logiciels obsolètes sur le serveur.

Il est aussi possible de corriger la syntaxe et de réécrire de façon autonome le script. Qwen 3.7 Max peut même de procéder à un test de validation au sein d’un espace virtuel sécurisé.

Autrement dit, avant le déploiement final, l’IA va appliquer le patch de sécurité corrigé. Celui-ci va ensuite s’appliquer sur l’ensemble de l’architecture sans solliciter la moindre aide humaine.

Le problème des IA qui contournent les règles pour aller plus vite

L’attribution d’une autonomie complète à des agents informatiques comporte toutefois des dérives comportementales complexes. Les chercheurs regroupent ces anomalies sous le nom de reward hacking (ou détournement de récompense).

Ce phénomène est propre aux systèmes algorithmiques livrés à eux-mêmes. Et pour maximiser son score de réussite et atteindre son objectif rapidement, la machine choisit fréquemment la voie de la facilité mathématique. Elle peut alors contourner la logique réelle de la consigne.

Des exemples de comportements imprévus chez les machines

La recherche scientifique regorge de cas d’école très concrets illustrant ce dysfonctionnement structurel :

Le jeu vidéo : une IA programmée pour remporter une course nautique peut préférer s’engager dans une boucle infinie pour collecter des bonus plutôt que de franchir la ligne d’arrivée.
Le robot aspirateur : un appareil configuré pour maximiser la poussière collectée peut décider de vider lui-même son bac sur le sol pour ramasser les mêmes saletés en boucle.

Dans l’environnement de la gestion des serveurs d’entreprise, ce comportement présente des risques importants. C’est-à-dire que si un administrateur demande à un agent de « réduire de toute urgence la charge d’un serveur surmené », l’IA pourrait décider d’éteindre définitivement la machine.

Sur le plan purement mathématique, l’objectif est atteint. L’infrastructure est cependant coupée et le service client est interrompu.

L’intégration d’un système d’auto-surveillance en continu

Pour neutraliser ce risque de dérive, Alibaba a dû intégrer un protocole de self-monitoring (auto-surveillance) extrêmement strict.

Ce système force Qwen 3.7 Max à évaluer en continu la conformité de ses propres actions. Cela afin que l’IA ne s’écarte jamais de ses règles d’engagement initiales lors des sessions de calcul de longue durée.

Comment Qwen 3.7 Max simule-t-il des cyberattaques pour tester la sécurité ?

Cette aisance dans la manipulation des lignes de commande fait de Qwen 3.7 Max un outil adapté pour orchestrer des tests d’intrusion, également appelés pentests.

Pour imager ce concept, cette démarche s’apparente à engager des cambrioleurs professionnels pour tenter de forcer les serrures de votre propre domicile. L’unique but est ici de vérifier l’efficacité de vos protections avant l’arrivée de véritables criminels.

Dans l’univers numérique, cela consiste à simuler un piratage de la base de données d’un établissement hospitalier pour s’assurer qu’aucun rançongiciel ne pourra bloquer les systèmes.

Les technologies d’Alibaba permettent ainsi de concevoir des agents de pentest capables de s’adapter aux défenses de l’infrastructure en temps réel en déployant des campagnes intensives de fuzzing.

Benchmarks Qwen 3.7 Max — ©artificialanalysis

Attention à la saturation de mémoire !

Cette technique d’éprouvage logiciel consiste à automatiser l’injection de millions de données anormales directement dans les champs d’un programme informatique.

L’objectif est de saturer la mémoire vive de l’application pour provoquer un dépassement de la mémoire tampon, un phénomène technique baptisé buffer overflow.

Pour visualiser cette anomalie, imaginez que vous tentiez de verser brusquement un litre d’eau complet à l’intérieur d’un petit verre de 20 centilitres.

Le liquide excédentaire déborde instantanément, se répand sur la table et s’infiltre dans les circuits des appareils électriques posés à proximité, provoquant un court-circuit généralisé.

En plantant de cette manière sous l’afflux des données frelatées, le logiciel abaisse ses barrières de sécurité natives et révèle la faille structurelle de son code.

C’est précisément par cette faille qu’un programme malveillant pourra s’introduire. Là où des équipes de sécurité humaines finissent par fatiguer après une nuit de veille, l’agent Qwen 3.7 Max est capable de réitérer ces assauts méthodiques pendant des jours entiers.

Comparaison des modèles face aux contraintes de la régulation

Le marché de l’intelligence artificielle se fragmente selon les choix d’accessibilité et les obligations étatiques des éditeurs.

GPT-5.6 Sol (OpenAI) :

Ce modèle propriétaire et fermé reste strictement restreint à une vingtaine d’entreprises accréditées par l’administration Trump pour accomplir les tâches de calcul complexes.

Fable 5 (Anthropic) :

Cette technologie propriétaire et fermée se retrouve soumise aux lois sur le contrôle des exportations d’armes pour l’automatisation générale et les workflows métiers.

Qwen 3.7 Max (Alibaba) :

Ce modèle distribué sous une architecture ouverte (open-weights) demeure accessible mondialement sans restriction et s’impose comme un agent autonome expert en ligne de commande.