L’encyclopédie libre Wikipédia fait face à une montée spectaculaire de son trafic… mais pas pour les raisons habituelles. Depuis janvier 2024, la Fondation Wikimedia a observé une explosion de la bande passante utilisée. La cause ? Les robots d’IA, qui aspirent le contenu libre pour entraîner leurs modèles, menacent désormais la stabilité même des services de la plateforme.
Les robots d’IA consomment massivement les ressources
Depuis début 2024, Wikimedia a observé une hausse de 50 % de la bande passante utilisée. Cette consommation n’est pas liée aux humains, mais bien à des robots d’exploration IA. Ces agents automatisés récupèrent en masse images, vidéos, fichiers et articles de Wikimedia Commons et Wikipédia. L’objectif est de former des modèles d’intelligence artificielle générative. Or, cette exploitation intensive met en péril les performances du site, surtout en cas de pic d’audience.
Un risque pour les lecteurs en cas d’événement majeur
Lors d’événements médiatiques forts, les utilisateurs humains accèdent en masse aux mêmes contenus. Le système de Wikimedia crée alors des caches locaux pour accélérer les temps de chargement. En revanche, les robots IA explorent des pages rarement consultées. Ceci en forçant l’accès direct au centre de données principal, ce qui engendre des ralentissements. Lors du décès de Jimmy Carter, certains lecteurs ont vu les vidéos ralentir à cause du trafic de ces bots.
Une surcharge invisible qui perturbe les équipes techniques
Wikimedia affirme que 65 % du trafic consommateur de ressources provient désormais des bots. L’équipe technique doit les détecter et les bloquer constamment, ce qui mobilise beaucoup d’énergie. Ces surcharges menacent la fiabilité du service. De plus, ces usages massifs ne s’accompagnent d’aucune attribution. Cela nuit à la mission éducative de Wikimedia, qui dépend des dons et cherche à attirer de nouveaux contributeurs pour survivre.
Un contenu gratuit, mais une infrastructure coûteuse
« Notre contenu est libre, mais pas notre infrastructure », rappelle Wikimedia. La fondation doit maintenant trouver des solutions durables pour encadrer l’accès des développeurs aux données. Car l’exploitation actuelle, massive et non attribuée, met en danger l’écosystème Wikimedia. Aucune baisse du trafic IA n’est anticipée. Au contraire, tout indique que cette pression va continuer d’augmenter à mesure que les IA ont besoin de plus de données.
Vers une régulation de l’accès aux contenus ouverts ?
Wikimedia appelle à un dialogue avec les développeurs IA pour préserver l’équilibre entre ouverture et viabilité. Elle envisage de nouvelles règles d’accès pour les réutilisateurs, tout en maintenant l’esprit collaboratif de la plateforme. Dans un monde où l’intelligence artificielle a soif de contenu, il devient urgent de protéger les biens communs numériques. Sinon, même des piliers comme Wikipédia pourraient fléchir sous le poids des machines.
- Partager l'article :