La bataille juridique éclate entre Anthropic et Reddit, ce dernier soulignant que le propriétaire de Claude AI a utilisé ses données sans consentement pour entraîner ses modèles. D’après la déclaration de Reddit, Anthropic aurait récupéré les commentaires des utilisateurs, et cela de manière illégale, pour pouvoir former le chatbot Claude.
Selon Reddit, Anthropic aurait utilisé des robots pour collecter automatiquement des contenus issus du site, et ce, malgré des restrictions clairement formulées.
La plateforme soutient également que les données personnelles des utilisateurs ont été exploitées sans leur accord. Ce qui, à l’égard de la loi en vigueur, constitue une violation de la vie privée.
Ladite plainte a été enregistrée mercredi devant un tribunal de San Francisco, en Californie. De son côté, Anthropic n’a pas encore réagi à ces accusations.
« Quoi qu’il en soit, les entreprises d’intelligence artificielle ne devraient pas pouvoir exploiter les contenus partagés par les internautes sans encadrement strict », ajoute le directeur juridique de Reddit, Ben Lee.
Alors pourquoi Google et OpenAI peuvent-ils utiliser les commentaires Reddit ?
En réalité, Reddit a déjà signé des accords de licence avec des entreprises comme Google, OpenAI et d’autres acteurs du secteur de l’intelligence artificielle.
Grâce à ces partenariats, ces derniers peuvent utiliser les commentaires publiés sur la plateforme pour entraîner leurs modèles d’IA.
À titre d’information, Reddit compte plus de 100 millions d’utilisateurs actifs. Et chaque jour, ces utilisateurs produisent une immense quantité de texte.
Il est donc logique que Reddit soit devenu une ressource importante pour le développement de modèles linguistiques avancés. Notamment ceux qui alimentent ChatGPT, Claude AI ou d’autres IA du même type.
Toujours d’après Ben Lee, ces accords permettent à la plateforme de protéger ses utilisateurs.
« Ils garantissent des droits importants, comme la possibilité de supprimer son contenu, la protection de la vie privée et la lutte contre l’utilisation abusive des données, notamment contre le spam », a-t-il ajouté.
🚨BREAKING🚨
— Reddit Lies (@reddit_lies) June 4, 2025
Reddit just filed a lawsuit against Anthropic for "wrongful use of Reddit content."
It appears that Reddit is cracking down on LLMs using Reddit data for training. pic.twitter.com/Rg7giNhHl8
Anthropic rejette les accusations de Reddit
Anthropic a réagi aux accusations de Reddit. Sa porte-parole, Danielle Ghighlieri, a déclaré par e-mail qu’ils ne partagent pas le point de vue de Reddit et ils comptent se défendre fermement.
Pour rappel, dans sa plainte, Reddit accuse Anthropic d’avoir ignoré le fichier robots.txt du site.
Pourtant, ce fichier sert justement à informer les robots automatisés de ne pas explorer certaines pages.
Reddit affirme que malgré l’annonce, en 2024, d’un blocage de ces robots, ceux d’Anthropic auraient continué à collecter des données.
Et jusqu’à aujourd’hui, Anthtropic aurait encore exploré et récupérez les données de Reddit plus de 100 000 fois.
Reddit demande donc à la justice de condamner Anthropic à lui verser des dommages et intérêts.
Elle réclame aussi un remboursement des gains générés grâce à l’utilisation de son contenu, en plus d’une interdiction légale empêchant Anthropic d’exploiter (encore) ses données.
- Partager l'article :