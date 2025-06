Reddit a déposé une plainte contre Anthropic, la société d’intelligence artificielle responsable du chatbot Claude, devant un tribunal de San Francisco, accusant l’entreprise d’avoir accédé à sa plateforme plus de 100 000 fois depuis juillet 2024, malgré des engagements contraires.

Des accusations de vol de données pour entraîner l’IA

Dans sa plainte, Reddit qualifie Anthropic, concurrent d’OpenAI, de « société d’IA tardive qui se présente comme le chevalier blanc de l’industrie ». Mais, selon Reddit, « elle est tout sauf cela ». La plateforme reproche à Anthropic d’avoir ignoré ses règles en récupérant massivement ses contenus, malgré une interdiction explicite. Reddit affirme avoir contacté le créateur de Claude pour clarifier que l’utilisation de ses données n’était pas autorisée, mais l’entreprise « a refusé de s’engager ».

Reddit soutient que les bots d’Anthropic ont contourné le fichier robots.txt, un standard signalant aux systèmes automatisés de ne pas explorer un site. Comme preuve, Reddit pointe les fréquentes références de Claude à des communautés et sujets propres à Reddit, suggérant que l’IA a été entraînée sur ces données. Reddit demande des dommages-intérêts compensatoires, une restitution des profits générés par Anthropic grâce à ce vol de contenus, ainsi qu’une injonction pour empêcher l’utilisation future de ses contenus.

Un contexte de litiges récurrents

Ce n’est pas la première fois qu’Anthropic fait face à des accusations similaires. En août 2024, trois auteurs ont intenté une action collective en Californie, reprochant à l’entreprise d’avoir bâti une activité de plusieurs milliards de dollars en volant des centaines de milliers de livres protégés par le droit d’auteur. En octobre 2023, Universal Music a également poursuivi Anthropic pour violation systématique et généralisée des paroles de chansons protégées par le droit d’auteur. Ces affaires soulignent les défis juridiques auxquels les entreprises d’IA sont confrontées dans leur quête de données pour entraîner leurs modèles.

Pendant ce temps, Reddit a conclu des accords pour monétiser ses données, notamment avec Google en février 2024 pour fournir des données d’entraînement à l’IA. Un autre contrat, d’une valeur d’environ 60 millions de dollars par an, a été signé avec une entreprise non nommée. Ces partenariats montrent la valeur croissante des données de Reddit, que l’entreprise cherche à protéger contre des utilisations non autorisées.