Internet

Les médias français s’attaquent à des bases de données exploitées par l’IA générative

2 Sep. 2025 • 14:10
0

Les éditeurs de presse français intensifient leur lutte contre l’utilisation non autorisée de leurs contenus par les services d’intelligence artificielle. Dans une action coordonnée, ils ciblent des bases de données publiques (comme Common Crawl), accusées de fournir du contenu protégé à des plateformes comme ChatGPT sans compensation.

Intelligence artificielle

Une offensive contre Common Crawl et ses dérivés

L’Alliance de la presse d’information générale (Apig) et le Syndicat des éditeurs de la presse magazine (SEPM), représentant 800 titres, mènent cette initiative. Leur objectif est d’obtenir le retrait des articles de leurs membres des bases de données Common Crawl, C4 et Oscar, largement utilisées pour entraîner les modèles d’IA générative. Dans un communiqué commun, les deux organismes expliquent que ces bases, qui archivent des milliards de pages Web via des robots, reproduisent et distribuent des millions d’articles protégés par le droit d’auteur et le droit voisin, sans autorisation ni restriction d’accès.

Les éditeurs ont constaté, par huissier, la présence massive de leurs contenus dans ces bases de données. Ils ont adressé des mises en demeure aux responsables, posant les bases d’éventuelles actions judiciaires contre ceux qui exploitent ces contenus sans droit. Cette démarche s’inscrit dans un contexte de tensions croissantes entre la presse française et les acteurs de l’IA, accusés de piller les contenus journalistiques.

Un conflit ancré dans un débat plus large

Cette action fait suite à une mobilisation en février, où cinq organisations, dont l’Apig et le SEPM, représentant plus de 3 000 titres, ont exhorté les pouvoirs publics à imposer un dialogue entre médias et entreprises d’IA. Leur but est de mettre fin à l’exploitation non rémunérée des contenus et de garantir une information fiable.

L’offensive contre Common Crawl marque un nouveau chapitre dans ce bras de fer, alors que les éditeurs cherchent à protéger leurs droits et à obtenir une juste rémunération pour l’utilisation de leurs articles par les technologies d’IA.

Intelligence Artificielle Robot Internet

France Travail Logo Hors-Sujet

