Meta fait face à un nouveau recours collectif aux États-Unis, cette fois portée par de grands éditeurs qui l’accusent d’avoir nourri son grand modèle de langage Llama avec des livres et articles piratés. La plainte vise des dommages et intérêts, l’arrêt des pratiques contestées et la divulgation des œuvres utilisées pour entraîner les modèles.

Jusqu’ici, Meta était surtout attaqué par des auteurs, mais le groupe doit désormais répondre à une offensive menée par Macmillan, McGraw Hill, Elsevier, Hachette, Cengage et l’écrivain Scott Turow qui décrivent l’affaire comme l’un des plus vastes cas d’atteinte au droit d’auteur liés à l’entraînement d’un modèle d’intelligence artificielle.
Les plaignants affirment d’abord que Meta a sciemment récupéré des œuvres sur des bibliothèques pirates bien connues comme LibGen, Anna’s Archive, Sci-Hub ou Sci-Mag, puis qu’il a renforcé cet ensemble avec Common Crawl qui est saturé de copies non autorisées. Leur thèse est que cette matière d’entraînement se retrouve ensuite dans les réponses de Llama, capable selon eux de restituer des passages entiers ou presque entiers de livres protégés.
Pour appuyer cette idée, la plainte cite un exemple concret autour du livre Calculus : Early Transcendentals, 9e édition, de James Stewart. Avec un prompt comprenant deux phrases du livre, Llama commence à prolonger mot pour mot la section concernée.
Un nouveau front dans la bataille de l’IA et des livres
Cette action s’inscrit dans un contexte judiciaire encore instable. L’an dernier, un juge fédéral a donné raison à Meta dans un autre dossier, mais il a pris soin de préciser que sa décision ne validait pas en bloc la légalité de l’entraînement de modèles IA sur des œuvres protégées.
Le parallèle avec Anthropic renforce encore la pression. Un juge a admis que l’entraînement sur des livres achetés légalement pouvait relever du fair use, tout en laissant prospérer un recours collectif distinct sur des millions d’œuvres piratées, qu’Anthropic a fini par régler pour 1,5 milliard de dollars l’an dernier.
Les éditeurs et Scott Turow demandent donc plus qu’une compensation financière. Ils veulent aussi que Meta cesse les activités qu’ils jugent illégales et qu’il fournisse la liste complète des livres, articles scientifiques et autres contenus utilisés pour entraîner Llama.
Meta, de son côté, assume une ligne de défense désormais classique dans l’industrie. Un porte-parole du groupe affirme : « L’IA alimente des innovations transformatrices, de la productivité et de la créativité pour les particuliers comme pour les entreprises, et les tribunaux ont reconnu à juste titre que l’entraînement de l’IA sur des contenus protégés peut relever du fair use. Nous combattrons vigoureusement cette plainte ».