KultureGeek Logiciels L’IA Llama de Meta a été entrainée avec des livres piratés

L’IA Llama de Meta a été entrainée avec des livres piratés

2 min.
16 Jan. 2024 • 11:15
0

Trainée devant la justice pour de possibles violations de propriétés intellectuelles dans le cadre de son projet d’IA Llama (un modèle de langage concurrent du GPT d’OpenAI), Meta a fini par lâcher le morceau devant un tribunal fédéral de Californie et a avoué « avoir utilisé des extraits de la base de données Books3 pour l’entraînement de son modèle d’IA Llama ». Books3 étant (ou plutôt était) une base de donnée de livres au format numérique dont un grand nombre ont été tout simplement piratés, la révélation de Meta a tout d’une bombe. Meta n’est certes pas la seule société à avoir pioché dans les 37 Go d’ouvrages de Books3, mais le « casier » de la société est déjà tellement rempli à ras bord d’affaires douteuses (comme Cambridge Analytica) qu’il n’est pas certain qu’un aveu suffise à adoucir les juges.

LLaMA Meta

Ces nouvelles révélations s’ajoutent désormais à une grosse pile de la « honte » dans le secteur de l’IA, OpenAI et d’autres sociétés d’IA ayant déjà avoué l’usage régulier de données sous copyright pour l’entrainement de leurs modèles de langage. Généralement, les sociétés pointées du doigt invoquent la doctrine du « fair use », doctrine qui stipule que « de brefs extraits de documents protégés par le droit d’auteur peuvent, dans certaines circonstances, être cités textuellement à des fins telles que la critique, les reportages, l’enseignement et la recherche, sans qu’il soit nécessaire d’obtenir l’autorisation du détenteur du droit d’auteur ou de le payer. » (source Oxford Langages) Les juges seront-ils convaincus par ce système de défense plutôt « classique » dans le contexte ? De leur réponse dépend sans doute en partie l’évolution des IA de type LLM…

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Avengers Doomsday Steve Rogers Chris Evans

Avengers Doomsday : les teasers ont dépassé un milliard de vues

17 Jan. 2026 • 8:00
0 Geekeries

Marvel a réussi son pari avec le marketing d’Avengers : Doomsday par une série de teasers diffusés d’abord dans les...

NRJ Mobile Logo

De nouveaux opérateurs français ajoutent des frais de résiliation

16 Jan. 2026 • 20:59
3 Mobiles / Tablettes

Bouygues Telecom n’est pas le seul opérateur à imposer des frais de résiliation pour ses forfaits sans engagement, voilà...

ChatGPT Logo Icone

ChatGPT Go, l’abonnement moins cher, débarque dans le monde entier

16 Jan. 2026 • 20:27
0 Internet

ChatGPT Go était déjà disponible dans quelques pays, dont en France, et voilà maintenant que l’abonnement le moins cher...

ChatGPT Publicites Contenus Sponsorises

ChatGPT va bientôt afficher des publicités, confirme OpenAI

16 Jan. 2026 • 19:47
6 Internet

Les rumeurs étaient donc bonnes : OpenAI officialise l’arrivée de publicités sur ChatGPT. Cela commence par une phase de test...

Relais Colis Logo Livreur

Relais Colis confirme un piratage avec vol de données personnelles

16 Jan. 2026 • 19:28
0 Internet

Les cyberattaques continuent en France et c’est maintenant au tour de Relais Colis d’annoncer avoir fait l’objet d’un piratage...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site