Le 31 mars 2026, Anthropic a accidentellement publié l’intégralité du code source de Claude Code, son assistant de développement par intelligence artificielle, via un fichier glissé dans la version 2.1.88 du paquet npm officiel. En quelques heures, 1 900 fichiers TypeScript représentant plus de 512 000 lignes de code se retrouvaient archivés sur GitHub, clonés plus de 41 500 fois avant qu’Anthropic ne réagisse.

C’est Chaofan Shou, chercheur en sécurité chez Solayer Labs, qui a déclenché l’alerte en publiant un lien direct vers l’archive sur X (ex-Twitter). Le fichier de 59,8 Mo référençait un dépôt hébergé sur le stockage cloud R2 d’Anthropic, accessible publiquement sans authentification. Anthropic a confirmé l’incident en déclarant : « Aucune donnée sensible ni aucun identifiant de client n’ont été concernés ou exposés. Il s’agissait d’un problème lié à la mise en place d’une version, causé par une erreur humaine, et non d’une faille de sécurité. Nous mettons actuellement en place des mesures pour éviter que cela ne se reproduise. ».
Le leak de Claude Code dévoile des fonctions cachées
La valeur réelle de cette exposition ne tient pas à la quantité de code, mais à son contenu. Les développeurs qui ont analysé les fichiers ont recensé 44 fonctions entièrement développées mais non activées dans la version publique, ainsi que plusieurs révélations embarrassantes pour Anthropic.
Parmi elles, le « Undercover Mode » : lorsque des employés d’Anthropic contribuent à des dépôts publics via Claude Code, ce mode s’active automatiquement pour effacer toute trace d’IA dans les messages de commit, sans possibilité de le désactiver manuellement. La communauté open source a immédiatement réagi, jugeant la pratique trompeuse. Le code révèle également KAIROS, un système en arrière-plan autonome destiné à la consolidation de la mémoire, non encore disponible publiquement, ainsi qu’un « Coordinator Mode » permettant à Claude d’orchestrer plusieurs agents travaillant en parallèle. Le nom de code interne du projet Claude Code, Tengu, figure aussi dans les fichiers exposés.
Aucune donnée utilisateur n’a été compromise et les modèles de Claude (Opus et Sonnet) ne sont pas concernés par le leak. Mais la fuite intervient dans un contexte déjà fragilisé : quelques jours plus tôt, il a été révélé qu’Anthropic avait rendu accessibles par erreur environ 3 000 fichiers internes, dont un brouillon de billet de blog décrivant un modèle en développement sous les noms de code « Mythos » et « Capybara », présenté en interne comme soulevant des risques de cybersécurité sans précédent. Ce sont deux fuites majeures en moins d’une semaine pour l’un des acteurs les plus en vue de l’IA générative.