KultureGeek Logiciels IA : DeepSeek R1 serait le plus vulnérable et dangereux des grands modèles de langage

IA : DeepSeek R1 serait le plus vulnérable et dangereux des grands modèles de langage

2 min.
10 Fév. 2025 • 8:33
3

DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

DeepSeek Logo

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.

Les sujets liés à ces tags pourraient vous interesser

3 commentaires pour cet article :

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Claude Logo

Claude Opus 4.6 : Anthropic dévoile son modèle d’IA le plus intelligent

5 Fév. 2026 • 19:51
0 Internet

Anthropic accélère la course à l’intelligence artificielle avec le lancement de Claude Opus 4.6. Présenté comme...

Horizon Hunters Gathering

Horizon Hunters Gathering : Guerrilla dévoile un spin-off coopératif sur PS5 et PC (trailer)

5 Fév. 2026 • 19:10
0 Jeux vidéo

Guerrilla Games enrichit la licence Horizon avec Horizon Hunters Gathering, un spin-off orienté action et coopération prévu sur...

Spotify Page Match Livre

Spotify ajoute la synchronisation entre livres audio et livres papier

5 Fév. 2026 • 18:41
0 Mobiles / Tablettes

Après une phase de test, Spotify annonce Page Match, une nouvelle fonctionnalité qui permet aux utilisateurs de synchroniser la lecture...

Meta Vibes

Meta lance Vibes en application indépendante pour rivaliser avec les vidéos IA de TikTok et OpenAI

5 Fév. 2026 • 18:41
0 Mobiles / Tablettes

Meta teste actuellement une version autonome de Vibes, son service de création et de partage de vidéos générées par...

Substack

Substack victime d’une énorme fuite de données : des utilisateurs alertés plusieurs mois après l’intrusion

5 Fév. 2026 • 17:26
0 Internet

La plateforme de newsletters Substack a confirmé cette semaine avoir été la cible d’une violation de données...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site