KultureGeek Logiciels IA : DeepSeek R1 serait le plus vulnérable et dangereux des grands modèles de langage

IA : DeepSeek R1 serait le plus vulnérable et dangereux des grands modèles de langage

10 Fév. 2025 • 8:33
3

DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

DeepSeek Logo

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.

Les sujets liés à ces tags pourraient vous interesser

3 commentaires pour cet article :

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Dauphine Image Generee ChatGPT GPT-4o

OpenAI renforce ChatGPT avec un nouveau générateur d’images performant

25 Mar. 2025 • 22:39
0 Internet

OpenAI poursuit l’amélioration de son intelligence artificielle en dotant ChatGPT d’un nouveau modèle de...

Netflix Logo Television

Netflix et Amazon Prime Video veulent diffuser les films un an après la sortie au cinéma

25 Mar. 2025 • 20:53
0 Hors-Sujet

La chronologie des médias, qui régit les délais de diffusion des films après leur sortie en salles, est de nouveau en pleine...

Boutique de Bouygues Telecom Logo

Bouygues Telecom met fin au Wi-Fi 5 et augmente ses débits

25 Mar. 2025 • 19:36
2 Internet

Bouygues Telecom va opérer à plusieurs changements pour davantage miser sur l’Internet fixe et l’un d’eux consiste...

deals promos

🔥 [#PromosDuPrintemps] Les promos high-tech du 25 mars

25 Mar. 2025 • 18:56
0 Promos

Chaque jour nous dénichons pour vous des promos sur les produits High-Tech pour vous faire économiser le plus d’argent possible. Voici...

Nvidia App

Nvidia propose G-Assist, son assistant d’IA qui optimise votre PC gamer

25 Mar. 2025 • 18:00
0 Logiciels

Nvidia a lancé G-Assist, un assistant d’intelligence artificielle pour les propriétaires de cartes graphiques RTX, Ce projet, qui...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site