TENDANCES
Comparateur
- AUTO
DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.
Anthropic accélère la course à l’intelligence artificielle avec le lancement de Claude Opus 4.6. Présenté comme...
Guerrilla Games enrichit la licence Horizon avec Horizon Hunters Gathering, un spin-off orienté action et coopération prévu sur...
Après une phase de test, Spotify annonce Page Match, une nouvelle fonctionnalité qui permet aux utilisateurs de synchroniser la lecture...
Meta teste actuellement une version autonome de Vibes, son service de création et de partage de vidéos générées par...
La plateforme de newsletters Substack a confirmé cette semaine avoir été la cible d’une violation de données...
3 commentaires pour cet article :