TENDANCES
Comparateur
- AUTO
DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.
Une édition physique obscure d’un jeu PlayStation 4 devient soudainement l’objet de toutes les convoitises sur le marché de...
Adam Mosseri, le patron Instagram, estime que l’esthétique soigneusement orchestrée qui a fait la gloire de son réseau social...
SpaceX entame une reconfiguration de sa flotte orbitale pour l’année 2026 en annonçant son intention de déplacer près de...
La Poste donne quelques détails concernant la nouvelle cyberattaque qui la vise depuis le passage à 2026. Cela fait suite à une...
Grok, l’intelligence artificielle disponible sur le réseau social X (ex-Twitter) d’Elon Musk, se fait remarquer depuis quelques jours...
3 commentaires pour cet article :