Ne manquez plus aucune de nos publications :
DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.
En plus d’annoncer la fin des jeux physiques en 2028, Sony dévoile la fermeture prochaine du PlayStation Store sur PS3 et PS Vita. Les...
Microsoft développe en interne une fonction baptisée « Disc to Digital » pour les jeux Xbox One et Xbox Series X. L’outil...
Vinton Cerf, l’un des principaux architectes de l’Internet moderne, va quitter Google après plus de vingt ans passés au poste de...
Un rapport parlementaire porté par la députée Céline Calvez propose d’imposer une contribution obligatoire aux...
La multiplication des constellations de satellites pourrait bientôt rendre une partie du ciel nocturne beaucoup plus difficile à observer....
1 Jul. 2026 • 22:31
3 commentaires pour cet article :