TENDANCES
Comparateur
- AUTO
DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.

Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.
Après une pause en 2025 (qui ressemblait à un arrêt pur et simple du projet), Tesla prévoit de remettre en chantier Dojo, son...
Google intègre actuellement des modifications techniques pour transformer le processus de sideloading sur Android en 2026, imposant de nouvelles...
Microsoft inaugure l’année 2026 avec une défaillance technique majeure, forçant le groupe à déployer en urgence...
La plateforme Threads, développée par Meta, vient de franchir un énorme cap symbolique face à X (ex-Twitter) : selon de...
Le Pixel 10a n’est plus très loin et de nouvelles informations au sujet des prix et de la date de sortie du nouveau smartphone de Google...
3 commentaires pour cet article :