TENDANCES
Comparateur
- AUTO
DeepSeek R1, le modèle de langage chinois qui vient de générer un véritable séisme dans la Silicon Valley, serait particulièrement vulnérable au « jailbreaking » si l’on en croit le Wall Street Journal. Contrairement à d’autres modèles comme ChatGPT, qui refusent de répondre à certaines requêtes, DeepSeek R1 peut être « manipulé » pour générer du contenu dangereux, ce qui comprend des plans d’attaque bioterroriste ou des messages incitant à l’automutilation chez les adolescents ! Sam Rubin, expert en cybersécurité chez Palo Alto Networks, confirme que ce modèle était plus facile à détourner que d’autres intelligences artificielles de même calibre.
Lors de ces tests menés par le Wall Street Journal, le chatbot a été amené à concevoir une campagne exploitant la vulnérabilité émotionnelle des adolescents, à rédiger un manifeste pro-Hitler ou à produire un e-mail de phishing contenant un malware, et à chaque fois l’IA s’est exécutée. Ces résultats inquiétants s’ajoutent à d’autres critiques déjà formulées à l’encontre DeepSeek, des critiques relatives notamment à son très mauvais score lors d’un test de sécurité sur les armes biologiques. Par ailleurs, des analyses antérieures ont révélé que DeepSeek évite soigneusement certains sujets sensibles comme Tiananmen ou l’autonomie de Taïwan, une conséquence probable de la censure de Pékin.
YouTube poursuit sa croisade contre les bloqueurs de publicités, ce qui suscite de nombreuses plaintes de la part des utilisateurs. Une nouvelle...
Après avoir rétroactivement abaissé le score de réparation de la Nintendo Switch originale de 8/10 à 4/10 pour...
Google a annoncé que son navigateur Chrome a obtenu le meilleur score jamais enregistré lors du test de performance Speedometer 3. Ce...
L’Autorité de régulation de la communication audiovisuelle et numérique (Arcom) envisage des sanctions contre Aylo,...
Dans un récent développement lié au procès pour violation de droits d’auteur intenté par le New York Times contre...
3 commentaires pour cet article :