KultureGeek Internet L’IA Claude peut maintenant mettre fin aux discussions nuisibles ou abusives

L’IA Claude peut maintenant mettre fin aux discussions nuisibles ou abusives

3 min.
20 Août. 2025 • 14:55
1

Anthropic, la start-up derrière le chatbot Claude, met en place une nouvelle fonctionnalité permettant à ses modèles Opus 4 et 4.1 de mettre fin aux conversations jugées « persistantes et nuisibles ou abusives ». Cette mesure vise à protéger le bien-être potentiel des modèles d’intelligence artificielle.

Claude IA

Une réponse aux interactions toxiques

Anthropic a doté Claude de la capacité de clore une conversation en dernier recours lorsque les utilisateurs insistent pour demander du contenu nuisible, malgré des refus répétés et des tentatives de redirection. Selon l’entreprise, Claude manifeste une « détresse apparente » dans ces situations, notamment face à des requêtes impliquant du contenu sexuel avec des mineurs ou des informations pouvant contribuer à des actes violents ou terroristes. Testée sur Claude Opus 4, cette fonctionnalité reflète une « aversion robuste et constante au préjudice », selon Anthropic.

Lorsqu’une conversation est interrompue, l’utilisateur ne peut plus envoyer de nouveaux messages dans ce fil, mais peut initier une nouvelle discussion ou modifier ses messages précédents pour poursuivre. Anthropic précise que ces cas sont extrêmes et que la plupart des utilisateurs, même en abordant des sujets controversés, ne rencontreront pas cette restriction.

Claude est programmé pour ne pas couper les conversations si un utilisateur montre des signes de vouloir se faire du mal ou causer un préjudice imminent à autrui. Anthropic collabore avec Throughline, une plateforme de soutien en cas de crise, pour développer des réponses adaptées aux prompts liés à l’automutilation ou à la santé mentale, garantissant une approche responsable face à ces situations sensibles.

Une politique d’utilisation renforcée

La semaine dernière, Anthropic a également mis à jour sa politique d’utilisation pour répondre aux préoccupations croissantes sur la sécurité des IA avancées. Désormais, l’entreprise interdit l’utilisation de Claude pour développer des armes biologiques, nucléaires, chimiques ou radiologiques, ainsi que pour créer du code malveillant ou exploiter les vulnérabilités d’un réseau. Cette mise à jour reflète l’engagement d’Anthropic à encadrer l’usage de son IA dans un contexte où les technologies évoluent rapidement.

Les sujets liés à ces tags pourraient vous interesser

Un commentaire pour cet article :

  • Lehulk
    Après ce sera sur des questions plus terre à terre qui dérangeront? Ce n est pas plus simple d afficher ou de dire que le contenu demandé et formellement illégal et reprehensible ?

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Steam Machine

Steam Machine : Valve maintient la sortie en 2026, après une confusion

7 Mar. 2026 • 8:00
0 Jeux vidéo

Valve a brièvement alarmé les joueurs qui attendent la Steam Machine en publiant un message indiquant « nous espérons livrer en...

Mario Nintendo

Nintendo poursuit le gouvernement américain pour les droits de douane de Trump

6 Mar. 2026 • 22:40
0 Jeux vidéo

Nintendo of America a déposé une plainte devant le Tribunal de commerce international des États-Unis contre le gouvernement...

DART NASA

La mission DART de la NASA aurait modifié l’orbite d’un duo d’astéroïdes autour du Soleil

6 Mar. 2026 • 20:16
2 Science

La mission DART (Double Asteroid Redirection Test) de la NASA continue de révéler des résultats spectaculaires pour la défense...

The Last of Us Part 2 Ellie Arme

PlayStation Store : Sony teste la tarification dynamique des jeux

6 Mar. 2026 • 20:06
0 Jeux vidéo

Sony expérimente discrètement la tarification dynamique sur le PlayStation Store : un même jeu PS5 peut afficher des prix...

Metro Londres

Un piratage des transports de Londres a entraîné la fuite des données de 10 millions de personnes

6 Mar. 2026 • 18:50
1 Internet

C’est l’une des plus grandes fuites de données de l’histoire britannique. La BBC révèle que la cyberattaque subie...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site