TENDANCES
Comparateur
- AUTO
Anthropic, la start-up derrière le chatbot Claude, met en place une nouvelle fonctionnalité permettant à ses modèles Opus 4 et 4.1 de mettre fin aux conversations jugées « persistantes et nuisibles ou abusives ». Cette mesure vise à protéger le bien-être potentiel des modèles d’intelligence artificielle.
Anthropic a doté Claude de la capacité de clore une conversation en dernier recours lorsque les utilisateurs insistent pour demander du contenu nuisible, malgré des refus répétés et des tentatives de redirection. Selon l’entreprise, Claude manifeste une « détresse apparente » dans ces situations, notamment face à des requêtes impliquant du contenu sexuel avec des mineurs ou des informations pouvant contribuer à des actes violents ou terroristes. Testée sur Claude Opus 4, cette fonctionnalité reflète une « aversion robuste et constante au préjudice », selon Anthropic.
Lorsqu’une conversation est interrompue, l’utilisateur ne peut plus envoyer de nouveaux messages dans ce fil, mais peut initier une nouvelle discussion ou modifier ses messages précédents pour poursuivre. Anthropic précise que ces cas sont extrêmes et que la plupart des utilisateurs, même en abordant des sujets controversés, ne rencontreront pas cette restriction.
Claude est programmé pour ne pas couper les conversations si un utilisateur montre des signes de vouloir se faire du mal ou causer un préjudice imminent à autrui. Anthropic collabore avec Throughline, une plateforme de soutien en cas de crise, pour développer des réponses adaptées aux prompts liés à l’automutilation ou à la santé mentale, garantissant une approche responsable face à ces situations sensibles.
La semaine dernière, Anthropic a également mis à jour sa politique d’utilisation pour répondre aux préoccupations croissantes sur la sécurité des IA avancées. Désormais, l’entreprise interdit l’utilisation de Claude pour développer des armes biologiques, nucléaires, chimiques ou radiologiques, ainsi que pour créer du code malveillant ou exploiter les vulnérabilités d’un réseau. Cette mise à jour reflète l’engagement d’Anthropic à encadrer l’usage de son IA dans un contexte où les technologies évoluent rapidement.
Google a proposé des modifications à son Play Store, à savoir sa boutique d’applications Android, pour répondre aux...
Lors de la Conférence mondiale sur la robotique à Pékin, Kaiwa Technology a présenté un concept de robot humanoïde...
Anthropic, la start-up derrière le chatbot Claude, met en place une nouvelle fonctionnalité permettant à ses modèles Opus 4 et...
Capcom a profité de l’Opening Night Live de la Gamescom 2025 pour dévoiler Resident Evil Requiem (Resident Evil 9), attendu le 27...
La Maison-Blanche a officiellement rejoint TikTok, une plateforme que Donald Trump avait pourtant tenté d’interdire durant son premier...
Un commentaire pour cet article :