Anthropic annonce la disponibilité de Claude Opus 4.8 dès aujourd’hui, moins de deux mois après la version précédente, marquant une accélération notable du rythme de mise à jour du modèle d’intelligence artificielle. Les prix restent identiques à ceux de Claude Opus 4.7.
Plusieurs améliorations pour Claude Opus 4.8
Anthropic décrit Opus 4.8 comme disposant d’un « jugement plus affûté, d’une plus grande honnêteté sur l’avancement de ses tâches et d’une capacité à travailler de manière autonome plus longtemps que ses prédécesseurs ». Les testeurs qui ont pu avoir l’IA en avance rapportent que le modèle signale plus volontiers ses incertitudes et formule moins d’affirmations non étayées, deux axes directement liés aux usages en mode agentique.
Les gains de performance entre Opus 4.7 et Opus 4.8 sont les suivants selon les benchmarks :
Score de codage agentique : de 64,3 % (Claude Opus 4.7) à 69,2 % (Claude Opus 4.8)
Raisonnement multidisciplinaire avec outils : de 54,7 % à 57,9 %
Utilisation agentique de l’ordinateur : de 82,8 % à 83,4 %
Score de travail pour la connaissance : de 1 753 à 1 890
Analyse financière agentique : de 51,5 % à 53,9 %
Le mode rapide d’Opus 4.8 est environ 2,5 fois plus véloce que celui d’Opus 4.7 et son coût a été divisé par trois. Par défaut, le modèle fonctionne en effort élevé, ce qui consomme un volume de tokens comparable à Opus 4.7 sur les tâches de codage, pour de meilleures performances. Les utilisateurs peuvent également choisir les niveaux « extra » (xhigh dans Claude Code) ou « max » pour allouer davantage de tokens sur des tâches complexes ou des flux de travail de longue durée. Anthropic a également relevé les limites dans Claude Code pour absorber cette consommation accrue.
D’autres mises à jour au programme
En parallèle du lancement d’Opus 4.8, Anthropic déploie trois mises à jour distinctes :
les Dynamic workflows en aperçu de recherche dans Claude Code pour des tâches de plus grande envergure
un contrôle d’effort directement accessible dans l’interface sur claude.ai et Cowork
une évolution de l’API Messages qui permet aux développeurs de mettre à jour les instructions de Claude en cours de tâche sans interrompre le cache de prompt.
Enfin, Anthropic annonce la mise à disposition de son modèle Mythos, dédié à la cybersécurité et dévoilé début avril, pour l’ensemble de ses clients « dans les prochaines semaines », après une période d’accès restreint à certaines plateformes partenaires.
Razer PBT Keycap Set for Gaming Keyboard - Kit de Mise à Niveau des Capuchons de Touches pour claviers mécaniques et optiques (compatibilité avec Le rétroéclairage, matériau PBT supérieur) Noir