Anthropic lance Claude Sonnet 4.6, son modèle d’intelligence artificielle le plus performant pour la gamme Sonnet, qui égale les capacités d’Opus 4.5 sorti en novembre tout en conservant la grille tarifaire Sonnet de 3 à 15 dollars par million de tokens. Les utilisateurs en accès anticipé disent préférer Sonnet 4.6 à Opus 4.5 dans 59 % des cas, bouleversant (déjà) la hiérarchie établie trois mois plus tôt.
Claude Sonnet 4.6 est là
Anthropic dit que Sonnet 4.6 améliore simultanément le code, l’usage informatique, le raisonnement sur contextes longs, la planification d’agents, le travail documentaire et le design. La fenêtre de contexte atteint 1 million de tokens en bêta. Dans Claude Code, 70 % des utilisateurs le préfèrent à Sonnet 4.5. Face à Opus 4.5, il réduit nettement la sur-ingénierie, la « paresse », les hallucinations et améliore le suivi d’instructions et l’exécution multi-étapes.
Box mesure un gain de 15 points sur les questions-réponses complexes en comparaison avec Sonnet 4.5. Sur OfficeQA (documents d’entreprise), Sonnet 4.6 égale Opus 4.6, le modèle d’IA qui a vu le jour il y a deux semaines. Dans l’assurance, il atteint 94 % de précision sur les soumissions et les premiers avis de sinistre. Sur Vending-Bench Arena (simulation entreprise concurrentielle), il a investi massivement dix mois simulés puis pivoté vers la rentabilité, finissant largement en tête. Les utilisateurs rapportent des sorties visuelles plus polies avec de meilleurs rendus et animations, et moins d’itérations pour atteindre la production.
Voici les benchmarks de Sonnet 4.6 fournis par Anthropic, notamment pour faire une comparaison avec les autres modèles IA et ceux de la concurrence (Google Gemini 3 Pro et OpenAI GPT-5.2).
Encore du progrès pour le modèle IA
Anthropic a proposé l’usage informatique généraliste en octobre 2024, qualifié alors d’expérimental. OSWorld, qui teste des centaines de tâches sur des logiciels réels (Chrome, LibreOffice, VS Code) via souris et clavier virtuels sans API spéciales, documente les gains constants sur 16 mois. Les premiers testeurs observent des capacités de niveau humain pour naviguer dans des tableurs complexes, remplir des formulaires Web à plusieurs étapes et coordonner sur plusieurs onglets. Le modèle reste en retrait des humains les plus qualifiés, mais le rythme rend l’usage informatique utile pour une gamme élargie de tâches professionnelles.
Anthropic a également renforcé la résistance aux injections de prompt cachées sur sites Web. Les tests montrent que Sonnet 4.6 représente une amélioration majeure en comparaison avec Sonnet 4,5 et performe similairement à Opus 4.6. Les chercheurs en sécurité concluent qu’il possède « un caractère globalement chaleureux, honnête, prosocial et parfois drôle, des comportements de sécurité très solides, et aucun signe de préoccupations majeures concernant des formes critiques de désalignement ».
C’est disponible dès maintenant
Sonnet 4.6 est disponible sur toutes les offres de Claude (gratuit/Pro comme modèle par défaut), Claude Cowork, Claude Code, l’API et les plateformes cloud. Le modèle IA prend en charge à la fois la pensée adaptative et la pensée étendue, ainsi que la compression de contexte en version bêta. Cela vient résumer automatiquement les contextes plus anciens à mesure que les conversations approchent leurs limites, augmentant ainsi la longueur effective du contexte.
La Google I/O 2026 se tiendra les 19 et 20 mai au Shoreline Amphitheatre de Mountain View en Californie et en direct sur io.google, avec Android 17 et les...
Logitech K400 Plus Clavier sans Fil avec Pavé Tactile pour PC Connecté à TV, Touches Multimédia Personnalisables, Compatible avec Windows/Android/Portable/Tablette, Clavier AZERTY Belge - Noir