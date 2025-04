Google a profité de conférence Cloud Next pour présenter Ironwood, sa septième génération de TPU (Tensor Processing Unit). cette version marque une évolution majeure puisqu’il s’agit du premier TPU de Google conçu spécifiquement pour l’inférence, c’est-à-dire l’étape où les modèles d’IA effectuent des prédictions. Ironwood sera disponible plus tard cette année en deux configurations pour les clients de Google Cloud, soit un cluster de 256 puces et un cluster massif de 9 216 puces. Si l’on en croit Amin Vahdat, vice-président de Google Cloud, Ironwood est le TPU le plus puissant et le plus économe en énergie jamais développé par la firme de Mountain View, un TPU optimisé pour des charges de travail IA à grande échelle. Google semble donc se replacer dans la course au hardware d’ IA face à des concurrents comme Nvidia, Amazon et Microsoft (qui développent également leurs propres puces d’IA).

Ironwood affiche des spécifications impressionnantes : jusqu’à 4 614 téraflops (TFLOPs) de puissance de calcul par puce, 192 Go de mémoire haute vitesse, et une bande passante pouvant atteindre 7,4 Tbps. La puce intègre un SparseCore amélioré, un cœur spécialisé dans les systèmes de recommandation et les algorithmes de classement, et peut réduire les déplacements de données et la latence interne ce qui amélioré l’efficacité énergétique de l’ensemble. Google prévoit en outre d’intégrer Ironwood dans son architecture AI Hypercomputer, une plateforme de supercalcul modulaire dédiée à l’IA.