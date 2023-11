NVIDIA vient de dévoiler sa nouvelle gamme de super-processeur dédiées à l’IA, des puces qui intègreront les futurs super-calculateurs en charge du traitement des données pour les modules de langage (LLM) de type GTP-4. L’annonce la plus importante est sans doute celle des GPU HGX H200 et GH200) basé sur l’architecture Hopper, qui succède au très populaire GPU H100. Il s’agit aussi de la première puce à utiliser la mémoire HBM3e, plus rapide (4.8 téraoctets par seconde) et de plus grande capacité (jusqu’à 141 Go de mémoire adressable), pour une bande passante globalement 2,4 supérieure à celle du Nvidia A100. NVIDIA affirme en outre que le HGX H200 double la vitesse d’inférence sur Llama 2, un LLM de 70 milliards de paramètres, par rapport au H100. Amazon Web Services, Google Cloud, Microsoft Azure et Oracle Cloud sont déjà clients de ce GPU surpuissant, qui sera disponible en plusieurs versions à partir du second trimestre 2024.

L’autre grosse nouveauté est le Grace Hopper GH200, une super-puce qui intègrera des super-calculateurs de Dell, Eviden, Hewlett Packard Enterprise (HPE), Lenovo, QCT et Supermicro. Le plus gros supercomputer à recevoir le H200 n’est autre que le JUPITER, un supercomputer basé en Allemagne, qui dès sa mise en route en 2024 deviendra sans aucun doute le plus puissant des super-ordinateurs destiné à l’IA. Ce dernier disposera de 24000 superposes GH200 interconnectées entre elles via la plateforme de réseau NVIDIA Quantum-2 InfiniBand.

Ces deux annonces sont d’autant plus importantes pour Nvidia que le fabricant de puces réalise désormais la plus grosse part de son chiffre d’affaires grâce à sa division processeur et data center (soit 10,3 milliards de dollars sur le dernier trimestre).