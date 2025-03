Lors de la conférence GTC 2025, Nvidia a présenté ses nouvelles puces dédiées à l’intelligence artificielle, avec l’ambition de conserver son avance sur le marché. Parmi les annonces phares, l’entreprise a mis en lumière Blackwell Ultra, qui sera disponible au second semestre, ainsi que Vera Rubin, dont la sortie est prévue pour l’année prochaine. Il y a également Rubin Ultra, une version encore plus puissante, attendue pour 2027.

Blackwell Ultra : une évolution mesurée

Initialement, Nvidia avait annoncé des puces AI dont la production devait s’intensifier sur une base annuelle. Cependant, la Blackwell Ultra, bien qu’une évolution de la puce Blackwell, ne répond pas encore totalement aux attentes du marché. Lors de la présentation, Nvidia a précisé que chaque puce Blackwell Ultra offrirait la même performance de 20 pétaflops en IA que la version précédente, mais avec une capacité mémoire accrue. En effet, chaque puce sera équipée de 288 Go de mémoire HBM3e contre 192 Go pour la Blackwell. De plus, Blackwell Ultra DGX GB300 « Superpod », qui comprend 288 processeurs et 576 unités de traitement graphique (GPU), offrira 300 To de mémoire, soit une amélioration par rapport aux 240 To de la version antérieure.

Bien que ces améliorations soient notables, Nvidia semble se concentrer davantage sur la comparaison avec son modèle H100, lancé en 2022 et ayant marqué un tournant dans le domaine des puces pour l’intelligence artificielle. Nvidia estime que la Blackwell Ultra est 1,5 fois plus rapide que la H100 pour les inférences en FP4, notamment grâce à sa capacité de traiter 1 000 tokens par seconde, soit dix fois plus que les puces précédentes. Cette amélioration permet d’effectuer des tâches complexes de raisonnement IA beaucoup plus rapidement, comme le montre l’exemple d’un système capable de répondre en dix secondes à des questions contre 1 minute et 30 secondes pour H100.

Une nouvelle offre pour les entreprises : la DGX Station

Un des points intéressants de cette nouvelle série de puces est le lancement DGX Station, un ordinateur de bureau équipé d’une seule puce Blackwell Ultra. Ce modèle propose 784 Go de mémoire système unifiée et promet des performances de 20 pétaflops en IA. Asus, Dell, et HP, aux côtés d’autres entreprises comme Boxx et Lambda, seront partenaires de Nvidia pour la vente de cette station de travail.

Vera Rubin et Rubin Ultra : une puissance accrue

Nvidia ne s’arrête pas là et a également annoncé deux nouvelles architectures destinées à renforcer encore sa position dans le domaine de l’IA. La Vera Rubin, prévue pour 2026, devrait offrir 50 pétaflops en FP4, soit un gain significatif par rapport aux 20 pétaflops de la Blackwell. Mais c’est la Rubin Ultra qui représente véritablement un bond technologique. Cette puce, prévue pour 2027, sera équipée de deux GPU Rubin interconnectés, permettant ainsi de doubler la performance avec 100 pétaflops en FP4. De plus, sa mémoire sera quasiment quadruplée, atteignant 1 To. Un rack complet de Rubin Ultra, le NVL576, sera capable de délivrer jusqu’à 15 exaflops en inférence FP4 et 5 exaflops en entraînement FP8, soit une performance 14 fois supérieure à celle du rack Blackwell Ultra prévu pour cette année.

L’avenir de l’IA selon Nvidia : des besoins toujours croissants

Jensen Huang, le PDG de Nvidia, a souligné que les besoins en puissance de calcul pour l’IA ne cessent de croître. Il estime que l’industrie aura besoin de « 100 fois plus de puissance que ce que nous imaginions l’année dernière » pour suivre la demande. Cette vision est alimentée par l’essor rapide des technologies d’IA, notamment les systèmes comme DeepSeek, qui ont modifié les attentes du marché et redéfini les investissements en intelligence artificielle.

Nvidia continue donc d’investir dans des architectures de plus en plus performantes. Après Vera Rubin, l’entreprise prévoit déjà une nouvelle génération de puces pour 2028, baptisée Feynman, en hommage au célèbre physicien théoricien Richard Feynman.