KultureGeek Matériel [CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

[CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

3 min.
6 Jan. 2026 • 18:33
0

À l’occasion du CES 2026, Nvidia a présenté sa nouvelle architecture pour les data centers baptisée Rubin, conçue autour de six nouvelles puces pour dominer le marché de l’intelligence artificielle. Cette plateforme, déjà en production, promet des gains de performance massifs et une réduction significative des coûts par rapport à la génération Blackwell.

Nvidia Rubin

Le GPU Rubin et le CPU Vera redéfinissent la puissance de calcul

La pièce maîtresse de cette annonce est le GPU Rubin. Il intègre 336 milliards de transistors répartis sur deux puces. Il adopte la mémoire HBM4, offrant jusqu’à 288 Go de capacité par unité et une bande passante mémoire de 22 To/s. En matière de performance brute, Nvidia annonce jusqu’à 50 PFLOP en inférence (NVFP4) et 35 PFLOP en entraînement. Ces chiffres représentent respectivement des améliorations de 5 fois et 3,5 fois par rapport à l’architecture Blackwell.

Nvidia Rubin GPU

Pour accompagner ce processeur graphique, Nvidia met en avant le processeur (CPU) Vera. Basé sur des cœurs Arm personnalisés Olympus, il affiche les caractéristiques suivantes :

  • 227 milliards de transistors
  • 88 cœurs et 176 threads grâce au « Spatial Multi-Threading »
  • Jusqu’à 1,5 To de mémoire LPDDR5x
  • Une bande passante mémoire de 1,2 To/s

Nvidia affirme que le CPU Vera double les capacités de traitement de données et de compression en comparaison avec à la puce Grace. La connexion entre les puces est assurée par le lien NVLink-C2C, atteignant 1,8 To/s.

Le rack Vera Rubin NVL72 vise l’efficacité énergétique maximale

L’architecture Rubin prend tout son sens à l’échelle du système complet, notamment avec le rack Vera Rubin NVL72. Cette configuration rassemble 72 GPU Rubin et 36 CPU Vera, interconnectés via la technologie NVLink 6. Ce système délivre une puissance de 3,6 EFLOPS en inférence et 2,5 EFLOPS en entraînement, soutenu par une capacité mémoire totale impressionnante combinant HBM4 et LPDDR5x.

L’objectif principal de cette débauche de puissance est l’efficacité économique. Nvidia promet une division par dix du coût des tokens d’inférence. De plus, l’entraînement de modèles complexes (MoE) nécessiterait quatre fois moins de GPU qu’avec la génération précédente.

Pour supporter ces flux de données, l’infrastructure réseau évolue également. La technologie NVLink 6 offre 3,6 To/s de bande passante bidirectionnelle par GPU. Côté connectivité externe, Nvidia déploie le ConnectX-9 (jusqu’à 1,6 To/s par GPU) et le DPU BlueField-4, ainsi que des commutateurs Spectrum-X Ethernet Photonics.

Contrairement aux prévisions initiales qui tablaient sur le second semestre, Nvidia confirme que la plateforme Rubin est entrée en pleine production dès le premier trimestre de 2026. La disponibilité pour les partenaires reste fixée au second semestre, mais les déploiements initiaux débuteront tôt dans l’année. Les géants du cloud comme AWS (Amazon), Google Cloud, Microsoft et Oracle, ainsi que des partenaires spécialisés comme CoreWeave et Lambda, seront les premiers à exploiter cette nouvelle architecture

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

SFR Logo

Rachat de SFR : Orange, Bouygues et Free obtiennent un délai supplémentaire de 48 heures

5 Juin. 2026 • 22:35
0 Business

Le rachat de SFR par Orange, Bouygues Telecom et Free n’a pas lieu aujourd’hui, mais il ne semble plus très loin. Les différents...

Pixel Studio Application Android

Google met fin à Pixel Studio, son application qui génère des images IA

5 Juin. 2026 • 20:54
0 Logiciels

Google met fin à Pixel Studio en tant qu’application de création sur Android. Avec la mise à jour 2.3, l’outil ne...

Asha Sharma Xbox

Xbox veut devenir le numéro un des jeux vidéo d’ici 2030

5 Juin. 2026 • 20:20
0 Jeux vidéo

La patronne de Xbox, Asha Sharma, veut hisser Xbox au rang de première entreprise du jeu vidéo et du divertissement d’ici 2030. Cette...

Television Telcommande

Noos+ : le service d’IPTV avec 250 000 abonnés est fermé par les autorités

5 Juin. 2026 • 18:39
0 Internet

Les enquêteurs du centre de lutte contre les criminalités numériques (C3N) ont mis fin cette semaine à Noos+, une plateforme...

deals promos

🔥 [#BonPlan] Les promos High-Tech du 5 juin

5 Juin. 2026 • 17:50
0 Promos

Chaque jour nous dénichons pour vous des promos sur les produits High-Tech pour vous faire économiser le plus d’argent possible. Voici...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site