KultureGeek Matériel [CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

[CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

3 min.
6 Jan. 2026 • 18:33
0

À l’occasion du CES 2026, Nvidia a présenté sa nouvelle architecture pour les data centers baptisée Rubin, conçue autour de six nouvelles puces pour dominer le marché de l’intelligence artificielle. Cette plateforme, déjà en production, promet des gains de performance massifs et une réduction significative des coûts par rapport à la génération Blackwell.

Nvidia Rubin

Le GPU Rubin et le CPU Vera redéfinissent la puissance de calcul

La pièce maîtresse de cette annonce est le GPU Rubin. Il intègre 336 milliards de transistors répartis sur deux puces. Il adopte la mémoire HBM4, offrant jusqu’à 288 Go de capacité par unité et une bande passante mémoire de 22 To/s. En matière de performance brute, Nvidia annonce jusqu’à 50 PFLOP en inférence (NVFP4) et 35 PFLOP en entraînement. Ces chiffres représentent respectivement des améliorations de 5 fois et 3,5 fois par rapport à l’architecture Blackwell.

Nvidia Rubin GPU

Pour accompagner ce processeur graphique, Nvidia met en avant le processeur (CPU) Vera. Basé sur des cœurs Arm personnalisés Olympus, il affiche les caractéristiques suivantes :

  • 227 milliards de transistors
  • 88 cœurs et 176 threads grâce au « Spatial Multi-Threading »
  • Jusqu’à 1,5 To de mémoire LPDDR5x
  • Une bande passante mémoire de 1,2 To/s

Nvidia affirme que le CPU Vera double les capacités de traitement de données et de compression en comparaison avec à la puce Grace. La connexion entre les puces est assurée par le lien NVLink-C2C, atteignant 1,8 To/s.

Le rack Vera Rubin NVL72 vise l’efficacité énergétique maximale

L’architecture Rubin prend tout son sens à l’échelle du système complet, notamment avec le rack Vera Rubin NVL72. Cette configuration rassemble 72 GPU Rubin et 36 CPU Vera, interconnectés via la technologie NVLink 6. Ce système délivre une puissance de 3,6 EFLOPS en inférence et 2,5 EFLOPS en entraînement, soutenu par une capacité mémoire totale impressionnante combinant HBM4 et LPDDR5x.

L’objectif principal de cette débauche de puissance est l’efficacité économique. Nvidia promet une division par dix du coût des tokens d’inférence. De plus, l’entraînement de modèles complexes (MoE) nécessiterait quatre fois moins de GPU qu’avec la génération précédente.

Pour supporter ces flux de données, l’infrastructure réseau évolue également. La technologie NVLink 6 offre 3,6 To/s de bande passante bidirectionnelle par GPU. Côté connectivité externe, Nvidia déploie le ConnectX-9 (jusqu’à 1,6 To/s par GPU) et le DPU BlueField-4, ainsi que des commutateurs Spectrum-X Ethernet Photonics.

Contrairement aux prévisions initiales qui tablaient sur le second semestre, Nvidia confirme que la plateforme Rubin est entrée en pleine production dès le premier trimestre de 2026. La disponibilité pour les partenaires reste fixée au second semestre, mais les déploiements initiaux débuteront tôt dans l’année. Les géants du cloud comme AWS (Amazon), Google Cloud, Microsoft et Oracle, ainsi que des partenaires spécialisés comme CoreWeave et Lambda, seront les premiers à exploiter cette nouvelle architecture

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

godeal24 soldes ete

🔥 Windows 11 Pro et Office 2024 ensemble pour 28,25 € : pourquoi les utilisateurs sautent sur l’offre

14 Juin. 2026 • 17:45
0 Promos

Mettre à niveau les logiciels de son PC peut vite coûter cher. Entre un nouveau système d’exploitation et une suite de...

Xbox Series S et Xbox Series X et Manette Debout

Microsoft envisage de restructurer Xbox en une filiale

14 Juin. 2026 • 9:00
0 Jeux vidéo

Alors que Microsoft étudie une scission, une coentreprise ou basculer sa division Xbox en une filiale détenue à 100 %, la nouvelle...

Paramount Warner Bros Logos

Les États-Unis approuvent le rachat de Warner Bros par Paramount

14 Juin. 2026 • 8:00
2 Business

Au terme de huit mois d’enquête, le ministère américain de la Justice a approuvé sans condition le rachat de Warner Bros...

Claude Logo

Anthropic suspend Claude Fable 5 et Mythos 5 sur ordre des États-Unis

13 Juin. 2026 • 16:23
1 Internet

Sur directive du secrétaire américain au Commerce Howard Lutnick, Anthropic a désactivé Claude Fable Claude Mythos 5 pour...

Test du Tineco Floor One S9 Scientist : l’aspirateur laveur premium qui vise le sans-faute

13 Juin. 2026 • 15:47
0

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site