KultureGeek Matériel et Accessoires [CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

[CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

6 Jan. 2026 • 18:33
0

À l’occasion du CES 2026, Nvidia a présenté sa nouvelle architecture pour les data centers baptisée Rubin, conçue autour de six nouvelles puces pour dominer le marché de l’intelligence artificielle. Cette plateforme, déjà en production, promet des gains de performance massifs et une réduction significative des coûts par rapport à la génération Blackwell.

Nvidia Rubin

Le GPU Rubin et le CPU Vera redéfinissent la puissance de calcul

La pièce maîtresse de cette annonce est le GPU Rubin. Il intègre 336 milliards de transistors répartis sur deux puces. Il adopte la mémoire HBM4, offrant jusqu’à 288 Go de capacité par unité et une bande passante mémoire de 22 To/s. En matière de performance brute, Nvidia annonce jusqu’à 50 PFLOP en inférence (NVFP4) et 35 PFLOP en entraînement. Ces chiffres représentent respectivement des améliorations de 5 fois et 3,5 fois par rapport à l’architecture Blackwell.

Nvidia Rubin GPU

Pour accompagner ce processeur graphique, Nvidia met en avant le processeur (CPU) Vera. Basé sur des cœurs Arm personnalisés Olympus, il affiche les caractéristiques suivantes :

  • 227 milliards de transistors
  • 88 cœurs et 176 threads grâce au « Spatial Multi-Threading »
  • Jusqu’à 1,5 To de mémoire LPDDR5x
  • Une bande passante mémoire de 1,2 To/s

Nvidia affirme que le CPU Vera double les capacités de traitement de données et de compression en comparaison avec à la puce Grace. La connexion entre les puces est assurée par le lien NVLink-C2C, atteignant 1,8 To/s.

Le rack Vera Rubin NVL72 vise l’efficacité énergétique maximale

L’architecture Rubin prend tout son sens à l’échelle du système complet, notamment avec le rack Vera Rubin NVL72. Cette configuration rassemble 72 GPU Rubin et 36 CPU Vera, interconnectés via la technologie NVLink 6. Ce système délivre une puissance de 3,6 EFLOPS en inférence et 2,5 EFLOPS en entraînement, soutenu par une capacité mémoire totale impressionnante combinant HBM4 et LPDDR5x.

L’objectif principal de cette débauche de puissance est l’efficacité économique. Nvidia promet une division par dix du coût des tokens d’inférence. De plus, l’entraînement de modèles complexes (MoE) nécessiterait quatre fois moins de GPU qu’avec la génération précédente.

Pour supporter ces flux de données, l’infrastructure réseau évolue également. La technologie NVLink 6 offre 3,6 To/s de bande passante bidirectionnelle par GPU. Côté connectivité externe, Nvidia déploie le ConnectX-9 (jusqu’à 1,6 To/s par GPU) et le DPU BlueField-4, ainsi que des commutateurs Spectrum-X Ethernet Photonics.

Contrairement aux prévisions initiales qui tablaient sur le second semestre, Nvidia confirme que la plateforme Rubin est entrée en pleine production dès le premier trimestre de 2026. La disponibilité pour les partenaires reste fixée au second semestre, mais les déploiements initiaux débuteront tôt dans l’année. Les géants du cloud comme AWS (Amazon), Google Cloud, Microsoft et Oracle, ainsi que des partenaires spécialisés comme CoreWeave et Lambda, seront les premiers à exploiter cette nouvelle architecture

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

SFR Logo

Rachat de SFR : le retour à trois opérateurs avant 2027 est jugé « très improbable »

9 Jan. 2026 • 22:38
0 Mobiles / Tablettes

Le président de l’Autorité de la concurrence avertit Orange, Bouygues Telecom et Free que le rachat de SFR déclenchera...

ChatGPT Gemini Claude Logos

ChatGPT, Gemini… L’Autorité de la concurrence va enquêter sur les chatbots IA

9 Jan. 2026 • 20:57
0 Internet

L’Autorité de la concurrence va lancer une enquête approfondie sur les agents conversationnels tels que ChatGPT et Gemini afin...

Data Center Serveurs

Meta signe trois partenariats pour une capacité nucléaire capable de soutenir l’IA

9 Jan. 2026 • 20:37
0 Hors-Sujet

L’énergie est le nerf de la guerre dans l’essor des IA : Meta vient d’annoncer plusieurs accords majeurs visant à...

Cloudflare Logo

Cloudflare ne bloque pas des sites pirates et écope d’une amende de 14 millions d’euros en Italie

9 Jan. 2026 • 20:14
1 Internet

L’Autorité italienne pour les garanties dans les communications (AGCOM) vient de créer un précédent dans la lutte contre...

hubble

Le télescope Hubble pourrait cesser de fonctionner dès 2029 : la fin annoncée d’une icône spatiale

9 Jan. 2026 • 19:40
0 Science

Après plus de trois décennies passées à observer l’Univers, le télescope spatial Hubble approche d’un...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site