KultureGeek Matériel [CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

[CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

3 min.
6 Jan. 2026 • 18:33
0

À l’occasion du CES 2026, Nvidia a présenté sa nouvelle architecture pour les data centers baptisée Rubin, conçue autour de six nouvelles puces pour dominer le marché de l’intelligence artificielle. Cette plateforme, déjà en production, promet des gains de performance massifs et une réduction significative des coûts par rapport à la génération Blackwell.

Nvidia Rubin

Le GPU Rubin et le CPU Vera redéfinissent la puissance de calcul

La pièce maîtresse de cette annonce est le GPU Rubin. Il intègre 336 milliards de transistors répartis sur deux puces. Il adopte la mémoire HBM4, offrant jusqu’à 288 Go de capacité par unité et une bande passante mémoire de 22 To/s. En matière de performance brute, Nvidia annonce jusqu’à 50 PFLOP en inférence (NVFP4) et 35 PFLOP en entraînement. Ces chiffres représentent respectivement des améliorations de 5 fois et 3,5 fois par rapport à l’architecture Blackwell.

Nvidia Rubin GPU

Pour accompagner ce processeur graphique, Nvidia met en avant le processeur (CPU) Vera. Basé sur des cœurs Arm personnalisés Olympus, il affiche les caractéristiques suivantes :

  • 227 milliards de transistors
  • 88 cœurs et 176 threads grâce au « Spatial Multi-Threading »
  • Jusqu’à 1,5 To de mémoire LPDDR5x
  • Une bande passante mémoire de 1,2 To/s

Nvidia affirme que le CPU Vera double les capacités de traitement de données et de compression en comparaison avec à la puce Grace. La connexion entre les puces est assurée par le lien NVLink-C2C, atteignant 1,8 To/s.

Le rack Vera Rubin NVL72 vise l’efficacité énergétique maximale

L’architecture Rubin prend tout son sens à l’échelle du système complet, notamment avec le rack Vera Rubin NVL72. Cette configuration rassemble 72 GPU Rubin et 36 CPU Vera, interconnectés via la technologie NVLink 6. Ce système délivre une puissance de 3,6 EFLOPS en inférence et 2,5 EFLOPS en entraînement, soutenu par une capacité mémoire totale impressionnante combinant HBM4 et LPDDR5x.

L’objectif principal de cette débauche de puissance est l’efficacité économique. Nvidia promet une division par dix du coût des tokens d’inférence. De plus, l’entraînement de modèles complexes (MoE) nécessiterait quatre fois moins de GPU qu’avec la génération précédente.

Pour supporter ces flux de données, l’infrastructure réseau évolue également. La technologie NVLink 6 offre 3,6 To/s de bande passante bidirectionnelle par GPU. Côté connectivité externe, Nvidia déploie le ConnectX-9 (jusqu’à 1,6 To/s par GPU) et le DPU BlueField-4, ainsi que des commutateurs Spectrum-X Ethernet Photonics.

Contrairement aux prévisions initiales qui tablaient sur le second semestre, Nvidia confirme que la plateforme Rubin est entrée en pleine production dès le premier trimestre de 2026. La disponibilité pour les partenaires reste fixée au second semestre, mais les déploiements initiaux débuteront tôt dans l’année. Les géants du cloud comme AWS (Amazon), Google Cloud, Microsoft et Oracle, ainsi que des partenaires spécialisés comme CoreWeave et Lambda, seront les premiers à exploiter cette nouvelle architecture

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

HBO Max Logo

HBO Max s’attaque au partage de compte dans le monde

27 Fév. 2026 • 20:55
0 Internet

Warner Bros Discovery va étendre en 2026 les restrictions au partage de compte sur HBO Max à l’international, après une...

Samsung Galaxy S26 Ultra Arriere Coloris

Galaxy S26 : la hausse de prix est liée à la pénurie de RAM selon Samsung

27 Fév. 2026 • 20:20
1 Mobiles / Tablettes

Samsung a annoncé cette semaine les Galaxy S26, Galaxy S26+ et Galaxy S26 Ultra, avec une hausse de prix par rapport à la...

Disney Plus Logo

Disney+ France rétablit le HDR, mais toujours pas le Dolby Vision et HDR10+

27 Fév. 2026 • 19:14
0 Internet

Disney+ propose de nouveau le HDR en France et dans les autres pays d’Europe. Cela fait suite à son récent retrait. En revanche, le...

God of War

God of War : première image de Kratos et Atreus dans la série événement d’Amazon Prime Video

27 Fév. 2026 • 17:41
1 Jeux vidéo

Prime Video et Sony Pictures lèvent enfin le voile sur l’adaptation live-action très (très) attendue de God of War. Les...

PS5 Pro PlayStation 5 et Manette DualSense

PSSR 2.0 : la PS5 Pro améliore encore les graphismes des jeux

27 Fév. 2026 • 17:38
0 Jeux vidéo

Sony annonce une refonte majeure de sa technologie d’upscaling PSSR (PlayStation Spectral Super Resolution) pour PS5 Pro, avec un déploiement...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site