KultureGeek Matériel et Accessoires [CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

[CES 2026] Vera Rubin NVL72 : Nvidia dévoile son architecture surpuissante pour l’IA

6 Jan. 2026 • 18:33
0

À l’occasion du CES 2026, Nvidia a présenté sa nouvelle architecture pour les data centers baptisée Rubin, conçue autour de six nouvelles puces pour dominer le marché de l’intelligence artificielle. Cette plateforme, déjà en production, promet des gains de performance massifs et une réduction significative des coûts par rapport à la génération Blackwell.

Nvidia Rubin

Le GPU Rubin et le CPU Vera redéfinissent la puissance de calcul

La pièce maîtresse de cette annonce est le GPU Rubin. Il intègre 336 milliards de transistors répartis sur deux puces. Il adopte la mémoire HBM4, offrant jusqu’à 288 Go de capacité par unité et une bande passante mémoire de 22 To/s. En matière de performance brute, Nvidia annonce jusqu’à 50 PFLOP en inférence (NVFP4) et 35 PFLOP en entraînement. Ces chiffres représentent respectivement des améliorations de 5 fois et 3,5 fois par rapport à l’architecture Blackwell.

Nvidia Rubin GPU

Pour accompagner ce processeur graphique, Nvidia met en avant le processeur (CPU) Vera. Basé sur des cœurs Arm personnalisés Olympus, il affiche les caractéristiques suivantes :

  • 227 milliards de transistors
  • 88 cœurs et 176 threads grâce au « Spatial Multi-Threading »
  • Jusqu’à 1,5 To de mémoire LPDDR5x
  • Une bande passante mémoire de 1,2 To/s

Nvidia affirme que le CPU Vera double les capacités de traitement de données et de compression en comparaison avec à la puce Grace. La connexion entre les puces est assurée par le lien NVLink-C2C, atteignant 1,8 To/s.

Le rack Vera Rubin NVL72 vise l’efficacité énergétique maximale

L’architecture Rubin prend tout son sens à l’échelle du système complet, notamment avec le rack Vera Rubin NVL72. Cette configuration rassemble 72 GPU Rubin et 36 CPU Vera, interconnectés via la technologie NVLink 6. Ce système délivre une puissance de 3,6 EFLOPS en inférence et 2,5 EFLOPS en entraînement, soutenu par une capacité mémoire totale impressionnante combinant HBM4 et LPDDR5x.

L’objectif principal de cette débauche de puissance est l’efficacité économique. Nvidia promet une division par dix du coût des tokens d’inférence. De plus, l’entraînement de modèles complexes (MoE) nécessiterait quatre fois moins de GPU qu’avec la génération précédente.

Pour supporter ces flux de données, l’infrastructure réseau évolue également. La technologie NVLink 6 offre 3,6 To/s de bande passante bidirectionnelle par GPU. Côté connectivité externe, Nvidia déploie le ConnectX-9 (jusqu’à 1,6 To/s par GPU) et le DPU BlueField-4, ainsi que des commutateurs Spectrum-X Ethernet Photonics.

Contrairement aux prévisions initiales qui tablaient sur le second semestre, Nvidia confirme que la plateforme Rubin est entrée en pleine production dès le premier trimestre de 2026. La disponibilité pour les partenaires reste fixée au second semestre, mais les déploiements initiaux débuteront tôt dans l’année. Les géants du cloud comme AWS (Amazon), Google Cloud, Microsoft et Oracle, ainsi que des partenaires spécialisés comme CoreWeave et Lambda, seront les premiers à exploiter cette nouvelle architecture

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

God of War Ragnarok

God of War : la série d’Amazon a trouvé l’acteur qui incarnera Kratos

14 Jan. 2026 • 22:40
0 Geekeries

Amazon MGM Studios et Sony Pictures Television ont choisi Ryan Hurst pour prêter ses traits à Kratos dans la future série God of War...

Amazon Prime Video M6 Plus

Amazon Prime Video se met à proposer M6+

14 Jan. 2026 • 22:17
0 Hors-Sujet

À partir d’aujourd’hui, l’ensemble des membres Amazon Prime en France peuvent accéder gratuitement à M6+ sur Prime...

Grok Icone Logo

Deepfakes sexuels par l’IA Grok : la Californie ouvre une enquête contre xAI

14 Jan. 2026 • 20:55
0 Internet

La justice californienne passe à l’offensive contre l’intelligence artificielle Grok. Le procureur général...

PlayStation 5 PS5 Logo

PlayStation dévoile les jeux PS4 et PS5 les plus téléchargés en 2025

14 Jan. 2026 • 20:38
0 Jeux vidéo

Sony fait le bilan de l’année 2025 et dévoile quels ont été les jeux PlayStation les plus...

iPhone 17 Pro vs Galaxy S25 Ultra vs Pixel 10 Pro

Votre prochain smartphone coûtera plus cher, prévient Nothing

14 Jan. 2026 • 20:15
0 Mobiles / Tablettes

L’année 2026 marque un tournant brutal pour l’industrie des smartphones : les consommateurs doivent se préparer à payer...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site