NVIDIA Vera Rubin : 40 Millions de fois plus de calcul en 10 ans, 288 Go HBM4 et 50 PFLOPs AI

NVIDIA a récemment présenté sa nouvelle plateforme de centre de données IA, nommée Vera Rubin, fonctionnant grâce aux architectures Rubin GPU et Vera CPU.

NVIDIA Vera Rubin : 40 000 000x de croissance de calcul en une décennie

La plateforme NVIDIA Vera Rubin se compose de sept puces et six racks, chacun ayant un rôle précis pour les datacenters AI de prochaine génération. Les puces dévoilées sont les suivantes :

  • Rubin (GPU)
  • Vera (CPU)
  • CX9 (Connectivité)
  • BlueField-4 (DPU)
  • NVLINK-6 Switch (Interconnexion)
  • Spectrum-X CPO (Optique)
  • Groq 3 (LPU)

Le premier produit, le plateau de calcul Vera Rubin, améliore le système de montage, réduisant le temps d’installation à seulement deux heures. Totalement refroidi par liquide à 45 °C, ce plateau supporte les nouvelles Rubin GPUs, avec deux puces de taille imposante et huit sites HBM.

Les GPU Rubin disposent de 288 Go de mémoire HBM4, permettant un débit de 22 To/s et une performance de calcul de 50 PFLOPs. Chaque puce est constituée de 336 milliards de transistors, auxquels s’ajoutent 2,5 trillions issus de la mémoire HBM4.

NVIDIA souligne également les capacités du Vera CPU, qui affiche des performances de cœur en thread unique élevées, une sortie de données impressionnante et une efficacité énergétique extrême. Ce CPU est le premier à utiliser de la mémoire LPDDR5, offrant ainsi une performance par watt inégalée.

Le NVLink Switch Tray utilise la technologie NVLINK de 6e génération et est entièrement refroidi par liquide. Le plateau Groq 3 LPU est composé de huit unités Groq offrant 500 Mo de SRAM et 150 To/s de bande passante.

À lire :  ASRock dévoile l'AI BOX-A395 avec Ryzen AI Max+ 395 et jusqu'à 128 Go de mémoire LPDDR5X

Le Switch Spectrum-X CPO est le premier Switch optique co-emballé au monde, fabriqué par TSMC avec la technologie Cu-Litho de NVIDIA, actuellement en production.

Le plateau de stockage Bluefield-4 STX est conçu pour répondre aux exigences de Vera Rubin, tandis que le plateau ConnectX-9 est également équipé par le Vera CPU.

NVIDIA Vera Rubin NVL72 NVIDIA Vera Rubin Superchip NVIDIA Rubin GPU
Configuration 72 Rubins | 36 Veras 2 Rubins | 1 Vera 1 Rubin
Inferencing NVFP4 3 600 PFLOPS 100 PFLOPS 50 PFLOPS
Entraînement NVFP4 2 520 PFLOPS 70 PFLOPS 35 PFLOPS
Bande passante GPU 20,7 To HBM4 | 1 580 To/s 576 Go HBM4 | 44 To/s 288 Go HBM4 | 22 To/s
Nombre de cœurs CPU 3 168 cœurs NVIDIA Olympagus 88 cœurs NVIDIA Olympagus

Ensemble, ces composants forment le NVL72, proposé par divers partenaires, permettant un gain de 10x en performance par watt. Ce système offre des performances de 3,6 ExaFlops et une bande passante de 1,6 Po/s.

  • Racks Ethernet Spectrum-6 SPX
  • Racks GPU Vera Rubin NVL72
  • Racks CPU Vera
  • Racks d’accélérateurs de calcul Groq 3 LPX
  • Racks de stockage BlueField-4 STX

Les racks de CPU Vera, avec 256 unités, vont offrir 300 To/s de bande passante connectés via un spine ETL, offrant une capacité impressionnante.

Support Écosystémique Large
Les produits basés sur Vera Rubin seront disponibles chez plusieurs partenaires dès la seconde moitié de cette année, incluant AWS, Google Cloud et Microsoft Azure. Des constructeurs comme Cisco, Dell et HPE proposeront également des serveurs basés sur ces produits, facilitant ainsi leur adoption par des laboratoires d’IA et des développeurs de modèles avancés.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer