NVIDIA a lancé la production complète de sa nouvelle architecture Vera Rubin, offrant une vue d’ensemble détaillée de ses composants essentiels.
NVIDIA : Six Nouveaux Circuits Intégrés, Refroidissement Liquide Amélioré et NVLink 6
Avec Vera Rubin, NVIDIA introduit des mises à jour majeures. Une récente vidéo de CNBC a permis d’observer des composants clés tels que le nœud principal de calcul, ainsi que les éléments de mise en réseau et de refroidissement. Dion Harris, directeur senior de l’infrastructure chez NVIDIA, décrit ce système comme l’un des plus complexes au monde en matière d’IA.
Alors que des engagements clients sont attendus prochainement, il est crucial de comprendre l’architecture du rack NVL72. L’élément vital est bien sûr le SuperChip Vera Rubin. L’intégration de la mémoire HBM4 avec le GPU et des modules SOCAMM spécifiques permet d’obtenir une bande passante impressionnante de 1,2 To/s.

Le système de refroidissement subit également une évolution significative. NVIDIA prévoit d’intégrer des conceptions de refroidissement liquide modulaires pour les composants clés. Cela pourrait inciter les hyperscalers à adopter ces nouveaux systèmes tout en diminuant leur consommation en eau.


Le NVLink, intégrant la 6ème génération, offre une bande passante totale de 260 To/s par rack. Harris affirme que cette nouvelle génération améliore la modularité, permettant ainsi un entretien sans temps d’arrêt.

Bien que des augmentations de prix soient anticipées, NVIDIA assure que cette architecture réduit le coût par token d’inférence de 10x et la nécessité en GPU pour former des modèles MoE de 4x par rapport à la génération précédente, confirmant ainsi sa stratégie économique.




