NVIDIA annonce le lancement de Blackwell Ultra et tease l’architecture Vera Rubin pour 2026

Par Romain Vasseur Le 28 Fév 2025 à 15 h 12

NVIDIA, suite à un revers dans le déploiement de ses GPU Blackwell, se prépare à lancer sa nouvelle série, les B300, promettant des performances accrues. Avec un support technologique avancé, la société vise à révolutionner l’intelligence artificielle. Un futur captivant s’ouvre avec des architectures encore plus puissantes en préparation.

Orientée vers l’avenir : Malgré un revers dans le déploiement de ses GPU Blackwell pour les centres de données l’année dernière en raison d’un défaut de conception, NVIDIA a rapidement récupéré et est prête à livrer sa prochaine série de produits au cours des prochaines années. Le PDG Jensen Huang a confirmé lors de l’appel sur les résultats de l’entreprise que la prochaine grande sortie, appelée Blackwell Ultra (série B300), est sur la bonne voie pour la seconde moitié de cette année.

Ce rafraîchissement à mi-parcours de l’architecture Blackwell promet des améliorations significatives par rapport à ses prédécesseurs. La série B300 devrait offrir une performance de calcul supérieure et huit empilements de mémoire HBM3E 12-Hi, fournissant jusqu’à 288 Go de mémoire embarquée. Bien qu’officiels, des estimations font état d’un gain de performance de 50 % par rapport à la série B200.

Pour compléter ces puissants GPU, NVIDIA introduira le Switch Ethernet Mellanox Spectrum Ultra X800, affichant un radian de 512 et prenant en charge jusqu’à 512 ports. Cette mise à niveau réseau améliorera encore les capacités des systèmes IA et HPC construits autour de la série B300.

Crédit image : Constellation Research

En regardant au-delà de Blackwell, NVIDIA travaille déjà sur son architecture de prochaine génération, codée Vera Rubin. Prévue pour 2026, les GPU Rubin représentent une avancée significative vers l’obtention de l’intelligence artificielle générale (AGI).

La plateforme Rubin comprendra huit empilements de mémoire HBM4E, offrant jusqu’à 288 Go de mémoire, ainsi qu’un processeur Vera, des commutateurs NVLink 6 fonctionnant à 3600 Go/s, des cartes réseau CX9 prenant en charge 1 600 Gb/s, et des commutateurs X1600. Huang a laissé entendre le potentiel transformateur de l’architecture Rubin, la décrivant comme un grand pas en avant en matière de performances et de capacités.

NVIDIA a également indiqué qu’elle est prête à discuter des produits post-Rubin lors de la prochaine Conférence sur la technologie GPU (GTC) en mars. Une avancée potentielle à l’horizon est le soi-disant Rubin Ultra, prévu pour 2027. Ce produit pourrait repousser les limites du design de GPU, incorporant potentiellement 12 empilements de mémoire HBM4E. C’est une augmentation substantielle par rapport aux 8 empilements utilisés dans les générations précédentes, offrant potentiellement jusqu’à 576 Go de mémoire totale. L’utilisation de la technologie HBM4E fournirait une bande passante et une capacité de mémoire sans précédent, cruciales pour gérer des modèles et des calculs IA de plus en plus complexes.

Pour y parvenir, NVIDIA devra maîtriser l’utilisation des interposeurs CoWoS de taille 5.5 réticule et des substrats de 100 mm × 100 mm fabriqués par TSMC. Cela représente une augmentation significative par rapport aux interposeurs de taille 3.3 réticule utilisés dans les GPU les plus avancés d’aujourd’hui. La taille d’interposeur plus grande permettrait d’intégrer davantage de composants sur un seul package, facilitant l’inclusion d’empilements de mémoire supplémentaires et potentiellement plus de tuiles GPU.

NVIDIA