NVIDIA a récemment détaillé son GB10 Superchip équipé d’un GPU Blackwell, utilisé pour alimenter plusieurs superordinateurs DGX AI Mini.
NVIDIA lance le GB10 Superchip avec des caractéristiques avancées
Le DGX Spark, le premier système à utiliser le GB10 Superchip, fait sensation. Ce système représente l’entrée de NVIDIA dans le segment des PC AI. Depuis cette annonce, d’autres acteurs ont commencé à développer leurs propres plateformes de type GB10. Aujourd’hui, lors de Hot Chips 2025, NVIDIA examine en profondeur son GB10 Superchip et son adaptation de l’architecture Blackwell pour développeurs et stations de travail Mini.

L’idée derrière le DGX Spark était de concevoir un mini superordinateur AI basé sur l’architecture Blackwell. Pour cela, NVIDIA a développé le GB10 Superchip, combinant des innovations des datacenters telles que NVFP4, CUDA et TensorRT, adaptées à une plateforme Mini PC grâce à l’utilisation de technologies d’emballage multi-die et d’une interface C2C à faible consommation.

Le DGX Spark Workstation propose de nombreuses fonctionnalités et avantages, notamment :
- GB10 Grace Blackwell Superchip : Accélère AI, Data Science, Calcul, Rendu et Visualisation.
- 128 Go de Mémoire Système Unifiée Cohérente : Prise en charge de modèles AI jusqu’à 200 milliards de paramètres.
- ConnectX-7 Networking : Connecte deux systèmes DGX Spark pour gérer des modèles jusqu’à 405 milliards de paramètres.
- Base OS DGX et NVIDIA AI Software Stack : Déplacez facilement les charges de travail entre DGX Spark et DGX Cloud.
- Configurations de déploiement flexibles : Configurez en tant que station de travail AI ou cloud personnel AI connecté.
- Expérience utilisateur exceptionnelle : Support multi-écran et connectivité flexible.
- Design compact et économe en énergie : S’adapte facilement à n’importe quel bureau, équipé par une prise standard.

Examinons maintenant les caractéristiques du GB10 Superchip. Sa composition SoC révèle que la puce est constituée de deux dielets : un S-Dielet abritant le CPU et un G-Dielet contenant le cœur GPU, tous deux emballés ensemble avec une technologie d’emballage 2.5D avancée, fabriqués sur le procédé 3nm de TSMC.

Le CPU, basé sur l’architecture ARM Arch v9.2, comporte 20 cœurs au total, organisés en clusters de 10 cœurs, chacun ayant un cache L2 privé et un cache L3 de 16 Mo par cluster, soit 32 Mo au total.

Le GPU, basé sur l’architecture GB100 Blackwell, est considéré comme un iGPU, car il se trouve dans le même emballage et sur le même silicium. Il inclut des cœurs Tensor de 5ème génération avec prise en charge du DLSS 4 et de cœurs de Ray Tracing RTX. Il peut produire jusqu’à 31 TFLOPs de FP32 et 1000 TOPS de NVFP4 pour des charges de travail AI.
Concernant la mémoire, le GB10 Superchip prend en charge de la mémoire LPDDR5x à 256 bits avec des vitesses allant jusqu’à 9400 MT/s, permettant une bande passante brute jusqu’à 301 Go/s et une capacité maximale de 128 Go.

Le système comprend également 16 Mo de cache mémoire système, qui sert de L4 pour le CPU, et facilite le partage de données sur les différents moteurs de SoC. L’interface C2C est conçue pour être à la fois haute bande passante et faible consommation, grâce à l’architecture NVLINK de NVIDIA.
En termes de connectivité, le SoC GB10 offre PCIe, USB, Ethernet via PCIe, et prend en charge jusqu’à 4 affichages simultanés (3 DP + 1 HDMI) jusqu’à 4K à 120 Hz, ainsi qu’une prise en charge jusqu’à 8K à 120 Hz avec HDMI 2.1a. Les fonctionnalités de sécurité comprennent un support Dual Secure Root, processeurs SROOT et OSROOT, et une compatibilité avec fTPM et TPM dédié, le tout avec un TDP de 140W.

Le diagramme de bloc du SoC NVIDIA GB10 Superchip est présenté ci-après :

La scalabilité est un aspect intéressant du GB10 Superchip. Il est possible de connecter plusieurs puces GB10 grâce à la technologie ConnectX de NVIDIA, augmentant le débit, la bande passante et les capacités de DRAM pour soutenir des modèles AI plus grands.

NVIDIA décrit le SoC GB10 Superchip comme une collaboration réussie avec Mediatek, car la propriété intellectuelle du CPU provient de cette dernière. La puce a été soumise à une modélisation détaillée des performances du trafic mémoire GPU dans le sous-système de mémoire de Mediatek.

Ce qui rend le GB10 Superchip si intéressant, c’est qu’il pourrait un jour se retrouver dans des plateformes grand public telles que des ordinateurs portables et des Mini PCs. Plusieurs rapports évoquent des SoCs N1X et N1, qui seront les premiers SoCs centrics grand public de NVIDIA, et le GB10 offre un aperçu de ce que ces puces pourraient apporter.



