NVIDIA a récemment testé ses racks AI Blackwell GB200 NVL72 dans un environnement MoE (Mixture of Experts) et selon un communiqué, ils surpassent largement l’AMD Instinct MI355X.
NVIDIA et l’Architecture MoE
Les modèles d’IA évoluent vers un modèle centré sur le MoE, optimisant l’utilisation des ressources de calcul. Cependant, cette approche entraîne des bottleneck (goulots d’étranglement) en matière de calcul. Les grandes entreprises recherchent des solutions offrant le meilleur rapport qualité-prix, et d’après une analyse de Signal65, le GB200 NVL72 de NVIDIA est le choix privilégié pour les architectures MoE.

Performances et Économie de l’IA
Le rapport de SemiAnalysis révèle que les serveurs IA de NVIDIA offrent un débit 28 fois supérieur par GPU (75 tokens/sec) par rapport à l’AMD MI355X. Cette différence notable est attribuée à la stratégie de co-design de NVIDIA, qui intègre une configuration à 72 puces avec 30 To de mémoire partagée rapide, optimisant l’expert parallelism.

Selon les données d’Oracle, le GB200 NVL72 offre un coût par token inégalé, justifiant son adoption croissante. NVIDIA, avec son cycle de produit annuel, continue de dominer le secteur de l’IA, adressant tous les nouveaux défis à mesure qu’ils émergent.

Bien que l’AMD MI355X soit une option compétitive dans des environnements denses, NVIDIA reste le leader incontesté dans le MoE. Les futures solutions de rack, comme Helios, alimenteront la concurrence dans ce secteur dynamique.



