MLPerf v5.1 AI Inference : NVIDIA Blackwell Ultra GB300 et AMD Instinct MI355X à l’honneur

Par Guillaume Meyer Le 10 Sep 2025 à 05 h 24

Les dernières données de performance en matière de génération d’images sont désormais disponibles avec les cartes NVIDIA Blackwell Ultra GB300 et AMD Instinct MI355X, ayant été évaluées dans les benchmarks MLPerf v5.1.

NVIDIA Blackwell Ultra GB300 et AMD Instinct MI355X : Performances Inégalées à MLPerf v5.1

MLCommons a récemment publié les résultats des benchmarks MLPerf v5.1, attirant l’attention sur le GB300, le MI355X et l’Intel Arc Pro B60. Le GB300 et le MI355X représentent les options AI les plus rapides de leurs constructeurs respectifs, entraînant un test minutieux des performances de ces modèles.

Pour le benchmark DeepSeek R1 (Offline), le GB300 affiche une progression impressionnante de 45% par rapport au GB200 dans une comparaison à 72 GPU, tandis que dans une configuration à 8 GPU, l’augmentation se situe à 44%, correspondant presque aux 50% annoncés par NVIDIA.

Comparaisons et Performances : DeepSeek et Llama

Le benchmark DeepSeek R1 (Server) révèle également une hausse de 25% dans une comparaison à 72 GPU, atteignant 21% de gains dans la configuration à 8 GPU. Pour le Llama 3.1 405B (Offline), le MI355X constate une augmentation de 27% par rapport au GB200.

Concernant le benchmark Llama 2 70B (Offline), l’Instinct MI355X génère jusqu’à 648248 tokens par seconde avec 64 chips, représentant une augmentation significative de 2,09x par rapport à la configuration NVIDIA. En comparaison, l’Arc Pro B60 obtient 3009 tokens/s mais s’avère plus compétitif pour des utilisations hors datacenters que les autres modèles.

NVIDIA a partagé un large éventail de résultats démontrant les performances impressionnantes de sa plateforme Blackwell Ultra GB300, établissant de nouveaux records de génération d’images. Le GB300 montre un avantage de 4,7x en mode offline et de 5,2x en mode server face aux GPU Hopper.

Records MLPerf pour chaque Accélérateur
Benchmark	Offline	Server	Interactif
DeepSeek-R1	5,842 tokens/seconde/GPU	2,907 tokens/seconde/GPU	**
Llama 3.1 405B	224 tokens/seconde/GPU	170 tokens/seconde/GPU	138 tokens/seconde/GPU

Les prochains benchmarks de MLPerf promettent d’apporter des améliorations supplémentaires, alors que NVIDIA, AMD et Intel travaillent à l’optimisation de leurs plateformes.

AMD NVIDIA