NVIDIA Blackwell : jusqu’à 2,2x plus rapide que Hopper dans les benchmarks MLPerf v4.1

Par Guillaume Meyer Mis à jour le 13 Nov 2024 à 20 h 41

NVIDIA a récemment dévoilé des performances impressionnantes de ses GPU Blackwell lors des benchmarks MLPerf v4.1, atteignant un gain de 2,2x par rapport à la génération précédente, Hopper. Ce résultat consolidé met en lumière des avancées significatives dans le champ de l’entraînement de l’IA.

Des Performances Éclatantes avec les GPU Blackwell

Après des validations réussies en matière d’inférence AI, où les Blackwell ont démontré des performances robustes contre Hopper, l’accent est maintenant mis sur les benchmarks d’entraînement. Ces tests portent sur des workloads variés tels que le Llama 2 70B, Stable Diffusion et plusieurs autres modèles majeurs de l’apprentissage automatique.

Les benchmarks incluent des cas d’utilisation populaires tels que les modèles de traitement du langage naturel et de recommandation. Les résultats obtenus permettent d’évaluer la rapidité et l’efficacité des GPU Blackwell dans divers scénarios d’apprentissage intensif.

NVIDIA souligne que la demande croissante en matière de calcul dans le domaine de l’IA exige des traitements plus rapides et des capacités d’inférence robustes. L’importance d’une formation rapide des modèles devient cruciale pour les entreprises qui souhaitent rester compétitives.

Les Performances des GPU Hopper

Pour situer Hopper, les GPU H100 affichent à présent une amélioration de 1,3x en performance d’entraînement LLM par rapport aux soumissions précédentes. Cela prouve l’engagement d’NVIDIA à optimiser son hardware à travers des mises à jour logicielles et des infrastructures de centre de données innovantes.

Hopper a également réalisé des soumissions à grande échelle pour les benchmarks MLPerf, utilisant jusqu’à 11 616 GPU H100. Cette approche montre la capacité de NVIDIA à répondre aux défis croissants du marché de l’IA.

L’Avenir avec Blackwell

Avec Blackwell, NVIDIA ne se contente pas d’augmenter les performances, mais introduit également des innovations majeures dans l’architecture des processeurs. Dans cette optique, le superordinateur Nyx, basé sur les systèmes DGX B200, a établi de nouveaux records en atteignant des performances 2,2x supérieures pour des applications comme le fine-tuning de modèles.

Les nouvelles architectures incluent des kernels optimisés pour un meilleur usage des Tensor Cores, augmentant ainsi l’efficacité des opérations de deep learning. Cela a permis de faire tourner le benchmark GPT-3 avec moins de GPU tout en conservant des performances élevées.

Dans l’ensemble, la performance accrue et l’innovation apportée par Blackwell positionne NVIDIA comme un acteur clé dans l’évolution des centres de données AI. La roadmap future promet encore plus avec l’avènement de Blackwell Ultra prévu pour 2025, qui proposera une mémoire plus importante et des capacités de calcul supérieures.

NVIDIA