NVIDIA fait face à des retards de commandes pour ses racks de puces Blackwell, en raison de problèmes de surchauffe et de connectivité. Cette situation a entraîné une baisse significative de ses actions. Les grands clients comme Microsoft et Google choisissent d’annuler certaines commandes, augmentant ainsi l’incertitude sur l’avenir des ventes de NVIDIA.
Que s’est-il passé ? Certains des principaux clients commerciaux de NVIDIA auraient reporté leurs commandes des derniers racks de puces Blackwell en raison de problèmes de surchauffe et de défauts de connectivité des puces. Cette nouvelle a provoqué des ondulations dans l’industrie technologique et sur les marchés financiers, les actions de NVIDIA connaissant une forte baisse de quatre pour cent lors des échanges matinaux.
Selon The Information, les racks Blackwell GB200, composants cruciaux des centres de données, ont présenté des problèmes lors des déploiements initiaux. La consommation électrique sans précédent de ces GPU de pointe, chaque rack tirant une puissance stupéfiante de 120-132 kW, est à l’origine du problème, car l’extrême densité de puissance a poussé les systèmes de refroidissement traditionnels à leurs limites.
De plus, les expéditions initiales des racks Blackwell ont révélé des glitches interconnectés, entravant une distribution efficace de la chaleur et créant des points chauds problématiques. La conception complexe de module multi-puces, intégrant deux gros dies GPU dans un seul paquet, complique encore davantage la gestion thermique.
À mesure que les déploiements se développent, avec des configurations ayant jusqu’à 72 puces Blackwell par rack, ces inefficacités thermiques se cumulent de manière dramatique. Les conceptions actuelles des racks serveurs se sont révélées insuffisantes pour gérer l’énorme sortie thermique, poussant NVIDIA à demander de nombreuses modifications de conception à ses fournisseurs. La résolution de ces problèmes nécessitera probablement une combinaison d’optimisations au niveau des puces, le développement de solutions de refroidissement plus avancées, et une refonte complète de l’infrastructure des racks serveurs.

Certains des plus grands acheteurs de NVIDIA, dont Microsoft, Amazon Web Services, Google et Meta Platforms, ont réduit leurs commandes pour les racks Blackwell GB200. Ces hyperscalers avaient passé des commandes d’une offre de 10 milliards € ou plus pour cette nouvelle technologie. L’impact de ces réductions de commande pourrait être significatif.
Par exemple, Microsoft avait initialement prévu d’installer des racks GB200 avec au moins 50,000 puces Blackwell dans l’un de ses centres à Phoenix. Cependant, face aux retards, le partenaire clé de Microsoft, OpenAI, a demandé les anciennes puces ‘Hopper’ de NVIDIA à la place.
Malgré ces revers, il demeure incertain de savoir comment ces réductions de commandes affecteront finalement les ventes de NVIDIA. D’autres acheteurs potentiels pour les racks serveurs GB200 pourraient exister, même avec les problèmes signalés.
Lors des tests initiaux d’un serveur phare refroidi par liquide contenant 72 des nouvelles puces, le PDG de NVIDIA, Jensen Huang, a nié les rapports médiatiques concernant des problèmes de surchauffe. En novembre, Huang a également déclaré que l’entreprise était sur la bonne voie pour dépasser son objectif antérieur d’enregistrer plusieurs milliards de dollars de revenus provenant des puces Blackwell au cours de son quatrième trimestre fiscal.
NVIDIA et Amazon ont refusé de commenter la situation, tandis que Microsoft, Google et Meta n’ont pas encore répondu aux demandes de commentaires.



