NVIDIA perd du terrain chez les ingénieurs IA car les coûts de refroidissement et d’énergie orientent les hyperscalers vers des ASICs personnalisés selon Evercore

L’efficacité pure des puces IA de NVIDIA ne semble plus être l’unique argument de vente auprès des ingénieurs. Un récent rapport de la banque d’investissement Evercore ISI suggère que ces derniers scrutent désormais d’autres facteurs, comme les coûts de refroidissement, poussant certains vers des alternatives plus économiques.

Consommation et refroidissement, les nouveaux critères pour les puces NVIDIA

Si le PDG de NVIDIA, Jensen Huang, défend régulièrement le prix de ses puces IA par leur efficacité énergétique supérieure, les ingénieurs auraient une vision plus large. Selon Evercore, le coût total de possession, intégrant notamment la puissance consommée et les systèmes de refroidissement nécessaires, devient un critère décisif dans le choix du matériel.

Cette analyse fait écho à une note de Morgan Stanley qui, bien qu’elle soulignait une performance par watt jusqu’à huit fois supérieure pour les GPU Blackwell de NVIDIA, pointait aussi un investissement initial double pour construire un datacenter avec ces composants.

La recherche d’une meilleure rentabilité pousse vers les alternatives

Evercore explique que la transition vers un régime dominé par l’inférence, plutôt que l’entraînement des modèles, accentue la recherche du meilleur coût par token généré et du retour sur investissement. Cela stimulerait l’intérêt des hyperscalers pour leurs propres puces maison (ASICs) et d’autres accélérateurs.

Cette nouvelle donne modifierait les critères d’achat : la priorité n’est plus seulement le débit maximal, mais bien le coût par token, la puissance, le refroidissement et l’utilisation. Le rapport indique que les marges brutes de NVIDIA, avoisinant 70%, sont perçues comme excessives par de nombreux ingénieurs. Ces derniers seraient ainsi prêts à adopter des ASICs ou des solutions « suffisamment bonnes » pour améliorer la rentabilité de leurs opérations.

À lire :  Switch 2, la demande reste solide malgré une hausse de 50€, Nintendo commande 20 millions d'unités, les acheteurs vont s'adapter selon un analyste

Un expert de l’infrastructure IA Nebius confirme cette tendance, notant que l’inférence représente jusqu’à 95% des cas d’usage en entreprise et que certaines puces, comme celles de Groq, sont préférées pour leur débit plus élevé.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer