NVIDIA perd du terrain chez les ingénieurs IA car les coûts de refroidissement et d’énergie orientent les hyperscalers vers des ASICs personnalisés selon Evercore
L’efficacité pure des puces IA de NVIDIA ne semble plus être l’unique argument de vente auprès des ingénieurs. Un récent rapport de la banque d’investissement Evercore ISI suggère que ces derniers scrutent désormais d’autres facteurs, comme les coûts de refroidissement, poussant certains vers des alternatives plus économiques.
Consommation et refroidissement, les nouveaux critères pour les puces NVIDIA
Si le PDG de NVIDIA, Jensen Huang, défend régulièrement le prix de ses puces IA par leur efficacité énergétique supérieure, les ingénieurs auraient une vision plus large. Selon Evercore, le coût total de possession, intégrant notamment la puissance consommée et les systèmes de refroidissement nécessaires, devient un critère décisif dans le choix du matériel.
Cette analyse fait écho à une note de Morgan Stanley qui, bien qu’elle soulignait une performance par watt jusqu’à huit fois supérieure pour les GPU Blackwell de NVIDIA, pointait aussi un investissement initial double pour construire un datacenter avec ces composants.

La recherche d’une meilleure rentabilité pousse vers les alternatives
Evercore explique que la transition vers un régime dominé par l’inférence, plutôt que l’entraînement des modèles, accentue la recherche du meilleur coût par token généré et du retour sur investissement. Cela stimulerait l’intérêt des hyperscalers pour leurs propres puces maison (ASICs) et d’autres accélérateurs.
Cette nouvelle donne modifierait les critères d’achat : la priorité n’est plus seulement le débit maximal, mais bien le coût par token, la puissance, le refroidissement et l’utilisation. Le rapport indique que les marges brutes de NVIDIA, avoisinant 70%, sont perçues comme excessives par de nombreux ingénieurs. Ces derniers seraient ainsi prêts à adopter des ASICs ou des solutions « suffisamment bonnes » pour améliorer la rentabilité de leurs opérations.
Un expert de l’infrastructure IA Nebius confirme cette tendance, notant que l’inférence représente jusqu’à 95% des cas d’usage en entreprise et que certaines puces, comme celles de Groq, sont préférées pour leur débit plus élevé.
Evercore ISI: channel checks on GPUs vs ASICs/optics:
« NVDA inference to decline to 50% by 2028 as $AMD, TPU, Trainium, Maia, SRAM chips improve
« average AI engineer willing to use ASICs or “good enough” alternatives to improve economics »
B300 lead times stretched to 12-16 weeks… https://t.co/CZYShl8oFb pic.twitter.com/e5pQB9QPhQ— Sean (@sean_________) May 19, 2026



