Les CPU sont les prochains: la vague Agentic AI provoque de fortes pénuries dans le cloud

Après la ruée sur les accélérateurs puis la mémoire, un nouveau goulot d’étranglement frappe les clouds: les processeurs. L’essor de l’IA agentique met les centres de données sous pression et assèche les stocks, au point que certains services vacillent. Des acteurs majeurs auraient déjà vidé leurs réserves, tandis que les commandes s’envolent trimestre après trimestre.

Amazon et les fournisseurs cloud à court de CPU, la demande liée à l’IA agentique s’emballe

Selon Dylan Patel (SemiAnalysis), les GPU ne sont plus le principal goulot d’étranglement pour les fournisseurs cloud: ce sont désormais les CPU. Les accélérateurs dédiés à l’IA servaient surtout des tâches d’inférence basiques, puis les charges ont évolué au rythme de nouveaux modèles.

Avec la montée des modèles agentiques, les systèmes multiplient les appels vers des bases de données et interfacent des tâches qui reposent fortement sur le CPU, comme la physique ou la simulation. Ces enchaînements provoquent une poussée brutale de l’usage CPU dans les data centers.

Si les serveurs IA étaient historiquement dominés par les accélérateurs, par exemple 8 GPU pilotés par un seul CPU par rack, l’écart se réduit désormais et les ratios GPU/CPU convergent au sein des serveurs.

La pression se fait déjà sentir sur des services critiques: des utilisateurs signalent des indisponibilités et des échecs de commit à répétition sur GitHub.

Dylan Patel explique que la demande est si forte que les fournisseurs cloud ont épuisé leurs stocks de processeurs. Amazon et Microsoft auraient vendu la quasi-totalité de leurs CPU à des acteurs de l’IA comme OpenAI et Anthropic. Malgré un triplement annuel de ses serveurs CPU, Amazon serait déjà à court et incapable de couvrir les besoins à venir.

Oui, on suit les statistiques de GitHub sur la fréquence des pannes et des échecs de commit, c’est désastreux. Microsoft a vendu tous les CPU qu’il avait en rab à d’autres, soit pour un usage interne de leurs labos, mais surtout à des labos externes avec des accords chez Anthropic et OpenAI.

Ils n’ont pratiquement plus de CPU. On observe la même chose chez de nombreuses autres entreprises. Avant, on avait beaucoup de serveurs GPU pour un seul serveur CPU. 100 mégawatts de GPU pouvaient être servis par 1 mégawatt ou moins de CPU. Aujourd’hui, le ratio se resserre nettement, pour l’entraînement RL comme pour l’inférence agentique. Résultat: tout le monde est à court de CPU. Les volumes d’Amazon sur les CPU…

Dylan Patel (Semianalysis)

Les processeurs Arm seraient encore plus touchés depuis le passage d’OpenAI de l’architecture x86 vers Arm. À l’époque, Amazon disposait de davantage de ressources CPU sur Arm, tandis que l’offre x86 était limitée; de nombreuses équipes ont donc porté leur code vers Arm, un choix qui se retourne aujourd’hui contre elles avec l’explosion de la demande.

À lire :  La CWA et plus de 3 500 employés syndiqués de Xbox sont prêts à riposter contre les suppressions de postes massives rapportées chez Xbox

Le marché se dirige vers une pénurie massive de CPU. Les fabricants vont tenter d’accélérer la cadence, sur Arm comme sur x86. AMD et Intel alimentent une large part des besoins x86 des clouds, et NVIDIA monte en puissance avec ses baies Vera, qui empilent plusieurs puces et beaucoup de DRAM. La mémoire reste très orientée IA, et les CPU le deviennent aussi. Conséquence probable: des lignes de production grand public et pros sous-dotées, des stocks tendus, des prix en hausse, et une allocation prioritaire aux clients prêts à payer le plus.


Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer