NVIDIA devrait devenir le principal fournisseur mondial de CPU grâce à Vera, avec 20 milliards € de chiffre cette année
NVIDIA s’apprête à réaliser l’impensable cette année. Alors que le géant règne déjà sur le marché des GPU, l’incroyable demande pour sa nouvelle plateforme CPU Vera pourrait lui permettre de dominer aussi celui des processeurs. Cette double couronne serait une première historique dans l’industrie.
La folle demande qui propulse NVIDIA vers une double couronne
NVIDIA, le principal fournisseur mondial de GPU, est sur le point de conquérir le titre de leader des CPU cette année grâce à ses plateformes Vera, désormais en production. Les premiers racks ont été livrés à des poids lourds comme OpenAI, SpaceX, Anthropic et Oracle. Avec Vera, NVIDIA pénètre pour la première fois sur le marché des CPU autonomes, un élément central de son écosystème Rubin.
Ce CPU basé sur ARM, doté de 88 cœurs Olympus personnalisés, promet des gains majeurs. Il offre jusqu’à 50 % de performance en plus par cœur, le double de l’efficacité énergétique et une densité quadruple par rack comparé aux solutions x86 traditionnelles. Il est spécialement conçu pour l’inférence et l’IA agentique.
- Nature du produit : premier CPU sur mesure de NVIDIA, optimisé pour l’IA agentique.
- Domaines d’application : orchestration, appel d’outils, analyse de données, gestion d’états de contexte long.
- Public cible : laboratoires d’IA, fournisseurs cloud et entreprises déployant de l’IA agentique à grande échelle.
- Spécifications principales : 88 cœurs Olympus, 1,2 To/s de bande passante mémoire.

NVIDIA estime que Vera ouvre un nouveau marché potentiel de 200 milliards d’euros et prévoit un chiffre d’affaires CPU seul de près de 20 milliards d’euros cette année. Cette demande pourrait propulser NVIDIA en tête des fournisseurs de CPU, devant AMD et Intel qui profitent aussi du boom de l’IA agentique.
Conçu sur des cœurs ARM personnalisés et co-développé avec les GPU Rubin, Vera offre jusqu’à 1,5 fois plus de performances par cœur, le double de l’efficacité énergétique et quatre fois la densité par rack par rapport aux alternatives x86. Ce CPU ouvre un tout nouveau marché de 200 milliards d’euros pour NVIDIA, que nous n’avions jamais abordé. Chaque grand hyperscaler et constructeur s’associe à nous pour le déployer. Nous anticipons près de 20 milliards d’euros de revenus CPU cette année, ce qui nous positionne pour devenir le leader mondial des CPU.
Colette Kress – Directrice financière de NVIDIA
Le chiffre de 20 milliards d’euros concerne uniquement le CPU autonome. Vera a plusieurs applications : il sert de CPU hôte pour les racks Rubin (associé à quatre GPU), entre dans la composition de solutions de stockage et de sécurité avec CX9, et existe en version standalone. Ces prévisions dépassent largement celles d’AMD EPYC et Intel Xeon pour l’année.

Cependant, NVIDIA devra faire face à des contraintes d’approvisionnement. La production de Vera et de la mémoire LPDDR5X, essentielle à sa performance et très demandée, risque de limiter les livraisons pendant toute la durée de vie de la plateforme Rubin, malgré les investissements massifs de l’entreprise.
Les 20 milliards concernent le CPU autonome. Vera est utilisé de quatre façons : pour Rubin, en CPU autonome, avec CX9 pour le stockage, et avec CX9 pour la sécurité. Chaque cas d’usage repose sur Vera. Mon sentiment est que nous serons limités par l’approvisionnement pendant toute la durée de vie de Vera Rubin. Vera a été pensé comme un CPU pour l’agentique. Les CPU du passé étaient conçus avec de nombreux cœurs pour être loués. Les agents ne louent pas de cœurs, ils veulent que le travail soit fait rapidement. L’économie d’hier était au prix par cœur.
Jensen Huang – PDG de NVIDIA
Évoquant le Groq 3 LPX, un accélérateur d’inférence à forte quantité de SRAM, Jensen Huang l’a décrit comme un produit de niche, conçu pour une faible latence et un taux de token élevé, mais avec un débit et une capacité de modèles limités.

Son cas d’usage est encore marginal, réservé aux entreprises ayant besoin de différents types de tokens premium, qui représentent moins de 20 % de la production totale. NVIDIA prévoit que ces solutions SRAM resteront un produit de niche pour le groupe.
Le LPX vise la faible latence et un taux de token élevé. Mais son débit est faible. Sa capacité de modèles est limitée. Son aptitude à absorber beaucoup de contexte, pour le codage logiciel ou les charges agentiques, est plus basse. Le défi est que son cas d’usage n’est pas large. Il est destiné à des clients ayant un large portefeuille de services à tokens, où le taux est très élevé mais le nombre de clients restreint. Je m’attends à ce que le LPX et les accélérateurs similaires basés sur la SRAM restent des produits de niche encore longtemps.
Jensen Huang – PDG de NVIDIA
NVIDIA est sur le point de dominer le paysage matériel de l’IA comme jamais auparavant. Avec son CPU Vera désormais en production, la société s’apprête à devenir le premier fournisseur mondial de GPU et de CPU cette année, exploitant un nouveau marché de 200 milliards d’euros. Conçu pour l’IA agentique avec des performances inégalées, Vera redéfinit l’infrastructure de l’IA. La demande est telle que les contraintes d’approvisionnement semblent inévitables, consolidant la position de leader de NVIDIA pour la prochaine ère de l’intelligence artificielle.



