NVIDIA livre les premiers CPU Vera à Anthropic, OpenAI, SpaceX et Oracle, le successeur de Grace pour l’ère de l’IA agentique

La production du CPU Vera de NVIDIA est officiellement lancée. Les premiers exemplaires viennent d’être livrés à plusieurs géants de l’intelligence artificielle, signant le début d’une nouvelle phase pour l’infrastructure dédiée aux agents IA.

Les premières puces NVIDIA Vera sont entre les mains des clients

NVIDIA a commencé l’expédition des tous premiers CPU Vera vers de grandes entreprises spécialisées en intelligence artificielle. Cette étape marque le début officiel de la production pour cette puce conçue spécifiquement pour l’Agentic AI.

Ce CPU Vera ouvre un nouveau chapitre pour l’écosystème NVIDIA dédié aux agents IA et pose les bases de ce qui pourrait devenir une nouvelle frontière commerciale à plusieurs milliards d’euros.

  • Son rôle – Premier CPU sur-mesure de NVIDIA, pensé pour l’agentic AI.
  • Fonctionnalités clés – Orchestration, appels d’outils, charges de travail RL, analytique de données, mise en bac à sable d’agents, gestion d’états à contexte long.
  • Cibles principales – Laboratoires IA, fournisseurs de cloud et entreprises exécutant des agents IA à grande échelle.
  • Spécifications cœur – 88 cœurs Olympus personnalisés, bande passante mémoire de 1,2 To/s, performance par cœur supérieure de 50% sous charge complète.

Ian Buck, vice-président chez NVIDIA en charge du calcul haute performance et hyperscale, a physiquement remis les premiers CPU Vera à quatre acteurs majeurs : OpenAI, SpaceX, Anthropic et Oracle Cloud. C’est la première fois que ce composant quitte les laboratoires du fondeur pour rejoindre ses premiers clients.

Ian Buck a partagé les étapes de cette tournée de livraison. Les premiers serveurs équipés de Vera ont été installés dans les bureaux d’Anthropic à San Francisco. L’étape suivante a conduit l’équipe au siège d’OpenAI, puis au bureau de SpaceXAI à Palo Alto, où Elon Musk a personnellement pris possession du matériel.

À lire :  La GeForce RTX 50 Super serait à nouveau en route, NVIDIA préparerait une RTX 5060 Super avec 12 Go de VRAM

Ces trois premières livraisons ont eu lieu vendredi. Lundi, Ian Buck s’est rendu au centre d’excellence client AI d’Oracle pour y délivrer le dernier serveur de cette première série.

Ces envois ne représentent qu’une fraction des expéditions prévues par NVIDIA dans les prochains trimestres. L’intérêt des entreprises pour les CPU capables de gérer des agents IA est immense, et le Vera, conçu précisément pour cette tâche, génère un fort engouement. La semaine dernière, des rapports indiquaient que CoreWeave, Meta et Alibaba comptaient parmi les premiers acquéreurs. Oracle était également cité et vient effectivement de recevoir ses premières puces.

Ce que promet le CPU Vera, successeur de Grace

Selon NVIDIA, le Vera offre des performances exceptionnelles par cœur en mode mono-thread, un débit de données très élevé et une efficacité énergétique extrême. Il s’agit du premier et seul CPU pour data center à utiliser de la mémoire LPDDR5, ce qui lui confère des ratios performance par watt inégalés. NVIDIA intégrera ces processeurs dans sa plateforme Vera Rubin, mais ils seront aussi vendus seuls, une décision qui pourrait ouvrir un nouveau marché de plusieurs milliards d’euros pour l’entreprise.

Pour le Vera, NVIDIA a conçu une nouvelle architecture Arm personnalisée, nommée Olympus. La puce compte 88 cœurs, 176 threads, une interconnexion mémoire cohérente NVLink-C2C de 1,8 To/s, 1,5 To de mémoire système (triple de celle de Grace), une bande passante mémoire de 1,2 To/s via de la LPDDR5X SOCAMM, et prend en charge le calcul confidentiel à l’échelle du rack. Ces caractéristiques permettent un doublement des performances en traitement de données, compression et CI/CD par rapport à Grace.

À lire :  Halo: Campaign Evolved peine sur Unreal Engine 5, la RTX 5090 dépasse à peine les 100 FPS en 1440p Ultra

L’arrivée du Vera devrait également accroître la demande de mémoire DRAM LPDDR5X, la plateforme supportant jusqu’à 1,5 To de RAM. Étant donné les volumes de CPU Vera nécessaires pour répondre à la demande en calcul, la chaîne d’approvisionnement pourrait subir des tensions. La plateforme NVIDIA Vera Rubin doit être lancée dans la seconde moitié de la semaine, et la production de masse des premiers racks va commencer très prochainement. Le Vera sera utilisé à la fois dans des serveurs LPX autonomes et comme processeur hôte dans les racks Vera Rubin NVL72.

Avec le Vera entrant en phase de production totale et le Rubin qui sera lancé dans les prochains mois, la plateforme extrêmement intégrée développée par NVIDIA est appelée à faire progresser les workflows d’agentic AI vers un nouveau niveau.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer