OpenAI va devenir le principal client de la future puce AI NVIDIA-Groq avec 3GW de capacité d’inférence dédiée
La récente collaboration entre OpenAI et NVIDIA met l’accent sur la capacité d’inférence, où la nouvelle solution NVIDIA-Groq jouera un rôle prépondérant.
110 milliards $ pour l’IA
OpenAI se tourne vers des partenariats financiers dans l’industrie de l’IA, avec un investissement total de 110 milliards € annoncé, soutenu par NVIDIA, SoftBank et Amazon. Selon OpenAI, ces financements sont essentiels pour maintenir son développement. Un rapport du WSJ évoque que NVIDIA présentera son processeur axé sur Groq lors du GTC 2026, comme mentionné précédemment.
OpenAI deviendra le principal client de cette solution, ce qui représente un choix stratégique. NVIDIA a récemment révélé qu’OpenAI utilisera 3GW de capacité d’inférence dédiée, très probablement dérivée des innovations mises en avant en mars. L’inférence semble être une préoccupation majeure pour OpenAI, qui n’était pas satisfait des offres précédentes de NVIDIA.
Partenariats stratégiques
OpenAI a accepté de devenir l’un des plus gros clients du nouveau processeur, ce qui constitue une victoire importante pour NVIDIA. Créateur de ChatGPT, OpenAI cherche des alternatives plus efficaces aux puces de NVIDIA.
– WSJ
OpenAI aurait également testé des accords potentiels avec Cerebras et Groq pour optimiser les performances des tâches sensibles à la latence. Cependant, il semble qu’OpenAI ait finalement choisi de rester avec NVIDIA, indiquant que la solution à venir basée sur les unités de traitement de Groq est suffisamment prometteuse pour justifier cet engagement en matière de capacité. Nous anticipons une configuration hybride de type compute tray pour l’accord NVIDIA-Groq.

Nous attendons donc des annonces majeures de la part de NVIDIA lors du GTC de cette année, notamment sur Vera Rubin et la solution axée sur Groq.



