Le premier GPU d’OpenAI pour l’IA rivalise avec le haut de gamme

Par Quentin Le 24 Juin 2026 à 18 h 12

OpenAI vient de dévoiler sa première puce dédiée à l’intelligence artificielle, nommée Jalapeño. Conçue pour les charges de travail d’inférence, cette puce est fabriquée par Broadcom et vise à alimenter les futures applications d’IA agentique.

Jalapeño : une puce sur mesure pour les LLMs

OpenAI a officiellement présenté Jalapeño, son premier GPU conçu en interne. Ce silicium spécialisé, fraîchement sorti des usines de Broadcom, illustre la tendance des géants de l’IA à développer leurs propres accélérateurs.

Le PDG d’OpenAI, Sam Altman, et celui de Broadcom, Hock Tan, ont dévoilé le premier wafer de ce Jalapeño Intelligence Processor. Cette initiative rejoint celles d’autres acteurs, comme Anthropic ou Google, qui misent aussi sur des puces maison pour l’ère de l’IA agentique.

We’ve designed and built our first AI chip: Jalapeño.

Designed from the ground up by OpenAI and brought to production with @Broadcom, Jalapeño is purpose-built for the LLM workloads powering ChatGPT, Codex, the API, and future agentic products.

Chips are foundational to the AI… pic.twitter.com/mHU7DaMMTi

— OpenAI (@OpenAI) June 24, 2026

Selon OpenAI, Jalapeño marque le début d’une nouvelle vision pour l’inférence des modèles de langage. Il s’agit du premier accélérateur d’une plateforme de calcul multi-générationnelle, conçue pour rendre l’IA plus rapide, fiable et accessible.

Cette puce a été développée spécifiquement pour les tâches d’IA et co-conçue avec Broadcom en seulement neuf mois, du design initial à la production. L’écosystème sera soutenu par Broadcom et Celestica pour l’intégration système, le réseau haut débit et la production à grande échelle.

Jalapeño est une conception entièrement nouvelle pour l’inférence des LLMs modernes, et non un accélérateur généraliste adapté. Il tire parti de nos systèmes opérationnels pour ChatGPT, Codex, l’API et nos futurs produits agentiques, tout en étant conçu pour les LLMs actuels et à venir de l’industrie. L’objectif est d’allier la puissance des meilleurs accélérateurs du marché à une latence proche des systèmes d’inférence spécialisés, pour des produits LLM interactifs à grande échelle.

OpenAI

Jalapeño se veut flexible et compatible avec tous les grands modèles de langage. Les premiers exemplaires d’ingénierie exécutent déjà des charges de travail comme GPT-5.3-Codex-Spark aux fréquences et puissances cibles de production. La photo du wafer révèle huit emplacements HBM et le(s) die de calcul au centre.

Le déploiement des premières plateformes équipées de Jalapeño est prévu pour fin 2026, avec une expansion progressive les années suivantes. Ce projet s’inscrit dans un effort de long terme pour une plateforme de calcul évolutive.

Ce foray dans le silicium sur mesure démontre la demande croissante pour des ASIC et accélérateurs dédiés. L’an dernier, OpenAI avait signé un partenariat pour déployer 10GW de systèmes NVIDIA, mais face aux pénuries persistantes, les entreprises investissent désormais dans leurs propres puces. Cela leur permet de ne plus être liées à l’écosystème NVIDIA et de diversifier leur portefeuille de calcul.