Le premier GPU d’OpenAI pour l’IA rivalise avec le haut de gamme

OpenAI vient de dévoiler sa première puce dédiée à l’intelligence artificielle, nommée Jalapeño. Conçue pour les charges de travail d’inférence, cette puce est fabriquée par Broadcom et vise à alimenter les futures applications d’IA agentique.

Jalapeño : une puce sur mesure pour les LLMs

OpenAI a officiellement présenté Jalapeño, son premier GPU conçu en interne. Ce silicium spécialisé, fraîchement sorti des usines de Broadcom, illustre la tendance des géants de l’IA à développer leurs propres accélérateurs.

Le PDG d’OpenAI, Sam Altman, et celui de Broadcom, Hock Tan, ont dévoilé le premier wafer de ce Jalapeño Intelligence Processor. Cette initiative rejoint celles d’autres acteurs, comme Anthropic ou Google, qui misent aussi sur des puces maison pour l’ère de l’IA agentique.

Selon OpenAI, Jalapeño marque le début d’une nouvelle vision pour l’inférence des modèles de langage. Il s’agit du premier accélérateur d’une plateforme de calcul multi-générationnelle, conçue pour rendre l’IA plus rapide, fiable et accessible.

Cette puce a été développée spécifiquement pour les tâches d’IA et co-conçue avec Broadcom en seulement neuf mois, du design initial à la production. L’écosystème sera soutenu par Broadcom et Celestica pour l’intégration système, le réseau haut débit et la production à grande échelle.

Jalapeño est une conception entièrement nouvelle pour l’inférence des LLMs modernes, et non un accélérateur généraliste adapté. Il tire parti de nos systèmes opérationnels pour ChatGPT, Codex, l’API et nos futurs produits agentiques, tout en étant conçu pour les LLMs actuels et à venir de l’industrie. L’objectif est d’allier la puissance des meilleurs accélérateurs du marché à une latence proche des systèmes d’inférence spécialisés, pour des produits LLM interactifs à grande échelle.

OpenAI

Jalapeño se veut flexible et compatible avec tous les grands modèles de langage. Les premiers exemplaires d’ingénierie exécutent déjà des charges de travail comme GPT-5.3-Codex-Spark aux fréquences et puissances cibles de production. La photo du wafer révèle huit emplacements HBM et le(s) die de calcul au centre.

À lire :  AMD et Intel équipent le x86 contre l'écart en IA, intégrant des moteurs de multiplication matricielle et les formats basse précision directement dans les futurs CPU

Le déploiement des premières plateformes équipées de Jalapeño est prévu pour fin 2026, avec une expansion progressive les années suivantes. Ce projet s’inscrit dans un effort de long terme pour une plateforme de calcul évolutive.

Ce foray dans le silicium sur mesure démontre la demande croissante pour des ASIC et accélérateurs dédiés. L’an dernier, OpenAI avait signé un partenariat pour déployer 10GW de systèmes NVIDIA, mais face aux pénuries persistantes, les entreprises investissent désormais dans leurs propres puces. Cela leur permet de ne plus être liées à l’écosystème NVIDIA et de diversifier leur portefeuille de calcul.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer