Les GPU RTX d’NVIDIA offrent les meilleures performances IA sur les derniers modèles « gpt-oss » d’OpenAI

Par Guillaume Meyer Le 6 Août 2025 à 03 h 36

NVIDIA et OpenAI ont dévoilé la dernière famille de modèles d’IA open gpt-oss pour les consommateurs, offrant des performances exceptionnelles sur les GPU RTX.

Les Performances de la RTX 5090 sur le Modèle gpt-oss 20b

Dans un communiqué, NVIDIA a affirmé sa partenariat avec OpenAI pour rendre accessibles des modèles d’IA révolutionnaires sur des PC et stations de travail équipés de RTX, auparavant réservés aux centres de données cloud.

Jensen Huang, le fondateur et PDG de NVIDIA, a mis en avant cette initiative :

“OpenAI a démontré le potentiel de l’IA basée sur NVIDIA, et ils continuent à faire avancer l’innovation dans le logiciel open-source,” a déclaré Huang. “Les modèles gpt-oss permettent aux développeurs de s’appuyer sur ces fondations, tout en renforçant la position technologique des États-Unis dans le domaine de l’IA.”

Ce lancement incarne une nouvelle ère d’IA plus rapide et plus performante grâce à la puissance des GPU GeForce RTX et PRO. Deux déclinaisons sont disponibles :

Le modèle gpt-oss-20b est conçu pour maximiser les performances sur des PC dotés d’au moins 16 Go de VRAM, atteignant jusqu’à 250 tokens par seconde avec le GPU RTX 5090.
Le modèle gpt-oss-120b est adapté aux stations de travail professionnelles équipées de GPU RTX PRO.

OpenAI sécurise 8,3 milliards de dollars dans le cadre d’une levée de fonds de 40 milliards de dollars

Ces modèles sont entraînés sur des GPU NVIDIA H100, intégrant la précision MXFP4, offrant une qualité et une exactitude accrues sans pénalité de performance. Les deux modèles prennent en charge des longueurs de contexte allant jusqu’à 131 072, parmi les plus longues pour l’inférence locale. Leur architecture, basée sur un mélange de spécialistes, permet des capacités avancées de raisonnement et d’utilisation d’outils.

Cette semaine dans le RTX AI Garage, les passionnés d’IA et les développeurs peuvent découvrir comment démarrer avec les nouveaux modèles OpenAI sur les GPU NVIDIA :

Application Ollama : La solution la plus simple pour tester ces modèles est l’application Ollama, qui offre une interface utilisateur intégrant les modèles gpt-oss, entièrement optimisée pour les GPU RTX.
Llama.cpp : NVIDIA collabore avec la communauté open-source pour améliorer les performances sur les GPU RTX, avec des contributions récentes comme CUDA Graphs pour diminuer le surcoût. Les développeurs peuvent commencer sur le dépôt GitHub de Llama.cpp.
Microsoft AI Foundry : Les développeurs Windows peuvent accéder aux modèles via la préversion publique de Microsoft AI Foundry Local. Il suffit d’exécuter la commande Foundry model run gpt-oss-20b dans le terminal pour commencer.

NVIDIA NVIDIA GeForce