NVIDIA Présente Vera Rubin Avec Groq’s LPX Pour Entrer Dans le Marché de l’Inference

NVIDIA formalise son partenariat avec Groq, notamment avec le lancement d’un plateau de calcul hybride intégrant les unités LPU de troisième génération de Groq dans un rack Rubin.

NVIDIA et Groq : Viser les Charges de Travail à Haute Vitesse

Les attentes autour des intentions de NVIDIA avec Groq persistent depuis un certain temps. Lors du GTC 2026, NVIDIA a présenté le nouveau plateau hybride d вычисления Vera Rubin, le Groq 3 LPX, intégrant huit unités Groq3 encore non annoncées. D’après NVIDIA, ce partenariat fournit des performances d’inférence sans précédent, avec une augmentation de 35 fois le débit d’inférence par mégawatt, positionnant Groq comme clé d’accès au marché de l’inférence.

Ce plateau individuel de calcul repose sur 256 unités LPU, offrant 128 Go de SRAM intégrée et 640 To/s de bande passante. Cette réponse de NVIDIA aux avancées de Cerebras dans le domaine de l’inférence combine les GPU Rubin avec les LPU, ciblant les étapes de préremplissage et de décodage de l’inférence, renforçant ainsi sa compétitivité.

Pour chaque puce Groq3, on dispose de 500 Mo de SRAM et d’une bande passante de 150 To/s, avec 1,2 PFLOPs (FP8). Avec l’association des système Rubin et du plateau LPX de Groq, NVIDIA revendique un total atteignant 315 PFLOPs dédiée à l’inférence IA.

Conçu pour des modèles à un trillion de paramètres et un contexte d’un million de tokens, l’architecture LPX co-conçue avec Vera Rubin maximise l’efficacité en termes de puissance, mémoire et calcul. L’augmentation du débit par watt et la performance par token ouvrent de nouvelles opportunités de revenus pour les fournisseurs d’IA.

Avec des unités LPU jouant un rôle comparable à celui de Mellanox pour les réseaux, cette architecture hybride donne un avantage à NVIDIA sur les charges de travail sensibles à la latence. L’essor de l’IA agentique impose à NVIDIA de répondre aux exigences croissantes en matière de calcul, rendant ce partenariat avec Groq décisif pour l’entreprise.

À lire :  Marathon - Préparez-vous à affronter la menace UESC dès le lancement du jeu

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer