Zyphra et AMD lancent une nouvelle plateforme IA open alimentée par 15 MW de GPU MI355X, extension prévue vers MI450 et au-delà
Zyphra collabore avec AMD pour lancer une plateforme IA open-source installée aux États-Unis, concurrente directe de DeepSeek. Cette infrastructure repose sur des milliers de GPU MI355X fournis par TensorWave, avec 15 MW de puissance de calcul. Elle cible les performances d’inférence rapides pour les modèles avancés et prépare des extensions vers l’apprentissage par renforcement.
Zyphra Cloud : le DeepSeek américain propulsé par une infrastructure AMD complète avec 15 MW de calcul via MI355X et extension aux futurs GPU
La plateforme Zyphra AI Cloud optimise l’inférence pour les modèles open-weight de pointe comme DeepSeek V3.2, Kimi K2.6 et GLM 5.1. Elle intègre des kernels sur mesure, des algorithmes d’inférence à contexte étendu innovants et des méthodes de parallélisme sophistiquées afin d’assurer un débit élevé avec une faible latence en IA. Ce service convient parfaitement aux agents autonomes, à la recherche intensive et aux processus à horizon lointain.
La plateforme Cloud de Zyphra exploite l’infrastructure de TensorWave, équipée de milliers d’accélérateurs IA Instinct AMD. Elle mobilise 15 MW de calcul grâce à l’installation MI355X de TensorWave et pourra s’étendre à des GPU futurs comme le MI450 et au-delà.

Cette plateforme ne se limite pas aux tâches d’inférence : Zyphra prévoit d’élargir ses fonctions vers une offre intégrée incluant l’apprentissage par renforcement et le fine-tuning. Ces ajouts reposeront sur les derniers CPU EPYC d’AMD, avec accès à des clusters GPU dédiés.
« TensorWave fournit aux entreprises IA natives comme Zyphra la puissance AMD dédiée et performante sans concessions », déclare Jeff Tatarchuk, cofondateur et directeur du développement de TensorWave. « Alimenter l’inférence Zyphra avec notre infrastructure MI355X correspond précisément au type de partenariat pour lequel nous avons créé TensorWave : permettre aux équipes de déployer de l’IA prête pour la production sur les derniers accélérateurs AMD à grande échelle. »
TensorWave avait annoncé en 2024 son projet de construire l’un des plus grands clusters GPU AMD au monde d’ici 2025, intégrant les GPU MI300X, MI325X et MI350X. Cette installation promettait plusieurs gigawatts de capacité de calcul. Désormais, des entreprises IA comme Zyphra exploitent pleinement cette puissance pour les workflows d’agents IA destinés à leurs clients.
L’entreprise a déjà présenté trois modèles : ZAYA1-8B pour le raisonnement, ZAYA1-74B, un modèle MoE jusqu’à 74 milliards de paramètres, et ZAYA1-VL, son premier modèle vision-langage. Ces outils complètent les services d’inférence cloud proposés.
La plateforme IA Zyphra Cloud est accessible dès maintenant. Rendez-vous sur le site principal pour plus de détails et souscrire aux services cloud.



