AMD lance le MI350P, son premier «Instinct» PCIe en quatre ans – GPU CDNA 4 avec 4,6 PFLOPs IA, 144 Go HBM3E à 600 W
AMD dévoile l’accélérateur GPU Instinct MI350P au format PCIe, premier du nom depuis longtemps et orienté vers les tâches d’intelligence artificielle. Cette solution double-slot s’intègre sans effort dans les serveurs refroidis par air, exploitant l’infrastructure existante des centres de données. Elle enrichit l’offre AMD pour les entreprises qui déploient l’IA sur site.
L’Instinct MI350P au format PCIe divise les puces MI350X pour 128 CU, 144 Go de HBM3E et 600 W
Grâce à l’Instinct MI350P au format PCIe, AMD propose aux professionnels une extension aisée de leurs capacités de calcul IA, sans recourir à des infrastructures coûteuses. Son design PCIe en fait une carte simple à installer, performante et adaptée aux serveurs en double-slot.
Conçues pour anticiper les besoins en IA agentique, les cartes PCIe AMD Instinct MI350P occupent deux slots et s’insèrent dans les serveurs standards à refroidissement aérien. Elles déploient l’inférence sur site au sein de l’infrastructure électrique, de refroidissement et de racks actuels des centres de données. Les GPU AMD en format PCIe économique complètent le portefeuille de calcul IA d’AMD, avec des choix variés pour les entreprises en phase d’adoption IA.


Voici les principaux atouts de l’Instinct MI350P au format PCIe :
- Support natif des précisions MXFP6 et MXFP4 pour un débit élevé.
- Accélération via la sparsité pour les précisions 8 et 16 bits courantes.
- Environ 2 299 TFLOPS, jusqu’à 4 600 TFLOPS en pic à MXFP4, record pour une carte PCIe professionnelle.
- 144 Go de mémoire HBM3E à bande passante allant jusqu’à 4 To/s.
- Écosystème ouvert avec outils de développement gratuits ou low-cost pour simplifier le déploiement et réduire les frais d’exploitation.
Sur le plan technique, l’AMD Instinct MI350P repose sur l’architecture CDNA 4, gravé en 3 nm chez TSMC en configuration 4 XCD, soit la moitié de la MI350X. Il intègre un die IO unique en 6 nm FinFET. Le GPU compte 128 unités de calcul, soit 8 192 processeurs de flux et 512 cœurs matricielles. Ces cœurs atteignent 2 200 MHz en pic. La puce totalise 73 milliards de transistors.

Côté mémoire, l’Instinct MI350P embarque 128 Mo de LLC sous forme d’Infinity Cache dans le GPU, plus 144 Go de HBM3E rapide sur bus 4096 bits, pour 4 To/s de bande passante. La MI350X offre pour sa part 288 Go de HBM3E sur bus 8192 bits. La carte PCIe mesure 267 mm de long avec refroidissement passif, adapté aux serveurs. AMD emploie un connecteur 16 broches pour les 600 W de TBP, configurable jusqu’à 450 W.
En performances, l’AMD Instinct MI350P délivre :
- 4,6 PFLOPS en MXFP4
- 4,6 PFLOPS en MXFP6
- 2,3 PFLOPS en MXFP8
- 2,3 PFLOPS en FP16 (sparsité)
- 1,15 PFLOPS en FP16
- 72 TFLOPS en FP16
- 72 TFLOPS en FP32
- 36 TFLOPS en FP64
- 2,3 POPs en INT8
- 4,6 POPs en INT8 (sparsité)
- 1,15 PFLOPS en BFloat16
- 2,3 PFLOPS en BFloat16 (sparsité)
La série AMD Instinct MI350, y compris la MI350P, accélère nativement divers formats de précision IA professionnelle comme MXFP6 et MXFP4.

La MI350P rivalise avec la H200 NVL de NVIDIA, dernier accélérateur PCIe avec 141 Go de HBM3E sur GPU Hopper H200. NVIDIA sort la RTX PRO 6000 Blackwell pour serveurs, basée sur GB202 et non GB200, avec 96 Go de GDDR7. Les H200 NVL se vendent autour de 30 000 à 40 000 €.
Les GPU AMD Instinct MI350P au format PCIe sont disponibles chez divers partenaires, avec un écosystème ouvert et un stack logiciel IA prêt pour l’entreprise, compatible ROCm.



