AMD prépare déjà le terrain pour sa prochaine série d’accélérateurs Instinct MI400, prévue pour 2026, en dévoilant des caractéristiques impressionnantes. Cette nouvelle gamme vise à améliorer considérablement les performances par rapport à la série MI350 récemment lancée.
Avancées de l’AMD Instinct MI400 : Performances Multiplier
Les nouveaux accélérateurs MI400 promettent une capacité de calcul doublée. Les caractéristiques officielles prévoient 40 PFLOP pour le FP4 et 20 PFLOP pour le FP8, témoignant d’un bond significatif par rapport aux performances des MI350.

Les améliorations ne s’arrêtent pas là. La mémoire HBM4 sera intégrée, offrant une capacité de 432 Go, soit 50 % de plus que la HBM3e. Avec un incroyable débit de 19,6 To/s, cette nouvelle norme bouscule les limites précédentes tout en offrant un débit de 300 Go/s par GPU.

Chaque MI400 comportera jusqu’à quatre XCD (Accelerated Compute Dies) et deux AID (Active Interposer Dies), ce qui permet une communication plus efficace avec les unités de calcul. Les nouvelles die dédiées au I/O et au Multimédia apportent aussi leur lot d’optimisations.
En somme, cette proposition de génération d’accélérateurs est soigneusement conçue pour répondre aux besoins des tâches d’entraînement et d’inférence en intelligence artificielle à grande échelle. L’architecture CDNA-Next pourrait même subir un rebranding sous le nom de UDNA, unifiant les stratégies des architectures RDNA et CDNA.

Caractéristiques des Accélérateurs AI d’AMD Instinct
| Nom de l’Accélérateur | MI500 | MI400 | MI350X | MI325X | MI300 | MI250X |
|---|---|---|---|---|---|---|
| architecture GPU | CDNA Next / UDNA | CDNA Next / UDNA | CDNA 4 | Aqua Vanjaram (CDNA 3) | Aqua Vanjaram (CDNA 3) | Aldebaran (CDNA 2) |
| Process Node GPU | TBD | TBD | 3nm | 5nm+6nm | 5nm+6nm | 6nm |
| XCD (Chiplets) | TBD | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (Par Die) |
| Cœurs GPU | TBD | TBD | 16,384 | 19,456 | 19,456 | 14,080 |
| Vitesse d’Horloge GPU | TBD | TBD | TBD | 2100 MHz | 2100 MHz | 1700 MHz |
| Calcul INT8 | TBD | TBD | 5200 TOPS | 2614 TOPS | 2614 TOPS | 383 TOPs |
| Calcul FP6/FP4 | TBD | 40 PFLOPs | 20 PFLOPs | N/A | N/A | N/A |
| Calcul FP8 | TBD | 20 PFLOPs | 10 PFLOPs | 2.6 PFLOPs | 2.6 PFLOPs | N/A |
| Calcul FP16 | TBD | 10 PFLOPs | 5 PFLOPs | 1.3 PFLOPs | 1.3 PFLOPs | 383 TFLOPs |
| Calcul FP32 | TBD | TBD | 157.3 TFLOPs | 163.4 TFLOPs | 163.4 TFLOPs | 95.7 TFLOPs |
| Calcul FP64 | TBD | TBD | 79 TFLOPs | 81.7 TFLOPs | 81.7 TFLOPs | 47.9 TFLOPs |
| VRAM | TBD | 432 Go HBM4 | 288 Go HBM3e | 256 Go HBM3e | 192 Go HBM3 | 128 Go HBM2e |
| Cache Infinity | TBD | TBD | 256 Mo | 256 Mo | 256 Mo | N/A |
| Horloge de Mémoire | TBD | 19.6 To/s | 8.0 Gbps | 5.9 Gbps | 5.2 Gbps | 3.2 Gbps |
| Bus de Mémoire | TBD | TBD | 8192 bits | 8192 bits | 8192 bits | 8192 bits |
| Largeur de Bande Mémoire | TBD | TBD | 8 To/s | 6.0 To/s | 5.3 To/s | 3.2 To/s |
| Forme | TBD | TBD | OAM | OAM | OAM | OAM |
| Refroidissement | TBD | TBD | Refroidissement Passif | Refroidissement Passif | Refroidissement Passif | Refroidissement Passif |
| TDP (Max) | TBD | TBD | 1400W (355X) | 1000W | 750W | 560W |



