Meta continue à développer son propre silicium, montrant un engagement renforcé dans ses efforts ASIC pour améliorer les performances en matière d’inférence.
Quatre nouvelles puces d’ici 2026
Face à une demande croissante en calcul, Meta prévoit de déployer quatre nouvelles puces de la famille MTIA dans les deux prochaines années, chacune étant dédiée à des charges de travail spécifiques, allant de l’entraînement à l’inférence GenAI. La MTIA 300 se concentre sur le classement et les recommandations, avec un réseau qui fonctionne à 200 Go/s.
La MTIA 400 offre une performance 400 % supérieure en FP8 FLOPS et 51 % plus de bande passante HBM par rapport à la génération précédente. Cette série de puces est conçue pour être installée rapidement, montrant la satisfaction de Meta quant à leur performance compétitive.
Caractéristiques techniques
La MTIA 450 et la MTIA 500 se concentrent sur la capacité HBM et la bande passante pour répondre à une demande d’inférence accrue. Le tableau ci-dessous résume les caractéristiques des différentes versions :
| Métrique | MTIA 300 | MTIA 400 | MTIA 450 | MTIA 500 |
| Charge de travail | R&R Entraînement | Général | Inférence GenAI | Inférence GenAI |
| TDP des modules | 800 W | 1200 W | 1400 W | 1700 W |
| Bande passante HBM | 6,1 To/s | 9,2 To/s | 18,4 To/s | 27,6 To/s |
| Capacité HBM | 216 Go | 288 Go | 288 Go | 384-512 Go |
| Performance MX4 | — | 12 PFLOPs | 21 PFLOPs | 30 PFLOPs |
| Performance FP8/MX8 | 1,2 PFLOPs | 6 PFLOPs | 7 PFLOPs | 10 PFLOPs |
| Performance BF16 | 0,6 PFLOPs | 3 PFLOPs | 3,5 PFLOPs | 5 PFLOPs |
| Domain de montée en charge | 16 | 72 | 72 | 72 |
| Réseau de montée en charge (bande passante unidirectionnelle) | 1 To/s | 1,2 To/s | 1,2 To/s | 1,2 To/s |
| Réseau de montée en charge (bande passante unidirectionnelle) | 200 Go/s | 100 Go/s | 100 Go/s | 100 Go/s |
Meta vise à rivaliser avec les options « commercialement disponibles » en maintenant une cadence de produit rapide pour répondre aux besoins évolutifs. Avec la MTIA 450 et MTIA 500, Meta s’Oriente vers une approche centrée sur l’inférence, se détachant des solutions GPU standards.
Malgré des rumeurs de réduction de ses efforts en silicium personnalisé, Meta semble déterminé à poursuivre cette voie, en déployant ces nouvelles générations d’ici 2026 ou 2027 et abordant ainsi le bottleneck (goulot d’étranglement) en calcul.



