MTIA dévoile quatre puces AI en deux ans, défiant les attentes sur les efforts de puces custom

Par Guillaume Meyer Le 13 Mar 2026 à 07 h 24

Meta continue à développer son propre silicium, montrant un engagement renforcé dans ses efforts ASIC pour améliorer les performances en matière d’inférence.

Quatre nouvelles puces d’ici 2026

Face à une demande croissante en calcul, Meta prévoit de déployer quatre nouvelles puces de la famille MTIA dans les deux prochaines années, chacune étant dédiée à des charges de travail spécifiques, allant de l’entraînement à l’inférence GenAI. La MTIA 300 se concentre sur le classement et les recommandations, avec un réseau qui fonctionne à 200 Go/s.

La MTIA 400 offre une performance 400 % supérieure en FP8 FLOPS et 51 % plus de bande passante HBM par rapport à la génération précédente. Cette série de puces est conçue pour être installée rapidement, montrant la satisfaction de Meta quant à leur performance compétitive.

Caractéristiques techniques

La MTIA 450 et la MTIA 500 se concentrent sur la capacité HBM et la bande passante pour répondre à une demande d’inférence accrue. Le tableau ci-dessous résume les caractéristiques des différentes versions :

Métrique	MTIA 300	MTIA 400	MTIA 450	MTIA 500
Charge de travail	R&R Entraînement	Général	Inférence GenAI	Inférence GenAI
TDP des modules	800 W	1200 W	1400 W	1700 W
Bande passante HBM	6,1 To/s	9,2 To/s	18,4 To/s	27,6 To/s
Capacité HBM	216 Go	288 Go	288 Go	384-512 Go
Performance MX4	—	12 PFLOPs	21 PFLOPs	30 PFLOPs
Performance FP8/MX8	1,2 PFLOPs	6 PFLOPs	7 PFLOPs	10 PFLOPs
Performance BF16	0,6 PFLOPs	3 PFLOPs	3,5 PFLOPs	5 PFLOPs
Domain de montée en charge	16	72	72	72
Réseau de montée en charge (bande passante unidirectionnelle)	1 To/s	1,2 To/s	1,2 To/s	1,2 To/s
Réseau de montée en charge (bande passante unidirectionnelle)	200 Go/s	100 Go/s	100 Go/s	100 Go/s

Meta vise à rivaliser avec les options « commercialement disponibles » en maintenant une cadence de produit rapide pour répondre aux besoins évolutifs. Avec la MTIA 450 et MTIA 500, Meta s’Oriente vers une approche centrée sur l’inférence, se détachant des solutions GPU standards.

Malgré des rumeurs de réduction de ses efforts en silicium personnalisé, Meta semble déterminé à poursuivre cette voie, en déployant ces nouvelles générations d’ici 2026 ou 2027 et abordant ainsi le bottleneck (goulot d’étranglement) en calcul.