MTIA dévoile quatre puces AI en deux ans, défiant les attentes sur les efforts de puces custom

Meta continue à développer son propre silicium, montrant un engagement renforcé dans ses efforts ASIC pour améliorer les performances en matière d’inférence.

Quatre nouvelles puces d’ici 2026

Face à une demande croissante en calcul, Meta prévoit de déployer quatre nouvelles puces de la famille MTIA dans les deux prochaines années, chacune étant dédiée à des charges de travail spécifiques, allant de l’entraînement à l’inférence GenAI. La MTIA 300 se concentre sur le classement et les recommandations, avec un réseau qui fonctionne à 200 Go/s.

La MTIA 400 offre une performance 400 % supérieure en FP8 FLOPS et 51 % plus de bande passante HBM par rapport à la génération précédente. Cette série de puces est conçue pour être installée rapidement, montrant la satisfaction de Meta quant à leur performance compétitive.

Caractéristiques techniques

La MTIA 450 et la MTIA 500 se concentrent sur la capacité HBM et la bande passante pour répondre à une demande d’inférence accrue. Le tableau ci-dessous résume les caractéristiques des différentes versions :

Métrique MTIA 300 MTIA 400 MTIA 450 MTIA 500
Charge de travail R&R Entraînement Général Inférence GenAI Inférence GenAI
TDP des modules 800 W 1200 W 1400 W 1700 W
Bande passante HBM 6,1 To/s 9,2 To/s 18,4 To/s 27,6 To/s
Capacité HBM 216 Go 288 Go 288 Go 384-512 Go
Performance MX4 12 PFLOPs 21 PFLOPs 30 PFLOPs
Performance FP8/MX8 1,2 PFLOPs 6 PFLOPs 7 PFLOPs 10 PFLOPs
Performance BF16 0,6 PFLOPs 3 PFLOPs 3,5 PFLOPs 5 PFLOPs
Domain de montée en charge 16 72 72 72
Réseau de montée en charge (bande passante unidirectionnelle) 1 To/s 1,2 To/s 1,2 To/s 1,2 To/s
Réseau de montée en charge (bande passante unidirectionnelle) 200 Go/s 100 Go/s 100 Go/s 100 Go/s

Meta vise à rivaliser avec les options « commercialement disponibles » en maintenant une cadence de produit rapide pour répondre aux besoins évolutifs. Avec la MTIA 450 et MTIA 500, Meta s’Oriente vers une approche centrée sur l’inférence, se détachant des solutions GPU standards.

À lire :  Project Helix - Confirmation de l'approche hybride pour les consoles Xbox et PC en 2028

Malgré des rumeurs de réduction de ses efforts en silicium personnalisé, Meta semble déterminé à poursuivre cette voie, en déployant ces nouvelles générations d’ici 2026 ou 2027 et abordant ainsi le bottleneck (goulot d’étranglement) en calcul.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer