Intel a récemment lancé le premier logiciel important pour sa solution Arc Pro « Project Battlematrix », avec la version 1.0 de LLM Scaler, apportant d’importantes améliorations.
Mise à jour majeure pour les GPU Intel Arc Pro avec LLM Scaler 1.0
Lors de l’événement Computex 2025, Intel a présenté le projet Battlematrix, associé à ses GPU Arc Pro. Cette initiative vise à offrir une solution unique pour les plateformes de stations de travail dédiées à l’inférence, utilisant plusieurs GPU Arc Pro. La société avait promis une première mise en conteneur, ainsi qu’un support de télémétrie de base dans son calendrier, enfin réalisée avec LLM Scaler v1.0.

Voici la liste complète des fonctionnalités et optimisations intégrées dans ce conteneur LLM Scaler 1.0 :
- vLLM:
- Optimisation des performances pour les longueurs d’entrée longues (>4K), jusqu’à 1,8x de performance pour une séquence de 40K sur un modèle 32B KPI, et 4,2x pour un modèle 70B KPI.
- Améliorations de la performance d’environ 10 % pour les modèles KPI de 8B à 32B par rapport aux versions précédentes.
- Quantification en ligne par couche pour réduire la mémoire GPU requise.
- Support du parallélisme en pipeline dans vLLM (expérimental).
- Compilation avec torch (expérimental).
- Décodage spéculatif (expérimental).
- Support pour les modèles de réévaluation d’intégration.
- Amélioration du support des modèles multi-modaux.
- Détection automatique de la longueur maximale.
- Support du parallélisme de données.
- Activation de l’outil de benchmark OneCCL
- XPU Manager:
- Gestion de l’énergie GPU.
- Mise à jour du firmware GPU.
- Diagnostic GPU.
- Largeur de bande mémoire GPU.
Intel indique que cette nouvelle suite logicielle est conçue pour être conviviale et respecter les normes de l’industrie. Ce conteneur, optimisé pour Linux, vise à atteindre jusqu’à 80 % d’amélioration des performances grâce à l’évolutivité multi-GPU et aux transferts de données PCIe P2P. De plus, il offre des fonctionnalités de fiabilité et de gestion de qualité professionnelle comme ECC, SRIOV, télémétrie et mises à jour à distance du firmware.


Selon le calendrier précédent, cette mise à jour sera suivie d’une édition plus robuste du conteneur au même trimestre, offrant de meilleures performances et le service vLLM. Enfin, au cours du quatrième trimestre, Intel proposera un ensemble complet de fonctionnalités.



