AMD écrase Intel Lunar Lake avec 27% de performance en applications LLM grâce à Ryzen AI

Par Guillaume Meyer Le 1 Nov 2024 à 14 h 01

Les unités de traitement accéléré (APU) Strix Point d’AMD démontrent un avantage significatif dans le domaine des applications d’IA, en particulier pour les modèles de langage de grande taille (LLM), par rapport aux solutions proposées par Intel, notamment les puces Lunar Lake. Cette tendance souligne l’importance croissante de l’optimisation des processeurs pour les charges de travail liées à l’intelligence artificielle dans le secteur technologique.

Performance des APU Strix Point d’AMD dans les applications d’IA

Face à la demande croissante en matière de performances pour les logiciels d’intelligence artificielle, AMD a récemment lancé ses processeurs Strix Point, destinés principalement aux plateformes mobiles. Selon les informations diffusées par l’entreprise, les APU Strix Point affichent une performance accrue tout en réduisant la latence, offrant ainsi des résultats plus rapides que ceux des puces Intel dédiées.

Les processeurs Ryzen AI 300 d’AMD se distinguent par leur efficacité dans l’exécution des tâches liées aux LLM. Des tests montrent que ces processeurs peuvent fournir des résultats avec un nombre de tokens par seconde supérieur à celui des puces Lunar Lake d’Intel, destinées à traiter les charges de travail en IA. Cette avancée représente une amélioration notable dans la compétition entre les deux géants technologiques.

Lors d’une étude comparative, l’APU Ryzen AI 9 HX 375 a obtenu des résultats révélateurs, affichant jusqu’à 27% de performance en plus dans les applications de consommation de LLM via LM Studio par rapport à l’Intel Core Ultra 7 258V. Bien que ce dernier ne soit pas le modèle le plus performant de la série Lunar Lake, il reste l’un des plus compétitifs.

Optimisation des performances et réduction de la latence

Concernant la latence, l’APU Ryzen AI 9 HX 375 surpasse ses concurrents avec un taux jusqu’à 3,5 fois inférieur et atteint des performances de 50,7 tk/s contre 39,9 tk/s pour le Core Ultra 7 258V dans le cadre de l’application Meta Llama 3.2 1b Instruct. Cette réduction remarquable de la latence est essentielle pour des applications nécessitant des réponses rapides.

Avec des graphismes intégrés puissants, les deux séries de processeurs – Intel et AMD – permettent à l’outil LM Studio d’optimiser les performances des LLM en déléguant certaines tâches à l’iGPU. Les APU Strix Point, dotés des graphismes Radeon basés sur l’architecture RDNA 3.5, peuvent offrir un gain de performance de 31% pour Llama 3.2.

De plus, l’utilisation de la mémoire graphique variable (VGM) dans les processeurs Ryzen AI permet une réallocation efficace de la mémoire pour les tâches orientées iGPU. Cela améliore l’efficacité énergétique et génère une performance combinée augmentée de 60% grâce à l’accélération GPU.

Comparaisons justes et expansion des capacités IA

AMD a réalisé des tests équitables en utilisant des paramètres identiques dans le cadre de l’Intel AI Playground. Les résultats montrent que le Ryzen AI 9 HX 375 est 8,7% plus rapide que le Core Ultra 7 258V sur Microsoft Phi 3.1, et jusqu’à 13% plus rapide sur le modèle Mistral 7b Instruct 0.3. Ces résultats mettent en évidence l’écart de performance qui pourrait être encore plus marqué contre des modèles plus avancés chez Intel.

À l’heure actuelle, l’objectif d’AMD est de rendre les LLM accessibles au grand public, y compris à ceux qui ne possèdent pas de compétences techniques. Avec des outils comme le LM Studio basé sur le framework llama.cpp, l’entreprise se positionne pour démocratiser l’usage des modèles d’IA, offrant ainsi des possibilités étendues d’application dans divers secteurs.