NVIDIA présente le LLM « Llama-3.1-Nemotron-70B », surpassant GPT-4o en benchmarks AI

Par Guillaume Meyer Mis à jour le 18 Oct 2024 à 20 h 36

NVIDIA a récemment annoncé une avancée significative avec son nouveau modèle de langage, le Llama-3.1-Nemotron-70B-Instruct. Ce modèle repousse les limites des technologies d’intelligence artificielle, se positionnant comme une alternative sérieuse aux modèles de pointe tels que GPT-4o d’OpenAI et Claude 3.5 d’Anthropic.

La Stratégie d’Innovation d’NVIDIA dans l’IA

Avec cette nouvelle version, l’équipe de NVIDIA cherche à affiner les réponses de l’IA en les rendant plus pertinentes et alignées avec les attentes humaines. En se concentrant sur une correction factuelle et une résolution de problèmes cohérente, le modèle promet d’offrir des résultats nettement améliorés par rapport aux modèles antérieurs.

En se basant sur la structure de Llama-3.1-70B-Instruction Base de Meta, qui intègre un total de 70 milliards de paramètres, NVIDIA a peaufiné son modèle pour se concentrer sur un aspect spécifique, le SteerLM Regression Reward Modelling. Cette approche vise à optimiser le processus d’apprentissage de l’IA.

Des Performances Remarquables et des Innovations Technologiques

Le SteerLM Regression Reward Modelling implique l’utilisation de modèles de régression pour définir une fonction de récompense qui guide le processus d’apprentissage de l’IA. Cela permet d’affiner la qualité des données, contribuant à des réponses plus précises aux exigences des utilisateurs.

Un aspect fascinant de ce modèle est sa capacité à résoudre des problèmes qui étaient difficiles pour d’autres LLM, comme le fameux problème des « R » dans le mot « strawberry ». Ce succès témoigne des avancées que NVIDIA a réalisées dans le domaine des modèles de langage.

Modèle	Arena Hard	AlpacaEval	MT-Bench	Longueur Moyenne des Réponses
Détails	(95% CI)	2 LC (SE)	(GPT-4-Turbo)	(# de Caractères pour MT-Bench)
Llama-3.1-Nemotron-70B-Instruct	85.0 (-1.5, 1.5)	57.6 (1.65)	8.98	2199.8
Llama-3.1-70B-Instruct	55.7 (-2.9, 2.7)	38.1 (0.90)	8.22	1728.6
Llama-3.1-405B-Instruct	69.3 (-2.4, 2.2)	39.3 (1.43)	8.49	1664.7
Claude-3-5-Sonnet-20240620	79.2 (-1.9, 1.7)	52.4 (1.47)	8.81	1619.9
GPT-4o-2024-05-13	79.3 (-2.1, 2.0)	57.5 (1.47)	8.74	1752.2

Il est notable que le Llama-3.1-Nemotron-70B-Instruct a dépassé plusieurs modèles populaires, y compris le GPT-4o. Bien que des évaluations plus approfondies soient encore nécessaires pour différents cas d’application, ces résultats initiaux témoignent des capacités impressionnantes de ce modèle NVIDIA.

Pour les utilisateurs intéressés, le modèle est accessible sur la plateforme NIM de NVIDIA ou via HuggingFace. Avec cette innovation, NVIDIA continue de s’affirmer dans l’industrie de l’IA, se plaçant au cœur de l’évolution technologique.

NVIDIA