Des rumeurs sur le modèle AI DeepSeek R2 : coûts réduits de 97 % par rapport à GPT-4

Par Guillaume Meyer Le 26 Avr 2025 à 22 h 00

Il semblerait que la société chinoise DeepSeek s’apprête à lancer un nouveau modèle sur le marché, avec des détails émergents concernant leur modèle « DeepSeek R2 ».

DeepSeek R2 : Une Nouvelle Concurrence pour le Marché de l’IA

Le modèle R1 de DeepSeek a démontré au monde occidental que la Chine n’est pas en retard dans le développement de modèles avancés d’IA. La sortie de ce modèle a même provoqué une chute de la bourse américaine, perdant des milliards de dollars en évaluation. Cela prouve aussi que créer des modèles d’IA ne coûte pas autant que ce que des entreprises comme OpenAI ont laissé entendre.

🚨Viral rumors of DeepSeek R2 leaked!

—1.2T param, 78B active, hybrid MoE
—97.3% cheaper than GPT 4o (€0.07/M in, €0.27/M out)
—5.2PB training data. 89.7% on C-Eval2.0
—Better vision. 92.4% on COCO
—82% utilization in Huawei Ascend 910B

Big shift away from US supply chain. pic.twitter.com/Jncg0PvEYU

— Deedy (@deedydas) Avril 26, 2025

Il est important de souligner que ces informations doivent être prises avec précaution, car DeepSeek n’a pas encore confirmé les chiffres officiels de son prochain modèle. Selon les sources chinoises, le modèle R2 adopterait une architecture hybride MoE (Mixture of Experts), qui serait une version avancée de l’existant. Cela inclurait probablement des mécanismes de contrôle sophistiqués ou une combinaison de MoE et de couches denses pour optimiser les charges de travail intensives.

R2 pourrait rivaliser avec GPT-4 Turbo et Google Gemini 2.0 Pro, mais ce n’est pas tout. Le rapport indique également que les coûts par unité pour les tokens seraient inférieurs de 97,4 % à ceux de GPT-4, atteignant €0.07 par token d’entrée et €0.27 sortant. Par rapport aux tarifs d’OpenAI, le modèle R2 de DeepSeek est une aubaine pour les entreprises, ce qui pourrait marquer un tournant pour l’IA.

Un autre fait intéressant concernant le modèle DeepSeek R2 est qu’il atteindrait 82 % d’utilisation des clusters de puces Huawei Ascend 910B, avec une puissance de calcul mesurée à 512 PetaFLOPS en précision FP16. Cela montre que DeepSeek a choisi d’utiliser des ressources internes pour son prochain modèle grand public, consolidant ainsi sa chaîne d’approvisionnement en IA.

Il est important de souligner que les informations autour du DeepSeek R2 sont spéculatives et que le modèle final pourrait différer de ces prévisions. Cependant, les rapports en provenance de Chine laissent présager un nouveau développement surprenant pour les entreprises d’IA établies.