Des rumeurs sur le modèle AI DeepSeek R2 : coûts réduits de 97 % par rapport à GPT-4

Il semblerait que la société chinoise DeepSeek s’apprête à lancer un nouveau modèle sur le marché, avec des détails émergents concernant leur modèle « DeepSeek R2 ».

DeepSeek R2 : Une Nouvelle Concurrence pour le Marché de l’IA

Le modèle R1 de DeepSeek a démontré au monde occidental que la Chine n’est pas en retard dans le développement de modèles avancés d’IA. La sortie de ce modèle a même provoqué une chute de la bourse américaine, perdant des milliards de dollars en évaluation. Cela prouve aussi que créer des modèles d’IA ne coûte pas autant que ce que des entreprises comme OpenAI ont laissé entendre.

Il est important de souligner que ces informations doivent être prises avec précaution, car DeepSeek n’a pas encore confirmé les chiffres officiels de son prochain modèle. Selon les sources chinoises, le modèle R2 adopterait une architecture hybride MoE (Mixture of Experts), qui serait une version avancée de l’existant. Cela inclurait probablement des mécanismes de contrôle sophistiqués ou une combinaison de MoE et de couches denses pour optimiser les charges de travail intensives.

R2 pourrait rivaliser avec GPT-4 Turbo et Google Gemini 2.0 Pro, mais ce n’est pas tout. Le rapport indique également que les coûts par unité pour les tokens seraient inférieurs de 97,4 % à ceux de GPT-4, atteignant €0.07 par token d’entrée et €0.27 sortant. Par rapport aux tarifs d’OpenAI, le modèle R2 de DeepSeek est une aubaine pour les entreprises, ce qui pourrait marquer un tournant pour l’IA.

À lire :  GeForce NOW - CONTROL Resonant et Samson: A Tyndalston Story disponibles dès leur sortie

Un autre fait intéressant concernant le modèle DeepSeek R2 est qu’il atteindrait 82 % d’utilisation des clusters de puces Huawei Ascend 910B, avec une puissance de calcul mesurée à 512 PetaFLOPS en précision FP16. Cela montre que DeepSeek a choisi d’utiliser des ressources internes pour son prochain modèle grand public, consolidant ainsi sa chaîne d’approvisionnement en IA.

Il est important de souligner que les informations autour du DeepSeek R2 sont spéculatives et que le modèle final pourrait différer de ces prévisions. Cependant, les rapports en provenance de Chine laissent présager un nouveau développement surprenant pour les entreprises d’IA établies.


Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer