DeepSeek : Coûts de formation réels 400 fois plus élevés que les chiffres annoncés

La récente controverse autour des coûts de formation du modèle R1 de DeepSeek a secoué le marché. Les chiffres communiqués ont notamment été jugés trompeurs, alors que la réalité semble bien plus complexe et surprenante.

Les Coûts de Formation de DeepSeek : Une Montée en Puissance Technologique

Une analyse approfondie réalisée par la société de recherche SemiAnalysis remet en question l’idée que le modèle R1 de DeepSeek aurait des coûts de formation inférieurs à ceux d’autres acteurs majeurs du secteur, comme OpenAI. Au contraire, il semblerait que les ressources matérielles mobilisées soient non seulement nécessaires, mais également considérables.

Il a été initialement rapporté que DeepSeek avait dépensé environ 5 millions de dollars pour son modèle R1, un montant aligné sur celui d’autres services similaires. Cela a provoqué une certaine panique sur le marché américain. Avec le recul, les véritables investissements se révèlent être nettement plus élevés.

Fondamentalement, DeepSeek a émergé d’un projet subsidiaire du fonds d’investissement chinois High-Flyer. Selon le communiqué de SemiAnalysis, DeepSeek aurait acquis 10 000 unités des GPU A100 d’NVIDIA en 2021, période où les restrictions à l’exportation étaient moins strictes. Ce tournant a marqué le début de l’accumulation des ressources tests pour leur développement.

Coûts de formation de DeepSeek
Crédits Image : SemiAnalysis

Le rapport indique que DeepSeek possède environ 10 000 GPU H800, destinés au marché chinois, ainsi que 10 000 puces AI H100 haut de gamme. De plus, l’entreprise a investi dans des accélérateurs AI H20 d’NVIDIA. Ces ressources sont partagées entre DeepSeek et High-Flyer pour optimiser le trading, l’inférence, la formation, et la recherche.

Les chiffres avancés pour ces investissements se chiffrent à environ 1,6 milliard de dollars en dépenses d’investissement, avec des coûts opérationnels estimés à 944 millions de dollars. Cela montre que les coûts sont en réalité près de quatre cents fois supérieurs à ceux initialement perçus sur le marché.

À lire :  Starfield - Bethesda répond aux tests sur DLSS 5 et assure que la fonction sera optionnelle

Il est important de souligner que le chiffre de 5 millions de dollars ne représente qu’une partie spécifique des coûts de formation liés à l’exploitation du modèle final. Par ailleurs, DeepSeek a su tirer parti des talents locaux en organisant des événements de recrutement dans des universités réputées, avec des salaires souvent supérieurs à 1,3 million de dollars pour certains employés clés.

Les équipes derrière le modèle R1 de DeepSeek ont démontré leur capacité à développer des solutions performantes, en concurrence directe avec OpenAI. Cependant, les informations financières mal interprétées ont contribué, la semaine dernière, à un événement imprévu sur le marché.

Enfin, SemiAnalysis a mené des tests complets sur le modèle d’intelligence artificielle de DeepSeek, et il serait intéressant de consulter ces résultats pour obtenir des détails précieux sur les capacités réelles du modèle.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer