Les coûts de l’IA de DeepSeek dépassent largement les 5,5 millions €, atteignant peut-être 1,6 milliard € avec 50 000 GPU NVIDIA

La récente annonce de DeepSeek, avec son modèle R1 révolutionnaire, a bouleversé l’industrie de l’IA, provoquant une chute historique des actions de NVIDIA. Cependant, une enquête révèle que les coûts réels associés à cette prouesse seraient bien supérieurs aux montants avancés, remettant en question l’ascension fulgurante de cette start-up chinoise.

En résumé : La société DeepSeek de Chine a récemment plongé l’industrie de l’IA, valant plusieurs milliards d’euros, dans le chaos avec le lancement de son modèle R1, qui serait en mesure de rivaliser avec l’o1 d’OpenAI. Ce modèle aurait été entraîné sur 2 048 NVIDIA H800 pour un coût prétendu d’5,576 millions €. Néanmoins, un nouveau rapport dévoile que les réelles dépenses de l’entreprise s’élèveraient à 1,6 milliard € et que DeepSeek aurait accès à environ 50 000 GPU Hopper.

La prétention que DeepSeek a pu entraîner son modèle R1 avec une fraction des ressources nécessaires aux grandes entreprises technologiques a provoqué une chute record de 600 milliards € de la valorisation de NVIDIA en une seule journée. Si cette start-up chinoise pouvait créer un modèle aussi puissant sans débourser des milliards pour les GPU IA les plus performants de Team Green, qu’est-ce qui empêcherait les autres de faire de même ?

Cependant, DeepSeek a-t-elle vraiment conçu son modèle Mixture-of-Experts, qui domine les charts de l’App Store d’Apple, à si faible coût ? SemiAnalysis remet cela en question.

La société d’intelligence de marché indique que DeepSeek a accès à environ 50 000 GPU Hopper, dont 10 000 H800 et 10 000 H100. Elle a également des commandes pour de nombreux H20 réservés à la Chine. Les GPU sont partagés entre High-Flyer, le fonds spéculatif quantitatif derrière DeepSeek, et la start-up elle-même. Ils sont répartis sur plusieurs sites géographiques et utilisés pour le trading, l’inférence, la formation et la recherche.

À lire :  The Legend of California - Jeff Kaplan dévoile son nouveau jeu pour 2026 après son départ de Blizzard

SemiAnalysis affirme que DeepSeek a investi bien plus que les 5,5 millions € annoncés qui ont secoué le marché – le rapport révèle que ce coût d’entraînement est une très petite partie du total. L’investissement total de l’entreprise dans les serveurs s’élève à environ 1,6 milliard €, avec près de 944 millions € consacrés aux coûts d’exploitation. Les investissements en GPU, quant à eux, représentent plus de 500 millions €.

À titre d’exemple, le Claude 3.5 Sonnet d’Anthropic a coûté des dizaines de millions d’euros à entraîner, mais l’entreprise a tout de même dû lever des milliards d’euros d’investissements auprès de Google et d’Amazon.

Il est à noter que DeepSeek a recruté l’ensemble de son personnel exclusivement en Chine. Cela contraste avec les rapports d’autres entreprises technologiques chinoises, comme Huawei, essayant de débaucher des travailleurs à l’étranger, avec des employés taïwanais de TSMC étant des cibles particulièrement convoitées. On rapporte que DeepSeek proposerait des salaires de plus de 1,3 million € pour des candidats prometteurs, bien plus que ce que paient les autres entreprises chinoises d’IA.

DeepSeek bénéficie également de l’avantage de faire fonctionner majoritairement ses propres centres de données, plutôt que de dépendre de fournisseurs de cloud externes. Cela lui permet de favoriser l’expérimentation et l’innovation dans sa gamme de produits d’IA. SemiAnalysis souligne qu’elle est aujourd’hui le meilleur laboratoire de « poids ouverts », surpassant les efforts de Meta avec Llama, Mistral et d’autres.

Guide Optimisation Pc Windows 11 Jeux Performance Bot Guide Optimisations Pc Windows 10 Jeux Performances Sur Omgpu.com Bot

Guide Comment Reduire Input Lag Latence Omgpu Bot Comment supprimer Coil Whine carte graphique

Vous pourriez aussi aimer