Maison Nouvelles L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

Auteur : Lucy Feb 21,2025

Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La société prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, un contraste frappant avec les coûts nettement plus élevés des concurrents. Cependant, ce chiffre est trompeur.

L'auto-introduction de Deepseek: "Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre", fait allusion aux capacités du modèle, qui ont provoqué une baisse majeure du cours de l'action de Nvidia. Le succès du modèle découle des technologies innovantes:

  • Prédiction multi-token (MTP): prédit plusieurs mots simultanément, augmentant la précision et l'efficacité.
  • Mélange d'experts (MOE): emploie 256 réseaux de neurones, activant huit pour chaque jeton, accélérant la formation et la performance.
  • Attention latente multi-tête (MLA): Extrait à plusieurs reprises les détails clés, minimisant la perte d'informations et améliorant la compréhension des nuances.

DeepSeek Test Image: esigame.com

Malgré la faible réclamation de coûts de formation, un rapport de semianalyse révèle une infrastructure substantielle de Deepseek: environ 50 000 GPU Nvidia Hopper (y compris les unités H800, H100 et H20) répartis sur plusieurs centres de données, coûtant environ 1,6 milliard de dollars. Les dépenses opérationnelles sont estimées à 944 millions de dollars.

DeepSeek V3 Image: esigame.com

Deepseek, une filiale de High Flyer, un fonds spéculatif chinois, possède ses centres de données, contrairement à des concurrents californiens. Cela offre un contrôle plus important et une innovation plus rapide. L'autofinancement de l'entreprise favorise l'agilité. Les salaires élevés (plus de 1,3 million de dollars par an pour certains chercheurs) attirent les meilleurs talents chinois, à l'exclusion des spécialistes étrangers.

DeepSeek Image: esigame.com

Le chiffre de 6 millions de dollars ne couvre que l'utilisation du GPU avant la formation, à l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement total total de l'IA de Deepseek dépasse 500 millions de dollars. Sa structure maigre facilite une innovation efficace.

DeepSeek Image: esigame.com

Le succès de Deepseek démontre une capacité de société d'IA indépendante bien financée à rivaliser avec les joueurs établis. Cependant, sa réclamation "adaptée au budget" est exagérée; Des milliards d'investissements, des percées techniques et une équipe solide sont des facteurs clés. Le contraste est Stark: le R1 de Deepseek coûte 5 millions de dollars, tandis que ChatGPT-4 coûte 100 millions de dollars, mettant en évidence la différence de coût significative. Malgré la réclamation gonflée, le coût de Deepseek reste sensiblement inférieur à ses concurrents.

Derniers articles