首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Lucy Feb 21,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。该公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这与竞争对手的成本明显更高。但是,这个数字具有误导性。

DeepSeek的自我引言:“嗨,我是被创造的,所以您可以问任何问题并得到一个甚至可能会让您感到惊讶的答案,”该模型的功能暗示了Nvidia的股票价格大幅下降。该模型的成功源于创新技术:

  • 多语预测(MTP):同时预测多个单词,提高准确性和效率。
  • 专家的混合物(MOE):使用256个神经网络,每个令牌激活8个,加速培训和性能。
  • 多头潜在注意力(MLA):反复提取关键细节,最大程度地减少信息丢失并增强细微差别的理解。

DeepSeek Test图像:ensigame.com

尽管培训成本较低,但一份半分析报告揭示了DeepSeek的大量基础设施:大约50,000个NVIDIA HOPPER GPU(包括H800,H100和H20单位)分布在多个数据中心,成本约为16亿美元。运营费用估计为9.44亿美元。

DeepSeek V3图像:ensigame.com

中国对冲基金High-Flyer的子公司DeepSeek拥有其数据中心,与云依赖的竞争对手不同。这提供了更大的控制和更快的创新。该公司的自筹资金促进了敏捷性。高薪(对于一些研究人员来说,每年超过130万美元)吸引了中国顶级人才,不包括外国专家。

DeepSeek图像:ensigame.com

这笔600万美元的数字仅涵盖培训前的GPU使用情况,不包括研究,改进,数据处理和基础架构。 DeepSeek的总AI投资超过5亿美元。它的精益结构有助于有效的创新。

DeepSeek图像:ensigame.com

DeepSeek的成功表明了一家资金充足的独立AI公司与知名球员竞争的能力。但是,其“预算友好”的主张被夸大了。数十亿美元的投资,技术突破和强大的团队是关键因素。对比是鲜明的:DeepSeek的R1耗资500万美元,而Chatgpt-4的成本为1亿美元,突出了巨大的成本差异。尽管提出了夸张的说法,但DeepSeek的成本仍然大大低于其竞争对手。

最新文章
  • “ Cornhole Hero:享受简单的后院运动乐趣”

    ​随着夏天的涌入和天气的热情,全世界的人们正在为聚会,烧烤和心爱的后院运动做准备。输入Pixeljam新发行的手机游戏Cornhole Hero,它将Cornhole经典的后院运动触手可及。

    by Aaliyah May 18,2025

  • “和平者第2季预告片:DCU时间轴和Vigilante更新”

    ​对于DC爱好者来说,2025年夏季将是一个令人振奋的时期。在超人的电影院到来以及詹姆斯·冈恩(James Gunn)和彼得·萨弗兰(Peter Safran)的DCU推出之后,球迷们可以期待和平缔造者的第二季。约翰·塞纳(John Cena)作为爱心和和平而持枪的克里斯托(Christo)返回

    by Emily May 18,2025

最新游戏
Lion King Quiz Trivia

冒险  /  10.1.7  /  31.8 MB

下载
Gaple - Offline Domino

卡牌  /  2.1  /  1.60M

下载
Project Zombie

动作  /  0.06  /  239.7 MB

下载
Zoun

街机  /  1.2.8.1  /  38.1 MB

下载