研究机构:DeepSeek硬体GPU支出逾5亿美元

立即订阅亚视新闻 YouTube,即时掌握时事发展。

中国新创公司DeepSeek的模型成本引发热议,并且造成股市震荡。研究机构SemiAnalysis星期五(1月31日)发布报告指出,该公司至今在硬体绘图处理器(GPU)上的支出远超过5亿美元(约马币22.27亿令吉)。

SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立“深度求索”(DeepSeek)以推动AI技术研发,在此之前,幻方量化于2021年,也就是任何出口管制生效前,投资购买了1万颗英伟达(Nvidia)A100 GPU。

报告指出,该公司在GPU的投资上花费超过5亿美元。

报告称,英伟达根据法规要求,生产了多款H100的变化版,如H800、H20。目前仅有H20可销售给中国。英伟达在过去9个月已生产超过100万颗专供中国市场的H20 GPU。

伺服器总资本支出(CapEx)约16亿美元

报告分析显示,DeepSeek的伺服器总资本支出(CapEx)约为16亿美元。

报告提到,DeepSeek从中国本土招募人才,目前约有150名员工,正急速扩张。

你可能也喜欢

DeepSeek的价格和效能这一周因出现模型训练成本低于600万美元的说法引起讨论。报告强调预训练成本仅是总成本一小部分,不代表完整支出。

DeepSeek论文中提到的600万美元成本指的是预训练运行(pre-training run)时的GPU成本,是模型总成本的一部分,未计入的重要支出还包括研发(R&D)、硬体总拥有成本(Total Cost of Ownership)等关键因素。

报告也提到DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。

美国智库兰德公司(RAND)研究员海姆(Lennart Heim)近期分析,硬体的出口管制存在时间滞后,目前尚未完全发挥影响力。真正的考验将出现在数据中心需要升级或扩展时,这对美国企业较为容易,但对受到出口管制的中国企业而言将是挑战。

SemiAnalysis也评价指出,DeepSeek在开放权重模型上表现出色,超越Meta的Llama 、法国人工智慧新创公司Mistral AI、以及其他竞争者。

相关新闻:

你可能也喜欢

Back to top button