传DeepSeek打破惯例 未向美商展示新模型
知情人士透露,中国AI新创公司DeepSeek去年以低成本模型震撼全球,但在推出重大更新前,却未依照业界惯例,向美国芯片商展示即将发布的旗舰模型以进行效能最佳化。
消息人士指出,深度求索(DeepSeek)预计将推出下一次重大更新版本V4,但仅向包括华为技术公司(Huawei Technologies)在内的中国本土供应商提供了抢先使用权。
人工智能(AI)开发商通常会在模型正式发布前,将主要模型的预发布版本分享给英伟达(Nvidia)与超微(Advanced Micro Devices)等主要芯片制造商,以确保其软体能在广泛使用的硬体上高效运行。 DeepSeek过去也曾与英伟达的技术团队密切合作。
消息人士表示,这款原本预计于农历新年前后发布的新模型,DeepSeek并未向英伟达与超微提供测试权限,反而让包括华为在内的中国芯片制造商提前数周着手为其处理器进行软体最佳化。
英伟达与超微拒绝发表评论,DeepSeek与华为则未回覆记者询问。
路透目前无法确认此项决定的原因。
加州的创意策略公司(Creative Strategies)分析师巴荷林(Ben Bajarin)表示:“对英伟达与超微在通用资料加速器方面的影响有限——多数企业并未实际运行DeepSeek,它更多只是作为基准测试模型存在。”他补充说,新一代AI程式编写工具已将软体适配硬体所需时间“从数月缩短至数周”。
中国模型下载量冠绝全球
巴荷林表示,此举可能是中国政府更广泛战略的一部分,“试图让美国硬体与模型在中国处于不利地位”。
此事发生之际,特朗普政府高官告诉路透社,DeepSeek最新AI模型是在中国使用英伟达最先进的Blackwell芯片组丛集进行训练,此举似乎违反美国出口管制规定。
2025年1月崛起以来,DeepSeek的模型在开源平台Hugging Face的下载次数已超过7500万次,并带动中国开源模型浪潮,与美国AI实验室展开竞争。在过去一年发布的模型中,中国模型的下载量已超过该平台上其他任何国家。













