DeepSeek悄然升级R1模型 编程能力超阿里与Anthropic

立即订阅亚视新闻 YouTube,即时掌握时事发展。

中国人工智能(AI)初创企业DeepSeek于5月29日低调发布了其R1推理模型的新版本R1-0528,尽管未公开更新细节,但该模型在开源平台Hugging Face上线后迅速引起开发者关注,并在编程性能方面取得显著提升。

根据独立评测平台LiveCodeBench的数据显示,R1-0528在AI辅助编程方面表现优异,已成为中国表现最强的编程模型,仅次于OpenAI的o4-mini-high、o3-high和o4-mini-medium,超越了阿里巴巴(Alibaba)的通义千问3.0(Qwen3)与Anthropic的Claude 3.7。尽管其不久前在开源模型排行榜上被通义千问3.0(Qwen3)取代,但如今这一成绩也使DeepSeek重新回到公众视野。

中国AI产业竞争日益激烈

DeepSeek总部位于杭州,今年初因推出性价比高的V3与R1模型而迅速崛起。R1-0528是该公司自1月首次发布R1以来的首次迭代更新。该公司此前于3月也更新了其大型语言模型V3,重点提升了编程与写作能力。

尽管DeepSeek尚未回应外界关于R1-0528具体升级内容的询问,但开发社区普遍认为,这是为即将发布的下一代推理模型R2铺路。此前4月,该公司曾对一个数学专用模型进行小幅更新,进一步引发了业界对R1继任者的期待。

随着中国AI产业竞争日益激烈,各大科技公司纷纷加快布局。百度(Baidu)在4月推出具备多模态推理能力的Ernie 4.5 Turbo与X1 Turbo文心大模型,强调图像、音频与视频处理的整合,力求在多模态AI赛道上形成差异化优势。

相关新闻:

你可能也喜欢

Back to top button