DeepSeek绕开英伟达框架 为中国产GPU适配铺路

立即订阅亚视新闻 YouTube,即时掌握时事发展。

中国初创企业DeepSeek在其大语言模型研发中取得了令人瞩目的技术突破。据报道,DeepSeek选择绕过英伟达(NVIDIA)广泛使用的CUDA框架,直接依托GPU的底层硬件指令,力求为未来适配国产芯片打下基础。

英伟达的统一计算架构(CUDA)是一种通用编程框架,广泛用于全球各大AI公司,帮助更高效地利用英伟达的图形处理单元(GPU)进行数据处理和计算。

虽然CUDA技术大大降低了大规模模型开发的难度,但它在某些场合下可能会限制训练过程中的灵活性,影响速度。 DeepSeek则通过绕过CUDA,采用更细粒度的底层硬件指令(如PTX语言),能够在模型训练中节省时间。据分析,DeepSeek的这种做法可以将模型训练的时间缩短一半,举例来说,其他模型可能需要10天来完成训练,而DeepSeek仅需5天。

北京航空航天大学副教授黄雷指出,DeepSeek这种做法的优势在于,绕过CUDA后,开发者能够根据GPU的驱动函数进行更深层次的开发,从而实现更精确的控制和优化。 DeepSeek团队拥有一批精通PTX语言的开发人员,这使得他们能够为未来可能采用的国产GPU进行无缝适配,预示着在硬件适配方面将更具优势。

DeepSeek与华为云携手

此外,华为云也在近期宣布推出基于华为升腾云服务的DeepSeek-V3与DeepSeek-R1推理服务。借助华为云的自研推理加速引擎和强大算力支持,DeepSeek的模型能够与全球顶级GPU部署的模型竞争,提供稳定的商用环境,满足大规模生产需求。

华为云与硅基流动的联合发布受到了极大的关注,用户数量激增,甚至导致平台流量过大,需限制访问。硅基流动创始人袁进辉在社交媒体上表示,此次国产解决方案的成功上线远超预期,标志着中国在AI领域自主研发的突破。

随着DeepSeek在大语言模型训练中的技术创新和华为云提供的强大支持,业内对于中国AI企业的研发能力充满了期待。未来,随着国产GPU技术的逐步成熟,这一突破有望推动中国AI产业迎来新的发展机遇。

相关新闻:

你可能也喜欢

Back to top button