蚂蚁用国产芯片训AI模型 成本降两成

立即订阅亚视新闻 YouTube,即时掌握时事发展。

马云支持的蚂蚁集团近日宣布,其基于国产芯片研发的人工智能训练技术取得重要突破,有望在保持模型性能的同时,显著降低人工智能训练成本,为人工智能产业发展注入新动能。

据接近蚂蚁集团的知情人士透露,蚂蚁已使用国产芯片,包括关联公司阿里巴巴集团及华为技术有限公司的芯片,采用“专家混合”(Mixture of Experts,MoE)技术训练大语言模型,取得与英伟达H800芯片相当的性能表现。尽管该信息尚未公开,但多名知情人士指出,蚂蚁集团目前在人工智能模型开发中仍在使用英伟达产品,同时已将AMD及国产芯片纳入主力训练硬件。

蚂蚁入局MoE模型战

MoE模型作为近年来在人工智能领域快速发展的新技术,其优势在于通过分工机制提升模型效率。该方法将复杂任务划分为多个子任务,并由不同“专家”模块分别处理,从而实现更高效的计算资源分配。谷歌、DeepSeek等企业均在相关领域有所布局。蚂蚁集团的加入,意味着中国企业在新一轮AI技术竞赛中正不断争取主动权。

面对美国对高端人工智能芯片的出口限制,中国科技企业积极寻求替代方案。H800虽然不是英伟达最先进的芯片,但其性能已足以支持高强度人工智能训练。目前该类芯片已被列入美国对华出口管制清单。在此背景下,蚂蚁集团通过优化算法与硬件匹配,在国产芯片平台上训练大模型,不仅取得初步成效,更彰显我国AI领域正逐步突破关键核心技术的能力。

训练成本降两成

据介绍,蚂蚁集团在本月发布的一篇研究论文中指出,使用高性能硬件训练1万亿个token的成本约为635万元人民币,而通过优化后的方案,该成本可降低至510万元。token是语言模型学习语义结构与信息内容的最小单位,训练成本的降低意味着更广泛的应用可能。

该论文还披露,蚂蚁自主研发的大语言模型Ling-Plus与Ling-Lite已在多个权威评测中取得优异成绩。其中,Ling-Lite在英文理解能力方面超过Meta旗下Llama模型之一,在中文测试中,两款模型均优于DeepSeek的同类产品。Ling-Lite拥有168亿参数,Ling-Plus参数规模达到2900亿,虽不及OpenAI旗下GPT-4.5模型的1.8万亿参数规模,但已在应用层面显示出较强实力。

进军医疗金融

为推动人工智能技术服务于实体经济,蚂蚁集团计划将Ling系列模型应用于医疗、金融等场景。今年,蚂蚁收购了国内知名在线医疗平台好大夫在线,进一步完善其在医疗AI领域的布局。此外,蚂蚁旗下还推出生活助手“智小宝”与金融顾问人工智能“蚂小财”,持续推动人工智能技术向多元应用纵深发展。

论文亦坦言,在模型训练过程中,团队曾遇到稳定性挑战,尤其在硬件配置或模型结构发生微调时,容易出现误差率大幅波动等问题。这表明,在迈向人工智能自主化的过程中,仍需不断优化系统结构与算法策略。

虽然当前英伟达仍在全球人工智能芯片市场占据主导地位,其首席执行官黄仁勋日前表示,即便更高效模型如DeepSeek-R1被提出,人工智能计算需求仍将持续增长,因此更强大的GPU将是企业追求收益的关键,而非单纯依赖低成本方案。

但来自中国科技企业的最新实践表明,提升算法效率、拓展芯片适配路径,也是一条可行的发展方向。正如北京人工智能解决方案企业盛尚科技首席技术官余启文所言:“如果你找到了击败世界顶级高手的一招,那你就赢了。关键在于能否落地。”

蚂蚁集团此次突破再次印证,在全球人工智能格局深度演进的当下,我国科技企业正以持续技术创新和产业布局,走出一条高质量发展的自主道路。

相关新闻:

你可能也喜欢

Back to top button