GPU浪费有解 阿里云技术让H20使用量锐减82%
立即订阅亚视新闻 YouTube,即时掌握时事发展。
小
中
大
AI模型发展不再仅依赖算力增长,如何提升算力利用率正成为产业新焦点。中国科技巨头阿里巴巴旗下阿里云宣布,其自研的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该系统可大幅减少GPU闲置与浪费问题,提升AI模型服务效率。
根据《科创板日报》报道,Aegaeon已在阿里云百炼平台实际应用。在为期3个月的Beta测试中,该系统在服务多个高达720亿参数的大模型时,所需的英伟达(Nvidia)H20 GPU由1192颗减至213颗,节省比例高达82%。换言之,企业可显著降低硬体采购成本,减少对昂贵GPU的依赖。
Aegaeon的核心创新在于“GPU资源池化”技术,打破传统“一个模型绑定一个GPU”的模式,让多个模型可动态共享GPU资源,解决了“热门模型过载、长尾模型闲置”的结构性问题。数据显示,阿里云曾有17.7%的GPU算力仅处理1.35%的请求,而池化技术有效释放了这部分被浪费的资源。
SOSP(操作系统原理研讨会)由ACM SIGOPS主办,被誉为操作系统领域的“奥斯卡”,每届仅录取数十篇论文。阿里云Aegaeon的入选,标志着中国企业在系统软体与AI融合创新上的突破。
业内人士指出,AI发展正从“硬体驱动”转向“软体驱动”。百度智能云AI计算部负责人王雁鹏曾坦言,当前大模型训练中约有50%的算力被浪费,如何提高算力利用率已成为行业共同课题。阿里云Aegaeon的实践,或为AI基础设施优化提供新的方向。













