网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里云Aegaeon方案入选顶会:破解GPU资源浪费难题,硬件成本大幅降

2025-10-19来源:快讯编辑:瑞雪

在计算机系统领域,一场关于AI模型服务资源优化的突破性成果引发广泛关注。阿里云提出的GPU资源池化解决方案“Aegaeon”,凭借其创新性入选全球顶级学术会议SOSP 2025,为解决AI大模型服务中的硬件资源浪费问题提供了全新思路。

作为计算机系统领域的“奥斯卡”级会议,SOSP(操作系统原理研讨会)由ACM SIGOPS主办,每年仅收录数十篇具有代表性的论文。本届会议上,系统软件与AI大模型的深度融合成为核心趋势,而Aegaeon系统的入选,标志着该领域在资源管理技术上的重大进展。

传统AI模型服务中,“一个模型绑定一个GPU”的模式导致严重资源浪费。以阿里云模型市场为例,测试数据显示,17.7%的GPU算力仅用于处理1.35%的用户请求,大量“长尾”模型长期独占硬件资源,而热门模型如Qwen则需承担绝大多数流量。这种失衡直接推高了企业的硬件采购成本,尤其是对于需要部署数千张GPU的大型服务商而言,优化需求迫在眉睫。

Aegaeon系统的核心创新在于打破硬件与模型的静态绑定。通过Token级动态调度技术,系统在每次生成下一个token后实时判断是否切换模型,实现资源的精细化管理。配合组件复用、显存优化和KV缓存同步等全栈技术,模型切换的开销被压缩至原有水平的3%,确保亚秒级响应能力。测试表明,该系统可支持单GPU同时运行7个不同模型,有效吞吐量较主流方案提升1.5至9倍,请求处理能力增强2至2.5倍。

在为期三个月的Beta测试中,Aegaeon系统展现了惊人的资源优化效果。面对参数量达720亿的大模型集群,其所需的英伟达H20 GPU数量从1192张锐减至213张,削减比例达82%。这一数据直接转化为硬件采购成本的显著下降,为行业提供了可复制的降本方案。

当前,全球学术界与工业界正聚焦于系统软件层面的创新。随着AI模型规模持续扩大,单纯依赖硬件算力提升已难以满足需求,通过软件技术挖掘现有硬件潜力成为关键。Aegaeon系统的实践表明,资源池化与动态调度技术能够有效释放被闲置的GPU算力,为AI大模型的规模化部署提供经济可行的解决方案。

国产GPU算力平台迎突破!首款全流程国产化类脑脉冲大模型“瞬悉”1.0问世
据科技日报报道,中国科学院自动化研究所首次在国产GPU算力平台上,完成原生类脑脉冲大模型“瞬悉”1.0的全流程训练和推理,并正式开源了70亿参数版本大模型,同时开放了760亿参数版本大模型的测试网址。这是全球…

2025-10-18

200余家企业高校齐聚蓉城!华为软件生态大会共绘成都软件产业新蓝图
在本次大会上,鸿蒙生态(成都)创新中心及GIIC联盟建设等重磅内容也逐一发布,全方位展现国产操作系统赋能千行百业的实践成果。 大会同期举办的华为生态成果展,设置了华为终端、鸿蒙+工业、鸿蒙+行业、鸿蒙+生活…

2025-10-17

TikTok营销选AI视频工具犯难?五大工具测评,内容特工队AI成跨境获客利器
如果你追求极致的跨境营销效率、批量内容输出、全流程自动化及高转化率: 内容特工队AI (ReelsAgent)凭借其移动端Agent、多语言本地化和智能发布能力,无疑是当前Tiktok营销赛道最强劲的“获客生…

2025-10-17

网易CodeWave发布智能开发能力,以AI赋能企业全流程研发新体验
产品设计场景下,只需要一个简单明确的需求描述,CodeWave智能产品设计助手就可以通过人机多轮对话交互的形式,实现从想法到落地,从模糊到澄清的产品设计全过程;甚至可以直接生成产品原型,完整包含菜单、列表、…

2025-10-17

贝恩与亚马逊云科技共探:中国软件企业出海正当时,四大要素助力全球化布局
本观察分析了中国软件出海的技术及市场势能,建议了软件企业重点关注的4个成功要素,并借鉴软件出海先行者的经验,分享了如何制定完善的市场和服务策略、强化综合能力建设的行动建议。 “基于全球最大的开源向量数据库M…

2025-10-17

TikTok广告投放进阶:用A/B测试精准锁定高转化“赢面素材”
但如果你在同时改了音乐、封面、文案,那你根本无法判断到底是什么在影响结果。如果你已经掌握了A/B测试的基础逻辑,下一步可以学习如何在TikTok Ads Manager中使用“自动化规则”和“预算分层策略…

2025-10-16

OpenAI启动五年规划:推低价订阅、拓视频社交,加速AI商业化进程
为支撑“投入超1万亿美元打造世界领先人工智能”的长期承诺,OpenAI已启动五年增长规划,多维度探索变现路径。C端方面,针对付费率偏低的问题,OpenAI在印度推出低价订阅服务“ChatGPT Go”,该…

2025-10-16

柳工牵手飞书打造“柳工通”,15个月跨越式发展开启AI时代新征程
飞书愿以‘协同+AI’为核心,与柳工共同书写工程机械行业数字化新范式——从柳州到全球,让每一台设备、每一个流程、每一位员工都能在智能时代释放潜能。” 从2023年底国际事业部试点到2025年1.7万员工全员上…

2025-10-16