网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

中科大团队携手昇腾,MoE稀疏大模型推理性能提升超三成

2025-08-21来源:砍柴网编辑:瑞雪

人工智能领域的探索步伐从未停歇,尤其是随着大型模型的参数量呈现爆炸式增长,如何在提升模型容量的同时控制训练成本,成为了科研人员亟待解决的难题。MoE(Mixture of Experts)稀疏大模型应运而生,以其独特的优势吸引了广泛关注,但在推理阶段遭遇的性能瓶颈却限制了其广泛应用。近日,中国科学技术大学人工智能与数据科学学院传来喜讯,张燕咏院长带领团队,在鲲鹏昇腾科教创新卓越中心的强大算力支撑下,成功研发出一项创新框架,有效破解了MoE稀疏大模型推理性能的挑战。

该团队的创新之处在于,他们深入剖析了专家选择过程中的规律,通过对MoE层中相似token的专家选择特征进行细致分类,成功预测出token的专家选择路径偏好。这一发现为后续的推理性能优化奠定了坚实基础。团队利用这些预测结果,巧妙地对专家负载进行了均衡处理,通过复制频繁访问的专家、替换非关键专家,实现了资源的合理分配,显著提升了推理效率。

昇腾推理引擎MindIE在此次项目中发挥了重要作用。其内置的性能分析工具不仅提供了直观的性能数据可视化,还在实时监测专家负载、统计访问频率等方面给予了精准的数据支持,为团队优化专家负载均衡策略提供了有力依据。

团队还致力于降低分布式计算中的通信时延。他们根据计算节点上的数据预测结果,将专家提前部署到对应的节点,并将需要紧密合作的专家放置在同一计算单元,从而缩短了数据与所需专家之间的物理距离。结合昇腾384超节点的高速总线互联技术,跨节点和跨计算单元的通信消耗得到了大幅降低。

实践是检验真理的唯一标准。经过一系列技术突破,该创新框架在多尺寸、多结构的MoE模型中展现出了卓越的性能。与现有主流方案相比,推理时间、all2all时间、MoE层时间以及负载不均分数均提升了超过30%。在多卡复杂场景中,前三项指标同样提升了30%,推理时间更是提升了20%。这一成果无疑为开发者利用昇腾技术优化MoE稀疏大模型推理性能提供了宝贵经验。

此次项目的成功,不仅标志着中国科学技术大学在MoE稀疏大模型推理性能优化方面取得了重要进展,也为推动人工智能技术在各领域的广泛应用奠定了坚实基础。未来,鲲鹏昇腾科教创新卓越中心将继续深化产学研合作,依托昇腾软硬件平台,不断探索前沿AI模型优化领域的新突破,为自主创新和数字经济发展贡献力量。

百度世界大会发布文心大模型5.0 多项能力达全球领先水平
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-15

李彦宏2025百度世界大会发声:AI跨越临界点,百度成果引领产业新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度智能云发布新芯与超节点,持续布局AI算力助力企业AI能力内化
百度智能云今年已经点亮了昆仑芯三万卡集群,可同时支撑多个千亿参数大模型训练,打造了国产AI算力集群的一大里程碑。未来,百度智能云将持续优化软硬件协同效果,通过百舸AI计算平台,将昆仑芯单一集群的规模从三万卡进…

2025-11-13

李彦宏2025百度世界大会发声:AI迈向效果涌现 产业构建倒金字塔生态
11月13日举办的2025百度世界大会上,百度创始人李彦宏围绕 AI 技术发展阶段与产业生态发表观点,指出 AI正从技术演示走向实际应用,产业结构也在发生根本性转变。 在 AI 产业结构层面,李彦宏表示该领…

2025-11-13

AI从“智能涌现”迈向“效果涌现”,李彦宏:百度引领AI产业结构新变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13