网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

百度智能云携手昆仑芯、HAMi推出双模式调度,让国产算力高效适配AI业务需求

2025-11-04来源:快讯编辑:瑞雪

近日,百度智能云混合云携手昆仑芯、HAMi(由密瓜智能主导的CNCF开源项目)推出了一项创新算力调度方案——基于昆仑芯P800的XPU/vXPU双模式资源调度体系。该方案已在某金融企业的昆仑芯集群中成功落地,为智能客服、营销辅助等十余类AI业务提供稳定且灵活的算力支持。通过整合整卡XPU与虚拟化vXPU资源,企业可在同一集群内实现算力的按需调用,既满足业务高效运行需求,又提升资源利用率。

在算力调度领域,百度智能云与HAMi合作构建的“XPU整卡+vXPU虚拟化”双模式体系,通过差异化策略适配不同业务场景。XPU整卡模式聚焦大规模训练任务,采用拓扑寻优调度与集群健康度评估技术,确保多卡协同下的通信性能与稳定性。系统自动识别服务器物理分区,优先在单侧翼内分配资源,减少跨分区通信开销;同时,通过评估节点拓扑规整度,选择最优调度节点,避免资源碎片化。这一设计使运维团队无需手动拼卡,即可实现大模型训练的稳定运行。

针对推理、开发测试等轻量化任务,vXPU虚拟化模式提供多粒度算力切分支持。该模式允许单张昆仑芯P800显卡被切分为1/4卡(24GB显存)或1/2卡(48GB显存)规格,满足细粒度算力需求。用户仅需声明所需显存,系统会自动匹配最优切分规格,例如申请20GB显存时,系统直接分配24GB规格,简化操作流程。通过“同规格共享”机制,同一物理卡仅允许相同规格的虚拟实例共享,进一步降低资源隔离与管理复杂度。

为应对灰度测试、硬件故障复现等特殊场景,方案设计了UUID精准控卡功能。运维人员可通过指定物理卡UUID,直接选定或排除特定卡片。例如,在新模型灰度发布时,仅需调用部分卡片完成验证;硬件故障排查时,可精准定位问题卡片进行调试,无需整机下线。这一设计结合自动化调度与人工调节通道,既保障日常调度效率,又赋予运维团队灵活管理的能力。

该双模式调度方案在金融行业的实践,验证了“场景驱动调度策略”的技术价值。通过整合开源生态与企业服务能力,方案不仅提升了国产AI硬件的利用率,也为复杂业务场景下的算力管理提供了可复制的解决方案。

百度AI成果井喷:从智能涌现到效果涌现,产业结构迈向健康倒金字塔
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-15

百度世界大会:李彦宏携AI“军火库”全面开放,开启应用新篇章
现场演示连线数字人罗永浩环节上,出现了“翻车”这一尴尬现象时,李彦宏的情绪也并没有太多波动,而是感觉“有点遗憾”,并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。 还有大模型层面上的文…

2025-11-15

百度世界大会发布AI新成果:文心5.0等亮相,李彦宏畅谈AI内化生产力变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13

百度“文心杯”第三届落幕:8支团队获千万投资,李彦宏力推AI应用普及
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

2025百度世界大会聚焦AI发展:成果发布,内化能力引领新质生产力变革
本届大会以“效果涌现”为主题,聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海,呈现了百度作为中国人工智能领军企业,如何将AI技术内化为产业发展的原生动能,为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13