在机器学习工程领域,百度智能云旗下的企业级算法自主优化智能体——百度伐谋Agent 2.0,再次以卓越表现登顶全球权威基准MLE-Bench,并刷新最优成绩。这一成果标志着中国AI技术在企业级算法工程领域实现新的突破,继去年10月首次登顶后,百度伐谋凭借持续优化的工程能力再次领跑全球。
MLE-Bench由OpenAI主导设立,被誉为检验智能体实战能力的“硬核考场”。该基准包含75个源自Kaggle竞赛的真实工程难题,覆盖模型训练、数据准备、实验运行等机器学习全流程,重点考察人工智能在复杂场景下的端到端自动化能力。百度伐谋Agent 2.0作为面向最优解的智能体,能够像顶尖算法工程师一样,从需求理解到方案输出实现全链路自动化,在具有明确评价标准的问题中高效寻找全局最优解。
最新评测显示,百度伐谋2.0在“高难度”任务中展现出显著优势,综合胜率超越搭载Claude-Opus-4.6等主流大模型的同类产品。这一成绩得益于其在演化策略、长程记忆机制和底层基础设施层面的全面升级:增强的演化策略支持多路径并行探索与动态回溯调整;长程记忆机制确保智能体在长链条任务中保持逻辑一致性;依托百度智能云全栈AI基础设施的优化,则大幅提升了算法迭代效率。
技术突破的同时,百度伐谋2.0显著降低了算法应用门槛。业务人员无需算法背景,仅需通过自然语言或数据文件提交需求,系统即可自动生成可解释、可交互的企业级解决方案。这一特性使其快速渗透至零售、金融、制造、能源、交通等国民经济核心领域,上线至今已服务数千家企业。
在汽车制造领域,阿尔特太乙与百度伐谋合作开发的御风智能预测系统,将单次风阻验证时间从10小时压缩至数分钟,整车研发周期平均缩短25%;金融风控场景中,中信百信银行引入该技术后实现7×24小时风险特征挖掘,效率提升100%,模型风险区分度提高2.41%;能源基建领域,中国能建广东院借助其解决海上风电电缆桥架布置难题,节省近一周工期与大量材料成本;交通信控方面,鄂尔多斯伊金霍洛旗部署百度智能云伐谋信控平台后,车均延误降低18%,高峰通行时间减少超50%。
科研场景同样见证了百度伐谋的价值。北京工业大学团队将其应用于中国空间站微型气相色谱柱设计实验,通过自动化寻优替代人工反复仿真,显著提升分离效率;天津大学团队利用该技术优化灾害预测模型,将原本需数周的科研探索压缩至6小时内完成。为进一步支持科研创新,百度智能云近期开源了Famou for Science项目,通过多智能体协同模式构建虚拟科研团队,涵盖实验管理、文档评审等角色,支持长线程科研任务的自动化推进与算法持续演化。
