在2025百度世界大会上,一款名为文心大模型5.0的原生全模态大模型正式亮相。这款模型拥有高达2.4万亿的参数量,通过原生全模态统一建模技术,实现了对文本、图像、音频、视频等多种信息输入输出的全面支持,展现出强大的全模态理解与生成能力。
文心大模型5.0在基础能力上实现了全面跃升。在多模态理解、指令遵循、创意写作、事实性以及智能体规划与工具应用等多个维度,该模型均展现出卓越的性能。经过40余项权威基准的综合评估,其语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等国际顶尖模型不相上下,图像与视频生成能力更是与垂直领域专精模型比肩,标志着其已跻身全球领先行列。
百度创始人李彦宏在大会上强调,大模型技术正处于高速迭代阶段,其智能水平不断突破新高度。他指出,模型思考时间的延长、原生全模态的统一,以及自我学习和迭代能力的具备,使得模型具备了创新能力。李彦宏表示,智能本身即是最大的应用场景,而技术迭代的速度则是构筑竞争优势的关键。百度将持续加大投入,研发更为前沿的模型,不断推高智能技术的天花板。
百度首席技术官王海峰进一步阐释了文心大模型5.0的技术特色。他介绍,与业界多数采用后期融合方式的多模态模型不同,文心5.0从训练之初便采用统一的自回归架构进行原生全模态建模,实现了理解与生成的一体化。这种技术路线使得语言、图像、视频、音频等多模态数据在统一架构下充分融合并协同优化,从而实现了原生的全模态统一理解与生成。
依托飞桨深度学习框架,文心大模型5.0采用了超稀疏混合专家架构进行全模态训练,总参数规模超过2.4万亿,但激活参数比例低于3%。这一设计在保持模型强大能力的同时,有效提升了推理效率。模型还基于大规模工具环境合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著增强了模型的智能体和工具调用能力。
目前,文心大模型5.0 Preview已同步上线文心App,供用户直接体验。同时,开发者和企业用户也可通过百度千帆大模型平台调用文心大模型5.0的API服务,进一步拓展其应用场景。
值得一提的是,在11月8日公布的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一,尤其在创意写作和复杂问题理解方面表现尤为突出,再次证明了文心大模型系列的强大实力。
