网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

文心大模型5.0正式版上线:原生全模态建模,引领全球AI新潮流

2026-01-22来源:互联网编辑:瑞雪

在百度文心Moment大会上,一款具有里程碑意义的大模型——文心大模型5.0正式版宣布上线。这款模型参数规模高达2.4万亿,采用原生全模态统一建模技术,实现了对文本、图像、音频、视频等多种信息的全面理解与生成能力,标志着人工智能技术迈向新的高度。

与传统多模态模型采用“后期融合”方案不同,文心5.0通过统一的自回归架构进行原生全模态建模。该技术路线将多源数据在同一模型框架中联合训练,使多模态特征在统一架构下深度融合并协同优化。这种创新设计不仅提升了模型对复杂场景的理解能力,还实现了原生全模态的统一生成。在权威基准评测中,其语言与多模态理解能力稳居国际第一梯队,图像与视频生成能力达到垂直领域专精模型水平,整体性能处于全球领先地位。

技术架构方面,文心5.0采用超大规模混合专家结构,激活参数比低于3%。这种设计在保持模型强大能力的同时,显著提升了推理效率。通过大规模工具环境合成训练数据,并运用基于思维链和行动链的端到端多轮强化学习,模型的智能体和工具调用能力得到质的飞跃。这些突破使得模型在多模理解、代码生成、创意写作等关键领域实现显著提升。

百度应用模型研发部负责人贾磊在会上展示了三项突破性技术:基于声音Token的端到端合成大模型、5分钟生成超越真人效果的直播技术,以及实时交互数字人技术。其中,实时交互数字人采用三态Token联动架构,实现文本、语音、视频的流式控制。该技术突破传统数字人模态串联模式,通过系统自动完成动作衔接与状态重组,由声音Token实时驱动表情与口型,输出三态合一的视频流。这项技术具有低延迟、低成本和高表现力的特点,百度罗永浩数字人即基于此技术开发。

为推动技术落地,百度千帆平台同步支持企业用户和开发者便捷调用文心5.0正式版。平台提供的Agent Infra解决方案涵盖模型、工具、开发、数据及运行环境五个层面。在模型服务方面,提供包括文心5.0在内的150余个全场景SOTA模型,并针对Agent场景开发精准思维链控制等增强服务。工具服务层面,通过MCP协议开放百度AI搜索、地图、文库等成熟AI能力,同时引入出行、支付等企业级高频需求的第三方能力。

开发服务方面,千帆平台凝聚百度工程师实战经验,开放企业级深度研究Agent等多款官方应用。数据服务通过智能平台将非结构化数据转化为模型可理解信息,实现多模态数据统一管理及算力混合调度,数据处理效率提升6倍,计算成本降低30%。运行环境则提供完善的资源部署、权限管理及监控工具链,确保智能体在业务场景中的稳定运行。目前,千帆平台上已累计开发超过130万个Agents,展现出强大的生态构建能力。

百度AI主场“罗永浩”数字人激辩,展现技术自信引领AI新叙事
百度能够在这样的节点,很自然的把辩论搬到现场舞台,并不是简单的复刻,除了展示“罗永浩”数字人的技术成熟度,还能对外传递一种自信心:戏可能是一样,但内容和功底决定其精彩程度,更不会担心同台较量。尤其是后者,尽…

2026-01-22

2026年AI大跃迁:从实验室到现实场景,开启生产力变革新篇章
为达成这一目的进行实现,正专注从事构建具备多云以及多芯片特性的多元化算力相关生态系统,从而保证能够以稳定且规模化的状态去满足未来的相应需求。另外一方面,被视作走势良好方向的是机器人(具身智能),虽然面临着技术…

2026-01-22

小红书新公约:为真实表达“划界”,为创新创造“留种”
表面看,这是一次常规的社区规范升级;但如果从更底层的逻辑去看,它其实只做了一件事:把“真实表达”,从一种内容风格,升级为一种“可被保护、可被经营、可被持续复用的社区资产”。 这和知识产权中一个极其核心、却常被…

2026-01-22

消息称一加15T入网:子系唯一6.32英寸小屏旗舰,春节后或亮相
IT之家 1 月 22 日消息,博主 @数码闲聊站 今日发文透露,一加 15T 手机也已入网,标配 100W 快充头,是子系唯一 6.32英寸小屏旗舰。 据称,一加 15T 定位全能小钢炮,将搭载骁龙 8 …

2026-01-22

华为2026年春节后或推两大新品 中端折叠屏手机与万元级折叠平板引期待
【CNMO科技消息】1月22日,CNMO注意到,有数码博主透露,2026年春节后,华为将带来两大重磅新品,包括疑似华为novaFlip迭代的中端折叠屏手机和一款折叠屏平板。此外,有传言称华为Pura 90系…

2026-01-22