网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

百度搜索文心助手焕新升级:8大模态创作矩阵+实时数字人

2025-10-17来源:快讯编辑:瑞雪

百度搜索近日宣布,旗下文心助手AIGC创作能力迎来重大升级,推出覆盖AI图片、视频、音乐、播客等8大模态的创作矩阵,并同步发布行业首个开放式实时互动数字人智能体。此次升级标志着搜索引擎从传统信息检索工具向“全能创作与服务平台”的深度转型,在技术突破与生态构建上均实现跨越式发展。

在视频生成领域,依托百度蒸汽机(文心专精)模型的技术迭代,文心助手突破了传统AI视频10秒左右的时长限制,实现“输入一段话生成3分钟故事大片”的长视频实时交互创作。从情节设计、角色建模到镜头运镜、配乐合成,全流程由AI自动完成,生成速度超越国内主流同类模型。平台还集成了“一句话写歌”“MV制作”“名场面模仿秀”等特色功能,搭配超30种特效模板,形成覆盖静态图像处理、动态视频制作、音频创作的完整生态链。

据百度搜索相关负责人透露,文心助手用户日均生成AIGC内容已突破千万量级,多模态创作工具的规模化应用价值得到充分验证。更值得关注的是,即将上线的音乐数字人分身功能将进一步打通“创作-演绎”全链路,实现AI从内容生成到个性化演绎的闭环。

除内容创作外,文心助手在任务解决能力上也实现关键升级。通过构建多工具调用引擎,用户可一键触发跨领域服务,覆盖生活规划、健康咨询、教育辅导、职场办公等核心场景。例如,家长查询“小学生科学实验方案”时,系统会自动整合实验步骤文本、器材清单图片、操作演示短视频,并生成可打印的任务卡,避免用户多次切换工具。

这一“需求-解决方案”的直达模式,源于文心大模型对用户意图的深度理解与资源调度能力。百度方面表示,该功能通过持续学习用户交互数据,正不断优化工具组合策略与响应效率,未来将覆盖更多生活场景。

同期发布的开放式实时互动数字人智能体成为另一大亮点。该技术基于文心大模型4.5构建,融合NOVA数字人技术的核心优势,具备三大特性:其一,超拟真交互体验,通过10分钟真人样本数据即可复刻声音特征、动作习惯与微表情,口型准确率与表情自然度达行业领先水平;其二,毫秒级响应能力,采用云渲染与端渲染双引擎适配,兼容多终端场景,实时对话延迟控制在百毫秒以内;其三,开放式服务生态,目前已接入法律、情感、旅游等领域的专家数字分身,用户可直接就专业问题展开深度对话,未来还将开放第三方开发者平台。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13